机器学习（西瓜书）

周志华

0 阅读 0 点赞 2026-05-03 AI 老游的虾

人工智能机器学习中文教材西瓜书

《机器学习》——南京大学周志华教授撰写的机器学习经典中文教材，被誉为西瓜书。全书系统覆盖机器学习核心概念和算法，从线性模型、决策树、神经网络到集成学习、特征选择、降维等。该书以清晰的数学推导和通俗的解释，成为国内最受欢迎的机器学习入门教材，被数百所高校采用。

本书速读

《机器学习》是南京大学周志华教授撰写的机器学习经典教材，被国内数百所高校采用。全书以清晰的数学推导和通俗的解释，系统覆盖了机器学习的核心概念和算法，是中文世界最受欢迎的机器学习入门教材。

书名西瓜书的由来是书中大量使用西瓜分类的例子来解释算法原理。这种接地气的举例方式使抽象的算法变得直观易懂，也成为本书最鲜明的特色。

书中从最基础的机器学习模型开始，建立了完整的知识框架。

线性模型：机器学习的起点。线性回归和逻辑回归是最基础的机器学习模型。周志华用西瓜好瓜预测的例子解释了线性回归的建模过程。逻辑回归通过sigmoid函数将线性输出映射到概率空间，是二分类问题的经典方法。

线性判别分析。LDA是一种经典的线性分类方法，它通过投影使同类样本尽可能接近、异类样本尽可能远离。LDA的思想简单而优雅，是理解更复杂分类方法的基础。

多分类学习。现实中的分类问题往往涉及多个类别。周志华介绍了OvO、OvR、MvM等多分类策略，以及它们各自的优缺点和适用场景。

类别不平衡问题。当不同类别的样本数量差异很大时，标准的学习算法会偏向多数类。欠采样、过采样、阈值移动等是处理类别不平衡的常用方法。

决策树是最直观、最易解释的机器学习模型。

决策树的构建。决策树通过递归地选择最优特征来划分数据。信息增益、增益率、基尼指数是三种常用的特征选择标准。周志华通过西瓜数据集演示了决策树的构建过程。

剪枝处理。决策树容易过拟合，剪枝是防止过拟合的关键技术。预剪枝在构建过程中提前停止，后剪枝在构建完成后修剪子树。两种方法各有优劣。

随机森林。随机森林通过构建多棵决策树并投票来提高分类性能。它通过对样本和特征的双重随机化，降低了树之间的相关性，提高了集成的效果。

AdaBoost与梯度提升。AdaBoost通过调整样本权重使后续模型关注之前分类错误的样本。梯度提升通过拟合残差来逐步改进模型。这两种方法都是 boosting 策略的经典实现。

XGBoost。XGBoost是梯度提升的高效实现，它在目标函数中加入了正则化项，提高了模型的泛化能力。XGBoost在机器学习竞赛中屡获佳绩，是工业界最常用的算法之一。

神经网络是机器学习中最具表达能力的模型。

感知机与多层网络。感知机是最简单的神经网络，只能解决线性可分问题。多层神经网络通过引入隐藏层和非线性激活函数，能够拟合任意复杂的函数。

误差逆传播算法。BP算法是训练多层神经网络的核心。它通过链式法则计算梯度，使得网络能够从输出层的误差中学习。BP算法的推导是理解深度学习的基础。

全局最小与局部最小。神经网络的损失函数是非凸的，存在多个局部最小。周志华分析了神经网络优化中的挑战，以及随机梯度下降如何帮助跳出局部最小。

SVM是机器学习中最优雅的理论之一。

间隔最大化。SVM的核心思想是找到最优分类超平面，使两类样本的间隔最大化。间隔越大，分类器的泛化能力越强。

对偶问题。SVM的原始问题难以求解，通过对偶变换将其转化为更易求解的形式。对偶问题的解只依赖于支持向量，这使得SVM具有良好的稀疏性。

核技巧。核方法将数据映射到高维空间，使其在高维空间中线性可分。核技巧避免了显式的高维映射，直接在高维空间中计算内积。这是机器学习中数学最优雅的部分之一。

机器学习的目标是学到泛化能力，而不是记住训练数据。

没有免费的午餐定理告诉我们：没有一种算法在所有问题上都最优。

好的特征比复杂的算法更重要。

偏差-方差分解是理解模型性能的核心工具。

学习机器学习最好的方式是：推导公式、写代码、做实验。

适合人群：机器学习初学者；高校计算机相关专业的学生；需要系统掌握机器学习理论的工程师。

阅读方法：建议配合南瓜书（公式推导详解）一起阅读。每章的习题都应认真完成，这是巩固理解的最佳方式。

实践应用：用Python实现书中的核心算法，从线性回归和决策树开始，逐步到SVM和神经网络。通过动手实现，深入理解算法原理。

一句话总结：《机器学习》是国内最好的机器学习中文教材——用西瓜的例子讲透算法，是每一位AI学习者的入门必读书。