这篇文章上次修改于 1407 天前，可能其部分内容已经发生变化，如有疑问可询问作者。

迷茫中被开了这门机器学习课程，记得导师'周昊'开课时说着这课不是给我们这个阶段的学生学习的，原想着会教的相对轻松些，没想到还是对我的高数知识弱区一顿打击。转眼就要结课考试，故在这里对整个学期的教学内容进行简单归纳，项目的仓库(github)地址放在最后，方便对照查看。

流程

数据预处理

读入数据并进行一定调整、分割

注意：

数据去重
处理异常值(含空值)
字符串类型的映射处理
数值离散化
划分训练集与测试集

建立模型

编写算法或使用sklearn库中特定封装方法进行训练与预测

预测/评价

对模型的预测进行评价

回归评价指标

name	function
平均绝对误差	mean_absolute_error(y, y_predict)
均方误差	mean_squared_error(y, y_predict)
中值绝对误差	median_absolute_error(y, y_predict)
可解释方差值	explained_variance_score(y, y_predict)
R方值	r2_score(y, y_predict)

分类评价指标

name	function
准确性评价指标	accuracy_score(y, y_predict)
精确率评价指标	precision_score(y, y_predict)
召回率评价指标	recall_score(y, y_predict)
ROC曲线	fpr, tpr, thresholds = roc_curve(y, y_predict) plt.plot(fpr, tpr, ...)

算法归类

回归

多元线性回归模型

对连续值进行预测

Code:
T0324_multivariate_linear_regression_sklearn

批量梯度下降

在梯度下降的每一步中都用到了所有的训练样本。
思想：找能使代价函数减小最大的下降方向（梯度方向）。
损失函数（loss function）：通常用损失函数来度量拟合的程度。损失函数极小化，意味着拟合程度最好，对应的模型参数即为最优参数。

Code:
T0407_batch_gradient_descent(批量梯度下降)
T0414_mini_batch_gradient_descent(小批量梯度下降)
T0414_stochastic_batch_gradient_descent(随机梯度下降)

多项式回归

多项式回归是多元线性回归的一个特例，使用曲线来拟合数据

Code:
T0414_polynomial_regression

AlphaAE 博客

机器学习试前归纳 (2021上半学期)

流程

数据预处理

建立模型

预测/评价

回归评价指标

分类评价指标

算法归类

回归

多元线性回归模型

批量梯度下降

多项式回归

分类

Logistic回归

决策树

支持向量机（Support Vector Machine, SVM）

朴素贝叶斯分类

相关内容

没有评论

机器学习 试前归纳 (2021上半学期)

流程

数据预处理

建立模型

预测/评价

回归评价指标

分类评价指标

算法归类

回归

多元线性回归模型

批量梯度下降

多项式回归

分类

Logistic回归

决策树

支持向量机（Support Vector Machine, SVM）

朴素贝叶斯分类

相关内容

没有评论

机器学习试前归纳 (2021上半学期)