机器学习

监督学习与无监督学习

监督学习无监督学习分类聚类回归

一句话摘要

机器学习的两种基本范式：有标签数据的监督学习和无标签数据的无监督学习，理解它们的区别是学习机器学习的第一步。

什么是监督学习？

监督学习（Supervised Learning） 是指模型从带有标签（正确答案）的训练数据中学习，建立输入到输出的映射关系，从而对新数据做出预测。

"监督"的含义就像有老师批改作业：每道训练题都有标准答案，模型学的就是如何从题目推出答案。

监督学习的两大任务

任务类型	输出	举例
分类	离散类别	垃圾邮件识别、图像分类
回归	连续数值	房价预测、温度预测

常见算法

决策树
K近邻（KNN）
线性回归 / 逻辑回归
支持向量机（SVM）
神经网络

什么是无监督学习？

无监督学习（Unsupervised Learning） 是指模型处理没有标签的数据，自动发现数据中的隐藏模式和结构。

没有"标准答案"，模型需要自己找规律。就像把一堆照片给你，不告诉你类别，让你自己分组。

无监督学习的典型任务

任务类型	作用	举例
聚类	将相似数据分组	客户分群、新闻分类
降维	减少数据维度	PCA主成分分析
异常检测	发现异常数据点	信用卡欺诈检测

常见算法

K-Means聚类
PCA主成分分析
自编码器（Autoencoder）

如何判断是监督还是无监督？

关键看数据有没有标签：

有标签（知道正确答案）→ 监督学习
无标签（不知道正确答案）→ 无监督学习

还有半监督学习和强化学习

半监督学习：少量有标签数据 + 大量无标签数据
强化学习：通过奖惩信号学习（属于行为主义学派）

考试要点

监督学习需要带标签的数据，用于分类和回归
无监督学习处理无标签数据，用于聚类和降维
决策树、KNN 是监督学习；K-Means、PCA 是无监督学习
自编码器属于无监督学习

微信二维码

扫码备注【NOAI】加交流群