什么是监督学习?
监督学习(Supervised Learning) 是指模型从带有标签(正确答案)的训练数据中学习,建立输入到输出的映射关系,从而对新数据做出预测。
"监督"的含义就像有老师批改作业:每道训练题都有标准答案,模型学的就是如何从题目推出答案。
监督学习的两大任务
| 任务类型 | 输出 | 举例 |
|---|---|---|
| 分类 | 离散类别 | 垃圾邮件识别、图像分类 |
| 回归 | 连续数值 | 房价预测、温度预测 |
常见算法
- 决策树
- K近邻(KNN)
- 线性回归 / 逻辑回归
- 支持向量机(SVM)
- 神经网络
什么是无监督学习?
无监督学习(Unsupervised Learning) 是指模型处理没有标签的数据,自动发现数据中的隐藏模式和结构。
没有"标准答案",模型需要自己找规律。就像把一堆照片给你,不告诉你类别,让你自己分组。
无监督学习的典型任务
| 任务类型 | 作用 | 举例 |
|---|---|---|
| 聚类 | 将相似数据分组 | 客户分群、新闻分类 |
| 降维 | 减少数据维度 | PCA主成分分析 |
| 异常检测 | 发现异常数据点 | 信用卡欺诈检测 |
常见算法
- K-Means聚类
- PCA主成分分析
- 自编码器(Autoencoder)
如何判断是监督还是无监督?
关键看数据有没有标签:
- 有标签(知道正确答案)→ 监督学习
- 无标签(不知道正确答案)→ 无监督学习
还有半监督学习和强化学习
- 半监督学习:少量有标签数据 + 大量无标签数据
- 强化学习:通过奖惩信号学习(属于行为主义学派)
考试要点
- 监督学习需要带标签的数据,用于分类和回归
- 无监督学习处理无标签数据,用于聚类和降维
- 决策树、KNN 是监督学习;K-Means、PCA 是无监督学习
- 自编码器属于无监督学习