机器学习

监督学习与无监督学习

监督学习无监督学习分类聚类回归
一句话摘要

机器学习的两种基本范式:有标签数据的监督学习和无标签数据的无监督学习,理解它们的区别是学习机器学习的第一步。

什么是监督学习?

监督学习(Supervised Learning) 是指模型从带有标签(正确答案)的训练数据中学习,建立输入到输出的映射关系,从而对新数据做出预测。

"监督"的含义就像有老师批改作业:每道训练题都有标准答案,模型学的就是如何从题目推出答案。

监督学习的两大任务

任务类型输出举例
分类离散类别垃圾邮件识别、图像分类
回归连续数值房价预测、温度预测

常见算法

  • 决策树
  • K近邻(KNN)
  • 线性回归 / 逻辑回归
  • 支持向量机(SVM)
  • 神经网络

什么是无监督学习?

无监督学习(Unsupervised Learning) 是指模型处理没有标签的数据,自动发现数据中的隐藏模式和结构。

没有"标准答案",模型需要自己找规律。就像把一堆照片给你,不告诉你类别,让你自己分组。

无监督学习的典型任务

任务类型作用举例
聚类将相似数据分组客户分群、新闻分类
降维减少数据维度PCA主成分分析
异常检测发现异常数据点信用卡欺诈检测

常见算法

  • K-Means聚类
  • PCA主成分分析
  • 自编码器(Autoencoder)

如何判断是监督还是无监督?

关键看数据有没有标签

  • 有标签(知道正确答案)→ 监督学习
  • 无标签(不知道正确答案)→ 无监督学习

还有半监督学习和强化学习

  • 半监督学习:少量有标签数据 + 大量无标签数据
  • 强化学习:通过奖惩信号学习(属于行为主义学派)

考试要点

  • 监督学习需要带标签的数据,用于分类和回归
  • 无监督学习处理无标签数据,用于聚类和降维
  • 决策树、KNN 是监督学习;K-Means、PCA 是无监督学习
  • 自编码器属于无监督学习
微信二维码

扫码备注【NOAI】加交流群