课程: Python 机器学习基础
免费学习该课程!
今天就开通帐号,24,700 门业界名师课程任您挑!
监督学习vs非监督学习
在我们上一节课中, 介绍了两种机器学习任务: 分类和回归。 你可能还记得, 分类是判断某个样本属于哪个类别, 比如识别猫和狗; 而回归是预测一个具体的数值, 比如房价或者温度。 这两种任务虽然表面上不同, 但它们都属于一个更大的范畴, 也就是我们今天要讲的第一种学习方式, 监督学习。 什么是监督学习呢? 简单来说,它是一种有老师的学习过程。 在这种学习方式中, 我们给计算机提供的每一个训练样本, 它都是成对出现的。 一边是题目,也就是输入数据; 而另一边是正确答案,也就是标签。 就像你小时候做练习题时, 一边有参考答案, 看着参考答案来学着怎么做对。 计算机在监督学习中, 就是在看着答案练习题,不断调整自己, 直到能把题做对。 比如, 我们要教一台电脑判断图片里是猫还是狗, 我们给它看成千上万张图片, 并告诉它,这一张是猫,那一张是狗。 它在通过这些带标签的数据, 来学习猫和狗之间的特征差异。 等它觉得差不多的, 再给它一张新图,它就可以自己做出判断了。 所以,监督学习的核心是数据有标签, 模型是从已知输入和已知输出的数据中 学规律, 目的是将来遇到新输入时, 也能预测正确的输出。 接下来,我们来看第二种,非监督学习。 顾名思义,它就是没有老师的学习。 我们给模型的只有输入数据, 没有答案让它参考。 那么它如何学习呢? 它的任务不是预测, 而是要自己从这些数据中 找出隐藏的结构或规律。 这就像我们把一群不认识的人 放到一个房间, 来告诉模型,自己看一看, 这些人可以分成几组。 它可能会根据 他们的穿着、说话方式、行为习惯, 来自动发现一些相似的人组成一组。 而把人类分群,这就是我们常说的聚类, 这是非监督学习中的一种典型任务。 还有另一个常见的任务叫降维, 比如一张图像,原始有几千个像素, 我们想提取出最核心的特征, 让计算来变得更加高效。 这也属于非监督学习擅长的事情。 所以,非监督学习更像是一种探索性学习, 它没有参考答案, 只能靠自己看图说话,从数据中挖掘结构。 除了监督学习和非监督学习, 机器学习还有第三种主要方式, 叫做强化学习。 强化学习 和我们前面说的两种学习方式很不一样。 它不像监督学习那样有一个明确的答案; 也不像非监督学习那样, 只是探索数据结构。 它更像是在玩一个游戏, 不断地试错、积累经验,然后优化策略。 在强化学习中,…