外媒关注中国高校开设减肥课：激励学生更加健康

课程: Python 机器学习基础

开始一个月试用购买团队方案

特征缩放与归一化

“ 百度除主动安全升级之外，第二代斑马系统是年轻用户最爱的配置，包括人工智能语音控制、大数据主动导航等。

在进入模型训练前，我们要完成一项重要的预处理步骤，特征缩放，也称为归一化。那么，我们为什么要进行特征缩放呢？在现实世界中，不同特征往往具有不同的单位和量级。比如，收入的单位可能是元或者万元，孩子数量通常是个位数，预算可能是 5 位数、甚至 6 位数，年龄范围从十几岁到几十岁。如果我们直接把这些数值输入模型，数值大的特征会对模型影响更大，导致模型训练更加偏向于重视这些特征。这种现象就叫做量纲不一致导致的特征权重不公平。那么在哪些模型中，我们必须要做特征缩放呢？首先是基于距离计算的模型，比如 K 最近邻、支持向量机，或者说 K-means 聚类，它们直接依赖特征之间的距离，所以，特征数值必须在统一尺度下才有意义。然后是依赖梯度下降的模型，像是逻辑回归、神经网络等等，特征值差距过大，会导致梯度不稳定，模型收敛变慢，甚至失败。最后是正则化的线性模型。如果特征没有缩放，那么就会影响惩罚项对系数的影响。我们本次归一化，使用的是 MinMaxScaler。它会把数值缩放到一个固定的范围，默认就是 0-1。所有的特征将被线性转换，最小值对应 0，最大值对应 1，其他值则按比例映射。接下来，我们通过代码来实际操作一下。首先我们创建一个新的代码框，输入这样一行代码，运行一下。这是 scikit-learn 中提供的标准化代码工具，用于按最小、最大范围进行缩放，我们前面提到过。接下来，我们再创建一个代码框，运行这样一段代码。在这里，我们选择了这几个连续型的特征，进行归一化，收入、预算、年龄以及孩子的数量。接着看第二行，我们创建了一个缩放器实例，用于后续的 fit() 和 transform()。接下来，我们使用 fit_transform 这个函数对数据拟合并转换，然后返回缩放后的值。然后，我们为每个缩放后的字段，重新创建新的列名，后缀加上 .scale 的，保留原始列，以便后续对比或调试。最后，我们把归一化后的数据，添加到 Data Frame 作为新的列。我们这里保留原始数据是一种良好的习惯，可以方便后面的调试或者可视化分析。最后，我们使用 print() 函数打印了前 5 行归一化后的数据，来验证处理的结果。如果所有的值都在 0 到 1 之间，…

防微杜渐的意思是什么	阴虚火旺吃什么好	猫是什么动物	双鱼座最配什么星座	每天经常放屁什么原因
为什么会得飞蚊症	fdg是什么意思	世态炎凉是什么意思	越狱男主角叫什么	mra是什么意思
排骨炖什么最好吃	94年什么生肖	六字真言是什么意思	什么动作容易怀孕	骨折有什么忌口
新鲜的乌梅长什么样	黄鼠狼为什么叫黄大仙	胸口闷闷的有点疼是什么原因	上眼药是什么意思	新生儿什么时候吃ad

仓鼠能吃什么hcv8jop9ns0r.cn	初恋是什么意思hcv9jop4ns0r.cn	孽缘什么意思hcv9jop3ns4r.cn	胃胀是什么症状hcv9jop3ns6r.cn	结婚6年是什么婚hcv9jop0ns2r.cn
陆代表什么生肖imcecn.com	药敏试验是什么意思hcv8jop6ns8r.cn	有什么好处chuanglingweilai.com	痦子是什么hcv9jop7ns2r.cn	口腔扁平苔藓吃什么药好得快bfb118.com
种田文什么意思hcv9jop3ns6r.cn	focus什么意思hcv8jop1ns7r.cn	笏是什么意思hcv9jop4ns5r.cn	银耳有什么功效hcv7jop9ns0r.cn	羊水多了对宝宝有什么影响cj623037.com
肝火旺吃什么调理hcv9jop3ns1r.cn	事物是什么意思travellingsim.com	八年是什么婚hcv8jop4ns6r.cn	什么人容易长智齿hcv8jop2ns1r.cn	女人吃什么最补子宫hcv8jop5ns1r.cn

免费学习该课程！

今天就开通帐号，24,700 门业界名师课程任您挑！

外媒关注中国高校开设减肥课：激励学生更加健康

课程: Python 机器学习基础

特征缩放与归一化

下载课程离线学习

内容

别再等了，今天就开始学习吧！

探索商务领域