Python数据分析学习笔记:使用SciKit-Learn进行数据规范化

举报
howard2005 发表于 2021/11/19 02:57:36 2021/11/19
【摘要】 Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,比如[0, 1],便于...

Python数据分析学习笔记:使用SciKit-Learn进行数据规范化

数据规范化是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,比如[0, 1],便于进行综合分析。

SciKit-Learn是Python的重要机器学习库,封装了大量的机器学习算法,比如分类、聚类、回归、降维等,此外,还包括了数据变换模块,下面我们来学习使用SciKit-Learn提供的数据转换模块进行数据规范化。

一、Min-Max规范化

Min-Max规范化也称为离散标准化,是对原始数据的线性变换,将数据值映射到[0, 1]之间。

公式:新数值 = (原数值 - 最小值) / (最大值 - 最小值)

SciKit-Learn里有个MinMaxScaler函数可以将原始数据映射到[min, max]区间,默认情况下,[min, max]就是[0, 1]。

但是可以通过规范器(MinMaxScaler)设置参数:scaler.set_params().feature_range = (a, b),于是[min, max] = [a, b]。

1、导入模块

文章来源: howard2005.blog.csdn.net,作者:howard2005,版权归原作者所有,如需转载,请联系作者。

原文链接:howard2005.blog.csdn.net/article/details/102778309

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。