Python数据分析学习笔记:使用SciKit-Learn进行数据规范化
【摘要】
Python数据分析学习笔记:使用SciKit-Learn进行数据规范化
数据规范化是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,比如[0, 1],便于...
Python数据分析学习笔记:使用SciKit-Learn进行数据规范化
数据规范化是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,比如[0, 1],便于进行综合分析。
SciKit-Learn是Python的重要机器学习库,封装了大量的机器学习算法,比如分类、聚类、回归、降维等,此外,还包括了数据变换模块,下面我们来学习使用SciKit-Learn提供的数据转换模块进行数据规范化。
一、Min-Max规范化
Min-Max规范化也称为离散标准化,是对原始数据的线性变换,将数据值映射到[0, 1]之间。
公式:新数值 = (原数值 - 最小值) / (最大值 - 最小值)
SciKit-Learn里有个MinMaxScaler函数可以将原始数据映射到[min, max]区间,默认情况下,[min, max]就是[0, 1]。
但是可以通过规范器(MinMaxScaler)设置参数:scaler.set_params().feature_range = (a, b),于是[min, max] = [a, b]。
1、导入模块
文章来源: howard2005.blog.csdn.net,作者:howard2005,版权归原作者所有,如需转载,请联系作者。
原文链接:howard2005.blog.csdn.net/article/details/102778309
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)