数据挖掘入门:(二)EDA-探索性数据分析

  • Post author:
  • Post category:其他


参考资料:

【1】零基础入门数据挖掘-二手车交易价格预测-阿里云

https://tianchi.aliyun.com/competition/entrance/231784/introduction

【2】Datawhale 零基础入门数据挖掘

https://github.com/datawhalechina/team-learning/


(二)EDA-探索性数据分析(EDA,Exploratory Data Analysis)

EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机

器学习或者深度学习使用。

当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。

是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过

作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。

1. 载入各种数据科学以及可视化库:pandas、numpy、scipy;matplotlib、seabon;



版权声明:本文为weixin_43275811原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。