pandas中文网:
https://www.pypandas.cn/
1、什么是pandas?
Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。
2、pandas所能处理的数据类型?
- 与 SQL(structured query language结构化查询语言) 或 Excel 表类似的,含异构列的表格数据;
数据的异构性:数据的结构不同
稍微详细一点的讲解(在做数据分析时为什么要考虑数据的异构性)https://www.zhihu.com/answer/332057702(知乎链接)
- 有序和无序(非固定频率)的时间序列数据(股票涨落的变动趋势、心脏每分每秒的周期性搏动、随思维跳跃的脑电波曲线);
- 带行列标签的矩阵数据,包括同构或异构型数据;
- 任意其它形式的观测、统计数据集,
3、Pandas 的主要数据结构是
Series
(一维数据)与
DataFrame
(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。
4、数据处理的一般阶段
数据整理与清洗、数据分析与建模、数据可视化与制表
5、第一部分主讲
1、处理浮点与非浮点数据里的缺失数据,表示为NaN;
2、删除 DataFrame 等多维对象的列;
3、读取文本文件(CSV 等支持分隔符的文件)并转换为csv文件、Excel 文件、数据库等来源的数据,
4、pandas 制作图表
版权声明:本文为weixin_43601884原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。