Pandas简介

  • Post author:
  • Post category:其他


pandas中文网:

https://www.pypandas.cn/

1、什么是pandas?

Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。

2、pandas所能处理的数据类型?

  • 与 SQL(structured query language结构化查询语言) 或 Excel 表类似的,含异构列的表格数据;

数据的异构性:数据的结构不同

稍微详细一点的讲解(在做数据分析时为什么要考虑数据的异构性)https://www.zhihu.com/answer/332057702(知乎链接)

  • 有序和无序(非固定频率)的时间序列数据(股票涨落的变动趋势、心脏每分每秒的周期性搏动、随思维跳跃的脑电波曲线);
  • 带行列标签的矩阵数据,包括同构或异构型数据;
  • 任意其它形式的观测、统计数据集,

3、Pandas 的主要数据结构是

Series

(一维数据)与

DataFrame

(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。

4、数据处理的一般阶段

数据整理与清洗、数据分析与建模、数据可视化与制表

5、第一部分主讲

1、处理浮点与非浮点数据里的缺失数据,表示为NaN;

2、删除 DataFrame 等多维对象的列;

3、读取文本文件(CSV 等支持分隔符的文件)并转换为csv文件、Excel 文件、数据库等来源的数据,

4、pandas 制作图表



版权声明:本文为weixin_43601884原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。