Python数据预处理
作者:管理员 发布时间:2020-12-29 09:35
对于拿到手的一堆数据,对这些数据的初加工,就叫预处理;
他的常见流程如下:
工欲善其事,必先利其器!
Python就是一个做数据处理与分析的利器,其中Pandas、Numpy库的支持,也让Python如虎添翼!
我们先从几款工具的使用开始,逐步了解数据处理的方法!
Pandas
Pandas提供两个主要数据结构分为:
Series(一维数据)与DataFrame(二维数据);
Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成,即index和values两部分,可以通过索引的方式选取Series中的单个或一组值。
一维数据就是
这样的数据;
DataFrame是一个表格型的数据类型,每列值类型可以不同,是最常用的pandas对象。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。
二维数据就是
这样的数据,也可以是个有行有列的表格。
标签:
更多介绍:
Pandas |
数据抽取/选择 |
数据增改 |
数据清洗 |
数据格式化 |
数据转换 |
数据排序 |
计算与统计 |
数据分组 |
时间序列 |