Python数据预处理

作者:管理员 发布时间:2020-12-29 09:35

    对于拿到手的一堆数据,对这些数据的初加工,就叫预处理;

    他的常见流程如下:


    工欲善其事,必先利其器!

    Python就是一个做数据处理与分析的利器,其中Pandas、Numpy库的支持,也让Python如虎添翼!

    我们先从几款工具的使用开始,逐步了解数据处理的方法!


Pandas  

    Pandas提供两个主要数据结构分为:

    Series(一维数据)与DataFrame(二维数据);

    Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成,即index和values两部分,可以通过索引的方式选取Series中的单个或一组值。

一维数据就是

[1,1,2,3,4,4,...]

这样的数据;


DataFrame是一个表格型的数据类型,每列值类型可以不同,是最常用的pandas对象。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。

二维数据就是

[{name:"xiaoming",value:"1"},{name:"suanfashi",value:"2"}]

这样的数据,也可以是个有行有列的表格。



标签:
更多介绍:
Pandas
数据抽取/选择
数据增改
数据清洗
数据格式化
数据转换
数据排序
计算与统计
数据分组
时间序列
Copyright © 2020 万物律动 旗下 AI算法狮 京ICP备20010037号-1
本站内容来源于网络开放内容的收集整理,并且仅供学习交流使用;
如有侵权,请联系删除相关内容;