数据清洗

作者:管理员 发布时间:2021-02-01 14:07

数据清洗就是删除掉或筛选掉没用的数据。

本章节重点为,数据的筛选与删除!


如果我们想直接删除某列:

del df['col1'] #直接删除某列


DataFrame清洗

函数描述操作
drop()删除行或列 编辑 删除
duplicated()查找重复数据 编辑 删除
drop_duplicates()删除重复数据 编辑 删除
isna()检测缺失值。 编辑 删除
dropna()删除不完整的行 编辑 删除
fillna()缺失值的填充 编辑 删除
replace()替换数据 编辑 删除

Series清洗

函数描述操作
str.contains()测试pattern或regex是否包含在Series或Index的字符串中 编辑 删除
isna()检测缺失值。 编辑 删除
str.json()链接字符串 编辑 删除
strip()/lstrip()/rstrip()去空格 编辑 删除

标签:
Copyright © 2020 万物律动 旗下 AI算法狮 京ICP备20010037号-1
本站内容来源于网络开放内容的收集整理,并且仅供学习交流使用;
如有侵权,请联系删除相关内容;