1.去掉重复行

使用pandas自带的drop_duplicates方法:
norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')
#去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行
补充:
当keep=False时,就是去掉所有的重复行
当keep=‘first’时,就是保留第一次出现的重复行
当keep=’last’时就是保留最后一次出现的重复行。
(注意,这里的参数是字符串,要加引号!!!)

2.去掉NaN行

使用pandas自带的dropna()方法:
#删除表中某行全部为NaN的行 nonan_df = df.dropna(axis=0, how='all') #删除表中某行含有任何NaN的行
nonan_df = df.dropna(axis=0, how='any')
补充:
删除行的参数axis = 0
删除列的参数axis = 1

友情链接
KaDraw流程图
API参考文档
OK工具箱
云服务器优惠
阿里云优惠券
腾讯云优惠券
华为云优惠券
站点信息
问题反馈
邮箱:ixiaoyang8@qq.com
QQ群:637538335
关注微信