当前标签: DataFrame
python dataframe选择满足某条件的行,进行操作
import pandas as pd data = {'state':['Ohio','Ohio','Merry','Nevaio','Nevada'], 'year':[2000,2001,2002,2001,2002], 'pop':[1.5,1.7,3.6,2.4,2.9] } frame = pd.Dat...
2018-11-27 23:29
阅读(2169)
Pandas DataFrame 取一行数据会得到Series
Pandas DataFrame 取一行数据会得到Series 如题,想要取如下dataframe的一行数据,以为得到的还是dataframe lista = [1, 3, 7,4,0] listb = [3, 3, 4,4,5] listc = [3, 3, 4,4,6] df1 = pd.DataFrame(...
2018-08-20 15:51
阅读(1597)
Spark 创建RDD、DataFrame各种情况的默认分区数
我的原创地址:https://dongkelun.com/2018/08/13/sparkDefaultPartitionNums/ <https://dongkelun.com/2018/08/13/sparkDefaultPartitionNums/> 前言 熟悉Spark的分区对于Spark性能调优很重...
2018-08-14 10:55
阅读(226)
Pandas个人操作练习(1)创建dataframe及插入列、行操作
使用pandas之前要导入包: import numpy as np import pandas as pd import random #其中有用到random函数,所以导入 一、dataframe创建 pandas.DataFrame(data=None, index=None, columns=...
2018-08-03 17:30
阅读(424)
pandas中关于DataFrame去掉重复行和NaN行
1.去掉重复行 使用pandas自带的drop_duplicates方法: norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first') #去掉UNIT_ID和KPI_ID列中重复的行,并保留重复出现的行中第一次出现的行 补充: ...
2018-08-03 16:50
阅读(8780)
Pandas的DataFrame教程——指定位置增加删除一行一列
1、删除一行、一列 >>> df A B C D 0 1 3 3 4 1 5 6 7 8 2 1 1 1 1 3 2 3 2 3 #删除A列,不改变原来的data数据,返回删除后的新表data_2。axis为1表示删除列,0表示删除行。inplace为True表示直接对原表修改。 >>> data_2 = df....
2018-08-03 11:10
阅读(6918)
如何将groupby之后的groupby对象转化为dataframe
先将其转换成为字典,再将字典赋值给dataframe dictSale_skuid = dict(list(dfSale.groupby('item_sku_id',as_index=False))) mydf = DataFrame(dictSale_skuid[item_id]) ...
2018-07-23 09:25
阅读(1267)
pandas的dataframe如何更改数据类型?
pandas的dataframe数据类型转换 在使用pandas库进行数据分析时,有时候会需要将object类型转换成数值类型(float,int),那么如何做呢? 主要有以下三种方法:创建时指定类型,df.astype强制类型转换,以及使用pd.to_numeric() 转换成适当数值类型。 一,...
2018-07-22 20:38
阅读(443)