需要把下面的dataframe里面列的数据类型是list的列拆分成多个行:
df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]})
df
Out[458]:
A B
0 1 [1, 2]
1 2 [1, 2]
所用代码如下:
(1)如果你要拆分的dataframe只有两列,那么使用下面的方法(亲测非常高效):
df=pd.DataFrame({'A':df.A.repeat(df.B.str.len()),'B':np.concatenate(df.B.values)})
df
Out[465]:
A B
0 1 1
0 1 2
1 2 1
1 2 2
(2)如果要拆分的dataframe有多列,那么可能需要使用下面的方法(还没有尝试过,期待有机会尝试),需要使用到numpy:
newvalues=np.dstack((np.repeat(df.A.values,list(map(len,df.B.values))),np.concatenate(df.B.values)))
pd.DataFrame(data=newvalues[0],columns=df.columns)
A B
0 1 1
1 1 2
2 2 1
3 2 2
参考:
版权声明:本文为u011412768原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。