python 整列运算_Pandas对DataFrame单列/多列进行运算(map, apply, transform, agg)

  • Post author:
  • Post category:python


1.单列运算

在Pandas中,DataFrame的一列就是一个Series, 可以通过map来对一列进行操作:

df[‘col2’] = df[‘col1’].map(lambda x: x**2)

其中lambda函数中的x代表当前元素。可以使用另外的函数来代替lambda函数,例如:

define square(x):

return (x ** 2)

df[‘col2’] = df[‘col1’].map(square)

2.多列运算

apply()会将待处理的对象拆分成多个片段,然后对各片段调用传入的函数,最后尝试将各片段组合到一起。

要对DataFrame的多个列同时进行运算,可以使用apply,例如col3 = col1 + 2 * col2:

df[‘col3’] = df.apply(lambda x: x[‘col1’] + 2 * x[‘col2’], axis=1)

其中x带表当前行,可以通过下标进行索引。

示例2

In [44]: f = lambda x : x.max()-x.min()

In [45]: df.apply(f)

Out[45]:

data1 5.042275

data2 1.967290

dtype: float64

In [46]: df.apply(f,axis=1)

Out[46]:

0 2.810074

1 1.009774

2 0.



版权声明:本文为weixin_39739404原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。