pandas.Series.rank()用法的理解

  • Post author:
  • Post category:其他


今天看了《基于python的大数据分析基础及实战》看到了pandas.Series.rank()默认情况下的结果

注:pandas.Series.rank()把对象的value替换为数值等级(相应的名次)。

import pandas as pd
from pandas import Series
ser = Series([4,2,0,3],index=list('abcd'))
ser.rank()

结果是

a 4.0

b 2.0

c 1.0

d 3.0

dtype: float64

import pandas as pd
from pandas import Series
ser = Series([3,2,0,3],index=list('abcd'))
ser.rank()

结果是

a 3.5

b 2.0

c 1.0

d 3.5

dtype: float64

我的理解就是如果是平级,那么其默认的情况等级就是(3+4)/2 = 3.5

import pandas as pd
from pandas import Series
ser = Series([3,2,0,3,3],index=list('abcde'))
ser.rank()

结果是

a 4.0

b 2.0

c 1.0

d 4.0

e 4.0

dtype: float64

(3+4+5)/3 = 4

Series.rank(axis=0, method=‘average’, numeric_only=None, na_option=‘keep’, ascending=True, pct=False)具体用法不介绍。



版权声明:本文为weixin_44356655原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。