今天看了《基于python的大数据分析基础及实战》看到了pandas.Series.rank()默认情况下的结果
注:pandas.Series.rank()把对象的value替换为数值等级(相应的名次)。
import pandas as pd
from pandas import Series
ser = Series([4,2,0,3],index=list('abcd'))
ser.rank()
结果是
a 4.0
b 2.0
c 1.0
d 3.0
dtype: float64
import pandas as pd
from pandas import Series
ser = Series([3,2,0,3],index=list('abcd'))
ser.rank()
结果是
a 3.5
b 2.0
c 1.0
d 3.5
dtype: float64
我的理解就是如果是平级,那么其默认的情况等级就是(3+4)/2 = 3.5
import pandas as pd
from pandas import Series
ser = Series([3,2,0,3,3],index=list('abcde'))
ser.rank()
结果是
a 4.0
b 2.0
c 1.0
d 4.0
e 4.0
dtype: float64
(3+4+5)/3 = 4
Series.rank(axis=0, method=‘average’, numeric_only=None, na_option=‘keep’, ascending=True, pct=False)具体用法不介绍。
版权声明:本文为weixin_44356655原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。