Попытка сопоставить формулу Excel PERCENTRANK в Python

Я пытаюсь использовать Python для воспроизведения результатов, которые я получаю в Excel. Одна из формул Excel - 2-летнее скользящее процентное звание. Данные за неделю. и я ищу ранг самой последней точки данных. Формула Excel выглядит следующим образом. =PERCENTRANK.INC('Indices'!P7:P110,'Indices'!P110, 5)

Используя Excel, я получаю значение .26213

Используя Python, я получаю значение .26923 что достаточно для того, чтобы изменить значения ниже по течению

Кто-нибудь есть идеи, как я могу сопоставить расчет Excel и результаты?

Вот что я пробовал в Python:

#python
rollWindow = 104

example = pd.Series([100.0268, 98.6107, 96.8536, 96.9045, 95.7169, 95.0132, 95.716, 95.7043, 95.6948, 96.9666, 97.6367, 97.4099, 96.3846, 95.5558, 95.2478, 94.5487, 95.295, 94.2901, 94.3517, 95.6225, 94.81, 93.915, 91.6883, 91.5727, 91.6745, 90.3186, 89.9786, 88.6776, 86.9716, 85.4051, 86.3174, 86.2327, 87.2157, 85.8357, 87.0657, 86.9309, 84.5083, 84.0628, 81.5965, 81.7031, 79.3157, 80.8909, 80.5395, 81.56, 80.5344, 82.2279, 81.3875, 80.6736, 82.5171, 83.4307, 82.1976, 80.809, 79.7344, 79.5829, 78.7555, 79.2864, 80.4945, 80.0812, 79.9429, 80.97, 82.1083, 82.1985, 83.0025, 82.1122, 83.9145, 84.4257, 82.2824, 81.596, 81.1486, 81.0595, 80.0349, 80.6402, 81.555, 79.7871, 78.9343, 79.3772, 78.0532, 76.942, 75.5564, 74.6491, 74.6702, 73.9801, 73.7626, 72.6968, 73.4371, 72.5184, 73.6416, 72.7711, 73.1224, 75.8298, 75.5966, 73.3623, 73.4183, 74.033, 73.7934, 74.6728, 76.1003, 76.5892, 76.2145, 77.1619, 77.9082, 78.201, 78.1049, 78.2039])

«»»

Используя Pandas.rank я получаю .26923

python
def my_rank(x):
   return pd.Series(x).rank(pct=True).iloc[-1]
percentrank = example.rolling(rollWindow).apply(my_rank, raw=False)

Попытка еще раз, другим способом (не совсем) я получаю .26923

python
pctrank = lambda x: pd.Series(x).rank(pct=True).iloc[-1]
percentrank3 = example.rolling(window=rollWindow, center=False).apply(pctrank, raw=True)

Используя SciPy.Stats я получаю .2692308

python
def set_rank(x):
    return stats.percentileofscore(x,x[-1])
percentrank = example.rolling(rollWindow).apply(set_rank, raw=True)

Спасибо за внимание!

Всего 1 ответ


Я не очень знаком с функцией Percentrank в Excel, но похоже, что вы могли бы достичь того же результата, используя что-то вроде:

def percent_rank(pd_series, value, precision):
    return np.round((pd_series < value).astype(int).sum()/(len(pd_series) -1), precision) 

Если вы заинтересованы в получении всех значений одновременно (т.е. где каждое значение находится в вашем диапазоне):

def percent_rank(pd_series, precision):
    return [np.round((pd_series< value).astype(int).sum()/(len(pd_series) -1), precision) for value in pd_series]

Надеюсь, это поможет!


Есть идеи?

10000