Среднее и Максимальное на датафрейме Python

Можно ли одновременно выполнять операции max и mean на кадре данных. Моя цель - создать гистограмму и линейный график для следующих данных в Python.

  1. Найти 3 страны с наибольшим количеством баллов {Германия, Канада, Франция}
  2. Для вышеперечисленных стран найти среднюю цену

Бар будет на максимальных баллах, в то время как линии тренда будут на средней цене

import numpy as np

dfrn1 = pd.DataFrame({
    'country' : np.array(['France', 'US', 'France', 'US', 'Germany', 'US', 'France', 'France', 'India', 'Canada' ]),
    'price' : np.array([1,2,3,4,5,6,7,8,9,7]),
    'points' : np.array([98,88,90,90,100,69,87,87,87,99 ])
})

dfrn1

Это то, что у меня есть

country = dfrn1.groupby("country")

country.describe().head()

t1 = country.points.max().sort_values(ascending=False).head(4).reset_index(name='points')
t2 = country.price.mean().reset_index(name='price') 

mergedStuff = pd.merge(t1, t2, on=['country'], how='inner')
mergedStuff

fig = go.Figure()

fig.add_trace(
    go.Bar(
        x= mergedStuff['country'],
        y= mergedStuff['points'],
        name="Maximum Points" ,
        marker=dict(color = '#47d2fc'),

    ))
fig.add_trace(
    go.Scatter(
        x= mergedStuff['country'],
        y= mergedStuff['price'],
        name="Average Price" ,
        line=go.scatter.Line(color="crimson"),
    ))        

fig.show()

Всего 1 ответ


temp = dfrn1['points'].nlargest(3)
df2 = pd.merge(dfrn1, temp).sort_values('points', ascending=False) # creates a dataframe of top 3 countries with maximum points sorted in descending order

df2
df2["price"].mean()

Не самое эффективное решение, но надеюсь, оно вам поможет!