Kako izračunati povprečja s pandas mean()

Contents

Funkcija DataFrame.mean() v Python pandas se uporablja za izračun povprečij po eni ali več oseh DataFrame. Pandas mean() je bistven za analizo numeričnih podatkov. Poleg izračuna povprečnih vrednosti ponuja tudi vpogled v porazdelitev podatkov.

Kakšna je sintaksa za `DataFrame.mean()`?

Funkcija pandas mean() sprejme do tri parametre in ima naslednjo sintakso:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)

python

Kateri parametri se lahko uporabljajo s pandas `Dataframe.mean`?

Za prilagajanje delovanja pandas DataFrame.mean() lahko uporabite različne parametre.

Parameter	Opis	Privzeta vrednost
`axis`	Določa, ali se izračun izvede po vrsticah (`axis=0`) ali stolpcih (`axis=1`).	`0`
`skipna`	Če je nastavljeno na `True`, se vrednosti NaN ignorirajo.	`True`
`numeric_only`	Če je nastavljeno na `True`, bodo v izračun vključeni samo numerični podatkovni tipi.	`False`

Kako uporabljati pandas `mean()`

Funkcijo pandas DataFrame.mean() lahko uporabite za stolpce in vrstice.

Izračun povprečnih vrednosti za stolpce

Najprej bomo ustvarili pandas DataFrame z nekaterimi numeričnimi podatki:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)

python

Rezultatni DataFrame izgleda takole:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

Za izračun povprečja vsakega stolpca lahko uporabite funkcijo pandas mean(). Privzeto je parameter osi nastavljen na 0, kar ustreza stolpcem.

column_means = df.mean()
print(column_means)

python

Zgornja koda izračuna povprečje za vsak stolpec (A, B in C) tako, da poišče vsoto elementov v posameznem stolpcu in jo nato deli s številom elementov v stolpcu. Rezultat je naslednja pandas Series:

A    2.5
B    5.5
C    8.5
dtype: float64

Izračun povprečnih vrednosti za vrstice

Če želite izračunati povprečje za vrstice, preprosto nastavite parameter axis na 1:

row_means = df.mean(axis=1)
print(row_means)

python

Pandas mean() izračuna povprečja vrstic tako, da vsoto elementov v vrstici deli s številom elementov, ki jih vsebuje. Klic funkcije zgoraj da naslednji izpis:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

Obravnavanje vrednosti NaN

V tem primeru bomo uporabili drugačen DataFrame, ki vsebuje vrednosti NaN:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)

python

Zgornja koda ustvari naslednji DataFrame:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Pri izračunu povprečij za stolpce parameter skipna določa, ali naj se vrednosti NaN vključijo ali ignorirajo. Privzeto je skipna nastavljeno na True, tako da df.mean() samodejno ignorira vrednosti NaN. Če želite vključiti vrednosti NaN, morate dodati skipna=False kot parameter. S tem bo vsak stolpec z vsaj eno vrednostjo NaN vrnil NaN kot svojo srednjo vrednost.

mean_with_nan = df.mean() 
print(mean_with_nan)

python

Klic df.mean() da naslednji izpis:

A    2.333333
B    5.666667
C    8.000000
dtype: float64

Kako združiti DataFrames s pandas merge()

Metoda pandas DataFrame merge() razvijalcem ponuja različne načine za združevanje podatkov iz različnih virov. Z uporabo parametrov lahko uporabniki izvajajo različne vrste operacij združevanja za analizo podatkov. V tem članku bomo pogledali sintakso funkcije pandas merge(),…

Mr. Kosalshutterstock

Kaj je Pandas fillna() in kako ga uporabljati

Metoda Pandas fillna() je funkcija, ki se uporablja za obdelavo manjkajočih vrednosti. S funkcijo se lahko uporabljajo različni parametri, kar omogoča fleksibilnost pri nadomeščanju vrednosti NaN. V tem članku si bomo ogledali to funkcijo, njeno sintakso in parametre ter kako…

Kako identificirati manjkajoče vrednosti s funkcijo pandas isna()

Funkcija pandas isna() je uporabno orodje za prepoznavanje manjkajočih podatkov v DataFrame. S svojo preprosto sintakso vam hitro prikaže jasen pregled manjkajočih vrednosti in vam pomaga ukrepati, ko je treba podatke očistiti. V tem članku boste izvedeli, kaj je pandas isna() in…

BEST-BACKGROUNDSShutterstock

Kako iskati DataFrames z uporabo pandas isin()

Pandas isin() je uporabna funkcija za analizo podatkov. S svojo preprosto sintakso in vsestranskimi možnostmi uporabe omogoča učinkovito preverjanje vrednosti v DataFrame. Ne glede na to, ali preverjate posamezne stolpce, filtrirate DataFrames ali izvajate bolj zapletene analize…

NDAB Creativityshutterstock

Kaj je pandas groupby() in kako ga uporabljati

Funkcija pandas DataFrame.groupby() je močno orodje za organiziranje podatkov. Omogoča vam, da podatke razvrstite po določenih merilih, kar olajša izvajanje kompleksnih agregacij in transformacij. Z učinkovito uporabo te metode lahko poenostavite svoje analitične procese, tako da…

UndreyShutterstock

Kako filtrirati različne vrednosti s pandas DataFrame[].unique()

S pandas DataFrame[].unique() lahko identificirate različne vrednosti v stolpcu DataFrame. Vrne numpy niz, ki vam pomaga učinkoviteje obdelovati velike podatkovne nize. Metoda je še posebej koristna, če želite imeti pregled nad informacijami v stolpcu brez podvojenih vrednosti.…

Kako iz­ra­ču­na­ti povprečja s pandas mean()

Kakšna je sintaksa za DataFrame.mean()?

Kateri parametri se lahko upo­ra­blja­jo s pandas Dataframe.mean?

Kako upo­ra­blja­ti pandas mean()

Izračun pov­preč­nih vrednosti za stolpce

Izračun pov­preč­nih vrednosti za vrstice

Obrav­na­va­nje vrednosti NaN

Kako izračunati povprečja s pandas mean()

Kakšna je sintaksa za `DataFrame.mean()`?

Kateri parametri se lahko uporabljajo s pandas `Dataframe.mean`?

Kako uporabljati pandas `mean()`

Izračun povprečnih vrednosti za stolpce

Izračun povprečnih vrednosti za vrstice

Obravnavanje vrednosti NaN