Kaip apskaičiuoti vidurkius naudojant pandas mean()

Contents

Python pandas DataFrame.mean() funkcija naudojama vidurkiams apskaičiuoti pagal vieną ar daugiau DataFrame ašių. Pandas mean() yra būtina skaitmeninių duomenų analizei. Be vidurkių apskaičiavimo, ji taip pat suteikia informacijos apie duomenų pasiskirstymą.

Kokia yra `DataFrame.mean()` sintaksė?

Funkcija pandas mean() priima iki trijų parametrų ir turi tokią sintaksę:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)

python

Kokie parametrai gali būti naudojami su pandas `Dataframe.mean`?

Galite naudoti įvairius parametrus, kad pritaikytumėte pandas DataFrame.mean() veikimą.

Parametras	Aprašymas	Numatytasis vertė
`axis`	Nurodo, ar skaičiavimas atliekamas pagal eilutes (`axis=0`) ar stulpelius (`axis=1`)	`0`
`skipna`	Jei nustatyta `True`, NaN reikšmės bus ignoruojamos.	`True`
`numeric_only`	Jei nustatoma `True`, į skaičiavimus bus įtraukti tik skaitmeniniai duomenų tipai.	`False`

Kaip naudoti pandas `mean()`

Pandas DataFrame.mean() funkciją galite taikyti tiek stulpeliams, tiek eilutėms.

Vidutinių stulpelių verčių skaičiavimas

Pirmiausia sukursime pandas DataFrame su keliais skaitiniais duomenimis:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)

python

Gautas duomenų rėmelis atrodo taip:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

Norėdami apskaičiuoti kiekvienos stulpelio vidurkį, galite naudoti pandas mean() funkciją. Pagal numatytuosius nustatymus ašies parametras yra nustatytas kaip 0, kuris atitinka stulpelius.

column_means = df.mean()
print(column_means)

python

Pateiktas kodas apskaičiuoja kiekvienos kolonos (A, B ir C) vidurkį, surandant atitinkamos kolonos elementų sumą ir padalijant ją iš kolonos elementų skaičiaus. Rezultatas yra toks pandas serijos:

A    2.5
B    5.5
C    8.5
dtype: float64

Eilutės vidutinių verčių skaičiavimas

Jei norite rasti eilučių vidurkį, tiesiog nustatykite parametrą axis į 1:

row_means = df.mean(axis=1)
print(row_means)

python

Pandas mean() apskaičiuoja eilučių vidurkius, dalydamas eilutės elementų sumą iš elementų skaičiaus. Iššaukdami aukščiau pateiktą funkciją, gausime tokį rezultatą:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

NaN verčių tvarkymas

Šiame pavyzdyje naudosime kitą duomenų rėmelį, kuriame yra NaN reikšmės:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)

python

Pateiktas kodas sukuria tokį duomenų rėmelį:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Apskaičiuojant stulpelių vidurkius, parametras skipna nustato, ar NaN reikšmės turi būti įtrauktos, ar ignoruojamos. Pagal numatytuosius nustatymus skipna yra nustatytas kaip True, todėl df.mean() automatiškai ignoruoja NaN reikšmes. Jei norite įtraukti NaN reikšmes, turite pridėti skipna=False kaip parametrą. Tai padaryti, bet kuris stulpelis, kuriame yra bent viena NaN reikšmė, grąžins NaN kaip savo vidurkį.

mean_with_nan = df.mean() 
print(mean_with_nan)

python

Skambinant df.mean() gaunamas toks rezultatas:

A    2.333333
B    5.666667
C    8.000000
dtype: float64

Kaip sujungti duomenų rėmus naudojant pandas merge()

Pandas DataFrame merge() metodas siūlo kūrėjams įvairius būdus, kaip sujungti duomenis iš skirtingų šaltinių. Naudodami parametrus, vartotojai gali atlikti įvairių tipų sujungimo operacijas savo duomenų analizei. Šiame straipsnyje apžvelgsime pandas merge() funkcijos sintaksę,…

Mr. Kosalshutterstock

Kas yra Pandas fillna() ir kaip ją naudoti

Pandas fillna() metodas yra funkcija, skirta trūkstamų verčių tvarkymui. Su šia funkcija galima naudoti įvairius parametrus, todėl NaN verčių pakeitimas yra lankstus. Šiame straipsnyje apžvelgsime šią funkciją, jos sintaksę ir parametrus bei tai, kaip pritaikyti NaN verčių…

Kaip nustatyti trūkstamas reikšmes naudojant pandas isna() funkciją

Pandas isna() funkcija yra naudinga priemonė trūkstamų duomenų identifikavimui DataFrame. Dėl savo paprastos sintaksės ji greitai pateikia aiškų trūkstamų verčių apžvalgą, padėdama imtis veiksmų, kai reikia išvalyti duomenis. Šiame straipsnyje sužinosite, kas yra pandas isna() ir…

BEST-BACKGROUNDSShutterstock

Kaip ieškoti duomenų rėmelių naudojant pandas isin()

Pandas isin() yra naudinga funkcija duomenų analizei. Dėl paprastos sintaksės ir universalių taikymo galimybių ji leidžia efektyviai tikrinti vertes DataFrame. Nesvarbu, ar tikrinate atskiras stulpelius, filtruojate DataFrames, ar atliekate sudėtingesnes analizes su žodynais,…

NDAB Creativityshutterstock

Kas yra pandas groupby() ir kaip jį naudoti

Pandas DataFrame.groupby() funkcija yra galingas įrankis duomenų tvarkymui. Ji leidžia sugrupuoti duomenis pagal konkrečius kriterijus, todėl lengviau atlikti sudėtingus agregavimus ir transformavimus. Efektyviai naudodami šį metodą, galite supaprastinti analizės procesus,…

UndreyShutterstock

Kaip filtruoti skirtingas reikšmes naudojant pandas DataFrame[].unique()

Naudodami pandas DataFrame[].unique(), galite identifikuoti skirtingas reikšmes DataFrame stulpelyje. Jis grąžina numpy masyvą, padedantį efektyviau tvarkyti didelius duomenų rinkinius. Šis metodas ypač naudingas, jei norite gauti stulpelyje esančios informacijos apžvalgą be…

Kaip ap­skai­čiuo­ti vidurkius naudojant pandas mean()

Kokia yra DataFrame.mean() sintaksė?

Kokie pa­ra­met­rai gali būti naudojami su pandas Dataframe.mean?

Kaip naudoti pandas mean()

Vidutinių stulpelių verčių skai­čia­vi­mas

Eilutės vidutinių verčių skai­čia­vi­mas

NaN verčių tvarkymas

Kaip apskaičiuoti vidurkius naudojant pandas mean()

Kokia yra `DataFrame.mean()` sintaksė?

Kokie parametrai gali būti naudojami su pandas `Dataframe.mean`?

Kaip naudoti pandas `mean()`

Vidutinių stulpelių verčių skaičiavimas

Eilutės vidutinių verčių skaičiavimas