Kuidas arvutada keskmisi pandas mean() abil

Contents

Python pandas’i funktsiooni DataFrame.mean() kasutatakse keskmiste arvutamiseks ühe või mitme DataFrame’i telje puhul. Pandas mean() on oluline numbriliste andmete analüüsimiseks. Lisaks keskmiste väärtuste arvutamisele pakub see ka ülevaadet andmete jaotumisest.

Mis on `DataFrame.mean()` süntaxis?

Funktsioon pandas mean() võtab vastu kuni kolm parameetrit ja selle süntaks on järgmine:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)

python

Milliseid parameetreid saab kasutada pandas `Dataframe.mean`-ga?

Saate kasutada erinevaid parameetreid, et kohandada pandas DataFrame.mean() töötamist.

Parameeter	Kirjeldus	Vaikimisi väärtus
`axis`	Määrab, kas arvutus tehakse ridade (`axis=0`) või veergude (`axis=1`) põhjal.	`0`
`skipna`	Kui on seatud `True`, ignoreeritakse NaN väärtused.	`True`
`numeric_only`	Kui seadistada `True`, arvestatakse arvutamisel ainult numbrilisi andmetüüpe.	`False`

Kuidas kasutada pandas `mean()`

Funktsiooni pandas DataFrame.mean() saab rakendada nii veergudele kui ka ridadele.

Veergude keskmiste väärtuste arvutamine

Esiteks loome pandas DataFrame’i mõningate numbriliste andmetega:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)

python

Saadud andmeraamistik näeb välja järgmine:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

Iga veeru keskmise arvutamiseks võite kasutada pandas mean() funktsiooni. Vaikimisi on telje parameeter seatud väärtusele 0, mis vastab veergudele.

column_means = df.mean()
print(column_means)

python

Eespool toodud kood arvutab iga veeru (A, B ja C) keskmise, leides vastava veeru elementide summa ja jagades selle veeru elementide arvuga. Tulemuseks on järgmine pandas Series:

A    2.5
B    5.5
C    8.5
dtype: float64

Ridade keskmiste väärtuste arvutamine

Kui soovite leida ridade keskmise, seadke lihtsalt parameeter axis väärtuseks 1:

row_means = df.mean(axis=1)
print(row_means)

python

Pandas mean() arvutab rea keskmised väärtused, jagades rea elementide summa selle elementide arvuga. Eespool nimetatud funktsiooni kutsumine annab järgmise tulemuse:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

NaN-väärtuste käsitlemine

Selles näites kasutame teistsugust DataFrame’i, mis sisaldab NaN-väärtusi:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)

python

Eespool olev kood loob järgmise andmestiku:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Veergude keskmiste arvutamisel määrab parameeter skipna, kas NaN-väärtused tuleks arvesse võtta või ignoreerida. Vaikimisi on skipna seatud väärtuseks True, seega ignoreerib df.mean() automaatselt NaN-väärtused. Kui soovite NaN-väärtusi arvesse võtta, peate lisama parameetrina skipna=False. Sel juhul tagastab iga veerg, milles on vähemalt üks NaN-väärtus, keskmisena NaN-väärtuse.

mean_with_nan = df.mean() 
print(mean_with_nan)

python

Kõne df.mean() annab järgmise väljundi:

A    2.333333
B    5.666667
C    8.000000
dtype: float64

Kuidas ühendada DataFrames pandas merge() abil

Pandas DataFrame merge() meetod pakub arendajatele erinevaid viise erinevatest allikatest pärit andmete ühendamiseks. Parameetreid kasutades saavad kasutajad oma andmete analüüsimiseks teha erinevaid liitmistoiminguid. Käesolevas artiklis vaatame pandas merge() funktsiooni…

Mr. Kosalshutterstock

Mis on Pandas fillna() ja kuidas seda kasutada?

Pandas fillna() meetod on funktsioon, mida kasutatakse puuduvate väärtuste käsitlemiseks. Funktsiooniga saab kasutada mitmesuguseid parameetreid, mis pakuvad paindlikkust NaN-väärtuste asendamisel. Käesolevas artiklis vaatame lähemalt seda funktsiooni, selle süntaksit ja…

Kuidas tuvastada puuduvad väärtused pandas isna() funktsiooni abil

Pandas isna() funktsioon on kasulik vahend puuduvate andmete tuvastamiseks DataFrame'is. Lihtsa süntaksiga annab see kiiresti selge ülevaate puuduvatest väärtustest, aidates teil võtta meetmeid, kui andmeid on vaja puhastada. Selles artiklis õpite, mis on pandas isna() ja kuidas…

BEST-BACKGROUNDSShutterstock

Kuidas otsida andmeid DataFrames'is, kasutades pandas isin()

Pandas isin() on andmete analüüsimisel kasulik funktsioon. Tänu oma lihtsale süntaksile ja mitmekülgsele rakendusele võimaldab see tõhusalt kontrollida väärtusi DataFrame'is. Olgu tegemist üksikute veergude kontrollimise, DataFrame'ide filtreerimise või sõnastikega keerukamate…

NDAB Creativityshutterstock

Mis on pandas groupby() ja kuidas seda kasutada?

Pandas DataFrame.groupby() funktsioon on võimas vahend andmete organiseerimiseks. See võimaldab teil rühmitada andmeid kindlate kriteeriumide alusel, mis lihtsustab keerukate koondamiste ja teisenduste tegemist. Selle meetodi tõhusal kasutamisel saate oma analüüsiprotsesse…

UndreyShutterstock

Kuidas filtreerida erinevaid väärtusi pandas DataFrame[].unique() abil

Pandas DataFrame[].unique() abil saate tuvastada DataFrame'i veerus olevad erinevad väärtused. See tagastab numpy massiivi, mis aitab teil suuremaid andmekogumeid tõhusamalt töödelda. Meetod on eriti kasulik, kui soovite saada ülevaate veerus olevast teabest ilma dubleeritud…

Kuidas arvutada keskmisi pandas mean() abil

Mis on DataFrame.mean() süntaxis?

Milliseid pa­ra­meetreid saab kasutada pandas Dataframe.mean-ga?

Kuidas kasutada pandas mean()

Veergude keskmiste väärtuste ar­vu­ta­mine

Ridade keskmiste väärtuste ar­vu­ta­mine

NaN-väärtuste kä­sit­le­mine

Mis on `DataFrame.mean()` süntaxis?

Milliseid parameetreid saab kasutada pandas `Dataframe.mean`-ga?

Kuidas kasutada pandas `mean()`

Veergude keskmiste väärtuste arvutamine

Ridade keskmiste väärtuste arvutamine

NaN-väärtuste käsitlemine