Kuinka laskea keskiarvoja pandas mean() -funktiolla

Sisällys

Python pandas -kirjaston DataFrame.mean() käytetään laskemaan keskiarvoja yhden tai useamman DataFrame-akselin yli. Pandas mean() on välttämätön numeeristen tietojen analysoinnissa. Keskiarvojen laskemisen lisäksi se tarjoaa myös tietoa tietojen jakautumisesta.

Mikä on syntaksi numerolle `DataFrame.mean()`?

Pandas mean() -funktio hyväksyy enintään kolme parametria ja sen syntaksi on seuraava:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)

python

Mitä parametreja voidaan käyttää pandas `Dataframe.mean` kanssa?

Voit käyttää erilaisia parametreja pandas DataFrame.mean() toiminnan mukauttamiseen.

Parametri	Kuvaus	Oletusarvo
`axis`	Määrittää, tehdäänkö laskenta rivien (`axis=0`) vai sarakkeiden (`axis=1`) perusteella.	`0`
`skipna`	Jos asetetaan arvoon `True`, NaN-arvot ohitetaan.	`True`
`numeric_only`	Jos asetetaan arvoon `True`, vain numeeriset tietotyypit sisällytetään laskelmaan.	`False`

Kuinka käyttää pandas `mean()`

Voit käyttää pandas DataFrame.mean() -funktiota sekä sarakkeisiin että riveihin.

Sarakkeiden keskiarvojen laskeminen

Ensin luomme pandas-tietokehyksen, joka sisältää numeerista dataa:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)

python

Tuloksena oleva DataFrame näyttää tältä:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

Kunkin sarakkeen keskiarvon laskemiseen voit käyttää pandas mean() -funktiota. Oletusarvoisesti akseliparametri on asetettu arvoon 0, joka vastaa sarakkeita.

column_means = df.mean()
print(column_means)

python

Yllä oleva koodi laskee kunkin sarakkeen (A, B ja C) keskiarvon laskemalla kyseisen sarakkeen elementtien summan ja jakamalla sen sarakkeen elementtien lukumäärällä. Tuloksena on seuraava pandas-sarja:

A    2.5
B    5.5
C    8.5
dtype: float64

Rivien keskiarvojen laskeminen

Jos haluat laskea rivien keskiarvon, aseta parametri axis arvoon 1:

row_means = df.mean(axis=1)
print(row_means)

python

Pandas mean() laskee rivien keskiarvot jakamalla rivin elementtien summan sen elementtien lukumäärällä. Yllä olevan funktion kutsuminen tuottaa seuraavan tuloksen:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

NaN-arvojen käsittely

Tässä esimerkissä käytämme erilaista DataFrame-taulukkoa, joka sisältää NaN-arvoja:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)

python

Yllä oleva koodi tuottaa seuraavan DataFrame-kehyksen:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Sarakkeiden keskiarvoja laskettaessa parametri skipna määrittää, pitäisikö NaN-arvot sisällyttää vai jättää huomiotta. Oletusarvoisesti skipna on asetettu arvoon True, joten df.mean() jättää NaN-arvot automaattisesti huomiotta. Jos haluat sisällyttää NaN-arvot, sinun on lisättävä parametriksi skipna=False. Tällöin kaikki sarakkeet, joissa on vähintään yksi NaN-arvo, palauttavat keskiarvona NaN-arvon.

mean_with_nan = df.mean() 
print(mean_with_nan)

python

Kutsun df.mean() tulos on seuraava:

A    2.333333
B    5.666667
C    8.000000
dtype: float64

Suositut artikkelit

Verkkotunnusten kauppa: kuinka myydä verkkotunnus

Verkkotunnusten ostaminen ja myyminen voi olla tuottoisaa – jos osaa toimia oikein.…

Lue lisää

Aiheeseen liittyvät artikkelit

UndreyShutterstock

Kuinka yhdistää DataFrames pandas merge() -toiminnolla

Pandas DataFrame merge() -menetelmä tarjoaa kehittäjille erilaisia tapoja yhdistää eri lähteistä peräisin olevia tietoja. Parametreja käyttämällä käyttäjät voivat suorittaa erilaisia yhdistämistoimintoja tietojen analysointia varten. Tässä artikkelissa tarkastelemme pandas…

Lue lisää

Mr. Kosalshutterstock

Mikä on Pandas fillna() ja miten sitä käytetään

Pandas fillna() -metodi on funktio, jota käytetään puuttuvien arvojen käsittelemiseen. Funktiossa voidaan käyttää erilaisia parametreja, mikä tarjoaa joustavuutta NaN-arvojen korvaamisessa. Tässä artikkelissa tarkastelemme tätä funktiota, sen syntaksia ja parametreja sekä sitä,…

Lue lisää

Kuinka tunnistaa puuttuvat arvot pandas-kirjaston isna()-funktiolla

Pandas-funktio isna() on hyödyllinen työkalu puuttuvien tietojen tunnistamiseen DataFrame-kehyksessä. Sen yksinkertaisen syntaksin ansiosta saat nopeasti selkeän yleiskuvan puuttuvista arvoista, mikä auttaa sinua ryhtymään toimenpiteisiin, kun tiedot on puhdistettava. Tässä…

Lue lisää

BEST-BACKGROUNDSShutterstock

Kuinka hakea DataFrames-tietokantoja pandas isin() -toiminnolla

Pandas isin() on hyödyllinen funktio data-analyysiin. Sen suoraviivaisen syntaksin ja monipuolisten sovellusten ansiosta voit tarkistaa tehokkaasti arvot DataFrame-taulukosta. Olitpa sitten tarkistamassa yksittäisiä sarakkeita, suodattamassa DataFrame-taulukoita tai suorittamassa…

Lue lisää

NDAB Creativityshutterstock

Mikä on pandas groupby() ja miten sitä käytetään?

Pandas-kirjaston DataFrame.groupby()-funktio on tehokas työkalu tietojen järjestämiseen. Sen avulla voit ryhmitellä tietoja tiettyjen kriteerien mukaan, mikä helpottaa monimutkaisten aggregointien ja muunnoksien suorittamista. Käyttämällä tätä menetelmää tehokkaasti voit…

Lue lisää

UndreyShutterstock

Kuinka suodattaa erilliset arvot pandas DataFrame[].unique() -toiminnolla

Pandas DataFrame[].unique() -funktiolla voit tunnistaa DataFrame-taulukon sarakkeen erilliset arvot. Se palauttaa numpy-taulukon, jonka avulla voit käsitellä suuria tietojoukkoja tehokkaammin. Menetelmä on erityisen hyödyllinen, jos haluat saada yleiskuvan sarakkeen tiedoista…

Lue lisää

Kuinka laskea kes­kiar­vo­ja pandas mean() -funk­tiol­la

Mikä on syntaksi numerolle DataFrame.mean()?

Mitä pa­ra­met­re­ja voidaan käyttää pandas Dataframe.mean kanssa?

Kuinka käyttää pandas mean()

Sa­rak­kei­den kes­kiar­vo­jen las­ke­mi­nen

Rivien kes­kiar­vo­jen las­ke­mi­nen

NaN-arvojen käsittely

Kuinka laskea keskiarvoja pandas mean() -funktiolla

Mikä on syntaksi numerolle `DataFrame.mean()`?

Mitä parametreja voidaan käyttää pandas `Dataframe.mean` kanssa?

Kuinka käyttää pandas `mean()`

Sarakkeiden keskiarvojen laskeminen

Rivien keskiarvojen laskeminen