Sådan beregnes gennemsnit med pandas mean()

Indhold

Funktionen DataFrame.mean() i Python pandas bruges til at beregne gennemsnit på tværs af en eller flere akser i en DataFrame. Pandas mean() er afgørende for analyse af numeriske data. Ud over at beregne gennemsnitsværdier giver den også indsigt i datadistributionen.

Hvad er syntaksen for `DataFrame.mean()`?

Funktionen pandas mean() accepterer op til tre parametre og har følgende syntaks:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)

python

Hvilke parametre kan bruges med pandas `Dataframe.mean`?

Du kan bruge forskellige parametre til at tilpasse, hvordan pandas DataFrame.mean() fungerer.

Parameter	Beskrivelse	Standardværdi
`axis`	Angiver, om beregningen skal foretages over rækker (`axis=0`) eller kolonner (`axis=1`)	`0`
`skipna`	Hvis indstillet til `True`, ignoreres NaN-værdier.	`True`
`numeric_only`	Hvis indstillet til `True`, vil kun numeriske datatyper blive inkluderet i beregningen.	`False`

Sådan bruges pandas `mean()`

Du kan anvende pandas DataFrame.mean() -funktionen på både kolonner og rækker.

Beregning af gennemsnitsværdier for kolonner

Først skal vi oprette en pandas DataFrame med nogle numeriske data:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)

python

Den resulterende DataFrame ser således ud:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

For at beregne gennemsnittet for hver kolonne kan du bruge mean() -funktionen. Som standard er parameteren axis indstillet til 0, hvilket svarer til kolonner.

column_means = df.mean()
print(column_means)

python

Ovenstående kode beregner gennemsnittet for hver kolonne (A, B og C) ved at finde summen af elementerne i den respektive kolonne og derefter dividere den med antallet af elementer i kolonnen. Resultatet er følgende pandas-serie:

A    2.5
B    5.5
C    8.5
dtype: float64

Beregning af gennemsnitsværdier for rækker

Hvis du vil finde gennemsnittet for rækker, skal du blot indstille parameteren axis til 1:

row_means = df.mean(axis=1)
print(row_means)

python

Pandas mean() beregner række gennemsnit ved at dividere summen af elementer i en række med antallet af elementer den har. Ved at kalde ovenstående funktion får man følgende output:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

Håndtering af NaN-værdier

I dette eksempel bruger vi en anden DataFrame, der indeholder NaN-værdier:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)

python

Ovenstående kode genererer følgende DataFrame:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Når gennemsnittene for kolonner beregnes, bestemmer parameteren skipna, om NaN-værdier skal medtages eller ignoreres. Som standard er skipna indstillet til True, så df.mean() ignorerer automatisk NaN-værdier. Hvis du vil medtage NaN-værdier, skal du tilføje skipna=False som parameter. Hvis du gør det, vil alle kolonner med mindst én NaN returnere NaN som deres gennemsnit.

mean_with_nan = df.mean() 
print(mean_with_nan)

python

Opkald til df.mean() giver følgende output:

A    2.333333
B    5.666667
C    8.000000
dtype: float64

Populære artikler

Domænehandel: Sådan sælger du et domænenavn

Køb og salg af domæner kan være en god forretning – hvis man ved, hvordan man gør. Vi vil…

Læs mere

Relaterede artikler

UndreyShutterstock

Sådan flettes DataFrames med pandas merge()

Pandas DataFrame merge()-metoden giver udviklere forskellige muligheder for at kombinere data fra forskellige kilder. Ved hjælp af parametre kan brugerne udføre forskellige typer sammenføjningsoperationer til deres dataanalyse. I denne artikel ser vi på syntaksen for pandas…

Læs mere

Mr. Kosalshutterstock

Hvad er Pandas fillna(), og hvordan bruges det?

Pandas fillna()-metoden er en funktion, der bruges til at håndtere manglende værdier. Der kan bruges forskellige parametre med funktionen, hvilket giver fleksibilitet ved udskiftning af NaN-værdier. I denne artikel ser vi på denne funktion, dens syntaks og parametre, og hvordan…

Læs mere

Sådan identificeres manglende værdier med pandas isna()-funktionen

Pandas-funktionen isna() er et nyttigt værktøj til at identificere manglende data i en DataFrame. Med sin enkle syntaks giver den dig hurtigt et klart overblik over manglende værdier, så du kan handle, når data skal renses. I denne artikel lærer du, hvad pandas isna() er, og…

Læs mere

BEST-BACKGROUNDSShutterstock

Sådan søger du i DataFrames ved hjælp af pandas isin()

Pandas isin() er en nyttig funktion til dataanalyse. Med sin enkle syntaks og alsidige anvendelsesmuligheder giver den dig mulighed for effektivt at kontrollere værdier i en DataFrame. Uanset om du verificerer enkelte kolonner, filtrerer DataFrames eller udfører mere komplekse…

Læs mere

NDAB Creativityshutterstock

Hvad er pandas groupby(), og hvordan bruges det?

Pandas DataFrame.groupby()-funktionen er et effektivt værktøj til at organisere data. Den giver dig mulighed for at gruppere data efter specifikke kriterier, hvilket gør det nemmere at udføre komplekse aggregeringer og transformationer. Ved at bruge denne metode effektivt kan du…

Læs mere

UndreyShutterstock

Sådan filtreres der efter unikke værdier med pandas DataFrame[].unique()

Med pandas DataFrame[].unique() kan du identificere unikke værdier i en kolonne i en DataFrame. Den returnerer en numpy-matrix, som hjælper dig med at håndtere store datasæt mere effektivt. Metoden er især nyttig, hvis du ønsker at få et overblik over oplysningerne i en kolonne…

Læs mere

Sådan beregnes gen­nem­snit med pandas mean()

Hvad er syntaksen for DataFrame.mean()?

Hvilke parametre kan bruges med pandas Dataframe.mean?

Sådan bruges pandas mean()

Beregning af gen­nem­snits­vær­di­er for kolonner

Beregning af gen­nem­snits­vær­di­er for rækker

Hånd­te­ring af NaN-værdier

Sådan beregnes gennemsnit med pandas mean()

Hvad er syntaksen for `DataFrame.mean()`?

Hvilke parametre kan bruges med pandas `Dataframe.mean`?

Sådan bruges pandas `mean()`

Beregning af gennemsnitsværdier for kolonner

Beregning af gennemsnitsværdier for rækker

Håndtering af NaN-værdier