Kā aprēķināt vidējos rādītājus ar pandas mean()

Contents

Python pandas DataFrame.mean() funkcija tiek izmantota, lai aprēķinātu vidējos rādītājus vienā vai vairākās DataFrame asīs. Pandas mean() ir būtiska skaitlisko datu analīzei. Papildus vidējo rādītāju aprēķināšanai tā sniedz arī ieskatu datu sadalījumā.

Kāda ir sintakse `DataFrame.mean()`?

Funkcija pandas mean() pieņem līdz trim parametriem un tās sintakse ir šāda:

DataFrame.mean(axis=None, skipna=True, numeric_only=None)

python

Kādus parametrus var izmantot ar pandas `Dataframe.mean`?

Jūs varat izmantot dažādus parametrus, lai pielāgotu pandas DataFrame.mean() darbību.

Parametrs	Apraksts	Noklusējuma vērtība
`axis`	Norāda, vai aprēķins tiek veikts pa rindām (`axis=0`) vai kolonnām (`axis=1`)	`0`
`skipna`	Ja iestatīts uz `True`, NaN vērtības tiks ignorētas.	`True`
`numeric_only`	Ja iestatīts uz `True`, aprēķinā tiks iekļauti tikai skaitliskie datu tipi.	`False`

Kā lietot pandas `mean()`

Jūs varat piemērot pandas DataFrame.mean() funkciju gan kolonnām, gan rindām.

Vidējo vērtību aprēķināšana kolonnām

Vispirms izveidosim pandas DataFrame ar dažiem skaitliskajiem datiem:

import pandas as pd
data = {
    'A': [1, 2, 3, 4],
    'B': [4, 5, 6, 7],
    'C': [7, 8, 9, 10]
}
df = pd.DataFrame(data)
print(df)

python

Rezultātā iegūtais DataFrame izskatās šādi:

A  B    C
0  1  4    7
1  2  5    8
2  3  6    9
3  4  7  10

Lai aprēķinātu katras kolonnas vidējo vērtību, varat izmantot pandas mean() funkciju. Pēc noklusējuma ass parametrs ir iestatīts uz 0, kas atbilst kolonnām.

column_means = df.mean()
print(column_means)

python

Iepriekš minētais kods aprēķina vidējo vērtību katrai kolonnai (A, B un C), aprēķinot attiecīgās kolonnas elementu summu un pēc tam dalot to ar elementu skaitu kolonnā. Rezultāts ir šāda pandas sērija:

A    2.5
B    5.5
C    8.5
dtype: float64

Vidējo vērtību aprēķināšana rindām

Ja vēlaties atrast vidējo rindu skaitu, vienkārši iestatiet parametru axis uz 1:

row_means = df.mean(axis=1)
print(row_means)

python

Pandas mean() aprēķina rindu vidējos, dalot rindas elementu summu ar elementu skaitu tajā. Izsaucot iepriekš minēto funkciju, tiek iegūts šāds rezultāts:

0    4.0
1    5.0
2    6.0
3    7.0
dtype: float64

NaN vērtību apstrāde

Šajā piemērā izmantosim citu DataFrame, kas satur NaN vērtības:

import pandas as pd
import numpy as np
data = {
    'A': [1, 2, np.nan, 4],
    'B': [4, np.nan, 6, 7],
    'C': [7, 8, 9, np.nan]
}
df = pd.DataFrame(data)
print(df)

python

Iepriekš minētais kods rada šādu DataFrame:

A    B    C
0  1.0  4.0  7.0
1  2.0  NaN  8.0
2  NaN  6.0  9.0
3  4.0  7.0  NaN

Aprēķinot kolonnas vidējos rādītājus, skipna parametrs nosaka, vai NaN vērtības ir jāiekļauj vai jāignorē. Pēc noklusējuma skipna ir iestatīts uz True, tādējādi df.mean() automātiski ignorē NaN vērtības. Ja vēlaties iekļaut NaN vērtības, kā parametru ir jāpievieno skipna=False. Tādējādi jebkura kolonna, kurā ir vismaz viena NaN vērtība, kā vidējo rādītāju atgriezīs NaN.

mean_with_nan = df.mean() 
print(mean_with_nan)

python

Zvanot uz df.mean(), tiek iegūts šāds rezultāts:

A    2.333333
B    5.666667
C    8.000000
dtype: float64

Kā apvienot DataFrames ar pandas merge()

Pandas DataFrame merge() metode piedāvā izstrādātājiem dažādus veidus, kā apvienot datus no dažādiem avotiem. Izmantojot parametrus, lietotāji var veikt dažādus savienošanas veidus savu datu analīzei. Šajā rakstā mēs apskatīsim pandas merge() funkcijas sintaksi, tās parametrus un…

Mr. Kosalshutterstock

Kas ir Pandas fillna() un kā to lietot

Pandas fillna() metode ir funkcija, ko izmanto, lai apstrādātu trūkstošās vērtības. Ar šo funkciju var izmantot dažādus parametrus, kas nodrošina elastību, aizstājot NaN vērtības. Šajā rakstā mēs apskatīsim šo funkciju, tās sintaksi un parametrus, kā arī to, kā pielāgot…

Kā identificēt trūkstošās vērtības ar pandas isna() funkciju

Pandas isna() funkcija ir noderīgs rīks, lai identificētu trūkstošos datus DataFrame. Pateicoties vienkāršajai sintaksei, tā ātri sniedz skaidru pārskatu par trūkstošajām vērtībām, palīdzot jums rīkoties, kad dati ir jāattīra. Šajā rakstā jūs uzzināsiet, kas ir pandas isna() un…

BEST-BACKGROUNDSShutterstock

Kā meklēt DataFrames, izmantojot pandas isin()

Pandas isin() ir noderīga funkcija datu analīzei. Pateicoties tās vienkāršajai sintaksei un daudzpusīgajām lietojumprogrammām, tā ļauj efektīvi pārbaudīt vērtības DataFrame. Neatkarīgi no tā, vai jūs pārbaudāt atsevišķas kolonnas, filtrējat DataFrames vai veicat sarežģītākas…

NDAB Creativityshutterstock

Kas ir pandas groupby() un kā to lietot

Pandas DataFrame.groupby() funkcija ir spēcīgs rīks datu organizēšanai. Tā ļauj grupēt datus atbilstoši konkrētiem kritērijiem, atvieglojot sarežģītu apkopojumu un transformāciju veikšanu. Efektīvi izmantojot šo metodi, varat optimizēt analīzes procesus, padarot tos ātrākus un…

UndreyShutterstock

Kā filtrēt atšķirīgas vērtības ar pandas DataFrame[].unique()

Izmantojot pandas DataFrame[].unique(), varat identificēt atšķirīgas vērtības DataFrame kolonnā. Tā atgriež numpy masīvu, palīdzot efektīvāk apstrādāt lielus datu kopumus. Šī metode ir īpaši noderīga, ja vēlaties iegūt pārskatu par informāciju kolonnā bez dublētiem vērtībām.…

Kā aprēķināt vidējos rādītājus ar pandas mean()

Kāda ir sintakse DataFrame.mean()?

Kādus pa­ra­met­rus var izmantot ar pandas Dataframe.mean?

Kā lietot pandas mean()

Vidējo vērtību ap­rē­ķi­nā­ša­na kolonnām

Vidējo vērtību ap­rē­ķi­nā­ša­na rindām

NaN vērtību apstrāde

Kāda ir sintakse `DataFrame.mean()`?

Kādus parametrus var izmantot ar pandas `Dataframe.mean`?

Kā lietot pandas `mean()`

Vidējo vērtību aprēķināšana kolonnām

Vidējo vērtību aprēķināšana rindām