Python pandas funkcija DataFrame.isna() padeda var­to­to­jams iden­ti­fi­kuo­ti trūks­ta­mus duomenis (NaN arba None) DataFrame. Tai gali būti ypač naudinga norint pamatyti, ar prieš pradedant analizę reikia išvalyti duomenis.

Kokia yra pandas isna() sintaksė?

Kadangi pandas isna() nepriima jokių parametrų, jo sintaksė yra gana paprasta:

DataFrame.isna()
python

Kaip naudoti pandas isna() funkciją

Kai isna() taikoma DataFrame, ji sukuria naują DataFrame su Būlio reikš­mė­mis. Jei ori­gi­na­lio­je DataFrame trūksta reikšmės (pvz., pažymėta kaip NaN arba None), isna() parodys True, kur yra reikšmė. Kitais atvejais funkcija parodys False.

Note

Jei, be NaN ar None verčių iden­ti­fi­ka­vi­mo, norite jas ir pašalinti, iš­ban­dy­ki­te pandas dropna() funkciją. Jei nenorite pašalinti šių verčių, bet sis­te­min­gai jas pakeisti, fillna() funkcija yra naudinga priemonė tai padaryti.

Trūkstamų verčių nu­sta­ty­mas duomenų rėmelio

Šiame pavyzdyje nau­do­ja­mas duomenų rėmelis su duo­me­ni­mis apie skir­tin­gus asmenis, kuriuose trūksta tam tikros in­for­ma­ci­jos.

import pandas as pd
# Create DataFrame example
data = {
    'Name': ['Alice', 'Bob', None, 'David'],
    'Age': [25, None, 35, 40],
    'City': ['Nottingham', 'London', 'Cardiff', None]
}
df = pd.DataFrame(data)
print(df)
python

Duomenų rėmelis atrodo taip:

Name   Age         City
0  Alice  25.0     Nottingham
1    Bob   NaN  	London
2   None  35.0      Cardiff
3  David  40.0         None

Trūkstama in­for­ma­ci­ja pažymėta kaip None arba NaN. Norėdami pamatyti, kokios tiksliai reikšmės trūksta, galite iškviesti isna() duomenų rėmelį.

# Applying  pandas isna()
missing_values = df.isna()
print(missing_values)
python

Funkcijos iš­kvie­ti­mas grąžina naują duomenų rėmelį (DataFrame), kuriame trūks­ta­mos pradinių duomenų reikšmės pažymėtos kaip True, o esančios reikšmės pažymėtos kaip False. Štai re­zul­ta­tas:

Name    Age   City
0  False  False  False
1  False   True  False
2   True  False  False
3  False  False   True

Trūkstamų verčių skai­čia­vi­mas pagal stul­pe­lius

Taip pat gali būti naudinga žinoti, kiek verčių trūksta kiek­vie­no­je skiltyje, kad ga­lė­tu­mė­te nuspręsti, kaip elgtis. Galite naudoti isna() kartu su Python sum() funkcija, kad su­skai­čiuo­tu­mė­te trūkstamų verčių skaičių kiek­vie­no­je skiltyje.

# Count missing values per column
missing_count = df.isna().sum()
print(missing_count)
python

Čia matote trūkstamų verčių skaičių kiek­vie­no­je skiltyje:

Name     1
Age      1
City     1
dtype: int64
Go to Main Menu