Python pandas funkcija DataFrame.isna() palīdz lie­to­tā­jiem iden­ti­fi­cēt trūk­sto­šos datus (NaN vai None) DataFrame. Tas var būt īpaši noderīgi, lai redzētu, vai dati ir jāattīra pirms analīzes sākšanas.

Kāda ir pandas isna() sintakse?

Tā kā pandas isna() nepieņem nekādus pa­ra­met­rus, tā sintakse ir diezgan vienkārša:

DataFrame.isna()
python

Kā lietot pandas isna() funkciju

Kad isna() tiek piemērots DataFrame, tas izveido jaunu DataFrame ar Boole’a vērtībām. Ja sākotnējā DataFrame trūkst kāda vērtība (piemēram, atzīmēta kā NaN vai None), isna() parādīs True, kur atrodas vērtība. Pretējā gadījumā funkcija parādīs False.

Note

Ja papildus NaN vai None vērtību iden­ti­fi­cē­ša­nai vēlaties arī tās izdzēst, iz­man­to­jiet pandas dropna() funkciju. Ja ne­vē­la­ties izdzēst šīs vērtības, bet gan sis­te­mā­tis­ki aizstāt tās, noderīgs rīks šim nolūkam ir fillna() funkcija.

Trūkstošo vērtību iden­ti­fi­cē­ša­na DataFrame

Šajā piemērā izmantots DataFrame ar datiem par dažādām personām, kur daļa in­for­mā­ci­jas ir trūkstoša.

import pandas as pd
# Create DataFrame example
data = {
    'Name': ['Alice', 'Bob', None, 'David'],
    'Age': [25, None, 35, 40],
    'City': ['Nottingham', 'London', 'Cardiff', None]
}
df = pd.DataFrame(data)
print(df)
python

DataFrame izskatās šādi:

Name   Age         City
0  Alice  25.0     Nottingham
1    Bob   NaN  	London
2   None  35.0      Cardiff
3  David  40.0         None

Trūkstošā in­for­mā­ci­ja ir atzīmēta kā None vai NaN. Lai redzētu, kādas tieši vērtības trūkst, varat izsaukt isna() uz DataFrame.

# Applying  pandas isna()
missing_values = df.isna()
print(missing_values)
python

Funkcijas izsaukums atgriež jaunu DataFrame, kurā trūk­sto­šās vērtības no sā­kot­nē­jiem datiem ir atzīmētas kā True, bet esošās vērtības ir atzīmētas kā False. Šeit ir izvade:

Name    Age   City
0  False  False  False
1  False   True  False
2   True  False  False
3  False  False   True

Trūkstošo vērtību skai­tī­ša­na katrā ailē

Var būt noderīgi zināt, cik daudz vērtību trūkst katrā ailē, lai palīdzētu izlemt, kā rīkoties. Jūs varat izmantot isna() kopā ar Python sum() funkciju, lai skaitītu trūkstošo vērtību skaitu katrā ailē.

# Count missing values per column
missing_count = df.isna().sum()
print(missing_count)
python

Tas parāda trūkstošo vērtību skaitu katrā ailē:

Name     1
Age      1
City     1
dtype: int64
Go to Main Menu