De Python pandas-functie DataFrame.isna() helpt ge­brui­kers bij het iden­ti­fi­ce­ren van ont­bre­ken­de gegevens (NaN of None) in een DataFrame. Dit kan vooral handig zijn om te zien of gegevens moeten worden op­ge­schoond voordat met de analyse wordt begonnen.

Wat is de syntaxis voor pandas isna()?

Aangezien pandas isna() geen pa­ra­me­ters gebruikt, is de syntaxis vrij eenvoudig:

DataFrame.isna()
python

Hoe gebruik je de functie pandas isna()?

Wanneer isna() wordt toegepast op een DataFrame, wordt een nieuwe DataFrame met Boole­aan­se waarden gemaakt. Als een waarde in de oor­spron­ke­lij­ke DataFrame ontbreekt (bij­voor­beeld ge­mar­keerd als NaN of None), geeft isna() True weer waar de waarde zich bevindt. Anders geeft de functie False weer.

Opmerking

Als u naast het iden­ti­fi­ce­ren van NaN of None waarden deze ook wilt ver­wij­de­ren, kijk dan eens naar de pandas-functie dropna(). Als u deze waarden niet wilt ver­wij­de­ren, maar ze sys­te­ma­tisch wilt vervangen, is de functie fillna() een handig hulp­mid­del om dat te doen.

Ont­bre­ken­de waarden in een DataFrame iden­ti­fi­ce­ren

Het volgende voorbeeld maakt gebruik van een DataFrame met gegevens over ver­schil­len­de personen, waarbij sommige in­for­ma­tie ontbreekt.

import pandas as pd
# Create DataFrame example
data = {
    'Name': ['Alice', 'Bob', None, 'David'],
    'Age': [25, None, 35, 40],
    'City': ['Nottingham', 'London', 'Cardiff', None]
}
df = pd.DataFrame(data)
print(df)
python

Het DataFrame ziet er als volgt uit:

Name   Age         City
0  Alice  25.0     Nottingham
1    Bob   NaN  	London
2   None  35.0      Cardiff
3  David  40.0         None

De ont­bre­ken­de in­for­ma­tie is ge­mar­keerd als None of NaN. Om precies te zien welke waarden ontbreken, kunt u isna() aanroepen op het DataFrame.

# Applying  pandas isna()
missing_values = df.isna()
print(missing_values)
python

De functie roept een nieuw DataFrame op, waarin ont­bre­ken­de waarden uit de oor­spron­ke­lij­ke gegevens worden ge­mar­keerd als True, terwijl aanwezige waarden worden ge­mar­keerd als False. Hier is de uitvoer:

Name    Age   City
0  False  False  False
1  False   True  False
2   True  False  False
3  False  False   True

Het aantal ont­bre­ken­de waarden per kolom tellen

Het kan ook nuttig zijn om te weten hoeveel waarden er in elke kolom ontbreken, zodat u kunt beslissen hoe u hiermee omgaat. U kunt isna() samen met de functie sum() van Python gebruiken om het aantal ont­bre­ken­de waarden in elke kolom te tellen.

# Count missing values per column
missing_count = df.isna().sum()
print(missing_count)
python

Dit toont u het aantal ont­bre­ken­de waarden in elke kolom:

Name     1
Age      1
City     1
dtype: int64
Ga naar hoofdmenu