A função DataFrame.isna() do Python Pandas ajuda usuários a iden­ti­fi­car dados ausentes em um DataFrame (marcados como NaN ou None). Esse recurso é es­pe­ci­al­mente útil ao decidir por limpar ou não dados antes de iniciar uma análise.

Hos­pe­da­gem que se adapta às suas ambições
  • Fique online com 99,99% de tempo de atividade e segurança robusta
  • Aumente o de­sem­pe­nho com um clique à medida que o tráfego cresce
  • Inclui domínio gratuito, SSL, e-mail e suporte 24 horas por dia, 7 dias por semana

Sintaxe da função Pandas isna()

Como a função Pandas isna() não aceita nenhum parâmetro, sua sintaxe é es­pe­ci­al­mente simples:

DataFrame.isna()
python

Como usar a função Pandas isna()

Quando a função Pandas isna() é aplicada a um DataFrame, ela cria um novo DataFrame com valores booleanos. Se houver um valor ausente no DataFrame original (por exemplo, marcado como NaN ou None), a função isna() retornará com a mensagem True naquela posição. Do contrário, a função exibirá False.

Nota

Se além de iden­ti­fi­car os valores NaN e None, você quiser removê-los, use a função Pandas dropna(). Caso não queira remover os valores, mas deseje substituí-los sis­te­ma­ti­ca­mente, a função Pandas fillna() é a solução que você procura.

Iden­ti­fi­car valores ausentes em um DataFrame

O exemplo a seguir apresenta um DataFrame com dados de várias pessoas, mas faltam algumas in­for­ma­ções sobre elas.

import pandas as pd
# Criar DataFrame de exemplo
data = {
    'Nome': ['Alice' , 'Bruno', None, 'Danilo'],
    'Idade': [25, None, 35, 40],
    'Cidade': [‘Londrina', 'Rio de Janeiro', 'Fortaleza', None]
}
df = pd.DataFrame(data)
print(df)
python

O DataFrame ficará assim:

Nome   Idade         Cidade
0  Alice  25.0     Londrina
1  Bruno   NaN  Rio de Janeiro
2  None  35.0      Fortaleza
3  Danilo  40.0         None

As in­for­ma­ções que faltam foram marcadas como None ou NaN. Para descobrir exa­ta­mente quais são os valores ausentes, você pode chamar a função Pandas isna() no DataFrame.

# Aplicar a função Pandas isna()
missing_values = df.isna()
print(missing_values)
python

A função retornará um novo DataFrame, no qual os valores ori­gi­nal­mente ausentes serão marcados como True, enquanto os valores presentes serão iden­ti­fi­ca­dos como False. Este será o resultado:

Nome  Idade  Cidade
0  False  False  False
1  False   True  False
2   True  False  False
3  False  False   True

Contar valores ausentes por coluna

Talvez você precise saber o número de valores ausentes em cada coluna para entender como ad­mi­nis­trá-los. Nesse caso, use a função Pandas isna() junto com a função sum() do Python para contar o número de valores ausentes em cada coluna.

# Contar valores ausentes por coluna
missing_count = df.isna().sum()
print(missing_count)
python

O resultado exibirá o número de valores ausentes em cada coluna:

Nome     1
Idade      1
Cidade    1
dtype: int64
Ir para o menu principal