Pandas isna(): Como identificar valores ausentes no Python
A função DataFrame.isna() do Python Pandas ajuda usuários a identificar dados ausentes em um DataFrame (marcados como NaN ou None). Esse recurso é especialmente útil ao decidir por limpar ou não dados antes de iniciar uma análise.
- Fique online com 99,99% de tempo de atividade e segurança robusta
- Aumente o desempenho com um clique à medida que o tráfego cresce
- Inclui domínio gratuito, SSL, e-mail e suporte 24 horas por dia, 7 dias por semana
Sintaxe da função Pandas isna()
Como a função Pandas isna() não aceita nenhum parâmetro, sua sintaxe é especialmente simples:
DataFrame.isna()pythonComo usar a função Pandas isna()
Quando a função Pandas isna() é aplicada a um DataFrame, ela cria um novo DataFrame com valores booleanos. Se houver um valor ausente no DataFrame original (por exemplo, marcado como NaN ou None), a função isna() retornará com a mensagem True naquela posição. Do contrário, a função exibirá False.
Se além de identificar os valores NaN e None, você quiser removê-los, use a função Pandas dropna(). Caso não queira remover os valores, mas deseje substituí-los sistematicamente, a função Pandas fillna() é a solução que você procura.
Identificar valores ausentes em um DataFrame
O exemplo a seguir apresenta um DataFrame com dados de várias pessoas, mas faltam algumas informações sobre elas.
import pandas as pd
# Criar DataFrame de exemplo
data = {
'Nome': ['Alice' , 'Bruno', None, 'Danilo'],
'Idade': [25, None, 35, 40],
'Cidade': [‘Londrina', 'Rio de Janeiro', 'Fortaleza', None]
}
df = pd.DataFrame(data)
print(df)pythonO DataFrame ficará assim:
Nome Idade Cidade
0 Alice 25.0 Londrina
1 Bruno NaN Rio de Janeiro
2 None 35.0 Fortaleza
3 Danilo 40.0 NoneAs informações que faltam foram marcadas como None ou NaN. Para descobrir exatamente quais são os valores ausentes, você pode chamar a função Pandas isna() no DataFrame.
# Aplicar a função Pandas isna()
missing_values = df.isna()
print(missing_values)pythonA função retornará um novo DataFrame, no qual os valores originalmente ausentes serão marcados como True, enquanto os valores presentes serão identificados como False. Este será o resultado:
Nome Idade Cidade
0 False False False
1 False True False
2 True False False
3 False False TrueContar valores ausentes por coluna
Talvez você precise saber o número de valores ausentes em cada coluna para entender como administrá-los. Nesse caso, use a função Pandas isna() junto com a função sum() do Python para contar o número de valores ausentes em cada coluna.
# Contar valores ausentes por coluna
missing_count = df.isna().sum()
print(missing_count)pythonO resultado exibirá o número de valores ausentes em cada coluna:
Nome 1
Idade 1
Cidade 1
dtype: int64
