Pandas isna(): Como identificar valores ausentes no Python
A função DataFrame.isna()
do Python Pandas ajuda usuários a identificar dados ausentes em um DataFrame (marcados como NaN
ou None
). Esse recurso é especialmente útil ao decidir por limpar ou não dados antes de iniciar uma análise.
Rápido e escalável, confie na hospedagem da IONOS, que inclui domínio grátis no primeiro ano e endereço de e-mail!
- Domínio
- SSL Wildcard
- Suporte 24 horas
Sintaxe da função Pandas isna()
Como a função Pandas isna()
não aceita nenhum parâmetro, sua sintaxe é especialmente simples:
Como usar a função Pandas isna()
Quando a função Pandas isna()
é aplicada a um DataFrame, ela cria um novo DataFrame com valores booleanos. Se houver um valor ausente no DataFrame original (por exemplo, marcado como NaN
ou None
), a função isna()
retornará com a mensagem True
naquela posição. Do contrário, a função exibirá False
.
Se além de identificar os valores NaN
e None
, você quiser removê-los, use a função Pandas dropna(). Caso não queira remover os valores, mas deseje substituí-los sistematicamente, a função Pandas fillna() é a solução que você procura.
Identificar valores ausentes em um DataFrame
O exemplo a seguir apresenta um DataFrame com dados de várias pessoas, mas faltam algumas informações sobre elas.
O DataFrame ficará assim:
As informações que faltam foram marcadas como None
ou NaN
. Para descobrir exatamente quais são os valores ausentes, você pode chamar a função Pandas isna()
no DataFrame.
A função retornará um novo DataFrame, no qual os valores originalmente ausentes serão marcados como True
, enquanto os valores presentes serão identificados como False
. Este será o resultado:
Contar valores ausentes por coluna
Talvez você precise saber o número de valores ausentes em cada coluna para entender como administrá-los. Nesse caso, use a função Pandas isna()
junto com a função sum()
do Python para contar o número de valores ausentes em cada coluna.
O resultado exibirá o número de valores ausentes em cada coluna: