Pandas isin(): Como fazer buscas em DataFrames
A função DataFrame.isin()
do Python Pandas foi criada para verificar, de forma rápida e eficaz, se determinados valores existem em um DataFrame. Ela é especialmente útil para checar múltiplos valores ao mesmo tempo.
Rápido e escalável, confie na hospedagem da IONOS, que inclui domínio grátis no primeiro ano e endereço de e-mail!
- Domínio
- SSL Wildcard
- Suporte 24 horas
Qual é a sintaxe da função Pandas isin()
?
A função Pandas isin()
aceita a inclusão de um parâmetro e tem a seguinte sintaxe:
O parâmetro values
pode ser uma lista em Python, um dicionário em Python ou outro DataFrame. Ele abrange os valores que você deseja buscar dentro do DataFrame.
Se estiver trabalhando com Series em vez de DataFrames no Pandas, use a função equivalente: Series.isin()
.
Usar a função Pandas isin()
com DataFrames
Você pode usar a função Pandas isin()
para diferentes finalidades. Além de verificar a existência de valores, ela também pode ser utilizada para filtrar DataFrames.
Verificar valores em uma coluna
Primeiro, vamos criar um DataFrame contendo informações sobre diferentes pessoas e as cidades em que elas moram.
O DataFrame ficará assim:
Nome Cidade
0 Aldo Recife
1 Bruna Campinas
2 Camila Manaus
3 Diogo Natal
Em seguida, vamos usar a função Pandas isin()
para verificar se as cidades na coluna “Cidade” estão presentes em uma lista separada. Após criarmos essa lista de referência, executaremos a função na coluna “Cidade” do DataFrame:
O resultado trará uma série de valores booleanos que indicarão se cada uma das cidades na coluna “Cidade” estava presente na lista cidades_para_comparar
:
0 False
1 False
2 True
3 True
Nome: Cidade, dtype: bool
Filtrar DataFrame com a função Pandas isin()
Também é possível usar a função Pandas isin()
para filtrar um DataFrame, mantendo apenas as linhas com mesmas cidades presentes na lista cidades_para_comparar
.
O resultado será um DataFrame contendo apenas as linhas com as cidades que também estavam presentes na lista cidades_para_comparar
:
Nome Cidade
2 Camila Manaus
3 Diogo Natal
Verificar múltiplas colunas em um DataFrame
Para desempenhar operações com filtros mais complexos, você pode usar a função Pandas isin()
com dicionários. No exemplo a seguir, mostraremos como usar um dicionário para verificar múltiplas colunas de um DataFrame simultaneamente. Primeiro, adicionaremos uma coluna ao DataFrame original e, depois, aplicaremos a função isin()
:
Nesse caso, a chamada da função isin()
retornará um DataFrame booleano, no qual cada célula indica se o valor contido está presente na lista correspondente à sua coluna no dicionário.:
Nome Cidade Idade
0 False False False
1 False False True
2 False True False
3 False True True