Pandas DataFrame[].unique(): Filtrar valores distintos em colunas

Tabela de Conteúdos

O Python Pandas possibilita o uso da função unique() para identificar valores únicos em uma coluna de um DataFrame. Esse método é eficiente para proporcionar uma visão geral dos diferentes valores presentes em um conjunto de dados.

Hospedagem que se adapta às suas ambições

Fique online com 99,99% de tempo de atividade e segurança robusta
Aumente o desempenho com um clique à medida que o tráfego cresce
Inclui domínio gratuito, SSL, e-mail e suporte 24 horas por dia, 7 dias por semana

Sintaxe da função Pandas `DataFrame[].unique()`

A sintaxe básica da função Pandas DataFrame[].unique() é simples, pois ela não aceita a inclusão de nenhum parâmetro:

DataFrame['nome_coluna'].unique()

python

Lembre-se de que a função unique() só pode ser aplicada a uma coluna. Antes de chamá-la, você precisa indicar qual coluna deseja avaliar. A função unique() retorna um array NumPy que contém todos os diferentes valores na ordem em que eles estão dispostos na coluna, removendo os duplicados. Ela não ordena os valores retornados.

Nota

Se você trabalha com Python há algum tempo, deve estar familiarizado com a versão da função Pandas unique() oferecida pelo NumPy. Por questão de eficiência, é recomendável usar a versão oferecida pelo Pandas.

Como usar a função Pandas DataFrame[].unique()

Para usar a função unique() em um DataFrame do Pandas, primeiro é necessário especificar a coluna que será verificada. No exemplo abaixo, vamos usar um DataFrame que contém a idade e a cidade de residência de um grupo de pessoas.

import pandas as pd
# Criar um DataFrame de exemplo
data = {
    'Nome': ['Alice' , 'Breno', 'Carlos', 'Denis', 'Eduardo'],
    'Idade': [24, 27, 22, 32, 29],
    'Cidade': ['Curitiba', 'Salvador', 'Curitiba', 'Teresina', 'Salvador']
}
df = pd.DataFrame(data)
print(df)

python

O DataFrame ficará assim:

Nome  Idade    Cidade
0    Alice     24  Curitiba
1    Breno     27  Salvador
2   Carlos     22  Curitiba
3    Denis     32  Teresina
4  Eduardo     29  Salvador

Agora, vamos imaginar que a nossa intenção é criar uma lista com todas as cidades presentes no DataFrame. Podemos aplicar a função Pandas DataFrame[].unique() na coluna que contém os nomes das cidades.

# Encontrar cidades diferentes
cidades_diferentes = df['Cidade'].unique()
print(cidades_diferentes)

python

O resultado será um array NumPy que lista cada cidade apenas uma vez, revelando que as pessoas do DataFrame vivem em três cidades diferentes: Curitiba, Salvador e Teresina.

['Curitiba' 'Salvador' 'Teresina']

Pandas table: Como formatar DataFrames em tabelas

Exibir um Pandas DataFrame como tabela é essencial, e a ação pode ser realizada de diferentes formas. Seja um resultado simples exibido no próprio console, uma tabela HTML formatada ou variados formatos padronizados, como texto simples e GitHub Markdown, o Pandas permite criar…

Python Pandas

Leia mais

GaudiLabShutterstock

Como selecionar dados usando Pandas loc[]

O indexador Pandas DataFrame loc[] é uma solução fácil para extrair dados usando marcadores. Ela é especialmente útil na administração de dados cujas posições nas linhas e colunas não são previsíveis. Neste artigo, vamos conhecer a sintaxe de Pandas loc[], aprender como usá-la e…

Python Pandas

Leia mais

BEST-BACKGROUNDSShutterstock

Como percorrer DataFrames com Pandas iterrows()

A função Pandas DataFrame.iterrows() é uma ferramenta útil para percorrer linhas de um DataFrame, principalmente nos casos em que processamentos de dados se fazem necessários. O Pandas iterrows() é especialmente útil para a realização de cálculos ou lógicas condicionais. Conheça…

Python Pandas

Leia mais

Mr. Kosalshutterstock

Como usar o Pandas DataFrame index no Python

O Pandas DataFrame index é uma poderosa ferramenta de manipulação de dados. Ao aplicar diferentes métodos, você poderá trabalhar com dados e subconjuntos específicos no seu DataFrame. Neste artigo, explicamos o que é o Pandas DataFrame index, como acessar dados em colunas e…

Python Pandas

Leia mais

BEST-BACKGROUNDSShutterstock

Como limpar dados com a função Pandas dropna()

A função Pandas DataFrame.dropna() é uma poderosa ferramenta para limpar conjuntos de dados. Ela remove os valores definidos como ausentes e pode ser combinada com diversos parâmetros, possibilitando que programadores especifiquem requisitos diferentes para limpar os dados. Neste…

Python Pandas

Leia mais

Ranjit Karmakarshutterstock

O que é a função Pandas DataFrame describe()?

A função Pandas DataFrame.describe() gera um resumo estatístico abrangente baseado nos dados numéricos de um DataFrame. Ela permite ajustar o percentis e especificar os tipos de dados, por isso é considerada uma ferramenta bastante flexível e adequada para desempenhar uma ampla…

Python Pandas

Leia mais

Pandas DataFrame[].unique(): Filtrar valores distintos em colunas

Sintaxe da função Pandas DataFrame[].unique()

Como usar a função Pandas DataFrame[].unique()

Sintaxe da função Pandas `DataFrame[].unique()`