O Python Pandas pos­si­bi­lita o uso da função unique() para iden­ti­fi­car valores únicos em uma coluna de um DataFrame. Esse método é eficiente para pro­por­ci­o­nar uma visão geral dos di­fe­ren­tes valores presentes em um conjunto de dados.

Hos­pe­da­gem que se adapta às suas ambições
  • Fique online com 99,99% de tempo de atividade e segurança robusta
  • Aumente o de­sem­pe­nho com um clique à medida que o tráfego cresce
  • Inclui domínio gratuito, SSL, e-mail e suporte 24 horas por dia, 7 dias por semana

Sintaxe da função Pandas DataFrame[].unique()

A sintaxe básica da função Pandas DataFrame[].unique() é simples, pois ela não aceita a inclusão de nenhum parâmetro:

DataFrame['nome_coluna'].unique()
python

Lembre-se de que a função unique() só pode ser aplicada a uma coluna. Antes de chamá-la, você precisa indicar qual coluna deseja avaliar. A função unique() retorna um array NumPy que contém todos os di­fe­ren­tes valores na ordem em que eles estão dispostos na coluna, removendo os du­pli­ca­dos. Ela não ordena os valores re­tor­na­dos.

Nota

Se você trabalha com Python há algum tempo, deve estar fa­mi­li­a­ri­zado com a versão da função Pandas unique() oferecida pelo NumPy. Por questão de efi­ci­ên­cia, é re­co­men­dá­vel usar a versão oferecida pelo Pandas.

Como usar a função Pandas DataFrame[].unique()

Para usar a função unique() em um DataFrame do Pandas, primeiro é ne­ces­sá­rio es­pe­ci­fi­car a coluna que será ve­ri­fi­cada. No exemplo abaixo, vamos usar um DataFrame que contém a idade e a cidade de re­si­dên­cia de um grupo de pessoas.

import pandas as pd
# Criar um DataFrame de exemplo
data = {
    'Nome': ['Alice' , 'Breno', 'Carlos', 'Denis', 'Eduardo'],
    'Idade': [24, 27, 22, 32, 29],
    'Cidade': ['Curitiba', 'Salvador', 'Curitiba', 'Teresina', 'Salvador']
}
df = pd.DataFrame(data)
print(df)
python

O DataFrame ficará assim:

Nome  Idade    Cidade
0    Alice     24  Curitiba
1    Breno     27  Salvador
2   Carlos     22  Curitiba
3    Denis     32  Teresina
4  Eduardo     29  Salvador

Agora, vamos imaginar que a nossa intenção é criar uma lista com todas as cidades presentes no DataFrame. Podemos aplicar a função Pandas DataFrame[].unique() na coluna que contém os nomes das cidades.

# Encontrar cidades diferentes
cidades_diferentes = df['Cidade'].unique()
print(cidades_diferentes)
python

O resultado será um array NumPy que lista cada cidade apenas uma vez, revelando que as pessoas do DataFrame vivem em três cidades di­fe­ren­tes: Curitiba, Salvador e Teresina.

['Curitiba' 'Salvador' 'Teresina']
Ir para o menu principal