Vous pouvez utiliser la fonction unique() pour les Da­ta­Frames Python Pandas afin de dé­ter­mi­ner les valeurs uniques dans une colonne. Cela permet d’obtenir ef­fi­ca­ce­ment un aperçu des dif­fé­rentes valeurs au sein d’un ensemble de données.

La syntaxe de la fonction DataFrame[].unique() de Pandas

La syntaxe de base pour l’uti­li­sa­tion de Pandas unique() est simple, car la fonction ne prend aucun paramètre :

DataFrame['nom_colonne'].unique()
python

Notez que pour les Da­ta­Frames de Pandas, unique() ne peut s’appliquer qu’à une colonne spé­ci­fique. Vous devez donc la spécifier au préalable. La fonction unique() vous renvoie un tableau Numpy avec les valeurs uniques dans l’ordre d’ap­pa­ri­tion ; il n’y a pas de tri des valeurs.

Note

Si vous vous in­té­res­sez depuis longtemps à la pro­gram­ma­tion Python, vous con­nais­sez cer­tai­ne­ment aussi l’équi­valent Numpy de la fonction unique() de Pandas. La variante de Pandas est cependant pré­fé­rable pour des raisons d’ef­fi­ca­cité.

Ap­pli­ca­tion de la fonction unique() de Pandas

Sur les Da­ta­Frames Pandas, vous pouvez utiliser unique() en spé­ci­fiant d’abord la colonne dans laquelle vous souhaitez re­cher­cher des valeurs uniques.

Dans l’exemple suivant, nous con­si­dé­rons un DataFrame contenant des in­for­ma­tions sur dif­fé­rentes personnes.

import pandas as pd
# Créer un exemple de DataFrame
data = {
    'Nom' : ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Âge' : [24, 27, 22, 32, 29],
    'Ville' : ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
python

Le DataFrame se présente alors comme suit :

Nom   Âge        Ville
0   Alice   24    New York
1     Bob   27 Los Angeles
2 Charlie   22    New York
3   David   32     Chicago
4  Edward   29 Los Angeles

Il s’agit main­te­nant de dé­ter­mi­ner les villes dans les­quelles ces personnes vivent. Pour cela, chaque ville ne doit être listée qu’une seule fois. La fonction unique() de Pandas est appliquée à la colonne du DataFrame qui contient les villes :

# Trouver les villes uniques dans la colonne « Ville »
unique_cities = df['Ville'].unique()
print(unique_cities)
python

Le résultat est un tableau Numpy qui contient chaque ville une fois. Cela montre que les personnes pro­vien­nent de trois villes dif­fé­rentes : New York, Los Angeles et Chicago.

['New York' 'Los Angeles' 'Chicago']
Aller au menu principal