Python pan­da­sis­sa voit käyttää unique() tun­nis­ta­maan ai­nut­laa­tui­set arvot DataFrame-taulukon sa­rak­kees­sa. Tämä helpottaa da­ta­jou­kon eri arvojen nopeaa tar­kas­te­lua.

Mikä on pandas DataFrame[].unique():n syntaksi?

Pandas unique() käytön pe­rus­syn­tak­si on yk­sin­ker­tai­nen. Tämä johtuu siitä, että funktio ei ota vastaan pa­ra­met­re­ja:

DataFrame['column_name'].unique()
python

Muista, että unique() voidaan soveltaa vain yhteen sa­rak­kee­seen. Ennen funktion kut­su­mis­ta sinun on il­moi­tet­ta­va, mitä saraketta haluat arvioida. Funktio unique() palauttaa numpy-taulukon, joka sisältää kaikki eri arvot niiden esiin­ty­mis­jär­jes­tyk­ses­sä, ja sa­rak­kees­ta on poistettu pääl­lek­käi­set arvot. Se ei kui­ten­kaan lajittele arvoja.

Huomio

Jos olet työs­ken­nel­lyt Pythonin parissa jo jonkin aikaa, saatat olla tuttu pandas unique() numpy-vastaavan kanssa. Te­hok­kuus­syis­tä pandas-versio on yleensä suo­si­tel­ta­vam­pi.

Kuinka käyttää pandas DataFrame[].unique()

Jotta voit käyttää unique() pandas DataFrame-ke­hyk­ses­sä, sinun on ensin mää­ri­tet­tä­vä sarake, jonka haluat tarkistaa. Seu­raa­vas­sa esi­mer­kis­sä käytämme DataFrame-kehystä, joka sisältää tietoja ryhmän jäsenten iästä ja asuin­pai­kas­ta.

import pandas as pd
# Create a sample DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Age': [24, 27, 22, 32, 29],
    'City': ['Newcastle', 'London', 'Newcastle', 'Cardiff', 'London']
}
df = pd.DataFrame(data)
print(df)
python

Tuloksena oleva DataFrame näyttää tältä:

Name  	Age       City
0    Alice    	24    	Newcastle
1    Bob    	27  		London
2  Charlie    	22    	Newcastle
3    David    	32    	Cardiff
4   Edward    	29  		London

Oletetaan, että haluamme luoda luettelon kaikista kau­pun­geis­ta, joissa DataFrame-taulukon henkilöt asuvat. Voimme soveltaa pandas unique() -funktiota sa­rak­kee­seen, joka sisältää kaupungit.

# Find different cities
unique_cities = df['City'].unique()
print(unique_cities)
python

Tuloksena on numpy-taulukko, jossa kukin kaupunki on listattu kerran ja joka osoittaa, että DataFrame-taulukon henkilöt ovat kotoisin yhteensä kolmesta kau­pun­gis­ta: Newcastle, Lontoo ja Cardiff.

['Newcastle' 'London' 'Cardiff']
Siirry pää­va­lik­koon