Python pandas galite naudoti funkciją unique(), kad nu­sta­ty­tu­mė­te unikalias reikšmes DataFrame stul­pe­ly­je. Tai leidžia lengvai gauti greitą įvairių reikšmių duomenų rinkinyje apžvalgą.

Kokia yra pandas DataFrame[].unique() sintaksė?

Pag­rin­di­nė pandas unique() naudojimo sintaksė yra paprasta. Taip yra todėl, kad funkcija nepriima jokių parametrų:

DataFrame['column_name'].unique()
python

Atminkite, kad unique() gali būti taikoma tik vienai stul­pe­liui. Prieš iš­kvies­da­mi funkciją, turėsite nurodyti, kurį stulpelį norite įvertinti. Funkcija unique() grąžina numpy masyvą, kuriame yra visos skir­tin­gos reikšmės jų pa­si­ro­dy­mo tvarka, o stul­pe­ly­je esančios pa­si­kar­to­jan­čios reikšmės yra pa­ša­li­na­mos. Tačiau ji ne­sor­tuo­ja reikšmių.

Note

Jei jau kurį laiką dirbate su Python, galbūt esate su­si­pa­ži­nę su numpy ek­vi­va­len­tu pandas unique(). Dėl efek­ty­vu­mo prie­žas­čių paprastai yra pa­gei­dau­ti­na naudoti pandas versiją.

Kaip naudoti pandas DataFrame[].unique()

Norėdami naudoti unique() pandas DataFrame, pir­miau­sia turite nurodyti stulpelį, kurį norite pa­tik­rin­ti. Toliau pa­teik­ta­me pavyzdyje naudosime DataFrame, kuriame yra in­for­ma­ci­ja apie asmenų grupės amžių ir gy­ve­na­mą­jį miestą.

import pandas as pd
# Create a sample DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Age': [24, 27, 22, 32, 29],
    'City': ['Newcastle', 'London', 'Newcastle', 'Cardiff', 'London']
}
df = pd.DataFrame(data)
print(df)
python

Gautas duomenų rėmelis atrodo taip:

Name  	Age       City
0    Alice    	24    	Newcastle
1    Bob    	27  		London
2  Charlie    	22    	Newcastle
3    David    	32    	Cardiff
4   Edward    	29  		London

Tarkime, kad norime sukurti visų miestų, kuriuose gyvena DataFrame duomenų rėmo žmonės, sąrašą. Pandas unique() funkciją galime taikyti stul­pe­ly­je, kuriame yra miestai.

# Find different cities
unique_cities = df['City'].unique()
print(unique_cities)
python

Re­zul­ta­tas yra numpy masyvas, kuriame kiek­vie­nas miestas yra nurodytas vieną kartą, parodant, kad DataFrame duomenų bazėje esantys asmenys yra iš trijų miestų: Niukaslio, Londono ir Kardifo.

['Newcastle' 'London' 'Cardiff']
Go to Main Menu