Hvordan filtrere etter unike verdier med pandas DataFrame[].unique()
I Python pandas kan du bruke funksjonen unique() til å identifisere unike verdier i en kolonne i en DataFrame. Dette gjør det enkelt å få en rask oversikt over de forskjellige verdiene i datasettet ditt.
Hva er syntaksen til pandas DataFrame[].unique()?
Den grunnleggende syntaksen for bruk av pandas unique() er enkel. Dette skyldes at funksjonen ikke tar noen parametere:
DataFrame['column_name'].unique()pythonHusk at unique() kun kan brukes på én kolonne. Før du kaller funksjonen, må du angi hvilken kolonne du ønsker å evaluere. Funksjonen unique() returnerer en numpy-matrise som inneholder alle de forskjellige verdiene i den rekkefølgen de vises, med dupliserte verdier i kolonnen fjernet. Den sorterer imidlertid ikke verdiene.
Hvis du har jobbet med Python en stund, er du kanskje kjent med numpy-ekvivalenten til pandas unique(). Av effektivitetshensyn er pandas-versjonen generelt å foretrekke.
Hvordan bruke pandas DataFrame[].unique()
For å bruke unique() i en pandas DataFrame, må du først spesifisere kolonnen du vil sjekke. I det følgende eksemplet bruker vi en DataFrame som inneholder informasjon om alder og bosted for en gruppe individer.
import pandas as pd
# Create a sample DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
'Age': [24, 27, 22, 32, 29],
'City': ['Newcastle', 'London', 'Newcastle', 'Cardiff', 'London']
}
df = pd.DataFrame(data)
print(df)pythonDen resulterende DataFrame ser slik ut:
Name Age City
0 Alice 24 Newcastle
1 Bob 27 London
2 Charlie 22 Newcastle
3 David 32 Cardiff
4 Edward 29 LondonLa oss si at vi ønsker å lage en liste over alle byene hvor personene i DataFrame bor. Vi kan bruke unique() jonen på kolonnen som inneholder byene.
# Find different cities
unique_cities = df['City'].unique()
print(unique_cities)pythonResultatet er en numpy-matrise som viser hver by én gang, og viser at personene i DataFrame kommer fra totalt tre byer: Newcastle, London og Cardiff.
['Newcastle' 'London' 'Cardiff']