Kuidas filtreerida erinevaid väärtusi pandas DataFrame[].unique() abil
Python pandas’is saate kasutada funktsiooni unique(), et tuvastada unikaalsed väärtused DataFrame’i veerus. See võimaldab teil kiiresti saada ülevaate andmekogumi erinevatest väärtustest.
Mis on pandas DataFrame[].unique() süntaks?
Pandas unique() kasutamise põhiline süntaks on lihtne. Seda seetõttu, et funktsioon ei võta vastu mingeid parameetreid:
DataFrame['column_name'].unique()pythonPidage meeles, et unique() saab rakendada ainult ühele veerule. Enne funktsiooni kutsumist peate märkima, millist veergu soovite hinnata. Funktsioon unique() tagastab numpy massiivi, mis sisaldab kõiki erinevaid väärtusi nende ilmumise järjekorras, kusjuures veerust on eemaldatud dubleeritud väärtused. See ei sorteeri aga väärtusi.
Kui olete Pythoniga juba mõnda aega töötanud, siis olete ehk tuttav numpy ekvivalendiga pandas unique(). Efektiivsuse seisukohast on pandas versioon üldiselt eelistatavam.
Kuidas kasutada pandas DataFrame[].unique()
Et kasutada unique() pandas DataFrame’is, peate esmalt määrama veeru, mida soovite kontrollida. Järgmises näites kasutame DataFrame’i, mis sisaldab teavet rühma isikute vanuse ja elukoha kohta.
import pandas as pd
# Create a sample DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
'Age': [24, 27, 22, 32, 29],
'City': ['Newcastle', 'London', 'Newcastle', 'Cardiff', 'London']
}
df = pd.DataFrame(data)
print(df)pythonSaadud andmeraamistik näeb välja järgmine:
Name Age City
0 Alice 24 Newcastle
1 Bob 27 London
2 Charlie 22 Newcastle
3 David 32 Cardiff
4 Edward 29 LondonOletame, et tahame luua nimekirja kõikidest linnadest, kus DataFrame’is olevad inimesed elavad. Saame rakendada pandas unique() funktsiooni veerule, mis sisaldab linnu.
# Find different cities
unique_cities = df['City'].unique()
print(unique_cities)pythonVäljundiks on numpy massiiv, mis loetleb iga linna üks kord, näidates, et DataFrame’is olevad isikud on pärit kokku kolmest linnast: Newcastle’ist, Londonist ja Cardiffist.
['Newcastle' 'London' 'Cardiff']