Kako filtrirati različne vrednosti s pandas DataFrame[].unique()
V Python pandas lahko uporabite funkcijo unique() za identifikacijo edinstvenih vrednosti v stolpcu DataFrame. To omogoča hiter pregled različnih vrednosti v vašem nizu podatkov.
Kakšna je sintaksa pandas DataFrame[].unique()?
Osnovna sintaksa za uporabo pandas unique() je preprosta. To je zato, ker funkcija ne sprejema nobenih parametrov:
DataFrame['column_name'].unique()pythonUpoštevajte, da se unique() lahko uporabi samo za en stolpec. Preden pokličete funkcijo, morate navesti, kateri stolpec želite ovrednotiti. Funkcija unique() vrne numpy matriko, ki vsebuje vse različne vrednosti v vrstnem redu, v katerem se pojavljajo, pri čemer so podvojene vrednosti v stolpcu odstranjene. Vrednosti pa ne razvrsti.
Če že nekaj časa delate s Pythonom, ste morda seznanjeni z numpy ekvivalentom pandas unique(). Zaradi večje učinkovitosti je na splošno boljša različica pandas.
Kako uporabljati pandas DataFrame[].unique()
Da bi uporabili unique() v pandas DataFrame, morate najprej določiti stolpec, ki ga želite preveriti. V naslednjem primeru bomo uporabili DataFrame, ki vsebuje informacije o starosti in mestu prebivališča skupine posameznikov.
import pandas as pd
# Create a sample DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
'Age': [24, 27, 22, 32, 29],
'City': ['Newcastle', 'London', 'Newcastle', 'Cardiff', 'London']
}
df = pd.DataFrame(data)
print(df)pythonRezultatni DataFrame izgleda takole:
Name Age City
0 Alice 24 Newcastle
1 Bob 27 London
2 Charlie 22 Newcastle
3 David 32 Cardiff
4 Edward 29 LondonRecimo, da želimo ustvariti seznam vseh mest, v katerih živijo ljudje iz DataFrame. Funkcijo pandas unique() lahko uporabimo za stolpec, ki vsebuje mesta.
# Find different cities
unique_cities = df['City'].unique()
print(unique_cities)pythonRezultat je numpy matrika, ki enkrat navaja vsako mesto in kaže, da posamezniki v DataFrame prihajajo iz skupno treh mest: Newcastle, London in Cardiff.
['Newcastle' 'London' 'Cardiff']