Kaip filtruoti skirtingas reikšmes naudojant pandas DataFrame[].unique()
Python pandas galite naudoti funkciją unique(), kad nustatytumėte unikalias reikšmes DataFrame stulpelyje. Tai leidžia lengvai gauti greitą įvairių reikšmių duomenų rinkinyje apžvalgą.
Kokia yra pandas DataFrame[].unique() sintaksė?
Pagrindinė pandas unique() naudojimo sintaksė yra paprasta. Taip yra todėl, kad funkcija nepriima jokių parametrų:
DataFrame['column_name'].unique()pythonAtminkite, kad unique() gali būti taikoma tik vienai stulpeliui. Prieš iškviesdami funkciją, turėsite nurodyti, kurį stulpelį norite įvertinti. Funkcija unique() grąžina numpy masyvą, kuriame yra visos skirtingos reikšmės jų pasirodymo tvarka, o stulpelyje esančios pasikartojančios reikšmės yra pašalinamos. Tačiau ji nesortuoja reikšmių.
Jei jau kurį laiką dirbate su Python, galbūt esate susipažinę su numpy ekvivalentu pandas unique(). Dėl efektyvumo priežasčių paprastai yra pageidautina naudoti pandas versiją.
Kaip naudoti pandas DataFrame[].unique()
Norėdami naudoti unique() pandas DataFrame, pirmiausia turite nurodyti stulpelį, kurį norite patikrinti. Toliau pateiktame pavyzdyje naudosime DataFrame, kuriame yra informacija apie asmenų grupės amžių ir gyvenamąjį miestą.
import pandas as pd
# Create a sample DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
'Age': [24, 27, 22, 32, 29],
'City': ['Newcastle', 'London', 'Newcastle', 'Cardiff', 'London']
}
df = pd.DataFrame(data)
print(df)pythonGautas duomenų rėmelis atrodo taip:
Name Age City
0 Alice 24 Newcastle
1 Bob 27 London
2 Charlie 22 Newcastle
3 David 32 Cardiff
4 Edward 29 LondonTarkime, kad norime sukurti visų miestų, kuriuose gyvena DataFrame duomenų rėmo žmonės, sąrašą. Pandas unique() funkciją galime taikyti stulpelyje, kuriame yra miestai.
# Find different cities
unique_cities = df['City'].unique()
print(unique_cities)pythonRezultatas yra numpy masyvas, kuriame kiekvienas miestas yra nurodytas vieną kartą, parodant, kad DataFrame duomenų bazėje esantys asmenys yra iš trijų miestų: Niukaslio, Londono ir Kardifo.
['Newcastle' 'London' 'Cardiff']