Πώς να φιλτράρετε για διακριτές τιμές με pandas DataFrame[].unique()
Στο Python pandas, μπορείτε να χρησιμοποιήσετε τη συνάρτηση unique() για να προσδιορίσετε μοναδικές τιμές σε μια στήλη ενός DataFrame. Αυτό σας διευκολύνει να αποκτήσετε μια γρήγορη επισκόπηση των διαφορετικών τιμών στο σύνολο δεδομένων σας.
Ποια είναι η σύνταξη του pandas DataFrame[].unique();
Η βασική σύνταξη για τη χρήση του pandas unique() είναι απλή. Αυτό οφείλεται στο γεγονός ότι η συνάρτηση δεν δέχεται παραμέτρους:
DataFrame['column_name'].unique()pythonΛάβετε υπόψη ότι unique() μπορεί να εφαρμοστεί μόνο σε μία στήλη. Πριν καλέσετε τη συνάρτηση, θα πρέπει να υποδείξετε ποια στήλη θέλετε να αξιολογήσετε. Η συνάρτηση unique() επιστρέφει έναν πίνακα numpy που περιέχει όλες τις διαφορετικές τιμές με τη σειρά που εμφανίζονται, με τις διπλές τιμές στη στήλη να έχουν αφαιρεθεί. Ωστόσο, δεν ταξινομεί τις τιμές.
Εάν εργάζεστε με Python για αρκετό καιρό, ίσως γνωρίζετε το numpy που είναι ισοδύναμο με το pandas unique(). Για λόγους αποτελεσματικότητας, η έκδοση pandas είναι γενικά προτιμότερη.
Πώς να χρησιμοποιήσετε το pandas DataFrame[].unique()
Για να χρησιμοποιήσετε unique() σε ένα DataFrame pandas, πρέπει πρώτα να καθορίσετε τη στήλη που θέλετε να ελέγξετε. Στο παρακάτω παράδειγμα, θα χρησιμοποιήσουμε ένα DataFrame που περιέχει πληροφορίες σχετικά με την ηλικία και την πόλη διαμονής μιας ομάδας ατόμων.
import pandas as pd
# Create a sample DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
'Age': [24, 27, 22, 32, 29],
'City': ['Newcastle', 'London', 'Newcastle', 'Cardiff', 'London']
}
df = pd.DataFrame(data)
print(df)pythonΤο τελικό DataFrame έχει την εξής μορφή:
Name Age City
0 Alice 24 Newcastle
1 Bob 27 London
2 Charlie 22 Newcastle
3 David 32 Cardiff
4 Edward 29 LondonΤώρα, ας υποθέσουμε ότι θέλουμε να δημιουργήσουμε μια λίστα με όλες τις πόλεις όπου ζουν οι άνθρωποι στο DataFrame. Μπορούμε να εφαρμόσουμε τη συνάρτηση pandas unique() στη στήλη που περιέχει τις πόλεις.
# Find different cities
unique_cities = df['City'].unique()
print(unique_cities)pythonΤο αποτέλεσμα είναι ένας πίνακας numpy που εμφανίζει κάθε πόλη μία φορά, δείχνοντας ότι τα άτομα στο DataFrame προέρχονται από συνολικά τρεις πόλεις: Newcastle, Λονδίνο και Κάρντιφ.
['Newcastle' 'London' 'Cardiff']