Στο Python pandas, μπορείτε να χρησιμοποιήσετε τη συνάρτηση unique() για να προσδιορίσετε μοναδικές τιμές σε μια στήλη ενός DataFrame. Αυτό σας διευκολύνει να αποκτήσετε μια γρήγορη επισκόπηση των διαφορετικών τιμών στο σύνολο δεδομένων σας.

Ποια είναι η σύνταξη του pandas DataFrame[].unique();

Η βασική σύνταξη για τη χρήση του pandas unique() είναι απλή. Αυτό οφείλεται στο γεγονός ότι η συνάρτηση δεν δέχεται παραμέτρους:

DataFrame['column_name'].unique()
python

Λάβετε υπόψη ότι unique() μπορεί να εφαρμοστεί μόνο σε μία στήλη. Πριν καλέσετε τη συνάρτηση, θα πρέπει να υποδείξετε ποια στήλη θέλετε να αξιολογήσετε. Η συνάρτηση unique() επιστρέφει έναν πίνακα numpy που περιέχει όλες τις διαφορετικές τιμές με τη σειρά που εμφανίζονται, με τις διπλές τιμές στη στήλη να έχουν αφαιρεθεί. Ωστόσο, δεν ταξινομεί τις τιμές.

Note

Εάν εργάζεστε με Python για αρκετό καιρό, ίσως γνωρίζετε το numpy που είναι ισοδύναμο με το pandas unique(). Για λόγους αποτελεσματικότητας, η έκδοση pandas είναι γενικά προτιμότερη.

Πώς να χρησιμοποιήσετε το pandas DataFrame[].unique()

Για να χρησιμοποιήσετε unique() σε ένα DataFrame pandas, πρέπει πρώτα να καθορίσετε τη στήλη που θέλετε να ελέγξετε. Στο παρακάτω παράδειγμα, θα χρησιμοποιήσουμε ένα DataFrame που περιέχει πληροφορίες σχετικά με την ηλικία και την πόλη διαμονής μιας ομάδας ατόμων.

import pandas as pd
# Create a sample DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Age': [24, 27, 22, 32, 29],
    'City': ['Newcastle', 'London', 'Newcastle', 'Cardiff', 'London']
}
df = pd.DataFrame(data)
print(df)
python

Το τελικό DataFrame έχει την εξής μορφή:

Name  	Age       City
0    Alice    	24    	Newcastle
1    Bob    	27  		London
2  Charlie    	22    	Newcastle
3    David    	32    	Cardiff
4   Edward    	29  		London

Τώρα, ας υποθέσουμε ότι θέλουμε να δημιουργήσουμε μια λίστα με όλες τις πόλεις όπου ζουν οι άνθρωποι στο DataFrame. Μπορούμε να εφαρμόσουμε τη συνάρτηση pandas unique() στη στήλη που περιέχει τις πόλεις.

# Find different cities
unique_cities = df['City'].unique()
print(unique_cities)
python

Το αποτέλεσμα είναι ένας πίνακας numpy που εμφανίζει κάθε πόλη μία φορά, δείχνοντας ότι τα άτομα στο DataFrame προέρχονται από συνολικά τρεις πόλεις: Newcastle, Λονδίνο και Κάρντιφ.

['Newcastle' 'London' 'Cardiff']
Go to Main Menu