Hoe gegevens selecteren uit pandas DataFrames met loc[]

Inhoudsopgave

In de Python pandas-bibliotheek is DataFrame.loc[] een eigenschap waarmee u gegevens uit een DataFrame kunt selecteren met behulp van labels. Dit maakt het eenvoudig om specifieke rijen en kolommen uit een DataFrame te extraheren.

Wat is de syntaxis voor pandas `loc[]`?

De syntaxis voor loc[] is vrij eenvoudig. Het enige wat u hoeft te doen is de labels van de kolommen en rijen die u wilt selecteren als parameter doorgeven:

DataFrame.loc[selection]

python

Met pandas loc[] worden selecties voornamelijk gemaakt met behulp van labels. Dit betekent dat de parameter die u opgeeft een enkel label, een lijst of een reeks labels kan zijn. Booleaanse arrays kunnen ook worden gebruikt.

Wat is het verschil tussen `loc[]` en `iloc[]`?

Terwijl pandas DataFrame.loc[] gegevens selecteert op basis van labels, selecteert DataFrame.iloc gegevens op basis van posities op basis van gehele getallen. Hier is een codevoorbeeld om de verschillen te illustreren. Eerst gaan we een pandas DataFrame maken:

import pandas as pd
# Example DataFrame
data = {'Name': ['Alyssa', 'Brandon', 'Carmen'], 'Age': [23, 35, 30]}
df = pd.DataFrame(data)
print(df)

python

Zo ziet het DataFrame eruit:

Name    Age
0   Alyssa     	23
1 	Brandon     35
2  	Carmen     	30

Om ‘Alyssa’ uit het DataFrame te halen, kun je zowel pandas loc[] als iloc[] gebruiken. Hoewel de aanpak verschilt, is het resultaat hetzelfde:

# Using loc and labels to extract Alyssa
print(df.loc[0, 'Name'])  # Output: 'Alyssa'
# Using iloc and integers to extract Alysa
print(df.iloc[0, 0])  # Output: 'Alyssa'

python

Hoe pandas `DataFrame.loc[]` te gebruiken

Pandas loc[] helpt u bij het extraheren van subsets van uw DataFrame. Met loc[] kunt u een enkele rij of kolom, meerdere rijen en kolommen extraheren of zelfs voorwaarden toepassen voor het filteren. Deze flexibiliteit maakt het geschikt voor verschillende gebruikssituaties.

Een enkele rij selecteren

Laten we eens kijken naar een voorbeeld van een DataFrame:

import pandas as pd
data = {
    'Name': ['Alyssa', 'Brandon', 'Carmen'],
    'Age': [23, 35, 30],
    'City': ['Sheffield', 'Glasgow', 'Belfast']
}
df = pd.DataFrame(data)
print(df)

python

Dit is hoe het resulterende DataFrame eruitziet:

Name  	Age      City
0   Alyssa  23	 	Sheffield
1 Brandon  	35    Glasgow
2 Carmen    30    Belfast

Om de gegevens te selecteren uit de rij die informatie bevat over Brandon (index 1), kunt u pandas loc[] gebruiken:

brandon_data = df.loc[1]
print(brandon_data)

python

Dit is het resultaat:

Name         Brandon
Age              35
City        	Glasgow
Name: 1, dtype: object

Meerdere kolommen selecteren

Je kunt ook DataFrame.loc[] gebruiken om een subset van kolommen te selecteren. De volgende code selecteert de kolommen ‘Naam’ en ‘Stad’:

name_city = df.loc[:, ['Name', 'City']]
print(name_city)

python

Het resultaat is een subset van het oorspronkelijke DataFrame:

Name     City
0   Alyssa  Sheffield
1 Brandon   Glasgow
2  Carmen   Belfast

Rijen selecteren op basis van voorwaarden

Met pandas loc[] kunt u ook rijen selecteren die aan specifieke criteria voldoen. Dit kunt u doen met Booleaanse vergelijkingsoperatoren. Hier volgt bijvoorbeeld hoe u alle personen ouder dan 25 kunt filteren:

older_than_25 = df.loc[df['Age'] > 25]
print(older_than_25)

python

De bovenstaande code produceert een DataFrame die alleen gegevens bevat voor personen in de DataFrame die ouder zijn dan 25 jaar:

Name  	Age     City
1 Brandon     35   Glasgow
2  Carmen     30   Belfast

Populaire artikelen

Domeinhandel: hoe verkoop je een domeinnaam?

Het kopen en verkopen van domeinen kan lucratief zijn – als je weet hoe je het moet…

Lees meer

Gerelateerde artikelen

ESB Professionalshutterstock

Hoe je Pandas DataFrame kunt gebruiken om tabellen snel te bewerken in Python

De Pandas-module is een van de krachtigste tools voor gegevensmanipulatie in Python. Een van de centrale gegevensstructuren in Pandas is het DataFrame. DataFrames kunnen worden gebruikt om tweedimensionale, gestructureerde gegevens efficiënt te manipuleren. We leggen de structuur…

Lees meer

Mr. Kosalshutterstock

Hoe pandas DataFrames te indexeren

Pandas DataFrame-indexering is een krachtig hulpmiddel voor efficiënte en effectieve gegevensverwerking. Met verschillende methoden kunt u specifieke gegevens en subsets van uw DataFrame targeten. In dit artikel gaan we dieper in op wat de pandas DataFrame-index is, hoe u met…

Lees meer

BEST-BACKGROUNDSShutterstock

Hoe DataFrames doorlopen met pandas iterrows()

Pandas DataFrame.iterrows() is een handige functie om door rijen in een DataFrame te lopen, vooral wanneer u gegevens rij voor rij moet verwerken. Dit is vooral handig voor berekeningen of voorwaardelijke logica. In dit artikel bespreken we de syntaxis van panda iterrows() en…

Lees meer

Mr. Kosalshutterstock

Wat is Python pandas any() en hoe werkt het?

In pandas is de DataFrame any()-methode een efficiënt hulpmiddel om snel te controleren of er ten minste één ware waarde langs een as van een DataFrame aanwezig is. Deze methode is vooral nuttig voor gegevensanalyse en validatie. In dit artikel laten we u zien wat de syntaxis…

Lees meer

Ranjit Karmakarshutterstock

Wat is de methode describe() van pandas DataFrame?

De methode DataFrame.describe() van pandas biedt een snelle manier om een uitgebreid statistisch overzicht van numerieke gegevens in een DataFrame te genereren. Met de mogelijkheid om percentielen aan te passen en gegevenstypen te specificeren, is deze methode zeer flexibel en…

Lees meer

Hoe gegevens se­lec­te­ren uit pandas Da­taF­ra­mes met loc[]

Wat is de syntaxis voor pandas loc[]?

Wat is het verschil tussen loc[] en iloc[]?

Hoe pandas DataFrame.loc[] te gebruiken

Een enkele rij se­lec­te­ren

Meerdere kolommen se­lec­te­ren

Rijen se­lec­te­ren op basis van voor­waar­den

Hoe gegevens selecteren uit pandas DataFrames met loc[]

Wat is de syntaxis voor pandas `loc[]`?

Wat is het verschil tussen `loc[]` en `iloc[]`?

Hoe pandas `DataFrame.loc[]` te gebruiken

Een enkele rij selecteren

Meerdere kolommen selecteren

Rijen selecteren op basis van voorwaarden