Sådan indekseres pandas DataFrames

Indhold

Indeksering af Python pandas DataFrames giver mulighed for effektiv og direkte adgang til data. Det gør det nemmere at vælge bestemte rækker og kolonner, hvilket forenkler dataanalyseopgaver.

Hvad er indeksering i pandas?

Indeksering i pandas henviser til forskellige metoder, du kan bruge til at vælge rækker eller kolonner. Ved hjælp af etiketter på rækker og kolonner eller deres numeriske position i DataFrame kan du nemt vælge elementer i en DataFrame. Et indeks fungerer som en slags adressesystem for dine data, der hjælper dig med at finde og administrere dine data mere effektivt.

Hvad er pandas `DataFrame.index`?

Du kan se indeksmærkerne for en DataFrame i pandas ved hjælp af attributten index. Syntaksen ser således ud:

DataFrame.index

python

Hvad er syntaksen for indeksering af DataFrames i pandas?

Der er flere måder at indeksere pandas DataFrames på, og syntaksen varierer afhængigt af den operation, du ønsker at udføre.

Indeksering med etiketter (kolonneetiketter)

Du kan bruge kolonnenavne til at indeksere pandas DataFrames. Her er et eksempel på, hvordan du opretter en eksempel-DataFrame:

import pandas as pd
# Creating a sample DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['Nottingham', 'London', 'Cardiff']
}
df = pd.DataFrame(data)
print(df)

python

Sådan ser DataFrame ud:

Name  Age       City
0    Alice   25     Nottingham
1    Bob   30  	London
2  Charlie   35    Cardiff

For at få adgang til alle værdierne i en kolonne kan du bruge kolonnenavnet sammen med indekseringsoperatoren []. Indtast blot kolonnenavnet som en Python-streng inden for indekseringsoperatoren:

# Access the Age column
print(df['Age'])

python

Resultatet er en liste over aldre:

0    25
1    30
2    35
Name: Age, dtype: int64

For at hente data fra mere end én kolonne skal du skrive kolonnenavnene i indekseringsoperatoren og adskille dem med kommaer.

Indeksering med `loc[]` (rækkeetiketter)

Hvis du har brug for at få adgang til en bestemt række i din DataFrame, kan du bruge pandas loc-indekseringen. Du kan overføre rækkeetiketten eller rækkens nummer til indekseringen. I dette eksempel bruger vi den samme DataFrame som ovenfor og udtrækker værdierne fra den første række (række 0):

print(df.loc[0])

python

Ovenstående kode udskriver værdierne for Alice, som findes i den første række i DataFrame:

Name        Alice
Age            25
City      Nottingham
Name: 0, dtype: object

Indeksering med `iloc[]` (række- og kolonnenumre)

En anden måde at få adgang til specifikke elementer i din DataFrame er via række- og kolonnenumre. Dette er sandsynligvis den mest populære måde at finde elementer i en DataFrame. For at bruge det numeriske indeks skal du bruge DataFrame-attributten iloc.

# Access the first row
print(df.iloc[0])
# Access the value in the first row and second column
print(df.iloc[0, 1])

python

Her er resultatet, når man arbejder med iloc[]:

Name        Alice
Age            25
City      Nottingham
Name: 0, dtype: object
25

Adgang til individuelle værdier

Hvis du kun vil have adgang til en enkelt værdi, er at en hurtig og enkel måde at gøre det på. Med denne indeksering kan du definere rækker og kolonner ved hjælp af deres etiketter. Hvis du f.eks. vil finde ud af, hvor Bob bor, skal du skrive ‘1’ for rækken og ‘City’ for kolonnen:

print(df.at[1, 'City'])

python

Her får vi resultatet London.

Alternativt kan du bruge 20-indekseringen, som fungerer på samme måde som at, men bruger den heltalbaserede kolonneposition i stedet for navnet. Koden nedenfor giver det samme resultat som det foregående eksempel:

print(df.iat[1, 2])

python

Boolsk indeksering

Du kan også oprette delmængder af en DataFrame baseret på en betingelse. Dette kaldes boolsk indeksering. Betingelsen skal evaluere til enten True eller False og placeres direkte i indekseringsoperatoren. Hvis du f.eks. vil vælge rækker, der indeholder personer, der er over 30 år, kan du bruge følgende kode:

# Select rows where Age is greater than 30
print(df[df['Age'] > 30])

python

Den eneste person, der er over 30, er Charlie, hvilket resulterer i følgende output:

Name  Age     City
2  Charlie   35    Cardiff

Populære artikler

Domænehandel: Sådan sælger du et domænenavn

Køb og salg af domæner kan være en god forretning – hvis man ved, hvordan man gør. Vi vil…

Læs mere

Relaterede artikler

BEST-BACKGROUNDSShutterstock

Sådan gennemløber du DataFrames med pandas iterrows()

Pandas DataFrame.iterrows() er en nyttig funktion til at gennemløbe rækker i en DataFrame, især når du skal behandle data række for række. Dette er især nyttigt til beregninger eller betinget logik. I denne artikel gennemgår vi syntaksen for panda iterrows() og viser dig, hvordan…

Læs mere

Mr. Kosalshutterstock

Hvad er Python pandas any(), og hvordan fungerer det?

I pandas er DataFrame any()-metoden et effektivt værktøj til hurtigt at kontrollere, om der er mindst én sand værdi langs en akse i en DataFrame. Denne metode er især nyttig til dataanalyse og validering. I denne artikel viser vi dig, hvad syntaksen for denne funktion er, hvordan…

Læs mere

ESB Professionalshutterstock

Sådan bruges Pandas DataFrame til hurtigt at manipulere tabeller i Python

Pandas-modulet er et af de mest kraftfulde værktøjer til databehandling i Python. En af de centrale datastrukturer i Pandas er DataFrame. DataFrames kan bruges til at behandle todimensionelle, strukturerede data effektivt. Vi forklarer datastrukturens opbygning samt dens…

Læs mere

UndreyShutterstock

Hvad er Python pandas-egenskaben iloc[]?

Når man arbejder med DataFrames i Python pandas, er det ikke alle rækker eller kolonner i en DataFrame, der altid er relevante for dataanalysen. Pandas DataFrame-egenskaben iloc[] er et nyttigt værktøj til at vælge rækker eller kolonner ved hjælp af deres indekser. I denne…

Læs mere

REDPIXEL.PLShutterstock

Sådan beregnes gennemsnit med pandas mean()

Pandas-funktionen `DataFrame.mean()` beregner gennemsnit i en DataFrame. Den kan bruges til at finde gennemsnitsværdier for rækker eller kolonner og giver fleksibilitet, når det kommer til håndtering af NaN-værdier. I denne artikel ser vi på funktionens syntaks, de parametre, den…

Læs mere

Sådan in­dek­se­res pandas Da­ta­F­ra­mes

Hvad er in­dek­se­ring i pandas?

Hvad er pandas DataFrame.index?

Hvad er syntaksen for in­dek­se­ring af Da­ta­F­ra­mes i pandas?

In­dek­se­ring med etiketter (ko­lon­ne­e­ti­ket­ter)

In­dek­se­ring med loc[] (ræk­ke­e­ti­ket­ter)

In­dek­se­ring med iloc[] (række- og ko­lon­ne­num­re)

Adgang til in­di­vi­du­el­le værdier

Boolsk in­dek­se­ring

Sådan indekseres pandas DataFrames

Hvad er indeksering i pandas?

Hvad er pandas `DataFrame.index`?

Hvad er syntaksen for indeksering af DataFrames i pandas?

Indeksering med etiketter (kolonneetiketter)

Indeksering med `loc[]` (rækkeetiketter)

Indeksering med `iloc[]` (række- og kolonnenumre)

Adgang til individuelle værdier

Boolsk indeksering