Kuinka valita dataa pandas DataFrames -kehyksistä loc[]-komennolla

Sisällys

Python pandas -kirjastossa DataFrame.loc[] on ominaisuus, jonka avulla voit valita tietoja DataFrame-taulukosta tunnisteiden avulla. Tämä helpottaa tiettyjen rivien ja sarakkeiden poimimista DataFrame-taulukosta.

Mikä on pandas `loc[]`:n syntaksi?

loc[] n syntaksi on melko yksinkertainen. Sinun tarvitsee vain välittää parametriksi valitsemiesi sarakkeiden ja rivien nimet:

DataFrame.loc[selection]

python

Pandas loc[]:ssä valinnat tehdään pääasiassa tunnisteiden avulla. Tämä tarkoittaa, että antamasi parametri voi olla yksittäinen tunniste, luettelo tai tunnisteiden osajoukko. Myös boolen matriiseja voidaan käyttää.

Mitä eroa on `loc[]`:lla ja `iloc[]`llä?

Kun pandas DataFrame.loc[] valitsee tiedot tunnisteiden perusteella, DataFrame.iloc valitsee tiedot kokonaislukupohjaisten sijaintien perusteella. Seuraava koodiesimerkki havainnollistaa eroja. Ensin luomme pandas DataFrame-kehyksen:

import pandas as pd
# Example DataFrame
data = {'Name': ['Alyssa', 'Brandon', 'Carmen'], 'Age': [23, 35, 30]}
df = pd.DataFrame(data)
print(df)

python

DataFrame näyttää seuraavalta:

Name    Age
0   Alyssa     	23
1 	Brandon     35
2  	Carmen     	30

Voit poimia Alyssan DataFrame-taulukosta käyttämällä joko pandas loc[] tai iloc[]. Vaikka lähestymistavat eroavat toisistaan, tulos on sama:

# Using loc and labels to extract Alyssa
print(df.loc[0, 'Name'])  # Output: 'Alyssa'
# Using iloc and integers to extract Alysa
print(df.iloc[0, 0])  # Output: 'Alyssa'

python

Kuinka käyttää pandas `DataFrame.loc[]`:tä

Pandas loc[] auttaa sinua poimimaan osajoukkoja DataFrame-kehyksestäsi. loc[] avulla voit poimia yhden rivin tai sarakkeen, useita rivejä ja sarakkeita tai jopa soveltaa suodatusolosuhteita. Tämä joustavuus tekee siitä sopivan monenlaisiin käyttötarkoituksiin.

Yhden rivin valitseminen

Katsotaanpa DataFrame-esimerkkiä:

import pandas as pd
data = {
    'Name': ['Alyssa', 'Brandon', 'Carmen'],
    'Age': [23, 35, 30],
    'City': ['Sheffield', 'Glasgow', 'Belfast']
}
df = pd.DataFrame(data)
print(df)

python

Tässä on lopullisen DataFrame-kehyksen ulkoasu:

Name  	Age      City
0   Alyssa  23	 	Sheffield
1 Brandon  	35    Glasgow
2 Carmen    30    Belfast

Voit valita tiedot riviltä, joka sisältää Brandonia koskevat tiedot (indeksi 1), käyttämällä pandas loc[]:

brandon_data = df.loc[1]
print(brandon_data)

python

Tässä on tulos:

Name         Brandon
Age              35
City        	Glasgow
Name: 1, dtype: object

Useiden sarakkeiden valitseminen

Voit myös käyttää DataFrame.loc[] valitaksesi osajoukon sarakkeista. Seuraava koodi valitsee sarakkeet “Name” ja “City”:

name_city = df.loc[:, ['Name', 'City']]
print(name_city)

python

Tuloksena on alkuperäisen DataFrame-kehyksen osajoukko:

Name     City
0   Alyssa  Sheffield
1 Brandon   Glasgow
2  Carmen   Belfast

Rivien valinta ehtojen perusteella

Pandas loc[]:lla voit myös valita rivejä, jotka täyttävät tietyt kriteerit. Voit tehdä tämän boolen vertailuoperaattoreilla. Esimerkiksi näin voit suodattaa pois kaikki yli 25-vuotiaat henkilöt:

older_than_25 = df.loc[df['Age'] > 25]
print(older_than_25)

python

Yllä oleva koodi tuottaa DataFrame-kehyksen, joka sisältää vain DataFrame-kehyksessä olevat yli 25-vuotiaat henkilöt:

Name  	Age     City
1 Brandon     35   Glasgow
2  Carmen     30   Belfast

Suositut artikkelit

Verkkotunnusten kauppa: kuinka myydä verkkotunnus

Verkkotunnusten ostaminen ja myyminen voi olla tuottoisaa – jos osaa toimia oikein.…

Lue lisää

Aiheeseen liittyvät artikkelit

ESB Professionalshutterstock

Kuinka käyttää Pandas DataFrame -sovellusta taulukoiden nopeaan käsittelyyn Pythonissa

Pandas-moduuli on yksi tehokkaimmista työkaluista tietojen käsittelyyn Pythonissa. Yksi Pandasin keskeisistä tietorakenteista on DataFrame. DataFrame-rakenteita voidaan käyttää tehokkaasti kaksiulotteisten, jäsenneltyjen tietojen käsittelyyn. Selitämme tietorakenteen rakenteen…

Lue lisää

Mr. Kosalshutterstock

Kuinka indeksoida pandas DataFrames

Pandas DataFrame -indeksointi on tehokas työkalu tehokkaaseen ja tulokselliseen tietojen käsittelyyn. Erilaisten menetelmien avulla voit kohdistaa tietyt tiedot ja DataFrame-tietokannan osajoukot. Tässä artikkelissa tutustumme pandas DataFrame -indeksiin, siihen, miten pääset…

Lue lisää

BEST-BACKGROUNDSShutterstock

Kuinka silmukoida DataFrames-kehyksiä pandas iterrows()-funktiolla

Pandas DataFrame.iterrows() on hyödyllinen funktio DataFrame-taulukon rivien läpikäymiseen, erityisesti kun dataa on käsiteltävä rivi riviltä. Tämä on erityisen hyödyllistä laskelmissa tai ehdollisessa logiikassa. Tässä artikkelissa käsitellään panda iterrows()-funktion syntaksia…

Lue lisää

Mr. Kosalshutterstock

Mikä on Python pandas any() ja miten se toimii?

Pandassa DataFrame any() -metodi on tehokas työkalu, jolla voidaan nopeasti tarkistaa, onko DataFrame-akselilla vähintään yksi totta-arvo. Tämä metodi on erityisen hyödyllinen data-analyysissä ja validoinnissa. Tässä artikkelissa esittelemme tämän funktion syntaksin, sen käytön…

Lue lisää

Ranjit Karmakarshutterstock

Mikä on pandas DataFrame describe() -metodi?

Pandas-kirjaston DataFrame.describe()-metodi tarjoaa nopean tavan luoda kattava tilastollinen yhteenveto DataFrame-kehyksen numeerisista tiedoista. Sen avulla voi säätää prosenttipisteitä ja määrittää tietotyyppejä, joten se on erittäin joustava ja sopii monenlaisiin…

Lue lisää

Kuinka valita dataa pandas Da­taFra­mes -ke­hyk­sis­tä loc[]-ko­men­nol­la

Mikä on pandas loc[]:n syntaksi?

Mitä eroa on loc[]:lla ja iloc[]llä?

Kuinka käyttää pandas DataFrame.loc[]:tä

Yhden rivin va­lit­se­mi­nen

Useiden sa­rak­kei­den va­lit­se­mi­nen

Rivien valinta ehtojen pe­rus­teel­la

Kuinka valita dataa pandas DataFrames -kehyksistä loc[]-komennolla

Mikä on pandas `loc[]`:n syntaksi?

Mitä eroa on `loc[]`:lla ja `iloc[]`llä?

Kuinka käyttää pandas `DataFrame.loc[]`:tä

Yhden rivin valitseminen

Useiden sarakkeiden valitseminen

Rivien valinta ehtojen perusteella