Kuinka valita dataa pandas DataFrames -kehyksistä loc[]-komennolla
Python pandas -kirjastossa DataFrame.loc[] on ominaisuus, jonka avulla voit valita tietoja DataFrame-taulukosta tunnisteiden avulla. Tämä helpottaa tiettyjen rivien ja sarakkeiden poimimista DataFrame-taulukosta.
Mikä on pandas loc[]:n syntaksi?
loc[] n syntaksi on melko yksinkertainen. Sinun tarvitsee vain välittää parametriksi valitsemiesi sarakkeiden ja rivien nimet:
DataFrame.loc[selection]pythonPandas loc[]:ssä valinnat tehdään pääasiassa tunnisteiden avulla. Tämä tarkoittaa, että antamasi parametri voi olla yksittäinen tunniste, luettelo tai tunnisteiden osajoukko. Myös boolen matriiseja voidaan käyttää.
Mitä eroa on loc[]:lla ja iloc[]llä?
Kun pandas DataFrame.loc[] valitsee tiedot tunnisteiden perusteella, DataFrame.iloc valitsee tiedot kokonaislukupohjaisten sijaintien perusteella. Seuraava koodiesimerkki havainnollistaa eroja. Ensin luomme pandas DataFrame-kehyksen:
import pandas as pd
# Example DataFrame
data = {'Name': ['Alyssa', 'Brandon', 'Carmen'], 'Age': [23, 35, 30]}
df = pd.DataFrame(data)
print(df)pythonDataFrame näyttää seuraavalta:
Name Age
0 Alyssa 23
1 Brandon 35
2 Carmen 30Voit poimia Alyssan DataFrame-taulukosta käyttämällä joko pandas loc[] tai iloc[]. Vaikka lähestymistavat eroavat toisistaan, tulos on sama:
# Using loc and labels to extract Alyssa
print(df.loc[0, 'Name']) # Output: 'Alyssa'
# Using iloc and integers to extract Alysa
print(df.iloc[0, 0]) # Output: 'Alyssa'pythonKuinka käyttää pandas DataFrame.loc[]:tä
Pandas loc[] auttaa sinua poimimaan osajoukkoja DataFrame-kehyksestäsi. loc[] avulla voit poimia yhden rivin tai sarakkeen, useita rivejä ja sarakkeita tai jopa soveltaa suodatusolosuhteita. Tämä joustavuus tekee siitä sopivan monenlaisiin käyttötarkoituksiin.
Yhden rivin valitseminen
Katsotaanpa DataFrame-esimerkkiä:
import pandas as pd
data = {
'Name': ['Alyssa', 'Brandon', 'Carmen'],
'Age': [23, 35, 30],
'City': ['Sheffield', 'Glasgow', 'Belfast']
}
df = pd.DataFrame(data)
print(df)pythonTässä on lopullisen DataFrame-kehyksen ulkoasu:
Name Age City
0 Alyssa 23 Sheffield
1 Brandon 35 Glasgow
2 Carmen 30 BelfastVoit valita tiedot riviltä, joka sisältää Brandonia koskevat tiedot (indeksi 1), käyttämällä pandas loc[]:
brandon_data = df.loc[1]
print(brandon_data)pythonTässä on tulos:
Name Brandon
Age 35
City Glasgow
Name: 1, dtype: objectUseiden sarakkeiden valitseminen
Voit myös käyttää DataFrame.loc[] valitaksesi osajoukon sarakkeista. Seuraava koodi valitsee sarakkeet “Name” ja “City”:
name_city = df.loc[:, ['Name', 'City']]
print(name_city)pythonTuloksena on alkuperäisen DataFrame-kehyksen osajoukko:
Name City
0 Alyssa Sheffield
1 Brandon Glasgow
2 Carmen BelfastRivien valinta ehtojen perusteella
Pandas loc[]:lla voit myös valita rivejä, jotka täyttävät tietyt kriteerit. Voit tehdä tämän boolen vertailuoperaattoreilla. Esimerkiksi näin voit suodattaa pois kaikki yli 25-vuotiaat henkilöt:
older_than_25 = df.loc[df['Age'] > 25]
print(older_than_25)pythonYllä oleva koodi tuottaa DataFrame-kehyksen, joka sisältää vain DataFrame-kehyksessä olevat yli 25-vuotiaat henkilöt:
Name Age City
1 Brandon 35 Glasgow
2 Carmen 30 Belfast