Kaip indeksuoti pandas DataFrames

Contents

Python pandas DataFrames indeksavimas leidžia efektyviai ir tiesiogiai pasiekti duomenis. Tai palengvina konkrečių eilučių ir stulpelių atranką, supaprastindamas duomenų analizės užduotis.

Kas yra indeksavimas pandose?

Indeksavimas pandose reiškia įvairius metodus, kuriuos galite naudoti eilutėms ar stulpeliams atrinkti. Naudodami eilutės ir stulpelio žymes arba jų skaitmeninę padėtį duomenų rėmelio viduje, galite lengvai atrinkti elementus duomenų rėmelyje. Indeksas veikia kaip adresų sistema jūsų duomenims, padėdamas jums efektyviau rasti ir tvarkyti savo duomenis.

Kas yra pandos `DataFrame.index`?

Duomenų rėmo indeksų etiketes pandas galite peržiūrėti naudodami index atributą. Sintaksė atrodo taip:

DataFrame.index

python

Kokia yra pandas duomenų rėmelių indeksavimo sintaksė?

Yra keletas būdų indeksuoti pandas DataFrames, o sintaksė skiriasi priklausomai nuo operacijos, kurią norite atlikti.

Indeksavimas su žymėmis (stulpelių žymėmis)

Galite naudoti stulpelių pavadinimus, kad indeksuotumėte pandas DataFrames. Štai pavyzdys, kaip sukurti pavyzdinį DataFrame:

import pandas as pd
# Creating a sample DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['Nottingham', 'London', 'Cardiff']
}
df = pd.DataFrame(data)
print(df)

python

Štai kaip atrodo duomenų rėmelis:

Name  Age       City
0    Alice   25     Nottingham
1    Bob   30  	London
2  Charlie   35    Cardiff

Norėdami pasiekti visas stulpelio reikšmes, galite naudoti stulpelio pavadinimą kartu su indeksavimo operatoriumi []. Tiesiog įveskite stulpelio pavadinimą kaip Python eilutę indeksavimo operatoriaus viduje:

# Access the Age column
print(df['Age'])

python

Rezultatas yra amžių sąrašas:

0    25
1    30
2    35
Name: Age, dtype: int64

Norėdami gauti daugiau nei vienos stulpelio duomenis, įrašykite stulpelių pavadinimus indeksavimo operatoriaus laukelyje ir atskirkite juos kableliais.

Indeksavimas su `loc[]` (eilučių žymėmis)

Jei norite pasiekti konkretų eilutę savo DataFrame, galite naudoti pandas loc indeksatorių. Indeksuotojui galite perduoti eilutės etiketę arba eilutės numerį. Šiame pavyzdyje naudosime tą patį DataFrame kaip ir aukščiau ir išgausime vertes iš pirmos eilutės (eilutė 0):

print(df.loc[0])

python

Pirmiau pateiktas kodas išveda Alice vertes, kurios yra pateiktos pirmoje DataFrame eilutėje:

Name        Alice
Age            25
City      Nottingham
Name: 0, dtype: object

Indeksavimas su `iloc[]` (eilutės ir stulpelių numeriais)

Kitas būdas pasiekti konkrečius elementus jūsų DataFrame yra per eilučių ir stulpelių numerius. Tai tikriausiai populiariausias būdas rasti elementus DataFrame. Norėdami naudoti skaitmeninį indeksą, jums reikės DataFrame atributas iloc.

# Access the first row
print(df.iloc[0])
# Access the value in the first row and second column
print(df.iloc[0, 1])

python

Štai rezultatas dirbant su iloc[]:

Name        Alice
Age            25
City      Nottingham
Name: 0, dtype: object
25

Prieiga prie individualių verčių

Jei norite pasiekti tik vieną reikšmę, at indeksatorius yra greitas ir paprastas būdas tai padaryti. Naudodami šį indeksatorių, galite apibrėžti eilutes ir stulpelius naudodami jų etiketes. Pavyzdžiui, jei norite sužinoti, kur gyvena Bobas, įveskite „1“ eilutėje ir „Miestas“ stulpelyje:

print(df.at[1, 'City'])

python

Čia gauname rezultatą „London“.

Arba galite naudoti iat indeksatorių, kuris veikia panašiai kaip at, bet vietoj pavadinimo naudoja sveikųjų skaičių pagrįstą stulpelio poziciją. Toliau pateiktas kodas duoda tokį patį rezultatą kaip ir ankstesnis pavyzdys:

print(df.iat[1, 2])

python

Būlio indeksavimas

Taip pat galite kurti DataFrame pogrupius pagal sąlygą. Tai vadinama Būlio indeksavimu. Sąlyga turėtų būti įvertinta kaip True arba False ir įrašoma tiesiai į indeksavimo operatorius. Pavyzdžiui, jei norite atrinkti eilutes, kuriose yra vyresni nei 30 metų žmonės, galite naudoti šį kodą:

# Select rows where Age is greater than 30
print(df[df['Age'] > 30])

python

Vienintelis asmuo, kuris yra vyresnis nei 30 metų, yra Charlie, todėl gaunamas toks rezultatas:

Name  Age     City
2  Charlie   35    Cardiff

Kaip kartoti DataFrames su pandas iterrows()

Pandas DataFrame.iterrows() yra naudinga funkcija, skirta kartoti eilutes DataFrame, ypač kai reikia apdoroti duomenis eilutė po eilutės. Tai ypač naudinga skaičiavimams ar sąlyginei logikai. Šiame straipsnyje aptarsime panda iterrows() sintaksę ir parodysime, kaip sudėti…

Mr. Kosalshutterstock

Kas yra Python pandas any() ir kaip jis veikia?

Pandose DataFrame any() metodas yra veiksminga priemonė, leidžianti greitai patikrinti, ar DataFrame ašyje yra bent viena teisinga reikšmė. Šis metodas ypač naudingas duomenų analizei ir patvirtinimui. Šiame straipsnyje parodysime, kokia yra šios funkcijos sintaksė, kaip ją…

ESB Professionalshutterstock

Kaip naudoti Pandas DataFrame, kad greitai tvarkytumėte lenteles Python kalba

Pandas modulis yra vienas iš galingiausių duomenų tvarkymo įrankių Python kalboje. Viena iš pagrindinių Pandas duomenų struktūrų yra DataFrame. DataFrames gali būti naudojami efektyviam dvimatės struktūros duomenų tvarkymui. Mes paaiškiname duomenų struktūros sandarą, savybes ir…

UndreyShutterstock

Kas yra Python pandas savybė iloc[]?

Dirbant su DataFrames Python pandas, ne visos DataFrame eilutės ar stulpeliai visada yra svarbūs duomenų analizei. Pandas DataFrame savybė iloc[] yra naudinga priemonė eilutėms ar stulpeliams atrinkti pagal jų indeksus. Šiame straipsnyje apžvelgsime iloc[] sintaksę ir įvairius…

REDPIXEL.PLShutterstock

Kaip apskaičiuoti vidurkius naudojant pandas mean()

Pandas funkcija „DataFrame.mean()“ apskaičiuoja vidurkius DataFrame. Ji gali būti naudojama vidutinių verčių eilutėms ar stulpeliams rasti ir yra lanksti tvarkant NaN vertes. Šiame straipsnyje aptarsime funkcijos sintaksę, jos parametrus ir naudojimo būdus. Skaitykite toliau, kad…

Kaip in­dek­suo­ti pandas Da­taF­ra­mes

Kas yra in­dek­sa­vi­mas pandose?

Kas yra pandos DataFrame.index?

Kokia yra pandas duomenų rėmelių in­dek­sa­vi­mo sintaksė?

In­dek­sa­vi­mas su žymėmis (stulpelių žymėmis)

In­dek­sa­vi­mas su loc[] (eilučių žymėmis)

In­dek­sa­vi­mas su iloc[] (eilutės ir stulpelių numeriais)

Prieiga prie in­di­vi­dua­lių verčių

Būlio in­dek­sa­vi­mas

Kaip indeksuoti pandas DataFrames

Kas yra indeksavimas pandose?

Kas yra pandos `DataFrame.index`?

Kokia yra pandas duomenų rėmelių indeksavimo sintaksė?

Indeksavimas su žymėmis (stulpelių žymėmis)

Indeksavimas su `loc[]` (eilučių žymėmis)

Indeksavimas su `iloc[]` (eilutės ir stulpelių numeriais)

Prieiga prie individualių verčių

Būlio indeksavimas