Python pandas read_csv() yra vienas iš daž­niau­siai naudojamų metodų CSV failams įskaityti į pandas ir saugoti juos kaip Da­taF­ra­mes. CSV failai (kab­le­liais atskirti duomenys) yra plačiai nau­do­ja­mas formatas len­te­li­nių duomenų sau­go­ji­mui ir yra pa­lai­ko­mas daugelyje programų.

Kokia yra Python pandas read_csv() sintaksė?

pandas.read_csv() sukuria pandas DataFrame iš CSV failo. Pag­rin­di­nė funkcijos sintaksė atrodo taip:

import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)
python

Kokie yra svar­biau­si pa­ra­met­rai pandas.read_csv()?

pandas.read_csv() gali priimti įvairius pa­ra­met­rus. Kad būtų pa­pras­čiau, su­telk­si­me dėmesį į svar­biau­sius ar­gu­men­tus. Čia pa­tei­kia­ma pag­rin­di­nių parametrų, kuriuos galite naudoti norėdami nurodyti, kaip funkcija turėtų veikti, apžvalga:

Pa­ra­met­ras Reikšmė Nu­ma­ty­ta­sis vertė
filepath_or_buffer Tai yra Python eilutė, at­spin­din­ti CSV failo arba duomenų buferio, pvz., URL, kelią.
sep Tai nurodo at­sky­rik­lį tarp verčių. ,
header Nurodo, kuri eilutė turi būti naudojama kaip antraštė. infer (pirmoji eilutė)
names Jei nu­sta­ty­tas header=None, galite naudoti names, kad pa­teik­tu­mė­te Python stulpelių pa­va­di­ni­mų sąrašą.
index_col Nustato, kurią stulpelių naudoti kaip indeksą. None
usecols Šis pa­ra­met­ras leidžia pa­si­rink­ti, kuriuos stul­pe­lius norite įkelti į DataFrame. None
dtype Nurodo stulpelių duomenų tipą. None

Išsamų šios funkcijos parametrų sąrašą galite rasti pandas do­ku­men­ta­ci­jo­je.

Kaip prieiti prie CSV failų žingsnis po žingsnio

Naudodami pandas.read_csv(), galite lengvai perkelti duomenis iš CSV failų į Python vos keliais veiksmais.

Šiuose pa­vyz­džiuo­se dirbsime su CSV failu, kurio struktūra yra tokia:

1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000

1 žingsnis: Im­por­tuo­ti pandas

Pir­miau­sia į savo Python skriptą im­por­tuo­ki­te pandas bi­b­lio­te­ką.

import pandas as pd
python

2 etapas: įkelkite CSV failą

Dabar galite įkelti CSV failą į Python pandas naudodami read_csv() funkciją. Tiesiog per­duo­ki­te failo kelią į funkciją. Toliau pa­teik­ta­me kode naudosime failą pa­va­di­ni­mu data.csv, kuris yra iš­sau­go­tas tame pačiame kataloge kaip ir sce­na­ri­jus:

df = pd.read_csv('data.csv')
python

Pirmiau pateiktas kodas išsaugo failą DataFrame objekte (df), su kuriuo vėliau galėsime dirbti. Pandas au­to­ma­tiš­kai in­ter­pre­tuos pirmą eilutę kaip stulpelių antraštes, jei ne­nu­ro­dy­si­te kitaip.

3 žingsnis: CSV failo rodymas

Verta per­žiū­rė­ti pirmąsias kelias DataFrame eilutes, kad įsi­ti­kin­tu­mė­te, jog failas įkeltas teisingai. Tam galite naudoti funkciją DataFrame.head(). Pagal nu­ma­ty­tuo­sius nu­sta­ty­mus ji rodo pirmąsias penkias DataFrame eilutes, lei­džian­čias greitai su­si­pa­žin­ti su duomenų struktūra:

print(df.head())
python

Re­zul­ta­tas atrodo taip:

0  1        John Avery   35      Nottingham  	50000
1  2    Adelaide Smith   29   	 London 	    62000
2  3   Michael Rivera    41      Cardiff	   	40000
3  4        Grace Kim    33      Hull 		    35000
4  5    Tyler Johnson    28      Kent   		52000

4 žingsnis: pa­kei­s­ki­te stulpelių pa­va­di­ni­mus (pa­si­rink­ti­nai)

Jei jūsų CSV faile nėra antraštės eilutės, galite stulpelių pa­va­di­ni­mus nustatyti rankiniu būdu:

df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])
python

Šiame pavyzdyje stul­pe­lius pa­va­di­no­me ID, Vardas, Amžius, Miestas ir At­ly­gi­ni­mas. Re­zul­ta­tas atrodo taip:

ID                Name    	Age            City    	Salary
0  1          John Avery    	35        Nottingham    50000
1  2     Adelaide Smith    	29    	London        62000
2  3    Michael Rivera    	41        Cardiff    	40000
3  4          Grace Kim    	33        Hull        	35000
4  5     Tyler Johnson    	28        Kent        52000
Go to Main Menu