Python pandas read_csv() on üks le­vi­nu­maid meetodeid CSV-failide lu­ge­miseks pandasse ja nende sal­ves­ta­miseks Da­taF­ra­me­sina. CSV-failid (komadega eraldatud väärtused) on laialt kasutatav formaat tabelite andmete sal­ves­ta­miseks ja neid toetavad paljud ra­ken­dused.

Mis on Python pandas read_csv() süntaks?

pandas.read_csv() loob CSV-failist pandas DataFrame’i. Funkt­siooni põhiline süntaks on järgmine:

import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)
python

Millised on pandas.read_csv() jaoks kõige olu­li­se­mad pa­ra­meet­rid?

pandas.read_csv() võib vastu võtta mit­me­su­gu­seid pa­ra­meetreid. Lihtsuse huvides kes­ken­dume kõige olu­li­se­ma­tele ar­gu­men­ti­dele. Siin on ülevaade pea­mis­test pa­ra­meet­ri­test, mida saab kasutada funkt­siooni käitumise mää­ra­miseks:

Pa­ra­mee­ter Tähendus Vaikimisi väärtus
filepath_or_buffer See on Python-string, mis esindab CSV-faili või and­me­puhvri teekonda, näiteks URL-i.
sep See määrab väärtuste vahelise eraldaja. ,
header Märgib, millist rida kasutada peal­kir­jana. infer (esimene rida)
names Kui header=None on seatud, saate names abil anda veergude nimede Python-nimekirja.
index_col Määrab, millist veergu kasutada indeksina. None
usecols Selle pa­ra­meet­riga saate valida, millised veerud soovite DataFrame’i laadida. None
dtype Määrab veergude and­me­tüübi. None

Selle funkt­siooni pa­ra­meet­rite täieliku loetelu leiate pandas do­ku­men­tat­sioo­nist.

Kuidas pääseda CSV-failidele juurde samm-sammult

pandas.read_csv() abil saate vaid mõne sammuga CSV-failidest andmeid Pyt­ho­nisse üle kanda.

Järg­mis­tes näidetes töötame CSV-failiga, mille struktuur on järgmine:

1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000

Samm 1: Importi pandad

Esiteks, importige pandas-teek Python-skripti.

import pandas as pd
python

2. samm: Lae CSV-fail

Nüüd saate oma CSV-faili laadida Python pandasse, kasutades funkt­siooni read_csv(). Lihtsalt edastage failitee funkt­sioo­nile. Järgmises koodis kasutame faili nimega data.csv, mis on sal­ves­ta­tud samasse kataloogi kui skript:

df = pd.read_csv('data.csv')
python

Eespool olev kood salvestab faili DataFrame-objekti (df), millega saame seejärel töötada. Pandas tõlgendab esimest rida au­to­maat­selt veeru peal­kir­jana, kui te ei määra teisiti.

3. samm: CSV-faili kuvamine

On hea mõte vaadata DataFrame’i esimesed read, et veenduda, et fail on õigesti laaditud. Selleks võite kasutada funkt­siooni DataFrame.head(). Vaikimisi näitab see DataFrame’i esimesed viis rida, andes teile kiire ülevaate andmete struk­tuu­rist:

print(df.head())
python

Väljund näeb välja järgmine:

0  1        John Avery   35      Nottingham  	50000
1  2    Adelaide Smith   29   	 London 	    62000
2  3   Michael Rivera    41      Cardiff	   	40000
3  4        Grace Kim    33      Hull 		    35000
4  5    Tyler Johnson    28      Kent   		52000

4. samm: Muuda veergude nimesid (va­li­ku­line)

Kui CSV-failis pole peal­kir­ja­read, saate veergude nimed käsitsi mää­rat­leda:

df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])
python

Selles näites oleme veer­gu­dele andnud nimed ID, Nimi, Vanus, Linn ja Palk. Väljund näeb välja järgmine:

ID                Name    	Age            City    	Salary
0  1          John Avery    	35        Nottingham    50000
1  2     Adelaide Smith    	29    	London        62000
2  3    Michael Rivera    	41        Cardiff    	40000
3  4          Grace Kim    	33        Hull        	35000
4  5     Tyler Johnson    	28        Kent        52000
Go to Main Menu