Python pandas read_csv() je ena naj­po­go­ste­je upo­ra­blja­nih metod za branje CSV datotek v pandas in njihovo shra­nje­va­nje kot Da­ta­Fra­mes. CSV datoteke (vrednosti, ločene z vejico) so široko upo­ra­blja­na oblika za shra­nje­va­nje ta­be­la­rič­nih podatkov in jih podpirajo številne apli­ka­ci­je.

Kakšna je sintaksa za Python pandas read_csv()?

pandas.read_csv() ustvari pandas DataFrame iz CSV datoteke. Osnovna sintaksa funkcije je naslednja:

import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)
python

Kateri so naj­po­memb­nej­ši parametri za pandas.read_csv()?

pandas.read_csv() lahko sprejme široko paleto pa­ra­me­trov. Da bi stvari po­e­no­sta­vi­li, se bomo osre­do­to­či­li na naj­po­memb­nej­še argumente. Tukaj je pregled ključnih pa­ra­me­trov, ki jih lahko uporabite za določitev, kako naj se funkcija obnaša:

Parameter Pomen Privzeta vrednost
filepath_or_buffer To je niz v jeziku Python, ki pred­sta­vlja pot do datoteke CSV ali po­dat­kov­ne­ga po­mnil­ni­ka, na primer URL.
sep To določa ločilo med vre­dnost­mi. ,
header Označuje, katero vrstico uporabiti kot glavo. infer (prva vrstica)
names Če je na­sta­vlje­no header=None, lahko uporabite names za za­go­to­vi­tev seznama imen stolpcev v Pythonu.
index_col Določa, kateri stolpec se uporabi kot indeks. None
usecols Ta parameter vam omogoča, da izberete stolpce, ki jih želite naložiti v DataFrame. None
dtype Določa vrsto podatkov stolpcev. None

Celoten seznam pa­ra­me­trov za to funkcijo najdete v do­ku­men­ta­ci­ji pandas.

Kako dostopati do CSV datotek korak za korakom

Z uporabo pandas.read_csv() lahko v nekaj korakih enostavno prenesete podatke iz CSV datotek v Python.

V na­sle­dnjih primerih bomo delali s CSV datoteko, ki je struk­tu­ri­ra­na takole:

1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000

Korak 1: Uvoz pandas

Najprej uvozite knjižnico pandas v svoj Python skript.

import pandas as pd
python

Korak 2: Naložite CSV datoteko

Sedaj lahko CSV datoteko naložite v Python pandas s pomočjo funkcije read_csv(). Preprosto prenesite pot do datoteke v funkcijo. V na­sle­dnjem kodeksu bomo uporabili datoteko z imenom data.csv, ki je shranjena v istem imeniku kot skript:

df = pd.read_csv('data.csv')
python

Zgornja koda shrani datoteko v objekt DataFrame (df), s katerim bomo lahko nato delali. Pandas bo prvo vrstico samodejno razlagal kot naslove stolpcev, če ne določite drugače.

Korak 3: Prikaži CSV datoteko

Pri­po­ro­člji­vo je, da si ogledate prvih nekaj vrstic DataFrame, da se pre­pri­ča­te, da je bila datoteka pravilno naložena. Za to lahko uporabite funkcijo DataFrame.head(). Privzeto prikaže prvih pet vrstic DataFrame, kar vam omogoča hiter pregled strukture podatkov:

print(df.head())
python

Izhod je videti takole:

0  1        John Avery   35      Nottingham  	50000
1  2    Adelaide Smith   29   	 London 	    62000
2  3   Michael Rivera    41      Cardiff	   	40000
3  4        Grace Kim    33      Hull 		    35000
4  5    Tyler Johnson    28      Kent   		52000

Korak 4: Spre­me­ni­te imena stolpcev (neobvezno)

Če vaša CSV datoteka nima vrstice z glavo, lahko imena stolpcev določite ročno:

df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])
python

V tem primeru smo stolpce po­i­me­no­va­li ID, Ime, Starost, Mesto in Plača. Izhod je videti takole:

ID                Name    	Age            City    	Salary
0  1          John Avery    	35        Nottingham    50000
1  2     Adelaide Smith    	29    	London        62000
2  3    Michael Rivera    	41        Cardiff    	40000
3  4          Grace Kim    	33        Hull        	35000
4  5     Tyler Johnson    	28        Kent        52000
Go to Main Menu