Python pandas read_csv() ir viena no visbiežāk iz­man­to­ta­jām metodēm, lai lasītu CSV failus pandas un saglabātu tos kā Da­taF­ra­mes. CSV faili (ar komatu atdalītas vērtības) ir plaši izmantots formāts tabulu datu sa­gla­bā­ša­nai, un tos atbalsta daudzas lie­to­jum­prog­ram­mas.

Kāda ir Python pandas read_csv() sintakse?

pandas.read_csv() izveido pandas DataFrame no CSV faila. Funkcijas pamata sintakse izskatās šādi:

import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)
python

Kādi ir sva­rī­gā­kie parametri pandas.read_csv()?

pandas.read_csv() var pieņemt dažādus pa­ra­met­rus. Lai vien­kār­šo­tu lietas, mēs kon­cen­trē­si­mies uz vis­sva­rī­gā­ka­jiem ar­gu­men­tiem. Šeit ir pārskats par gal­ve­na­jiem pa­ra­met­riem, kurus var izmantot, lai noteiktu, kā funkcija jā­dar­bo­jas:

Parametrs Nozīme No­klu­sē­ju­ma vērtība
filepath_or_buffer Šī ir Python virkne, kas attēlo ceļu uz CSV failu vai datu buferi, piemēram, URL.
sep Tas norāda at­da­lī­tā­ju starp vērtībām. ,
header Norāda, kura rinda jāizmanto kā galvenā. infer (pirmā rinda)
names Ja ir iestatīts header=None, varat izmantot names, lai norādītu Python sarakstu ar kolonnu no­sau­ku­miem.
index_col Nosaka, kuru kolonnu izmantot kā indeksu. None
usecols Šis parametrs ļauj iz­vē­lē­ties, kuras kolonnas vēlaties ielādēt DataFrame. None
dtype Norāda kolonnu datu tipu. None

Šīs funkcijas parametru pilnu sarakstu varat atrast pandas do­ku­men­tā­ci­jā.

Kā piekļūt CSV failiem soli pa solim

Iz­man­to­jot pandas.read_csv(), jūs varat viegli pārnest datus no CSV failiem uz Python tikai dažos soļos.

Turp­mā­ka­jos piemēros mēs strādāsim ar CSV failu, kura struktūra ir šāda:

1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000

1. solis: Im­por­tē­jiet pandas

Vispirms im­por­tē­jiet pandas bib­lio­tē­ku savā Python skriptā.

import pandas as pd
python

2. solis: Ie­lā­dē­jiet CSV failu

Tagad varat ielādēt CSV failu Python pandas, iz­man­to­jot read_csv() funkciju. Vienkārši nododiet faila ceļu funkcijai. Turp­mā­ka­jā kodā iz­man­to­sim failu ar nosaukumu data.csv, kas ir saglabāts tajā pašā di­rek­to­ri­jā, kurā atrodas skripts:

df = pd.read_csv('data.csv')
python

Iepriekš minētais kods saglabā failu DataFrame objektā (df), ar kuru mēs pēc tam varēsim strādāt. Pandas au­to­mā­tis­ki in­ter­pre­tēs pirmo rindu kā kolonnas vir­srak­stus, ja vien jūs neesat norādījis citādi.

3. solis: CSV faila pa­rā­dī­ša­na

Ieteicams apskatīt pirmās DataFrame rindas, lai pār­lie­ci­nā­tos, ka fails ir ielādēts pareizi. Tam var izmantot funkciju DataFrame.head(). Pēc no­klu­sē­ju­ma tā parāda pirmās piecas DataFrame rindas, sniedzot ātru pārskatu par datu struktūru:

print(df.head())
python

Rezultāts izskatās šādi:

0  1        John Avery   35      Nottingham  	50000
1  2    Adelaide Smith   29   	 London 	    62000
2  3   Michael Rivera    41      Cardiff	   	40000
3  4        Grace Kim    33      Hull 		    35000
4  5    Tyler Johnson    28      Kent   		52000

4. solis: Mainiet kolonnu no­sau­ku­mus (pēc izvēles)

Ja CSV failā nav galvenes rindas, varat kolonnas no­sau­ku­mus definēt manuāli:

df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])
python

Šajā piemērā mēs esam nosaukuši kolonnas ID, Vārds, Vecums, Pilsēta un Alga. Rezultāts izskatās šādi:

ID                Name    	Age            City    	Salary
0  1          John Avery    	35        Nottingham    50000
1  2     Adelaide Smith    	29    	London        62000
2  3    Michael Rivera    	41        Cardiff    	40000
3  4          Grace Kim    	33        Hull        	35000
4  5     Tyler Johnson    	28        Kent        52000
Go to Main Menu