Python pandas read_csv() er en af de mest anvendte metoder til at læse CSV-filer ind i pandas og gemme dem som Da­ta­F­ra­mes. CSV-filer (kom­ma­se­pa­re­re­de værdier) er et udbredt format til lagring af ta­bel­for­me­de data og un­der­støt­tes af mange ap­pli­ka­tio­ner.

Hvad er syntaksen for Python pandas read_csv()?

pandas.read_csv() opretter en pandas DataFrame fra en CSV-fil. Den grund­læg­gen­de syntaks for funk­tio­nen ser således ud:

import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)
python

Hvad er de vigtigste parametre for pandas.read_csv()?

pandas.read_csv() kan acceptere en lang række parametre. For at gøre det enkelt vil vi fokusere på de vigtigste ar­gu­men­ter. Her er en oversigt over de vigtigste parametre, du kan bruge til at angive, hvordan funk­tio­nen skal fungere:

Parameter Betydning Stan­dard­vær­di
filepath_or_buffer Dette er en Python-streng, der re­præ­sen­te­rer stien til CSV-filen eller en da­ta­buf­fer, f.eks. en URL.
sep Dette angiver af­græn­se­ren mellem værdier. ,
header Angiver, hvilken række der skal bruges som over­skrift. infer (første række)
names Hvis header=None er indstil­let, kan du bruge names til at angive en Python-liste over ko­lon­ne­nav­ne.
index_col Bestemmer, hvilken kolonne der skal bruges som indeks. None
usecols Denne parameter giver dig mulighed for at vælge, hvilke kolonner du vil indlæse i DataFrame. None
dtype Angiver datatypen for ko­lon­ner­ne. None

Du kan finde en om­fat­ten­de liste over pa­ra­me­tre­ne for denne funktion i pandas-do­ku­men­ta­tio­nen.

Sådan får du adgang til CSV-filer trin for trin

Med pandas.read_csv() kan du nemt overføre data fra CSV-filer til Python i blot få trin.

I de følgende eksempler arbejder vi med en CSV-fil, der er struk­tu­re­ret som følger:

1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000

Trin 1: Importer pandas

Først skal du importere pandas-bi­bli­o­te­ket til dit Python-script.

import pandas as pd
python

Trin 2: Indlæs CSV-filen

Nu kan du indlæse din CSV-fil til Python pandas ved hjælp af funk­tio­nen read_csv(). Du skal blot overføre filstien til funk­tio­nen. I den følgende kode bruger vi en fil ved navn data.csv, som er gemt i samme mappe som scriptet:

df = pd.read_csv('data.csv')
python

Oven­stå­en­de kode gemmer filen i et DataFrame-objekt (df), som vi derefter kan arbejde med. Pandas fortolker au­to­ma­tisk den første række som ko­lon­ne­over­skrif­ter, medmindre du angiver andet.

Trin 3: Vis CSV-filen

Det er en god idé at kigge på de første par rækker i DataFrame for at sikre, at filen er indlæst korrekt. Du kan bruge funk­tio­nen DataFrame.head() til dette. Som standard viser den de første fem rækker i DataFrame, hvilket giver dig et hurtigt overblik over da­ta­struk­tu­ren:

print(df.head())
python

Re­sul­ta­tet ser således ud:

0  1        John Avery   35      Nottingham  	50000
1  2    Adelaide Smith   29   	 London 	    62000
2  3   Michael Rivera    41      Cardiff	   	40000
3  4        Grace Kim    33      Hull 		    35000
4  5    Tyler Johnson    28      Kent   		52000

Trin 4: Skift ko­lon­ne­nav­ne­ne (valgfrit)

Hvis din CSV-fil ikke har en over­skrifts­ræk­ke, kan du definere ko­lon­ne­nav­ne­ne manuelt:

df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])
python

I dette eksempel har vi navngivet ko­lon­ner­ne ID, Navn, Alder, By og Løn. Re­sul­ta­tet ser således ud:

ID                Name    	Age            City    	Salary
0  1          John Avery    	35        Nottingham    50000
1  2     Adelaide Smith    	29    	London        62000
2  3    Michael Rivera    	41        Cardiff    	40000
3  4          Grace Kim    	33        Hull        	35000
4  5     Tyler Johnson    	28        Kent        52000
Gå til ho­ved­me­nu­en