Kuidas laadida faile Pythonisse pandas read_csv() abil
Python pandas read_csv() on üks levinumaid meetodeid CSV-failide lugemiseks pandasse ja nende salvestamiseks DataFramesina. CSV-failid (komadega eraldatud väärtused) on laialt kasutatav formaat tabelite andmete salvestamiseks ja neid toetavad paljud rakendused.
Mis on Python pandas read_csv() süntaks?
pandas.read_csv() loob CSV-failist pandas DataFrame’i. Funktsiooni põhiline süntaks on järgmine:
import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)pythonMillised on pandas.read_csv() jaoks kõige olulisemad parameetrid?
pandas.read_csv() võib vastu võtta mitmesuguseid parameetreid. Lihtsuse huvides keskendume kõige olulisematele argumentidele. Siin on ülevaade peamistest parameetritest, mida saab kasutada funktsiooni käitumise määramiseks:
| Parameeter | Tähendus | Vaikimisi väärtus |
|---|---|---|
filepath_or_buffer
|
See on Python-string, mis esindab CSV-faili või andmepuhvri teekonda, näiteks URL-i. | |
sep
|
See määrab väärtuste vahelise eraldaja. | ,
|
header
|
Märgib, millist rida kasutada pealkirjana. | infer (esimene rida)
|
names
|
Kui header=None on seatud, saate names abil anda veergude nimede Python-nimekirja.
|
|
index_col
|
Määrab, millist veergu kasutada indeksina. | None
|
usecols
|
Selle parameetriga saate valida, millised veerud soovite DataFrame’i laadida. | None
|
dtype
|
Määrab veergude andmetüübi. | None
|
Selle funktsiooni parameetrite täieliku loetelu leiate pandas dokumentatsioonist.
Kuidas pääseda CSV-failidele juurde samm-sammult
pandas.read_csv() abil saate vaid mõne sammuga CSV-failidest andmeid Pythonisse üle kanda.
Järgmistes näidetes töötame CSV-failiga, mille struktuur on järgmine:
1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,52000Samm 1: Importi pandad
Esiteks, importige pandas-teek Python-skripti.
import pandas as pdpython2. samm: Lae CSV-fail
Nüüd saate oma CSV-faili laadida Python pandasse, kasutades funktsiooni read_csv(). Lihtsalt edastage failitee funktsioonile. Järgmises koodis kasutame faili nimega data.csv, mis on salvestatud samasse kataloogi kui skript:
df = pd.read_csv('data.csv')pythonEespool olev kood salvestab faili DataFrame-objekti (df), millega saame seejärel töötada. Pandas tõlgendab esimest rida automaatselt veeru pealkirjana, kui te ei määra teisiti.
3. samm: CSV-faili kuvamine
On hea mõte vaadata DataFrame’i esimesed read, et veenduda, et fail on õigesti laaditud. Selleks võite kasutada funktsiooni DataFrame.head(). Vaikimisi näitab see DataFrame’i esimesed viis rida, andes teile kiire ülevaate andmete struktuurist:
print(df.head())pythonVäljund näeb välja järgmine:
0 1 John Avery 35 Nottingham 50000
1 2 Adelaide Smith 29 London 62000
2 3 Michael Rivera 41 Cardiff 40000
3 4 Grace Kim 33 Hull 35000
4 5 Tyler Johnson 28 Kent 520004. samm: Muuda veergude nimesid (valikuline)
Kui CSV-failis pole pealkirjaread, saate veergude nimed käsitsi määratleda:
df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])pythonSelles näites oleme veergudele andnud nimed ID, Nimi, Vanus, Linn ja Palk. Väljund näeb välja järgmine:
ID Name Age City Salary
0 1 John Avery 35 Nottingham 50000
1 2 Adelaide Smith 29 London 62000
2 3 Michael Rivera 41 Cardiff 40000
3 4 Grace Kim 33 Hull 35000
4 5 Tyler Johnson 28 Kent 52000