Kā ielādēt failus Python ar pandas read_csv()
Python pandas read_csv() ir viena no visbiežāk izmantotajām metodēm, lai lasītu CSV failus pandas un saglabātu tos kā DataFrames. CSV faili (ar komatu atdalītas vērtības) ir plaši izmantots formāts tabulu datu saglabāšanai, un tos atbalsta daudzas lietojumprogrammas.
Kāda ir Python pandas read_csv() sintakse?
pandas.read_csv() izveido pandas DataFrame no CSV faila. Funkcijas pamata sintakse izskatās šādi:
import pandas as pd
df = pd.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None, ...)pythonKādi ir svarīgākie parametri pandas.read_csv()?
pandas.read_csv() var pieņemt dažādus parametrus. Lai vienkāršotu lietas, mēs koncentrēsimies uz vissvarīgākajiem argumentiem. Šeit ir pārskats par galvenajiem parametriem, kurus var izmantot, lai noteiktu, kā funkcija jādarbojas:
| Parametrs | Nozīme | Noklusējuma vērtība |
|---|---|---|
filepath_or_buffer
|
Šī ir Python virkne, kas attēlo ceļu uz CSV failu vai datu buferi, piemēram, URL. | |
sep
|
Tas norāda atdalītāju starp vērtībām. | ,
|
header
|
Norāda, kura rinda jāizmanto kā galvenā. | infer (pirmā rinda)
|
names
|
Ja ir iestatīts header=None, varat izmantot names, lai norādītu Python sarakstu ar kolonnu nosaukumiem.
|
|
index_col
|
Nosaka, kuru kolonnu izmantot kā indeksu. | None
|
usecols
|
Šis parametrs ļauj izvēlēties, kuras kolonnas vēlaties ielādēt DataFrame. | None
|
dtype
|
Norāda kolonnu datu tipu. | None
|
Šīs funkcijas parametru pilnu sarakstu varat atrast pandas dokumentācijā.
Kā piekļūt CSV failiem soli pa solim
Izmantojot pandas.read_csv(), jūs varat viegli pārnest datus no CSV failiem uz Python tikai dažos soļos.
Turpmākajos piemēros mēs strādāsim ar CSV failu, kura struktūra ir šāda:
1,John Avery,35,Nottingham,50000
2,Adelaide Smith,29,London,62000
3,Michael Rivera,41,Cardiff,40000
4,Grace Kim,33,Hull,35000
5,Tyler Johnson,28,Kent,520001. solis: Importējiet pandas
Vispirms importējiet pandas bibliotēku savā Python skriptā.
import pandas as pdpython2. solis: Ielādējiet CSV failu
Tagad varat ielādēt CSV failu Python pandas, izmantojot read_csv() funkciju. Vienkārši nododiet faila ceļu funkcijai. Turpmākajā kodā izmantosim failu ar nosaukumu data.csv, kas ir saglabāts tajā pašā direktorijā, kurā atrodas skripts:
df = pd.read_csv('data.csv')pythonIepriekš minētais kods saglabā failu DataFrame objektā (df), ar kuru mēs pēc tam varēsim strādāt. Pandas automātiski interpretēs pirmo rindu kā kolonnas virsrakstus, ja vien jūs neesat norādījis citādi.
3. solis: CSV faila parādīšana
Ieteicams apskatīt pirmās DataFrame rindas, lai pārliecinātos, ka fails ir ielādēts pareizi. Tam var izmantot funkciju DataFrame.head(). Pēc noklusējuma tā parāda pirmās piecas DataFrame rindas, sniedzot ātru pārskatu par datu struktūru:
print(df.head())pythonRezultāts izskatās šādi:
0 1 John Avery 35 Nottingham 50000
1 2 Adelaide Smith 29 London 62000
2 3 Michael Rivera 41 Cardiff 40000
3 4 Grace Kim 33 Hull 35000
4 5 Tyler Johnson 28 Kent 520004. solis: Mainiet kolonnu nosaukumus (pēc izvēles)
Ja CSV failā nav galvenes rindas, varat kolonnas nosaukumus definēt manuāli:
df = pd.read_csv('data.csv', header=None, names=['ID', 'Name', 'Age', 'City', 'Salary'])pythonŠajā piemērā mēs esam nosaukuši kolonnas ID, Vārds, Vecums, Pilsēta un Alga. Rezultāts izskatās šādi:
ID Name Age City Salary
0 1 John Avery 35 Nottingham 50000
1 2 Adelaide Smith 29 London 62000
2 3 Michael Rivera 41 Cardiff 40000
3 4 Grace Kim 33 Hull 35000
4 5 Tyler Johnson 28 Kent 52000