Sådan læses excel (xlsx) fil i python

How Read Excel File Python



Det .xlsx er udvidelsen af ​​excel -dokumentet, der kan gemme en stor mængde data i tabelform, og mange typer af aritmetisk og logisk beregning kan let udføres i et excel -regneark. Nogle gange er det påkrævet at læse dataene fra excel -dokumentet ved hjælp af Python -script til programmeringsformål. Der findes mange moduler i Python for at læse excel -dokumentet. Nogle af de nyttige moduler er xlrd , openpyxl , og pandaer . Måden at bruge disse moduler til at læse excel -filen i Python er blevet vist i denne vejledning.

Forudsætning:

En dummy excel -fil med .xlsx -udvidelsen er påkrævet for at kontrollere eksemplerne på denne vejledning. Du kan bruge en eksisterende excel -fil eller oprette en ny. Her er en ny excel -fil navngivet salg.xlsx fil er blevet oprettet med følgende data. Denne fil har brugt til læsning ved hjælp af forskellige python -moduler i den næste del af denne vejledning.







salg.xlsx



Salgsdato Sælger Beløb
05/12/18 Sila Ahmed 60000
12/06/19 Mig Hossain 50.000
08/09/20 Sarmin Jahan 45000
04/07/21 Mahmudul Hasan 30000

Eksempel-1: Læs excel-fil ved hjælp af xlrd

Xlrd -modulet er som standard ikke installeret med Python. Så du skal installere modulet, før du bruger det. Den nyeste version af dette modul understøtter ikke excel -filen med .xlsx -udvidelsen. Så du skal installere 1.2.0 -versionen af ​​dette modul for at læse xlsx -filen. Kør følgende kommando fra terminalen for at installere den nødvendige version af xlrd .



$pipinstallere xlrd== 1.2.0

Efter afslutning af installationsprocessen skal du oprette en python -fil med følgende script for at læse salg.xlsx fil ved hjælp af den xlrd modul. open_workbook () funktion bruges i scriptet, åbn xlsx -filen til læsning. Denne excel -fil indeholder kun et ark. Så workbook.sheet_by_index () funktion er blevet brugt i scriptet med argumentværdien 0. Dernæst den indlejrede 'til' loop har brugt til at læse celleværdierne i regnearket ved hjælp af række- og kolonneværdierne. To funktioner () er blevet brugt i scriptet til at definere række- og kolonnestørrelsen baseret på arkdataene. Det celleværdi () funktion har brugt til at aflæse arkets særlige celleværdi i hver iteration af sløjfen. Hvert felt i output vil blive adskilt af et tabulatorrum.





# Importer xlrd -modulet
importer xlrd

# Åbn projektmappen
projektmappe = xlrd.open_workbook('salg.xlsx')

# Åbn regnearket
regneark = arbejdsbog.ark_ ved_indeks(0)

# Iterér rækker og kolonner
tiljegirækkevidde(0,5):
tiljirækkevidde(0,3):
# Udskriv celleværdierne med faneblad
Print(regneark.cell_værdi(jeg, j),ende='t')
Print('')

Produktion:

Følgende output vises efter udførelse af ovenstående script.



Eksempel-2: Læs excel-fil ved hjælp af openpyxl

Det openpyxl er et andet python -modul til at læse xlsx -filen, og den er heller ikke installeret med Python som standard. Kør følgende kommando fra terminalen for at installere dette modul, før du bruger det.

$pipinstallereopenpyxl

Efter afslutning af installationsprocessen skal du oprette en python -fil med følgende script for at læse salg.xlsx fil. Ligesom xlrd -modulet, openpyxl modulet har load_workbook () funktion til at åbne xlsx -filen til læsning. Det salg.xlsx filen bruges som argumentværdi for denne funktion. Formålet med wookbook.active er blevet oprettet i scriptet for at læse værdierne for max_row og max_kolonne ejendomme. Disse egenskaber er blevet brugt i den indlejrede til sløjfer til at læse indholdet af salg.xlsx fil. Funktionen område () er blevet brugt til at læse arkets rækker, og funktionen iter_cols () er blevet brugt til at læse arkets kolonner. Hvert felt i output vil blive adskilt af to tabulatorrum.

# Importer openyxl -modul
import openpyxl

# Definer variabel for at indlæse wookbook
wookbook = openpyxl.load_workbook('salg.xlsx')

# Definer variabel for at læse det aktive ark:
regneark = wookbook.active

# Iterér sløjfen for at læse celleværdierne
tiljegirækkevidde(0, regneark.max_row):
til med iregneark.iter_cols(1, regneark.max_kolonne):
Print(med[jeg].værdi,ende=' t t')
Print('')

Produktion:

Følgende output vises efter udførelse af ovenstående script.

Eksempel-3: Læs excel-fil ved hjælp af pandaer

Panda-modulet er ikke installeret med python-lignende det forrige modul. Så hvis du ikke har installeret det før, skal du installere det. Kør følgende kommando for at installere pandaer fra terminalen.

$pipinstallerepandaer

Efter afslutning af installationsprocessen skal du oprette en python -fil med følgende script for at læse salg.xlsx fil. Det read_excel () pandas funktion bruges til at læse xlsx -filen. Denne funktion har brugt i scriptet til at læse salg.xlsx fil. Det DataFrame () funktion har brugt her til at læse indholdet af xlsx -filen i datarammen og gemme værdierne i den navngivne variabel data . Værdien af ​​dataene er blevet udskrevet senere.

# Importer pandaer
import pandaersompd

# Indlæs xlsx -filen
excel_data = pd.read_excel('salg.xlsx')
# Læs værdierne for filen i dataramen
data = pd.DataFrame(excel_data,kolonner=['Salgsdato','Sælger','Beløb'])
# Udskriv indholdet
Print('Filens indhold er: n', data)

Produktion:

Følgende output vises efter udførelse af ovenstående script. Outputtet af dette script er forskelligt fra de to foregående eksempler. Rækketallene udskrives i den første kolonne, hvor rækkeværdien har talt fra 0. Datoværdierne er justeret centralt. Navnene på sælgerne er justeret rigtigt. Beløbet er justeret til venstre.

Konklusion:

Python -brugerne skal arbejde med xlsx -filer til forskellige programmeringsformål. Tre forskellige måder at læse xlsx -filen er blevet vist i denne vejledning ved hjælp af tre python -moduler. Hvert modul har forskellige funktioner og egenskaber til at læse xlsx -filen. Denne vejledning hjælper python -brugere med at læse xlsx -filen let ved hjælp af python -scriptet efter at have læst denne vejledning.