Pandas DataFrame til JSON

Pandas Dataframe Til Json



'Pandaerne' giver mulighed for datamanipulation såvel som dataanalyse. I den moderne verden er dataanalyse et enormt værdifuldt værktøj. For at fuldføre denne opgave er en række datastrukturer tilgængelige inden for datalogi. I 'pandaer' har vi DataFrame, som også er konverteret til 'JSON'. Vi kan forklare 'JSON', da det er en tekst, der bruger JavaScript Object-notationer. Dataoverførslen mellem servere og webapps bruger 'JSON'. I denne vejledning vil vi undersøge JSON-formatkonverteringen af ​​DataFrames. Til denne konvertering fra DataFrame til 'Json', giver 'pandas' metoden 'to_json()'. Når vi skal konvertere DataFrame til 'JSON'-formatet, bruger vi 'to_json()'-metoden for 'pandas'. For bedre at forstå, hvordan man bruger funktionen af ​​'pandas', som er 'to_json', lad os se på et par koder for 'pandas' her i denne vejledning.'

Eksempel #01
Vi vil i praksis demonstrere, hvordan man bruger 'to_json()'-metoden for 'pandas' til at ændre 'pandas' DataFrame til JSON-formatet. 'Pandas'-pakken importeres her, som er 'numpy', og vi importerer den som 'np'. Nu, for at udføre 'pandas'-koden, skal pandaens pakker importeres. For at importere den pakke bruger vi nøgleordet 'import'. Derefter indstiller vi 'pandas som pd', hvilket betyder, at vi nemt kan få adgang til eller bruge enhver 'pandas-pakke', som vi har brug for, ved blot at placere 'pd'en' der.

Vi opretter numpy-arrayet her ved at bruge 'np. array', hjælper denne 'np' os med at få adgang til de numpy-biblioteksfunktioner. Dette numpy-array er også gemt i 'New_data'-variablen, og vi sætter 'A, B, C, D' og 'E, F, G, H' til dette numpy-array. Dette numpy-array er nu konverteret til DataFrame ved at bruge 'pd.DataFrame'-metoden. Dette er 'pandas'-metoden, som vi får adgang til her ved at placere 'pd'. Når vi konverterer dette numpy-array til DataFrame, så sætter vi også kolonnenavnene.







De navne, vi tilføjer her som kolonneoverskrifter, er 'col1, col2, col3 og col4'. Så ser du, at vi har 'printet' nedenfor, hvor vi angiver navnet på DataFrame, som i dette tilfælde er 'New_dataFrame', så dette vil blive gengivet ved udførelsen af ​​denne kode. Nu konverterer vi denne DataFrame til JSON-formatet ved at bruge metoden 'to_json()'. Vi indstiller navnet på DataFrame 'New_dataFrame' med 'to_json()'-metoden og placerer også denne metode i 'New_json'-variablen. Her har vi ikke videregivet nogen parameter til denne 'to_json()'-metode. JSON-formatet af DataFrame er nu placeret i 'print', og det vil også gengives på konsollen.





For kompilering og eksekvering af denne kode, trykker vi 'Shift+Enter', og hvis koden er fejlfri, vil outputtet blive gengivet. Her indsætter vi også resultatet af denne kode, hvor vi har vist den DataFrame, som vi har oprettet i dette eksempel, og også JSON-formatet for den DataFrame.





Eksempel #02
Her importerer vi kun ét bibliotek, som er 'pandaerne', og derefter oprettes listen 'AtoZ_Courses', og vi placerer nogle lister i den, som er 'Python, 29000, 35 dage og 1000.0', så sætter vi ' JavaScript, 27000, 55 dage og 2300.0', derefter tilføjer vi 'HTMLCSS, 25000, 25 dage og 1500.0'. Nu har vi også indsat to data mere som 'DataBase, 24000, 45 dage og 1500.0' og 'OOP, 21000, 35 dage, 1500.0'. 'AtoZ_Courses'-listen er nu ændret i DataFrame, og vi kaldte den 'AtoZ_Courses_df'. 'Courses_Name, Payment, Duration og Bonus' tilføjes her som kolonnenavnene på DataFrame.



Nu genereres DataFrame i dette trin, og vi tilføjer det i 'print()'-sætningen for at vise det på terminalen. Nu, ved hjælp af 'to_json()'-metoden, transformerer vi 'AtoZ_Courses_df' DataFrame til JSON-formatet. Denne 'to_json()'-metode får også en parameter, som er 'orient= column', som også er standardparameteren. Det viser DataFrame som diktet som '{kolonnenavn -> {indeksværdi -> kolonneværdi}} format'.

Her, i JSON-formatet, viser den kolonnenavnet og sætter derefter alle værdier i den kolonne sammen med indeksværdien. Først nævner den navnet på den første kolonne, og derefter gengives alle værdier i den første kolonne sammen med indeksværdierne, og derefter sætter den anden kolonnenavn og også alle værdier i den anden kolonne med indekser og så videre.

Eksempel #03
DataFrame er genereret i denne kode med navnet 'Bachelors_df'. Vi har indsat fem kolonner til denne 'Bachelors_df'. Den første kolonne, vi har her, er kolonnen 'Student', og vi indsætter 'Lily, Smith, Bromley, Milli og Alexander' i den. Den næste kolonne er kolonnen 'Degree', som indeholder 'IT, BBA, engelsk, CS og DVM'. Så kommer 'året_af_tilslutning', hvor vi tilføjer elevernes tiltrædelsesår, som er '2015, 2018, 2017, 2015 og 2014'.

Kolonnen ved siden af ​​denne kolonne er 'year_of_graduation', som indeholder afgangsårene for disse studerende er '2019, 2022, 2021, 2019 og 2018'. Vi tilføjer også kolonnen 'CGPA' her, hvor vi placerer CGPA'erne for eleverne '3.3, 3.5, 3.6, 3.7 og 3.8'. For at vise 'Bachelors_df' på terminalen, inkluderer vi det i udtrykket 'print()'. Nu konverterer vi ' Bachelors_df ' DataFrame til JSON-formatet ved hjælp af 'to_json()' metoden.

Parameteren 'orient= records' overføres ligeledes til denne 'to_json()'-metode i denne kode. Denne 'orient= records' vil vise JSON-formatet som '[{kolonnenavn -> kolonneværdi}, ... , {kolonnenavn -> kolonneværdi}]'-form. DataFrames JSON-format er nu indstillet til 'print', og det vil også blive vist på terminalen.

DataFrame er simpelthen vist her i kolonner og rækker, men i JSON-formatet kan du bemærke, at den sætter navnet på kolonnen og derefter viser værdien af ​​den kolonne; efter at have vist værdien af ​​en kolonne, udskriver den navnet på den anden kolonne og sætter derefter værdien af ​​den kolonne og så videre, fordi vi indstiller 'to_josn'-metodens parameter som 'orient= records'.

Eksempel #04
Vi opretter et numpy array 'My_data', hvori vi indsætter '2, 4' og '6, 8'. Skift derefter numpy-arrayet til DataFrame 'My_dataFrame' og indstil dets kolonnenavne som 'A1 og A2'. Nu, efter at have vist DataFrame her ved at bruge 'print'. Vi bruger først 'to_json()'-metoden uden nogen parametre og viser den. Herefter indstiller vi 'to_json()'-metodens parameter til 'orient=split' og udskriver også dette format. Derefter anvender vi 'to_josn()' igen til 'My_dataFrame', og denne gang sender vi 'orient=records' som parameter for denne funktion.

Under dette sætter vi 'orient= index' med 'My_dataFrame' og gengiver dette JSON-format. Efter denne parameter bruger vi igen 'to_json' med parameteren 'orient = column' og gengiver den også. Derefter sender vi 'orient= værdier' som parameteren for 'to_json()'-metoden og anvender den på 'My_dataFrame'. Vi indstiller også parameteren for denne funktion til 'orient= table' og bruger den igen med den samme DataFrame og viser også dette JSON-format. Nu vil vi bemærke forskellen mellem formaterne af JSON i outputtet af denne kode.

Her kan du nemt finde forskellen mellem formaterne i JSON, som vi har anvendt på den samme DataFrame. Alle parametre, som vi har videregivet i 'to_json'-metoden, vises i forskellige formater her.

Konklusion

Denne guide viser JSON-formatet og har forklaret dette JSON-format i detaljer, og hvordan man konverterer pandas DataFrame til JSON. Vi har forklaret, at metoden 'to_json()' bruges til at konvertere pandas DataFrame til JSON-formatet. Vi har også diskuteret forskellige parametre, som vi har videregivet til 'to_json()' metoden her. Vi har leveret en komplet guide, hvori vi har brugt 'to_json()'-metoderne ved at sætte alle mulige parametre til denne 'to_json()'-metode i vores 'pandas'-kode og også vist dem i outputtet, hvordan disse parametre ændrer formatet af JSON.