Pandas Reindex

Pandas Reindex



'I 'pandaer' kan vi gemme en masse information i tabelform, som også er kendt som DataFrame. 'Pandaerne' letter os med 'DataFrame()'-metoden til at konstruere DataFrame. DataFrame indeholder indekser, og vi kan også ændre indekserne for DataFrame ved at bruge 'pandas' funktionerne. Metoden, som vi bruger til at genindeksere DataFrame, er metoden 'reindex()'. Denne metode hjælper med at ændre rækkens indeksværdier såvel som indeksværdierne for kolonnerne. Ved at bruge denne metode kan vi ændre standardindekset for DataFrame, og vi kan også ændre det indeks, som vi indstillede, mens vi oprettede DataFrame. Vi vil bruge 'reindex()'-metoden i vores 'pandas'-eksempler i denne tutorial og vil forklare dette koncept i dybden her.'

Eksempel #01

'Spyder'-værktøjet hjælper os med at udvikle 'pandas'-koden her i denne tutorial, og vi starter vores kode med nøgleordet 'import', som vil hjælpe med at importere 'pandas'-funktionen. Vi placerer 'pandaer som pd' efter at have skrevet 'import'. Efter dette opretter vi DataFrame ved at skrive 'pd.DataFrame()'. Vi skriver denne 'pd' her, fordi 'DataFrame()' er metoden til 'pandaer'. 'value_df' er navnet på den variabel, som DataFrame er gemt i. Vi tilføjer 'RandomName', som er kolonnenavnet, og 'RandomName' indeholder 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander og Samuel'.







Så har vi 'Værdi_1', hvori vi har indsat '16, 29, 24, 35, 44, 50, 69, 74 og 88'. Så kommer 'Værdi_2', og vi har tilføjet '25, 38, 42, 56, 54, 65, 78, 89 og 99'. Nu kommer 'Værdi_3' næste gang, og vi placerer '36, 48, 52, 69, 74, 75, 87, 91 og 69' i den. Kolonnen 'Value_4' er til stede efter dette, hvor vi har indsat '52, 64, 72, 88, 82, 95, 97, 21 og 39'. Den sidste kolonne er kolonnen 'Værdi_5' her, og i denne kolonne er de værdier, vi har tilføjet, '66, 78, 82, 99, 34, 45, 57, 61 og 89'. Efter dette bruger vi 'print()'-funktionen, hvor 'Values_df' er tilføjet så. Den udskrives på terminalen.




Efter at have trykket på 'Shift+Enter', kan vi nemt få resultatet af vores koder i 'Spyder'-appen. Her returnerer denne kode DataFrame med standardindekset. Nu vil vi anvende 'reindex()'-metoden til at genindeksere denne DataFrame i 'pandas'.




Funktionen 'reindex()' bruges her til at genindeksere rækkens indeksværdi. I ovenstående DataFrame kan du se, at standardindeksværdierne for rækken vises, og nu anvender vi metoden 'reindex()' til at genindeksere disse rækkeindekser. Vi placerer DataFrames navn og derefter 'reindex()'-metoden, hvori vi placerer de indeksværdier, som vi ønsker at tilføje til ovenstående DataFrame. Vi sætter 'ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H og ind_I' i funktionen 'reindex()'. Så disse rækkers indekser vil blive opdateret på DataFrame, når vi udfører denne kode.






Værdierne for rækkens indeks vises i dette resultat, og du kan bemærke, at DataFrame-værdierne ikke vises her, og 'NaN'-værdierne er dukket op. Dette skyldes, at de nye indeksværdier ikke matcher de tidligere indeksværdier i DataFrame. Når det nye indeks og det gamle indeks ikke stemmer overens, viser det 'Nan' der. Disse 'NaN'-værdier vises som standard, når vi ændrer indekset, og det matcher ikke det forrige indeks.



Eksempel #02

Vi ændrer nu kolonneindeksværdierne for 'Value_df', som vi tidligere har oprettet i eksempel 1. Efter at have udskrevet 'Value_df', sætter vi 'column'-variablen og tilføjede nogle værdier til den. Vi tilføjer 'a_1, b_1, c_1, d_1 og e_1'. Nu vil vi justere disse værdier som indekset for kolonnerne, så til dette bruger vi metoden 'reindex()' og placerer navnet på variablen 'kolonne', hvori de nye kolonneindeksværdier er gemt og sæt også 'aksen' til 'kolonner', så den opdaterer kolonneakseindekset. Vi sætter 'reindex()'-metoden i 'print()', så den også gengives på terminalen.


Da vi har brugt 'reindex()'-metoden, opdateres kolonneindeksværdierne, som er til stede i den første DataFrame, og nye værdier tilføjes i den opdaterede DataFrame. Du kan også bemærke, at alle værdier i DataFrame konverteres til 'NaN', fordi begge indeksværdier for kolonner er forskellige.

Eksempel #03

'Programmeringsdata' i denne kode indeholder 'P_Languages', hvor vi har tilføjet 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java og JavaScript'. Derefter har vi 'timer', hvor vi placerer '4_timer, 2_timer, 3_timer, 7_timer, 6_timer, 5_timer, 8_timer og 6_timer'. Herefter indtastes 'P_Code', og vi indsætter '11523, 12423, 12321, 11456, 11454, 12267, 13106 og 14123'. Vi tilføjer 'p_index' variablen og sætter 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G og Pro_H'.

Disse værdier vil blive brugt som indeksværdier for rækkerne. Vi ændrer 'Programming_data' i 'Programming_df' DataFrame. Vi tilføjer også 'p_index' til denne DataFrame ved at bruge 'indeks' metoden. Vi sætter 'Programming_df' og derefter 'indeks'-metoden og tildeler 'p_index' til dette. Nu tilføjes ovenstående indeksværdier som rækkeindeksværdierne til DataFrame. Vi udskriver også 'Programmering_df'.

Herefter tilføjer vi nogle nye indeksværdier i variablen 'new_index', og disse er 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 og P_8'. Da vi ønsker at opdatere indeksværdierne for rækker, bruger vi 'reindex()'-metoden og sætter 'new_index' som parameter for denne funktion og gemmer også den opdaterede DataFrame i 'newProgramming_df' og placerer 'newProgramming_df' i ' print()' til visning.


Indeksværdierne er opdateret, og vi kan også sige, at vi har reindekseret den DataFrame, som vi har oprettet. Alle værdier af DataFrame konverteres også til 'NaN', fordi begge indeksværdier er forskellige.

Eksempel #04

Vi er i øjeblikket ved at ændre 'Programming_df's' indeksværdierne for kolonner, som vi tidligere har udviklet i eksempel 3. Vi placerer 'column'-variablen og indsætter nye værdier i den. 'P_Code, P_Languages, Hours, and New' tilføjes til 'column'-variablen. Derefter bruger vi igen 'reindex()'-metoden, hvor vi indstiller 'column'-variablen, som vil opdatere de tidligere kolonneindeksværdier og tilføje disse nye kolonneindeksværdier til DataFrame.

Her kan du bemærke, at de nye værdier, som vi har tilføjet i 'kolonne', er de samme, som vi har tilføjet i ovenstående DataFrame, men rækkefølgen er anderledes, så den vil ændre rækkefølgen af ​​kolonnerne og justere alle kolonner, efterhånden som vi nævnt i 'kolonne'-variablen. Vi tilføjer også endnu en indeksværdi, som ikke er til stede i ovenstående DataFrame, som er 'Ny' her, så 'NaN'-værdierne vises i denne kolonne.


Rækkefølgen af ​​kolonnerne ændres her, og alle værdier vises, som de er til stede i den originale DataFrames kolonner, og kolonnen 'Ny' i den opdaterede DataFrame indeholder alle 'NaN'-værdier, fordi denne kolonne ikke er til stede i den originale DataFrame.

Konklusion

Vi har præsenteret denne tutorial, som hjælper os med at forstå 'pandas reindex'-begrebet i detaljer. Vi har diskuteret, hvordan vi kan genindeksere en DataFrames kolonne samt rækkens indeksværdier. Vi har forklaret, at 'reindex()'-funktionen af ​​'pandaer' bruges til at gøre dette. Vi har lavet forskellige eksempler, hvor vi har ændret indeksværdierne for rækkerne i DataFrame og også indeksværdierne for kolonneindekset i DataFrame. Vi har gengivet resultaterne af alle de koder, som vi har lavet her i denne tutorial og også forklaret dem i dybden.