Pandaer Indsæt() kolonne

Pandaer Indsaet Kolonne



'Python leverer en bred vifte af datastrukturer og operationer til håndtering af numeriske data og tidsseriedata. Den DataFrame, vi har oprettet eller importeret i Pandas, kan bruges til en række forskellige formål. Kolonnerne i datarammen kan også justeres sammen med datakilden. Pandaer gør mange af de kedelige, tidskrævende opgaver, der er forbundet med at arbejde med data, enkle. Der er fire måder at tilføje en kolonne til en DataFrame i Pandas, men i denne artikel bruger vi pandaens kolonne 'insert()' funktion.

Når vi har bygget eller indlæst vores dataFrame i Pandas, er der en række ting, vi kunne ønske os at opnå. For eksempel kan vi blive ved med at manipulere data, for eksempel ved at ændre kolonnerne i datarammen. Dernæst skal vi forstå, hvordan man inkluderer kolonner i en dataramme, hvis størstedelen af ​​dataene kommer fra én dataudbyder, men nogle data kommer fra en anden. En kolonne kan nemt tilføjes til en Pandas dataramme.'







Pandas insert() Metode

Den sidste kolonne i datarammen genereres af en anden funktion. Ved at bruge DataFrame 'insert()'-metoden kan du tilføje kolonner mellem aktuelle kolonner i stedet for at tilføje dem i bunden af ​​pandas DataFrame. Det giver os mulighed for at tilføje en kolonne hvor som helst, vi vælger, snarere end blot ved afslutningen. Derudover tilbyder det mange måder at tilføje værdierne for kolonnerne. Når du har brug for at tilføje en kolonne ved en specificeret position eller indeks, er pandaernes 'insert()'-funktion nyttig.



Syntaks for Pandas insert()-kolonnen



Eksempel 1: Indsættelse af kolonne i en dataramme ved hjælp af Pandas insert()-metoden

Begynd med artiklens første eksempel, hvor vi vil forklare, hvordan du indsætter en kolonne i en dataramme. Ved at bruge 'spyder'-værktøjet kan vi bevise denne kode. Først genererer vi en dataramme med navnet 'kursus'. Vi har to kolonner i denne dataramme, 'course_title' og 'fee'. I kolonnen 'course_title' har vi en liste over kurser 'python', 'java', 'object_oriented' og 'PHP'. I anden kolonne 'gebyr' har vi listen over kursusgebyrer, som er '30000', '25000', '15000' og '22000'. Visning af vores dataramme, 'kursus', ved at bruge 'pd. DataFrame”.





Dernæst vil vi diskutere kodens hovedfunktion, som er pandas 'insert() column'. Det er en effektiv metode at inkludere en ny liste i datarammen. Du kan tilføje den nye kolonne på et hvilket som helst angivet sted ved hjælp af indsæt-metoden. Denne metode giver også mulighed for manuel tilføjelse af en kolonne til en dataramme, men der er mindre tilpasningsevne.

Gennem hele indsættelsen betyder, at kilde-DataFrame opdateres direkte under processen, og der oprettes ingen ny DataFrame. I dette tilfælde har vi tilføjet en ny kolonne til vores dataramme med navnet 'Time_duration' ved at bruge funktionen 'insert()'. Listen over værdier, vi har i denne kolonne, er '6_months', '3_months', '3months' og '6_months'. Vi har en kolonne 'Time_duration' med et indeks defineret som '2' i programmet nedenfor. Siden det angivne indeks, vil DataFrame få et interval, der begynder ved 0 og stiger i trin, så det betyder, at denne kolonne vises som en tredje kolonne i datarammen. DataFrame tilføjer en ny kolonne med navnet 'Time _duration' ved at bruge funktionen 'pd.insert()'.



Og lad os nu diskutere programmets output fra oven. Dens output viser en dataramme, der har tre kolonner. Den ekstra kolonne tilføjes i slutningen af ​​datarammen. Ved at bruge 'pd.DataFrame.insert()'-metoden kan du tilføje en kolonne blandt andre kolonner i stedet for at tilføje dem i slutningen af ​​pandas DataFrame.'Time_ duration' er en ny kolonne, som vi tilføjede ved hjælp af 'inserting' fungere. Position '2' refererer til den tredje kolonne i DataFrame, da positionen starter ved 0. Kolonnen føjes til den sidste plads i datarammen.

Eksempel 2:  Tilføjelse af kolonner i en dataramme ved hjælp af Pandas insert() funktion

Vi vil bruge metoden 'insert()' til at tilføje nye kolonner til datarammen. I stedet for at tilføje yderligere kolonner i slutningen af ​​pandaerne, kan du indsætte dem mellem de eksisterende kolonner. For at generere en dataramme, der ligner det forrige eksempel, tog vi tre kolonner og tildelte dem værdier. I den første kolonne, 'Navn', har vi en liste over navne, som inkluderer 'Emma', 'Ella', 'Smith' og 'Maxwell'. I den anden kolonne 'Alder' listen over værdier har vi '29', '36', '39' og '33'.

Derefter udskriver vi en erklæring 'DataFrame'. Vi viser datarammen under 'dataframe'-sætningen. Vi opretter endnu en kolonne til Pandas-datarammen ved hjælp af funktionen 'insert()'. Der skal oprettes en liste, så den kan tilføjes som en ny kolonne til vores givne datasæt. 'Assign()'-metoden for pandas DataFrame kan også bruges til at tilføje flere kolonner. Vi indsætter en ny kolonne ved at bruge 'df. indsætte”. Den ekstra kolonne med navnet 'Køn' viser kønnet som enten 'Mand' eller 'Kvinde'.

Lad os bare udskrive en anden erklæring, 'New Dataframe'. En ny dataramme vil nu blive præsenteret under udsagnet 'New Dataframe', indeholdende den ekstra kolonne, som vi tilføjede med 'pd. insert()” funktion. Kolonnen med et lignende navn kan ikke tilføjes ved hjælp af funktionen 'insert()'. Hvis der allerede findes en kolonne i datarammen, vises en værdifejl som standard.

I dette output føjes den kolonne som vi lavede ved at bruge funktionen 'insert()' til datarammen. Dens output viser to datarammer; den første dataFrame blev oprettet ved hjælp af 'pd.data frame', hvori vi har to kolonner, 'Navn' og 'Alder'. Den nye kolonne 'køn', vi tilføjede ved hjælp af 'insert()'-funktionen er vist i den anden dataramme vist nedenfor. Denne dataramme viser, at der er tre kolonner med nogle data i dem. Indekset er '2' i størrelse, hvilket betyder, at det har indgange fra '0 til 3'. Den nye kolonne, som vi tildelte denne dataramme, har en indeksposition på '3'.

Konklusion

En almindeligt anvendt dataanalyse- og opdateringshandling er at tilføje kolonner til DataFrame. Pandas giver dig dog adskillige muligheder for at fuldføre opgaven ved at tilbyde fire forskellige metoder; dog bruger vi kun én teknik, som er panadas 'insert()'-kolonnen, i vores artikel. En af de sværeste dele af at udvide en DataFrame med nye kolonner er indeksering. Lad os hurtigt beskrive begge eksempler. Vi oprettede først en dataramme med titlen kursus og tilføjede kolonnerne 'kursus titel' og 'gebyr' og tildelte værdier til denne kolonne. Ved at bruge funktionen 'insert()' tilføjer vi en ny kolonne til den samme dataramme, der angiver dens position som '2' i indekset. I det andet eksempel er to dataFrames vist. Vi har oprettet to kolonner og angivet nogle værdier i den første dataramme. Derefter, ved at bruge funktionen insert() indsatte vi en ny kolonne i datarammen med navnet 'Køn', den blev også placeret som '2' i indekset; nu viste den tabellen igen, som vist i ovenstående andet eksempel.

Efter at have mestret ovenstående teknikker, kan vi nemt tilføje nye kolonner til DataFrame.