Pandas Dataramme Unik

Pandas Dataramme Unik



Det mest populære Python-bibliotek, der bruges i datavidenskab, kaldes Pandas. Det tilbyder Python-programmører højtydende, brugervenlige og dataanalyseværktøjer. Når du først forstår de grundlæggende funktioner, og hvordan du bruger dem, er Pandas et potent værktøj til at ændre data. I 'pandaer' er standardmetoderne til lagring af data i tabelform DataFrames. Vi kan bruge nogle 'pandas' metoder til at få de unikke værdier i 'pandas' DataFrames kolonne. Når vi skal have unikke værdier i DataFrames kolonner og ikke ønsker duplikering af værdier i 'pandas' DataFrames kolonne, kan vi bruge de metoder, som 'pandas' giver til at gøre dette. Lad os se på sådanne metoder i denne vejledning sammen med nogle eksempler og output for at få unikke værdier i DataFrames kolonne med 'pandaer'.

Metoder til at få unikke værdier i 'pandas' DataFrames kolonner

Vi kan bruge to metoder til at få de unikke værdier i 'pandas' DataFrames kolonner. Vi dropper de duplikerede værdier og får kun de unikke værdier i kolonnerne i DataFrames. Metoderne som 'pandaer' giver til at udføre denne opgave er:







  • Ved at bruge den unikke() metode.
  • Ved at bruge drop_dupliactes() metoden.

Nu vil vi bruge begge metoder i 'pandas'-koderne til at få de unikke værdier i 'pandas' DataFrames kolonner.



Eksempel #01

'Spyder'-appen bruges her til at generere disse 'pandas'-koder for at bruge de metoder, der hjælper os med at få de unikke værdier i 'pandas' DataFrames kolonner. Vi skal importere 'pandas'-modulerne, som er nødvendige for 'pandas'-koden, før vi opretter DataFrame. Ved at bruge udtrykket 'import' og placere 'pandaer som pd', importerer vi disse moduler.



Nu kan vi ved hjælp af 'pd' hurtigt få 'pandas' funktioner eller metoder. Vi sætter derefter 'Subject_data', hvori vi tilføjer 'Navn', og i 'Navn', tilføjer vi navnets data, som er 'Roman, William, Peter, Smith, John, Milli, Thomas og James'. Derefter tilføjer vi emnedataene i 'Emnet', som er 'Matematik, økonomi, naturvidenskab, matematik, statistik, statistik, statistik og computer'. Derefter konverterer vi denne 'Subject_data' til 'Subject_df' DataFrame ved at bruge 'pd.DataFrame()' metoden. Vi placerer 'Subject_df' i 'print()'-metoden, så den vises på terminalen.





Nu ønsker vi at få de unikke værdier i 'pandas' DataFrames kolonne 'Subj'. Til dette formål bruger vi 'unique()' metoden her, og vi tilføjer navnet på kolonnen og også navnet på DataFrame som vist nedenfor. Vi tilføjer denne metode i 'print()', så resultatet også vises på terminalen.



Nu trykker vi på 'Shift+Enter' for at få resultatet af denne kode, og den gengives på terminalen og vises også her, som indeholder DataFrame med alle værdier. Dette er den originale DataFrame, som vi har tilføjet i koden, og nedenfor viser den de unikke værdier i kolonnen 'Subj'. Den sletter de duplikerede værdier og viser de unikke værdier i kolonnen 'Subj' i DataFrame.

Eksempel #02

Vi opretter 'Sample_list', som indeholder nogle oplysninger. Vi indsætter 'Layla, 21, 28, 31, 14 og 39', som vises som den første kolonne, når vi konverterer denne liste til DataFrame. Derefter tilføjer vi 'Lusy, 31, 25, 34, 26 og 21' som den anden række af DataFrame. Efter dette har vi 'Peter, 38, 20, 20, 35 og 24' og 'Layla 38, 23, 39 24, 23', som vil være den tredje og fjerde række i DataFrame. Vi indsætter også tre data mere, som er 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' og også 'Peter, 21, 21, 31, 21, 29' .

Nu konverterer vi 'Sample_list' til 'DF_Sample', som er navnet på DataFrame her ved at sætte funktionen 'pd.DataFrame()'. Vi angiver også navnet på kolonnerne i denne DataFrame, og disse navne er 'Name, Ass_1, Ass_2, Ass_3, Ass_4 og Ass_5'. Derefter bruger vi 'print()', som hjælper med at vise DataFrame 'DF_Sample'. Nu bruger vi en anden metode i dette eksempel til at få de unikke værdier i DataFrames kolonne. Denne metode er 'drop_duplicates()'-metoden for 'pandas'.

I metoden 'drop_duplicates()' indstiller vi navnet på den kolonne, hvor vi ønsker at få de unikke værdier i DataFrames kolonne. Vi får unikke værdier for kolonnen 'Navn' ved at droppe duplikatværdierne i denne kolonne ved hjælp af 'drop_duplicates()'-metoden og også gengive disse unikke værdier ved at bruge 'print()'-funktionen her.

De navne, der duplikeres, slettes, og unikke værdier gengives efter anvendelse af 'drop_duplicates()'-metoden. Du kan bemærke, at navnet 'Layla' vises i tre celler i kolonnen 'Navn'. Men når 'drop_duplicates()'-metoden anvendes på denne kolonne, slettes alle duplikerede værdier, og et 'Layla'-navn er dukket op på skærmen. Efter at have droppet dubletværdierne, dukkede den nye DataFrame op, som indeholder de unikke værdier i denne 'Navn'-kolonne. På denne måde kan vi droppe de duplikerede værdier og få den unikke værdi i DataFrames kolonne ved hjælp af 'drop_duplicates()' metoden.

Eksempel #03

Den samme DataFrame bruges igen, og nu anvender vi metoden 'unique()' her. Med 'unique()'-metoden placerer vi navnet på kolonnen såvel som DataFrames navn, som vi ønsker at anvende denne 'unique()'-metode på for at få de unikke værdier. Dette vil kun gengive de unikke værdier for den pågældende kolonne og vil ikke vise disse værdier i form af DataFrame.

Her indeholder DataFrame syv værdier i kolonnen 'Navn', men når vi anvender 'unique()'-metoden på denne kolonne, er der kun dukket fire værdier op, og disse er de unikke værdier for den kolonne. Det gengiver ikke duplikerede værdier.

Eksempel #04

DataFrame, som vi opretter i dette eksempel, er 'F_G_df'. Vi indsætter 'My_fruits' og 'my_Vegs' i denne DataFrame. Kolonnen 'My_fruits' indeholder 'Æble, appelsin, æble, pære, litchi, æble, æble, pære og æble'. Dernæst har vi 'My_Vegs', som indeholder navnene på grøntsagerne, som er 'Chili, Bringle, Gulerod, Kartoffel, Kartoffel, Gulerod, Løg, Hvidløg og Ingefær'. Denne DataFrame indeholder kun to kolonner.

Nu får vi de unikke værdier i begge kolonner ved hjælp af 'unique()'-metoden. Vi nævner navnet på DataFrame. Indsæt derefter kolonnens første kolonnenavn. Efter dette bruger vi append() metoden. I dette appendiks placerer vi igen navnet på DataFrame og det anden kolonnenavn og placerer 'unique()'-metoden. Dette vil få de unikke værdier for begge kolonner og derefter tilføje de unikke værdier for begge kolonner og vise dem på skærmen.

DataFrame gengives først og indeholder alle værdier. Herefter anvendes 'unique()'-metoden, og de unikke værdier for begge kolonner gengives nedenfor. I denne kode får vi de unikke værdier i de flere kolonner i DataFrame ved at bruge metoden 'unique()'.

Konklusion

Den fulde forklaring på at få de unikke værdier i DataFrames kolonne findes i denne guide. Vi har diskuteret 'unique()' og 'drop_duplicates()' metoderne, som hjælper os med at få de unikke værdier af DataFrames kolonne. Vi har undersøgt, hvordan man bruger disse metoder i 'pandas'-koden ved at bruge disse metoder her i vores koder. Vi har illustreret forskellige eksempler i denne vejledning og har vist dig, hvordan du får de unikke værdier af en kolonne ved at bruge 'unique()'-metoden såvel som 'drop_duplicates()'-metoden. Vi har også undersøgt, hvordan man får de unikke værdier i flere kolonner ved at bruge metoden 'unique()' i denne vejledning.