Pandaer Qcut

Pandaer Qcut



'Python' indeholder mange biblioteker, og når vi vil analysere eller manipulere data, så bruger vi disse 'Pythons' biblioteker, og 'pandaerne' er også biblioteket af det. 'Pandas'-biblioteket bruges inden for datavidenskab, og det bruges også i maskinlæringsaktiviteter. 'Pandas' DataFrame hjælper os med at gemme dataene. I 'pandaer', når vi vil have databinning, bruger vi metoden 'qcut()'. Metoden 'qcut()' bruges til at konvertere kontinuerlige funktioner til kategoriske. Vi kan tilføje forskellige typer parametre i denne 'qcut()'-metode for at få forskellige typer resultater. Denne tutorial handler om 'qcut()'-metoden, og vi vil forklare 'qcut()'-metoden i detaljer her. Vi vil forklare dig, hvordan vi laver databinning ved hjælp af 'qcut()'-funktionen i 'pandas' i denne tutorial.'

Eksempel #01

Vi vil anvende 'qcut()'-metoden i disse koder, og vi vil gøre disse koder i 'Spyder'-appen. Når vi skal arbejde med 'pandaerne', kan vi kun få adgang til dets funktioner, når vi importerer 'pandaerne'-biblioteket til vores koder. Først sætter vi 'import', og derefter skriver vi 'pandaer som pd'. Nu skal vi anvende 'qcut()'-metoden, så til dette opretter vi DataFrame her. Vi konstruerer 'Random_df' indeholdende 'R_ID, R_name og R_age' som dens kolonner, og også i 'R_ID' placerer vi 'R_17, R_21, R_24, R_29, R_31, R_34, R_44, R_46, R_50, R_51, R_55 R_61, R_73 og R_81'. Derefter tilføjer vi 'Theodore, Teddy, Noah, Leo, Ivy, Henry, Freddie, Evelyn, Ava, Willow, Theo, Oscar, Jacob og Harper' i kolonnen 'R_name'. Herefter indsætter vi '21, 33, 12, 43, 22, 7, 21, 51, 72, 19, 10, 9, 37 og 40' i kolonnen 'R_age'. Nu bruger vi 'print()', som indeholder 'Random_df', og det vil hjælpe med at gengive 'Random_df' DataFrame. Vi har lige oprettet DataFrame og anvender ikke 'qcut()'-metoden endnu.








'Kør'-ikonet hjælper os med at udføre koderne. Når vi trykker på dette 'kør'-ikon, så vises resultatet af denne kode på terminalen af ​​'Spyder'-appen. 'Random_df' DataFarme vises som resultatet af koden, som vi har skrevet i dette eksempel. Nu vil vi anvende 'qcut()'-metoden og vil også vise resultatet.




Vi samler dataene her. Vi samler 'R_age'-kolonnen og placerer 'pd.qcut()'-metoden, som er metoden for 'pandas', der hjælper med databinning. I denne metode indsætter vi navnet på DataFrame og også kolonnenavnet, som vi ønsker at anvende denne 'qcut()'-metode på. Vi indstiller også værdien af ​​'q' til '5', og den bruges til at skære dataene i kolonnen 'R_age' i fem lige store kvantiler. Vi tilføjer 'qcut()'-metoden i 'print()', så den også viser binning-dataene på terminalen.




Her vises data efter binning, og det skærer 'R_age' i fem kvantiler. Den viser også de kategorier, hvori 'R_age'-kolonnens data er gemt. Den kategoriske serie repræsenterer 'R_age'-beholderne.






Vi kan også justere etiketten til disse skraldespande. Vi tilføjer disse beholderetiketter for at gøre dem nemme at fortolke. Vi tilføjer en 'R_age_qcut'-kolonne til 'Random_df', hvori vi tilføjer etiketterne for disse beholdere. Vi bruger igen metoden 'pd.qcut()' til at mærke dem. Vi tilføjer etiketterne, der er 'små, ikke så små, middelmådige, høje og højeste' i den. Så sætter vi igen “Random_df” i “print()”.


Alle skraldespande er mærket og præsenteret i dette resultat. Kolonnen 'R_age_qcut' vises i denne DataFrame, hvor mærkede beholdere vises.



Eksempel #02

For at oprette DataFrame tilføjer vi først 'karakterer', som er '3, 6, 8, 7, 2, 5, 1, 9, 4, 7 og 8'. Derefter tilføjer vi navne på elever i 'elever', som er 'Peter, Bromley, James, David, Allierede, John, James, Samuel, William, Howard og Alexander'. Derefter genererer vi 'Grades_df', hvor vi har tilføjet 'pd.DataFrame()'-metoden, og i denne metode sætter vi 'Std_name', som vil vises som kolonnenavnet, og tildeler værdier for 'elever' til dette. Så sætter vi 'Students_grades' som kolonnenavnet på DataFrame og tildeler også 'karakterer' her, som vi har oprettet ovenfor. Efter dette har vi 'print()', hvori vi tilføjer 'Grades_df' til udskrivning.


DataFrame, der indeholder to kolonner, vises i resultatet af denne kode. Nu vil vi anvende metoden 'qcut()' på kolonnen 'Students_grades' for at samle dataene for denne kolonnes værdier.


Vi tilføjer en ny kolonne 'karakter' her, hvor vi har anvendt 'pd.qcut()' til kolonnen 'Students_grades', og vi har også brugt '4' til værdien af ​​'q', så det vil skære dataene i fire lige store kvantiler. Efter dette specificerer vi disse kvantiler her ved at placere værdier i 'q', som er '0, .4, .8 og 1'. Så viser vi også dette. Nu mærker vi disse indskrevne data, og de etiketter, vi tilføjer her, er 'D, C, A og B' og er også gemt i kolonnen 'karakter'.


Her vises data efter binning her i 'karakter'-kolonnen, og det skærer 'Student_grades'-kolonnens data i fire lige store kvantiler.


DataFrame, som vi får efter at have anvendt 'qcut()'-metoden og specificeret kvantiler, vises i dette resultat.


Nu, efter tilføjelse af etiketterne til disse beholdere, gengives også i dette resultat i kolonnen 'karakter', og du kan se, at den tildeler etiketterne i henhold til bin-værdierne.

Eksempel #03

Vi kan også anvende 'qcut()'-metoden til dataene i CSV-filen. Til dette læser vi først CSV-filens data ved hjælp af 'read_csv()'-metoden. Vi læser dataene fra 'office2.csv'-filen, og derefter placeres dataene i denne fil i 'Office_df'. Denne metode vil konvertere 'office2'-filens data til DataFrame og gemme dem i 'Office_df'. Derefter viser vi også disse data ved at sætte 'Office_df' i 'print()'. Herefter tilføjer vi en ny kolonne kaldet 'Units_qcut', hvorpå vi anvender funktionen 'pd.qcut()' til kolonnen 'Units'.

Derudover sætter vi værdien af ​​'q'-variablen til '5', som vil opdele dataene i fem lige store kvantiler. Dataene, efter skæring i 5 lige store kvantiler, gemmes i kolonnen 'Units_qcut', og denne kolonne føjes også til 'Office_df', og 'Office_df' gengives her igen ved hjælp af 'print()'. Vi mærker nu disse indskrevne data, tilføjer etiketterne i 'qcut()'-metoden, som er  'Enhed 1, Unit 2, Unit 3, Unit 4 og Unit 5' og gemmer dem også i kolonnen 'Labels' . Vi gengiver også denne DataFrame, hvor kolonnen 'Etiketter' er tilføjet.


De data, som vi får efter at have læst 'office2.csv'-filen, gengives her i form af DataFrame. Derefter tilføjes kolonnen 'Units_qcut', hvori de indsatte værdier i kolonnen 'Enheder' vises. Herefter tilføjes også kolonnen 'Etiketter', som tildeler etiketterne til disse indskrevne værdier. Det hele gøres ved at bruge 'qcut()'-metoden i 'pandas'.

Konklusion

Vi har forklaret 'qcut()'-metoden i detaljer i denne tutorial, som hjælper med at samle dataene i 'pandaer'. Vi har diskuteret, at dataene er lagret i henhold til den kvantile 'q'-værdi, som vi har tilføjet i 'qcut()'-metoden, og vi har også justeret etiketterne til disse lagrede data. Vi har udforsket 'qcut()'-metoden og har anvendt denne metode til kolonnerne i DataFrame, og vi har også anvendt denne 'qcut()'-metode på dataene i CSV-filen efter at have læst CSV-filerne. Vi har præsenteret resultatet af alle koder i denne tutorial for klart at forklare og vise resultatet af 'qcut()'-metoden.