Ryd DataFrame i Pandas

Ryd Dataframe I Pandas



Fjernelse af data fra Pandas DataFrame udføres ved hjælp af pandas.DataFrame.drop()-funktionen. Bortset fra denne funktion kan vi vælge rækkerne fra DataFrame uden at overveje kolonnerne/rækkerne. Dette kan også gøres ved hjælp af firkantede parenteser. I denne vejledning vil vi også bruge nøgleordet 'del' og pop() til at slette alle rækkerne ved at iterere DataFrame ved hjælp af en 'for'-løkke.

Brug af Pandas.DataFrame.Drop

Vi bruger pandas.DataFrame.drop()-funktionen til at slippe bestemte rækker eller specifikke kolonner fra Pandas DataFrame. Lad os bruge denne funktion til at slippe alle rækker og kolonner.

Syntaks :







Det følgende er syntaksen for pandas.DataFrame.drop()-funktionen. Vi bruger kun tre parametre og diskuterer kun disse tre i denne guide. Der findes en detaljeret vejledning om denne funktion:



pandaer. DataFrame . dråbe ( etiketter , akse , indeks , kolonner , niveau , på plads , fejl )
  1. Vi skal sende en liste over rækkeindekser til parameteren 'labels' for at slette alle rækkerne fra DataFrame. Vi kan også videregive attributten DataFrame.index, der vælger alle rækkeindekser. På samme måde skal vi videregive alle kolonnenavne til denne parameter eller videregive egenskaben DataFrame.columns.
  2. Indstil parameteren 'akse' til 1, hvis du overfører kolonnerne til parameteren 'etiketter'. Som standard er akse = 0, som refererer til rækkerne.
  3. Vi kan udføre operationen (Slet) på den eksisterende DataFrame. Indstil 'inplace'-parameteren til 'True'.

Eksempel 1:

Overvej 'Campaign1' DataFrame med fire rækker og to kolonner. Slip først alle rækkerne ved at overføre rækkeindeksene til parameteren 'labels' og slip derefter alle kolonnerne ved at overføre kolonneetiketterne til parameteren 'labels'.



importere pandaer

# Opret DataFrame - Kampagne1 med 2 kolonner og 4 poster
Kampagne 1 = pandaer. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'python lejr' , 'USA' ] ] ,
kolonner = [ 'Campaign_Name' , 'Beliggenhed' ] )
Print ( Kampagne 1 , ' \n ' )

# Slip alle rækker
Kampagne 1. dråbe ( etiketter = [ 0 , 1 , 2 , 3 ] , på plads = Rigtigt )
Print ( Kampagne 1 , ' \n ' )

# Slip alle kolonner
Kampagne 1. dråbe ( etiketter = [ 'Campaign_Name' , 'Beliggenhed' ] , på plads = Rigtigt , akse = 1 )
Print ( Kampagne 1 , ' \n ' )

Produktion :





Efter at have droppet rækkerne, fjernes rækkerne, men kolonnerne eksisterer. Efter at have fjernet kolonnerne, er 'Kampagne1' tom.



Eksempel 2:

Brug den tidligere 'Campaign1' DataFrame og slip rækkerne ved at overføre 'Campaign1.index' til 'labels' parameteren og slip derefter kolonnerne ved at overføre 'Campaign.columns' til 'labels' parameteren.

importere pandaer

# Opret DataFrame - Kampagne1 med 2 kolonner og 4 poster
Kampagne 1 = pandaer. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'python lejr' , 'USA' ] ] ,
kolonner = [ 'Campaign_Name' , 'Beliggenhed' ] )
Print ( Kampagne 1 , ' \n ' )

# Slip alle rækker
Kampagne 1. dråbe ( etiketter = Kampagne 1. indeks , på plads = Rigtigt )

# Slip alle kolonner
Kampagne 1. dråbe ( etiketter = Kampagne 1. kolonner , på plads = Rigtigt , akse = 1 )
Print ( Kampagne 1 )

Produktion :

Efter at have droppet rækkerne, fjernes rækkerne, men kolonnerne eksisterer. Efter at have fjernet kolonnerne, er 'Kampagne1' tom.

Brug af Iloc[]

Egenskaben pandas.DataFrame.iloc[] bruges til at vælge data baseret på indekspositionen. Vi kan bruge denne egenskab til at vælge 0 rækker og 0 kolonner fra DataFrame. Her sletter vi ikke selve DataFrame, men vi vil vælge 0 poster.

Syntaks :

Først skal vi slette kolonnerne og derefter rækkerne.

  1. Vælg 0 kolonner – DataFrame.iloc[:,0:0]
  2. Vælg 0 rækker – DataFrame.iloc[0:0]

Eksempel :

Brug den samme DataFrame og vælg den tomme DataFrame ved hjælp af egenskaben iloc[].

importere pandaer

# Opret DataFrame - Kampagne1 med 2 kolonner og 4 poster
Kampagne 1 = pandaer. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'python lejr' , 'USA' ] ] ,
kolonner = [ 'Campaign_Name' , 'Beliggenhed' ] )
Print ( Kampagne 1 , ' \n ' )

# Slip alle rækker
Kampagne 1. dråbe ( etiketter = [ 0 , 1 , 2 , 3 ] , på plads = Rigtigt )
Print ( Kampagne 1 , ' \n ' )

# Slip alle kolonner
Kampagne 1. dråbe ( etiketter = [ 'Campaign_Name' , 'Beliggenhed' ] , på plads = Rigtigt , akse = 1 )
Print ( Kampagne 1 , ' \n ' )

Produktion :

Brug af nøgleordet Del

Alle data vil blive slettet fra DataFrame ved at bruge 'del' nøgleordet ved at iterere alle rækkerne inde i 'for' løkken.

importere pandaer

# Opret DataFrame - Kampagne1 med 4 kolonner og 4 poster
Kampagne 1 = pandaer. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'python lejr' , 'USA' ] ] ,
kolonner = [ 'Campaign_Name' , 'Beliggenhed' ] )
Print ( Kampagne 1 , ' \n ' )

# Brug af nøgleordet del
til jeg i Kampagne 1:
af Kampagne 1 [ jeg ]
Print ( Kampagne 1 )

Produktion :

Nu er DataFrame tom.

Brug af Pop()-funktionen

Hele data vil blive slettet fra DataFrame ved hjælp af pop()-funktionen ved at iterere alle rækkerne inde i 'for'-løkken. Denne funktion er specificeret i 'for'-løkken.

importere pandaer

# Opret DataFrame - Kampagne1 med 4 kolonner og 4 poster
Kampagne 1 = pandaer. DataFrame ( [ [ 'java camp' , 'Indien' ] , [ 'linux camp' , 'USA' ] , [ 'c/c++ camp' , 'Indien' ] , [ 'python lejr' , 'USA' ] ] ,
kolonner = [ 'Campaign_Name' , 'Beliggenhed' ] )
Print ( Kampagne 1 , ' \n ' )

# Brug af pop()
til jeg i Kampagne 1:
Kampagne 1. pop ( jeg )
Print ( Kampagne 1 )

Produktion :

Nu er DataFrame tom.

Konklusion

Vi lærte, hvordan man rydder Pandas DataFrame ved at fjerne rækkerne og kolonnerne. Først droppede vi rækker fra DataFrame ved hjælp af drop()-funktionen og droppede derefter kolonnerne, efter at vi brugte egenskaben iloc[] til at vælge 0 rækker. Til sidst diskuterede vi, hvordan man sletter posterne fra DataFrame ved hjælp af nøgleordet 'del' og pop()-funktionen.