logo

Python | Panda's.pivot()

pandas.pivot(index, kolommen, waarden) functie produceert een draaitabel op basis van 3 kolommen van het DataFrame. Gebruikt unieke waarden uit de index/kolommen en vult deze met waarden.

Python Pandas.pivot()-syntaxis

Syntaxis : pandas.pivot(index, kolommen, waarden)



Parameters:

  1. index[ndarray] : Labels die moeten worden gebruikt om de index van een nieuw frame te maken
  2. kolommen[ndarray] : Labels die u kunt gebruiken om de kolommen van een nieuw frame te maken
  3. waarden[ndarray] : Waarden die moeten worden gebruikt voor het invullen van de waarden van het nieuwe frame

Geeft terug: Hervormd DataFrame
Uitzondering: ValueError wordt gegenereerd als er duplicaten zijn.

Een voorbeelddataframe maken

Hier maken we een voorbeeld van een DataFrame dat we in ons artikel zullen gebruiken.



Python3






# importing pandas as pd> import> pandas as pd> > # creating a dataframe> df>=> pd.DataFrame({>'A'>: [>'John'>,>'Boby'>,>'Mina'>],> >'B'>: [>'Masters'>,>'Graduate'>,>'Graduate'>],> >'C'>: [>27>,>23>,>21>]})> > df>

Java-verzamelingsframework
>

>

Uitvoer

 A B C 0 John Masters 27 1 Boby Graduate 23 2 Mina Graduate 21>

Panda's pivot() Functievoorbeelden

Hieronder staan ​​enkele voorbeelden waarmee we een DataFrame kunnen draaien met behulp van Panda's pivot()-functie in Python :

  • Creëren en Een dataframe draaien
  • Een draaitabel met meerdere niveaus maken met Panda's DataFrame
  • ValueError bij het draaien van een dataframe

Creëren en Een dataframe draaien

In dit voorbeeld is een pandas DataFrame (df>) wordt gedraaid, waarbij de kolommen ‘A’ en ‘B’ respectievelijk de nieuwe index en kolommen worden, en de waarden in kolom ‘C’ de cellen van de resulterende draaitabel vullen. De functie gaat ervan uit dat elke combinatie van ‘A’ en ‘B’ een unieke corresponderende waarde heeft in ‘C’.

Python3




# values can be an object or a list> df.pivot(>'A'>,>'B'>,>'C'>)>

Linux gratis ipconfig

>

>

Uitvoer

B Graduate Masters A Boby 23.0 NaN John NaN 27.0 Mina 21.0 NaN>

Een draaitabel met meerdere niveaus maken met Pandas DataFrame

In dit voorbeeld is de panda DataFrame (df>) wordt getransformeerd in een draaitabel met meerdere niveaus, waarbij ‘A’ als index wordt gebruikt, ‘B’ als de kolommen, en waarden worden geëxtraheerd uit beide kolommen ‘C’ en ‘A’ om de cellen te vullen. Deze aanpak maakt een meer gedetailleerde weergave van de gegevens mogelijk, waarbij meerdere dimensies in de resulterende draaitabel worden opgenomen.

Python3




# value is a list> df.pivot(index>=>'A'>, columns>=>'B'>, values>=>[>'C'>,>'A'>])>

rom
>

>

Uitvoer

 C A B Graduate Masters Graduate Masters A Boby 23.0 NaN NaN NaN John NaN 27.0 NaN NaN Mina 21.0 NaN NaN NaN>

ValueError opgetreden bij het draaien van een dataframe

Verhoog ValueError als er een index is, kolomcombinaties met meerdere waarden.

Python3


bias en variantie



# importing pandas as pd> import> pandas as pd> > # creating a dataframe> df>=> pd.DataFrame({>'A'>: [>'John'>,>'John'>,>'Mina'>],> >'B'>: [>'Masters'>,>'Masters'>,>'Graduate'>],> >'C'>: [>27>,>23>,>21>]})> > > df.pivot(>'A'>,>'B'>,>'C'>)>

>

>

Uitvoer

ValueError: Index contains duplicate entries, cannot reshape>