In dit artikel bespreken we Pandas DataFrame.set_index() in Python. Python onderscheidt zich als een uitstekende taal voor data-analyse, grotendeels dankzij het uitstekende ecosysteem van datacentrische pakketten. Van deze pakketten zijn Panda's speelt een belangrijke rol bij het vereenvoudigen van het importeren en analyseren van gegevens.
Panda's DataFrame.set_index() Syntaxis
Syntaxis: DataFrame.set_index(keys, drop=True, append=False, inplace=False, verificatie_integrity=False)
Parameters:
- sleutels: Kolomnaam of een lijst met kolomnamen.
- druppel: Een Booleaanse waarde die, indien True, de kolom verwijdert die voor de index wordt gebruikt.
- toevoegen: Indien True, wordt de opgegeven kolom toegevoegd aan de bestaande indexkolom.
- in situ: Indien True, worden de wijzigingen aangebracht in het DataFrame zelf.
- verificatie_integriteit: Indien True: controleert de nieuwe indexkolom op duplicaten.
Wat is Panda's DataFrame.set_index()?
Het Panda's-dataframe. set_index() De methode wordt gebruikt om een lijst, reeks of een ander dataframe toe te wijzen als de index van een bepaald dataframe. Het is vooral handig bij het combineren van meerdere dataframes, waardoor de index eenvoudig kan worden gewijzigd. Hoewel een indexkolom kan worden opgegeven tijdens het maken van een dataframe, biedt set_index() een flexibele manier om de index later te wijzigen. In wezen kunt u hiermee een lijst, reeks of dataframe instellen als de index van een dataframe. Maar soms wordt een dataframe gemaakt uit twee of meer dataframes en daarom kan de index later met deze methode worden gewijzigd.
Om het gebruikte CSV-bestand te downloaden, klikt u op Hier.
Panda's DataFrame.set_index() Voorbeelden
Hieronder vindt u goede illustraties van de voorbeelden voor Pandas DataFrame.set_index().
- Panda's Stel de index in op kolom
- Meerdere indexkolommen
- Een enkele instellen Zwevende kolom als Index
- Instelling drie kolommen als MultiIndex
- Panda's stellen de index van een specifieke kolom in
Panda's Stel de index in op kolom
In dit voorbeeld wijzigen we de indexkolom. De kolom Voornaam is de indexkolom van Data Frame gemaakt.
Python3
# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()> |
>
>
Uitvoer : Vóór gebruik –

Na operatie –

Zoals te zien is in de uitvoerafbeeldingen, was de indexkolom voorheen een reeks getallen, maar werd deze later vervangen door Voornaam.
Panda's Stel Index in op Meerdere indexkolommen
In dit voorbeeld worden twee kolommen gemaakt als indexkolom. De parameter Drop wordt gebruikt om de kolom te verwijderen en de parameter Append wordt gebruikt om doorgegeven kolommen toe te voegen aan de reeds bestaande indexkolom.
Python3
# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()> |
>
>
Uitgang:

Zoals weergegeven in de uitvoerafbeelding, hebben de gegevens 3 indexkolommen.
Pandas Dataframe Index Een single instellen Zwevende kolom als Index
In dit voorbeeld gebruikt het onderstaande codefragment de Pandas-bibliotheek om een DataFrame met de naam ‘df’ te maken op basis van een geneste lijst met leerlinggegevens. Het stelt de kolom ‘Agg_Marks’ in als index en geeft het resulterende DataFrame weer met de kolommen ‘Naam’, ‘Leeftijd’, ‘Stad’ en ‘Land’.
Python3
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df> |
>
soorten netwerken
>
Uitgang:
Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>
In het bovenstaande voorbeeld stellen we de kolom ‘ Agg_Marks ‘ als index van het dataframe.
Pandas Dataframe Index-instelling drie kolommen als MultiIndex
In dit voorbeeld gebruikt de onderstaande code Pandas om een DataFrame ‘df’ te maken van leerlinggegevens, met de kolommen ‘Naam’, ‘Leeftijd’, ‘Stad’, ‘Land’, ‘Agg_Marks’ en ‘ID’. Het maakt gebruik van de functie `set_index()` om een index op meerdere niveaus tot stand te brengen met behulp van ‘Naam’, ‘Plaats’ en ‘ID’, en geeft vervolgens het resulterende DataFrame weer.
Python3
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df> |
>
>
Uitgang:
Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>
In het bovenstaande voorbeeld stellen we de kolommen ‘ Naam ', ' Stad ', En ' ID kaart ‘ als multiIndex van het dataframe.
Panda's stellen de index van een specifieke kolom in
In dit voorbeeld demonstreert de onderstaande code hoe u Pandas kunt gebruiken om een DataFrame te maken. Stel een specifieke kolom (‘Naam’ in dit geval) in als index met behulp van deset_index()>methode en geeft vervolgens zowel de originele als de gewijzigde DataFrames weer. Deinplace=True>parameter zorgt ervoor dat de wijzigingen rechtstreeks op het DataFrame worden toegepast zonder dat opnieuw toewijzing nodig is.
Python3
import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>'
DataFrame after set_index:'>)> print>(df)> |
>
>
Uitgang:
Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>