logo

Nieuwe kolom toevoegen aan bestaand DataFrame in Pandas

Het toevoegen van nieuwe kolommen aan een bestaand DataFrame is een fundamentele taak bij het analyseren van gegevens Panda's . Hiermee kunt u uw gegevens verrijken met aanvullende informatie en verdere analyse en manipulatie vergemakkelijken. In dit artikel worden verschillende methoden onderzocht voor het toevoegen van nieuwe kolommen, waaronder eenvoudige toewijzing, deinsert()>methode, deassign()>methode. Laten we het hebben over het toevoegen van nieuwe kolommen aan het bestaande DataFrame van Pandas.

Wat is Panda's DataFrame?

A Panda's DataFrame is een tweedimensionale, in grootte veranderbare, potentieel heterogene tabelvormige gegevensstructuur met gelabelde assen (rijen en kolommen). Het is een fundamentele datastructuur in het Python-datawetenschapsecosysteem en biedt een krachtige manier om met tabelgegevens te werken.



Hier zijn enkele belangrijke kenmerken van een Pandas DataFrame:

  • Data weergave: Slaat gegevens op in een tabelindeling met rijen en kolommen.
  • Heterogene gegevenstypen: Kan verschillende gegevenstypen in verschillende kolommen bevatten (bijvoorbeeld gehele getallen, floats, strings, booleans).
  • Etikettering: Elke rij en kolom heeft een label (index- en kolomnamen).
  • Veranderlijk: Maakt gegevensmanipulatie en -wijziging mogelijk.
  • Krachtige operaties: Biedt verschillende functies en methoden voor gegevensanalyse, manipulatie en verkenning.
  • Uitbreidbaar: Kan worden aangepast en uitgebreid met extra functionaliteiten via bibliotheken en door de gebruiker gedefinieerde functies.

Er zijn meerdere manieren om een ​​nieuwe kolom toe te voegen aan een bestaand dataframe in Pandas Python :

  • Een voorbeelddataframe maken
  • Door het gebruiken van Dataframe.insert() methode
  • Door het gebruiken van Dataframe.assign() methode
  • Woordenboek gebruiken
  • Lijst gebruiken
  • Gebruik makend van .plaats()
  • Meer dan één kolommen toevoegen aan een bestaand dataframe

Een voorbeelddataframe maken

Hier maken we een voorbeelddataframe:



java oeps-concepten

Python3






import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)>

>

>

Uitgang:

   Name Height Qualification     0    Jai 5.1 Msc   1    Princi 6.2 MA   2   Gaurav 5.1 Msc   3   Anuj 5.2 Msc>

Houd er rekening mee dat de lengte van uw lijst overeen moet komen met de lengte van de indexkolom, anders wordt er een fout weergegeven.

Voeg een nieuwe kolom toe aan een bestaand datframe met behulp van DataFrame.insert()

Het geeft de vrijheid om een ​​kolom toe te voegen op elke gewenste positie en niet alleen aan het einde. Het biedt ook verschillende opties voor het invoegen van de kolomwaarden.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)>

>

>

slapen in javascript

Uitgang:

  Name Height Age Qualification     0   Jai 5.1 21 Msc   1   Princi 6.2 23 MA   2   Gaurav 5.1 24 Msc   3    Anuj 5.2 21 Msc>

Kolommen toevoegen aan Pandas DataFrame met Dataframe.assign()

Met deze methode wordt een nieuw dataframe gemaakt waaraan een nieuwe kolom wordt toegevoegd aan het oude dataframe.

Python3




chiranjeevi-acteur
import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)>

>

>

Uitgang:

   Name Height Qualification address     0    Jai 5.1 Msc Delhi   1    Princi 6.2 MA Bangalore   2    Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Panda's Voeg kolom toe aan DataFrame met behulp van een woordenboek

Wij kunnen gebruik maken van een Python-woordenboek om een ​​nieuwe kolom toe te voegen in Panda's DataFrame. Gebruik een bestaande kolom als sleutelwaarden en hun respectievelijke waarden zijn de waarden voor een nieuwe kolom.

Python3




# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)>

>

>

Uitgang:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Een nieuwe kolom toevoegen aan een Pandas DataFrame met behulp van Lijst

In dit voorbeeld Panda's voegen nieuwe kolommen uit de lijst toe Adresseer een bestaand Pandas DataFrame met behulp van een woordenboek en een lijst.

Python3




# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)>

>

>

Uitgang:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Voeg een nieuwe kolom toe aan een bestaand Pandas DataFrame met behulp van Dataframe.loc()

In dit voorbeeld wordt een Pandas DataFrame gemaakt met de naamdf>met de kolommen Naam, Hoogte en Kwalificatie en voegt een nieuwe kolom Adres toe met behulp van deloc>attribuut.

Python3

bash voor lus 1 tot en met 10




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)>

kmp-algoritme

>

>

Uitgang:

  Name Height Qualification Address     0    Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3   Anuj 5.2 Msc Patna>

Meer dan één kolommen toevoegen aan een bestaand dataframe

In dit voorbeeld breidt het een bestaand Pandas DataFrame uitdf>met twee nieuwe kolommen, Leeftijd en Staat, met behulp van hun respectievelijke gegevenslijsten.

Python3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)>

>

>

Uitgang:

   Name Height Qualification Address Age State     0    Jai 5.1 Msc Delhi 22 NCT   1   Princi 6.2 MA Bangalore 25 Karnataka   2    Gaurav 5.1 Msc Chennai 23 Tamil Nadu   3   Anuj 5.2 Msc Patna 24 Bihar>

Conclusie

Begrijpen hoe u nieuwe kolommen aan DataFrames kunt toevoegen, is essentieel voor het verkennen en manipuleren van gegevens in Pandas. Het kiezen van de juiste methode hangt af van de specifieke context en het gewenste resultaat. Door deze technieken onder de knie te krijgen, kunt u uw gegevens effectief manipuleren, analyseren en waardevolle inzichten verkrijgen.