Panda's DataFrame is een tweedimensionaal gelabelde gegevensstructuur, zoals een tabel met rijen en kolommen. De grootte en waarden van het DataFrame zijn veranderlijk, d.w.z. kunnen worden gewijzigd.
DataFrame wordt meestal gebruikt bij data-analyse en datamanipulatie. Hiermee kunt u gegevens in tabelvorm opslaan, zoals een SQL-database, MS Excel of Google Spreadsheets, waardoor het eenvoudiger wordt om rekenkundige bewerkingen op de gegevens uit te voeren.
Het is het meest gebruikte Pandas-object. De DataFrame()-functie wordt gebruikt om een DataFrame in Pandas te creëren. U kunt Pandas DataFrame ook op meerdere manieren maken.
Panda's Dataframe()-syntaxis
pandas.DataFrame(data, index, kolommen)
periode sleutel
Parameters:
- gegevens : Het is een dataset waaruit een DataFrame moet worden gemaakt. Het kan een lijst, woordenboek, scalaire waarde, reeks en arrays zijn, enz.
- inhoudsopgave : Het is optioneel, standaard begint de index van het DataFrame vanaf 0 en eindigt bij de laatste gegevenswaarde (n-1). Het definieert het rijlabel expliciet.
- kolommen : deze parameter wordt gebruikt om kolomnamen op te geven in het DataFrame. Als de kolomnaam niet standaard is gedefinieerd, heeft deze een waarde van 0 tot n-1.
Geeft terug:
- DataFrame-object
Nu we de functie DataFrame() hebben besproken, gaan we kijken naar verschillende manieren om een DataFrame te maken:
Verschillende manieren om een dataframe in Python te maken
Er zijn verschillende manieren om een Panda's-dataframe in Python . U kunt een DataFrame maken met de volgende methoden:
- Maak Panda's DataFrame met behulp van de DataFrame()-functie
- Maak Pandas DataFrame uit de lijst met lijsten
- Maak Pandas DataFrame vanuit het woordenboek van ndarray/list
- Maak Pandas DataFrame uit de lijst met woordenboeken
- Maak Pandas DataFrame op basis van een woordenboek met series
- DataFrame maken met de functie zip().
- Een DataFrame maken door het indexlabel expliciet te bewijzen
Maak een leeg dataframe met behulp van de DataFrame()-methode
DataFrame in Python kan worden gemaakt door de DataFrame()-functie van de Panda's bibliotheek . Roep de functie gewoon aan met de DataFrame-constructor om een DataFrame te maken.
Voorbeeld : Een leeg DataFrame maken met behulp van de DataFrame() functie in Python
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Uitgang:
Empty DataFrame Columns: [] Index: []>
Maak DataFrame van lijsten met lijsten
Om een Pandas DataFrame te maken van een lijst van lijsten kunt u de functie pd.DataFrame() gebruiken. Deze functie neemt een lijst met lijsten als invoer en creëert een DataFrame met hetzelfde aantal rijen en kolommen als de invoerlijst.
Voorbeeld : DataFrame maken uit lijsten met lijsten met behulp van de DataFrame() -methode
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
java mvc
>
Uitgang:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Maak een DataFrame vanuit de woordenlijst van ndArray/Lists
Om DataFrame te maken van een woordenboek van ndarrays /lists, moeten alle arrays dezelfde lengte hebben. Als een index wordt doorgegeven, moet de lengte-index gelijk zijn aan de lengte van de arrays.
Als er geen index wordt doorgegeven, is de index standaard range(n), waarbij n de arraylengte is.
Voorbeeld : DataFrame maken op basis van een woordenboek van ndarray/lists
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
>
Uitgang:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Opmerking: Bij het maken van DataFrame met behulp van een woordenboek, zijn de sleutels van het woordenboek standaard kolomnamen. We kunnen kolomnamen ook expliciet opgeven met behulp van de kolomparameter.
Maak een DataFrame uit de lijst met woordenboeken
Panda's DataFrame kan worden gemaakt door het doorgeven lijsten met woordenboeken als invoergegevens. Standaard worden woordenboeksleutels als kolommen beschouwd.
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
>
Uitgang:
a b c 0 1 2 3 1 10 20 30>
Een ander voorbeeld is het maken van een Pandas DataFrame door lijsten met woordenboeken en rij-indexen .
Python3
string java-indexof
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Uitgang:
b c a first 2 3 NaN second 20 30 10.0>
Maak DataFrame op basis van een woordenboek met series
Om een DataFrame te maken op basis van een woordenboek van serie , kan een woordenboek worden doorgegeven om een DataFrame te vormen. De resulterende index is de vereniging van alle reeksen doorgegeven geïndexeerd.
Voorbeeld: Een DataFrame maken op basis van een woordenboek met series.
Python3
vind geblokkeerde nummers op Android
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Uitgang:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Maak DataFrame met de functie zip().
Twee lijsten kunnen worden samengevoegd met behulp van de zip()-functie . Maak nu het Pandas DataFrame door de functie pd.DataFrame() aan te roepen.
Voorbeeld: DataFrame maken met de functie zip().
Python3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Uitgang:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Maak een DataFrame door het indexlabel expliciet te bewijzen
Om een DataFrame te maken door het indexlabel expliciet op te geven, kunt u de indexparameter van de pd.DataFrame()-constructor gebruiken. De indexparameter neemt een lijst met indexlabels als invoer, en het DataFrame gebruikt deze labels voor de rijen van het DataFrame.
Voorbeeld: Een DataFrame maken door het indexlabel expliciet te bewijzen
Python3
staan
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
Uitgang:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Conclusie
Python Pandas DataFrame is vergelijkbaar met een tabel met rijen en kolommen. Het is een tweedimensionale datastructuur en is zeer nuttig voor data-analyse en datamanipulatie.
In deze tutorial hebben we meerdere manieren besproken om een Pandas DataFrame te maken. Met deze zelfstudie kunt u omgaan met elke complexe vereiste bij het maken van DataFrame.