logo

Python Panda's-serie

De Pandas-serie kan worden gedefinieerd als een eendimensionale array die verschillende gegevenstypen kan opslaan. We kunnen de lijst, het tupel en het woordenboek eenvoudig omzetten in reeksen met behulp van ' serie ' methode. De rijlabels van series worden de index genoemd. Een reeks kan niet meerdere kolommen bevatten. Het heeft de volgende parameter:

    gegevens:Dit kan elke lijst-, woordenboek- of scalaire waarde zijn.inhoudsopgave:De waarde van de index moet uniek en hasheerbaar zijn. Het moet dezelfde lengte hebben als de gegevens. Als we geen enkele index doorgeven, standaard np.arrange(n) zal gebruikt worden.dtype:Het verwijst naar het gegevenstype van series.kopiëren:Het wordt gebruikt voor het kopiëren van de gegevens.

Een serie maken:

We kunnen op twee manieren een serie maken:

  1. Maak een lege serie
  2. Maak een serie met behulp van invoer.

Maak een lege serie:

We kunnen in Pandas gemakkelijk een lege reeks maken, wat betekent dat deze geen enkele waarde heeft.

De syntaxis die wordt gebruikt voor het maken van een lege reeks:

 = pandas.Series() 

In het onderstaande voorbeeld wordt een object van het type Empty Series gemaakt dat geen waarden heeft en een standaardgegevenstype heeft, d.w.z. zweven64 .

Voorbeeld

 import pandas as pd x = pd.Series() print (x) 

Uitvoer

 Series([], dtype: float64) 

Een serie maken met behulp van invoer:

We kunnen series maken door verschillende invoer te gebruiken:

js-functie aanroepen vanuit html
  • Array
  • Dict
  • Scalaire waarde

Serie maken vanuit array:

Voordat we een serie maken, moeten we eerst de numpig module en gebruik vervolgens de functie array() in het programma. Als de gegevens ndarray zijn, moet de doorgegeven index dezelfde lengte hebben.

Als we geen index doorgeven, is de index standaard bereik(n) wordt doorgegeven waarbij n de lengte van een array definieert, d.w.z. [0,1,2,.... bereik(len(matrix))-1 ].

Voorbeeld

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Uitvoer

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Maak een serie van dict

We kunnen ook een serie maken van dict. Als het woordenboekobject als invoer wordt doorgegeven en de index niet is opgegeven, worden de woordenboeksleutels in gesorteerde volgorde genomen om de index samen te stellen .

stringarray maken in Java

Als de index wordt doorgegeven, worden de waarden die overeenkomen met een bepaald label in de index uit het bestand gehaald woordenboek .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Uitvoer

 x 0.0 y 1.0 z 2.0 dtype: float64 

Maak een serie met Scalar:

kaneel versus mate

Als we de scalaire waarden nemen, moet de index worden opgegeven. De scalaire waarde wordt herhaald om overeen te komen met de lengte van de index.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Uitvoer

 0 4 1 4 2 4 3 4 dtype: int64 

Toegang tot gegevens uit series met Positie:

Nadat u het Series-typeobject hebt gemaakt, heeft u toegang tot de indexen, gegevens en zelfs individuele elementen.

De gegevens in de serie zijn op dezelfde manier toegankelijk als die in de ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Uitvoer

 1 

Objectkenmerken van serie

Het Series-attribuut wordt gedefinieerd als alle informatie met betrekking tot het Series-object, zoals grootte en gegevenstype. enz. Hieronder staan ​​enkele attributen die u kunt gebruiken om informatie over het Series-object te verkrijgen:

Kenmerken Beschrijving
Serie.index Definieert de index van de serie.
Serievorm Het retourneert een tupel van de vorm van de gegevens.
Serie.dtype Het retourneert het gegevenstype van de gegevens.
Seriegrootte Het retourneert de grootte van de gegevens.
Serie.leeg Het retourneert True als het Series-object leeg is, en retourneert anders false.
Serie.hasnans Het retourneert True als er NaN-waarden zijn, en retourneert anders false.
Serie.nbytes Het retourneert het aantal bytes in de gegevens.
Serie Het retourneert het aantal dimensies in de gegevens.
Serie.itemgrootte Het retourneert de grootte van het gegevenstype van het item.

Index-array en data-array van een serieobject ophalen

We kunnen de indexarray en data-array van een bestaand Series-object ophalen door de attributenindex en waarden te gebruiken.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Uitvoer

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Typen (dtype) en grootte van type (itemsize) ophalen

U kunt attribuut dtype gebruiken met Series-object als dtype voor het ophalen van het gegevenstype van een individueel element van een series-object. U kunt de artikelgrootte attribuut om het aantal bytes weer te geven dat aan elk gegevensitem is toegewezen.

np.argmax
 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Uitvoer

 int64 8 float64 8 

Vorm ophalen

De vorm van het Series-object definieert het totale aantal elementen, inclusief ontbrekende of lege waarden (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Uitvoer

 (4,) (3,) 

Afmeting, grootte en aantal bytes ophalen:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Uitvoer

 1 1 4 3 32 24 

Controle van de leegte en aanwezigheid van NaN's

Om te controleren of het Series-object leeg is, kunt u de leeg attribuut . Op dezelfde manier kunt u, om te controleren of een serieobject enkele NaN-waarden bevat of niet, de Hassan attribuut.

Voorbeeld

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Uitvoer

 False False True True False False 4 3 3 3 

Serie Functies

Er worden enkele functies gebruikt in Series, die als volgt zijn:

Functies Beschrijving
Panda's Series.map() Wijs de waarden uit twee reeksen met een gemeenschappelijke kolom toe.
Panda's-serie.std() Bereken de standaardafwijking van de gegeven reeks getallen, DataFrame, kolom en rijen.
Panda's Series.to_frame() Converteer het serieobject naar het dataframe.
Panda's Series.value_counts() Retourneert een reeks die tellingen van unieke waarden bevat.