logo

Panda's DataFrame.describe()

De methode beschrijven() wordt gebruikt voor het berekenen van bepaalde statistische gegevens, zoals percentiel, gemiddelde En soa van de numerieke waarden van de serie of het dataframe. Het analyseert zowel numerieke als objectreeksen en ook de DataFrame-kolomsets met gemengde gegevenstypen.

wat is jQuery

Syntaxis

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Parameters

    percentiel:Het is een optionele parameter die een lijst is van het gegevenstype met getallen die tussen 0 en 1 moeten liggen. De standaardwaarde is [.25, .5, .75], wat de 25e, 50e en 75e percentielen retourneert.erbij betrekken:Het is ook een optionele parameter die de lijst met gegevenstypen bevat terwijl het DataFrame wordt beschreven. De standaardwaarde is Geen.uitsluiten:Het is ook een optionele parameter die de lijst met gegevenstypen uitsluit bij het beschrijven van DataFrame. De standaardwaarde is Geen.

Geeft terug

Het retourneert de statistische samenvatting van de serie en het dataframe.

Voorbeeld 1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Uitvoer

 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

Voorbeeld2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Uitvoer

 count 4 unique 3 top q freq 2 dtype: object 

Voorbeeld3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Uitvoer

 categorical count 3 unique 3 top u freq 1 

Voorbeeld4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Uitvoer

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0