PANDAS DATAFRAME CORR() METHODE - TECHCODEVIEW.COM

Panda's dataframe.corr() wordt gebruikt om de paarsgewijze correlatie van alle kolommen in het Pandas Dataframe in Python te vinden. Elk NaN waarden worden automatisch uitgesloten. Als u niet-numerieke waarden wilt negeren, gebruikt u de parameter numeriek_only = True. In dit artikel leren we over de DataFrame.corr()-methode in Python .

Pandas DataFrame corr() Methodesyntaxis

Syntaxis: DataFrame.corr(self, method=’pearson’, min_periods=1, numerieke_only = False)

Parameters:

methode:

peerson: standaardcorrelatiecoëfficiënt

kendall: Kendall Tau-correlatiecoëfficiënt

speerman: Spearman-rangcorrelatie

min_perioden: Minimaal aantal waarnemingen vereist per paar kolommen om een geldig resultaat te verkrijgen. Momenteel alleen beschikbaar voor Pearson- en Spearman-correlatie

numeriek_only : Of alleen de numerieke waarden moeten worden bewerkt of niet. Standaard staat deze op False.

Geeft terug: aantal :y : DataFrame

Correlaties van pandagegevens corr() Methode

Een goede correlatie hangt af van het gebruik, maar je kunt gerust zeggen dat je minimaal 0,6 (of -0,6) hebt om van een goede correlatie te spreken. Een eenvoudig voorbeeld om te laten zien hoe correlatie werkt Python .

Python3

import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

Uitvoer

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Voorbeelddataframe maken

Afdrukken van de eerste 10 rijen van het dataframe.

Opmerking: De correlatie van een variabele met zichzelf is 1. Klik op voor een link naar het CSV-bestand Used in Code hier

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

Uitvoer

Gegevenscorrelaties van panda's

Python Pandas DataFrame corr() Methodevoorbeelden

Zoek de correlatie tussen de kolommen met behulp van de Pearson-methode

Hier gebruiken we de functie corr() om de correlatie tussen de kolommen in het dataframe te vinden met behulp van de ‘Pearson’-methode. We hebben slechts vier numerieke kolommen in het Dataframe. Het uitvoerdataframe kan worden geïnterpreteerd alsof voor elke cel de correlatie van de rijvariabele met de kolomvariabele de waarde van de cel is. Zoals eerder vermeld is de correlatie van een variabele met zichzelf 1. Om die reden zijn alle diagonale waarden 1,00.

Python3

# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

Uitvoer

Gegevenscorrelaties van panda's

Zoek de correlatie tussen de kolommen met behulp van de Kendall-methode

Gebruik de functie Pandas df.corr() om de correlatie tussen de kolommen in het dataframe te vinden met behulp van de ‘kendall’-methode. Het uitvoerdataframe kan worden geïnterpreteerd alsof voor elke cel de correlatie van de rijvariabele met de kolomvariabele de waarde van de cel is. Zoals eerder vermeld is de correlatie van een variabele met zichzelf 1. Om die reden zijn alle diagonale waarden 1,00.

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

beperkingen van elektronisch bankieren

Uitvoer

dataframe.corr

TechCodeview

Panda's DataFrame corr()-methode

Pandas DataFrame corr() Methodesyntaxis

Correlaties van pandagegevens corr() Methode

Python3

Voorbeelddataframe maken

Python3

Python Pandas DataFrame corr() Methodevoorbeelden

Zoek de correlatie tussen de kolommen met behulp van de Pearson-methode

Python3

Zoek de correlatie tussen de kolommen met behulp van de Kendall-methode

Python3