logo

Hoe vindt u de standaarddeviatie in R?

In dit artikel bespreken we hoe u de standaarddeviatie kunt vinden R-programmeertaal . Standaarddeviatie R is de maat voor de spreiding van de waarden. Het kan ook worden gedefinieerd als de vierkantswortel van de variantie.

Formule van de standaardafwijking van het monster:



s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

waar,

  • s = standaardafwijking van het monster
  • N = Aantal entiteiten
  • overlijn{x}= Gemiddelde van entiteiten

In principe zijn er twee verschillende manieren om de standaardafwijking in de programmeertaal R te berekenen. Beide worden hieronder besproken.



Methode 1: Naïeve aanpak

Bij deze methode voor het berekenen van de standaardafwijking gebruiken we de bovenstaande standaardformule voor de standaardafwijking van het monster in de R-taal.

Voorbeeld 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Uitgang:



[1]   25.53886>

Voorbeeld 2:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Uitgang:

[1] 2.676004>

Methode 2: SD() gebruiken

De functie sd() wordt gebruikt om de standaardafwijking te retourneren.

Syntaxis: sd(x, na.rm = ONWAAR)

Parameters:

    x: een numerieke vector, matrix of dataframe.na.rm: ontbrekende waarden worden verwijderd?

Opbrengst: De steekproefstandaarddeviatie van x.

Voorbeeld 1:

als anders als anders als java

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)>
>
>

Uitgang:

[1] 25.53886>

Voorbeeld 2:

R

v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Uitgang:

[1] 23.52175>

Voorbeeld 3:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Uitgang:

[1] 2.676004>

Bereken de standaardafwijking van het dataframe:

Met beide methoden kunnen we de standaardafwijking van het dataframe berekenen. we kunnen de irisdataset nemen en voor elke kolom berekenen we de standaardafwijking.

Voorbeeld 1:

R

data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)>
>
>

Uitgang:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>

We kunnen ook de standaardafwijking voor het gehele dataframe berekenen met behulp van de toepassingsfunctie.

R

# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)>
>
>

Uitgang:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>

Kolommen 1 tot en met 4 van de irisgegevensset, de numerieke kolommen met de variabele metingen, worden gekozen met behulp van de uitdrukking iris[, 1:4] in de bovenstaande code.

De sd-functie wordt toegepast op elke kolom (gemarkeerd met 2) van de gekozen subset van de irisgegevensset met behulp van de apply-functie. De resulterende standaarddeviatiewaarden worden voor elke kolom opgeslagen in de std_deviation-vector.