In dit artikel bespreken we hoe u de standaarddeviatie kunt vinden R-programmeertaal . Standaarddeviatie R is de maat voor de spreiding van de waarden. Het kan ook worden gedefinieerd als de vierkantswortel van de variantie.
Formule van de standaardafwijking van het monster:

waar,
- s = standaardafwijking van het monster
- N = Aantal entiteiten
-
= Gemiddelde van entiteiten
In principe zijn er twee verschillende manieren om de standaardafwijking in de programmeertaal R te berekenen. Beide worden hieronder besproken.
Methode 1: Naïeve aanpak
Bij deze methode voor het berekenen van de standaardafwijking gebruiken we de bovenstaande standaardformule voor de standaardafwijking van het monster in de R-taal.
Voorbeeld 1:
R
v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)> |
>
>
Uitgang:
[1] 25.53886>
Voorbeeld 2:
R
v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)> |
>
>
Uitgang:
[1] 2.676004>
Methode 2: SD() gebruiken
De functie sd() wordt gebruikt om de standaardafwijking te retourneren.
Syntaxis: sd(x, na.rm = ONWAAR)
Parameters:
x: een numerieke vector, matrix of dataframe.na.rm: ontbrekende waarden worden verwijderd?
Opbrengst: De steekproefstandaarddeviatie van x.
Voorbeeld 1:
als anders als anders als java
R
v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)> |
>
>
Uitgang:
[1] 25.53886>
Voorbeeld 2:
R
v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)> |
>
>
Uitgang:
[1] 23.52175>
Voorbeeld 3:
R
v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)> |
>
>
Uitgang:
[1] 2.676004>
Bereken de standaardafwijking van het dataframe:
Met beide methoden kunnen we de standaardafwijking van het dataframe berekenen. we kunnen de irisdataset nemen en voor elke kolom berekenen we de standaardafwijking.
Voorbeeld 1:
R
data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)> |
>
>
Uitgang:
[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>
We kunnen ook de standaardafwijking voor het gehele dataframe berekenen met behulp van de toepassingsfunctie.
R
# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)> |
>
>
Uitgang:
Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>
Kolommen 1 tot en met 4 van de irisgegevensset, de numerieke kolommen met de variabele metingen, worden gekozen met behulp van de uitdrukking iris[, 1:4] in de bovenstaande code.
De sd-functie wordt toegepast op elke kolom (gemarkeerd met 2) van de gekozen subset van de irisgegevensset met behulp van de apply-functie. De resulterende standaarddeviatiewaarden worden voor elke kolom opgeslagen in de std_deviation-vector.
= Gemiddelde van entiteiten