logo

Gemiddelde, variantie en standaarddeviatie

Gemiddelde, variantie en standaarddeviatie zijn essentiële statistische metingen. Variantie kwantificeert de afwijking van het datapunt ten opzichte van het gemiddelde, terwijl de standaarddeviatie de dataverdeling meet. Het belangrijkste onderscheid ligt in het feit dat de standaarddeviatie in dezelfde eenheden ligt als het gemiddelde, terwijl de variantie in kwadratische eenheden is. Duik dieper in deze concepten met definities, formules en een illustratief voorbeeld.

Gemeen

Gemeen is het gemiddelde van een gegeven reeks gegevens. Laten we het onderstaande voorbeeld bekijken



2, 4, 4, 4, 5, 5, 7, 9

Deze acht gegevenspunten hebben het gemiddelde (gemiddelde) van 5:

frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

Formule: mu=frac{sum_{i=1}^{N} x_{i}}{N}

Waar ? is gemiddeld en x1, X2, X3…., Xizijn elementen. Merk ook op dat gemiddelde soms wordt aangegeven met egin{array}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (- 1)^2 = 1 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4  (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16.  end{matrix}

Variantie

Variantie is de som van de kwadraten van de verschillen tussen alle getallen en gemiddelden.
Afwijking voor bovenstaand voorbeeld. Bereken eerst de afwijkingen van elk gegevenspunt ten opzichte van het gemiddelde, en kwadraat het resultaat van elk gegevenspunt:

Formule: sigma^{2}= frac { sum_{i=1}^{N} (x_{i}-mu)^{2}}{N}

variantie = 	extup{Variatiecoëfficiënt } =frac{ 	extup{Standaardafwijking}}{Gemiddelde}*100= 4.



Waar ? is het gemiddelde, N is het totale aantal elementen of de distributiefrequentie.


Standaardafwijking

Standaardafwijking is de wortel van de variantie. Het is een maatstaf voor de mate waarin gegevens afwijken van het gemiddelde.

Standaardafwijking (voor bovenstaande gegevens) = = 2

Waarom kozen wiskundigen een kwadraat en vervolgens een vierkantswortel om de afwijking te vinden, waarom namen ze niet simpelweg het verschil in waarden?
Eén reden is dat de som van de verschillen 0 wordt volgens de definitie van gemiddelde. De som van absolute verschillen zou een optie kunnen zijn, maar met absolute verschillen was het moeilijk om veel mooie stellingen te bewijzen. [Bron: MIT-videolezing om 1:19]



  1. De waarde van de standaardafwijking is 0 als alle invoergegevens hetzelfde zijn.
  2. Als we een getal, bijvoorbeeld 7, optellen (of aftrekken) bij alle waarden in de invoerset, wordt het gemiddelde met 7 verhoogd (of verlaagd), maar verandert de standaarddeviatie niet.
  3. Als we alle waarden in de invoerset vermenigvuldigen met een getal 7, worden zowel het gemiddelde als de standaarddeviatie vermenigvuldigd met 7. Maar als we alle invoerwaarden vermenigvuldigen met een negatief getal, bijvoorbeeld -7, wordt het gemiddelde vermenigvuldigd met -7, maar de standaarddeviatie wordt vermenigvuldigd met 7.
  4. Standaarddeviatie en variantie is een maatstaf die aangeeft hoe verspreid de cijfers zijn. Terwijl de variantie u een globaal beeld geeft van de spreiding, is de standaarddeviatie concreter, waardoor u exacte afstanden tot het gemiddelde krijgt.
  5. Gemiddelde, mediaan en modus zijn de maatstaf voor de centrale tendens van gegevens (gegroepeerd of niet-gegroepeerd).

Rekening:

  • Variantie en standaarddeviatie
  • Real-life toepassingen van standaarddeviatie
  • Verschil tussen variantie en standaarddeviatie

Onderstaande vragen zijn gesteld tijdens de GATE-examens van vorig jaar Referenties:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm

Gemiddelde, variantie en standaarddeviatie – Veelgestelde vragen

Wat is het verschil tussen standaarddeviatie en variantie?

Standaarddeviatie en variantie meten beide de spreiding van datapunten in een dataset ten opzichte van het gemiddelde. Het belangrijkste verschil is dat de variantie het gemiddelde meet van de kwadratische afwijkingen van het gemiddelde, terwijl de standaarddeviatie de vierkantswortel is van de variantie, wat een maatstaf voor de spreiding oplevert in dezelfde eenheden als de gegevens.



Hoe berekent u het gemiddelde, de variantie en de standaarddeviatie?

  • Betekenis: tel alle getallen bij elkaar op en deel door het aantal getallen.
  • Variantie: Bereken het gemiddelde, trek het gemiddelde van elk getal af, kwadraat het resultaat, tel deze gekwadrateerde resultaten bij elkaar op en deel door het aantal getallen min één.
  • Standaarddeviatie: Neem de wortel van de variantie.

Waarom zijn gemiddelde, variantie en standaarddeviatie belangrijk?

Deze statistische metingen zijn cruciaal voor het begrijpen van de distributie van gegevens. Het gemiddelde biedt een centrale waarde, terwijl variantie en standaarddeviatie inzicht geven in de variabiliteit of spreiding van de gegevens, wat de consistentie of volatiliteit van de dataset aangeeft.

Kunnen variantie en standaarddeviatie negatief zijn?

Nee, variantie en standaarddeviatie kunnen niet negatief zijn. De variantie wordt berekend als het gemiddelde van de gekwadrateerde verschillen met het gemiddelde, wat resulteert in een niet-negatieve waarde. Omdat de standaarddeviatie de vierkantswortel van de variantie is, kan deze ook niet negatief zijn.

Hoe beïnvloeden uitschieters het gemiddelde, de variantie en de standaarddeviatie?

Uitschieters kunnen het gemiddelde aanzienlijk beïnvloeden door het naar de uitbijterwaarde te trekken, waardoor de centrale tendens van de dataset niet nauwkeurig wordt weerspiegeld. De variantie en de standaarddeviatie worden ook beïnvloed omdat ze zullen toenemen, wat wijst op een grotere spreiding van de gegevens als gevolg van de uitbijter(s).