logo

Variantie

Variantie is een meetwaarde die wordt gebruikt om te achterhalen hoe de gegevens zijn verspreid over de gemiddelde of de gemiddelde waarde van de dataset. Het wordt gebruikt om te achterhalen hoe de distributiegegevens zijn verspreid over het gemiddelde of de gemiddelde waarde. Het symbool dat wordt gebruikt om de variantie te definiëren is σ2. Het is het kwadraat van de standaarddeviatie.

Er zijn twee soorten variantie die in statistieken worden gebruikt:



  • Steekproefvariantie
  • Bevolkingsvariantie

De populatievariantie wordt gebruikt om te bepalen hoe elk gegevenspunt in een bepaalde populatie fluctueert of verspreid is, terwijl de steekproefvariantie wordt gebruikt om het gemiddelde van de gekwadrateerde afwijkingen van het gemiddelde te vinden.

In dit artikel zullen we meer te weten komen Variantie (steekproef, populatie), hun formules, eigenschappen en andere in detail.

Inhoudsopgave



Wat is variantie?

We meten de verschillende waarden van de gegevens en deze waarden worden voor verschillende doeleinden gebruikt. De gegevens kunnen in twee typen worden gegeven: gegroepeerde gegevens of niet-gegroepeerde (afzonderlijke) gegevens. Als de gegevens worden gegeven in de vorm van klasse-intervallen, worden dit gegroepeerde gegevens genoemd, terwijl als de gegevens worden gegeven in de vorm van een enkel gegevenspunt, dit een discreet of niet-gegroepeerd gegevenspunt wordt genoemd. Variantie is de maatstaf voor de spreiding van de gegevens met betrekking tot de gemiddelde waarde van de gegevens. Het vertelt ons hoe de gegevens zijn verspreid in de gegeven gegevenswaarde. We kunnen eenvoudig de steekproefvariantie en populatievariantie berekenen voor zowel gegroepeerde als niet-gegroepeerde gegevens.

Variantiedefinitie

Variantie is een statistische maatstaf die de spreiding of spreiding van een reeks gegevenspunten kwantificeert. Het geeft aan hoeveel de individuele datapunten in een dataset verschillen van het gemiddelde (gemiddelde) van de dataset

Soorten variantie

We kunnen de variantie van de gegeven gegevens in twee typen definiëren:



  • Bevolkingsvariantie
  • Steekproefvariantie

Laten we ze nu in detail leren kennen.

Bevolkingsvariantie

Populatievariantie wordt gebruikt om de spreiding van de gegeven populatie te vinden. De bevolking wordt gedefinieerd als een groep mensen en alle mensen in die groep maken deel uit van de bevolking. Het vertelt ons hoe de populatie van een groep varieert ten opzichte van de gemiddelde populatie.

Alle leden van een groep worden de populatie genoemd. Als we willen ontdekken hoe elk datapunt in een bepaalde populatie varieert of verspreid is, gebruiken we de populatievariantie. Het wordt gebruikt om de kwadratische afstand van elk gegevenspunt tot het populatiegemiddelde weer te geven.

Steekproefvariantie

Als de populatiegegevens erg groot zijn, wordt het moeilijk om de populatievariantie van de dataset te berekenen. In dat geval nemen we een steekproef van gegevens uit de gegeven dataset en vinden de variantie van die dataset, die steekproefvariantie wordt genoemd. Bij het berekenen van het steekproefgemiddelde zorgen we ervoor dat we het steekproefgemiddelde berekenen, d.w.z. het gemiddelde van de steekproefgegevensset en niet het populatiegemiddelde. We kunnen de steekproefvariantie definiëren als het gemiddelde van het kwadraat van het verschil tussen het steekproefgegevenspunt en het steekproefgemiddelde.

Variantie-symbool

Het symbool voor variantie wordt doorgaans weergegeven door de Griekse letter sigma kwadraat (σ²) wanneer wordt verwezen naar de populatievariantie. Voor steekproefvariantie wordt dit vaak aangegeven met s².

Variantie voorbeeld

We kunnen het concept variantie begrijpen met behulp van het hieronder besproken voorbeeld.

Zoek de populatievariantie van de gegevens {4,6,8,10}

Oplossing:

Gemiddelde = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
10 (10-7)2 9

Variantie = (9+1+1+9)/4 = 20/4 = 5

De variantie van de gegevens is dus 5

Variantieformule

De variantie voor een dataset wordt aangegeven met het symbool σ2. Voor populatiegegevens is de formule gelijk aan de som van de kwadratische verschillen tussen gegevensinvoer en het gemiddelde, gedeeld door het aantal invoer. Terwijl we voor voorbeeldgegevens de tellerwaarde delen door het verschil tussen het aantal vermeldingen en de eenheid.

Voorbeeldvariantieformule

Als de dataset een steekproef is, wordt de variantieformule gegeven door:

P 2 = ∑ (x i - X) 2 /(n – 1)

waar,

  • X is het gemiddelde van de voorbeeldgegevensset
  • N is het totale aantal waarnemingen

Formule voor populatievariantie

Als we een populatiegegevensset hebben, wordt de formule geschreven als:

P 2 = ∑ (x i - X) 2 /N

waar,

  • X is het gemiddelde van de populatiegegevensset
  • N is het totale aantal waarnemingen

We kunnen ook de variantie berekenen voor gegroepeerde en niet-gegroepeerde datasets. Verschillende formules voor de variantie zijn:

verilog altijd

Variantieformule voor gegroepeerde gegevens

Voor gegroepeerde gegevens wordt de variantieformule hieronder besproken:

Voorbeeldvariantieformule voor gegroepeerde gegevens (σ 2 ) = ∑ f(m i - X) 2 /(n-1)

Bevolkingsvariantieformule voor gegroepeerde gegevens (P 2 ) = ∑ f(m i - X) 2 /N

waar,

  • F is de frequentie van elk interval
  • M i is het middelpunt van de ieinterval
  • X is het gemiddelde van de gegroepeerde gegevens

Voor gegroepeerde gegevens wordt het gemiddelde berekend als:

Gemiddelde = ∑ (f i X i ) / ∑ f i

Variantieformule voor niet-gegroepeerde gegevens

Voor niet-gegroepeerde gegevens wordt de variantieformule hieronder besproken:

  • Voorbeeldvariantieformule voor niet-gegroepeerde gegevens (P 2 ) = ∑ (x i - X) 2 /(n-1)
  • Bevolkingsvariantieformule voor niet-gegroepeerde gegevens (P 2 ) = ∑ (x i - X) 2 /N

waar X is het gemiddelde van de gegroepeerde gegevens

Formule voor het berekenen van variantie

De formule die wordt gebruikt voor het berekenen van de variantie wordt besproken in de onderstaande afbeelding,

Variantieformule

Hoe variantie berekenen?

Over het algemeen betekent variantie populatiestandaardvariantie. De stappen om de variantie van een gegeven reeks waarden te berekenen zijn:

Stap 1: Bereken het gemiddelde van de waarneming met behulp van de formule (Gemiddelde = Som van waarnemingen/aantal waarnemingen)

Stap 2: Bereken de gekwadrateerde verschillen tussen de gegevenswaarden en het gemiddelde. (Gegevenswaarde – Gemiddelde)2

Stap 3: Bereken het gemiddelde van de gekwadrateerde verschillen van de gegeven waarden, die de variantie van de dataset worden genoemd.

(Variantie = som van gekwadrateerde verschillen / aantal waarnemingen)

Variantie en standaarddeviatie

Variantie en Standaardafwijking beide zijn maatstaven van de centrale tendens die wordt gebruikt om ons te vertellen in hoeverre de waarden van de dataset afwijken ten opzichte van de centrale of de gemiddelde waarde van de dataset.

Er is een duidelijke relatie tussen variantie en standaarddeviatie voor elke gegeven dataset.

Variantie = (standaardafwijking) 2

Variantie wordt gedefinieerd als het kwadraat van de standaardafwijking, dat wil zeggen dat het kwadraat van de standaardafwijking voor een groep gegevens ons de variantie van die gegevensset oplevert. variantie wordt gedefinieerd met behulp van het symbool P 2 terwijl P wordt gebruikt om de standaarddeviatie van de dataset te definiëren. De variantie van de dataset wordt uitgedrukt in kwadratische eenheden, terwijl de standaardafwijking van de dataset wordt uitgedrukt in een eenheid die vergelijkbaar is met het gemiddelde van de dataset.

Kom meer te weten: Variantie en standaarddeviatie

Variantie van binomiale verdeling

Binomiale verdeling is de discrete waarschijnlijkheidsverdeling die ons het aantal positieve uitkomsten vertelt in een binomiaal experiment dat n aantal keren wordt uitgevoerd. De uitkomst van het binomiale experiment is 0 of 1, dat wil zeggen positief of negatief.

In het binomiale experiment van N proeven en waar de waarschijnlijkheid van elke poging wordt gegeven P , dan wordt de variantie van de binominale verdeling gegeven met behulp van,

P 2 = np (1 – p)

waar 'bijvoorbeeld' wordt gedefinieerd als het gemiddelde van de waarden van de binominale verdeling.

Variantie van Poisson-verdeling

Vergiftiging distributie wordt gedefinieerd als een discrete waarschijnlijkheidsverdeling die wordt gebruikt om de waarschijnlijkheid te definiëren dat het ‘n’ aantal gebeurtenissen plaatsvindt binnen de ‘x’ tijdsperiode. Het gemiddelde in de Poisson-verdeling wordt gedefinieerd door het symbool l.

In de Poisson-verdeling zijn het gemiddelde en de variantie van de gegeven dataset gelijk. De variantie van de Poisson-verdeling wordt gegeven met behulp van de formule:

P 2 = λ

Variantie van uniforme distributie

Bij een uniforme verdeling zijn de kansverdelingsgegevens continu. De uitkomst van deze experimenten ligt in het bereik tussen een specifieke bovengrens en een specifieke ondergrens en daarom worden deze verdelingen ook wel rechthoekige verdelingen genoemd. Als de bovengrens of de maximumgrens is B en de ondergrens of de minimumgrens is a, dan wordt de variantie van de uniforme verdeling berekend met behulp van de formule,

P 2 = (1/12)(b – een) 2

Het gemiddelde van de uniforme verdeling wordt gegeven met behulp van de formule:

Gemiddelde = (b + a) / 2

waar,

  • B is de bovengrens van de uniforme verdeling
  • A is de ondergrens van de uniforme verdeling

Variantie en covariantie

Variantie van de dataset definieert de volatiliteit van alle waarden van de dataset ten opzichte van de gemiddelde waarde van de dataset. Covariantie vertelt ons hoe de willekeurige variabelen met elkaar verband houden en hoe de verandering in de ene variabele de verandering in andere variabelen beïnvloedt.

Covariantie kan positief of negatief zijn, de positieve covariantie betekent dat beide variabelen in dezelfde richting bewegen ten opzichte van de gemiddelde waarde, terwijl negatieve covariantie betekent dat beide variabelen in tegengestelde richtingen bewegen ten opzichte van de gemiddelde waarde.

Voor twee willekeurige variabelen x en y waarbij x de afhankelijke variabele is en y de onafhankelijke variabele, wordt de covariantie berekend met behulp van de formule die wordt vermeld in de onderstaande bijgevoegde afbeelding.

Covariantieformule

Variantie-eigenschappen

Variantie wordt veel gebruikt in de wiskunde, statistiek en andere takken van de wetenschap voor verschillende doeleinden. Variantie heeft verschillende eigenschappen die op grote schaal worden gebruikt voor het oplossen van verschillende problemen. Enkele van de basiseigenschappen van de variantie zijn:

  • De variantie van de dataset is de niet-negatieve grootheid en de nulwaarde van de variantie betekent dat alle waarden van de dataset gelijk zijn.
  • Een hogere waarde van de variantie vertelt ons dat alle datawaarden van de dataset wijd verspreid zijn, dat wil zeggen dat ze ver verwijderd zijn van de gemiddelde waarde van de dataset.
  • Een lagere waarde van de variantie vertelt ons dat alle datawaarden van de dataset dicht bij elkaar liggen, dat wil zeggen dat ze zeer dicht bij de gemiddelde waarde van de dataset liggen.

Voor elke constante ‘c’

  • Var(x + c) = Var(x)

waar X is een willekeurige variabele

  • Var(cx) = c2

waar X is een willekeurige variabele

mysql-gebruikerslijst

Ook als A En B zijn de constante waarde en X is dan een willekeurige variabele,

  • Var(ax + b) = a2

Voor onafhankelijke variabelen x1, X2, X3…,XNwe weten dat,

  • Waar(x1+x2+……+xN) = Var(x1) + Waar(x2) +……..+Waar(xN)

Mensen lezen ook:

  • Gemeen
  • Modus
  • Verschil tussen variantie en standaarddeviatie

Voorbeelden van variantieformule

Voorbeeld 1: Bereken de variantie van de voorbeeldgegevens: 7, 11, 15, 19, 24.

Oplossing:

We hebben de gegevens 7, 11, 15, 19, 24

Zoek het gemiddelde van de gegevens.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

Met behulp van de formule voor variantie die we krijgen,

P2= ∑ (xi- X)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2

Voorbeeld 2: Bereken het aantal waarnemingen als de variantie van de gegevens 12 is en de som van de gekwadrateerde verschillen van de gegevens ten opzichte van het gemiddelde 156 is.

Oplossing:

We hebben,

(Xi- X)2= 156

P2= 12

Met behulp van de formule voor variantie die we krijgen,

P2= ∑ (xi- X)2/N

12 = 156/n

n = 156/12

n = 13

Voorbeeld 3: Bereken de variantie voor de gegeven gegevens

Xi

Fi

10 1
4 3
6 5
8 1

Oplossing:

Gemiddelde (x̄) = ∑(fiXi)/∑(vi)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(fi) = 1+3+5+1 = 10

Xi

Fi

FiXi

(Xi- X)

(Xi- X)2

Fi(Xi- X)2

10 1 10 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

Nu,

P 2 = (∑ i N F i (X i - X) 2 /N)

= [(16 + 12 + 0 +8)/10]
= 3,6

Variantie(σ2) = 3,6

Voorbeeld 4: Zoek de variantie van de volgende gegevenstabel

Klas

Frequentie

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

Oplossing:

Klas

Xi

Fi

f×Xi

Xi – μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

10 van 100,00

3

vijftien

-vijftien

225

675

10-20

vijftien

6

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

vijftien

225

450

40-50

Vier vijf

1

Vier vijf

25

625

625

Totaal

16

320

2000

Gemiddelde (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

P 2 = (∑ i N F i (X i - M) 2 /N)

= [(2000)/(16)]
= (125)

De variantie van de gegeven dataset is 125.

Samenvatting – Variantie

Variantie is een statistische maatstaf die laat zien hoeveel de waarden in een dataset verschillen van het gemiddelde. Het helpt ons de spreiding of verspreiding van datapunten te begrijpen. Er zijn twee hoofdtypen variantie: populatievariantie, die meet hoe gegevenspunten in een hele populatie zich verspreiden, en steekproefvariantie, die meet hoe gegevenspunten in een steekproef zich verspreiden. De variantie wordt aangegeven met σ² en is het kwadraat van de standaarddeviatie. Om de variantie te berekenen, zoekt u het gemiddelde van de gegevens, trekt u het gemiddelde van elk gegevenspunt af, kwadrateert u de verschillen en middelt u deze gekwadrateerde verschillen. Variantie is belangrijk omdat het ons helpt de variabiliteit binnen een dataset te begrijpen. Een hoge variantie geeft aan dat de gegevenspunten wijd verspreid zijn, terwijl een lage variantie aangeeft dat ze dicht bij het gemiddelde liggen. Variantie is altijd niet-negatief, omdat het gaat om het kwadrateren van de verschillen.

Veelgestelde vragen over variantie

Wat is variantie in statistieken?

Variantie wordt gedefinieerd als de spreiding van de waarden van de dataset ten opzichte van de gemiddelde waarde van de dataset. De variantie van de dataset geeft aan in welke mate de waarden in een bepaalde dataset afwijken van de gemiddelde waarde.

Wat is het symbool van variantie?

We gebruiken de symbolen σ2, s2 en Var(x) om de variantie van de dataset aan te geven.

Wat is de variantieformule?

De variantie van de dataset wordt berekend met behulp van de formule:

P 2 = E[( X – m ) 2 ]

Wat vertelt variantie?

Variantie wordt gebruikt om de omvang van de spreiding van de gegevens te bepalen, dat wil zeggen dat het ons vertelt hoe de waarden in een dataset zijn verspreid ten opzichte van de gemiddelde waarde. Voor de grotere variantiewaarde zijn de waarden wijd verspreid ten opzichte van de gemiddelde waarde, terwijl voor de kleinere variantiewaarde de waarden nauw gespreid zijn ten opzichte van de gemiddelde waarde

Wat is de relatie tussen variantie en standaarddeviatie?

Voor de gegeven dataset is de variantie van de dataset het kwadraat van de standaarddeviatie van die dataset. Deze relatie wordt uitgedrukt als,

Variantie = (standaardafwijking) 2

Hoe bereken je de variantie?

Om de variantie te berekenen, zoekt u eerst het gemiddelde (gemiddelde) van de dataset. Trek vervolgens het gemiddelde van elk gegevenspunt af en kwadraat het resultaat. Bereken ten slotte het gemiddelde van deze kwadratische verschillen.

Waarom is variantie belangrijk?

Variantie is cruciaal voor het begrijpen van de distributie van gegevens binnen een dataset. Het helpt bij het bepalen hoe verspreid de gegevenspunten zich bevinden ten opzichte van de gemiddelde waarde, en geeft de variabiliteit of consistentie binnen de gegevens aan.

Wat is het verschil tussen variantie en standaarddeviatie?

Hoewel zowel de variantie als de standaarddeviatie de gegevensspreiding meten, is de standaarddeviatie de vierkantswortel van de variantie. De standaardafwijking wordt uitgedrukt in dezelfde eenheden als de gegevens, waardoor deze beter interpreteerbaar zijn voor het aangeven van de spreiding.

Kan variantie negatief zijn?

Nee, de variantie kan niet negatief zijn. Omdat het wordt berekend als het gemiddelde van de gekwadrateerde verschillen met het gemiddelde, is de resulterende waarde altijd niet-negatief.