logo

Chikwadraattoets in R

De chikwadraattoets van onafhankelijkheid evalueert of er een verband bestaat tussen de categorieën van de twee variabelen. Er zijn in principe twee soorten willekeurige variabelen en deze leveren twee soorten gegevens op: numeriek en categorisch. In R-programmeertaal Chi-kwadraatstatistieken worden gebruikt om te onderzoeken of verdelingen van categorische variabelen van elkaar verschillen. De chikwadraattoets is ook nuttig bij het vergelijken van de aantallen of aantallen categorische antwoorden tussen twee (of meer) onafhankelijke groepen.

In R-programmeertaal is de functie die wordt gebruikt voor het uitvoeren van een chikwadraattest chisq.test()> .



Syntaxis:

chisq.test(gegevens)

Java-boon

Parameters:



gegevens : data is een tabel met telwaarden van de variabelen in de tabel.

De onderzoeksgegevens nemen we mee in de MASS> bibliotheek die de gegevens vertegenwoordigt van een enquête onder studenten.

R






# load the MASS package> library>(MASS)> print>(>str>(survey))>

>

>

Uitgang:

'data.frame': 237 obs. of 12 variables:  $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ...  $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ...  $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ...  $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ...  $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ...  $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ...  $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ...  $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ...  $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ...  $ Height: num 173 178 NA 160 165 ...  $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ...  $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL>

Het bovenstaande resultaat laat zien dat de dataset veel factorvariabelen bevat die als categorische variabelen kunnen worden beschouwd. Voor ons model zullen we rekening houden met de variabelen Exer En Rook De kolom Rook registreert de rookgewoonten van de leerlingen, terwijl de kolom Exer hun inspanningsniveau registreert. Ons doel is om de hypothese te testen of de rookgewoonte van studenten onafhankelijk is van hun inspanningsniveau op een significantieniveau van .05.

R




java csv lezen
# Create a data frame from the main data set.> stu_data =>data.frame>(survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data =>table>(survey$Smoke,survey$Exer)> > print>(stu_data)>

>

>

Uitgang:

 Freq None Some  Heavy 7 1 3  Never 87 18 84  Occas 12 3 4  Regul 9 1 7>

En tot slot passen we de chisq.test()> functie toe aan de contingentietabel stu_data.

R




de naam van een directory wijzigen
# applying chisq.test() function> print>(>chisq.test>(stu_data))>

>

>

Uitgang:

 Pearson's Chi-squared test  data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828>

Omdat de p-waarde 0,4828 groter is dan de 0,05, concluderen we dat de rookgewoonte onafhankelijk is van het bewegingsniveau van de leerling en dat er dus een zwakke of geen correlatie bestaat tussen de twee variabelen. De volledige R-code vindt u hieronder.

Samenvattend kan dus worden gezegd dat het heel eenvoudig is om een ​​Chi-kwadraattoets uit te voeren met R. Je kunt deze taak uitvoeren met chisq.test()> functie in R.

Visualiseer de Chi-kwadraattestgegevens

R


laatste trefwoord in Java



# Load required library> library>(MASS)> # Print structure of the survey dataset> print>(>str>(survey))> # Create a data frame for smoking and exercise columns> stu_data <->data.frame>(survey$Smoke, survey$Exer)> stu_data <->table>(survey$Smoke, survey$Exer)> # Print the table> print>(stu_data)> # Perform the Chi-Square Test> chi_result <->chisq.test>(stu_data)> print>(chi_result)> # Visualize the data with a bar plot> barplot>(stu_data, beside =>TRUE>, col =>c>(>'lightblue'>,>'lightgreen'>),> >main =>'Smoking Habits vs Exercise Levels'>,> >xlab =>'Exercise Level'>, ylab =>'Number of Students'>)> # Add legend separately> legend>(>'center'>, legend =>rownames>(stu_data), fill =>c>(>'lightblue'>,>'lightgreen'>))>

>

>

Uitgang:

g

Chikwadraattoets in R

In deze code gebruiken we deMASS>bibliotheek om een ​​Chi-kwadraattest uit te voeren op de ‘enquête’-dataset, waarbij de nadruk ligt op de relatie tussen rookgewoonten en bewegingsniveaus.

Het creëert een kruistabel, voert de statistische test uit en visualiseert de gegevens met behulp van een staafdiagram. De legenda is afzonderlijk toegevoegd aan de linkerbovenhoek, waarbij onderscheid wordt gemaakt tussen verschillende rookgewoonten met verschillende kleuren.

De code heeft tot doel de verbanden tussen rookgedrag en bewegingspraktijken binnen de dataset te onderzoeken en te communiceren.