logo

Boxplots in R-taal

Een boxgrafiek is een diagram dat wordt gebruikt om informatie in de vorm van distributie weer te geven door voor elk ervan boxplots te tekenen. Deze gegevensverdeling is gebaseerd op vijf sets (minimum, eerste kwartiel, mediaan, derde kwartiel en maximum).

Boxplots in R-programmeertaal

Boxplots worden in R gemaakt met behulp van de boxplot() functie.



Syntaxis: boxplot(x, data, notch, varwidth, namen, hoofd)

Parameters:

    x: Deze parameter wordt ingesteld als een vector of een formule. data: Deze parameter stelt het dataframe in. notch: Deze parameter is het label voor de horizontale as. varwidth: Deze parameter is een logische waarde. Stel deze in op True om de breedte van het vak te tekenen die evenredig is aan de steekproefomvang. main: Deze parameter is de titel van het diagram. namen: deze parameter zijn de groepslabels die onder elke boxplot worden weergegeven.

Een gegevensset maken

Om te begrijpen hoe we een boxplot kunnen maken:



  • Wij gebruiken de dataset mtcars.
  • Laten we eens kijken naar de kolommen mpg en cil in mtcars.

R




maat latex lettertype



input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))>

>

>

Uitgang:

 mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>

Het maken van de boxplot

Het maken van de Boxplot-grafiek.

  • Neem de parameters die nodig zijn om een ​​boxplot te maken.
  • Nu tekenen we een grafiek voor de relatie tussen mpg en cil.

R




# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)>

>

>

Uitgang:

Boxplot in RGeeksforgeeks

Boxplot in R

Boxplot met notch

Een boxplot tekenen met een inkeping:

  • Met behulp van Notch kunnen we ontdekken hoe de medianen van verschillende gegevensgroepen met elkaar overeenkomen.

R


Java-parseint



# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)>

>

>

Uitgang:

Boxplot in RGeeksforgeeks

Boxplot in R

kleur: Gebruikt een vector van kleuren (my_colors) om de vulkleur van de vakken te wijzigen.
grenzen: Stelt de kleur van de kaderranden in op zwart.
inkeping: Om de betrouwbaarheidsintervallen te illustreren, is er een inkeping aan de vakjes toegevoegd.
kerfbreedte: Beheert de breedte van de inkepingen.
dokter: Maakt de kleur van de middenlijn wit.
garde: Stelt de kleur van de snorharen in op zwart met het commandowhiskycol.
boxwex: Wijzigt de breedte van de vakken.
uit : stelt de vormen van de uitschieters in op volle cirkels.
uitkomst: Verandert de kleur van de uitschieters naar zwart.

Meerdere boxplots

Hier maken we meerdere boxplots. De individuele gegevens waarvoor een boxplot-weergave nodig is, zijn gebaseerd op de functie.

R




# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))>

>

int parseint
>

Uitgang:

Meerdere boxplots in RGeeksforgeeks

Meerdere boxplots in R

  • In deze code beginnen we met het opsommen van de variabelen in de variabelenvector waarvoor we boxplots willen maken. Ik heb in dit voorbeeld mpg, disp, hp en wt toegevoegd, maar u kunt deze lijst aanpassen aan uw behoeften.
  • De diagramindeling wordt vervolgens gemaakt met behulp van de par-functie en de syntaxis mfrow = c(1, lengte(variabelen)), die een raster genereert met één rij en evenveel kolommen als er variabelen zijn in de variabelenvector.
  • We gebruiken de boxplot-functie binnen de lus om voor elke variabele een boxplot te genereren. De functie get(var) haalt dynamisch de overeenkomende kolomwaarden uit de gegevensset. Met behulp van de gegeven instellingen veranderen we het uiterlijk van elke boxplot.