logo

Nominale versus ordinale gegevens

Datawetenschap draait om de verwerking en analyse van gegevens met behulp van een reeks tools en technieken. In de huidige datagestuurde wereld komen we soorten gegevens tegen die elk verwerking en interpretatie vereisen. Het is belangrijk om verschillende soorten gegevens te begrijpen voor een goede gegevensanalyse en statistische interpretatie. Het type gegevens bepaalt de juiste statistische methoden en bewerkingen die moeten worden gebruikt. Verschillende gegevenstypen hebben verschillende analyse- en interpretatiemethoden nodig om significante conclusies te trekken. In dit artikel zullen we het concept van data verkennen, en de betekenis ervan, voorbeelden uit de praktijk geven en u begeleiden bij manieren om ermee te werken.

Meetniveaus

Voordat u een dataset analyseert, is het van cruciaal belang om het type gegevens dat deze bevat te identificeren. Gelukkig kunnen alle gegevens in een van de vier categorieën worden gegroepeerd: nominale, ordinale, interval- of ratiogegevens. Hoewel dit vaak gegevenstypen worden genoemd, zijn het in feite verschillende meetniveaus. Het meetniveau weerspiegelt de nauwkeurigheid waarmee een variabele is gekwantificeerd, en bepaalt de methoden die kunnen worden gebruikt om inzichten uit de gegevens te halen.



De vier gegevenscategorieën zijn niet altijd eenvoudig te onderscheiden en behoren in plaats daarvan tot een hiërarchie, waarbij elk niveau voortbouwt op het voorgaande.

1

Er zijn vier soorten gegevens: categorisch, die verder kunnen worden onderverdeeld in nominaal en ordinaal, en numeriek, die verder kunnen worden onderverdeeld in interval en ratio. De nominale en ordinale schalen zijn relatief onnauwkeurig, waardoor ze gemakkelijker te analyseren zijn, maar ze bieden minder nauwkeurige inzichten. Aan de andere kant zijn de interval- en ratioschalen complexer en moeilijker te analyseren, maar ze hebben het potentieel om veel rijkere inzichten te bieden.



  • Nominale gegevens – Nominale gegevens zijn een basisgegevenstype dat gegevens categoriseert door waarden zoals geslacht, haarkleur of diersoorten te labelen of te benoemen. Er is geen hiërarchie.
  • Ordinale gegevens – Ordinale gegevens omvatten het classificeren van gegevens op basis van rang, zoals sociale status, in categorieën als ‘rijk’, ‘middeninkomen’ of ‘arm’. Er zijn echter geen vaste intervallen tussen deze categorieën.
  • Intervalgegevens – Intervalgegevens zijn een manier om gegevens te organiseren en te vergelijken, inclusief gemeten intervallen. Temperatuurschalen, zoals Celsius of Fahrenheit, zijn goede voorbeelden van intervalgegevens. Intervalgegevens hebben echter geen echt nulpunt, wat betekent dat een meting van nul nog steeds een kwantificeerbare maatstaf kan vertegenwoordigen (zoals nul graden Celsius, wat gewoon een ander punt op de schaal is en niet betekent dat er feitelijk geen temperatuur aanwezig is). .
  • Verhoudingsgegevens – Het meest ingewikkelde meetniveau zijn verhoudingsgegevens. Net als bij intervalgegevens worden gegevens gecategoriseerd en gerangschikt, waarbij gebruik wordt gemaakt van gemeten intervallen. Maar in tegenstelling tot intervalgegevens bevatten verhoudingsgegevens een echte nul. Wanneer een variabele nul is, is die variabele niet aanwezig. Een goed voorbeeld van verhoudingsgegevens is de hoogtemeting, die niet negatief kan zijn.

Wat zijn nominale gegevens?

Categorische gegevens, ook wel nominale gegevens genoemd, zijn een cruciaal type informatie dat wordt gebruikt op diverse gebieden, zoals onderzoek, statistiek en data-analyse. Het bestaat uit categorieën of labels die helpen bij het classificeren en ordenen van gegevens. Het essentiële kenmerk van categorische gegevens is dat ze geen inherente volgorde of rangorde binnen de categorieën hebben. In plaats daarvan zijn deze categorieën gescheiden, verschillend en sluiten ze elkaar uit.

2

Nominale gegevens worden bijvoorbeeld gebruikt om informatie in verschillende labels of categorieën te classificeren, zonder enige natuurlijke volgorde of rangschikking. Deze labels of categorieën worden weergegeven met namen of termen, en er bestaat geen natuurlijke volgorde of rangorde tussen. Nominale gegevens zijn nuttig voor kwalitatieve classificatie en organisatie van informatie, waardoor onderzoekers en analisten datapunten kunnen groeperen op basis van specifieke attributen of kenmerken zonder enige numerieke relaties te impliceren.



  • Oogkleurcategorieën zoals blauw of groen vertegenwoordigen nominale gegevens. Elke categorie is verschillend, zonder volgorde of rangorde.
  • Smartphonemerken zoals iPhone of Samsung zijn nominale gegevens. Er is geen hiërarchie tussen merken.
  • Vervoerswijzen zoals auto of fiets zijn nominale gegevens. Het zijn discrete categorieën zonder inherente volgorde.

Kenmerken van nominale gegevens

  • Gegevens die als nominaal zijn geclassificeerd, bestaan ​​uit categorieën die volledig gescheiden en verschillend van elkaar zijn.
  • Gegevens die onder de nominale categorie vallen, worden onderscheiden door beschrijvende labels in plaats van door een numerieke of kwantitatieve waarde
  • Nominale gegevens kunnen niet hiërarchisch worden gerangschikt of geordend, aangezien geen enkele categorie superieur of inferieur is aan een andere.

Voorbeeld

Hier volgen enkele voorbeelden van hoe nominale gegevens worden gebruikt om informatie in verschillende en niet-geordende categorieën te classificeren en te categoriseren:

1. Kleuren van auto: Autokleuren zijn nominale gegevens, met duidelijke categorieën, maar zonder inherente volgorde of rangorde. Elke auto valt onder één kleurcategorie, zonder enig logisch of numeriek verband tussen kleuren.

2. Soorten fruit: Fruitcategorieën in een mand zijn nominaal. Elke vrucht behoort tot een specifieke categorie zonder hiërarchie of volgorde. Alle categorieën zijn verschillend en discreet.

3. Filmgenres: Filmgenres zijn nominale gegevens, omdat er geen rangorde bestaat tussen categorieën als actie of komedie. Elk genre is uniek, maar alleen op basis van deze gegevens kunnen we niet zeggen of het ene beter is dan het andere.

Wat zijn ordinale gegevens?

Ordinale gegevens zijn een vorm van kwalitatieve gegevens die variabelen in beschrijvende categorieën classificeren. Het wordt gekenmerkt door het feit dat de categorieën die het gebruikt op een soort hiërarchische schaal zijn gerangschikt, bijvoorbeeld van hoog naar laag. Ordinale gegevens zijn na nominale gegevens het meest gecompliceerde type meting. Hoewel het ingewikkelder is dan nominale gegevens, die geen enkele inherente volgorde hebben, is het nog steeds relatief simplistisch.

3

Ordinale gegevens zijn bijvoorbeeld een type gegevens dat wordt gebruikt om items met een betekenisvolle hiërarchie of volgorde te categoriseren. Deze categorieën helpen ons verschillende prestaties, posities of prestaties van leerlingen te vergelijken en te rangschikken, zelfs als de onderlinge afstanden niet gelijk zijn. Ordinale gegevens zijn nuttig voor het begrijpen van geordende keuzes of voorkeuren en voor het beoordelen van relatieve verschillen.

  • Schoolcijfers: Cijfers zoals A, B en C zijn ordinale gegevens, gerangschikt op prestatie, maar de intervallen daartussen variëren.
  • Opleidingsniveau: Niveaus zoals middelbare school, bachelor en master zijn ordinale gegevens, geordend op opleidingsniveau, maar de verschillen tussen niveaus verschillen.
  • Anciënniteitsniveau: Functieniveaus zoals instapniveau, middenniveau en senior zijn ordinale gegevens die een hiërarchie aangeven, maar de kloof verschilt per functie en sector.

Kenmerken van ordinale gegevens

  • Ordinale gegevens vallen onder de categorie niet-numerieke en categorische gegevens, maar kunnen nog steeds numerieke waarden als labels gebruiken.
  • Ordinale gegevens worden altijd gerangschikt in een hiërarchie (vandaar de naam ‘ordinaal’).
  • Ordinale gegevens kunnen worden gerangschikt, maar hun waarden zijn niet gelijkmatig verdeeld.
  • Met ordinale gegevens kunt u de frequentieverdeling, modus, mediaan en bereik van variabelen berekenen.

Voorbeeld

Hier volgen enkele voorbeelden van hoe ordinale gegevens worden gebruikt in velden en domeinen:

1. Educatieve niveaus: Ordinale gegevens worden vaak gebruikt om opleidingsniveaus weer te geven, zoals school, bachelordiploma, masterdiploma en Ph.D. Deze niveaus hebben een volgorde.

2. Klanttevredenheidsbeoordelingen: Een andere toepassing van data is klanttevredenheidsonderzoek. Bij deze onderzoeken wordt respondenten vaak gevraagd hun ervaring te beoordelen op een schaal van slecht tot uitstekend.

3. Economische klassen: Klassen, waaronder de middenklasse en de hogere klasse, kunnen op basis van hun rangorde worden geclassificeerd als ordinale gegevens.

Deze voorbeelden demonstreren de manieren waarop ordinale gegevens in verschillende velden en domeinen worden gebruikt.

Nominale versus gewone gegevens

Kenmerken

Nominale gegevens

Ordinale gegevens

Aard van categorieën

Onderscheidend en discreet

Discreet en onderscheidend

Orde/rangschikking

Geen inherente volgorde

Heeft een duidelijke volgorde of rangschikking

Numerieke waarden

Geen betekenisvolle numerieke waarden

Geen betekenisvolle numerieke waarden

Analysetechnieken

Frequentietellingen, percentages, staafdiagrammen

Ranking, mediaan, niet-parametrische tests, geordende staafdiagrammen, ordinale regressie

Voorbeeld

Kleuren, geslacht, soorten dieren

laatste trefwoord in Java

Schoolcijfers, opleidingsniveau, anciënniteitsniveau

Interpretatie

Gebruikt voor classificatie en groepering op basis van categorie

Wordt gebruikt voor het beoordelen van geordende voorkeuren, hiërarchie of ranglijsten