Spreidingsmaten in de statistiek

oktober 14, 2019
Spreidingsmaten zijn van vitaal belang omdat ze je kunnen laten zien wat er binnen een bepaald monster of een bepaalde groep mensen gebeurt. Als het gaat om steekproeven, is die spreiding belangrijk omdat het de foutenmarge bepaalt die je krijgt bij het maken van gevolgtrekkingen over metingen van de centrummaat, zoals gemiddelden.

In elke dataset spelen spreidingsmaten een belangrijke rol. Deze metingen gaan samen met de maatregelen van de centrummaat en tonen je de variabiliteit van je gegevens aan.

Metingen van de centrummaat tonen je de verschillende manieren waarop je je gegevens kunt groeperen. Ze zijn goed om uit te zoeken hoe de verschillende variabelen werken in een specifieke steekproef of groep mensen. De drie fundamentele dingen die ze je kunnen vertellen zijn de mediaan, het gemiddelde en het bereik.

Spreidingsmaten gaan hand in hand met de metingen van de centrummaat. Ze zijn ook essentieel voor het lezen van iedere dataset, omdat ze je laten zien hoe variabel je gegevens zijn. Hun belangrijke rol in de statistiek is versterkt door Wild en Pfannkuch (1999).

Volgens hen is onze perceptie van de variabiliteit van de gegevens één van de basiscomponenten van het statistisch denken. De manier waarop we de variabiliteit waarnemen, geeft ons informatie over de spreiding van de gegevens, als het gaat om een gemiddelde of een mediaan.

Een gemiddelde is heel gebruikelijk in de statistiek. Het is echter makkelijk om het verkeerd te interpreteren. Dit gebeurt vooral wanneer zich een grote spreiding van waarden in de variabele bevindt. Dan komen de spreidingsmaten in het spel (2).

Spreidingsmaten bevatten drie belangrijke componenten, die gerelateerd zijn aan willekeurige variabiliteit (2):

  • de perceptie van hoe vaak ze voorkomen in de wereld om je heen
  • of er concurrerende verklaringen zijn
  • het vermogen om ze te kwantificeren (wat betekent dat je het begrip spreiding begrijpt en weet hoe het van toepassing is)
Een man staat voor een bord met formules

Waar dienen spreidingsmaten voor?

Spreidingsmaten zijn belangrijk in elk statistisch onderzoek wanneer je probeert conclusies te trekken uit gegevens. Dit komt omdat ze een directe rol spelen in de foutenmarge waarmee je werkt. Hoe groter de spreiding in een steekproef, hoe meer ruimte je nodig hebt om binnen die marge te werken.

Ze kunnen je ook helpen uitzoeken of je gegevens ver van de centrummaat afstaan. Dat laat je zien of jouw centrummaat een goede manier zijn om de steekproef die je voor je onderzoek hebt getest te vertegenwoordigen. Dit is zeer nuttig als het gaat om het vergelijken van verdelingen en het begrijpen van de risico’s van het nemen van bepaalde beslissingen (1).

Kortom, hoe groter de spreiding, hoe minder representatief je centrummaat is. Hier zijn de meest voorkomende maatstaven voor de spreiding:

  • spreidingsbreedte
  • gemiddelde afwijking
  • variantie
  • standaardafwijking
  • variatiecoëfficiënt

Hoe werken deze maatstaven?

Spreidingsbreedte

De spreidingsbreedte is over het algemeen het beste voor het maken van de eerste vergelijkingen, omdat het alleen kijkt naar de twee uitersten van de gegevens.

Dit is ook de reden waarom het over het algemeen alleen de moeite waard is om te doen met een kleine steekproefgrootte (1). De basisdefinitie van spreidingsbreedte is: het verschil tussen de eerste en laatste data.

Appels en klokhuizen op een rij

Gemiddelde afwijking

Dan is er een gemiddelde afwijking. Het is nuttig omdat het je kan laten zien waar de gegevens zich zouden bevinden als ze allemaal precies dezelfde afstand tot het gemiddelde zouden zijn (1).

De afwijking van een getal van de variabele, is het verschil tussen de absolute waarde van die variabele en het gemiddelde. De gemiddelde afwijking is dus in principe gewoon het gemiddelde van alle afwijkingen (3).

Variantie

Variantie is de algebraïsche functie voor alle waarden, en het is perfect voor de differentiaalstatistieken (1). De variantie is in principe het kwadraat van de afwijkingen.

Standaardafwijking

De standaardafwijking is de meest voorkomende maat voor de spreiding van monsters van dezelfde groep mensen (1). Het is de vierkantswortel van de variantie (3).

Variatiecoëfficiënt

Deze maatregel wordt voornamelijk gebruikt om de variatie tussen twee gegevensreeksen in afzonderlijke groepen te vergelijken.

Bijvoorbeeld als je informatie krijgt over de lengte en het gewicht van leerlingen op een school. Het kan je helpen uitzoeken welke specifieke verdeling de hoogste groepering van gegevens laat zien, voor een meer representatieve meting.

Spreidingsmaten in de statistiek

De variatiecoëfficiënt is de meest representatieve van alle spreidingsmaten waarover we het hebben gehad, omdat het je een abstract getal geeft. Met andere woorden, het is onafhankelijk van de variabelen in je groepen. Over het algemeen wordt de variatiecoëfficiënt weergegeven als een percentage (3).

Deze spreidingsmaten zijn manieren om te zien hoeveel variabiliteit zich in je steekproef bevindt. Ze vertellen je ook hoe representatief de centrummaat is. Als de variabiliteit laag is, betekent dat dat je gegevens relatief dicht bij die maat liggen en een goede weergave zijn van de totale dataset.

Aan de andere kant, als je een hoge mate van variabiliteit hebt, betekent dat dat de gegevens verspreid zijn in plaats van geconcentreerd. Hoge variabiliteit betekent een centrummaat die niet erg representatief is.

Als dit het geval is, moet je uit een grotere datapool putten. Het hebben van meer data zal de variabiliteit verminderen, wat de hoofdoorzaak was van de grote foutenmarge.

  1. Graus, M. E. G. (2018). Estadística aplicada a la investigación educativa. Dilemas Contemporáneos: Educación, Política y Valores, 5(2).
  2. Batanero, C., González-Ruiz, I., del Mar López-Martín, M., & Miguel, J. (2015). La dispersión como elemento estructurador del currículo de estadística y probabilidad. Epsilon, 32(2), 7-20.
  3. Folgueras Russell, P. Medidas de Dispersión. Retrieved from https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&ved=2ahUKEwixgPLvw_XgAhVDAmMBHW02AesQFjABegQIBRAC&url=http%3A%2F%2Fwww.educaguia.com%2FBiblioteca%2Fapuntesde%2Fmatematicas%2FESTADISTICAYPROBABILIDAD%2FMEDIDASDEDISPERSION.pdf&usg=AOvVaw0DCZ9Ej1YvX7WNEu16m2oF
  4. Wild, C. J. y Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International
    Statistical Review, 67(3), 223-263.