Modus, gemiddelde en mediaan zijn drie belangrijke concepten in de statistiek die worden gebruikt om de kenmerken van een dataset te beschrijven.
Modus verwijst naar de meest voorkomende waarde in een dataset, gemiddelde is de gemiddelde waarde van een dataset en mediaan is de waarde die een dataset in twee gelijke delen verdeelt.
Elk van deze concepten biedt een ander en nuttig inzicht in de gegevens . Ze worden doorgaans samen gebruikt om een vollediger inzicht in een dataset te krijgen.
Het kiezen van het juiste concept hangt af van het type data waarmee u werkt en het doel dat u wilt bereiken. Daarom is het essentieel om te begrijpen hoe ze werken en wanneer u ze correct moet gebruiken.
Wat is mode?
De modus is de meest voorkomende of algemene waarde in een reeks statistische steekproeven . Met andere woorden: het is de waarde die het vaakst voorkomt in een dataset.
Als er meerdere waarden verschijnen met dezelfde maximale frequentie, kunnen we zeggen dat er meerdere modi zijn . Modus is een maatstaf voor centrale tendens die in statistieken wordt gebruikt om gegevens te beschrijven.
Deze waarde is met name handig in gegevenssets met verdelingen die niet symmetrisch zijn of uitschieters hebben. De modus wordt dus niet beïnvloed door deze waarden en geeft in deze gevallen een nauwkeurigere indicatie van de centrale tendens.
Hoe wordt de modus berekend?
De berekening van de modus is vrij eenvoudig en kan als volgt worden gedaan:
- Tel de frequentie van elke waarde in de dataset en vind de waarde met de hoogste frequentie. Dit is de moduswaarde.
- Sorteer de dataset en vind de waarde die het vaakst voorkomt. Dit is de moduswaarde.
- Als de gegevensset continu is in plaats van discreet, kan een histogram worden gebruikt om de gegevens uit te zetten en het interval te vinden dat het grootste aantal waarden bevat. De modus is de waarde in dat interval die optreedt bij de maximale frequentie.
Voorbeeld
Stel dat we de volgende waarden in een dataset hebben:
5, 8, 9, 9, 10, 11, 11, 12
We kunnen de modus als volgt berekenen:
Tel de frequentie van elke waarde :
5:1
8:1
9:2
10:1
11:2
12:1
Zoals je kunt zien zijn waarde 9 en waarde 11 de meest voorkomende waarden in de dataset, dus we hebben twee modi: 9 en 11.
Gegevens sorteren :
5, 8, 9, 9, 10, 11, 11, 12
Zoek de waarde die het vaakst voorkomt :
9 en 11 zijn de meest voorkomende waarden en zijn daarom de modi van de dataset.
In dit voorbeeld hebben we twee modi in de dataset gevonden, wat betekent dat er twee waarden voorkomen met dezelfde maximale frequentie.
Als de dataset slechts één meest voorkomende waarde had, zou die waarde de enige modus zijn.
Wat is het gemiddelde?
Het rekenkundig gemiddelde is een maatstaf voor de centrale tendens die informatie geeft over de locatie van gegevens in een dataset.
Het is een manier om een reeks gegevens samen te vatten en te beschrijven, en is nuttig voor het vergelijken van verschillende gegevensreeksen.
Het is de waarde die het middelpunt van de gegevens in wiskundige zin vertegenwoordigt, en het is een meting die gemakkelijk kan worden begrepen en aan anderen kan worden gecommuniceerd.
Het gemiddelde is niet alleen een maatstaf voor de centrale tendens, maar kan ook worden gebruikt om voorspellingen te doen .
Als we bijvoorbeeld het gemiddelde kennen van een reeks gegevens uit het verleden, kunnen we deze informatie gebruiken om het toekomstige gemiddelde te voorspellen.
Dit kan nuttig zijn in een verscheidenheid aan toepassingen, zoals economie, wetenschap en geneeskunde.
Het is echter belangrijk op te merken dat het gemiddelde kan worden beïnvloed door uitbijters of niet-representatieve waarden in de dataset.
Hoe wordt het gemiddelde berekend?
Het kan worden berekend door alle waarden in de dataset bij elkaar op te tellen en het resultaat te delen door het aantal waarden in de set.
De formule die je nodig hebt om het gemiddelde te berekenen is:
Waarbij N het aantal waarden in de dataset is.
Hier is een numeriek voorbeeld om het gemiddelde te berekenen
Stel dat we de volgende waarden in een dataset hebben:
5, 8, 9, 10, 11, 12
Het is mogelijk om als volgt te berekenen:
Gemiddeld = (5 + 8 + 9 + 10 + 11 + 12) ÷ 6
Gemiddeld = 55 ÷ 6
Gemiddeld = 9,17
In dit voorbeeld is het gemiddelde 9,17, wat betekent dat de gemiddelde waarde van de waarden in de dataset 9,17 is.
Wat is de mediaan?
De mediaan is een maatstaf voor de centrale tendens die de centrale positie van gegevens in een dataset beschrijft.
In tegenstelling tot het gemiddelde, dat een meting is die is gebaseerd op de som van alle gegevens en gedeeld door het aantal gegevens, is de mediaan gebaseerd op de volgorde van de gegevens . Het vertegenwoordigt ook de waarde die de gegevens in twee gelijke helften scheidt.
Het is vermeldenswaard dat dit een robuuste maatstaf is, wat betekent dat deze niet wordt beïnvloed door uitschieters of niet-representatieve waarden in de dataset , zoals bij het gemiddelde het geval kan zijn.
Als een dataset bijvoorbeeld een zeer hoge of zeer lage waarde bevat die een uitbijter is vergeleken met de rest van de gegevens, kan het gemiddelde worden beïnvloed, maar zal de mediaan nog steeds adequaat de centrale positie van de gegevens weergeven.
Hoe de mediaan berekenen?
Om de mediaan te berekenen, moet u eerst de gegevens ordenen van klein naar groot of omgekeerd.
Als het aantal gegevens dan oneven is, is de mediaan de waarde die de centrale positie inneemt .
Als het aantal gegevenselementen even is, is de mediaan het rekenkundig gemiddelde van de twee mediaanwaarden.
Bijvoorbeeld
Beschouw de dataset: 2, 5, 7, 9, 12.
Geordend van klein naar groot zijn de gegevens: 2, 5, 7, 9, 12.
Omdat het een even aantal gegevens betreft, wordt de mediaan gevonden door het rekenkundig gemiddelde van de twee centrale waarden te berekenen, dat wil zeggen (7 + 9) ÷ 2 = 8.
Toepassingen van modus, gemiddelde en mediaan
De toepassingen van modus, gemiddelde en mediaan zijn zeer breed en worden op verschillende gebieden aangetroffen. Sommige ervan zijn:
- Statistieken : zijn maatstaven van centrale tendens die de positie van gegevens in een dataset beschrijven. Dit zijn metingen die worden gebruikt om datasets te beschrijven, te vergelijken en voorspellingen te doen.
- Economie : Ze worden gebruikt om de verdeling van inkomsten, uitgaven en andere economische indicatoren te beschrijven. Het gemiddelde kan bijvoorbeeld worden gebruikt om het gemiddelde inkomen van een bevolking te meten, terwijl de mediaan kan worden gebruikt om het inkomen te meten van de persoon in het centrum van de verdeling.
- Sociale wetenschappen : worden gebruikt om patronen en trends in variabelen zoals leeftijd, inkomen en opleiding te beschrijven. De gemiddelde leeftijd van een populatie kan bijvoorbeeld worden gebruikt om de gemiddelde leeftijd van de populatie te beschrijven.
- Kwaliteitsmeting : deze worden gebruikt om de klanttevredenheid en productprestaties te meten. Het gemiddelde van klantrecensies kan bijvoorbeeld worden gebruikt om het algehele klanttevredenheidsniveau over een product te meten.
- Onderzoek : Ze zijn nuttig voor het beschrijven en vergelijken van de resultaten van onderzoeken en experimenten. Het gemiddelde kan bijvoorbeeld worden gebruikt om de gemiddelde grootte van twee verschillende groepen te vergelijken.
Over het algemeen zijn modus, gemiddelde en mediaan waardevolle meetgegevens voor het beschrijven, vergelijken en doen van voorspellingen over gegevens. Elk van deze statistieken heeft zijn sterke en zwakke punten, dus het is belangrijk om de juiste metriek te selecteren op basis van het probleem en de gegevens waarmee u te maken heeft.
Voorbeeld om modus, gemiddelde en mediaan te berekenen
Hier is een voorbeeld waarin de modus, het gemiddelde en de mediaan kunnen worden berekend:
Stelling: Er wordt een onderzoek uitgevoerd onder 100 mensen om hun lengte te achterhalen. De volgende informatie wordt verzameld:
Hoogte (in centimeter): 170, 175, 170, 165, 180, 170, 175, 170, 165, 180, 175, 180, 185, 170, 165
1. Berekeningsmodus
Modus is de waarde die vaak voorkomt in een dataset. In dit geval wordt de waarde 170 het vaakst herhaald, dus de modus is 170.
2. Berekening van het gemiddelde
Het gemiddelde wordt berekend door alle waarden bij elkaar op te tellen en te delen door het aantal items. De formule om het gemiddelde te berekenen is:
Gemiddelde = (som van waarden) ÷ (aantal elementen)
Gemiddeld = (170 + 175 + 170 + 165 + 180 + 170 + 175 + 170 + 165 + 180 + 175 + 180 + 185 + 170 + 165) ÷ 15
Gemiddeld = 170
3. Berekening van de mediaan
De mediaan is de middelste waarde van een geordende dataset. In dit geval is de mediaan, bij 15 elementen, de achtste waarde.
Mediaan = 170
Dit zijn de resultaten van de modus-, gemiddelde- en mediaanberekeningen voor de gegevensset voor de lengte van de respondent.