Een doel van statistieken is om gegevens op een zinvolle manier te presenteren. Bij datasets zijn vaak miljoenen (zo niet miljarden) waarden betrokken. Dit is veel te veel om af te drukken in een tijdschriftartikel of zijbalk van een tijdschriftverhaal. Dat is waar grafieken van onschatbare waarde kunnen zijn, waardoor statistici een visuele interpretatie kunnen geven van complexe numerieke verhalen. Zeven soorten grafieken worden vaak gebruikt in statistieken.
Goede grafieken brengen informatie snel en gemakkelijk over naar de gebruiker. Grafieken markeren de opvallende kenmerken van de gegevens. Ze kunnen relaties laten zien die niet duidelijk zijn door een lijst met cijfers te bestuderen. Ze kunnen ook een handige manier zijn om verschillende gegevenssets te vergelijken.
Verschillende situaties vragen om verschillende soorten grafieken en het helpt om een goede kennis te hebben van welke soorten beschikbaar zijn. Het type gegevens bepaalt vaak welke grafiek geschikt is om te gebruiken.
Kwalitatieve data, kwantitatieve gegevens, en gepaarde gegevens elk gebruiken verschillende soorten grafieken.EEN Pareto-diagram of staafdiagram is een manier om kwalitatieve gegevens visueel weer te geven. Gegevens worden horizontaal of verticaal weergegeven en stellen kijkers in staat items te vergelijken, zoals hoeveelheden, kenmerken, tijden en frequentie. De balken zijn gerangschikt in volgorde van frequentie, dus belangrijkere categorieën worden benadrukt. Door naar alle balken te kijken, is het gemakkelijk om in één oogopslag te zien welke categorieën in een set gegevens de andere domineren. Staafdiagrammen kan enkelvoudig, gestapeld of gegroepeerd zijn.
Vilfredo Pareto (1848–1923) ontwikkelde de staafgrafiek toen hij de economische besluitvorming een 'menselijker' gezicht wilde geven plotten van gegevens op ruitjespapier, met inkomen op één as en het aantal mensen met verschillende inkomensniveaus op de andere. De resultaten waren opvallend: ze toonden op dramatische wijze het verschil tussen arm en rijk in elk tijdperk in de loop van de eeuwen.
Een andere veelgebruikte manier om gegevens grafisch weer te geven is een cirkeldiagram. Het dankt zijn naam aan de manier waarop het eruit ziet, net als een cirkelvormige taart die in meerdere plakjes is gesneden. Dit soort grafiek is handig bij het tekenen van kwalitatieve gegevens, waarbij de informatie een eigenschap of attribuut beschrijft en niet numeriek is. Elk plakje taart vertegenwoordigt een andere categorie en elk kenmerk komt overeen met een ander plakje taart; sommige plakjes zijn meestal merkbaar groter dan andere. Door alle taartstukken te bekijken, kunt u vergelijken hoeveel van de gegevens in elke categorie of segment passen.
EEN histogram in een ander soort grafiek die balken gebruikt in de weergave. Dit type grafiek wordt gebruikt met kwantitatieve gegevens. Waardenbereiken, klassen genoemd, worden onderaan vermeld en de klassen met hogere frequenties hebben hogere balken.
Een histogram lijkt vaak op een staafdiagram, maar is anders vanwege de meetniveau van de gegevens. Staafdiagrammen meten de frequentie van categorische gegevens. Een categorische variabele is er een die twee of meer categorieën heeft, zoals geslacht of haarkleur. Histogrammen worden daarentegen gebruikt voor gegevens die betrekking hebben op ordinale variabelen of zaken die niet gemakkelijk te kwantificeren zijn, zoals gevoelens of meningen.
EEN stengel en blad plot breekt elke waarde van een kwantitatieve gegevensset in twee stukken: een stengel, meestal voor de hoogste plaatswaarde, en een blad voor de andere plaatswaarden. Het biedt een manier om alle gegevenswaarden in een compacte vorm weer te geven. Als u deze grafiek bijvoorbeeld gebruikt om studententestscores van 84, 65, 78, 75, 89, 90 te bekijken, 88, 83, 72, 91 en 90, de stelen zijn 6, 7, 8 en 9, wat overeenkomt met de tientallen plaats van de gegevens. De bladeren - de nummers rechts van een ononderbroken lijn - zijn 0, 0, 1 naast de 9; 3, 4, 8, 9 naast de 8; 2, 5, 8 naast de 7; en 2 naast de 6.
Dit zou aantonen dat vier studenten scoorden in de 90e percentiel, drie studenten in het 80e percentiel, twee in de 70e en slechts één in de 60e. Je zou zelfs kunnen zien hoe goed studenten in elk percentiel presteerden, waardoor dit een goede grafiek is om te begrijpen hoe goed studenten de stof begrijpen.
EEN punt plot is een hybride tussen een histogram en een stengel en blad plot. Elke kwantitatieve gegevenswaarde wordt een punt of punt dat boven de toepasselijke klassewaarden wordt geplaatst. Waar histogrammen rechthoeken of staven gebruiken, gebruiken deze grafieken stippen, die vervolgens worden samengevoegd met een eenvoudige lijn, zegt statisticshowto.com. Dotplots bieden een goede manier om te vergelijken hoe lang het duurt voor een groep van zes of zeven personen om te ontbijten, bijvoorbeeld, of om het percentage mensen in verschillende landen te tonen dat toegang heeft tot elektriciteit, volgens MathIsFun.
EEN scatterplot geeft gegevens weer die zijn gekoppeld met behulp van een horizontale as (de x-as) en een verticale as (de y-as). De statistische tools van correlatie en regressie worden vervolgens gebruikt om trends op de scatterplot weer te geven. Een scatterplot ziet er meestal uit als een lijn of curve die van links naar rechts langs de grafiek omhoog of omlaag beweegt met punten "verspreid" langs de lijn. De scatterplot helpt u om meer informatie over elke dataset te ontdekken, waaronder:
EEN tijdreeksgrafiek geeft gegevens op verschillende tijdstippen weer, dus het is een ander soort grafiek om te gebruiken voor bepaalde soorten gepaarde gegevens. Zoals de naam al aangeeft, meet dit type grafiek trends in de tijd, maar het tijdsbestek kan minuten, uren, dagen, maanden, jaren, decennia of eeuwen zijn. U kunt dit type grafiek bijvoorbeeld gebruiken om de bevolking van de Verenigde Staten in de loop van een eeuw uit te zetten. Op de y-as staat de groeiende bevolking, op de x-as de jaren, zoals 1900, 1950, 2000.