Wat zijn Density Intervallen

? In de statistiek , intervallen dichtheid zijn een manier te vertegenwoordigen hoe vaak een variabele verschijnt in verschillende regio's van een populatie . Dichtheid intervallen inherent schattingen van frequentie en worden vaak " bakken " aangezien het de variabele frequentie up is onderverdeeld in verschillende intervallen , worden net als geplaatst in een bak . Introductie

Density intervallen tonen de redundantie van een variabele in discrete intervallen van gegevens . Bijvoorbeeld, als je wilt weten hoeveel dozen cornflakes in een supermarkt zijn geprijsd in een bepaald bereik , kunt u discrete intervallen van nul creëren om $ 1 , $ 1,01 tot $ 2 , $ 2,01 tot $ 3 , en ga zo maar door . De dichtheid interval van een interval is hoeveel dozen ontbijtgranen passen binnen een bepaald bereik , zoals $ 1,01 tot $ 2 . De hoogste dichtheid interval is de discrete interval met de hoogste dichtheid .
Voordelen

Het voordeel van het gebruik van intervallen dichtheid is dat het u toestaat om een visuele weergave van gegevens te maken . De gemeenschappelijke representatie in de vorm van een histogram die intervallen dichtheid een als rechthoekige gebieden op een grafiek . De hoogte van de dichtheid interval is de frequentie waarmee de variabele verschijnt in dat interval , en de breedte van het interval is het bereik . De dichtheid is dan de hoogte gedeeld door de breedte .
Nadelen

Omdat intervallen dichtheid partitie gegevens in afzonderlijke bakken , de data wordt geïnterpreteerd door een verstorende factor , het bereik van het interval zelf . Een andere reeks produceert een heel andere dichtheid , maar de gegevens is hetzelfde en de frequentie van de variabele in de populatie werd niet veranderd . Een oplossing voor dit verstorende effect van de dichtheid schatting problemen is een kernel dichtheid schatting tool, die de frequentie van een variabele vertegenwoordigt zonder discrete intervallen of bakken te gebruiken.
Toepassingen

Dichtheid intervallen hebben een brede toepassing in de statistische representaties . Ze worden gebruikt om de verdeling van populaties met een bepaalde variabele , zoals leeftijd , ras of sekse ; hoe vaak soorten fouten in een software platform ; ziekte voorkomt bij verschillende diersoorten ; de aanwezigheid van inputs in logische verklaringen ; en nog veel meer . Dichtheid intervallen voor verschillende variabelen kunnen worden overlay op elkaar aan variabele spreads in een populatie , zoals de frequentie van koffie drinkers , thee drinkers , of koffie en thee drinkers in een stedelijke omgeving te vergelijken. Het gemeenschappelijke kenmerk van deze verschillende toepassingen is het gebruik van bakken op verschillende frequenties van een variabele te scheiden.