Waarom Are Afwijkingen Geregelde

De variantie meet hoe ver scores in een gegevensverzameling afwijken van het gemiddelde . De eerste stap in de berekening van de variantie van het gemiddelde van de data set berekenen. Vervolgens wordt elke score afgetrokken van het gemiddelde en deze waarden worden geregeld, of vermenigvuldigd met zichzelf . Wanneer het proberen te begrijpen waarom de verschillen zijn in het kwadraat , moet je eerst begrijpen het construct van een constante en het effect van het toevoegen van een constante om elke waarde in een gegevensverzameling . Het definiëren van de gemiddelde

Omdat de variantie meet hoe verspreid nummers zijn uit het midden van een dataset , moet het midden van de dataset eerst worden berekend . Het gemiddelde van een gegevensverzameling is een getal dat midden beschreven . De gemiddelde kan verschillende nummers , waaronder het gemiddelde , mediaan of modus . Om de variantie te berekenen , moet uw gegevens continu zijn . Continue data bestaat tellen getallen zoals 1 , 2 , 3 en 4 Bij de berekening van het midden van een continue reeks data , het gemiddelde is de juiste statistiek . Om het gemiddelde te berekenen , telt u alle nummers in de set van gegevens en delen door het totaal aantal waarnemingen . Als je 10 waarnemingen en de som is 1000 , het gemiddelde is 100
Afstand van gemiddeld

Haal de afstand van het gemiddelde voor elke waarneming in de dataset door het aftrekken van het gemiddelde. Als eerste gegevenspunt was 101 en de gemiddelde 100 , het eerste gegevenspunt van het gemiddelde verschilt met 1 Wanneer een waarde lager dan de gemiddelde , zal het verschil met het gemiddelde negatief . Bijvoorbeeld , een data punt 99 kleiner is dan het gemiddelde , zodat het verschil met het gemiddelde zou een negatief getal zijn ; in dit voorbeeld , 99-100 is ( -1 ) . De afstanden van het gemiddelde worden kwadraat omdat kwadratuur elimineert het negatieve teken. Doet precies hetzelfde voor elk nummer in een dataset wordt het toevoegen van een constante . Constanten worden toegevoegd om het werken met getallen gemakkelijker , maar niet de betekenis van een dataset niet veranderen .
Makkelijker

Op een aantal lijn , negatief interpreteren getallen vallen links van de neutrale nulpunt terwijl positieve getallen vallen naar rechts . Als u niet vierkant verschillen van het gemiddelde , zou een aantal verschillen links van de nul valt en sommigen rechts vallen . Bij de berekening variantie wordt statisticus betreft hoever getallen afwijken van het gemiddelde . Als een punt in de dataset verschilt ( -3 ) en een punt verschilt 3 , die elk verschillen evenveel stappen van het gemiddelde , in dit voorbeeld 3 Doordat het positieve teken door kwadrateren het nummer , het verschil 3 is gewoon makkelijker om te lezen .
Making verschillen grotere

Kwadratuur van elk van de verschillen ten opzichte van het gemiddelde bij de berekening van de variantie maakt ook de verschillen groter zodat het gemakkelijker is om te observeren trends. Omdat elk nummer in de dataset is groter gemaakt met hetzelfde bedrag , heeft de betekenis van de gegevens niet zijn gewijzigd .