Hoe kan ik een probleem met een resterende perceel zoeken

In de statistiek , de residuen zijn de verschillen tussen de waarden van de afhankelijke variabele voorspeld door het model en de waarden van de werkelijke afhankelijke variabele . Gewone regressie gaat ervan uit dat de residuen normaal verdeeld zijn . Voorts wordt verondersteld dat de variantie van de residuen is constant in niveaus van de onafhankelijke variabelen en dat de residuen niet zijn gerelateerd aan de onafhankelijke . Een manier van het controleren van de laatste twee hypothesen is te kijken naar een residuplot , die een onafhankelijke variabele op de x -as en de residuen op de y -as uitzet . Instructies
1

Controleer voor verandering in de verspreiding van de variantie als de onafhankelijke variabele toeneemt . Kijk naar de residuen nabij het ondereinde van de x - as in het midden van de x - as en nabij het boveneinde . De afstand tussen de hoogste en laagste reststoffen moet ongeveer gelijk zijn in de niveaus van de onafhankelijke variabele . Als ze niet zijn, je een probleem bekend als heteroscedasticiteit hebben . Kopen van 2

Kijk voor een toename of afname van de residuen als de onafhankelijke variabele toeneemt . Op alle niveaus van de onafhankelijke variabele , de residuen moeten worden gecentreerd rond 0 Er zou noch een toename of afname , noch moet er een U - vormig patroon ( laag in het midden , high aan elk uiteinde ) of een omgekeerde U worden vormige patroon . Het perceel moet eruit zien als een blob . Als dit niet gebeurt , dan heb je een probleem met de variabelen die in het model .
3

Kijk voor uitschieters hebben . Geen residuele moeten veel hoger dan de anderen . Als een punt springt , of slechts weinige , hetzij veel lager of veel hoger dan de andere , dan die kan worden geassocieerd met uitschieters . Dit kan een data-entry fouten zijn, of is het misschien een hoogst ongebruikelijke geval zijn .