Eigenschappen van de determinatiecoëfficiënt

De determinatiecoëfficiënt is ook bekend als R - kwadraat (R ^ 2 ) . Het is een statistische maat voor hoe goed een lineair model past een set van gegevens; het model kan een correlatie of een lineaire regressie of een analyse van variantie . Er zijn ook " pseudo R ^ 2 " maatregelen voor andere vormen van regressie , zoals logistische regressie . Bereik van de determinatiecoëfficiënt

De determinatiecoëfficiënt varieert van 0 tot 1 0 geeft aan dat er geen lineair verband bestaat helemaal niet, 1 geeft aan dat de relatie is perfect. Wat telt als een "high " of "goed " coëfficiënt varieert van veld naar veld . In psychologie , 0.3 is vrij hoog ; in de natuurkunde 0.8 wordt vaak beschouwd als laag .
Wat de Coëfficiënt Maatregelen

De determinatiecoëfficiënt meet de sterkte van een lineair verband . Maar de exacte betekenis van " lineaire relatie " is vaak verwarrend voor studenten . Een lineair verband is lineair in de parameters . Bijvoorbeeld , zou je gewicht in volwassen mensen te modelleren als functie van de hoogte en de lengte in het kwadraat , het krijgen van een regressievergelijking zoals :

W = b0 + b1 * H + b2 * H ^ 2

Waar W is het gewicht en H is de hoogte en b0 , b1 en b2 zijn coëfficiënten die moeten worden geschat . Dit is een lineaire regressie , omdat geen van de parameter worden verhoogd tot bevoegdheden .
Determinatiecoëfficiënt in Analysis of Variance

In de analyse van de variantie ( ANOVA ) , worden modellen ontwikkeld en geëvalueerd op basis van sommen van kwadraten , of afwijkingen . Bij een reeks van kwantitatieve gegevens die worden verzameld op verschillende groepen , kunt u kijken naar de totale variantie en de variantie binnen en tussen groepen . De determinatiecoëfficiënt is de som van de kwadraten tussen groepen gedeeld door de totale som van de kwadraten .
Aandeel Variatie

Een andere manier om te kijken naar de determinatiecoëfficiënt dat is het aandeel van de variatie in de afhankelijke variabele ( wat we proberen uit te leggen ) dat wordt verklaard door het model . Dus, als de coëfficiënt 0,8 is, betekent dit dat 80 procent van de variatie in de afhankelijke variabele wordt verklaard door het model .