Wat is R2 lineaire regressie

? Statistici en wetenschappers vaak vereist om de relatie tussen twee variabelen , gewoonlijk x en y onderzoeken . Het doel van het testen van twee van dergelijke variabelen is gewoonlijk te zien of er enig verband daartussen bekend als een correlatie in de wetenschap . Bijvoorbeeld, zou een wetenschapper wil weten of uren van blootstelling aan de zon kan worden gekoppeld aan de tarieven van huidkanker . Mathematisch beschrijven de sterkte van een correlatie tussen twee variabelen , zoals onderzoekers vaak gebruik R2 . Lineaire regressie

Statistici gebruik maken van de techniek van lineaire regressie op de rechte lijn die het beste past bij een reeks van x -en y -gegevens paren te vinden. Zij doen dit door een reeks van berekeningen die de vergelijking van de beste lijn ontlenen . Deze wiskundige beschrijving van de regel zal een lineaire vergelijking en hebben de algemene vorm van y = mx + b , waarbij x en y de twee variabelen in de data paren , m de helling van de lijn is en b de y- as.
Correlatie Coëfficiënt

de berekeningen die de beste rechte lijn zal een lineaire vergelijking produceren om elke set van gegevens passen , zelfs als dat data is eigenlijk niet erg lineair te vinden. Om een indicatie van hoe goed de data eigenlijk past een rechte lijn hebben , statistici berekenen ook een aantal bekend als de correlatiecoëfficiënt . Deze wordt gegeven op het symbool r of R en is een maat voor hoe nauw aan de data paren zijn om de beste rechte lijn door hen.
Betekenis van R

R kan elke waarde tussen -1 en 1 Een negatieve waarde van R betekent eenvoudig dat de best passende rechte lijn schuin neerwaarts bewegen van links naar rechts , dan omhoog . Hoe dichter R ofwel het zijn van de twee uitersten , hoe beter de fit van de gegevens op de regel met ofwel -1 of 1 een perfecte pasvorm en een R waarde nul zin dat er geen fit en de punten totaal willekeurig . Als de gegevens punten goed zijn afgestemd op de rechte lijn , wordt er gezegd dat een aantal correlatie tussen hen , vandaar de naam correlatiecoëfficiënt voor R.
R2

Sommige zijn statistici werken liever met de waarde van R2 , dat is gewoon de correlatiecoëfficiënt in het kwadraat , of met zichzelf vermenigvuldigd , en staat bekend als de determinatiecoëfficiënt . R2 is zeer vergelijkbaar met R en beschrijft ook de correlatie tussen de twee variabelen , maar het is ook iets anders . Het meet het percentage variatie in de y variabele die kan worden toegeschreven aan variaties in de variabele x . Een R2 waarde van 0,9 betekent bijvoorbeeld dat 90 procent van de variatie in de y gegevens gevolg van variatie in de x data . Dit hoeft niet te betekenen dat x is echt y beïnvloeden , maar dat lijkt het zo te doen .