wiskundige & Statistische methoden voor Genetische Analyse

Genetica is een tak van bezig met het bestuderen van genen , variatie , en erfelijke in dieren en planten biologie. Wiskunde en statistiek speelt een grote rol in het vakgebied van de genetica , in het bijzonder de subdiscipline van populatiegenetica . Populatiegenetica bestudeert de frequentie en de verdeling van de verschillende allelen in een bepaalde populatie van organismen en hoe ze zich verhouden tot andere populaties van organismen . Allelen zijn delen van de genetische code die samenhangen met specifieke eigenschappen . Gemiddelden

De meest elementaire vorm van statistische analyse is het gemiddelde . Er zijn drie soorten van gemiddeld : gemiddelde , mediaan en modus . Het gemiddelde wordt gevonden door het vinden van de som van een groep gegevens en deze som te delen door het aantal meetpunten. De mediaan wordt gevonden door alle datapunten in orde van grootte en de middelste gegevenspunt te selecteren. De functie is simpelweg de gegevenswaarde die het vaakst weergegeven . Alle drie soorten gemiddelde worden gebruikt in populatiegenetica , maar de meest voorkomende is het gemiddelde.
Variance

De variantie is een maat voor hoeveel de waarden in een set van gegevens variëren. De variantie wordt gesymboliseerd door s ^ 2 , of een sigma vierkant symbool . De variantie wordt berekend door het vinden van de som van het kwadraat van de verschillen tussen elke waarde en de gemiddelde waarde , en vervolgens te delen door een minder dan het aantal gegevenspunten . Een voorbeeld van variantie kan het aantal spots op een bepaalde soort van kever betrekken . Aannemen dat er vijf kevers in de set , en het aantal vlekken op elke kever zijn 5 , 5 , 6 , 6 en 8 Het gemiddelde is: .

( 5 + 5 + 6 + 6 + 8) /5 = 6

De variantie wordt als volgt berekend :

[ ( 5-6 ) ^ 2 + ( 5-6 ) ^ 2 + ( 6-6 ) ^ 2 + ( 6 - 6 ) ^ 2 + ( 8-6 ) ^ 2 ] /( 5-1 ) = 1.5

Dit geeft ons een indicatie van de spreiding van de waarden

Standard Deviation

De standaarddeviatie is een maat voor de spreiding . Het is de vierkantswortel van de variantie . Het heeft het voordeel dat het de eenheid waarin het gegevensverzameling wordt afgeleid. In het bovenstaande voorbeeld de standaarddeviatie gegeven :

(1,5) ^ (0,5) = 1,22474

Dit geeft aan dat de standaarddeviatie van het aantal plekken op de populatie kevers ongeveer 1,22 vlekken .
Correlatie

Correlatie is een maat voor de hoeveelheid van de associatie tussen twee reeksen gegevens . In populatiegenetica zou correlaties worden gebruikt om de relatie tussen het bezit van bepaalde genen en gevallen van bepaalde eigenschappen te bestuderen . Correlatie wordt gesymboliseerd door een r de subscript xy , waarbij x en y variabelen van de twee gegevensverzamelingen . Correlaties zijn altijd tussen -1 en 1 . -1 Betekent dat er een negatieve correlatie , 0 betekent dat er geen correlatie , en 1 betekent dat er een positieve correlatie .
Regressie

Regressie is een statistisch instrument gebruikt om de relatie tussen twee variabelen vinden . De regressiecoëfficiënt krijgt het symbool b met subscript yx , waarin y en x zijn variabelen van de twee gegevensverzamelingen . De regressiecoëfficiënt meet de voorspelde verandering in ay variabele per eenheid verandering in de variabele x .
Genetische aandoeningen nomenclatuur

Bij de bespreking van genetische aandoening , zijn er verschillende technische termen die beschrijven het patroon van de aandoening in de algemene bevolking . Deze voorwaarden omvatten incidentie, prevalentie , mortaliteit en levensduur risico . De incidentie van een genetische aandoening is het percentage mensen in de bevolking met een bepaalde genetische aandoening. De prevalentie van een genetische aandoening is het aantal mensen binnen een subgroep , zoals een bepaalde leeftijd , die een bepaalde genetische afwijking . Mortaliteit verwijst naar het aantal mensen in een bepaalde groep die sterven aan een specifieke stoornis per jaar . Een voorbeeld van een mortaliteit statistiek zou kunnen worden " 10 000 mensen in de Verenigde Staten overleden aan syndroom X in 2010 . " Levenslange risico is het gemiddelde risico op het ontwikkelen van een bepaalde genetische aandoening op een bepaald punt in het leven van een individu .