Post doc Jon Alm Eriksen

Statistiske utfordringer i genomvide assosiasjonsstudier

Jon Alm Eriksen, PhD i fysikk.

Mentale sykdommer er ofte et resultat av flere faktorer, både miljø og arv kan spille inn. Likevel vet vi at noen mentale sykdommer, som schizofreni og Alzheimer, er forbundet med en høy grad av arvelighet. Det er derfor naturlig å utforske hvilke deler av genene våre som kan ha en innvirkning. Mentale sykdommer er ofte også det vi kaller komplekse. I genetisk forstand betyr “kompleks” at det ikke er ett enkelt gen som avgjør, men en kakofoni av gener som spiller inn. Samspillet, eller rettere sagt mangelen på samspill, mellom et stort antall gener, gjør det utfordrende for forskere å identifisere hvilke gener det er snakk om. For å forstå denne utfordringen er det instruktivt å først forstå litt om genene våre.

DNA-molekylet, som utgjør genomet, består som kjent av kjeder av mindre nitrogenbaserte molekyler. Disse kommer i fire forskjellige utgaver som vi identifiserer med bokstavene A, T, C og G. Vi kan tenke på disse bokstavene som genomets alfabet, og rekkefølgen på bokstavene koder din genetiske arv. Måten foreldrenes DNA kombineres når et nytt avkom blir til, er en komplisert affære, men en ting vi vet er at relativt lange kjeder av DNA-et har det med å arves sammen. DNA-et blandes sammen setning for setning, ikke bokstav for bokstav. Har du arvet en A fra bestemoren din, på et eller annet sted langs DNA-kjeden, så er sannsynligheten stor for at de neste bokstavene langs denne kjeden også er fra henne. Et resultat av dette er at mutasjoner som ligger nærme hverandre langs DNA-kjeden, har en tendens til å arves sammen. Dette gjør at variasjonene langs DNA-et ikke er statistisk uavhengige, de er korrelerte! Hvor høy grad av statistisk avhengighet det er mellom disse variasjonene langs DNA-kjeden, avhenger av alt fra evolusjonære effekter til migrasjonshistorikken, men vi kan estimere korrelasjonene hvis vi har DNA-et til mange nok mennesker i populasjonen vi er interessert i å studere.

Hva disse korrelasjonene har med mentale lidelser å gjøre, kan hende du lurer på. Svaret ligger i hvordan vi estimerer hvilke deler av DNA-et som er assosiert med en kompleks sykdom. En mye brukt forskningsmetode for å avdekke dette, er såkalte genomvide assosiasjonsstudier (GWA-studier). I slike studier sammenlignes variasjonene i DNA-et i en pasientgruppe, med de tilsvarende variasjonene i en kontrollgruppe. Hvis en variasjon er tilstrekkelig særegen for pasientgruppen, kan vi anta at den er assosiert med sykdommen. Et spørsmål vi må stille oss er “hvor særegent trenger variasjonen å være?”. Dette er en problemstilling som opptar flere av forskerene ved Norment. Jeg jobber med å forstå hvordan korrelasjonene langs DNA-et påvirker svaret på spørsmålet. Mer spesifikt ser jeg på samspillet av mentale sykdommer, og hvordan vi kan bruke informasjon fra en GWA-studie til å øke den statistiske nøyaktigheten i estimeringen av sykdomsassosierte variasjoner i en annen GWA-studie, mens jeg samtidig kontrollerer estimatene for de underliggende genetiske korrelasjonene.

Genomvide assosiasjonsstudier er relativt nye, men den voldsomme teknologiske utviklingen gjør det hele tiden både lettere og billigere å analysere DNA-et. Det er derfor viktig med solide statistiske metoder for å analysere likheter og forskjeller i DNA-et til pasientgrupper med komplekse sykdommer.

Publisert 24. nov. 2015 08:48 - Sist endret 25. okt. 2017 14:21