DNA deaminering
Transcription
DNA deaminering
Nukleinsyrer – basal innføring (+ Noen sentrale teknikker og analysemetoder) Geir Slupphaug, Institutt for kreftforskning og molekylærmedisin Litt historikk • DNA ble først isolert av Johannes F. Miescher ca 1870, som fant en svak syre kalt «nuklein» i kjerner fra hvite blodceller. • Kjemisk analyse av nukleinet viste at det inneholdt betydelige mengder fosfor, og derfor ikke passet inn i noen av de hittil kjente stoffgruppene • Noen år greide Meischer å skille nuklein i en protein- og en nukleinsyredel Litt historikk • I 1866 postulerte Ernst Haeckel postulert at cellekjernen inneholdt arvematerialet. Meischer foreslo at nukleinsyrene kunne være involvert i arv. Han gikk senere bort fra denne teorien • I 1879 observerte Walther Fleming filamenter i cellekjerner som lot seg farge med basofile farger. Han kalte disse strukturene kromatin, senere kjent som kromosomer • Rundt 1900 var det kjent at DNA inneholdt sukker, fosfat og fire heterosykliske baser (A,T,C og G). Phoebus Levene viste ca 1910 at disse komponentene var ordnet som rekker av nukleotider. Han oppdaget også ribose og deoksyribose • Han trodde imidlertid at maksimal lengde av et DNAmolekyl var 4 nukleotider, og postulerte derfor at DNA ikke kunne være bærer av genetisk informasjon Litt historikk • I 1928 publiserte Frederick Griffith sitt eksperiment som viste at bakterier (Streptococcus pneumoniae) kunne transformeres • Griffith konkluderte at et «transforming principle» fra de drepte bakteriene transformerte nonvirulente bakterene. Litt historikk • I 1944 klarte Oswald Avery, Colin MacLeod og Maclyn McCarty å renfremstille DNA fra virulent S. pneumoliae, og viste at dette kunne transformere nonvirulente bakterier • I 1950 viste Edwin Chargaff at mengden adenin i DNA tilsvarte mengden tymin. Det samme gjaldt guanin og cytosin (Chargaff’s lov). Dette fikk stor betydning for løsningen av DNAets struktur • 1950-53: Rosalind Franklin greide å oppta røntgenkrystallografiske data av rent DNA og kalkulerte at fosfat måtte ligge på utsiden av molekylet, samt fant mengden vann i strukturen -begge deler vital informasjon for bygging av en DNA-modell. Litt historikk • I april 1953 publiserte Watson Crick sin DNA-modell i Nature Litt historikk • 1975: Frederick sanger publiserer sin metode for sekvensering av DNA • 1975: Forskere ved Genentech lager genmodifiserte mikroorganismer for produksjon av humant somatostatin, insulin og veksthormon • 1985: Kary Mullis publiserer første paper som beskriver polymerase-kjedereaksjon, PCR, for amplifisering av DNA, og patenterte metoden • Men – prinsippene for PCR hadde blitt beskrevet av Kjell Kleppe og Har Gobind Khorana allerede i 1971 Litt historikk • 1990: NIH utfører første godkjente genterapieksperiment på en 4-årig jente med SCID • 1993: Calgene produserer den første rekombinante matvare, tomat (Flavr Savr), godkjent av FDA • 1996: Sauen Dolly klonet fra somatiske celler fusjonert med ubefruktet egg • 2003: Human Genome Project publiserer den humane genomsekvensen til en nøyaktighet på 99.99% Prokaryote vs eukaryote genom • Prokaryote celler: • Eukaryote celler: • • DNAet er organisert som kromatin i cellekjernen, i en komplisert og tett pakket struktur som består av blant annet basiske histonproteiner. • I tillegg inneholder cellene DNA i mitokondriene (og i planter, kloroplastene). Genomet (DNAet) er lite, sirkulært og ligger åpent organisert i form av et nukleoid. Det inneholder 1000-4000 gener. I tillegg finnes ofte plasmider med noen få gener Eschericia coli Celler har ulik genomstørrelse • Prokaryoter og enkle eukaryoter har ofte et lite DNA-innhold (små genom), mens høyere eukaryoter har genom som kan være flere tusen ganger større • Det er likevel ikke en direkte sammenheng mellom genomstørrelse og hvor «avansert» organismen er • Høyere vertebrater har en mer avansert regulering av sitt genom Prok. Euk. Kromatin • Størrelsen på eukaryote genom krever at de er tettere «pakket» for å få plass inne i en cellekjerne • Eukaryote kromatin er et nettverk av DNA og protein som er pakket sammen i lange fibre. Med TEM kan en se tett pakkede områder (heterokromatin) og løst pakkede områder (eukromatin) TEM-bilde av cellekjerne EM-forstørrelse av kromatinfragment viser at det har en ”perler på en snor” struktur • ”Perler-på en snor”-utseendet skyldes at DNAet ligger krøllet rundt store proteinkompleks som kalles histoner. Under celledeling (mitose) blir denne pakkingen så tett at kromosomene blir synlige i mikroskopet. • Dette gjør også at en kopi av hvert kromosompar lett kan trekkes ut til hver av dattercellene i forbindelse med celledelingen • Eubacteria har ikke histoner, mens Archaebacteria har en enklere form for histoner enn eukaryoter Genorganisering • Mens eukaryote gener ligger spredt i store områder ikkekodende DNA, er prokaryote gener ofte mye tettere pakket («gene clustering») • Ofte ligger gener som koder for proteiner involvert i en og samme reaksjonsvei, ordnet «på rekke», og er styrt av én felles promoter. Slike rekker av funksjonelt relaterte gener kalles operons Strukturen av standard B-DNA Andre DNAstrukturer • A-DNA er sannsynligvis ikke viktig in vivo for dsDNA, men dannes in vitro ved høye saltkonsentrasjoner eller i nærvær av etanol. A-formen er vanlig i RNA og i RNA-DNA-duplexer. Den er bredere og mer sammentrykt enn B-formen. • Z-DNA ble første gang beskrevet i 1979. Denne er en venstredreid helix, med sikksakk-form. Denne konformasjonen danner spesifikke bindingsregioner for flere proteiner, blant annet et RNAediteringsenzym, ADAR1. Enkelte virale protein (ex. poxvirus E3L) binder også til Z-DNA, og øker ekspresjon av antiapoptotiske proteiner H-DNA • H-DNA er trippel-helix strukturer som kan dannes ved inverterte homopurin/homopyrimidinrepeats. Det er nylig vist at slike sekvender er ”hotspots” for mutasjoner DNA hybridisering • De to komplementære DNAtrådene holdes sammen av hydrogenbindinger • Disse kan brytes ved oppvarming, og DNAet denaturerer. • Ved avkjøling vil det to trådene renaturere • Trådene kan også anneale til andre komplementære DNAfragment, eller til RNA. dette kalles hybridisering • DNA/DNA- og RNA/DNA hybridisering danner grunnlaget for en rekke sentrale teknikker innen molekylærbiologien G:G sterkere enn A:T (A:U) DNA-syntese • Meselsohn og Stahl viste i 1958 at DNA replikeres semikonservativt • De to trådene i DNA-heliksen går i motsatt retning av hverandre (de er antiparallelle). Den enden av DNA-tråden som mangler en nukleotid i 5’-pososjon på sukkerringen, kalles 5’-enden, og tilsvarende kalles den enden som mangler en nukleotide i 3’-posisjon, 3’-enden. • Den DNA-tråden som tjener som templat, leses alltid i 3’-5’-retning, og dattertråden syntetiseres i 5’-3’-retning 5’ 3’ Nytt DNA dannes av DNA polymeraser • På 1950-tallet begynte en å lete etter enzymer som kunne syntetisere DNA. Det første av disse ble renset fra E. coli, og ble kalt DNA polymerase I. • Dette er fremdeles den best karakteriserte DNA polymerasen, og det har vist seg at virknings-mekanismen til dette enzymet har mange likhetstrekk med alle kjente DNA polymeraser. • Enzymet katalyserer et nukleofilt angrep av oksygen på 3’-OH enden av en voksende DNA tråd mot 5’-P i en innkommende nukleotid OH 3’ 5’ P A T P P T A P P G C 3’ HO O O O O P O P O PO O O O P G C HO P A P C DNA polymerase I P G P Replikasjonsmaskineriet er komplisert «Unormale» baser i DNA • I tillegg til A, T, C og G, vil både prokaryot og eukaryot DNA inneholde varierende mengder av «unormale» baser. Mange av disse basene kan oppstå som følge av genotoksiske agens, men mange kan også dannes spontant, eller inkorporeres under DNA replikasjon. • Enkelte baseendringer kan også induseres enzymatisk i cellene. De to viktigste av disse er metylering og deaminering DNA metylering. • I 1898 oppdaget man en ny nukleotide i DNA i tuberkelbakterien, og kalte denne tuberkulin. • Dette viste seg senere (1925) å være 5-metylcytosin (5-meC). I 1948 ble 5-meC også påvist i DNA hos pattedyr. C 5-meC Metyltransferaser DNA metylering i bakterier • C og A i bakterie-DNA kan metyleres av metyltransferaser • 5-meC, 4meC, 6-meA: Fungerer bla som forsvarssystem, da bakteriene motvirker virusangrep ved å «kutte» viralt DNA med enzymer kalt restriksjonsendonukleaser. Mange av disse er metyleringssensitive, og vil derfor ikke angripe bakterienes eget DNA. • Metylering kan også modulere virulens, DNAreplikasjon, DNAreparasjon og genekspresjon. DNA metylering hos pattedyr • 60-90% av alle CpG-sekvenser hos pattedyr er metylert, og dette utgjør er en viktig del av den epigenetiske reguleringen av genuttrykket • Det epigenetiske metyleringsmønsteret er delvis arvelig, men også dynamisk, da det bla. reprogrammeres etter fertilisering. Kjente metyltransferaser metylerer C, men det har inntil nylig vært et mysterium hvordan 5-meC kan demetyleres. • I 2009 ble enzymatisk dannelse av 5hydroksymetylcytosin (5hmC) oppdaget i humant DNA, og at denne basen også har en viktig regulatorisk rolle (>600 artikler publ siden 2009) DNA deaminering • A, C og G har aminogrupper som kan tapes spontant, og derved endre basenes baseparingsegenskaper. Den vanligste av disse er når cytosin deaminerer og danner uracil (102-103/celle/døgn). Uracil vil basepare mot adenin i stedet for guanin, og er derfor mutagen. • 5-meC deaminerer også lett, og fører også til CT mutasjoner mC T • Dette har gjennom evolusjonen ført til tap av CpG sekvenser fra vertebrate genom. DNA deaminering • I 1999 ble enzymet Activation induced cytidine deaminase (AID) oppdaget. En trodde først dette enzymet deaminerte C i RNA, men det viste seg da at C i DNA er målet. • AID uttrykkes i antigen-stimulerte B-celler, transporteres inn i cellekjernen, og angriper målrettet immunglobulingenene ved å deaminere C til U i Ig-genenes v- og s-regioner. • Dette fører til mutasjoner og en kraftig økning i Ig-variabiliteten. Pasienter med AID-mangel får derved defekt adaptivt immunforsvar • En har senere funnet at andre humane enzymer i samme familie (APOBEC) kan deaminere C til U. Disse enzymene aktiveres ved virusinfeksjon, og ser ut til å være en viktig del av det innate immunforsvaret ved å initiere uracilering og degradering av viralt DNA • Ny forskning tyder imidlertid på at både AID og APOBEC-enzymer kan foreta «untargeted» deaminering også i det humane genomet. Hva er et gen? • Genene er de fysiske og funksjonelle enhetene forbundet med arv • Gjennom det humane genomprosjektet har en funnet at mennesket har ca 22 000 proteinkodende gener og at de proteinkodende sekvensene utgjør bare ca 1-2% av genomet. Proteinkodende gen RNA Protein Hva med resten av DNAet? • En kalte lenge DNAet mellom genene «junk DNA», og mente dette hovedsakelig var evolusjonsmessig «skrap» • I dag vet vi at store deler av dette DNAet uttrykker RNAmolekyler som aldri omsettes til protein, men som har flere viktige regulatoriske funksjoner • Nyere funn tyder faktisk på at RNA-molekyl kan være bærere av arvelig informasjon også hos eukaryoter! • En har f. eks funnet at Arabidopsisplanter (vårskrinneblom) kan «overkjøre» bestemte gensekvenser arvet fra sine foreldre, og revertere til sekvenser funnet hos besteforeldregenerasjonen (i ca 10% av avkommet) • En tror dette har skjedd via gamle RNAfragment overført fra tidligere generasjoner Ulike typer RNA • RNA (RiboNucleic Acid) har nesten samme grunnstruktur som DNA, bortsett fra at sukkergruppen er ribose, i stedet for deoksyribose – og at Tymin (T) er erstattet med Uracil (U). • Selv om ikke RNA danner den klassiske dobbelhelixstrukturen, kan basene danne basepar. Ulike RNA-molekyl kan derfor opptre i svært komplekse strukturer. • Hovedtyper RNA i cellen er: – mRNA: Budbringer RNA • (koder for proteiner) – rRNA: Ribosomalt RNA • (byggesteiner for ribosomer) – tRNA: Transfer-RNA • (”bærere” av aminosyrer) – miRNA: mikro-RNA • (viktig i genregulering) – ncRNA: non-coding RNA • (Funksjonelt viktig, diagnoseverktøy?) RNA-molekyler kan danne komplekse strukturer, som i dette tRNA-molekylet RNA-interferens og miRNA • Nobelprisen i medisin i 2006 gikk til Andrew Fire (Stanford) og Craig Mellon (Univ. of Massachusetts) for sin banebrytende oppdagelse av RNA interferens. • De fant i 1993 at korte, dobbelttrådete RNA molekyler sprøytet inn i celler (kalte disse small inhibitory RNA, siRNA) kunne redusere eller skru av uttrykket av gener. • Senere er det funnet at tilsvarende RNA lages i cellene selv (kalles micro RNA, miRNA). Hele 3% av våre gener koder for miRNA! • Disse er viktige både for organismens utvikling, og de fysiologiske funksjonene til både celler og vev. Mekanisme • DROSHA kutter ved foten av dsRNA hairpins laget i kjernen, og transporterer disse til cytoplasma. • Her er proteinet DICER, som kutter dette videre til korte siRNA/dsDNA fragment. • En del av DICER blir sittende på fragmentene, og flere proteiner rekrutteres og danner et RISCkompleks, som fjerner den ene RNA-tråden • RISC-miRNA komplekset rekrutterer inn Argonautproteiner, og sammen vil komplekset gjenkjenne komplementære mRNA, og kutte disse ved aktivering av SLICER-aktiviteten i et av Argonaut-proteinene. • Det er beregnet at 10-30% av alle gener reguleres ved miRNA-enten ved å regulere mengden mRNA, eller ved å regulere translasjonen. • Det har også vist seg at serum/plasma inneholder store mengder stabile miRNA, og at profilering av disse kan være nyttige diagnoseverktøy, blant annet for infeksjoner. RISC ( ) Isolering av DNA fra celler/vev • Klassisk metode: Tidligere ble de fleste trinnene gjort manuelt, og besto av mest mulig skånsomt å åpne cellene og løse DNAet. Deretter ble det foretatt ulike trinn for å fjerne proteiner, RNA og andre makromolekyler • I dag utføres DNA-ekstraksjon med kits eller er robotisert. Disse finnes i ulike varianter alt etter type startmateriale (bakterier, gjær, planter, humane celler etc), mengde DNA som skal isoleres, type DNA (kromosomalt, plasmid) og hvor høy grad av renhet som trengs. • I de fleste av disse kitene brukes ionebytterkromatografi – dvs. en matrix som selektivt binder DNA, mens andre typer molekyler vaskes ut. • Måten DNAet er ekstrahert på kan ha stor betydning for hvordan det skal analyseres i neste trinn. Endel vaske- og elueringsbuffere som benyttes i ionebytter-basert DNA-isolering kan for eksempel hemme enzymatiske reaksjoner. • Eks: PCR av aktin-genet fra humant placentalt DNA, • 50 ul reaksjon spiket med ulike volum av vaskeløsninger brukt i forkjellige kit • Ny ultra-rask DNAekstraksjon snart på markedet (60 sek)? Kontaminering i DNA isoleringskit er også påvist Isolering av RNA fra celler/vev • De grunnleggende prinsippene er som for isolering av DNA. I tillegg må en imidlertid ta hensyn til følgende: – Hvilken type RNA skal isoleres? total-RNA, mRNA, miRNA etc. – Hvor rent skal RNAet være? Fjerning av DNA nødvendig? – Inneholder materialet mye RNAser? Hvor kritisk er det å inhibere disse? For å unngå RNAser er det viktig at disse blir inhibert straks cellene åpnes. Dette kan være vanskelig for celler som har en hard cellevegg, f. eks gjær og gram-positive bakterier • Anbefalte metoder (Ambion) Det fins flere måter å unngå nedbrytning av RNA ved RNAser • Prøven homogeniseres straks etter høsting i en buffer som inneholder kaotrope forbindelser (f. eks. guanidin hydroklorid). Disse okkuperer hydrogenbindingene på proteiner og forårsaker denaturering av RNAser • Prøvene fryses og knuses i flytende nitrogen (prøvene må være små nok til at de fryser umiddelbart) • RNAse-frie buffere etc (f. eks ved DEPC-behandling), utstyr (RNAZap), -spesifikke RNAseinhibitorer (Placental RNAse inhibitor RNAsin, SUPERase-IN , RNAse-Out, Ribolock etc) • Placental RNAse inhibitor og SUPERase RNAlater (Ambion) • Lagringsløsning som muliggjør lagring av celler/vevsprøver ved 4oC over lengre tid før selve RNA-ekstraksjonen starter • I de fleste tilfeller kan det samme materialet også brukes f. eks for immunohistokjemiske analyser Enzymatisk behandling av DNA/RNA • De aller fleste protokoller for analyse av rensede nukleinsyrer omfatter enzymatisk behandling. Noen av de vanligste enzymene som benyttes er: – DNA restriksjonsendonukleaser – DNA/RNA ligaser – DNA-avhengige DNA polymeraser (også termostabile) – Templat-uavhegige DNA polymeraser (terminal transferase) – RNA-avhengige DNA polymeraser (revers transkriptase) – Fosfataser og kinaser (CIP,SAP, T4 polynukleotid kinase etc) – Eksonukleaser (S1, mung bean, DNAse I etc) • I dag er det et stort kommersielt marked og en lang rekke leverandører av disse enzymene, og gode protokoller, samt egnede reaksjonsbuffere følger som regel med enzymene. • Grunnleggende protokoller med rekasjonsmekanismer finnes også i f. eks. Current Protocols in Molecular Biology (Wiley) Sekvensering av DNA • For å kunne gjøre funksjonelle studier av DNA, er det nødvendig å kjenne DNA-sekvensen. Inntil for ca 10 år siden vas Sanger-sekvensering dominerende. • Enzymatisk sekvensering (Sanger 1977, 1980) Manuell – Rask, men sensitiv for ”vanskelige” DNA strukturer”. Benytter DNA polymerase for å syntetisere DNA, og dideoxy-dNTP for å stoppe forlengelsen. Bruk av alternative polymeraser har gjort strukturproblematikken mindre viktig – Metoden har blitt kraftig automatisert Automatisert Next generation sequencing • Etter ferdigstillingen av det humane genom i år 2000 har nye teknologier blitt utviklet som har revolusjonert effektiviteten i DNA sekvensering Next generation sequencing • Noe som har redusert kostnadene kraftig Next generation sequencing • Det finnes nå en rekke teknologier på markedet, med ulike egenskaper, leselengder, hurtighet og kostnader involvert What’s next? • Nanoteknologi kan gi det neste store spranget i sekvenseringshastighet. Her har Oxford Nanopores utviklet nanopore-sekvensering. • Hvis selskapet lykkes med kommersialiseringen av denne teknologien, vil det teoretisk kunne øke dagens sekvenseringshastighet nærmest ubegrenset • I tillegg vil den ha teoretisk potensiale til å detektere ulike basemodifikasjoner direkte • Teknologien har også potensiale for å kunne sekvensere proteiner! Sekvenserte genom • Siden 1995 er ca 10 000 genom sekvensert • De fleste av disse er fra prokaryoter, og svært mange er humane patogener • Mer informasjon om- og linker til sekvenserte genom kan finnes på – http://www.ncbi.nlm.nih.gov/genome • En rekke firma har spesialisert seg på å lage array for å detektere ulike grupper av patogener • Eks: • Luminex: ulike virus i luftveiene • Autogenomics: luftveisvirus, HPV, mykobakterier etc • Akonni, TessAree, Veredus: Influensavirus • De fleste av disse arrayene inneholder opptil 100 prober, og er altså ikke egnet for mer dyptpløyende analyser • Andre har utviklet array med mye høyere antall prober, som ViroChip, GreeneChip og LLMDA (Lawrence Livermore Microbial Detection Array) Et omfattende metoderepertoar Konklusjon? Dypsekvensering ser ut til å vinne terreng over andre teknologier når det gjelder mikrobiologisk identifikasjon og kvantitering Men: Den teknologiske utviklingen skjer så raskt at det er vanskelig å spå hva som blir fremtidens dominerende metoder Nyhetsoppdatering kan blant annet finnes her http://rapidmicromethods.com/