Varijacija broja kopija
Varijacija broja kopija (CNV) je fenomen u kojem se dijelovi genoma ponavljaju i broj ponavljanja u njemu individualno varira.[1] Varijacija broja kopija je tip strukturne varijacije: konkretno, to je tip duplikacija ili delecija koji utiče na značajan broj parova baza.[2] Otprilike dvije trećine cjelokupnog ljudskog genoma može se sastojati od ponavljanja[3] i 4,8–9,5% može se klasifikovati kao varijacije broja kopija.[4] Kod sisara varijacije broja kopija imaju važnu ulogu u stvaranju potrebnih varijacija u populaciji, kao i fenotipa bolesti.[1]
Varijacije broja kopija mogu se općenito kategorizirati u dvije glavne grupe: kratka ponavljanja i duga ponavljanja. Međutim, ne postoje jasne granice između ove dvije grupe i klasifikacija zavisi od prirode lokusa od interesa. Kratka ponavljanja uključuju uglavnom dinukleotidna ponavljanja (dva nukleotida koja se ponavljaju, npr. A–C–A–C–A–C...) [i trinukleotidna ponavljanja. Duga ponavljanja uključuju ponavljanja čitavih gena. Ova klasifikacija zasnovana na veličini ponavljanja je najočitiji tip klasifikacije jer je veličina važan – u ispitivanju tipova mehanizama koji su najvjerovatnije doveli do ponavljanja;[5] otuda potiču vjerovatni efekti ovih ponavljanja na fenotip.
Tipovi i hromosomski rearanžmani
[uredi | uredi izvor]Jedan od najpoznatijih primjera varijacije kratkog broja kopija je trinukleotidno ponavljanje parova CAG baza u huntingtinskog gena odgovornog za neurološki poremećaj Huntingtonova bolest.[6] U ovom konkretnom slučaju, kada se trinukleotid CAG ponovi više od 36 puta u [[ekspanzija trinukleotidnog ponavljanja |ekspanziji nukleotidnog ponavljanja Huntingtonova bolest će se vjerovatno razviti kod pojedinca i vjerovatno će je naslijediti njegovo ili njeno potomstvo.[6] Broj ponavljanja trinukleotida CAG je u korelaciji sa dobi početka Huntingtonove bolesti.[7] Često se smatra da su ovi tipovi kratkih ponavljanja uzrokovani greškama u aktivnosti polimeraza tokom replikacije, uključujući klizanje polimeraze, prebacivanje šablona i prebacivanje replikacijskih viljuški. Kratka veličina ponavljanja ovih varijacija broja kopija podložna je greškama u polimerazi jer su ove ponovljene regije sklone pogrešnom prepoznavanju za polimeraze i replicirane regije mogu se ponovo replicirati, što dovodi do dodatnih kopija ponavljanja.[8] Osim toga, ako su ovi trinukleotidni ponavljači u istom okviru čitanja u kodirajućem dijelu gena, to može dovesti do dugog lanca iste aminokiseline, moguće stvarajući agregate proteina u ćeliji,[7] i ako ova kratka ponavljanja padaju u nekodirajući dio gena, to može uticati na ekspresiju gena i regulaciju. S druge strane, promjenjivi broj ponavljanja cijelih gena rjeđe je identificiran u genomu. Jedan primjer ponavljanja cijelog gena je za alfa amilazu (AMY1), koji kodira enzim koji ima značajne varijacije u broju kopija između različitih populacija s različitim načinima ishrane.[9] Iako je specifičan mehanizam koji omogućava genu AMY1 da poveća ili smanji broj kopija još uvijek tema rasprave, neke hipoteze sugeriraju da je nehomologno spajanje kraja ili mikrohomologno posredovano spajanje kraja vjerovatno odgovorno za ova kompletna genska ponavljanja.[9] Ponavljanje čitavih gena ima trenutne efekte na ekspresiju tog određenog gena, a činjenica da je varijacija broja kopija gena AMY1 povezana s ishranom je izuzetna primjer nedavne ljudske evolucijske adaptacije.[9] Iako su ovo opće grupe u koje su grupirane varijacije broja kopija, tačan broj parova baza koje varijacije u broju kopija utiču ovisi o specifičnim lokusima od interesa. Do sada, koristeći podatke iz svih prijavljenih varijacija broja kopija, srednja veličina varijante broja kopija je oko 118 kb, a medijana je oko 18 kb.[10]
U smislu strukturne arhitekture varijacija broja kopija, istraživanje je predložilo i definiralo žarišne regije u genomu gdje su varijacije broja kopija četiri puta više obogaćene.[2] Ove žarišne regije su definirane kao regije koje sadrže dugačka ponavljanja koja su 90-100% slična poznata kao segmentna duplikacija ili tandemska ili isprepletena i što je najvažnije, ove žarišne regije imaju povećanu stopu hromozomskog preuređivanja.[2] Smatralo se da ova velika hromosomska preuređivanja dovode do normalne varijacije i genetske bolesti, uključujući varijacije broja kopija.[1] Štaviše, ove žarišne tačke varijacije broja kopija su konzistentne u mnogim populacijama sa različitih kontinenata, što implicira da su ove žarišne tačke ili nezavisno stekle sve populacije i prenošene kroz generacije, ili su stečene u ranim fazama ljudske evolucije, prije nego što se populacije podijele, ovo drugo izgleda vjerovatnije.[1] Na kraju, čini se da se u genomu ne pojavljuju prostorne pristranosti lokacije na kojoj su varijacije broja kopija najgušće raspoređene.<ref. name="Mccaroll and altshuler"/> Iako je prvobitno otkriveno fluorescentnom in situ hibridizacijom i mikrosatelitskom analizom da su ponavljanja broja kopija lokalizirana na regije koje se vrlo ponavljaju, kao što su telomera, centromere i heterohromatin,[11] nedavne studije asocijacije na cijelom genomu su zaključile drugačije.[2] Naime, subtelomerne i pericentromerne regije su mjesta gdje se nalazi većina žarišta hromosomskog preuređivanja, i nema značajnog povećanja varijacija u broju kopija u toj regiji.[2] Nadalje, ovi žarišni dijelovi hromosomskog preuređivanja nemaju smanjen broj gena, što, opet, implicira da postoji minimalna prostorna pristranost genomske lokacije varijacija broja kopija.[2]
Detekcija i identifikacija
[uredi | uredi izvor]Prvobitno se putem citogenetičkih opažanja smatralo da varijacije broja kopija zauzimaju izuzetno mali i zanemarljiv dio genoma.[12] Varijacije u broju kopija općenito su bile povezane samo s malim tandemskim ponavljanjima ili specifičnim genetičkim poremećajima,[13] stoga su varijacije broja kopija u početku ispitivane samo u smislu specifičnih lokusa. Međutim, tehnološki razvoj doveo je do sve većeg broja vrlo preciznih načina identifikacije i proučavanja varijacija broja kopija. Varijacije broja kopija su prvobitno proučavane citogenetičkim tehnikama, koje omogućavaju posmatranje fizičke strukture hromosoma.[12] Jedna od ovih tehnika je fluorescentna in situ hibridizacija (FISH), koja uključuje ubacivanje fluorescentnih sondi koje zahtevaju visok stepen komplementarnosti u genom za vezivanje.[10] Uporedna genomska hibridizacija se također obično koristi za otkrivanje varijacija broja kopija putem fluoroforne vizualizacija, a zatim poređenja dužine hromosoma.[10] Jedan veliki nedostatak ovih ranih tehnika je da je genomska rezolucija relativno niska i da se mogu detektovati samo velika ponavljanja, kao što su ponavljanja čitavog gena.
Nedavni napredak u genomičkim tehnologijama doveo je do mnogih važnih metoda koji su izuzetno visoke genomske rezolucije i kao rezultat toga, prijavljen je sve veći broj varijacija broja kopija u genomu.[10] U početku su ovi napredak koji uključuje korištenje bakterijskih vještačkih hromosoma (BAC) niza sa oko 1 megabaznog intervala kroz cijeli gen,[14] BAC-ovi također mogu detektovati varijacije broja kopija u žarišnim tačkama za preuređivanje, omogućavajući otkrivanje 119 novih varijacija broja kopija.[2] Genomsko sekvenciranje visoke propusnosti je revolucioniralo polju ljudske genomike i in silico studije su sprovedene da bi se otkrile varijacije broja kopija u genomu.[2] Referentne sekvence su upoređene sa drugim sekvencama od interesa pomoću fosmida s strogom kontrolom fosmidnih klonova da budu 40 kb.[15] Sekvenciranje krajnjeg čitanja bi dalo adekvatne informacije za usklađivanje referentne sekvence sa sekvencom od interesa, a svaka neusklađenost je lahko uočljiva, pa se zaključuje da su varijacije broja kopija unutar tog klonskog regiona.[15] Ovaj tip tehnike detekcije nudi visoku genomsku rezoluciju i preciznu lokaciju ponavljanja u genomu, a može otkriti i druge tipove strukturnih varijacija kao što su inverzije.[10]
Osim toga, drugi način otkrivanja varijacije broja kopija je korištenje jednonukleotidnih polimorfizama (SNP).[10] Zbog obilja podataka o ljudskim SNP, smjer detekcije varijacije broja kopija se promijenio u koristiti ove SNP-ove.[16] Oslanjajući se na činjenicu da su ljudske rekombinacije relativno rijetke i da se mnogi događaji rekombinacije dešavaju u specifičnim regijama genoma poznatim kao žarišta rekombinacije, za identifikaciju varijacija broja kopija može se koristiti neravnoteža veza.[16] Učinjeni su napori u povezivanju varijacija broja kopija sa specifičnim haplotipnim SNP-ovima analizom neravnoteže veze; koristeći ove asocijacije, moguće je prepoznati varijacije broja kopija u genomu koristeći SNP-ove kao markere. sekvenciranja sljedeće generacije, uključujući sekvenciranje kratkog i dugog čitanja, danas se sve više koriste i počele su zamjenjivati tehnike zasnovane na nizu za otkrivanje varijacija broja kopija.[17][18] Za razliku od tehnika zasnovanih na sekvenci, metodi detekcije zasnovani na sekvenciranju lahko identifikuju druge klase strukturnih varijacija, kao što su inverzije i translokacije.
Također pogledajte
[uredi | uredi izvor]- Uporedna genomika
- Analiza broja kopija
- Ljudski genom
- Inparanoid
- Molekulska evolucija
- Pseudogeni
- Segmentna duplikacija
- Tandemska egzonska duplikacija
- Virtualni kariotip
Reference
[uredi | uredi izvor]- ^ a b c d McCarroll SA, Altshuler DM (July 2007). "Copy-number variation and association studies of human disease". Nature Genetics. 39 (7 Suppl): S37-42. doi:10.1038/ng2080. PMID 17597780. S2CID 8521333.
- ^ a b c d e f g h Sharp AJ, Locke DP, McGrath SD, Cheng Z, Bailey JA, Vallente RU, et al. (July 2005). "Segmental duplications and copy-number variation in the human genome". American Journal of Human Genetics. 77 (1): 78–88. doi:10.1086/431652. PMC 1226196. PMID 15918152.
- ^ de Koning AP, Gu W, Castoe TA, Batzer MA, Pollock DD (December 2011). "Repetitive elements may comprise over two-thirds of the human genome". PLOS Genetics. 7 (12): e1002384. doi:10.1371/journal.pgen.1002384. PMC 3228813. PMID 22144907.
- ^ Zarrei M, MacDonald JR, Merico D, Scherer SW (March 2015). "A copy number variation map of the human genome". Nature Reviews. Genetics. 16 (3): 172–83. doi:10.1038/nrg3871. hdl:2027.42/146425. PMID 25645873. S2CID 19697843.
- ^ Hastings PJ, Lupski JR, Rosenberg SM, Ira G (August 2009). "Mechanisms of change in gene copy number". Nature Reviews. Genetics. 10 (8): 551–64. doi:10.1038/nrg2593. PMC 2864001. PMID 19597530.
- ^ a b "A novel gene containing a trinucleotide repeat that is expanded and unstable on Huntington's disease chromosomes. The Huntington's Disease Collaborative Research Group" (PDF). Cell. 72 (6): 971–83. March 1993. doi:10.1016/0092-8674(93)90585-e. hdl:2027.42/30901. PMID 8458085. S2CID 802885.
- ^ a b Myers RH (April 2004). "Huntington's disease genetics". NeuroRx. 1 (2): 255–62. doi:10.1602/neurorx.1.2.255. PMC 534940. PMID 15717026.
- ^ Albertini AM, Hofer M, Calos MP, Miller JH (June 1982). "On the formation of spontaneous deletions: the importance of short sequence homologies in the generation of large deletions". Cell. 29 (2): 319–28. doi:10.1016/0092-8674(82)90148-9. PMID 6288254. S2CID 36657944.
- ^ a b c Perry GH, Dominy NJ, Claw KG, Lee AS, Fiegler H, Redon R, et al. (October 2007). "Diet and the evolution of human amylase gene copy number variation". Nature Genetics. 39 (10): 1256–60. doi:10.1038/ng2123. PMC 2377015. PMID 17828263.
- ^ a b c d e f Freeman JL, Perry GH, Feuk L, Redon R, McCarroll SA, Altshuler DM, et al. (August 2006). "Copy number variation: new insights in genome diversity". Genome Research. 16 (8): 949–61. doi:10.1101/gr.3677206. PMID 16809666.
- ^ Bailey JA, Gu Z, Clark RA, Reinert K, Samonte RV, Schwartz S, et al. (August 2002). "Recent segmental duplications in the human genome". Science. 297 (5583): 1003–7. Bibcode:2002Sci...297.1003B. doi:10.1126/science.1072047. PMID 12169732. S2CID 16501865.
- ^ a b Jacobs PA, Browne C, Gregson N, Joyce C, White H (February 1992). "Estimates of the frequency of chromosome abnormalities detectable in unselected newborns using moderate levels of banding". Journal of Medical Genetics. 29 (2): 103–8. doi:10.1136/jmg.29.2.103. PMC 1015848. PMID 1613759.
- ^ Inoue K, Lupski JR (2002). "Molecular mechanisms for genomic disorders". Annual Review of Genomics and Human Genetics. 3: 199–242. doi:10.1146/annurev.genom.3.032802.120023. PMID 12142364.
- ^ Iafrate AJ, Feuk L, Rivera MN, Listewnik ML, Donahoe PK, Qi Y, et al. (September 2004). "Detection of large-scale variation in the human genome". Nature Genetics. 36 (9): 949–51. doi:10.1038/ng1416. PMID 15286789.
- ^ a b Tuzun E, Sharp AJ, Bailey JA, Kaul R, Morrison VA, Pertz LM, et al. (July 2005). "Fine-scale structural variation of the human genome". Nature Genetics. 37 (7): 727–32. doi:10.1038/ng1562. PMID 15895083. S2CID 14162962.
- ^ a b Conrad B, Antonarakis SE (2007). "Gene duplication: a drive for phenotypic diversity and cause of human disease". Annual Review of Genomics and Human Genetics. 8: 17–35. doi:10.1146/annurev.genom.8.021307.110233. PMID 17386002.
- ^ Alkan C, Coe BP, Eichler EE (May 2011). "Genome structural variation discovery and genotyping". Nature Reviews. Genetics. 12 (5): 363–76. doi:10.1038/nrg2958. PMC 4108431. PMID 21358748.
- ^ Sudmant PH, Rausch T, Gardner EJ, Handsaker RE, Abyzov A, Huddleston J, et al. (October 2015). "An integrated map of structural variation in 2,504 human genomes". Nature. 526 (7571): 75–81. Bibcode:2015Natur.526...75.. doi:10.1038/nature15394. PMC 4617611. PMID 26432246.
Dopunska literatura
[uredi | uredi izvor]- Pollack JR, Perou CM, Alizadeh AA, Eisen MB, Pergamenschikov A, Williams CF, Jeffrey SS, Botstein D, Brown PO (September 1999). "Genome-wide analysis of DNA copy-number changes using cDNA microarrays". Nature Genetics. 23 (1): 41–6. doi:10.1038/12640. PMID 10471496. S2CID 997032.
- "Huge genetic variation in healthy people". New Scientist. 7 August 2004.
- Carter NP (September 2004). "As normal as normal can be?". Nature Genetics. 36 (9): 931–2. doi:10.1038/ng0904-931. PMID 15340426.
- Check E (October 2005). "Human genome: patchwork people". Nature. 437 (7062): 1084–6. Bibcode:2005Natur.437.1084C. doi:10.1038/4371084a. PMID 16237414. S2CID 8211641.
- "Gene duplications may define who you are". New Scientist. 22 November 2006.
- "DNA varies more widely from person to person, Genetic maps reveal". National Geographic. 22 November 2006.
- "Finding the right lenses" (PDF). Nature Genetics. 1 July 2007.
- Lam HY, Mu XJ, Stütz AM, Tanzer A, Cayting PD, Snyder M, et al. (January 2010). "Nucleotide-resolution analysis of structural variants using BreakSeq and a breakpoint library". Nature Biotechnology. Nature Biotechnoloty. 28 (1): 47–55. doi:10.1038/nbt.1600. PMC 2951730. PMID 20037582.
- "New Research Sheds Light on Autism's Genetic Causes". Singularity Hub. 15 June 2010. Arhivirano s originala, 18 June 2010. Pristupljeno 15 June 2010.
Vanjski linkovi
[uredi | uredi izvor]- Copy Number Variation Project, Sanger Institute
- The Claim: Identical Twins Have Identical DNA
- Integrative annotation platform for copy number variations in humans
- A bibliography on copy number variation
- Database of Genomic Variants, a database of structural variants in the human genome
- Copy Number Variation Detection via High-Density SNP Genotyping
- Oxford Gene Technology
- BioDiscovery Nexus Copy Number
- High-resolution mapping of copy number variations in 2,026 healthy individuals
- IGSR: The International Genome Sample Resource
- cn.FARMS: a latent variable model to detect copy number variations in microarray data with a low false discovery rate, an R package—software
- cn.MOPS: mixture of Poissons for discovering copy number variations in next generation sequencing data—software