Secuenciación de Sanger

A secuenciación de Sanger ou método de secuenciación de Sanger é un método de secuenciación de ADN que foi inicialmente comercializado por Applied Biosystems e está baseado na incorporación selectiva de didesoxinucleótidos na terminación da cadea de ADN feita pola ADN polimerase durante a replicación do ADN in vitro.^[1]^[2] Foi desenvolvida por Frederick Sanger e colegas en 1977 e foi o método de secuenciación máis amplamente usado durante aproximadamente 40 anos. Máis recentemente, a secuenciación de Sanger de maior volume foi substituída polos métodos de secuenciación "Next-Gen", especialmente para análises de xenomas automatizados a grande escala. Porén, o método de Sanger segue sendo moi utilizado para proxectos a pequena escala, validación de resultados de Next-Gen e especialmente para obter lecturas de secuencias de ADN contiguas longas (> 500 nucleótidos).

Método

O método de terminación da cadea clásico require un molde de ADN monocatenario, un cebador de ADN, unha ADN polimerase, desoxinucleótidos trifosfato normais (dNTPs) e di-desoxinucleótidos trifosfato modificados (ddNTPs); estes últimos terminan a elongación da febra de ADN. Estes nucleótidos de terminación da cadea carecen do grupo 3'-OH necesario para a formación dun enlace fosfodiéster entre dous nucleótidos, o que causa que a ADN polimerase deixe de alongar o ADN cando se incorpora un ddNTP modificado. Os ddNTPs poden ser etiquetados radioactivamente ou por fluorescencia para a deteción en máquinas de secuenciación automatizadas.

A mostra de ADN é dividida para facer catro reaccións de secuenciación separadas, que conteñen os catro desoxinucleótidos estándar (dATP, dGTP, dCTP e dTTP) e a ADN polimerase. En cada reacción engádese só un dos catro didesoxinucleótidos (ddATP, ddGTP, ddCTP ou ddTTP), mentres que os outros nucleótidos engadidos son os normais. A concentración de didesoxinucleótido debería ser aproximadamente 100 veces menor que o do desoxinucleótido correspondente (por exemplo, 0,005 mM ddTTP : 0,5 mM dTTP) para que se poidan producir suficientes fragmentos á vez que aínda se transcribe a secuencia completa.^[2] Poñéndoos nunha orde máis apropiada, neste proceso cómpren catro reaccións separadas para probar os catro ddNTPs. Despois de roldas de alongamento do ADN molde a partir do cebador unido, os fragmentos de ADN resultantes quéntanse, desnaturalízanse e sepáranse por tamaño usando electroforese en xel. Na publicación orixinal de 1977,^[2] a formación de bucles de bases apareadas de ADN monocatenario causou graves dificultades á hora de resolver as bandas nalgunhas localizacións. Isto realízase frecuentemente usando un xel desnaturalizante de poliacrilamida-urea con cada unha das catro reaccións que se "corren" nos catro carreiros do xel individuais (carreiros A, T, G, C). As bandas de ADN poden despois ser visualizadas por autorradiografía ou luz UV e a secuencia de ADN pode ser lida directamente da película de raios X ou imaxe do xel. Na imaxe da dereita, a película de raios X foi exposta ao xel e as bandas escuras corresponden a fragmentos de ADN de diferentes lonxitudes. Unha banda escura nun carreiro do xel indica un fragmento de ADN que é o resultado da terminación da cadea despois da incorporación dun didesoxinucleótido (ddATP, ddGTP, ddCTP ou ddTTP). As posicións relativas de diferentes bandas de catro carreiros, desde o fondo á parte superior, utilízanse despois para ler a secuencia de ADN.

Parte dun xel de secuenciación etiquetado radioactivamente

Variacións técnicas da secuenciación de terminación da cadea son a etiquetaxe con nucleótidos que conteñen fósforo radioactivo para radioetiquetaxe ou usar un cebador etiquetado no extremo 5' cunha tinguidura fluorescente. A secuenciación de cebador tinguido facilita a lectura nun sistema óptico para unha análise máis rápida e económica e a automatización. O último desenvolvemento que fixeron Leroy Hood e os seus colaboradores^[3]^[4] de cebadores e ddNTPs etiquetados fluorescentemente preparou o camiño para a secuenciación de ADN de alto rendemento automatizada.

Os métodos de terminación de cadea simplificaron enormemente a secuenciación do ADN. Por exemplo, disponse comercialmente de kits baseados na terminación da cadea, os cales conteñen os reactivos necesarios para a secuenciación, pre-alicuotados e listos para usar. As limitacións son a unión non específica do cebador co ADN, que afecta á lectura exacta da secuencia do ADN e as estruturas secundarias do ADN, que afectan a fidelidade da secuencia.

Secuenciación de terminador de tinguidura

A secuenciación de terminador de tinguidura (dye-terminator sequencing) utiliza a etiquetaxe fluorescente dos ddNTPs terminadores de cadea, o cal permite secuenciar nunha soa reacción, en vez de en catro reaccións como no método de cebador etiquetado. Na secuenciación de terminador de tinguidura, cada un dos catro terminadores de cadea didesoxinucleótidos etiquétase con tinguiduras (ou marcaxes) fluorescentes, cada un dos cales emite luz de diferente lonxitude de onda.

Debido á súa maior conveniencia e velocidade, a secuenciación de terminador de tinguidura é agora o método básico en secuenciación automatizada. As súas limitacións son os efectos da tinguidura debidos a diferenzas na incorporación dos terminadores de cadea etiquetados con tinguidura no fragmento de ADN, o que ten como resultado formas e alturas de pico desiguais no cromatograma do rastro da secuencia de ADN electrónica despois da electroforese capilar (ver figura da esquerda).

Este problema foi combatido co uso de sistemas de encimas ADN polimerase modificados e tinguiduras que minimizan a variabilidade de incorporación, así como métodos para a eliminación dos chamados "borróns de tinguidura" ("dye blobs"). O método de secuenciación de terminador de tinguidura, xunto coos analizadores de secuencia de ADN de alto rendemento automatizados, foron usados na gran maioría dos proxectos de secuenciación ata a introdución da secuenciación de seguinte xeración.

Automatización e preparación da mostra

Vista do comezo dun exemplo de lectura de terminador de tinguidura

Os instrumentos de secuenciación de ADN automatizada (secuenciadores de ADN) poden secuenciar ata 384 mostras de ADN nun só lote. Os procesamentos dos lotes poden facerse as 24 horas do día. Os secuenciadores separan as febras por tamaño (ou lonxitude) usando electroforese de capilaridade, detectan e rexistran a fluorescencia das tinguiduras, e presentan os datos como cromatogramas de rastros de picos de fluorescencia. As reaccións de secuenciación (termociclado e etiquetaxe), o lavado e a resuspenión das mostras nunha solución tampón realízanse por separado, antes de cargar as mostras no secuenciador. Existen varios paquetes de software comerciais e non comerciais que poden eliminar os rastros de ADN de baixa calidade automaticamente. Estes programas calculan a calidade de cada pico e eliminan os picos de baixa calidade (que están xeralmente localizados nos extremos da secuencia). A exactitude deses algoritmos é inferior ao exame visual feito por un operador humano, pero é adecuado para o procesamento automatizado de conxuntos de datos de secuencias grandes.

Retos

Retos comúns que presenta a secuenciación do ADN polo método de Sanger son a baixa calidade nas primeiras 15-40 bases da secuencia debido á unión de cebadores e á calidade deteriorada de rastros de secuencias de máis de 700-900 bases.^[5] O software de base calling (no que se identifican as bases polos sinais de intensidade da luz), como Phred, proporciona unha estimación da calidade para axudar na eliminación de rexións de baixa calidade de secuencias.^[6]^[7]

En casos nos que se clonan fragmentos de ADN antes de secuenciar, a secuencia resultante pode conter partes do vector de clonación. En contraste, a clonación baseada en PCR e as tecnoloxías de secuenciación de seguinte xeración baseadas en pirosecuenciación adoitan evitar o uso de vectores de clonación. Recentemente, desenvolvéronse os métodos de secuenciación de Sanger nun paso (combinando amplificación e secuenciación) como Ampliseq e SeqSharp, que permiten unha rápida secuenciación de xenes diana sen clonar ou antes da amplificación.^[8]^[9]

Os métodos actuais só poden secuenciar directamente fragmentos de ADN relativamente curtos (300-1000 nucleótidos de longo) nunha soa reacción. O principal obstáculo de secuenciar fragmentos de ADN por riba deste límite de tamaño é o insuficiente poder de separación para resolver grandes fragmentos de ADN que difiren en lonxitude en só un nucleótido.

Secuenciación de Sanger microfluídica

A secuenciación de Sanger microfluídica é unha amplificación lab-on-a-chip para a secuenciación de ADN, na cal os pasos de secuenciación de Sanger (ciclado térmico, purificación da mostra e electroforese capilar) están integrados nun chip do tamaño dunha oblea que usa volmes de mostra a escala de nanolitros. Esta tecnoloxía xera lecturas de secuencia longas e exactas, mentres que obvia moitos dos defectos significativos do método de Sanger convencional (por exemplo, o alto consumo de reactivos caros, a dependencia de equipos caros, a manipulacións que requiren moito persoal etc.) ao integrar e automatizar os pasos de secuenciación de Sanger.

Nos seus comezos modernos, a secuenciación de xenomas de alto rendemento implican a fragmentación do xenoma en pequenos cachos monocatenarios, seguidos da amplificación dos fragmentos por reacción en cadea da polimerase (PCR). Adoptando o método de Sanger, cada fragmento de ADN é terminado irreversiblemente coa incorporación dun nucleótido de terminación de cadea didesoxi etiquetado fluorescentemente, producindo así a “escada” de ADN de fragmentos que difiren en lonxitude nunha soa base e levan unha etiqueta fluorescente específica de base na base terminal. As escadas de bases amplificadas son despois separadas por electroforese de matriz capilar (Capillary Array Electrophoresis, CAE) con detección de "liña final" automatizada in situ de fragmentos de ADN monocatenarios etiquetados fluorescentemente, que proporcionan unha secuencia ordenada dos fragmentos. Estas lecturas de secuencia son despois ensambladas por computador en secuencias solapadas ou contiguas (denominadas "cóntigos"), que lembran a secuencia xenómica completa unha vez completamente ensambladas.^[10]

Os métodos de Sanger conseguen lonxitudes de lectura de aproximadamente 800 pares de bases (normalmente 500-600 pares de bases con ADN non enriquecido). As lonxitudes de lectura máis longas nos métodos de Sanger mostran vantaxes significativas sobre outros métodos de secuenciación especialmente en canto a secuenciar rexións repetitivas do xenoma. O reto que presentan os datos de secuencias de lectura curtas é un especial problema na secuenciación de novos xenomas e na secuenciación de segmentos de xenoma altamente rearranxados, como aqueles que se observan en xenomas cancerosos ou en rexións de cromosomas que mostran variación estrutural.^[11]

Aplicacións das tecnoloxías de secuenciación microfluídicas

Outras aplicacións útiles da secuenciación de ADN son a detección de polimorfismos de nucleótido único (SNP), a análise de heterodúplex de polimorfismos de conformación de febra simple (SSCP), e a análise de repeticións en tándem curtas (STR). O paso máis crítico no estudo destas características do xenoma é resolver fragmentos de ADN segundo as diferenzas en tamaño e/ou conformación.^[10]

Deseño de aparellos

O chip de secuenciación ten unha construción en catro capas, que consta de tres obleas de cristal de 100 mm de diámetro (cuxos elementos son microfabricados) e unha membrana de polidimetilsiloxano (PDMS). As dúas obleas de cristal superiores están unidas termicamente e entre elas grávanse cámaras de reacción e canles de electroforese. Fórmanse interconexións de canles tridimensionais e microválvulas entre a PDMS e a oblea de cristal colectora do fondo.

O aparello consta de tres unidades funcionais, cada unha correspondente aos pasos de secuenciación de Sanger. A unidade de Ciclado Térmico (TC) é unha cámara de reacción de 250 nanolitros cun detector de temperatura resistente integrado, microválvulas e un quentador de superficie. O movemento do reactivo entre a capa de cristal superior e a capa de cristal inferior-PDMS ocorre a través de buratos de 500 μm de diámetro. Despois do ciclado térmico, a mestura da reacción sofre unha purificación na cámara de captura/purificación e despois é inxectada na cámara de electroforese capilar (CE). A unidade de electroforese capilar consta dun capilar de 30 cm, que está pregado formando un zigzag compacto con xiros de 65 μm de ancho.

Química da secuenciación

Ciclado térmico

Na cámara de reacción de ciclado térmico, cárganse o reactivo de secuenciación de terminador de tinguidura, o ADN molde e cebadores e faise un termociclado durante 35 ciclos (a 95 °C durante 12 segundos e a 60 °C durante 55 segundos).

Purificación

A mestura de reacción cargada (que contén os fragmentos de extensión, o ADN molde e o exceso de reactivos de secuenciación) é conducida a través dunha cámara de captura/purificación a 30 °C por medio dun campo eléctrico de 33 volts/cm aplicados entre a os portos de entrada e saída da captura. O xel de captura a través do cal se conduce a mostra consta de 40 μM de oligonucleótidos (complementarios cos cebadores) unidos covalentemente a unha matriz de poliacrilamida. Os fragmentos de extensión están inmobilizados pola matriz do xel, e elúense o exceso de cebador, molde, nucleótidos libres e sales a través do porto de refugallos da captura. O xel de captura quéntase a 67-75 °C para liberar os fragmentos de extensión.

Electroforese capilar

Inxéctanse os fragmentos de extensión na cámra de electroforese capilar, onde son sometidos a electroforese a través dun campo de 125-167 V/cm.

Plataformas

A plataforma Apollo 100 (Microchip Biotechnologies Inc., Dublin, CA)^[12] integra os primeiros pasos da secuenciación de Sanger (termociclado e purificación) nun sistema totalmente automatizado. O fabricande indica que as mostras están listas para a electroforese capilar en tres horas unha vez que se cargan a mostra e os reactivos no sistema. A plataforma Apollo 100 require volumes de submicrolitros dos reactivos.

Notas

↑ Sanger F; Coulson AR (May 1975). "A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase". J. Mol. Biol. 94 (3): 441–8. PMID 1100841. doi:10.1016/0022-2836(75)90213-2.
↑ ^2,0 ^2,1 ^2,2 Sanger F; Nicklen S; Coulson AR (December 1977). "DNA sequencing with chain-terminating inhibitors". Proc. Natl. Acad. Sci. U.S.A. 74 (12): 5463–7. Bibcode:1977PNAS...74.5463S. PMC 431765. PMID 271968. doi:10.1073/pnas.74.12.5463.
↑ Smith LM, Sanders JZ, Kaiser RJ, et al. (1986). "Fluorescence detection in automated DNA sequence analysis". Nature 321 (6071): 674–9. Bibcode:1986Natur.321..674S. PMID 3713851. doi:10.1038/321674a0. Desenvolvemos un método para a automatización parcial da análise de secuencia de ADN. A detección de fluorescencia de fragmentos de ADN realízase por medio dun fluoróforo unido covalentemente a un cebador oligonucleótido usado en análises de secuencias de ADN encimáticas. Un fluoróforo de cor diferente utilízase para cada unha das reaccións específicas das bases A, C, G e T. As mesturas de reacción son combinadas e sometidas á vez a electroforese nun só tubo de xel de poliacrilamida, as bandas fluorescentes separadas de ADN son detectadas case no fondo do tubo, e a información da secuencia obtense directamente por computador.
↑ Smith LM; Fung S; Hunkapiller MW; Hunkapiller TJ; Hood LE (April 1985). "The synthesis of oligonucleotides containing an aliphatic amino group at the 5' terminus: synthesis of fluorescent DNA primers for use in DNA sequence analysis". Nucleic Acids Res. 13 (7): 2399–412. PMC 341163. PMID 4000959. doi:10.1093/nar/13.7.2399.
↑ binf snipacademy Sanger sequencing chain-termination method Arquivado 16 de febreiro de 2019 en Wayback Machine.
↑ "Phred - Quality Base Calling". Consultado o 2011-02-24.
↑ Ledergerber, C; Dessimoz, C (2011). "Base-calling for next-generation sequencing platforms". Briefings in Bioinformatics 12 (5): 489–97. PMC 3178052. PMID 21245079. doi:10.1093/bib/bbq077.
↑ Murphy, K.; Berg, K.; Eshleman, J. (2005). "Sequencing of genomic DNA by combined amplification and cycle sequencing reaction". Clinical Chemistry 51 (1): 35–39. PMID 15514094. doi:10.1373/clinchem.2004.039164.
↑ Sengupta, D. .; Cookson, B. . (2010). "SeqSharp: A general approach for improving cycle-sequencing that facilitates a robust one-step combined amplification and sequencing method". The Journal of Molecular Diagnostics 12 (3): 272–277. PMC 2860461. PMID 20203000. doi:10.2353/jmoldx.2010.090134.
↑ ^10,0 ^10,1 Kan, Cheuk-Wai; Fredlake, Christopher P.; Doherty, Erin A. S.; Barron, Annelise E. (1 November 2004). "DNA sequencing and genotyping in miniaturized electrophoresis systems". Electrophoresis 25 (21–22): 3564–3588. PMID 15565709. doi:10.1002/elps.200406161.
↑ Morozova, Olena; Marra, Marco A (2008). "Applications of next-generation sequencing technologies in functional genomics". Genomics 92 (5): 255–64. PMID 18703132. doi:10.1016/j.ygeno.2008.07.001.
↑ Microchip Biologies Inc. Apollo 100 Arquivado 28 de agosto de 2008 en Wayback Machine.

Véxase tamén

Bibliografía

https://web.archive.org/web/20120214053015/http://nano.cancer.gov/news_center/nanotech_news_2006-05-30a.asp
https://web.archive.org/web/20120214053039/http://nano.cancer.gov/news_center/monthly_feature_2005_aug.asp
Dewey, F. E; Pan, S; Wheeler, M. T; Quake, S. R; Ashley, E. A (2012). "DNA Sequencing: Clinical Applications of New DNA Sequencing Technologies". Circulation 125 (7): 931–44. PMC 3364518. PMID 22354974. doi:10.1161/CIRCULATIONAHA.110.972828.
Sanger, F; Coulson, A.R; Barrell, B.G; Smith, A.J.H; Roe, B.A (1980). "Cloning in single-stranded bacteriophage as an aid to rapid DNA sequencing". Journal of Molecular Biology 143 (2): 161–78. PMID 6260957. doi:10.1016/0022-2836(80)90196-5.

Ligazóns externas

MBI Says New Tool That Automates Sanger Sample Prep Cuts Reagent and Labor Costs

[Sanger75-1] Sanger F; Coulson AR (May 1975). "A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase". J. Mol. Biol. 94 (3): 441–8. PMID 1100841. doi:10.1016/0022-2836(75)90213-2.

[Sanger1977-2] 2,0 ^2,1 ^2,2 Sanger F; Nicklen S; Coulson AR (December 1977). "DNA sequencing with chain-terminating inhibitors". Proc. Natl. Acad. Sci. U.S.A. 74 (12): 5463–7. Bibcode:1977PNAS...74.5463S. PMC 431765. PMID 271968. doi:10.1073/pnas.74.12.5463.

[3] Smith LM, Sanders JZ, Kaiser RJ, et al. (1986). "Fluorescence detection in automated DNA sequence analysis". Nature 321 (6071): 674–9. Bibcode:1986Natur.321..674S. PMID 3713851. doi:10.1038/321674a0. Desenvolvemos un método para a automatización parcial da análise de secuencia de ADN. A detección de fluorescencia de fragmentos de ADN realízase por medio dun fluoróforo unido covalentemente a un cebador oligonucleótido usado en análises de secuencias de ADN encimáticas. Un fluoróforo de cor diferente utilízase para cada unha das reaccións específicas das bases A, C, G e T. As mesturas de reacción son combinadas e sometidas á vez a electroforese nun só tubo de xel de poliacrilamida, as bandas fluorescentes separadas de ADN son detectadas case no fondo do tubo, e a información da secuencia obtense directamente por computador.

[4] Smith LM; Fung S; Hunkapiller MW; Hunkapiller TJ; Hood LE (April 1985). "The synthesis of oligonucleotides containing an aliphatic amino group at the 5' terminus: synthesis of fluorescent DNA primers for use in DNA sequence analysis". Nucleic Acids Res. 13 (7): 2399–412. PMC 341163. PMID 4000959. doi:10.1093/nar/13.7.2399.

[5] snipacademy Sanger sequencing chain-termination method Arquivado 16 de febreiro de 2019 en Wayback Machine.

[urlPhred_-_Quality_Base_Calling-6] "Phred - Quality Base Calling". Consultado o 2011-02-24.

[urlBase-calling_for_next-generation_sequencing_platforms_—_Brief_Bioinform-7] Ledergerber, C; Dessimoz, C (2011). "Base-calling for next-generation sequencing platforms". Briefings in Bioinformatics 12 (5): 489–97. PMC 3178052. PMID 21245079. doi:10.1093/bib/bbq077.

[8] Murphy, K.; Berg, K.; Eshleman, J. (2005). "Sequencing of genomic DNA by combined amplification and cycle sequencing reaction". Clinical Chemistry 51 (1): 35–39. PMID 15514094. doi:10.1373/clinchem.2004.039164.

[9] Sengupta, D. .; Cookson, B. . (2010). "SeqSharp: A general approach for improving cycle-sequencing that facilitates a robust one-step combined amplification and sequencing method". The Journal of Molecular Diagnostics 12 (3): 272–277. PMC 2860461. PMID 20203000. doi:10.2353/jmoldx.2010.090134.

[kan-10] 10,0 ^10,1 Kan, Cheuk-Wai; Fredlake, Christopher P.; Doherty, Erin A. S.; Barron, Annelise E. (1 November 2004). "DNA sequencing and genotyping in miniaturized electrophoresis systems". Electrophoresis 25 (21–22): 3564–3588. PMID 15565709. doi:10.1002/elps.200406161.

[marra-11] Morozova, Olena; Marra, Marco A (2008). "Applications of next-generation sequencing technologies in functional genomics". Genomics 92 (5): 255–64. PMID 18703132. doi:10.1016/j.ygeno.2008.07.001.

[two-12] Microchip Biologies Inc. Apollo 100 Arquivado 28 de agosto de 2008 en Wayback Machine.

[1]