Download Análisis de la diversidad nucleotídica en el gen G6pd
Document related concepts
Transcript
Análisis de la diversidad nucleotídica en el gen G6pd El gen G6pd (gen ligado al sexo) codifica la síntesis del enzima glucosa 6 fosfato deshidrogenasa, enzima implicada en la vía de las pentosas fosfato y que actúa como mecanismo fundamental de protección de los hematíes frente a la oxidación. Su déficit es responsable de algunos tipos de anemia hemolítica. En Drosophila, el polimorfismo del gen G6pd ha sido extensamente utilizado como modelo empírico y sus relaciones filogenéticas y funcionales con otros taxones han sido estudiadas. En esta práctica, estudiaremos el patrón de polimorfismo nucleotídico y de divergencia entre D. melanogaster y D. simulans, y examinaremos la concordancia entre el polimorfismo y la divergencia en regiones sinónimas y no sinónimas. Bibliografía Eanes W., M. Kirchner M. and Yoon J. 1993. Evidence for adaptive evolution of the G6pd gene in Drosophila melanogaster and Drosophila simulans lineages. Proc. Natl. Acad. Sci. USA. 90:7475- 7479. Secuencia del gen G6pd (L13900) Mayúscula: exón. Minúscula: intrón. Subrayado: primer codón. ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....| 10 20 30 40 50 60 70 80 gAGATCACACCGCCCTGGATCTCATAATCAAGTCACTCAAGTCGCCTACAATGGTCTGCGAGGGAACCCACTTTGACGGC ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....| 90 100 110 120 130 140 150 160 AAGATTCCGCACACGTTCGTCATCTTTGGGGCGTCGGGCGATCTGGCCAAGAAGAAGATCTACCCCACGCTCTGGTGGCT ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....| 170 180 190 200 210 220 230 240 CTACCGCGATGACCTGCTGCCCAAGCCGACCAAGTTCTGCGGCTATGCCCGTTCCATGCTGACCGTCGATAGCATCAAGG ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....| 250 260 270 280 290 300 310 320 AGCAGTGTCTGCCGTACATGAAGGTgcgttcgggatttggtcataggccatttgcatcgcattaacccaacccattgcca ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....| 330 340 350 360 370 380 390 400 cacaggtCCAGCCGCACGAGCAGAAGAAGTACGAGGAGTTCTGGGCCCTCAATGAGTACGTGTCCGGCAGATATGACGGA ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....| 410 420 430 440 450 460 470 480 CGCACTGGCTTCGAGCTGCTTAACCAGCAGCTGGAGATTATGGAGAACAAGAACAAGGCCAACCGCATCTTCTATCTGGC ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....| 490 500 510 520 530 540 550 560 CCTGCCGCCCAGCGTCTTCGAGGAGGTGACTGTCAACATCAAGCAGATCTGCATGTCGGTCTGgtgagtataagatcaag ....|....|....|....|....|....|....|....|....|....|....|....|....|....|....|....| 570 580 590 600 610 620 630 640 atcaagatccagatgcatttaatttgaaacccgatacttatgtacacctataacccgttcgcttgcagCGGTTGGAACCG ....|....|....| 650 CGTGATTATC..... Sesión 1 A) Obtención de las secuencias del gen G6pd en D. melanogaster Las secuencias del gen G6pd que utilizaremos en esta práctica están disponibles en la base de datos GenBank (http://www.ncbi.nlm.nih.gov) con los números de acceso L13876- L13920. Utilizaremos una muestra de 12 secuencias de D. melanogaster de las 32 disponibles en la base de datos. Crea una archivo (formato texto) especificando los siguientes números de acceso L13889 L13897 L13898 L13899 L13900 L13901 L13904 L13906 L13909 L13912 L13917 L13920 En la pagina web http://www.ncbi.nlm.nih.gov/Entrez/, la opción Batch Entrey permite obtener un conjunto de secuencias a partir de sus números de acceso correspondientes. Utiliza la opción display Fasta para mostrar las secuencias, la opción Display Fasta Text para obtener las secuencias en formato Fasta texto. Copia y pega todas las secuencias en un archivo nuevo (programa word). A partir de estas secuencias crea un archivo (formato texto) y alinea las secuencias con el programa clustalW http://www.ebi.ac.uk/clustalw/ utiliza una salida en formato pir. Con el alineamiento obtenido mediante el clustalW, copia y pega las secuencias en un archivo nuevo, guárdalo en formato texto. Utiliza el programa DnaSP (software instalado) para visualizar el alineamiento. B) Análisis de la variabilidad nucleotídica en D. melanogaster. Observa los datos en Display/ view data, ¿Qué tipos de polimorfismo observas? Utiliza la secuencia del gen G6pd para establecer el marco de lectura correspondiente y asigna la región codificante (Data / Assign coding region) según los siguiente datos: Exon 1: 2- 265 Intron1: 266- 327 Exon 2: 328- 543 Intron 2: 544- 628 Exon 3 : 629-1706. I. Considerando el 1er intron del gen G6pd, y las secuencias de D. melanogaster, 1) ¿Cuantós sitios polimórficos hay? 2) Calcula el polimorfismo nucleotidico ps = sitios segregantes por sitio nucleotídico = = ps/a a = 1 + 1/2 + 1/3 + …1/(n-1). 3) Calcula la diversidad nucleotídica = n 2 ( xi x j ij) ( n 1) i j 4) Repite estos cálculos con el módulo Análisis / DNA polymorphism. ¿Qué diferencia hay entre ambas estimas ( y )? II. Consideramos la región 75-104 del exón 1. 5) ¿Cuántos sitios polimórficos hay? ¿Qué tipo de polimorfismo es? 6) Calcula la diversidad nucleotídica en esta región. 7) Calcula la diversidad nucleotídica sinónima y no sinónima en esta región. Para eso hay que calcular Ns y Na (número de posiciones sinónimas y no sinónimas, respectivamente) Na = N(0) + 2/3 N(2) + 1/3 N(3) Ns = N(4) + 1/3 N(2) + 2/3 N(3) s = n 2 ( xi x j ij) donde ij = S/Ns (S es el número de nucleótidos que ( n 1) i j difieren entre las secuencias i, j) a = n 2 ( xi x j ij) donde ij = S/Na ( n 1) i j GAC GGC AAG ATT CCG CAC ACG TTC GTC ATC 8) Repite estos cálculos con el módulo Análisis / Synonymous and Nonsyn. substitutions Sesión 2 Obtenga las secuencias del gen G6pd en D. simulans siguiendo los pasos efectuados en la sesión 1. Los números de acceso de estas secuencias son: L13876 L13877 L13878 L13879 L13881 L13882 L13883 L13884 L13891 L13892 L13893 L13894 Edita y alinea las secuencias como en la sesión anterior. Crea un archivo con el conjunto de las secuencias alineadas de D. melanogaster y D. simulans. Con el DnaSP, abra este archivo y asigna la región codificante. III. Calcula la diversidad nucleotídica (sinónima y no sinónima) en las distintas regiones (exones y intrones) en D. melanogaster y D. simulans (Análisis / Synonymous and Nonsyn. Substitutions). Para considerar las secuencias de una sola especie, utiliza el módulo Data/ includeexclude sequences. D. melanogaster s a D. simulans s a Exon 1 Exon 2 Exon 3 Total D. melanogaster D. simulans Intron 1 Intron 2 Total Comenta los resultados IV. Representa gráficamente los resultados (Análisis/ DNA polumorphism/ sliding window/ compute) V. Comparación del nivel de polimorfismo intraespecífico con la divergencia interespecífica. 1) Consideremos el primer exon. Clasifica el tipo de polimorfismo observado en las siguientes categorías: polimorfismo sinónimo, polimorfismo no sinónimo, diferencia fijada sinónima y diferencia fijada no sinónima. Sitio 47 D. melanogaster T D. simulans G Tipo Fijado sinónimo 2) Aplique un test de 2 para averiguar si hay diferencias entre los distintos tipos de cambio. 3) Repita los cálculos con todas la secuencia (Análisis/ McDonal and Kreitman test, substitutions in coding regions). 4) Interpreta los resultados obtenidos. VI. ¿Qué crees que pasaría si calculásemos la diversidad nucleotídica en otro gen del cromosoma X? ¿Y en un gen autosómico?