Download Efecto de la eliminación de secuencias intronicas en las topologías
Document related concepts
Transcript
Efecto de la eliminación de secuencias intronicas en las topologías Laura Lucia Estévez Landazábal 2060584 Universidad Industrial de Santander. Escuela de Biología INTRODUCCIÓN Una pregunta fundamental en sistemática molecular concierne a la eficacia de diferentes tipos de secuencias en rescatar clados a diferentes niveles taxonómicos [12]. Un criterio usado para obtención de datos eficientes es usar genes razonablemente conservados [8]. No todas las regiones de un gen cambian a la misma tasa [1], la proporción de sitios de rápida evolución es más grande en intrones que en exones, y las regiones exonicas están caracterizadas por sitios con varias posiciones que no varían. Las categorías de sitios invariantes o sitios que evolucionan rápido son inútiles o problemáticos en la reconstrucción de relaciones filogenéticas [10]. La resolución en estudios filogenéticos empleando datos moleculares de exones ha sido en algunos casos alta [11] y en otros baja[2] [3] [6], mientras que en otros estudios la comparación de resultados de análisis con intrones y exones del mismo gen ha arrojado topologías consistentes [13] El uso de las secuencias intronicas de ADN nuclear para el estudio de las relaciones filogenéticas de organismos cercanamente relacionados ha incrementado, sin embargo, la utilidad de secuencias intronicas a niveles taxonómicos más altos no ha sido firmemente establecida [9]. El objetivo de este trabajo es construir las filogenias derivadas de genes completos y de sus regiones codificantes, para observar los efectos de la utilización de dichos fragmentos en los análisis filogenéticos. MATERIALES Y METODOS Se emplearon las secuencias completas y exonicas de los genes codificantes de proteínas CLTC, CLTCL1, PRKC I y nad1 , los códigos de acceso al GenBank así como los taxa usados fueron tomados de los artículos de Chojnowski et al ,2008 [3]; Dombrovska & Qiu,2004[4]; Conrad et al, 2006[2]. Se realizo un análisis de máxima Likelihood, las secuencias moleculares de los genes completos y de las regiones codificantes fueron alineadas en MUSCLE 3.6 [5], utilizando dichas secuencias se asumió el modelo evolutivo JC69 +Gamma, el cual fue empleado para el procesamiento de los datos moleculares en el sofware PhyML 3.0 [7]. Calculando el soporte bootstraping no paramétrico de mil replicas. RESULTADOS Y DISCUSION Las topologías resultantes del empleo de las secuencias completas (Fig 2) y post-splicing (Fig 1) del gen CLTC no nos muestran las mismas relaciones filogenéticas, mientras que el uso de la secuencia completa agrupa todo el ingroup con un soporte de 1000, a Anser-Aythya en un nodo con soporte de 1000, a Speotyto y a Buteo como hermanos de Arenaria y esos a su vez como grupos hermanos de Anhinga, el empleo de los exones nos anida a Notoprocta (uno de los outgroup) con Speotyto, y reúne a todos los demás en un nodo con un soporte mucho mas bajo que el que reúne a todos los ingroup en un grupo monofiletico cuando se emplea la secuencia completa. En los resultados empleando las secuencias del gen CLTCL1 sin Splicing (Fig. 3), se observa el aumento del soporte tanto del nodo que agrupa a todo el ingroup con respecto al gen post Splicing (Fig. 4). Las relaciones a pesar de estar resueltas no son las mismas empleando el gen completo y los exones, usando el gen completo se puede observar la unión de Anser-Crax con Pandion-Rallus como grupo hermano, mientras que Mesitornis-Ciconia se agrupan aparte. Evento que no se observa con el uso de los exones, donde se ubica a Crax como grupo hermano de un clado con todos los demás terminales del ingroup, y no se detecta la relación de los galliformes con los anseriformes, por lo que se nota que la presencia de las secuencias intronicas tiene inferencia en las relaciones filogeneticas en este caso. Para el tercer set de datos, se encuentra que cuando se usaron los exones del gen PRKC I, uno de los grupos externos (Tamandua) se anidó mostrando relación con el conjunto TrichechusMacroscelides , mientras que los otros cuatro terminales del ingroup se ven relacionados entre ellos; los soportes de los nodos internos son bajos de la misma manera que ocurre con los soportes para la topología resultado del gen completo, pero en dicha topología el soporte del nodo de todo el ingroup es de 1000 (ver Figs. 5 y 6). En cuanto a los resultados del gen nad1 (Figs. 7 y 8) en ambas topologías se presentan las especies usadas como outgroup (pertenecientes a las hepáticas) separadas de los musgos, que aparecen como grupo monofiletico con un soporte de 1000, en la cual las relaciones están resueltas pero de diferente manera cuando se usa la secuencia génica pre-splicing y post-splicing. Las diferencias son que en el resultado del gen pre splicing se agrupa Anodon-Risogoniu con Mnium y el grupo hermano de ellos es Bartramia-Hedwigia, mientras que en el resultado PostSplicing se agrupa Anodon-Risogoniu con Bartramia y su grupo hermano es Mnium-Hedwigia, también se observa el incremento en los soportes de bootstrap para los nodos cuando se emplea el gen completo (pre-splicing), lo que lleva a pensar que en este caso las secuencias intronicas proveen evidencia que hace aumentar el soporte de los nodos. Las comparaciones anteriores entre las diferentes topologías resultantes del uso del gen completo y el uso de las regiones exonicas convergen en algunos aspectos, como por ejemplo que el soporte de los nodos es menor para las topologías que excluyen los intrones, observación que también ha sido hecha en algunas investigaciones en las que los intrones suministran mas sitios informativos que proveen mejor soporte para clados bien aceptados [3]. También se aprecia que las relaciones filogenéticas que se deducen de las topologías obtenidas incluyendo y excluyendo intrones en el mismo gen son diferentes. El uso de los exones en ciertos casos ha dejado ramas recientes sin resolver [11], debido a que se han usado secuencias altamente conservadas que cambian despacio y que no son útiles para resolver ciertas relaciones como por ejemplo las de Neoaves [3] o tortugas[6], en las que los intrones han resuelto politomias. Por lo tanto, los intrones están brindando información filogenética para relacionar diferentes organismos. El poder de los intrones mencionado en algunos artículos [2] [3] [6] para resolver politomias no se logro observar en los resultados aquí presentados, ya que no se presentaron politomias que se resolvieran gracias a la inclusión de las secuencias intronicas. Esto probablemente debido a que las relaciones entre los taxa usados aqui se podían resolver con la información de los exones, sin embargo eso no quiere decir que la información de los intrones sea descartable. BIBLIOGRAFIA [1]Castresana,J. 2000. Selection of Conserved Blocks from Multiple Alignments for Their Use in Phylogenetic Analysis. Molecular Biology and Evolution 17:540-552 [2]Conrad A., Geeta E., Munro M., Montgelard C., Pardini A, & Robinson A. 2006. Indel evolution of mammalian introns and the utility of non-coding nuclear markers in eutherian phylogenetics. Evolutionary Genomics Group, Department of Botany and Zoology. Molecular Phylogenetics and Evolution. Vol. 42, (3) 827-837. [3]Chojnowski, J., Kimball, R., Braun, E. 2008.Introns outperform exons in analyses of basal avian phylogeny using clathrin heavy chain genes. Gene. 410, 89–96. [4]Dombrovska, O., Qiu,Y. 2004.Distribution of introns in the mitochondrial gene nad1 in land plants: phylogenetic and molecular evolutionary implications. Molecular Phylogenetics and Evolution. 32, 246–263. [5]Edgar, Robert.C. 2004. MUSCLE: multiple sequence alignment with high accuracy and high throughput, Nucleic Acids Research 32, 1792-97 [6]Fujita, M., Engstrom,T., Starkey, D., Shaffer, H. 2004. Turtle phylogeny: insights from a novel nuclear intron. Molecular phylogenetics and evolution. 3,1031-1040 [7]Ghindon, S., & Gascuel, O. 2003. A Simple, Fast, and Accurate Algorithm to Estimate Large Phylogenies by Maximum Likelihood. Systematic Biology, 52, 696-704. [8] Li, C., Orti, G., Zhang,G., Lu,G.2007. A practical approach to phylogenomics: the phylogeny of ray-finned fish (Actinopterygii) as a case study. BMC Evolutionary Biology. [9]Matthee,C., Eick,G., Willows-Munro,s., Montgelard,C., Pardini,A.,Robinson,T.2007.Indel evolution of mammalian introns and the utility of non-coding nuclear markers in eutherian phylogenetics . Trends in Genetics. 3, 827-837 [10]Montgelard, C., Forty, E., Arnal, V., Matthee,C .2008. Suprafamilial relationships among Rodentia and the phylogenetic effect of removing fast-evolving nucleotides in mitocondrial, exón and intron fragments.Evolutionary Biology, 8:321 [11]Porter,C., Goodman,M., Stanhope, M. 1996.Evidence on Mammalian Phylogeny from Sequences of Exon 28 of the von Willebrand Factor Gene. Molecular Phylogenetics and Evolution. [12]Springer, M., DeBry, R., Douady, C., Amrine, H., Madsen, O., de Jong, W., Stanhope,M. 2001. Mitochondrial Versus Nuclear Gene Sequences in Deep-Level Mammalian Phylogeny Reconstruction. Molecular Biology and Evolution. 18,132-143 [13]Wang, N., Chen,R. 1999.Comparison between phylogeny of introns and exons in primate. Chinese Science Bulletin ANEXOS Fig 1: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen CLTC PostSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico. Fig 2: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen CLTC PreSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico. Fig 3: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen CLTCL1 PostSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico. Fig 4: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen CLTCL1 PreSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico. Fig 5: Topología consenso resultado del análisis de Máxima Verosimilitud para el PRKC I PostSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico. Fig 6: Topología consenso resultado del análisis de Máxima Verosimilitud para el PRKC I PreSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico. Fig 7: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen nad1 PostSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico. Fig 8: Topología consenso resultado del análisis de Máxima Verosimilitud para el gen nad1 PreSplicing. Los números sobre los nodos equivalen al soporte en Bootstrap no paramétrico.