Download tamaño de los genes
Document related concepts
Transcript
Genes, Alelos y Haplotipos. CA García Sepúlveda MD PhD Laboratorio de Genómica Viral y Humana Facultad de Medicina, Universidad Autónoma de San Luis Potosí 1 Sesiónes #8 y #9 Genes Historia La existencia (pero no el nombre) de los genes fue propuesta por Gregory Mendel (1882-1884). Mendel manejaba conceptos cruciales: segregación independiente de cromosomas, distinción entre rasgos recesivos y dominantes, diferencia entre homocigotos y heterocigotos al igual que la diferencia entre genotipo y fenotipo. Hugo de Vries en 1889 tuvo la decencia poco usual de hoy en día de ceder el crédito a Mendel pero propuso el término “pangen” para describir la unidad mínima de la herencia. William Johannsen abrevió el término a gen dos décadas después. 1920, Thomas Hunt Morgan demostró que los genes residían en los cromosomas (y en sitios específicos dentro de ellos llamados locus). 2 Sesiónes #8 y #9 Genes Historia Morgan y colaboradores mapearon por primera vez los genes de los cromosomas de Drosófila. 1928, Griffith demostró que los genes podían ser transferidos (principio transformante). 1941, George Wells Beadle y Edward Lawrie Tatum demostraron que las mutaciones génicas inducen cambios metabólicos = un gen una enzima. 1944, Oswald Avery, Collin Macleod y Maclyn McCarty mostraron que el DNA es el sustrato físico de la información genética. 1953, Watson y Crick exponen modelo de doble hélice del DNA y como funciona. 3 Sesiónes #8 y #9 Genes Definición de un gen Región física localizable de una secuencia genómica (DNA o RNA) que corresponde a la unidad básica de la herencia, que posee regiones regulatorias, regiones que serán transcritas y otras secuencias funcionales. Gertsein ha expandido definición para incluir a los genes no-codificantes (de proteínas) de RNA: “Un gen es la unión de secuencias genómicas que codifican un conjunto coherente de productos funcionales potencialmente empalmados”. 4 Sesiónes #8 y #9 Genes Cis- y TransGen = Cistrón = Grupo de complementación Cis Una región de DNA posee efectos cis- cuando afecta el funcionamiento (expresión, replicación, etc) de secuencias físicamente contiguas a ella (sinténicas) sin necesidad de una proteína (o RNA) intermediario...p. ej.: sitio de origen de replicación o los promotores de transcripción. Opuesto funcional a efecto trans 5 Sesiónes #8 y #9 Genes Cis- y TransTrans Una secuencia con efectos trans- corresponde simplemente a un gen que codifica para una proteína (o RNA) que ejerce un efecto sobre otra secuencia de DNA o RNA que no se encuentran físicamente contiguas a través de un intermediario (proteina o RNA). 6 Sesiónes #8 y #9 Genes Genes eucariotas Consisten en una secuencia de DNA que contiene un promotor encargado de regular la actividad (expresión) del gen, al igual que una secuencia que codifica para un producto determinado (proteína o RNA). Cuando el gen es activado, la región codificante es transcrita para producir una copia de RNA que en algunos casos posee actividad per se y en otros es posteriormente traducida hacia una proteína 7 Sesiónes #8 y #9 Genes Productos génicos En la mayoría de los casos el RNA transcrito constituye un producto intermediario en el proceso de manufactura de proteínas, pero en algunos casos el RNA mismo posee actividad funcional (rRNA o miRNA). Los rRNA de ribozimas poseen actividad catalítica mientras que los miRNA poseen actividad reguladora. A estos genes se les denomina genes de RNA o DNA no-codificante (por carecer de sustrato protéico). 8 Sesiónes #8 y #9 Genes miRNA Los miRNA corresponden a moléculas pequeñas de ssRNA de entre 20 y 30 bp que participan en la regulación de la expresión génica. Codificados por genes de RNA (o DNA no codificante) pero no traducidos a proteínas. Pasan directamente de transcritos primarios (pri-miRNA) a formar estructuras secundarias complejas (pre-miRNA) que son modificadas para formar miRNA maduro involucrado en interacciones con el mRNA de un gen específico (codificante de proteína) para regular su expresión (de manera pos-transcripcional). Las moléculas de miRNA maduras son parcialmente complementarias a uno más mRNA, por lo que al unírseles inhiben su traducción hacia proteínas Primeramente descritos en 1993 por Lee y cols, y como siempre el término se introdujo más tarde (2001). 9 Sesiónes #8 y #9 Genes RNA como repositorio de información génica Recordemos que los genes también pueden ser escritos en RNA, acercamiento de muchos virus Dichos patógenos requieren del secuestro de maquinaria celular para poder funcionar y de una enzima responsable de retrotranscribir el RNA al DNA empleado por dicha maquinaria celular (Transcriptasa Inversa). 10 Sesiónes #8 y #9 Genes Regiones reguladoras Todos los genes poseen regiones reguladoras además de las regiones codificantes para productos génicos. Una de estas regiones reguladoras son los promotores, los cuales sirven para promover la unión de la maquinaria transcripcional implicada en la expresión del producto génico. Los promotores poseen secuencias consenso relativamente conservadas, algunas de estas secuencias muestran una gran afinidad por la maquinaria transcripcional (promotores fuertes) y otros no (promotores débiles). La afinidad por la maquinaria transcripcional determina el número de interacciones que se dan entre estos dos componentes y por ende el número de veces que un gen es transcrito. 11 Sesiónes #8 y #9 Genes Regiones reguladoras Los potenciadores o “enhancers” constituyen otro tipo de región reguladora aunque no tan común como los promotores. Estos elementos reguladores promueven la unión de otros complejos proteicos involucrados en la facilitación de la transcripción por lo que pueden compensar en cierto grado la pobre actividad de un promotor débil. La mayor parte de las regiones reguladoras se encuentran “up-stream” al codón de iniciación (ATG) y en el extremo 5' del gen. Si bien se ha logrado caracterizar muy bien los promotores procariotas, con los eucariotas ha sido difícil dada su complejidad. 12 Sesiónes #8 y #9 Genes Regiones reguladoras La gran mayoría de los genes procariotas se encuentran organizados en operones o grupos de genes cuyos productos poseen funciones relacionadas y por ende, que son transcritos de manera conjunta como una unidad. En contraste, los eucariotas poseen genes que son transcritos de manera independiente pero posee una naturaleza interrumpida (con exones e intrones a diferencia de los procariotas monoexónicos). Así pues, los genes procariotas son policistrónicos pero monoexónicos, mientras que los eucariotas son monocistrónicos pero poliexónicos. 13 Sesiónes #8 y #9 Genes Genes y genomas Al complemento total de genes de un organismo se le llama genoma. Los genes se localizan en regiones bien definidas de DNA llamados locus (plural loci). El tamaño del genoma generalmente es menor para los procariotas en comparación a los eucariotas, tanto en número de bp como de genes. No obstante, esta relación se rompe al contemplar únicamente a los organismo eucariotas, en estos no existe una proporción directa entre complejidad genómica y complejidad del organismo. Uno de los genomas más grandes descubierto a la fecha pertenece a una Amoeba (Amoeba dubia) con >670 mil millones de bases (ca 200 x mayor a Hosa). 14 Sesiónes #8 y #9 Genes Genes y genomas Hosa Patr Papa Popy Gogo Homo sapiens Pan troglodytes Pan paniscus Pongo pygmaeus Gorilla gorilla Mundo Civilizado Norte de México Japón EEUUAA 15 Sesiónes #8 y #9 Genes Genes y genomas Recordemos que el helecho lingular de Adder tenía el mayor número de cromosomas no genes. Originalmente se pensaba que Hosa poseía alrededor de 100,000 genes, después del primer borrador del HGP el número se redujo a ca 30,000, actualmente se ha reducido incluso más a una cifra cercana a los 22,000 (20,488 según el último conteo de Science). Ch21 La densidad génica de un genoma se puede usar para describir la complejidad genómica (usualmente en genes por Mbp), obviamente los procariotas poseen mayor densidad que los eucariotas, con pocas excepciones. Ch6 La densidad génica del genoma humano oscila alrededor de 12 y 15 genes por Mbp (excepto la región del MHC que posee una densidad de alrededor de 45 por Mbp). 16 Sesiónes #8 y #9 Genes Nomenclatura Human Genome Organization (HUGO) Gene Nomenclature Comittee (HGNC) para cada gen conocido en forma de un nombre génico aprobado y un símbolo (nombre abreviado). Todos los nombres y símbolos aprobados disponibles para consulta en la base de datos presente en su sitio web. Facilita intercambio de ideas entre investigadores y unanimidad consensual de términos empleados. Facilita la compilación de bases de datos electrónicas a partir de publicaciones. www.genenames.org Trabajando con la filosofía de que cada nombre y símbolo debe indicar función o rol biológico...en vez de Cluster Designation (CD) 158E usar KIR3DL1. 17 Sesiónes #8 y #9 Genes Nomenclatura 18 Sesiónes #8 y #9 Genes Dogma Central de la BioMol Propuesto inicialmente por Francis Crick en 1958 y replanteado en 1970. Como en el dogma de fe, corresponde a un conjunto de normas o creencias indispensables para comprender el concepto de flujo de la información genética a través de biopolímeros y en organismos vivos (de acuerdo a nuestros conocimientos actuales)... 3x3 Propone 3 clases de biopolímeros: DNA, RNA y polipéptidos. Propone 3 modalidades de transferencia de información entre estos biopolímeros: modalidad general, especial y modalidad desconocida. Cada modalidad posee 3 direcciones de transferencia 19 Sesiónes #8 y #9 Genes Dogma Central de la BioMol Las tres direcciones generales son: de DNA a DNA (Replicación). de DNA a RNA (Transcripción). de RNA a AA (Traducción). * Ocurren de manera normal en la mayoría de las células. Las tres direcciones especiales son: de RNA a RNA (Replicación de RNA). de RNA a DNA (Retro-transcripción). de DNA a AA (Solo in vitro). *Ocurren de manera extraordinaria, pero ocurren. Las tres direcciones desconocidas son: de AA a DNA (Evolución inteligente). de AA a RNA (Otra forma de evolución inteligente). de AA a AA (controversia de priones). * Actualmente se piensa que no ocurren nunca. 20 Sesiónes #8 y #9 Genes Polimorfismo genético La genética Mendeliana clásica solamente distinguía dos tipos de genes: el Wild-type (normalmente circulante) y el Mutante (el menos común, inicialmente el que producida una enfermedad o cambio fenotípico). Hoy en día sabemos que algunos genes poseen diferentes variantes que pueden o no producir cambios fenotípicos o enfermedad por ello en realidad no son mutantes = alelos. En algunas instancias no es correcto emplear el término “wild-type” (HLA). Polimorfismo genético = hace referencia a la existencia de múltiples alelos para un gen (o locus). Una mutación se considera polimórfismo cuando se le encuentra en más de 1% de la población. ¿Por qué más del 1%? Por que el drift-genético que gobierna la evolución da lugar a alelos nuevos todo el tiempo, no todos ellos son importantes por que no todos se estabilizan su existencia en una población (fijación poblacional). 21 Sesiónes #8 y #9 Genes Polimorfismo genético Por otro lado, en aquellos sistemas en que sí existe un alelo wild-type, un escrutinio más detallado (secuencia nt podría revelar que incluso el WT es en sí polimórfico). Los polimorfismos llegan a modificar sitios de restricción, hecho que se explota para la producción de Mapas de Polimorfismos de Longitud de Fragmentos de Restricción (RFLP). Normalmente la digestión por una enzima produce patrones de migración electroforética específicos que dependen de la existencia de secuencias específicas para cada enzima (sitios de restricción). Algunos polimorfismos (mutaciones) modifican estos sitios de restricción y el patrón electroforético generado. Originalmente esto se aprovechaba para pruebas de paternidad y autentificación de identidad (por que hemos acumulado distintos tipos de mutaciones que nos hacen individuos diferentes). 22 Sesiónes #8 y #9 Genes Polimorfismo genético La segregación de patrones de RFLP puede ser observada al comparar a distintos miembros biológicamente emparentados. El RFLP puede ser empleado como marcador genético en vez de evaluar cambios fenotípicos de un organismo. Debido a que el DNA se recombina y hereda en forma de grandes fragmentos, es muy posible que el sitio de restricción ni siquiera se encuentre en el gen afectado (en el caso de una patología). Es decir, basta con que el sitio de restricción se encuentre en el fragmento (Mbp) que es heredado como “cassette” durante la recombinación para que éste sea vinculado a un rasgo fenotípico. 23 Sesiónes #8 y #9 Genes Polimorfismo genético Así pues, el RFLP de una persona normal (wild-type) pudiera diferir del de una persona enferma = un marcador genético para dicha patología. Este es el principio general detrás de los estudios de epidemiologia molecular. En perspectiva: el genoma humano posee >5,000 marcadores identificados (al 2004), los cuales se encuentran separados por una distancia de entre 1 y 2 Mbp. 24 Sesiónes #8 y #9 Genes Complejo Mayor de Histocompatibilidad (MHC) El Complejo Mayor de Histocompatibilidad (MHC) constituye el sistema genético más polimórfico de los animales. Fue la primer región en ser estudiada exhaustivamente y la primera en ser secuenciada por el HGP. El MHC constituye una región genómica grande (3.6 Mbp) presente en la mayoría de los vertebrados. Constituye la región más genéticamente-densa del genoma de los mamíferos (> 150 genes). Densidad promedio de eucariotas es de 14 genes por Mbp, densidad de MHC = ca 42 genes/Mbp. Contiene a genes involucrados en la respuesta inmune innata y adaptativa, con funciones inmunes, reproductivas e inflamatorias. 25 Sesiónes #8 y #9 Genes Complejo Mayor de Histocompatibilidad (MHC) Las proteínas de HLA codificadas por MHC presentan péptidos a células responsables de la vigilancia inmune. El MHC se divide en tres regiones funcionalmente distintas: MHC clase I, MHC clase III y MHC clase II Sistema genético Polimórfico (muchos alelos), Complejo (muchos genes) y Codominante (todos los genes expresados). Y el número sigue creciendo... 26 Sesiónes #8 y #9 Genes Complejo Mayor de Histocompatibilidad (MHC) MHC clase I Codificante para proteínas de HLA con mismo nombre (Clase I) involucradas en la presentación de péptidos endógenos (incluyendo a patógenos intracelulares) a células inmunes. HLA-A, HLA-B y HLA-C MHC clase II Codificante para proteínas de HLA de Clase II involucradas en la presentación de antígenos exogenos a células inmunes e involucradas en la selección de pareja sexual entre mamíferos (incluyendo a nosotros). HLA-DP, HLA-DQ y HLA-DR. MHC clase III Codificante para proteínas un poco más primitivas del sistema inmune, incluyendo a aquellas pertenecientes al complemento y algunas citocinas. 27 Sesiónes #8 y #9 Genes Region KIR del LRC (19q13.4) Región KIR constituye la segunda región más polimórfica de genes inmunes. Codificante para Receptores Inmunoglobulina-símiles de Células Asesinas Naturales (KIR). 28 Sesiónes #8 y #9 Genes Region KIR del LRC (19q13.4) Los 17 genes KIR se encuentran codificados en una región de 150 kb del Complejo de Receptores Leucocitario (LRC) en el cromosoma 19 (19q13.4). El LRC posee un tamaño de 1 Mb abarcando casi la mitad del cromosoma 19. Los genes KIR se encuentran organizados dentro de la región KIR y dentro del LRC en haplotipos. Genes siempre presentes (constitutivos) Genes para KIR inhibitorios Genes para KIR activadores Pesudogenes (no expresados) 29 Sesiónes #8 y #9 Genes Region KIR del LRC (19q13.4) Los genes KIR son polimórficos... 30 Sesiónes #8 y #9 Genes Region KIR del LRC (19q13.4) Los genes KIR se encuentran organizados en haplotipos..lo que significa que distintos individuos poseen diferentes números y tipos de genes. 31 Sesiónes #8 y #9 Genes Region KIR del LRC (19q13.4) En resumen, la región KIR ilustra algunos aspectos de diversidad genética. 1.- Poligénica (17 genes: 12 genes verdaderos, 2 pseudogenes, uno de baja expresión y dos homólogos). 2.- Polimórfica (existen 233 alelos de estos genes). 3.- Poli-haplotípica (existen diferentes arreglos de genes en cada cromosoma). Los 17 genes han evolucionado gracias a la recombinación exhaustiva entre ellos lo que ha dado lugar al intercambio de cassettes pequeños (exónicos) de secuencias...evidencia de evolución divergente. 32 Sesiónes #8 y #9 Genes Prioridades de diseño Dos prioridades diferentes distinguen a las formas y hábitos de procariotas y eucariotas. Filosofía procariota es minimalista, solamente poseen lo indispensable para propagar los genes de individuos aislados (selección del más apto). Filosofía eucariota es redundante, poseen mecanismos complejos, funcionalmente empalmados y ciertos lujos que les permiten no solo asegurar el bien del organismo aislado sino también de poblaciones enteras (evolución cooperativa). Los procariotas por ende están diseñados para hacer caber cuanta maquinaria, información y cualidades puedan hacer caber en un espacio pequeño. Los eucariotas en general están diseñados para adoptar innovaciones biológicas que los hagan sobrevivir con mayor éxito. 33 Sesiónes #8 y #9 Genes Naturaleza interrumpida de genes eucariotas Al principio se pensaba que los eucariotas tendrían organizaciones génicas similares a las de los procariotas en donde un gen es colinear y directamente proporcional al tamaño de su proteína codificada. La secuencia génica del DNA = a la secuencia del transcrito de RNA = secuencia de aa. Los genes eucariotas (superiores) difieren de los procariotas en que poseen una naturaleza interrumpida. La secuencia de DNA poseía fragmentos que no estaban presentes en el RNA maduro ni en los aminoácidos. Secuencia de DNA = secuencia de transcrito primario = secuencia de RNA maduro más intrones = aminoácidos. Las levaduras suelen poseer genes continuos sin interrupciones. Los genes de los eucariotas superiores poseen dos tipos de secuencias génicas intrones y exones. 34 Sesiónes #8 y #9 Genes Naturaleza interrumpida de genes eucariotas Los exones corresponden a las secuencias de DNA que son exportadas del núcleo en forma de RNA para ser traducidas en proteínas Los intrones corresponden a las secuencias de DNA que forman parte del transcrito de RNA primario pero que se quedan “dentro” del núcleo sin formar parte del mRNA maduro, sin codificar para proteínas y por ende no son blancos evolutivos. Debido a que los intrones no codifican para proteínas, pueden acumular mutaciones sin impacto sobre las regiones colindantes codificantes sin problema (a menos de que dichas mutaciones caigan en la frontera exónica en cuyo caso pudieran afectar el splicing, ver más abajo). 35 Sesiónes #8 y #9 Genes Naturaleza interrumpida de genes eucariotas Los genes interrumpidos son objeto de un proceso no observado en procariotas, el splicing nuclear mediante el cual los intrones son identificados y retirados del transcrito de RNA primario (pre-mRNA) para formar un mRNA maduro (mRNA propiamente). 36 Sesiónes #8 y #9 Genes Naturaleza interrumpida de genes eucariotas Por ahora consideraremos que tras el splicing nuclear, el orden de los exones es SIEMPRE el mismo que en la secuencia de DNA original. En realidad los exones nunca se separan unos de otro, el splicing nuclear ocurre como una reacción intramolecular en la cual los dos extremos de un intrón se unen formando un “loop o asa intrónica” que ulteriormente es liberada tras su escisión Esto evita que se formen recombinantes postranscripcionales en los cuales los exones son intercambiados con otros transcritos primarios. 37 Sesiónes #8 y #9 Genes Intrones y teoría de la información Teoría controversial pero lógica...Si quisiéramos diseñar una sonda espacial para mostrar información sobre nosotros a una civilización extraterrestre haría falta contemplar: Problemas: Largo viaje: varios años luz transcurrirían hasta que llegara a un sistema estelar cercano. Estaría expuesta al daño: micrometeoritos, radiación, degeneración de materiales, cambios térmicos, etc. Soluciones: Imprimirla en un material resistente que no permitiera ningún tipo de modificación (inexistente). Agregar maquinas que se encargaran de reparar los fragmentos dañados. Enviar todo en duplicado. Dispersar la información para disminuir la posibilidad de daño a partes cruciales. 38 Sesiónes #8 y #9 Genes Intrones y teoría de la información En todo caso, “agregar más papas al picadillo” implica un gasto que los procariotas no se pueden dar dadas sus limitaciones y filosofía minimalista, en cambio los eucariotas somos buenos para innovar. Qué tipo de documento ha aguantado mejor el paso del tiempo: la biblia de Guttenberg escrita en papel aprovechando el espacio al máximo (procariota) o los glifos gruesos, toscos, dispersos en la piedra de edificios Maya(eucariota)...ahora solo hay que aprender a leer los glifos. 39 Sesiónes #8 y #9 Genes Intrones y teoría de la información En todo caso, “agregar más papas al picadillo” implica un gasto que los procariotas no se pueden dar dadas sus limitaciones y filosofía minimalista, en cambio los eucariotas somos buenos para innovar. Qué tipo de documento ha aguantado mejor el paso del tiempo: la biblia de Guttenberg escrita en papel aprovechando el espacio al máximo (procariota) o los glifos gruesos, toscos, dispersos en la piedra de edificios Maya(eucariota)...ahora solo hay que aprender a leer los glifos. Genoma codificado de manera continua Genoma codificado de manera discontinua 40 Sesiónes #8 y #9 Genes Conservación de organización génica Por norma general, los exones son pequeños (entre 50 y 300 bp) en comparación a los intrones (1000 bp o mas). El número y tamaño de los intrones presentes en genes varía enormemente de especie a especie pero la organización génica suele mantenerse relativamente conservada. 41 Sesiónes #8 y #9 Genes Conservación de organización génica Usualmente, los intrones poseen codones de terminación en los tres marcos de lectura disponibles Un marco de lectura corresponde al tipo de agrupamiento en tripletes que es usado para traducir la secuencia de RNA a aminoácidos. Debido a que el código genético se lee en forma de tripletes, existen tres marcos de lectura distintos para toda secuencia de DNA...esto se abordará con mayor detalle más adelante. 42 Sesiónes #8 y #9 Genes Conservación de exones Un ejemplo clásico corresponde al gen de la Dihidrofolato Reductasa (DHFR) de varios mamíferos. En la gran mayoría de los mamíferos, el gen posee 6 exones correspondientes a los 2 kb de mRNA. Los genes individuales (incluyendo intrones) varían mucho entre estas especies (desde 25 a 31 kbp). Es decir, la porción codificante permanece relativamente igual mientras que el tamaño de los intrones varía. Esto es un reflejo de la evolución, los genes filogenéticamente emparentados tienden a poseer organizaciones similares: tamaños y posiciones de intrones y exones similares. 43 Sesiónes #8 y #9 Genes Conservación de exones Los genes emparentados muestran mayor similaridad en la secuencia de sus exones que en la secuencia de sus intrones. Recordemos que los intrones pueden acumular mutaciones sin impacto sobre función proteica por ende sin selección natural. Adelantándonos un poco, la evolución de nuevas proteínas (resultado de la tendencia eucariota por innovar) depende de eventos de recombinación, mutaciones y translocaciones. Estos eventos llevan al intercambio de secuencias funcionales específicas que hayan demostrado ser útiles para determinada cosa (exones). El intercambio y re-ordenamiento de exones (exon shuffling) se hace evidente en poblaciones a diferencia de los rearreglos génicos que se dan a nivel de individuos. De este modo, proteínas con funciones diferentes pueden compartir uno o dos exones (similares en tamaño y secuencia). 44 Sesiónes #8 y #9 Genes Conservación de exones El grado de homología de secuencias exónicas (de cualquier secuencia de hecho) puede ser graficado en plots de puntos. Aquellos sitios (codones, bases, grupos de 10 bases, etc) conservados entre dos secuencias se muestran con puntos mientras que los sitios donde haya una diferencia es marcado con otro carácter El ploteo de la comparación de dos secuencias idénticas da lugar a una línea diagonal de puntos que muestra la similaridad de secuencia. 45 Sesiónes #8 y #9 Genes Conservación de exones Este tipo de gráficas permite resaltar fácilmente las homologías que existen entre secuencias o sus diferencias, también resaltan indels como corrimientos verticales u horizontales de la diagonal. Si comparásemos dos secuencias de DNA semejantes veríamos que los exones se encontrarían conservados (la diagonal correría limpiamente por estas áreas) mientras que la diagonal se perdería en las regiones que difieren más (intrones y regiones UTR). En el caso de la imagen se puede observar que la secuencia de Betaglobina mayor posee una inserción a la mitad del intrón 3 que desplaza la diagonal hacia la derecha. 46 HLA-I 47 Sesiónes #8 y #9 Genes Tamaños de exones Conforme subimos en el árbol de la vida, los genomas tienden a incrementar su tamaño, en gran parte gracias al tamaño de los intrones. El tamaño del genoma es proporcional a la complejidad del organismo hablando de los eucariotas más primitivos. Esta correlación entre tamaño de genoma y complejidad del organismo se rompe a partir de los moluscos e insectos. En los eucariotas superiores no hay una correlación entre tamaño del genoma y complejidad del organismo. El tamaño de los genes por norma general SI guarda cierta proporción con la complejidad de eucariotas superiores (a partir de los insectos). 48 Sesiónes #8 y #9 Genes Tamaños de exones La mayor parte de los intrones de los vertebrados < 2 kb, pero cerca de un 10% de los intrones miden > 10 kbp y hasta 60 kbps. El tamaño de los exones suele ser relativamente constante. En hongos la mayor parte de los exones miden < 150 bp (codifican proteínas de ± 40 aminoácidos), pero un porcentaje importante de sus genes son monoexónicos. En los vertebrados, la mayor parte de los exones son entre 150 y 300 bp (codificando para proteínas entre 50 y 100 aa). Existe mayor diversidad en cuanto al número de exones que poseen los genes. 49 Sesiónes #8 y #9 Genes Número de exones Evolución de eucariotas superiores ha dependido en parte de la expansión genómica. Expansión genómica se vale de recombinación y exon shuffling. Cabe esperar que cuanto más complejo (filogenéticamente hablando: nuevo) sea un organismo, mayor variedad en tipo y número de exones debe tener. Esto se ve reflejado en el número de exones que forman parte de sus genes. 50 Sesiónes #8 y #9 Genes Número de exones Las levaduras poseen un número importante de genes monoexónicos (ca 95%), esta proporción es menor en los insectos (ca 20%) y mucho menor en los mamíferos ( ca 5%). Mientras que la mayor parte de las levaduras poseen genes de entre 2 y 5 exones, los insectos muestran mayor número de exones por gen (desde solo 2 hasta de 30 exones). Entre nosotros los mamíferos, la diversidad es mucho superior: Desde solo 2 por gen hasta 60. Lo más común entre nosotros son los genes de 5 y 9 exones. 51 Sesiónes #8 y #9 Genes Un gen Una proteina La mayor parte de los genes consisten en secuencias de DNA completamente dedicadas a la codificación de una sola proteína Una misma secuencia de DNA puede contener más de un gen y un gen puede codificar para más de una proteína Mecanismos: Genes empalmados Marcos de lectura alternativos Splicing alternativo 52 Sesiónes #8 y #9 Genes Genes empalmados Dos variedades de empalmamiento (en marco y en marco alternativo). En los genomas celulares (pro y eucariotas), las secuencias de DNA generalmente solo se leen en un solo marco de lectura Situación en la que un gen forma parte de otro gen. Usualmente genes que poseen dos codones de iniciación diferentes y un solo codón de terminación. Debido a que ambos codones de iniciación se encuentran en el mismo marco de lectura, la proteína corta es idéntica en secuencia de aminoácidos al producto más largo. 53 Sesiónes #8 y #9 Genes Genes empalmados Algunos genomas virales y mitocondriales hacen uso (dada la carencia de espacio) de otros marcos de lectura para codificar a más proteínas Secuencia: ATGCATGCATGCATGCATGCATGCATC Marcos de lectura posibles (recordando que se leen en tripletes). Marco #1 ATG CAT GCA TGC ATG CAT GCA TGC ATC Marco #2 A TGC ATG CAT GCA TGC ATG CAT GCA TC Marco # 3 AT GCA TGC ATG CAT GCA TGC ATG CAT C Marco #4 = Marco #1 menos M inicial. Proteína Marco #1= Proteína Marco #2= Proteína Marco #3= Proteína Marco #4= Met-His-Ala-Cys-Met-His-Ala-Cys-Ile Cys-Met-His-Ala-Cys-Met-His-Ala Ala-Cys-Met-His-Ala-Cys-Met-His His-Ala-Cys-Met-His-Ala-Cys-Ile 54 Sesiónes #8 y #9 Genes Genes empalmados El empalme generalmente es pequeño. 55 Sesiónes #8 y #9 Genes Splicing alternativo Para algunos genes se generan patrones de diversidad proteica alternativos gracias a las modificaciones pos-transcripcionales que sufre el transcrito primario de RNA. Depende de arreglos alternativos de los exones codificados por el mismo gen. El orden siempre es idéntico a aquel estipulado por DNA genómico. No confundir con recombinación por elección de copia...saltos de RNA pol. El contenido de exones puede ser mutuamente excluyente de tal forma que nunca sean unidos dos exones en el mismo mRNA. Depende de maquinaria espliceosomal. 56 Sesiónes #8 y #9 Genes Splicing alternativo Ejemplo clásico de la Troponina T murina. Contiene 5 exones diferentes pero únicamente cuatro llegan a formar el mRNA, el quinto usualmente es eliminado por maquinaria espliceosomal. De los 5 exones, dos exones son los mutuamente excluyentes, los otros tres SIEMPRE estarán presentes en el mRNA. Esto da lugar a dos proteínas con características diferentes (la -Troponina y -Troponina). 57 Sesiónes #8 y #9 Genes Función de los intrones Originalmente se pensaba que representaban fragmentos de secuencia de DNA cuya expresión había dejado de ser útil para la proteína a la cual ayudaban a codificar: hipótesis de “secuencia vieja”. Posteriormente se pensó que los intrones correspondían a “DNA basura” o “DNA espaciador”. Hoy en día sabemos que algunos intrones poseen funciones regulatorias, espliceosomales e incluso auto-catalíticas. Los intrones no son muy bien comprendidos pero sabemos un poco más sobre su participación en el splicing nuclear que de cualquier otra función (contienen secuencias que son reconocidas por maquinaria espliceosomal). Fueron descubiertos y llamados “secuencias de intervalo” por Phillip Allen Sharp y Richard J. Roberts (Nobel de Fisiología y Medicina del 1993). En 1978, Walter Gilbert propuso cambiar el nombre a intrones para acomodarse a la nomenclatura de biomol de entonces (cistrón, replicón, operón)...proponiendo además el de exón para las secuencias que serían expresadas. 58 Sesiónes #8 y #9 Genes Clasificación de los intrones Actualmente se conocen cuatro clases de intrones: Nucleares – Muy comunes, también llamados espliceosomales requieren de la intervencion del espliceosoma o de snRNA’s para ser retirados del precursor-mRNA (los pre-mRNA forman la mayor parte de la masa del hnRNA) Grupo I Grupo II Autocatalíticos, se escinden del pre-mRNA sin intervencion del espliceosoma. Son ribozimas y un tipo poco frecuente de intrones. Grupo III – Parecidos a los del grupo II por compartir estructura secundaria conservada. 59 Sesiónes #8 y #9 Genes Clasificación de los intrones Actualmente se conocen cuatro clases de intrones: Nucleares – Muy comunes, también llamados espliceosomales requieren de la intervencion del espliceosoma o de snRNA’s para ser retirados del precursor-mRNA (los pre-mRNA forman la mayor parte de la masa del hnRNA) Grupo I Grupo II Autocatalíticos, se escinden del pre-mRNA sin intervencion del espliceosoma. Son ribozimas y un tipo poco frecuente de intrones. Grupo III – Parecidos a los del grupo II por compartir estructura secundaria conservada. Los del grupo I difieren de los del grupo II y III en que requieren (los del grupo I) de un nucleósido de guanina libre para lograr su escisión. 60 Sesiónes #8 y #9 Genes Clasificación de los intrones Actualmente se conocen cuatro clases de intrones: Nucleares – Muy comunes, también llamados espliceosomales requieren de la intervencion del espliceosoma o de snRNA’s para ser retirados del precursor-mRNA (los pre-mRNA forman la mayor parte de la masa del hnRNA) Grupo I Grupo II Autocatalíticos, se escinden del pre-mRNA sin intervencion del espliceosoma. Son ribozimas y un tipo poco frecuente de intrones. Grupo III – Parecidos a los del grupo II por compartir estructura secundaria conservada. Los del grupo II y III generan circulo de escisión al ser removidos. 61 Sesiónes #8 y #9 Genes Espliceosoma Complejo de proteinas y RNAs catalíticos encargados de remover los intrones del pre-mRNA a través de una proceso llamado splicing y de unir los extremos exónicos liberados. Compuesto por cinco “snRNPs” Small nuclear RNA proteins (U1, U2, U4, U5 y U6) “snurps” Componente de RNA rico en uridina (nucleósido de uracilo). Espliceosoma se arma “de novo” en cada hnRNA que surge como transcrito primario. Circulo de escisión propio de los intrones de grupo II y III. 62 Sesiónes #8 y #9 Genes Espliceosoma e Intrones Nucleares Casi todos comienzan con GU y terminan en AG (regla GU-AG) lo que permite identificar de manera presuntiva las fronteras exón/intrónicas. Espliceosoma requiere de la existencia de secuencias conservadas presentes en todo hnRNA de para su función: - Sitio consenso 5´. - Sequencia de ramificación. - Tracto polipirimidina. - Sitio consenso 3´. ¿Donde se lleva a cabo el splicing DNA/RNA? 63 Sesiónes #8 y #9 Genes Clasificación de los intrones Los del grupo I se caracterizan por requerir de nucleósidos de guanina libres para ser escindidos y poseen una estructura secundaria diferente a la de los grupos II y III. Los intrones del grupo I se pueden encontrar en bacterias y protozoos. 64 Sesiónes #8 y #9 Genes Clasificación de los intrones Los de los grupos II y III poseen homología estructural y funcional por lo cual ocasionalmente se les clasifica conjuntamente como de Grupo II (poseen una estructura secundaria semejante). Los del grupo II (o II y III) se encuentran filogenéticamente emparentados al espliceosoma. De hecho se piensa que son el ancestro del espliceosoma. 65 Sesiónes #8 y #9 Genes Origen de los intrones Como ya se dijo, los procariotas tienen genes mono-exónicos continuos mientras que los eucariotas suelen tener genes poliexónicos interrumpidos. Si bien tenemos una buena idea acerca de como y de donde surgieron los intrones de grupos I, II y III (precursores del espliceosoma), el origen de los intrones nucleares es más controversial. Existen dos teorías que explican su origen filogénetico, la de intrones-tempranos y la de intrones-tardíos. 66 Sesiónes #8 y #9 Genes Intrones tempranos En tiempos ancestrales los genomas primordiales (progenotes=ancestro primordial de procariotas y eucariotas) contenian intrones que fueron eliminados poco a poco por los procariotas hasta desaparecer por completo de dicha rama del árbol de la vida. Propuesta por Walter-Gilbert sugiriendo que procariotas los fueron eliminando en su esfuerzo minimalista por optimizar recursos y acelerar crecimiento. Lado bonito: la presencia de intrones tempranos hubiese permitido evolucionar rasgos (proteínas) altamente especializadas ya que los exones se podrían intercambiar relativamente fácil y re-barajar para formar proteínas innovadoras 67 Sesiónes #8 y #9 Genes Intrones tempranos Actualmente solo los eucariotas poseen intrones nucleares, un reflejo de la filosofía adaptativa de sus genomas (expansibles). Lado feo: Difícil explicar el éxito para eliminar toda evidencia de intrones entre los procariotas. Quizás el mejor ejemplar residual de este eslabón perdido sean las mitocondrias y cloroplastos, los cuales poseen muchas semejanzas con los procariotas sin embargo poseen intrones nucleares en sus genomas. ¿Pudieron estos endosimibiontes haber infectado a células eucariotas antes de que los procariotas comenzaran a deshacerse de sus intrones? 68 Sesiónes #8 y #9 Genes Intrones tardíos En tiempo ancestrales los progenotes contenian solo exones, y fueron incorporando intrones después de la especiación procariota/eucariota. Teoría no explica de manera tan sensual el proceso evolutivo pero se ajusta mejor que la otra al panorama actual (intrones nucleares solamente presentes en eucariotas). Propone que los intrones surgieron de transposones o elementos transferibles que infectaron a células eucariotas aprovechando el boom de la creación de esta nueva rama del árbol de la vida. 69