Download 13 PBM (27-04-2011) control de la expresión génica,1
Document related concepts
Transcript
CONTROL DE LA EXPRESIÓN GÉNICA 1 Para empezar se hablará de cómo ha ido evolucionando el control de la expresión génica a lo largo del tiempo desde los procariotas hasta llegar a las eucariotas y las células humanas. También veremos los niveles de control, que evidentemente el más importante es la transcripción. El control de la expresión génica implica que un gen se exprese, que es lo mismo que decir que aparezca una proteína y esa proteína tenga una función, por tanto eso implica desde la transcripción desde el ARNm hasta que se traduce en una proteína funcional y activa. Todos esos pasos son pasos de control posibles de la expresión génica. En los procariotas ya vimos que en un mismo compartimento ocurrían los tres procesos, es decir, la replicación, la transcripción, y la traducción. La transcripción y la traducción iban seguidas y no era necesario que hubiera concluido la transcripción para que el mensajero sintetizado fuera traducido por la maquinaria ribosomal de los procatiotas. También vimos que con el operón triptófano en la traducción y como ejemplos de operones de aa. En los eucariotas la replicación ocurre en el núcleo y la transcripción y el procesamiento también y una vez que el ARNm está maduro sale al citoplasma y allí es traducido en una proteína. Esta proteína puede sufrir cambios, puede plegarse y sufrir modificaciones postraduccionales y finalmente tener funcionalidad y situarse en el lugar adecuado. - Aquí podemos ver lo que ha ido cambiando el genoma a lo largo de la evolución: El genoma más pequeño es el mycoplasma que es una bacteria que no llega al millón de pares de nucleótidos mientras que el más grande es el de la planta del lilio que tiene un genoma de 1011 pares de nucleótidos y es mucho más grande este genoma que el genoma humano que tiene 3.000 millones de pares de bases (genoma aploide), y es comparable con el de la rana y el del tiburón, a parte de otras especies de plantas y moluscos. El tamaño del genoma no se corresponde con la complejidad del organismo. En los organismos procariotas, los más sencillos, tienen el genoma más pequeño. En ellos el genoma se controlaba de dos maneras posibles: una es a través de una proteína que en el momento que surgía esa proteína se sintetizaba y se unía con el operador que impedía que se transcribiera el operón. Esto tiene lugar en el operón lactosa en el cual vemos que hay unos genes estructurales, Z, Y y A que son los que codifican enzimas que permiten la utilización del disacárido lactosa en las bacterias. Están codificadas en un único gen poligistrónico que está bajo el control de un promotor y un operador. El promotor es el sitio donde una secuencia de nucleótidos específica es conocida por una proteína (una de las subunidades) que acompañaba a la RNA polimerasa única de los procariotas. Esa era una de las subunidades sigma que era intercambiable (había varios tipos de subunidades sigma) pero esa era prácticamente toda la variabilidad que había en los procariotas respecto al reconocimiento del promotor. -El operador es un sitio que contribuye al control de los genes estructurales. Entonces ¿cómo se controla todo esto? Aquí vemos que a la izquierda del promotor hay otro gen que codificado que se llama el gen I que codifica una proteína que actúa como represor uniéndose al operador. En el operón lactosa vemos que aparece el promotor, luego el gen estructural y a partir del gen I se transcribe un ARNm que se traduce en una proteína que tiene afinidad por el operador (por los nucleótidos que están formando parte de él) y entonces cuando la ARN polimerasa se une al promotor esto obstaculiza el paso de forma que la ARN polimerasa se elimina sin haber transcrito el gen estructural. Esto ocurre en ausencia de inductor. Si no hay lactosa en el medio no hay inductor y entonces ocurre que el represor se une al operador y entonces la RNA polimerasa no puede transcribir los genes. Esta es una regulación bastante sencilla si pensamos en la complejidad que tiene más adelante con la evolución. Este operón lactosa tenía otra forma de control mediante el cAMP y la proteína de unión al cAMP pero más o menos esa es la complejidad de regulación posible descrita en los procariotas. El inductor es una sustancia derivada de la lactosa que produce por isomerización de ésta. La lactosa es un disacárido, entonces cuando se produce la 1,6-anolactosa actúa como el inductor. El inductor se une al represor y bloquea la unión del represor al operador. Entonces deja esa región libre, la RNA polimerasa se une al promotor y avanza a través de las secuencias del operador y transcribe los genes estructurales. El inductor obviamente es una molécula derivada de la lactosa, no ella en sí misma. Esto es porque el operón lactosa esta activo, se expresan los genes que codifican las enzimas que permiten la utilización de la lactosa solamente cuando hay lactosa en el medio. El operón triptófano es otro tipo de regulacón, que de alguna manera es opuesta a la del operón lactosa. El operón lactosa lo que codifica son genes de enzimas que permiten la utilizacióon de la lactosa, que metabolizan la lactosa mientras que el operón triptófano lo que codifica son genes que sintetizan el aa triptófano. Entonces el operón lactosa tendrá que estar activo cuando haya lactosa en el medio porque de otra manera estará gastando una energía sintetizando unas enzimas que es innecesaria porque si no hay lactosa en el media para qué queremos esas enzimas. Entonces con el triptófano ocurre lo contrario, cuando no hay triptófano es cuando la célula necesita sintetizarlo ella misma, por tanto, esto implica que en ausencia de triptófano el operón deberia estar activo, deberia expresarse. De modo que esto ocurre según la imagen superior. Vemos el sitio promotor -operador además de el trpL que codificaba el péptido libre (explicado en la clase anterior) y esto cnotrolaba a nivel traduccional. Pero el control principal que es el control transcripcional ocurre en el promotor-operador. Funcina de la siguiente manera: También hay un represor, otro gen distinto del operón triptófano que está codificado dentro del genoma de la bacteria que cuando se expresa, cuando se transcribe, da un mesajero que se traduce en una proteína represora que solamente actúa cuando hay triptófano en el medio, ya que en ausencia de triptófano esa proteína no tiene afinidad por el operador, la tiene cuando se le une el triptófano y por eso se le llama corepresor. La unión del triptófano y el represor constituyen el corepresor que se une al sitio operador y esto hace que se bloquee el paso de la ARN polimerasa y por tanto no se transcriben los genes del operador. En ausencia de triptófano el represor no está activo y el promotor-operador está accesible para la ARN polimerasa y ésta puede transcribir sin ningún problema los genes estructurales dando lugar a las enzimas de la vía de síntesis del triptófano. Hay situaciones intermedias en llas que hay concentraciones intermedias de triptófano donde se puede modular la actividad de este gen mediante un atenuador. El control de la expresión génica en procariotas es relativamente sencillo e implica un número reativamente pequeño de enzimas que . Las bacterias viven en un medio al cual se pueden adaptar en cierta medida y disponen de una maquinaria genes de mantenimiento que están practicamente activos, se están expresando de manera continuada y no están sometidos a una regulación. Los cambios ambientales son relativamente pequeños si comparamos con los cambios ambientales de una célula cualquiera de nuestro organismo. La longitud de los genomas no se corresponden con el número de genes que se expresan. En los procariotas, en Echerichia Coli que es ell organismo donde encontramos el operón lactosa y el operóon triptófano vemos que hay menos de 5000 genes que se expresen. Otro ejemplo es el de la Saccharomyces cerevisiae que tiene cerca de 6000, es una levadura, eucariota por lo tanto. También encontramos al homo sapiens que tiene 75.000 genes que se expresan. Tenemos que tener en cuenta que hay un número mayor de genes en los organismos más complejos. Aunque los genomas podrían ser más grandes en organismos más pequeños, el número de genes que se expresan si que establecen una correlación entre la complejidad de los organismos. Estudiando la estructura de los genes de procariotas y eucariotas más o menos evolucionados lo que se observa es que las porciones reguladoras van aumentando en complejidad con la evolución, de tal manera que la región rguladora en Echerichia Coli de cualquier gen en general de un operón, tenía un promotor , una secuencia reguladora o como mucho dos. Imagen inferior: En las levaduras vemos que hay un sitio promotor donde se une la ARN polimerasa donde se empieza a transcribir (la flecha indica el ARNm) y ahí hay un número mayor de secuencias reguladoras repetidas o distintas entre sí. Si comparamos finalmente con un gen de una célula humana vemos que tiene el promotor, en la región codificadora hay zonas y elementos reguladores que también pueden estar incluso dentro de la región codificadora. En 5I del promotor vemos que hay muchísimas zonas reguladoras que están indicadas por los fragmentos de nucleótidos azules; los hay cerca del promotor , un poco más lejos y los hay mucho más lejos porque el DNA estaría interrumpido y separaría los fragmentos aún más. La complejidad en la regulación de la expresión génica, del nivel de la transcripción de un gen es más grande en los organismos más complejos. Esto es así porque el medio en el que viven las bacterias es sencillo y el medio en el que se desarrollan las células humanas es mucho más complejo. El número de señales que pueden llegar a controlar la expresión de un gen en las células humanas es mucho mayor por lo que cada señal tendrá un sitio específico en el gen para poder ser regulado. Además, la secuencia de la región reguladora de cada gen específico es distinta. Va a haber un conjunto de genes que se expresan en proteínas que controlan este proceso. Las proteínas que se van a unir a estas secuencias reguladoras también van a estar en un número más grande en las células humanas que en las bacterias de los procariotas. En los organismos el aumento de la complejidad aporta una regulación de la expresión mucho más elaborada y también en organismos como lo de los mamíferos vemos por ejemplo en el del ratón vemos una serie de cosas como que tiene huesos, pelo, piel, cerebro…en definitiva tiene una serie de cosas en común con nosotros, no son exactamente iguales pero son las mismas estructuras con las mismas moléculas. Entonces todas esas moléculas se expresan gracias a la expresión de unos genes concretos que son iguales o muy parecidos en su región estructural. Las proteínas tienen homología, la región estructural de los genes tiene homología y donde no hay tanta homología es en la región reguladora. Vemos que en los mamíferos, aunque sean muy diferentes entre sí tienen genes cuyas ORF (marco de lectura- open reading frame), la parte del DNA que codifica, que da lugar a un ARNm o la atracción del mensajero con el triplete AUG y los tripletes de terminación, que es la que de tres en tres codifica aminoácidos. Entonces las ORF son muy parecidas pero se diferencian en la región reguladora de la expresión génica. La proporción de genes reguladores es de en las levaduras un gen de cada 20 y en los humanos un gen de cada 10. Por tanto hay muchos más genes en las células humanas dedicados a la expresión génica que en las levaduras, con lo que hay muchas más secuencias reguladoras en humanos que en levaduras. En el control de la expresión génica tiene mucha importancia que sea de manera ordenada y coordinada y muy precisa para que un organismo se pueda desarrollar. Como vimos en embriología los organismos van pasando por distintas etapas durante el desarrollo y esas etapas dependen de que en un momento determinado se exprese un determinado grupo de genes y otros no. Eso es lo más importante del control de la expresión génica porque de otra manera el organismo no llega al estadío adulto. El control de la expresión génica durante el desarrollo es el que condiciona practicamente la existencia o la llegada a la vida madura de un organismo. Aquí vemos que para que el cigoto se desarrollo tienen que expresarse multitud de genes de una manera muy coordinada. En un momento adecuado , cada grupo de genes tienen que responder de forma adecuada a una señal específica que solo se genera en ese momento , ni antes ni después. Eso es vital en el control de la expresión génica. De una zona tan pequeña se van a generar distintas partes del embrión y de cada una de esas partes se van a generar distintos tipos celulares. Cada tipo celular es distinto. Las células del hígado tienen poco que ver con las células de la piel, del músculo, del tejido adiposo, porque cada una de ellas expresa un conjunto de genes especícos de ese tipo celular. Eso también se controla de una forma adecuada y contextualizada en el control de la expresión génica de cada tipo celular. Aquí tenemos que de los genomas hay un parte muy pequeña que se transcribe, entonces hay alrededor de un 10%-20% de los genes que hay en los genomas se expresan y los podemos agrupar en tres grupos dependiendo de la cantidad de moléculas de ARN mensajero que se expresen a partir de un gen. Entonces en un momento determinado un gen se expresa y el número de moléculas de mensajero que aparecen puede ser muy pequeño, intermedio o muy grande. En el segundo apartado llamamos genes estructurales a los que dan lugar a proteínas que forman parte de las estructuras de la célula, tanto de la membrana como del citoplasma… no son enzimas. En el tercer apartado hay que decir que puede llegar un momento, por ejemplo, en el hígado, en el que es necesario para la supervivencia el estados de ayuno la gluconeogénesis hepática, que permite mantener la homeostasis de la glucosa en el plasma sanguíneo, que la enzima clave de la vía gluconeogénica que es la fosfoenolpiruvato carboxikinasa está regulada de manera hormonal y en un momento determinado pueden introducirse en ella muchas copias de su RNAm que se traduzcan y que tengan actividad enzimática suficiente para producir la glucosa necesaria para nuestro organismo. Se pensaba estos genes eran muy pocos y sin embargo la genómica afirma que hay varios cientos de genes en estas condiciones. Todo esto es para recordar que las células eucariotas tienen varios compartimentos y que en cada uno de ellos tienen lugar los distintos pasos de la expresión génica. Algunos de los pasos son: Cuando el gen se expresa da un transcrito primario, éste a su vez da un mensajero maduro que pasa a través de los poros nucleares al citoplasma y allí es degradado, inactivado o es traducido a una proteína inactiva que finalmente se activa y da lugar a una porción celular. Previamente en el DNA antes de que DNA se haya transcrito hay un control pretranscripcional. Ese control depende de la estructura del DNA, depende de que el gen esté accesible a la maquinaria de transcripción. Esto depende de la metilacion del DNa y del superenrollamiento. De modo que el control pretranscripcional determina esto. Es un control epigenético porque no depende de la secuencia de nucleótidos del genoma sino de las modificaciones que haya sobre la secuencia de nucleótidos y sobre las histonas que están acompañando a estos nucleótidos. El segundo punto de control es el control transcripcional. Las vías metabólicas se controlan en el primer paso, es decir, las enzimas clave en el control de estas vías son las que catalizan el primer paso, la primera transformación. Aquí ocurre lo mismo puesto que qué sentido tendría que la transcripción tuviera lugar, se unieran los nucleótidos para dar un mensajero, ese mensajero se tradujera en una proteína y al final no se activara de forma correcta y no sirviera para nada. Entonces lo lógico es frenar antes, en el primer paso, es decir, en la transcripción que está controlada por las secuencias del DNA y por proteínas que se unen específicamente a ese DNA y mandan señales integradas mediante lo correpresores en la RNA polimerasa y en el complejo de transcripción. El elemento que hace que la velocidad de transcripción sea más alta o más baja es la RNA polimerasa que hace que se forme un complejo de transcripción basal más o menos estable, la estabilidad de ese complejo es la que depende de todas las señales que pueden llegar a través de factores de transcripción y de moléculas intermediarias. Por una parte es la accesibilidad de los sitios de inicio, la disponibilidad de los factores de transcripción y también la secuencia de promotores, ya que se podían dar hasta 4 tipos de secuencias que podían colocarse de una determinada manera para conseguir la eficiencia máxima de un promotor. Si una de estas secuencias no está presente en un promotor, éste no sería tan eficiente como el que si la contenga. El inicio de la transcripción es donde reside el control principal porque una vez que se ha iniciado la elongación ya no depende de prácticamente nada más, solo de algunos factores que acompañan a la RNA polimerasa. Una vez que ya se ha transcrito el gen tiene lugar un control de la maduración en el que se retiran unos intrones determinados y se ordenan los exones. En el control de la estabilidad debemos tener en cuenta que el ARNm será traducido tantas veces como esté disponible para la maquinaria ribosomal. Un ARNm circularizado puede estar simultáneamente traducido por varios ribosomas. Cuanto más tiempo esté físicamente dentro de la célula y cerca de los ribosomas y pueda ser traducido, más cantidad de proteínas se sintetizará. Pero si la vida media del ARNm es de 13, es decir 13 RNAm se degradan, entonces no puede haber traducción de ese mensajero. De modo que la vida media del mensajero es muy importante para el control de la expresión génica. En el año 2006 el premio nobel de fisiología y medicina fue para estos dos investigadores que descubrieron que hay un mecanismo mediante el cual se puede suprimir la actividad de genes , su expresión, y este mecanismo implica un RNA de doble cadena que puede suprimir esta expresión de una forma dependiente de homología y esto se llama RNA interferido. Una de las cosas más difíciles a las que se ha enfrentado la biología experimental molecular ha sido poder estudiar los RNA, ya que éste es muy inestable y se degrada fácilmente y no es sencillo manipularlo. El experimento consistió en que ellos inyectaron un RNA de doble cadena o de cadena sencilla en las gónadas de un gusano. Cuando lo hacían se veía que aunque se inyectaba el RNA con sentido en la gónada, el gusano se desarrollaba y daba lugar a un genotipo normal. Si se inyectaba el antisentido, es decir, la molécula de ARNm con la secuencia de RNA complementaria y antiparalela del RNAm con sentido lo que se veía es que los resultados no daban ningún efecto en el genotipo del gusano. Sin embargo cuando se inyectaba un RNA de doble cadena, con dos hebras, con y sin sentido juntas, lo que ocurría era que se formaba un gusano distinto con un genotipo cambiado. Entonces eso les llevó a repetir el proceso en otros genes como el gen mex-3 (RNAm) y lo inyectaron en embriones. De modo que investigando qué era lo que cambiaba dentro de la célula y qué era lo que había se descubrió que había dos complejos proteicos importantes en este proceso. Uno de ellos era el de doble cadena que se llamaba Dicer que corta el RNA de doble cadena en trozos de 21-25 pares de nucleótidos. También hace que una de las hebras sean cargadas sobre otros trozos y éstos tienen una cierta afinidad por un complejo que se llama Risc. Este complejo recoge un trozo de la hebra antisentido del RNA de doble cadena y le ha unido el RNAm por complementariedad de nucleótidos. Cuando se produce esta unión entre los fragmentos de doble cadena entonces esta proteína Risc tiene actividad de hidrólisis del RNAm y con lo cual este mecanismo lo que hace es degradar el RNAm. Todas las células tienen capacidad para producir RNA de doble cadena específicos para degradar RNAm concretos porque este RNA antisentido amarillo tiene que hibridar con un RNAm celular (imagen). De modo que este es el mecanismo para degradar RNAm. El sistema Dicer se encarga de cortar el RNA de doble cadena en trocitos pequeños de 21 a 25 pares de nucleótidos y también desdoblan la doble cadena. Mientras que el sistema Risc se encarga de unir los trozos generados de monocadena y los enfrenta a RNAm celulares. De modo que cuando un RNAm celular tiene enfrentado una secuencia de RNA complementaria y antiparalela Risc rompe el RNAm y lo degrada desapareciendo el mensajero de forma que ya no vuelve a estar disponible. Estos sistemas sirven a la célula principalmente para destruir RNA invasores, permiten la eliminación de transcritos, de fragmentos de RNA que no tienen ninguna función, bloquean la síntesis de proteínas porque al romper los RNA impiden que se traduzcan… Hasta que aparecieron los RNA de interferencias cuando uno quería la función de un gen concreto en una célula o en un organismo determinado lo que tenía que hacer era noquear ese gen e impedir de alguna manera que ese gen se expresara. De este modo aparecieron los animales knock-out, animales experimentales como ratones que no expresaban una serie de genes concretos. Era un proceso muy largo y costoso y cuando se descubrió esto, sintetizando en un laboratorio RNA de doble cadena que tuviera una de las cadenas prácticamente igual que el mensajero del gen que queríamos eliminar pues haciendo llegar ese RNA de doble cadena a la célula hacíamos que no se expresara ese gen en la célula porque se destruirían los mensajeros a través de ese mecanismo. Está permitido el estudio de la función de nuestros genes, quitando el gen vemos qué función desaparece en la célula. De modo que el método Dicer-Risc ha supuesto un avance en estos estudios. Para eliminar un determinado gen no sería necesario eliminarlo en un organismo completo. Entonces Sabemos que el control traduccional se podía hacer mediante la fosforilación entre otras técnicas.