Download Evolución de estructura y función proteica
Document related concepts
Transcript
Bioquímica de las Macromoléculas Evolución de estructura y función proteica Romina Hidalgo proto prefijo del gr. prôtos, que significa primero. proteico, ca adj. Que cambia con frecuencia de forma, por alusión a Proteo; dios marino que habiendo recibido de su padre Neptuno el don de la profecía, para librarse de los que lo acosaban con sus preguntas cambiaba de forma cuando quería. 1 Evolución de estructura y función proteica Introducción: Todos los organismos vivos son similares a nivel molecular, 20 aminoácidos isómero L y los mismos nucleótidos con la D-ribosa. Esto está de acuerdo con la teoría de que todos poseen un ancestro común que había adquirido esas características. Se asume que la diversidad a niveles mas altos de organización es el resultado de la evolución divergente, y los procesos bioquímicos más básicos han sido conservados, porque una alteración hubiera sido letal. La comparación de las secuencias de ADN y de proteínas es la manera mas aceptada para la reconstrucción de los procesos de evolución. Esto es porque la información contenida en esas secuencias es muy amplia. Una cadena de sólo 1000 nucleótidos (como para codificar una proteína promedio) puede existir como cualquiera de 41000 (10600) secuencias diferentes. Las variaciones evolutivas de una proteína, aportan mucha información sobre la proteína en sí misma. La evolución divergente hacia distintas especies resulta en variaciones de la misma proteína, con esencialmente la misma función biológica pero diferente secuencia. Las diferencias y similitudes en la secuencia reflejan la estrictez necesaria para estructura y función para esa proteína. Las relaciones evolutivas nos dan indicios del rol biológico de proteínas no caracterizadas. Proteínas que son muy similares en estructura y secuencia pueden llevar a cabo funciones distintas, y proteínas con estructuras distintas pueden tener funciones idénticas. Se sabe que la función y la estructura tridimensional están íntimamente relacionadas. Entender la evolución de la función puede aportar datos para el diseño de proteínas con funciones nuevas. Mutaciones y estructura proteica Las consecuencias de las mutaciones sobre la estructura, depende de la ubicación de los nucleótidos afectados en el gen, incluso puede ser inocua. Las mutaciones pueden cortar el polipéptido, o reemplazar un aminoácido por otro. La importancia de este cambio tendrá relación con la similitud química de los aminoácidos, y será mucho mayor si afecta a modificaciones post traduccionales, como el clivaje proteolítico. Inserciones y deleciones, afectan el marco de lectura, y este tipo de mutaciones produce una cadena peptídica irreconocible. Mutaciones en regiones no codificantes puede alterar la cantidad de proteína sintetizada, e incluso el splicing, afectando dramáticamente a la proteína. Luego de la existencia de material genético funcional, su complejidad habría aumentado mas fácilmente debido a la duplicación de genes existentes que por generación de nuevo material genético. Con dos copias de cada gen disponibles, una copia puede proveer la función original necesaria, y la otra acumular las mutaciones que alteran esa función. Si esta copia alterada eventualmente sirve para una nueva función, probablemente quede retenida en el genoma y pasado a las siguientes generaciones. Los genes que ocupan el mismo locus en diferentes especies, y las proteínas producto de esos genes, se llaman ortólogos, mientras que genes de diferentes loci, pero relacionados por duplicación de genes son designados parálogos. La filogenia de las especies puede reconstruirse solo comparando los genes ortólogos. las diferencias entre genes parálogos de diferentes especies no está relacionada con el tiempo desde la divergencia, sino con el tiempo desde la duplicación de los genes. 2 Bioquímica de las Macromoléculas Definiciones Término Homólogo Análogo Ortólogos Parálogos Residuos funcionales Definición Surgieron de una proteína ancestral en común, y su relación evolutiva es evidente por similitudes en la secuencia, la estructura y/o en la función Son similares de alguna forma, pero no hay evidencias de ancestro común. Análogos estructurales comparten el mismo plegamiento, y análogos funcionales la misma función. Son genes equivalentes en diferentes especies que surgieron de un ancestro común por especiación. Surgieron por duplicación de genes dentro de un genoma, y tienen funciones diferentes, pero generalmente relacionadas. Incluyen residuos de unión, en contacto con sustrato y cofactor, y residuos catalíticos que intervienen en el mecanismo enzimático. Elongación proteica por duplicación intragénica Parte o toda la secuencia de aminoácidos es duplicada si se mantiene el marco de lectura. Las porciones duplicadas pueden acumular cambios por mutaciones y divergir. Se observa este fenómeno en proteínas con dos mitades de secuencia muy similares, y en la estructura tridimensional, dos dominios gemelos (como el caso de las ferredoxinas, albúmina, fibrinógeno y colágeno). Fusión de genes Dado que existen un número limitado de plegamientos, y una cantidad inmensurable de actividades requeridas para la vida, la construcción modular ha sido un importante mecanismo para originar funciones nuevas. La fusión de genes ocurre mas frecuentemente en eucariotas que en procariotas, probablemente porque las dos regiones codificantes de ADN tienen que estar unidas exactamente con el mismo marco de lectura si ocurre en intrones. Dos regiones codificantes pueden ser eficientemente fusionadas por recombinación genética con un intrón entre ellas que puede excisionarse fácilmente. La existencia de intrones en el genoma pareciera facilitar la fusión, duplicación y rearreglo de segmentos de genes. Hay evidencias que indican que las proteínas mosaico surgieron a partir del shuffling de intrones y exones. La fusión de genes no está restringida a los eucariotas, y también ocurre en procariotas, donde como no hay intrones, la fusión debe ser precisa. Por ejemplo, en la biosíntesis del triptofano se requieren cinco reacciones que son catalizadas por cinco actividades enzimáticas diferentes, las cuales en alguna bacterias ocurren en cinco enzimas diferentes, codificadas por diferentes genes. En otras bacterias, como Escherichia coli, dos pares de estos genes están fusionados para producir dos polipéptidos bifuncionales. En cada polipéptido bifuncional, las dos actividades enzimáticas están dirigidas por regiones separadas de la cadena polipeptídica, que son homólogas a las correspondientes proteínas de otras bacterias. El método “mix and match” probablemente sea la ruta más rápida para nuevas funciones genéticas. La fusión de genes puede generar funciones totalmente nuevas, como en las que el sitio activo se ubica entre dos o más sitios distintos. La fusión genética no necesariamente modifica la función proteica, y la multiplicidad de dominios puede ser reflejo de la organización del genoma. El algunos sistemas de proteínas, sin embargo, la existencia de dos o más centros catalíticos dentro de una sola cadena es beneficioso ya que facilita la canalización de los intermediarios o sustratos en pasos sucesivos en el metabolismo. 3 Evolución de estructura y función proteica Reclutamiento de genes Se refiere a la adquisición de nuevas funciones por un gen existente. Según el reclutamiento, genes multifuncionales son sujeto de dos o más presiones de selección, resultando en limitaciones en la adaptación. Estas presiones pueden llevar a uno de tres cambios: mutaciones locales para aumentar una función sin comprometer la otra. separación de la función (por duplicación y especialización). reversión del reclutamiento. Protein Data Bank (PDB) Como la estructura está mucho más conservada que la secuencia, estos datos facilitan la identificación de relaciones evolutivas que están ocultas a nivel de la secuencia. estos estudios sostienen que el mínimo número de familias proteicas es finito con un mínimo estimado en 1000 diferentes plegamientos. Hay dos puntos de vista para clasificar estructura: filogenético con un árbol filogenético, relacionando las distintas familias de acuerdo a su relación evolutiva. teóricamente hay un único resultado “correcto”. fenotípico descripción de la estructura (clase, arquitectura y tipo de plegamiento). Esta descripción no es absoluta, pero muy útil. Dominios Las proteínas mas grandes tienen dominios reconocibles, pensados como unidades evolutivas, unidades estructurales compactas. hay evidencia de que se pueden plegar independientemente. pueden formar proteínas multimodulares e incluso, un dominio insertarse en otro. Todos los esquemas de clasificación de proteínas apuntan a dividirlas según los dominios, pero la información estructural es muy incompleta (a la mayoría de las proteínas no se les ha determinado la estructura). Clasificación de dominios proteicos CATH: Los dominios son asignados por herencia (para proteínas con secuencia muy similar a otra que ya esté en la base de datos) o por consenso (si en tres algoritmos diferentes se deduce la misma estructura) o manualmente (si los algoritmos no aportan la misma respuesta). SCOP: Las asignaciones son hechas manualmente y las proteínas pertenecen a un dominio sólo si uno de los dominios existe independiente en la base de datos.(La serín proteinasa es 2 barriles en CATH y un solo dominio en SCOP). DALI y VAST: Son totalmente automatizados. Las proteínas se consideran de la misma familia de homólogas si cumplen una de estas condiciones: evidencia de similitud de secuencia significativa. evidencia de similitud de estructura significativa. evidencia de similitud funcional, ubicación y configuración del sitio activo. 4 Bioquímica de las Macromoléculas Relaciones Estructura/ Función enzimática Clase y función En cuanto al contenido de estructura secundaria (el amplio nivel de estructura), se ha encontrado dominancia de / en enzimas en comparación con no enzimas. esto refleja la importancia de dominios de unión a nucleótidos en la función celular, y puede sugerir múltiples eventos de duplicación para el uso metabólico. La clase donde predomina no es abundante en enzimas, y esto se puede deber a la inhabilidad de los grupos polares dentro de la hélice a estar involucrados en unión o catálisis, ya que sus puentes de hidrógeno están satisfechos (en los bordes de las hojas los grupos para formar puentes de hidrógeno están accesibles). El primer número EC define el tipo de enzima (oxidorreductasa, transferasa, etc.). No se encontró una relación clara entre este número y la clase. Sin embargo, para varios ligandos comunes (hemo, DNA, carbohidratos, nucleótidos) se encontró una notable tendencia ciertas clases de proteínas definidas por requerimientos estereoquímicos para unión de ligando. La actividad enzimática dependería del arreglo específico de unos pocos residuos en el sitio activo. Plegamiento y función Hay evidencias para creer que existe un número limitado de plegamientos en la naturaleza, probablemente debido a las limitaciones fisicoquímicos del plegamiento proteico. Consecuentemente, familias de enzimas diferentes evolutivamente con funciones no relacionadas pueden compartir una estructura común, y la similitud estructural no necesariamente implica una relación evolutiva. La mayoría de los plegamientos tienen una familia homóloga relacionada, y puede ser considerado esencialmente como un plegamiento funcional. Los plegamientos más comunes son: Rossman; /; del tipo inmunoglobulina; barril / (TIM); y el no-bundle represor de DNA. El barril TIM ejemplifica la versatilidad funcional de algunas estructuras, asociado a por lo menos seis funciones catalíticas. Esta versatilidad se debe probablemente a que los residuos del sitio activo se localizan invariablemente en el extremo carboxilo de las hebras o en los loops siguientes, por lo que el sitio activo puede estar en uno de los ocho motivos /. 5 Evolución de estructura y función proteica Familias homólogas y función La función describe el rol de una proteína como un todo, y no siempre es posible identificar cada subfunción con cada dominio constituyente. En algunas enzimas el sitio activo se puede asignar a un dominio inequívocamente, pero en otras, varios dominios cumplen el rol de la actividad catalítica. La aplicación de un plegamiento en diversas funciones celulares debe haber simplificado los procesos metabólicos durante la evolución. Como es de esperarse, familias en las que la función enzimática no está conservada, su estructura tiene una diversidad mucho mayor. Análogos funcionales En el otro extremo, es común encontrar enzimas con la misma actividad con estructura diferente. Probablemente estos análogos funcionales hayan surgido de la duplicación de sitios activos existentes que asumen nuevos roles catalíticos debido a pequeñas modificaciones. Esta hipótesis se refuerza cuando se encuentra una enzima en un número reducido de especies, y la familia de donde proviene ampliamente distribuida. La identificación de análogos enzimáticos provee mucha información sobre la evolución de rutas metabólicas, y la diversidad bioquímica de los grandes genomas, que contiene mayor riqueza en parálogos y análogos. Notablemente, ninguna de las enzimas involucradas en la replicación del DNA tiene un ortólogo común en Archaea, Bacteria y Eukarya, por lo que se cree que el ancestro común a los tres dominios más antiguo puede no haber tenido genoma de DNA. Los análogos funcionales son ejemplos de la convergencia funcional y también del mecanismo de convergencia, tipificado por las serín-proteasas. Su actividad catalítica está dada de la orientación espacial de unos pocos aminoácidos, y no es raro que esta misma conformación del sitio activo se encuentre en diferentes contextos estructurales. Incluso se cree que las combinaciones catalíticas sean un número limitado que se repite durante la evolución. 6 Bioquímica de las Macromoléculas Mecanismos de la evolución funcional La secuencia genética cambia, cambiando la estructura tridimensional, y por lo tanto la función. Posibles caminos a nuevas funciones: Nueva función proteica nuevo gen – nueva proteína – nueva función moonlighting: el mismo producto génico puede tener distintas funciones en distintos ambientes, la función es dependiente del pH, localización celular, ligandos disponibles, etc. mutaciones: mutaciones locales que llevan a una actividad distinta, pero relacionada con la original. oligomerización: nuevas funciones con oligómeros idénticos, relacionados, o muy diferentes entre sí. duplicación: nuevo producto génico con nueva función. construcción modular (mix and match), nuevas actividades al unirse dos genes. Actividad catalítica y especificidad de sustrato La actividad catalítica y la especificidad por el sustrato caracterizan las propiedades funcionales de las enzimas. Sus determinantes estructurales pueden ser independientes, esto le confiere una ventaja evolutiva a la enzima, ya que la actividad puede ser modificada sin comprometer la especificidad por el sustrato, y viceversa. Las enzimas primitivas probablemente tuvieron un amplio rango de actividades y/o especificidad por el sustrato, y se fueron especializando al incorporar en la evolución grupos funcionales adicionales. Especificidad de sustrato Está directamente determinada por la naturaleza de los residuos de unión, aprovechándose las propiedades de los 20 aminoácidos. Incluso la especificidad puede ser rediseñada en laboratorio por mutaciones puntuales. Los loops superficiales generalmente contienen los determinantes estructurales para la especificidad de sustrato, y esto facilita la rápida divergencia evolutiva y la adaptación, ya que puede variar la estructura del loop sin afectar el plegamiento global de la proteína. La naturaleza química de los residuos involucrados en la interacción no es necesariamente el único determinante de la especificidad. se han encontrado que la mutación de algunos residuos lejanos le dan forma al sitio activo para la complementariedad del sustrato. Mecanismo catalítico Algunas familias enzimáticas presentan gran divergencia en sus actividad catalítica, como también en su especificidad por el sustrato. El estudio detallado de su estructura y sus características bioquímicas revelaron que las diferentes actividades y sus reacciones asociadas compartían cofactor, nucleófilo o mecanismo de reacción. Con el descubrimiento de proteínas homólogas que catalizan un paso bioquímico común en los contextos de diferentes reacciones globales, se vió que los residuos esenciales para dicha actividad se conservan durante la 7 Evolución de estructura y función proteica evolución, mientras que los grupos funcionales adicionales intermediario de reacción, como la especificidad por el sustrato. determinan el destino del Evolución de rutas metabólicas No se conoce cuántas proteínas ancestrales diferentes hubo originalmente, pero puede que haya sido una sola. Las homologías distantes se notan mas en la estructura tridimensional (muy conservada) que en la estructura primaria. Indicadores de homología entre proteínas que divergieron hace mucho tiempo, sugiere que la mayoría de las proteínas catalizan hoy las vías metabólicas pueden haber surgido de la duplicación de unos pocos genes. Hay una teoría que dice que las enzimas de las rutas biosintéticas surgieron en el orden opuesto en el que están en la ruta por un proceso de duplicación de genes. La proteína que hoy es última en la ruta biosintética tiene un sitio de unión para el sustrato presente en la “sopa” original. si el gen para esta proteína fuese duplicado, la proteína del segundo gen podría mantener el sitio de unión para el mismo sustrato y desarrollar la capacidad de producirlo como un producto de otros componentes de la sopa primordial. Hay muchos casos donde enzimas de distintas rutas metabólicas con función catalítica similar pero afinidad por diferentes sustratos presentan homologías. En este último caso, la evolución de las duplicadas alteró la especificidad por el sustrato, pero mantuvo el mecanismo catalítico. Secuencias naturales separadas por grandes distancias Enzimas termofílicas comparten sólo 20-30% de su secuencia aminoacídica con una de ambientes más fríos. Para saber cuáles aminoácidos son importantes en la adaptación se determinarían por sustitución de cada uno, lo cual, por las combinaciones posibles, sería imposible. Otra dificultad es identificar qué propiedades son debidas a las presiones evolutivas, cómo era la enzima primitiva. Además algunos organismos están sujetos a complejas combinaciones de presiones de selección. No todas las diferencias entre las propiedades enzimáticas son reflejo de la adaptación, las mutaciones neutrales son neutrales con respecto al fitness pero no necesariamente a todos los comportamientos enzimáticos. Relevancia biológica vs. fisicoquímica Las enzimas son productos evolutivos y si bien están sujetos a las leyes físicas y químicas, el proceso evolutivo tiene mayores limitaciones. la evolución selecciona las funciones enzimáticas biológicas relevantes. 8 Bioquímica de las Macromoléculas Evolución en laboratorio Es una herramienta reciente para estudiar la función y adaptación enzimática, que nos permite observar adaptación bajo condiciones controladas. Como se pueden definir las presiones evolutivas, se pueden explorar funciones no naturales, y distinguir lo biológicamente relevante de lo físicamente posible. pasos: generar diversidad (mutagénesis al azar y/o recombinación in vitro) identificar variantes mejoradas El gen que codifica para la proteína se altera y se determina el efecto sobre el organismo, por lo que se estudia su función in vivo. Alteraciones genéticas de la estructura de la proteína tiene la ventaja de ser extremadamente específicas. Cuando la proteína está bien caracterizada genéticamente, lo ideal es hacer mutagénesis sitio dirigida. Alternativamente, cuando se conoce poco de la proteína o del gen, se pueden seleccionar el efecto fisiológico deseado luego de mutagénesis al azar. Otra alternativa es interrumpir el gen de interés con una secuencia de inserción. Luego de haber generado distintas mutaciones del mismo gen, se eligen aquellas que alteran la estructura y/o la función de la proteína. No hay procedimientos generales para esta selección porque el procedimiento a utilizar es necesariamente específico para cada gen y proteína y también depende del organismo. Sin embargo, las mutaciones que alteran la función de la proteína normal usualmente son seleccionados inicialmente. Si la mutación es letal para el organismo, pero que actúen sólo bajo ciertas condiciones, como las mutaciones “letal condicional”; las más usadas son las que dan sensibilidad a temperatura. Luego de la primer elección, los genes mutados que revierten el efecto de la primer mutación pueden ser seleccionados; unas pocas revierten la primer mutación, pero otras son mutaciones en otros lugares, y se puede aislar la proteína. Mutaciones que afectan una función en particular, se puede deber a una alteración de residuos específicos, o indirectamente, inhibiendo la síntesis de la proteína o destruyendo su estructura terciaria. La naturaleza de las mutaciones que son seleccionadas por este procedimiento, como también las que producen proteínas suficientemente normales para evitar el proceso de selección, es muy importante para estudiar la estructura y función proteica. 9 Evolución de estructura y función proteica Bibliografía: Kinch LN, Grishin, NV. Evolution of protein structures and functions. Curr Opin Struct Biol 2002, 12:400-408. Thornton JM, Orengo CA , Todd AE, Pearl FMG. Protein folds, functions and evolution. J Mol Biol 1999, 293:333-342. Todd AE, Orengo CA, Thornton JM. Evolution of protein function, from a structural perpective. Curr Opin Chem Biol 1999, 3:548-556. Wood TC, Pearson WR. Evolution of protein secuences and structures. J Mol Biol 1999, 291:977-995. Arnold FH, Wintrode PL, Miyazaki K, Gershenson A. How enzymes adapt: lessons from directed evolution. Trends Biochem Sciences 2001, 26:100-105. 10