Download Guia Problemas 2016
Document related concepts
Transcript
☰ Buscar Explorar Iniciar sesión Crear una nueva cuenta Pubblicare × GENETICA MOLECULAR en su 18º año consecutivo bajo el actual formato Guía de Problemas de Ejercitación autor: Norberto D. Iusem 2016 1 Equipo docente de Genética Molecular 2016 Elección de temas, clases teóricas y coordinacion general: Norberto Iusem (norbius@fbmc.fcen.uba.ar) Clases de Seminarios/Problemas: Liliana Dain (ldain@fbmc.fcen.uba.ar) Ezequiel Surace (esurace@hotmail.com) Rocío Sampayo (ro.sampayo@gmail.com) Laboratorio: Lucía Chemes (luchemes@gmail.com) Manuel Sánchez (manusanchez86@gmail.com) Paula Dos Santos Claro (pau2santosclaro@gmail.com) Página web de la materia: http://www.fbmc.fcen.uba.ar/materias/genmol 2 Indice Página Origen de la vida. Primeras células……………………………………………….4 Análisis parciales de los genomas...................................................................... ......6 Familias génicas Evolución de genes DNA repetitivo Perpetuación, fidelidad, integridad y dinamismo de los genomas……………..11 Recombinación Transposones Estrategias de búsqueda e identificación de genes a partir de fenotipo o patrón de expresión………………………………...............................................17 Complementación funcional Transposon tagging Clonado posicional Expresión diferencial Búsqueda de función de genes conocidos (Knockout, knockin)…………………29 Genómica……………………………………………………………………………31 Proyectos genoma Microarrays Cromatina…................................................................... ............................................47 Epigenética…………………………………………………………………………..52 Imprinting Inactivación del cromosoma X Silenciamiento génico....................................................................... ..........................61 Ciclo celular, cáncer, virus oncogénicos.................................................................. .65 Telómeros y telomerasas.................................................................. ..........................69 Genética Humana………………………………….....................…………………..74 Terapia génica....................................................................... ......................................84 Problemas integratorios (tipo examen)...................................................................... 87 3 Origen de la vida Primeras células 4 Origen de la vida. Primeras células 1) A 100 ºC, temperatura habitual de crecimiento de los procariotas hipertermófilos, las vidas medias in vitro de las bases nitrogenadas del RNA son: para A y G, 1 año; para U, 12 años; para C, 19 días. (fuente: The stability of the RNA bases: Implications for the origin of life. Levy M, Miller SL. Proc Natl Acad Sci U S A. 1998 95: 7933-8). ¿Estos datos son compatibles con las ideas de Darwin, Oparin y Woese de una “sopa caliente” como escenario pre-biótico para las reacciones que generaron las primeras biomoléculas sencillas? 2) Es muy aceptada entre los científicos la idea de que existieron riboorganismos, es decir, células primitivas sin ADN ni proteínas pero con moléculas de ARN, responsables de la información genética o actuando como ribozimas. ¿Los resultados de los análisis químicos hechos sobre el meteorito Murchison, de origen extraterrestre y caído en Australia en 1969, apoyan tal creencia? 3) Nyctotherus ovalis es un eucariota unicelular ciliado, con hidrogenosoma, que vive en el intestino de las cucarachas. Llamativamente, se ha observado la liberación de gas metano por estos organismos, que no tienen ni en su núcleo ni en sus organelas los genes necesarios para su síntesis. ¿Cómo se explica esta producción de metano? ¿La observación mencionada fortalece la hipótesis de Martin y Müller o la de Margulis para explicar el surgimiento de los primeros eucariotas con organelas? 4) Giardia lamblia y Entamoeba histolytica son protistas sin mitocondrias ni hidrogenosomas, que usan enzimas típicas de la fermentación para sobrevivir en condiciones anareobias como las del lumen intestinal de mamíferos, donde habitan. Se ha observado que en su genoma hay vestigios de genes procariotas involucrados en la producción de Hidrógeno gaseoso, inactivos. ¿Qué hipótesis sobre el origen de estos protistas es fortalecida por dicha observación? 5) Es conocida la estable “simbiosis” entre el alga verde Vaucheria litorea y moluscos marinos, p ej babosas (sea slugs) como Elysia chlorotica, que habita las costas del Atlántico Norte. Por lo tanto, estos animales adquieran un peculiar y vistoso “camouflage” verde (ver Figura) y logran hacer fotosíntesis de azúcares, de modo que viven de CO2 como única fuente de C, y luz! En realidad, las únicas estructuras de origen algal que se han encontrado en las células del ramificado tracto digestivo del molusco son cloroplastos. Teniendo en cuenta la dependencia de genes nucleares para la biogénesis, mantenimiento y funcionalidad de organelas contemporáneas que quedaron con genomas pequeños, ¿cómo se explica el origen de estos “moluscos verdes” a la luz de los resultados del siguiente paper?: “Genome analysis of Elysia chlorotica egg DNA provides no evidence for horizontal gene transfer into the germ line of this kleptoplastic mollusc”. Bhattacharya D, ……, Rumpho ME. Mol Biol Evol 2013. 5 Análisis parciales del genoma Familia génicas Evolución de genes DNA repetitivo 6 1) Analizando las secuencias nucleotídicas en regiones de miembros de una familia génica conservada en varias especies, ¿qué se puede inferir acerca de la historia evolutiva de dicha familia en los siguientes casos?: i) si se observan más similitudes entre genes ortólogos que entre parálogos ii) si se observan más similitudes entre genes parálogos que entre ortólogos ----------------------------------------------------------------------------------------------------------------------2) basado en Lemey et al (2005) Mol Biol Evol 4: 942-951. Comparando secuencias nucleotídicas entre cepas del virus HIV que fueron apareciendo últimamente, la tasa de sustituciones para el gen env del virus HIV resultó 0.1%/año para codones sinónimos, y 0.2%/año para codones no sinónimos. a) Compare estos valores con los del reloj molecular de primates (0.3% /MY): ¿por qué cree que existe esa enorme diferencia? b) ¿A qué se debe la diferencia de valor entre codones sinónimos y no sinónimos en env? ¿Cuál es la presión de selección qué deben vencer los virus animales? ----------------------------------------------------------------------------------------------------------------------3) Interesante correlación molecular-fenotípica con implicancias evolutivas, simplificada a partir del paper de Helen Rosemberg (2002), Nature Genetics 30: 411-415, citado en el paper de Seminarios (Hittinger & Carroll) Fig. 1. Mono asiático en el Zoo de Filadelfia, pobre El mono asiático (Pygathrix nemaeus, también llamado “douc langur” o “redshanked douc” [mono de pantorrilla roja]) (Fig. 1) es un colorido primate en peligro de extinción que se alimenta, en lugar de bananas o insectos, de hojas, las cuales son fermentadas en el intestino por bacterias que acidifican el medio, llevándolo a pH = 6. Se supone que las bacterias luego son desintegradas y su RNA, de simple y doble hebra, también es aprovechado por el mono, al ser digerido en el acidificado intestino por la ribonucleasa (RNasa) pancreática. Esta enzima está codificada por un gen cuya organización, común a todos los primates, se muestra en la Figura 2. 7 Promotor (408 pb) exon (35 pb) intrón (703 pb) exon 2 (634 pb) Fig. 2. Esquema de la organización conservada del gen RNasa de todos los primates. Con el objeto de estudiar las propiedades de la enzima, y al no disponer de un método para purificarla a partir de páncreas o intestino del mono, los investigadores decidieron producirla en bacterias por ingeniería genética. Para ello, primeramente hicieron una reacción de PCR usando DNA genómico del mono douc langur como molde y un determinado par de oligonucleótidos primers que abarcaban al exón 2. El DNA así amplificado fue usado como inserto, colocándolo en un vector plasmídico, y el plásmido recombinante resultante fue usado para transformar E. coli. Para gran sorpresa, al purificar los plásmidos de las colonias (clones) obtenidas y secuenciar sus insertos, aproximadamente la mitad de aquéllas tenía el gen esperado de acuerdo a la Fig. 2, y la otra mitad tenía una versión del gen levemente diferente. A partir de ese momento, a la variante original se la llamó “A” y a la nueva, “B”. Las secuencias de aminoácidos deducidas para cada una de las proteínas codificadas se muestran en la Figura 3. RNAasa “A”: RNAasa “B”: MALDKSLVIL PLLVVVLLVL GWAQPSLGRE SRAKKPQRQH MDSGSSPSSS .......... .......... ........G. .Q.E...... .......... STYCNQMMKR RNMTQGRCKP VNTPVHEPLV DVQNVCPQEK VTCKNGQTNC .........L ......W..S .......... .......... .......... FKSNSKMHIT DCRLTNGSKY PNCAYRTSPK ERHIIVACEG SPYVPVHPDA .......... E......... .....Q.... .......... .........D SVEDST ...... Figura 3. Secuencia de aminoácidos en código de una letra de la RNasa A y de la RNasa B. En la secuencia B, sólo se indican los aminoácidos que son diferentes con respecto a “A” (los puntos representan los aminoácidos de B que son los mismos que los de A para cada posición). Notar la diferencia en carga eléctrica de ambas que resulta de las sustituciones: A es más básica que B, es decir, más protonada que B a pH ácido (muchas cargas positivas que se repelen), y por lo tanto es probable que se despliegue y desnaturalice a bajo pH. De las colonias transformadas se purificó la RNasa A o B y a cada una se le midió su actividad enzimática in vitro sobre ssRNA en función del pH (Figura 4). 8 Fig. 4. Actividad enzimática (en unidades arbitrarias) para cada RNasa sobre ssRNA en función del pH Sin embargo, usando dsRNA como sustrato, RNasa A mostró alta actividad a pHs entre 6 y 8, y en cambio la actividad de RNAasa B resultó nula (datos no mostrados). Los autores del trabajo comprobaron que el mono asiático es el único primate que tiene dos genes parálogos de ribonucleasa y por lo tanto hipotetizaron que el gen de RNasa B del mono asiático se generó en la evolución de los primates por duplicación del gen de RNasa A y que luego divergió de éste por acumulación y fijación sucesiva de mutaciones que confirieron una ventaja adaptativa. a) ¿Está Ud. de acuerdo, en principio, con esa hipótesis? Si ocurrió realmente así, y teniendo en cuenta el fenotipo de estos monos mencionado al principio, ¿cuál habrá sido la presión selectiva que operó sobre el “nuevo” gen RNasa B? b) Analizando los resultados de actividad enzimática sobre dsRNA, se puede afirmar que -además de lo discutido en b)- “se relajó” la selección purificadora (negativa) contra las “mutaciones” no sinónimas presentes en RNasa B ¿Por qué? Finalmente, se contabilizaron y clasificaron las sustituciones halladas en las secuencias: par de genes de RNasa comparados A y B de douc langur A de douc langur y el único de mono rhesus número de sustituciones nucleotídicas región codificante intrón (Fig. 2) sinónimas no sinónimas 2 9 (Fig. 3) 11 4 10 49 c) ¿Los datos de la tabla robustecen o debilitan la hipótesis discutida en a) y b) en relación a un escenario en el cual la variante RNasa B fue objeto de selección positiva darwiniana (evolución adaptativa)? d) Usando los datos de la tabla y un valor de reloj molecular para regiones libres de presión de selección = 0.003 sustituciones/sitio/MY (es decir 0.3% /MY), estime el tiempo de la duplicación génica que generó a ambas ribonucleasas. e) ¿Son compatibles los datos de la tabla y su respuesta anterior con el tiempo de divergencia entre el mono asiático y el mono rhesus (Macaca mulatta), el cual, a partir de datos de 14C de registros fósiles, se sabe ocurrió al menos hace 10 MY? 9 Perpetuación de los genomas. Fidelidad y mutaciones Dinamismo de los genomas: Recombinación Transposición 10 Perpetuación, integridad y dinamismo de los genomas 1) basado en Johnson & Johnson (2001) J. Biol. Chem. 276: 38097 y http://book.bionumbers.org/what-is-themutation-rate-during-genomereplication/ A continuación se compara la fidelidad de varias DNA Polimerasas, expresada en valores aproximados de frecuencias de error, medidas in vitro Tipo de DNA Polimerasa frecuencia aproximada de error DNA Pol III de E coli completa (holoenzima con todas sus subunidades) 1 x 10-6/sitio * DNA Pol de Pfu (un archeon), que a veces se usa en PCR 1 x 10-6 DNA Pol γ (mitocondrial) 1 x 10-6 Taq Pol (la que se usa habitualmente en PCR) 1 x 10-5 RT de retrovirus HIV 6 x 10-4 * ejemplo de notación: 1 x 10-6 significa 1 error cada 1.000.000 de nt incorporados a) ¿A qué se deben las diferencias observadas en algunos casos? b) ¿A qué se debe la diferencia entre el valor de la DNA Pol III y la tasa de mutación en E coli in vivo, que es aproximadamente 1 x 10-10/sitio c) ¿A qué podrá obedecer la mayor tasa de mutación (del orden de 10-8/sitio) observada en los genomas mitocondriales? d) Estime la tasa teórica de sustitución/sitio/millón de años en todo el genoma de primates y compárela con el valor experimental de reloj molecular para regiones neutras usado en el problema de las pág. 7-9 (no tenga en cuenta eventuales cambios en tamaños poblacionales que podrían influir en la fijación de mutaciones) Datos: - tasa de mutación in vivo en genomas nucleares de eucariotas, valor estimado: igual al de procariotas, = 1 x 10-10/sitio - tamaño del genoma haploide de primates: 3 x 109 pb - número de divisiones celulares a partir de un cigoto de primate hasta una gameta madura de un adulto generado a partir de ese cigoto: en el macho, 400; en la hembra, 30 - tiempo intergeneracional promedio en primates: 20 - 25 años, es decir, 4 5 generaciones/siglo 11 Perpetuación, integridad y dinamismo de los genomas 2) basado en Boyko et al. (2010), PLoS One 5(3):e9514. Las reacciones adaptativas -fisiológicas, celulares y moleculares- frente al estrés abiótico en plantas están asociadas a cambios en la expresión genética. Es interesante que varios tipos diferentes de estrés (p. ej. frío, calor, sequedad, UV, etc.) suelen converger en las mismas respuestas moleculares. Sin embargo, la luz UV activa otras vías de señalización específicas debido a su directa interacción con el DNA. Para revelar algunos de estos mecanismos involucrados frente a estrés, se eligió el modelo Arabidopsis, generando transgénicas que llevan la construcción de la Figura 1: LUCIFER FERASA Figura 1. LUCI: parte 5’ del gen luciferasa, incluyendo el promotor 35S de FER: parte media del gen ASA: parte 3’ del gen luciferasa : secuencia irrelevante conectora Figura 2. Hojas de plantas ya adultas con actividad luciferasa, revelada y visualizada como manchas Cuando plántulas (es decir, muy jóvenes) transgénicas fueron sometidas a luz UV, muchas de ellas adquirieron actividad de luciferasa en todos los órganos (un ejemplo se ve en Fig. 2). a) ¿Cómo explica los resultados de la Figura 2? ¿Qué proceso molecular sufrió el transgén? ¿Qué actividad bioquímica tiene la enzima endógena que actuó sobre él? ¿Cuál habrá sido la señal de su reclutamiento? Ayuda: piense por qué los autores pusieron la secuencia FER repetida como parte del transgén. b) Dibuje un modelo sencillo del mecanismo de la transformación ocurrida en el transgén. 12 Perpetuación, integridad y dinamismo de los genomas 3) basado en Bender y Kleckner (1986) Cell. 45(6): 801-815 Para averiguar si el transposón Tn10 de E. coli transpone en forma replicativa o no-replicativa, se transformaron células en cultivo líquido de una cepa de E. coli RecA- laccon el siguiente plásmido suicida (sin origen de replicación): / Transposasa de Tn10 / AmpR IR Lac Z+ IR Lac ZEl gen β-galactosidasa presente en el plásmido había sido previamente modificado in vitro de tal manera que su hebra codificante era wild-type, pero su hebra no codificante portaba una mutación, de modo de crear un apareamiento erróneo o mismatch en la doble hélice (que resultó estable porque estas bacterias tenían mutaciones en su genoma que impedían la habitual reparación de mismatches). Las bacterias transformadas fueron inmediatamente sembradas a alta densidad (200.000 bacterias en total) en varias placas de Petri con medio de cultivo sólido conteniendo ampicilina, IPTG y X-gal, en incubadas en estufa a 37ºC overnight. Al día siguiente se observaron sólo 2 colonias, las cuales mostraban este aspecto: Tomado de Introduction to Genetic Analysis. Griffiths et al Ed. Freeman. a) ¿Por qué se observaron tan pocas colonias en total? b) ¿Qué implica el aspecto observado de las colonias? En base a su respuesta, ¿cree que el Tn10 transpone replicativa o no-replicativamente? 13 Perpetuación, integridad y dinamismo de los genomas 4) basado en los aprox. 300 trabajos de H. Kazazian; entre ellos Genes Dev. (2009) 23: 1303-1312. El autor citado, deseoso de contar con un modelo in vivo (animal entero) para investigar los curiosos elementos genéticos LINE, generó un ratón macho transgénico portando la siguiente construcción derivada de un LINE subclase L1, activo, en heterocigosis: Figura con el mismo diseño que en el paper de Esnault et al. (Guía de Seminarios) y en detalle: 1.500 pb primers para PCR PL1: Promotor de L1 (muy poco activo) PCMV: Promotor del virus CMV (muy activo) SD: sitio dador de splicing SA: sitio aceptor de splicing pAS: señal de poli-adenilación GFP: ORF de Green Fluorescent Protein partido en dos a) Observe el particular e ingenioso diseño del transgén ¿Qué cree que ocurrirá si se activa la expresión del mismo en el animal transgénico? Una vez obtenidos los animales transgénicos, se observó lo siguiente: Análisis fenotípico del animal transgénico adulto: “normal”, con la particularidad de que algunos de sus órganos resultaron verdes, incluyendo testículo. Análisis genotípico del animal transgénico adulto (sacrificado, luego de dejar descendencia): consistió en PCR con los primers indicados en el esquema de arriba: 14 Perpetuación, integridad y dinamismo de los genomas b) Observando el resultado del análisis de DNA mediante PCR ¿qué procesos moleculares cree que ocurrieron in vivo a partir de la incorporación del transgen? Intuitivamente y sin pensarlo mucho, los autores creían que el evento de integración del retrotranscripto iba a ocurrir en el mismo cromosoma que el transgén y además muy cerca del mismo. c) Si la cruza de ese ratón transgénico con un ratón hembra wild type arrojó los siguientes resultados: De los 40 ratones F1 obtenidos: 42,5% heredaron la banda de 1500 pb solamente 7,5% heredaron la banda de 500 pb solamente 7,5% heredaron ambas 42,5% no heredaron ninguna. ¿Se convalida esta creencia de los autores? d) Con el objeto de hallar el locus donde se insertó el retrotranscripto, se hicieron dos experimentos usando DNA genómico de la cola de cuatro ratones F1 tomados al azar entre los que heredaron la banda de 500 pb: - Southern blot, cortando con una enzima de restricción (que no corta al transgén) y usando GFP como sonda: los cuatro dieron 1 sola banda del mismo tamaño (data not shown). Un resultado similar se obtuvo con una segunda enzima de restricción. - PCR inversa: se concluyó que un alelo del gen FOXP2 (involucrado en lenguaje y audición) quedó interrumpido. Análisis fenotípicos finos revelaron déficit de audición en estos cuatro ratones, contrastando con su padre que oía perfectamente. ¿Cuál escenario in vivo, entre los siguientes, es más fácil de imaginar y cuáles no? Fundamente en base a los resultados obtenidos del padre y los hijos, tanto genotípicos como fenotípicos asociados al nivel de audición. i) el L1 se activó en el cigoto del ratón transgénico padre ii) el L1 generó múltiples e independientes inserciones en las células germinales del padre iii) el L1 generó inserciones en distintas células del embrión temprano del padre: la mayoría en células que dieron lugar a algunos tejidos somáticos y además 1 inserción en una célula germinal que dio lugar a una cierta fracción de gametas maduras e) ¿Podría ocurrir un nuevo evento de transposición a partir del retrotranscripto ya integrado al genoma? f) Recordando lo visto en clases teóricas: ¿qué tipo de proteína es la codificada por el ORF2? Se sabe que un dominio de esta proteína tiene actividad de endonucleasa. ¿Para qué le sirve al L1 tener esa actividad? g) Evidencias experimentales recientes revelaron que las secuencias Alu se transcriben (Mariner et al., (2008) Mol Cell. 29: 99-509). Al no tener ningún ORF, ¿cómo podrían llegar a transponerse? Para reflexionar: ¿Cree Ud. que la transposición es un fenómeno natural “frecuente” en la vida de una célula? ¿Convivimos pacíficamente con nuestro transposones?¿Pueden afectar la correcta expresión de los genes de los genomas que los hospedan?¿Pueden causar enfermedades en humanos? 15 5) basado en Ruffner et al. (1987) Molecular Biology and Evolution 4(1):1-9. Las secuencias Alu están presentes en seis sitios dentro de los intrones de los genes de albúmina humanos (son seis parálogos). Esta misma familia de genes en la rata no posee secuencias Alu. El hecho de que los humanos posean en estos genes secuencias Alu mientras que las ratas no, plantea dos posibles hipótesis: o bien las secuencias Alu “invadieron” los genes de humanoides en épocas evolutivas recientes (después de la separación de los linajes de rata y humano), o bien las secuencias Alu fueron de alguna forma eliminadas de los genes en el linaje rata. Los linajes de rata y humano divergieron hace aproximadamente 85 millones de años. Para distinguir entre estas dos posibilidades, se secuenciaron las seis secuencias Alu que se encuentran en distintos miembros de la familia de genes de albúmina humanos. Los extremos de los elementos Alu insertados y las correspondientes secuencias intrónicas flanqueantes se muestran en la figura 1. Figura 1: Secuencias nucleotídicas de los extremos de 6 elementos Alu insertos en la familia de genes de albúmina humanos y las correspondientes secuencias intrónicas flanqueantes. Las líneas puntuadas indican nucleótidos en la parte interna de las Alu. a) Marque los límites izquierdo y derecho de las secuencias Alu insertadas y subraye las diferencias en cada par de repeticiones directas (recuerde que todos los elementos genéticos móviles generan duplicaciones directas en el sitio target cuando se insertan). b) La tasa de sustitución nucleotídica en regiones genómicas (nucleares) libres de presión de selección (reloj molecular), en primates, ha sido estimada en 3 x 10-3 sustituciones por millón de años en cada sitio (= 0.3 % / MY). Calcule el tiempo transcurrido desde la inserción de las mismas (suponga que las seis inserciones ocurrieron al mismo tiempo). c) ¿Por qué se usaron estas secuencias flanqueantes para realizar este tipo de cálculo? ¿Por qué no se incluyeron segmentos más grandes del intrón para el cálculo? ¿Por qué no se tienen en cuenta las diferencias entre secuencias Alu entre sí? d) ¿Ud. se inclina por un escenario en el cual las secuencias Alu invadieron los genes humanos “recientemente” o por otro en el que en fueron eliminadas del genoma de la rata? 16 Estrategias de búsqueda e identificación de genes a partir de fenotipo o patrón de expresión Complementación o adquisición de nuevo fenotipo Transposon tagging Clonado posicional Expresión diferencial 17 Complementación (rescate de un fenotipo perdido por mutación) o adquisición de nuevo fenotipo (problemas 1-5) 1) Un gen bacteriano de extrema patogenicidad y protagonista en trabajos científicos hace varias décadas es el del neumococo con el que trabaron Frederick Griffith en 1928 y Oswald Avery et al. en 1944, aunque estos investigadores no pudieron plantear sus intenciones en esos términos. Reinterprete los pioneros y famosos experimentos de transformación genética de la era preingeniería genética usando las herramientas conceptuales actuales, indicando: las características genéticas de las dos cepas en cuestión las condiciones de calentamiento para matar a las bacterias virulentas un mecanismo posible de la transformación genética de la que Griffith y Avery fueron testigos. ¿Habrá sido alta o baja la eficiencia de transformación de las no virulentas? 18 2) Tomado y modificado del libro Molecular Biotechnology de Glick BR & Pasternak JJ. ASM Press. La ingeniería genética o tecnología del DNA recombinante no sería posible sin una larga colección de enzimas de restricción originarias de los más diversos microorganismos. Para evitar el manejo de diferentes condiciones óptimas de cultivo, las empresas que las comercializan históricamente han clonado los genes de estas enzimas en E. coli. Por ejemplo, a continuación reproducimos dos protocolos alternativos que se han usado para disponer industrialmente de clones productores de la enzima Pst I de Providencia stuartii : Protocolo I : 1. Extraer DNA cromosómico de P. stuartii y cortarlo con una pequeña cantidad de Msp I (tubo 1) 2. Cortar plásmido Bluescript con Cla I (tubo 2) 3. Mezclar tubos 1 y 2 junto con ligasa (tubo 3) 4. Transformar una cepa de E. coli (RecA- ; Eco RI nucleasa- y metilasa- ; βgal-) con el contenido de tubo 3 5. Incubar en medio líquido en presencia de ampicilina 6. Agregar fago λ mutado en el gen del represor o en el operador (fago lítico) proveniente de un lisado de E. coli de la misma cepa 7. Plaquear en medio sólido que contiene ampicilina, IPTG y X-gal 8. Observar las colonias 9. Hacer cultivos líquidos a partir de cualquiera de las colonias 10. Centrifugar y resuspender las bacterias en medio hipotónico (shock osmótico) 11. Centrifugar y recuperar el sobrenadante Preguntas sobre el protocolo I a) ¿Por qué se usa Msp I para cortar el DNA bacteriano y no Cla I ? (buscar las secuencias de reconocimiento para responder) b) ¿Qué contiene el tubo 3? c) ¿En qué consiste el screening de los clones de interés? ¿Para qué se puso fago λ* ? d) ¿Ud. esperaría que la mayoría de las colonias fueran blancas o azules en el paso 8? *aclaración: la replicación de λ lítico por círculo rodante no ocurre inmediatamente al ingresar a la bacteria porque antes deben transcribirse parte de sus genes involucrados en replicación. pregunta bonus: ¿cómo averiguaría si la mutación del λ lítico usado se encuentra en el gen de la proteína represora o en el operador al cual ella se une en trans? Protocolo II pasos 1-5. Igual que en protocolo I 6. Aislar (totalidad de) plásmidos y tratarlos in vitro con Pst I (tubo 6) 7. Transformar E. coli (RecA- ; Eco RI nucleasa- ; metilasa- ; β-gal-) con el contenido de tubo 6 8. Plaquear en medio sólido que contiene ampicilina, IPTG y X-gal 9. Recuperar las colonias 10-12. Igual que 9-11 de Protocolo I Preguntas sobre protocolo II f) ¿En qué consiste el screening de los clones de interés? Sabiendo que sólo los plásmidos intactos generan transformantes, ¿cuál es el objeto del tratamiento con Pst I in vitro? ¿Qué otro gen, cuyo producto es activo solamente durante replicación in vivo y relacionado funcionalmente al gen de la endonucleasa de restricción, tuvo que estar presente para explicar la viabilidad de las bacterias? g) Casi todos los clones obtenidos presentaron actividad de endonucleasa de restricción in vitro ¿Qué tipo de organización genómica esperaría Ud. con respecto a los dos genes mencionados en f)? 19 3) Se ha clonado un gen de ratón pero no se tiene la más remota idea de su función bioquímica (es decir, qué clase de proteína codifica) debido a que la búsqueda mediante BLAST de secuencias homólogas ingresadas a GenBank reveló que los genes reconocidos como ortólogos tampoco tienen función conocida asociada. Dichas secuencias ortólogas se hallaron exclusivamente en metazoos pero no en levaduras. Por último, tampoco se sabe su función fisiológica dado que su knock-out en ratones resultó letal embrionario. Para intentar averiguar su función bioquímica, se transformaron levaduras haploides S. Pombe con ese gen colocado en un vector plasmídico de expresión para levaduras que tiene dos particularidades: i) es de muy bajo número de copias y tiende a perderse si no existe presión de selección. ii) confiere color rojo a las colonias (porque complementa una mutación en levaduras dobles mutantes auxótrofas y así permite que se acumule una sustancia intermediaria en la biosíntesis de adenina, de color rojo). Las levaduras transformadas fueron mutagenizadas con UV y al plaquearlas en ausencia de presión de selección para el vector, se vio que todas las colonias eran blancas, excepto una que permaneció roja. Cuando ese clon rojo fue trasformado con una library de cDNA de levaduras (construida en un vector convencional), generó colonias todas de color rojo, excepto una blanca. Al secuenciar el inserto de la colonia blanca, se vio que su secuencia correspondía a una glicosiltransferasa de proteínas desnaturalizadas, las cuales, al actuar como sustrato de chaperonas, se pueden plegar correctamente. a) En base a los resultados, ¿cuál es la función bioquímica de ese gen de ratón? b) ¿Cree que el gen de esa glicosil-transferasa es esencial en levaduras? ¿Qué genotipo (cromosómico) tienen las levaduras de la colonia roja inicial? c) ¿Hubiera sido conveniente invertir el orden de las etapas del protocolo experimental, es decir primero mutagenizar y después transformar con el plásmido? Esta ingeniosa estrategia, basada en complementación funcional y llamada de los “letales sintéticos” (Kranz y Holm [1990] PNAS 87: 6629), también sirve para identificar “interacciones génicas” en levaduras, por ejemplo, genes distintos que puedan suplantarse mutuamente si uno de los dos falla, pero que causen letalidad si ambos tienen una mutación deletérea simultáneamente. Teniendo clonado uno de ellos, ¿se le ocurre cómo hacer para clonar el segundo? Nota: actualmente se están detectando interacciones génicas en levaduras a escala genómica (http://www.ncbi.nlm.nih.gov/pubmed/25213244) 20 4) basado en Shih & Weinberg (1982): “Isolation of a transforming sequence from a human bladder carcinoma cell line”. Cell 29: 161-169. El primer clonado de un oncogen humano fue realizado por Robert Weinberg en 1982 a partir de un tumor de vejiga, usando una estrategia de complementación funcional y aprovechando el conocimiento sobre la existencia de las secuencias Alu características del genoma humano. ¿Cómo habrá hecho R. Weinberg para clonar el oncogen, teniendo en cuenta que en esa época ya se contaba con: i) técnicas de cultivo de células de mamíferos ii) técnicas de purificación de DNA total iii) técnicas de transfección de células con DNA total purificado (fragmentado) iv) experiencia en identificación de colonias (“foci”) con fenotipo tumoral v) vectores de clonado que se replican en procariotas vi) técnicas de marcación de sondas para screening de genotecas pero no se contaba con: i) vectores de clonado que se replican en eucariotas ii) la técnica de PCR iii) la secuencia del genoma humano 5) basado en Guo et al y Yusa et al, Nature (2004) 429:891-895 y 896-899. El síndrome de Bloom en humanos resulta de mutaciones en un gen de DNA helicasa que normalmente impide que ocurra recombinación entre cromosomas homólogos ya duplicados durante mitosis (β cual causaría que un. Las células somáticas de pacientes con este síndrome (o células de personas normales pero knockout homocigotas en este gen) se aprovechan para clonar genes mediante complementación funcional. ¿Por qué no es útil generar mutaciones en células de personas normales para luego hacer complementación funcional? ¿En qué reside la ventaja de las células de pacientes de Bloom? -----------------------------------------------------------------------------------------------------------------Para reflexionar: ¿En qué casos se puede hacer clonado por complementación génica y por qué? ¿Qué alternativas existen cuando ésta no es aplicable? 21 Transposon tagging 6) basado en Mintz (2004) Microbiology 150(Pt 8):2677-88. Actinobacillus actinomycetemcomitans es una bacteria de gran interés odontológico porque es el agente causal de enfermedades periodontales, entendiendo por éstas a un conjunto de procesos inflamatorios que afectan los tejidos de soporte del diente -encía y hueso-, que si no se tratan a tiempo pueden llevar a la pérdida de piezas dentales. Este patógeno tiene particular predilección por la boca de los vertebrados mamíferos, no es un parásito intracelular y coloniza el tejido conectivo vecino a la dentadura porque tiene la propiedad de adherirse con mucha afinidad a colágeno y fibronectina. No se ha completado aún ningún Proyecto Genoma (determinación de secuencia de genoma completo) para esta bacteria. Los autores del trabajo citado utilizaron la estrategia de mutagénesis con transposones para identificar los genes de patogenicidad de esta bacteria. a) Dibuje un esquema de una posible construcción, útil para transformar a las bacterias y mutagenizarlas por inserción de un transposón. b) El autor obtuvo 2.000 diferentes mutantes insercionales ¿Considera Ud. que esta colección de mutantes es lo suficientemente amplia como para encontrar la mayoría de los genes responsables de la patogenicidad de Actinobacillus actinomycetemcomitans ? c) Diseñe un procedimiento in vitro (sin ratones) y otro in vivo (con ratones) para intentar identificar los clones bacterianos mutados en genes de patogenicidad (que evite tener que analizar uno por uno, lo cual sería muy engorroso). d) Una vez hallados los clones de interés, ¿qué estrategia metodológica elegiría Ud. para identificar los genes del patógeno responsables de enfermedades periodontales? ¿De qué manera podría Ud. llegar a tener información preliminar sobre la función bioquímica de esos genes? e) ¿Cree Ud. que los autores pudieron haber clasificado a genes del metabolismo esenciales de la bacteria como responsables de enfermedades periodontales? Datos útiles: Tamaño de genoma de Actinobacillus actinomycetemcomitans: 2.3 Mb Tamaño promedio de un gen de Actinobacillus actinomycetemcomitans: 1.0 Kb ----------------------------------------------------------------------------------------------------------------------7) basado en los trabajos de enhancer trapping del controvertido Walter Gehring (Halder et al. [1995] Science 267: 1788-1792). Uno de los objetivos de Gehring era clonar un gen (o al menos su enhancer) del desarrollo que se expresa en los “discos imaginales” de la larva y que determina la formación de las alas propias del adulto. Estos son los experimentos que hizo para lograrlo: Se generaron muchos individuos de Drosophila melanogaster transgénicos, mediante los elementos transposonibles P, para construir una extensa colección (library) de moscas viables que tenían el cDNA Gal4 (un factor de transcripción de levaduras) bajo un promotor mínimo (débil) de mosca. Estas moscas fueron llamadas “Gal4”. Por otro lado, se disponía de moscas transgénicas que tenían el cDNA “ey” de mosca (gen homeótico 22 que supuestamente determina la formación de los ojos) bajo las órdenes de un promotor débil de mosca, todo río abajo del enhancer UAS de levaduras, al cual se le une Gal4. Estas moscas eran fenotípicamente normales y fueron llamadas “ey”. En un alarde de virtuosismo genético y molecular, Gehring cruzó cada una de las miles de moscas Gal4 de fenotipo normal con una mosca diferente del grupo “ey”. Se centró la atención en una de las moscas Gal4, llamada Gal4-63, la cual, cuando fue cruzada con una “ey”, generó una progenie en la cual el 25% de los individuos presentaba un fenotipo monstruo: ojos en las alas! a) ¿Cómo explica este resultado? ¿le parece que Gehring logró su objetivo inicial de identificar regiones genómicas responsables del desarrollo de las alas? b) Antes de este trabajo, este objetivo pudo haberse intentado mediante transposon tagging convencional para detectar pérdida de función. En este caso, habría consistido en buscar individuos sin alas en la library de moscas mutantes o en su progenie. ¿Qué ventajas presentó la estrategia de Gehring respecto de la estrategia convencional? c) ¿Podría haberse usado la secuencia codificante de un gen reporter convencional (p. ej. ß-gal o GFP) en lugar del gen homeótico “ey”? 23 Clonado posicional 8) basado en Shapiro/Marks, Nature (2004) 428, 717-723 La pérdida de extremidades ha ocurrido en diversas líneas evolutivas de los vertebrados. En los reptiles, por ejemplo, se sabe que las serpientes evolucionaron a partir de ancestros con cuatro patas. Lo mismo ocurrió en los mamíferos, donde los cetáceos (ballenas, delfines y orcas) provienen de ancestros cuadrúpedos. En los peces en general, los dos pares de aletas (anteriores y posteriores) son los equivalentes de las patas de los otros vertebrados. En los espinosos marinos, el par de aletas posteriores (llamadas también aletas pélvicas) se presenta como dos espinas punzantes. Sin embargo, los espinosos de agua dulce carecen de las dos espinas pélvicas. En este contexto, resulta interesante conocer el gen o los genes responsables de tales diferencias anatómicas. Un modelo biológico muy valioso para estudiar esta cuestión lo constituyen los “espinosos”, que son peces de la especie Gasterosteus aculeatus, de la cual hay dos poblaciones bien estudiadas: los marinos y los de agua dulce, que se pueden cruzar entre sí. a) Qué estrategia habrán usado los autores para identificar al gen responsable de la diferencia anatómica? ¿De qué hábitats habrán pescado los animales que usaron? ¿Habrán usado solamente los que pescaron (parentales) o también su descendencia F1 o F2? ¿Habrán necesitado marcadores moleculares que detectan polimorfismos en el genoma? ¿Habrán necesitado secuenciar DNA o tener datos previos de secuencia? ¿Habrán necesitado obtener datos de frecuencia de recombinación entre el marcador y (el gen buscado responsable de) fenotipo relacionado con el desarrollo de las espinas? Los autores finalmente identificaron un gen candidato responsable. Se trata de Pitx1, que codifica una proteína que tiene un dominio homeótico en el medio. Sus regiones codificantes resultaron idénticas en ambas poblaciones parentales. Pitx1 se expresa en la pelvis de las larvas de espinosos marinos pero no en los de agua dulce. b) ¿En qué región del gen podría estar la/s sustitución/es nucleotídica/s en el gen Pitx1 que podría/n haber causado la pérdida de espinas en los espinosos de agua dulce? c) Si se comprobara que ninguna región del gen Pitx1 es diferente entre ambas poblaciones, ¿en qué otro gen podría haber diferencias y así explicar la pérdida de espinas? d) En cualquier caso, ¿la mutación en los peces de agua dulce será dominante o recesiva? Qué fenotipo tendrán todos los individuos F1? e) En ratones existe un ortólogo de Pitx1, que se expresa en la región pélvica del embrión. El knockout homocigota de este gen produce reducción del tamaño de las patas posteriores. ¿Este dato robustece o debilita la conclusión sobre la función de Pixt1 en peces? f) La presencia de espinas pélvicas en los espinosos marinos parece ser una adaptación defensiva contra peces predadores de estructuras bucales blandas (que no existen en agua dulce). Por otra parte, la ausencia de espinas pélvicas en los de agua dulce parece ser una adaptación defensiva contra invertebrados predadores en ese hábitat, capaces de atrapar más eficientemente a los espinosos con espinas pélvicas, agarrándose de las mismas. ¿Las siguientes afirmaciones son verdaderas o falsas?: g) El origen de la mutación que causó la desaparición de las espinas pélvicas fue un hecho independiente de la presencia de invertebrados predadores en agua dulce. h) La mutación que causó la desaparición de las espinas pélvicas tuvo valor adaptativo neutro en ambientes marinos. i) La mutación que causó la desaparición de las espinas pélvicas tuvo valor adaptativo positivo en ambientes de agua dulce. 24 ---------------------------------------------------------------------------------------------------------------------25 9) inspirado en el paper de Zhang et al., Nature (1994) 372:425. La obesidad es un trastorno nutricional frecuente en los países occidentales. Si bien se considera que está asociada a hábitos culturales muy recientes, hay registros de obesidad bastante lejanos en el tiempo (basta mirar las pinturas que retratan a Enrique VIII, ese que mandó degollar a varias de sus esposas). El peso corporal incrementado es un problema de salud importante porque está relacionado a enfermedades tales como diabetes e hipertensión. Los mecanismos moleculares que controlan el tamaño y distribución de los depósitos de grasas son desconocidos. Con el objeto de llegar a conocerlos, se pretende clonar el gen de la obesidad en humanos y en especial estudiar su alelo mutado, el cual se supone que es recesivo. Para ello suponga que se analizaron tres familias que incluían algunos de sus integrantes obesos. A cada individuo (todos adultos) se le determinó el genotipo relativo a tres marcadores moleculares no codificantes 1/I, 2/II y 3/III, nomenclatura donde cada número arábigo o romano (que no tienen nada que ver con dominancia o recesividad) representa un cierto “haplotipo”, es decir, una combinación particular de varios RFLP. Se obtuvieron los siguientes resultados: 73 1/I 2/II 3/3 103 1/1 2/II 3/III 58 1/I II/II 3/III 59 1/I 2/II 3/III 99 1/1 2/II 3/III 75 I/I 2/2 3/III 121 1/1 2/II 3/3 77 1/I 2/II 3/3 55 1/I 2/II 3/III 47 1/I 2/II 3/III 97 1/1 2/II 3/III 104 1/1 II/II 3/3 67 1/I 2/2 3/3 74 61 1/I 2/II 3/III 94 I/I II/II III/III 59 1/I 2/II 3/III 76 1/I II/II 3/III 81 80 1/1 1/I 2/II 2/II III/III 3/3 112 I/I 2/2 3/III Los números indican el peso en kg de cada persona. Suponga que la altura es 1.75 m para los varones y 1.65 m para las mujeres a) ¿Qué marcador molecular usaría como punto de partida para un caminado cromosómico? b) ¿Es necesario el uso de una genoteca para hacer el caminado cromosómico? Habiendo usado el marcador respondido en a) para un caminado a lo largo de 200 kb, Ud. llega a identificar dos regiones genómicas: I y II, que comparten un 80 % de identidad de secuencia y ambas con un marco abierto de lectura (ORF) de 4.2 kb con potencial codificante para un proteína con péptido señal de inserción a membranas. Usadas como sondas en zooblots de DNA, Ud. obtiene: 26 Por otra parte, buscando homología con ESTs (expressed sequence tags) de distintos tejidos humanos, disponibles en bases de datos, Ud. encuentra: hígado tejido adiposo páncreas testículo corazón intestino región I + región II - c) ¿Cuál región en principio puede ser considerada candidata para contener el gen buscado? ¿La I o la II? d) ¿A qué puede corresponder el ORF no elegido por Ud.? e) El análisis posterior reveló una mutación del tipo CT dentro del gen candidato en las personas con sobrepeso analizadas. Ahora suponga que quiere extender estas conclusiones a nivel de toda la población ¿Qué resultado entre los siguientes a debería hallarse indefectiblemente para asegurar que esa mutación es en efecto responsable de un fenotipo obeso? i) ningún individuo de peso normal en la población tiene esa mutación en ambos alelos. ii) todos los individuos con sobrepeso en la población tienen esa mutación en ambos alelos. 27 10) La hiperlipidemia familar es una enfermedad humana que se caracteriza por niveles aumentados de lípidos (colesterol y triglicéridos [TG]) en sangre, que predisponen a eventos riesgosos de ateroesclerosis en arterias coronarias. Como modelo de esta enfermedad se suelen usar ratones de la cepa mutante (espontánea) HcB19 cuyas características fenotípicas son una respiración más lenta y elevados niveles de TG en sangre. Como se quiere identificar el gen involucrado pero no hay disponibilidad de familias humanas numerosas afectadas para su análisis, se decidió cruzar estos ratones HcB19 con ratones CAST/Ei (normales en cuanto a sus lípidos). Mediante PCR se analizaron microsatélites polimórficos como marcadores, que exhiben diferencias entre las dos cepas parentales en el número de unidades repetidas. Como por experimentos con células somáticas híbridas se sospechaba que el gen buscado reside en el cromosoma 3 de ratón, se acotó el uso de marcadores a los de la serie D3, los cuales mapean en una zona del cromosoma 3. La siguiente tabla muestra el análisis de los animales parentales: Genotipo D3Mit1 (# repeats) Genotipo D3Mit7 (# repeats) Genotipo D3Mit12 (# repeats) Genotipo D3Mit41 (# repeats) Fenotipo TG (mg/ml) HcB19 20 4 5 6 > 320 CAST/Ei 20 18 16 14 < 40 aclaración: mínimas variaciones de # repeats intra-cepa no se indican De la cruza HcB19 x CAST/Ei, se generaron 2.700 ratones F2, mantenidos en un gran bioterio. La siguiente tabla resume los resultados de las combinaciones de fenotipo y genotipo encontradas en los individuos F2 homocigotas (tanto para marcador polimórfico como para niveles de TG) solamente. Microsat. D3Mit7 D3Mit12 D3Mit41 # repeats 4 4 18 18 5 5 16 16 6 6 14 14 Niveles de TG >320 <40 >320 <40 >320 <40 <40 >320 >320 <40 <40 >320 # ratones 167 173 170 162 660 18 662 16 679 1 677 2 a) Qué marcador elegiría para el caminado cromosómico? b) (como “tarea para el hogar”) Aprovechando el marcador respondido en a) y las bases de datos públicas de cromosomas y genes en Internet posibles gracias a la concreción de Proyectos Genoma (www.ncbi.nlm.nih.gov), identifique un gen candidato cuyas mutaciones serían responsables de la hiperlipidemia familiar en humanos. Ayuda: los ácidos grasos de los TG se metabolizan (oxidan) requiriendo reacciones redox. 28 Expresión diferencial 11) ¿Qué estrategia (que no sea mediante la moderna secuenciación “high throughput” de RNA que vamos a ver más adelante) seguiría para identificar genes en especies cuyo genoma no está secuenciado que respondan a las siguientes situaciones?: i) inducidos por frío en plantas ii) cuya expresión oscila a lo largo del día en insectos iii) que se van encendiendo gradualmente durante el desarrollo del embrión temprano de un mamífero iv) activados (directamente o indirectamente) por un factor de transcripción conocido en células de mamífero en cultivo a) Indique un procedimiento que involucre amplificación in vivo (en bacterias) y otro que involucre su amplificación in vitro (PCR) de secuencias originadas a partir de transcriptos. b) Si la extracción de RNA resultara metodológicamente muy complicada en algún caso, ¿qué otra alternativa existe para cumplir el objetivo deseado? 29 Búsqueda de función de genes conocidos (Knockout, Knockin) 30 Un grupo de investigadores suecos (Trifunovic et al, Nature 2004) interesados en la relación entre mutaciones acumuladas en el genoma mitocondrial y el proceso de envejecimiento lograron un ratón knockin reemplazando el gen nuclear de la DNA Polimerasa mitocondrial por una versión mutada puntualmente en el exón 3, que corresponde al dominio de su actividad proofreading (de manera de preservar intacto el dominio con actividad polimerasa propiamente dicha). Ellos lo hicieron usando la tecnología tradicional seleccionando stem cells en cultivo y manipulando embriones quimera, pero hoy seguramente lo hubieran hecho mediante la estrategia llamada CRISPR esquematizada en el dibujo de abajo. a) ¿Qué actividad tiene Cas9? b) Señale en el dibujo la parte del RNA variable diseñada “a medida”. c) ¿Qué DNA involucrado en el experimento falta en el dibujo? Agréguelo. d) ¿Qué proceso enzimático endógeno debe ocurrir para garantizar el reemplazo génico y qué fue lo que lo activó? e) ¿Es absolutamente necesario, eligiendo CRISPR, pasar por animales quimera para lograr el knock-in deseado? ¿Por qué? f) ¿Es posible mediante esta estrategia generar ratones homocigotas para la mutación mencionada sin necesidad de hacer cruzas? ¿Por qué? 31 Genómica Análisis globales de los genomas (genome-wide) Proyectos Genoma 32 Análisis globales de los genomas. Genómica. Microarrays 1) A mediados de los 1980’s, Walter Gilbert (premio Nobel 1980) estimó el número de genes humanos en 100.000 basándose en el tamaño de un gen típico (aprox. 3 x 104 bp) y el tamaño del genoma (3 x 109 bp). Quince años más tarde, análisis computacionales confiables que formaron parte del Proyecto Genoma Humano fueron capaces de predecir la existencia de 16.000 “nuevos” genes con potencial codificante de proteínas, los cuales sumados a los 15.000 ya conocidos, dio un total estimado de 31.000. ¿Cuál fue el error de Walter Gilbert en sus cálculos? ¿Estaba realmente tan errado? Aclaración: actualmente se estima que el número de genes humanos es alrededor de 32.400, incluyendo noncoding RNA, y más de 14.000 pseudogenes (Pertea & Salzberg, Genome Biology 2010, 11:206). 2) Tanto como el 20% del genoma humano contiene elementos LINE cuyo tamaño es 6.0 kb, la mayoría de los cuales son inactivos debido a mutaciones o silenciamiento. ¿Cuántas copias (aproximadamente) de LINEs hay en el genoma humano? 3) a) Usando el valor de reloj molecular para DNA nuclear en primates indicado en esta Guía (pág. 9), estime el número máximo de posiciones nucleotídicas diferentes (SNPs) que puede haber entre los genomas nucleares de dos personas cualesquiera (pero no emparentadas directamente). Además, exprese el resultado en % de identidad entre ambos genomas (ej. 99.0% o 99.5% o 99.9% o 99.95%, etc.). dato: el Homo sapiens “moderno” se originó (en Africa) hace 200.000 años. b) ¿Existe actualmente alguna tecnología posible para comprobar en forma rápida su respuesta anterior experimentalmente? ¿Cuál? (no se preocupe por el costo). 4) inspirado en Xue et al, Curr. Biol. (2009) Los Licenciados en Biología (UBA) Juan Urquiza y Luis Urquiza, que han cursado exitosamente Genética Molecular, sospechan que son primos lejanos descendientes directos por vía paterna del General Justo José de Urquiza (1801-1870), primer presidente constitucional de los argentinos, que se sabe dejó una numerosa descendencia….. Ambos recurrieron a una unidad de secuenciación profunda en un instituto del Conicet y, seducidos por una tentadora “promo 2 x1”, sometieron muestras de sangre con sus respectivos DNA a pirosecuenciación por quimioluminiscencia en un equipo 454 de Life Sciences. Luego de obtener las lecturas, el experto en bioinformática del instituto analizó solamente la secuencia de sus cromosomas “Y” (tamaño 30 Mb) para no complicarse con sucesivos aportes genómicos maternos, asumiendo que la tasa de cambios en ese cromosoma es igual que en los demás. El resultado arrojó 12 diferencias nucleotídicas entre ellos. a) (10 ptos) ¿Qué propiedad tiene el moderno equipo que lo hace apto para lograr la necesaria separación clonal de los fragmentos amplificados de la library a ser secuenciados? b) (15 ptos) ¿Juan y Luis son parientes lejanos o no? Justifique su respuesta en base a los datos del problema 1d de la Guía de Problemas (pág. 11) y al resultado que se hubiera esperado en el caso contrario a su respuesta. Muestre los cálculos estimativos. 33 Análisis globales de los genomas. Genómica. Microarrays Novedades técnicas en los últimos años (tomado de Wikipedia): Secuenciación de DNA de última generación o high throughput: Ion Semiconductor Sequencing is a method of DNA sequencing based on the detection of hydrogen ions that are released during the polymerization of DNA. This is a method of "sequencing by synthesis", during which a complementary strand is built based on the sequence of a template stand. A microwell containing a template DNA strand to be sequenced is flooded with a single species of deoxyribonucleotide triphosphate (dNTP). If the introduced dNTP is complementary to the leading template nucleotide, it is incorporated into the growing complementary strand. This causes the release of a hydrogen ion that triggers an ISFET ion sensor, which indicates that a reaction has occurred. If homopolymer repeats are present in the template sequence, multiple dNTP molecules will be incorporated in a single cycle. This leads to a corresponding number of released hydrogens and a proportionally higher electronic signal. This technology differs from other sequencing technologies in that no modified nucleotides or optics are used. Ion semiconductor sequencing may also be referred to as ion torrent sequencing, pH-mediated sequencing, silicon sequencing, or semiconductor sequencing. The technology was licensed from DNA Electronics Ltd, developed by Ion Torrent Systems Inc. and was released in February 2010. Ion Torrent have marketed their machine as a rapid, compact and economical sequencer that can be utilized in a large number of laboratories as a bench top machine. Roche's 454 Life Sciences is partnering with DNA Electronics on the development of a long-read, high-density semiconductor sequencing platform using this technology. Technology The incorporation of deoxyribonucleotide Triphosphate into a growing DNA strand causes the release of hydrogen and pyrophosphate. The release of hydrogen ions indicate if zero, one or more nucleotides were incorporated. Released hydrogens ions are detected by an ion sensor. Multiple incorporations lead to a corresponding number of released hydrogens and intensity of signal. Sequencing Chemistry In nature, the incorporation of a deoxyribonucleotide triphophate (dNTP) into a growing DNA strand involves the formation of a covalent bond and the release of pyrophosphate and a positively charged hydrogen ion. A dNTP will only be incorporated if it is complementary to the leading unpaired template nucleotide. Ion semiconductor sequencing exploits these facts by determining if a hydrogen ion is released upon providing a single species of dNTP to the reaction. Microwells on a semiconductor chip that each contain one single-stranded template DNA molecule to be sequenced and one DNA polymerase are sequentially flooded with unmodified A, C, G or T dNTP. If an introduced dNTP is complementary to the next unpaired nucleotide on the template strand it is incorporated into the growing complementary strand by the DNA polymerase.[9] If the introduced dNTP is not complementary there is no incorporation and no biochemical reaction. The hydrogen ion that is released in the reaction changes the pH of the solution, which is detected by an ISFET. The unattached dNTP molecules are washed out before the next cycle when a different dNTP species is introduced. Signal Detection Beneath the layer of microwells is an ion sensitive layer, below which is an ISFET ion sensor. All layers are contained within a CMOS semiconductor chip, similar to that used in the electronics industry. 34 Análisis globales de los genomas. Genómica. Microarrays Each chip contains an array of microwells with corresponding ISFET detectors. Each released hydrogen ion then triggers the ISFET ion sensor. The series of electrical pulses transmitted from the chip to a computer is translated into a DNA sequence, with no intermediate signal conversion required —meaning, because nucleotide incorporation events are measured directly by electronics, the use of labeled nucleotides and optical measurements are avoided. Signal processing and DNA assembly can then be carried out in software. Comparison to other sequencing methods: Ion Torrent 454 Sequencing Illumina SOLiD Sequencing Chemistry Ion semiconductor sequencing Pyrosequencing Ligation-based sequencing Amplification approach Mb per run Time per run Read length Cost per run Cost per Mb Cost per instrument Emulsion PCR Emulsion PCR 100 1.5 hours 200 bp $ 350 USD $ 5.00 USD $ 50,000 USD 100 7 hours 400 bp $ 8,438 USD $ 84.39 USD $ 500,000 USD Polymerase-based sequence-bysynthesis Bridge amplification 600,000 9 days 2x150 bp $ 20,000 USD $ 0.03 USD $ 600,000 USD Emulsion PCR 170,000 9 days 35x75 bp $ 4,000 USD $ 0.04 USD $ 595,000 USD Table 1. Comparing metrics and performance of next-generation DNA sequencers. Pyrosequencing is a method of DNA sequencing (determining the order of nucleotides in DNA) based on the "sequencing by synthesis" principle. It differs from Sanger sequencing, relying on the detection of pyrophosphate release on nucleotide incorporation, rather than chain termination with dideoxynucleotides.[1] The technique was developed by Pål Nyrén and his student Mostafa Ronaghi at the Royal Institute of Technology in Stockholm in 1996.[2][3][4] "Sequencing by synthesis" involves taking a single strand of the DNA to be sequenced and then synthesizing its complementary strand enzymatically. The Pyrosequencing method is based on detecting the activity of DNA polymerase (a DNA synthesizing enzyme) with another chemiluminescent enzyme. Essentially, the method allows sequencing of a single strand of DNA by synthesizing the complementary strand along it, one base pair at a time, and detecting which base was actually added at each step. The template DNA is immobilized, and solutions of A, C, G, and T nucleotides are added and removed after the reaction, sequentially. Light is produced only when the nucleotide solution complements the first unpaired base of the template. The sequence of solutions which produce chemiluminescent signals allows the determination of the sequence of the template. ssDNA template is hybridized to a sequencing primer and incubated with the enzymes DNA polymerase, ATP sulfurylase, luciferase and apyrase, and with the substrates adenosine 5´ phosphosulfate (APS) and luciferin. 1. The addition of one of the four deoxynucleotide triphosphates (dNTPs)(in the case of dATP we add dATPαS which is not a substrate for a luciferase) initiates the second step. DNA polymerase incorporates the correct, complementary dNTPs onto the template. This incorporation releases pyrophosphate (PPi) stoichiometrically. 2. ATP sulfurylase quantitatively converts PPi to ATP in the presence of adenosine 5´ phosphosulfate. This ATP acts as fuel to the luciferase-mediated conversion of luciferin to oxyluciferin that generates visible light in amounts that are proportional to the amount of ATP. The light produced in the luciferase-catalyzed reaction is detected by a camera and analyzed in a program. 3. Unincorporated nucleotides and ATP are degraded by the apyrase, and the reaction can restart with another nucleotide. 35 Análisis globales de los genomas. Genómica. Microarrays Currently, a limitation of the method is that the lengths of individual reads of DNA sequence are in the neighborhood of 300-500 nucleotides, shorter than the 800-1000 obtainable with chain termination methods (e.g. Sanger sequencing). This can make the process of genome assembly more difficult, particularly for sequence containing a large amount of repetitive DNA. As of 2007, pyrosequencing is most commonly used for resequencing or sequencing of genomes for which the sequence of a close relative is already available. The templates for pyrosequencing can be made both by solid phase template preparation (Streptavidin coated magnetic beads) and enzymatic template preparation (Apyrase + Exonuclease). El tipo de instrumental necesario: p. ej. el “454 GS FLX platform” fabricado por Life Sciences (usado para Proyectos Genomas recientes: de especies vegetales con propiedades medicinales, del oso Panda, del gusano de la seda y del hombre de Neanderthal) The complete sequencing workflow of the GS FLX and GS Junior Systems comprise of four main steps, leading from purified DNA to analyzed results. These basic steps include: Generation of a single-stranded template DNA library 2) Emulsion-based clonal amplification of the library 3) Data generation via sequencing-by-synthesis 1) Figure 1: Sequencing reaction of the Genome Sequencer System. Millions of copies of a single clonal fragment are contained on each DNA Capture Bead. 36 Análisis globales de los genomas. Genómica. Microarrays Equipamiento: Image Processing The Genome Sequencer System software tracks the location of DNA carrying beads on a XY axis. Each bead corresponds to a XY-coordinate on a series of images. The signal intensity per nucleotide flow is recorded for each bead over time and is plotted to generate a flowgram. Each 10-hour sequencing run with the GS FLX Titanium series will typically produce over 1,000,000 flowgrams, one flowgram per read, while each 10-hour sequencing run with the GS Junior Titanium series will produce approximately 100,000 flowgrams (Figure 2). Figure 2: Genome Sequencer System Image processing overview. 4) Data analysis using different bioinformatics tools 37 Análisis globales de los genomas. Genómica. Microarrays Explicación de los sucesivos pasos más en detalle Sample Input and Fragmentation The GS FLX and GS Junior Systems support the sequencing of samples from a wide variety of starting materials including genomic DNA, PCR products, BACs, and cDNA. Samples such as genomic DNA and BACs are fractionated into small, 300- to 800-basepair fragments. For smaller samples, such as small non-coding RNA or PCR amplicons, fragmentation is not required. Instead, short PCR products amplified using Genome Sequencer fusion primers can be used for immobilization onto DNA capture beads as shown below under "One Fragment = One Bead". The GS FLX and GS Junior Systems support multiple sample prep options. Library Preparation Using a series of standard molecular biology techniques, short adaptors (A and B) - specific for both the 3' and 5' ends - are added to each fragment. The adaptors are used for purification, amplification, and sequencing steps. Single-stranded fragments with A and B adaptors compose the sample library used for subsequent workflow steps. One Fragment = One Bead The single-stranded DNA library is immobilized onto specifically designed DNA Capture Beads. Each bead carries a unique single-stranded DNA library fragment. The bead-bound library is emulsified with amplification reagents in a water-in-oil mixture resulting in microreactors containing just one bead with one unique sample-library fragment. emPCR (Emulsion PCR) Amplification Each unique sample library fragment is amplified within its own microreactor, excluding competing or contaminating sequences. Amplification of the entire fragment collection is done in parallel; for each fragment, this results in a copy number of several million per bead. Subsequently, the emulsion PCR is broken while the amplified fragments remain bound to their specific beads. One Bead = One Read The clonally amplified fragments are enriched manually or using the REM e System for liquid handling workstations. The fragments are then ready for loading onto a PicoTiterPlate device for sequencing. The diameter of the PicoTiterPlate wells allows for only one bead per well. After addition of sequencing enzymes, the fluidics subsystem of the sequencing instrument flows individual nucleotides in a fixed order across the hundreds of thousands of wells containing one bead each. Addition of one (or more) nucleotide(s) complementary to the template strand results in a chemiluminescent signal recorded by the CCD camera within the instrument. For a detailed explanation of this reaction see Sequencing Chemistry. Data Analysis The combination of signal intensity and positional information generated across the PicoTiterPlate device allows the software to determine the sequence of more than 1,000,000 individual reads with the GS FLX System and 100,000 individual reads with the GS Junior System, per 10hour instrument run. For sequencing-data analysis, three different bioinformatics tools are available supporting the following applications: de novo assembly up to 400 megabases; resequencing genomes of any size; and amplicon variant detection by comparison with a known reference sequence. 38 Análisis globales de los genomas. Genómica. Microarrays 5) basado en los trabajos del grupo de Craig Venter (2010) Science 329(5987):52-6. La Genómica “moderna” comenzó en la década de los 1990s, pródiga en Proyectos Genoma. Por ejemplo, la secuencia del genoma de Mycoplasma genitalium fue determinada en 1997 por el equipo del mediático Craig Venter, utilizando los clásicos BACs. a) ¿Por qué se eligieron BACs y no el plásmido Bluescript como vectores para construir la genoteca? b) Para este proyecto, se decidió no secuenciar los insertos de la genoteca por “caminado cromosómico”. ¿Cómo se hizo entonces? Compare ventajas y desventajas de ambos métodos. Recientemente, la comunidad científica fue asombrada por la noticia –también proveniente de Venter- de reemplazo de genoma (uno natural por otro semi-sintético) en bacterias del género Mycoplasma, elegido por tres razones: i) sus especies exhiben fenotipos muy diferentes entre sí (por ej., morfología de colonias). ii) porque abarca a bacterias sin pared (y por lo tanto fácilmente transformables con DNA foráneo). iii) porque tienen un genoma pequeño, que él compara a un software “liviano”, modificable a voluntad por el investigador, y “ejecutable” por la célula a través de complejos macromoleculares que actuarían como hardware. Las bacterias “semi-sintéticas” fueron generadas ensamblando pequeños módulos de DNA sintético, respetando la secuencia natural de Mycoplasma mycoides, y amplificando el nuevo genoma en levaduras en forma de YAC, antes de introducirlo en Mycoplasma capricolum. c) Para convencer a la comunidad científica de que ocurrió realmente un reemplazo de genomas la estrategia preveía retener el genoma dador y al mismo tiempo deshacerse del genoma original de la bacteria receptora y poder así lograr cambios fenotípicos bien evidentes. ¿Qué “truco” muy usual habrá diseñado Venter para lograrlo? ¿Qué evento genético tuvo que haber descartardo Venter para asegurar que no quedó absolutamente nada de genoma de Mycoplasma capricolum? Aun con ese “truco”, los primeros intentos resultaron infructuosos a menos que las bacterias receptoras fueran previamente transformadas con el siguiente plásmido, en presencia de neomicina. E.R. neoR E.R. ORI sensib dr Esquema de la construcción. Los tres genes indicados tienen su propio promotor. El gen E.R., en este caso interrumpido, normalmente codifica a la enzima de restricción predominante en ambas especies de Mycoplasma. neoR: gen de resistencia a neomicina. sensib dr: gen de sensibilidad a una droga. El plásmido carece de origen de replicación (ORI) a propósito. d) ¿En qué consiste la estrategia salvadora mostrada en la figura? ¿Qué habría ocurrido si Venter se hubiera olvidado de agregar neomicina al cultivo? ¿Por qué habían fracasado los primeros intentos de reemplazo de genoma? e) ¿Cómo habrá hecho Venter para verificar el reemplazo genómico, es decir que el genoma dador (mycoides) estaba presente y el de capricolum no? 39 Análisis globales de los genomas. Genómica. Microarrays 6) basado en Green et al (2010) Science 328:710-22. Los Neanderthal comenzaron a habitar Europa y Asia occidental hace 230.000 años. Co-habitaron con humanos “modernos” durante miles de años hasta que se extinguieron hace 29.000. Estudios de genómica comparativa revelaron que sus genomas nucleares son 99.5% similares entre sí, dato consistente con un ancestro común hace varios cientos de miles de años atrás. Las diferencias genéticas estimadas entre Neanderthals y humanos (en promedio 0.5%) son más que las que hay entre dos humanos cualesquiera entre sí (aprox. 0.1%). Estudios de mtDNA (que evoluciona mucho más rápido que el DNA nuclear) de numerosos individuos Neanderthal y humanos aportaron datos de secuencia de genomas mitocondriales completos relativamente distantes, sugiriendo que no hubo cruza entre ellos, sino gradual reemplazo poblacional (teoría “out of Africa”). Sin embargo, recientemente se publicó un interesante paper (Green et al., 2010) que reporta la secuencia del genoma nuclear entero del hombre de Neanderthal, cuestionando la creencia anterior y argumentando a favor de que los pre-modernos migraron desde Africa hacia Asia y Europa y evolucionaron separadamente para dar lugar a variantes regionales de Homo sapiens (teoría “multiregional”). Los autores de ese trabajo, (entre ellos, el grupo de Svante Pääbo en Leipzig) usaron tres huesos hallados en una cueva de Croacia que datan de aprox. 38.000 años atrás y que no tenían mayor valor morfológico para los paleontólogos. Metodológicamente, el DNA fue extraído de los huesos mediante un torno de dentista en condiciones estériles, fragmentado, los fragmentos ligados a oligonucleótidos adaptadores (generando una “library”), amplificados por PCR y secuenciados por pirosencuenciación. Se compararon las secuencias de Neanderthal con humano moderno europeo, asiático y africano, y con chimpancé. De entre aquellas secuencias no compartidas con chimpancé, se halló un mayor número de posiciones nucleótidicas compartidas entre Neanderthal y humano moderno europeo y asiático, que entre Neanderthal y humano africano. Los autores interpretan estos datos como que hubo flujo génico mediante cruzas entre Neanderthal y humano moderno, desafiando teorías previas vigentes, por lo cual tuvieron que convencer a los antropólogos evolutivos que la metodología usada, pirosecuenciación “profunda”, es confiable. En este contexto, algunas de las dificultades técnicas consistieron en: i) la necesidad de eliminar el abundante DNA bacteriano (mayor a 95%!) que contaminaba a los huesos o si esto no era posible, no considerarlo en el análisis. ii) evitar la contaminación de DNA humano en la preparación de las muestras a secuenciar, por supuesto, y sobre todo, identificar las muestras involuntariamente contaminadas, para descartarlas. iii) tener en cuenta la desaminación espontánea de citosinas, que se sabe es significativa al cabo de miles de años transcurridos, aun en células muertas, generando datos de aparentes sustituciones C → U o C → T, que obviamente no corresponden a genuinas diferencias entre Neanderthal y humano. a) ¿Cree Ud. relevante haber secuenciado el genoma del Neanderthal? ¿Sirve para algo más que para demostrar que es posible secuenciar el de una especie extinta? ¿Se pueden sacar conclusiones claras sobre la evolución de los humanos? b) ¿Cómo cree Ud. que pudieron ser superadas las dificultades técnicas mencionadas? Para reflexionar: ¿Le parece importante que existan Proyectos Genoma? En aquellas especies en que ya se cuenta con un Proyecto Genoma, ¿tiene sentido seguir secuenciando genomas enteros de individuos? por ej.: ¿servirían para estudiar asociación de polimorfismos con enfermedades genéticas en distintas poblaciones humanas? 40 Análisis globales de los genomas. Genómica. Microarrays Análisis globales de los genomas y transcriptomas Genómica y Transcritómica mediante microarrays 41 Análisis globales de los genomas. Genómica. Microarrays Breve introducción teórica: La disponibilidad de un elevado número de secuencias de ácidos nucleicos, posibles ya sea gracias a la información provista por numerosos experimentos de clonado realizados independientemente, o bien gracias a los recientes Proyectos Genoma, ha permitido la fabricación de “microarrays” o “chips” de DNAs, que consisten en oligonucleótidos, clones de cDNA, clones genómicos o productos de amplificación por PCR de regiones genómicas de una especie, ordenadamente depositados en un soporte inerte. Los “microarrays” pueden ser hibridizados con: 1) DNA total de otras especies, para evaluar pronunciadas diferencias a nivel genómico (p. ej. genes muy divergentes o ausentes), o bien DNA total de la misma especie en casos de sospecha de alteraciones genómicas (como número de copia de algunos genes) en determinadas células, p. ej. en cáncer. Esta estrategia se llama hibridización genómica comparativa (abreviada CGH en inglés). 2) cDNA total de determinadas células o tejidos de la misma especie bajo condiciones determinadas (hormonas, transfección con genes exógenos, situaciones de stress, infección por patógenos, etc.). En estos casos, se obtienen datos de transcripción de varios o muchos genes a la vez, llamados “transcriptomas”. Estos, comparados con los obtenidos en condiciones normales o de referencia, son muy útiles para evaluar “patrones de expresión” de una pequeña o gran (dependiendo del número de genes depositados en el “microarray”) fracción del genoma. Esta estrategia se llama genómica funcional. Como la detección se basa en la propiedad de hibridización de los ácidos nucleicos, la tecnología de microarrays tiene las bondades y limitaciones de aquélla. Recordemos que la hibridización permite reconocer moléculas de ácidos nucleicos homólogas (con umbral variable a voluntad del operador) y que depende de la cantidad y calidad (secuencia) de las mismas. En el caso de los microarrays, se permite que la hibridización llegue al equilibrio, no se mide cinética. Las nociones principales de la metodología involucrada en el uso de microarrays están incorporadas en los problemas de ejercitación siguientes. La combinación de esta metodología con la de “Inmunoprecipitación de Cromatina” (ChIP) se verá más adelante en el capítulo de “Cromatina”. 42 Análisis globales de los genomas. Genómica. Microarrays Problemas 1) basado en Cassat et al. J Bacteriol. (2005) 187: 576–592. Con el fin de evaluar diferencias genómicas entre cepas virulentas y no virulentas de Staphylococcus aureus, los autores del paper eligieron la estrategia CGH. Compraron un microarray comercial preparado por la empresa Affimetrix que contiene 2.589 oligonucleótidos diferentes, correspondientes a genes de copia única conocidos de una cepa no virulenta, tomada como cepa de referencia. Los oligonucleótidos fueron depositados (printed en inglés) por un robot (microarrayer) como dots de 150 µm en un portaobjetos cubierto con polilisina. Por otro lado, se marcó DNA genómico de una cepa virulenta con DNA polimerasa (enzima “Klenow”) y dUTP acoplado a un colorante fluorescente rojo. La marcación del DNA genómico de la cepa de referencia fue hecha con Klenow y dUTP acoplado a un colorante fluorescente verde. Ambas muestras de DNA marcado se usaron simultáneamente para hibridizar el panel (previamente tratado con anhídrido succínico para bloquear los grupos básicos de la polilisina libre) siguiendo el protocolo indicado en www.microarrays.org., en condiciones de mediana rigurosidad. Los portaobjetos fueron scanneados por medio de un scanner marca GenPix y las imágenes obtenidas fueron analizadas con el software GenePix Pro 3.0. A continuación se muestra una porción de la imagen obtenida (en el archivo original se ven los colores) Análisis de los resultados: % spots 78 15 7 Intensidad fluorescencia rojo/verde 1 ó muy cercano a 1 < 0.30 Entre 0.30 y 1 a) ¿Qué información suministra cada una de las tres filas de la tabla? b) ¿En qué fila de la tabla se encuentran los genes que tienen una sola mutación puntual en alguna de las cepas con respecto a la otra? c) ¿Es esperable el resultado de la segunda fila de la tabla (15%) para cepas de la “misma especie”? d) El valor de 85 % es similar al % de genes reconocidos por BLAST como homólogos entre los aprox. treinta genes de copia única secuenciados en ambas cepas. ¿Cree Ud. que fue conveniente el umbral elegido, de 0.30? ¿De qué manera se hubiera modificado la tabla y cómo hubiera sido la correspondencia con BLAST si se hubiera elegido un umbral de 0.25? e) En base a los resultados, ¿es posible estimar el nivel de similitud global de los genomas entre ambas especies? 43 Análisis globales de los genomas. Genómica. Microarrays 2) basado en el paper de los ¿hermanos? Zhang, Zhang y Zhang (2005) Plant Mol Biol, 58, 401-19. Con el fin de identificar los genes que se expresan específicamente en el desarrollo floral en Arabidopsis, se abordó la estrategia de genómica funcional, utilizando un microarray comercial conteniendo 22.746 oligonucleótidos correspondientes a numerosos ORFs. La metodología fue muy similar a la del problema anterior con la diferencia de que los DNAs fluorescentes para la hibridización fueron preparados a partir de RNA total, transcriptasa reversa (en lugar de DNA genómico y DNA Pol) y dNTPs. De esta manera se obtuvo cDNA correspondiente a cada tejido (hoja, tallo, raíz, brotes florales y flores diferenciadas), marcado diferencialmente al haber agregado a la mezcla de reacción UTP acoplado a sustancias fluorescentes de diferente color. Resultados: 17.583 spots mostraron fluorescencia cuando se hibridizó con cDNA proveniente de al menos menos 1 de los tejidos examinados. 12.245 spots mostraron fluorescencia cuando se hibridizó con cDNA proveniente de cualquiera de los tejidos examinados. 104 spots mostraron fluorescencia solamente cuando se hibridizó con cDNA proveniente de brotes florales tempranos. a) ¿A qué corresponderán los spots que nunca mostraron señal fluorescente? b) ¿Cuáles son los pasos a seguir para sacarles bien el jugo a los resultados obtenidos? c) ¿Qué clase de genes esperaría para la mayoría del grupo de los 104 mencionados? d) ¿Cómo evaluaría la performance de todo el proceso? ¿Validaría Ud. el resultado obtenido para un gen en particular en forma individual mediante otra técnica? e) Además de estos microarrays a escala genómica (genome-wide) ¿oyó hablar de alguna otra técnica moderna para determinar patrones de expresión génica a nivel global? 44 Análisis globales de los genomas. Genómica. Microarrays 3) Los resultados de los Proyectos Genoma de primates hominoides desarrollados en la década pasada confirmaron que el genoma del humano (Homo sapiens) y el del chimpancé (Pan troglodytes) son más similares entre sí (96%) que lo que son el de mono (Macacus rhesus) y el humano entre sí (93%), o el de mono y el de chimpancé entre sí (93%). Sin embargo, análisis preliminares de los transcriptomas de cerebro, obtenidos usando un microarray de secuencias codificantes de DNA humano, revelan resultados sorprendentes: los de monos y chimpancés son muy similares entre sí, y éstos son muy diferentes al del humano. En cambio, los transcriptomas de linfocitos o hígado de cada una de las tres especies reflejan las diferencias globales de los respectivos genomas. Estos resultados de microarray y los descriptos más abajo en la Tabla 1 provienen del grupo de Svante Pääbo (Enard et al. [2002] Science 296:340). Abajo se presentan los resultados mencionados de microarrays en forma de “árboles”. La longitud de las ramas se dibujó de manera que refleja el nivel de variación entre especies en los patrones cuantitativos de hibridización. a) en base a los genomas (GCH; microarray hibridado con DNA genómico marcado): H. sapiens M. rhesus P. troglodytes b) en base a los transcriptomas (microarray hibridado con cDNA total marcado): Linfocitos Hígado H. sapiens Cerebro H. sapiens M. rhesus M. rhesus P. troglodytes H. sapiens M. rhesus P. troglodytes P. troglodytes a) ¿Qué opinión le merece la decisión de los autores de abordar genómica funcional hibridizando ácidos nucleicos de distintas especies entre sí? (con respecto a esta cuestión, les recomendamos ver Gilad et al., Genome Res [2005] 15: 674-80). b) ¿Cree Ud. que estos nuevos resultados cuestionan el considerar al chimpancé como el primate más cercano evolutivamente al Hombre? c) Aceptando que las diferencias en patrones de transcripción de los mismos tejidos entre diferentes especies son gobernadas por sus respectivos genomas, ¿qué tipo de genes debieron haber sido realmente relevantes en la evolución del Hombre? 45 Análisis globales de los genomas. Genómica. Microarrays A continuación se muestra un análisis comparativo de proteínas de cerebro de humano y chimpancé mediante electroforesis en poliacrilamida en dos dimensiones: d) Son estos resultados compatibles con los transcriptomas mostrados? ¿Dan información adicional? chimpancé (Pan troglodytes) Su rama evolutiva se separó de la de homínidos hace aprox. 6.000.000 años mono rhesus (Macacus rhesus) Comparte con humanos y chimpancé un ancestro común que existió aprox. 25.000.000 años atrás. el Prof. Svante Pääbo (representante de Homo sapiens) en su oficina del Instituto Max Planck de Antropología Evolutiva Leipzig, Alemania 46 Análisis globales de los genomas. Genómica. Microarrays Novedad técnica: los PCR arrays (sin hibridización) En los últimos años ha aparecido una nueva generación de arrays de ácidos nucleicos, pero no concebidos para una posterior hibridización sino para una posterior RT-PCR cuantitativa. Estos “PCR arrays” consisten en placas microwell, en cada uno de cuyos pocillos se han colocado distintos pares de primers específicos para medir las cantidades de transcriptos asociados a un proceso biológico determinado (hay disponibles comercialmente arrays para varios procesos, a elección del investigador). Técnicamente, es sencillo: se mezcla la muestra de cDNA (obtenida como siempre a partir de RNA total y Transcriptasa Reversa) con una master mix para PCR (Taq polimerasa, dNTPs), luego se agregan iguales volúmenes a cada uno de los pocillos donde están los primers, y se corre un programa apropiado para monitorear la amplificación que va ocurriendo en todos los pocillos simultáneamente mediante Real Time PCR en el instrumento que se tenga (los hay de las empresas ABI, Bio-Rad, Stratagene y Roche). De esta manera, uno puede averiguar si los genes cuyos primers están en el array muestran expresión inducida o reprimida en procesos normales o patológicos, como por ejemplo ciclo celular, apoptosis, adhesión celular, diferenciación, inflamación, estrés oxidativo, cáncer, etc. La empresa líder en la fabricación (http://www.sabiosciences.com/home.php). de 47 estos PCR arrays es SABiosciences Cromatina 48 Cromatina 1) basado en Weintrab & Groudine (1976) Science 193: 848-856 Para entender la relación entre estructura de la cromatina y expresión génica, se estudiaron dos tipos de células de pollo: reticulocitos (precursores de los glóbulos rojos), los cuales expresan grandes cantidades de globina; y fibroblastos, que no expresan nada de globina. Se quería saber si las secuencias de globina existen bajo las mismas o diferentes estructuras cromatínicas comparando estos dos tipos celulares. Como “probes” de la estructura de la cromatina se usaron dos nucleasas: la micrococal y la DNasa I pancreática. En el experimento i) se trataron núcleos de cada una de estas células con estas nucleasas por separado y después se extrajo el DNA total. En el experimento ii) se purificaron monómeros de nucleosomas (a partir de cromatina de núcleos tratados con nucleasa micrococal a alta concentración). A una alícuota se la trató con tripsina para eliminar 20 a 30 aminoácidos del extremo amino de cada histona. Después, los nucleosomas purificados fueron incubados con las nucleasas, y luego se extrajeron los DNA. Todos estos DNA fueron sometidos a electroforesis en agarosa, transferidos a nitrocelulosa e hibridizados con cDNA globina como sonda. Los resultados están dibujados en la siguiente figura: i) F: núcleos de fibroblastos R: núcleos de reticulocitos F R F R F R F R ii) f: nucleosomas de fibroblastos r: nucleosomas de reticulocitos r-trip: nucleosomas de reticulocitos + tripsina f r r-trip f r 49 Cromatina En base a los resultados, a) ¿Las histonas están presentes en la cromatina transcripcionalmente activa? b) Explique qué consecuencias tiene la acción de la tripsina in vitro sobre la estructura de los nucleosomas. c) ¿Lo que distingue cromatina activa de inactiva es una propiedad relacionada solamente con el empaquetamiento de estructuras de alto orden o es también una propiedad de los nucleosomas individuales? d) Bajo este diseño experimental en que no hubo extremo fijo marcado, ¿habrían variado los resultados de los Southerns si los nucleosomas no hubieran estado bien “posicionados” in vivo (es decir, si su posición relativa a determinados nucleótidos fuera variable en todas las células)? ---------------------------------------------------------------------------------------------------------------------------- --------------2) Prediga la utilidad de la siguiente estrategia experimental que consiste en las indicadas etapas secuenciales: 1. Tratamiento de células vivas con formaldehído (que forma “bases de Schiff” reversibles con grupos -NH2 de dos macromoléculas distintas, haciendo de “puente” covalente entre ellas) 2. 3. 4. 5. 6. 7. 8. Aislamiento de núcleos Sonicación (que significa tratamiento generador de ultrasonido) Inmunoprecipitación con anticuerpo anti-factor de transcripción X Incubación a 69ºC/proteinasa K ligar oligonucleótidos adaptadores (de secuencia conocida) al DNA inmunoprecipitado PCR con primers específicos para dichos adaptadores secuenciar producto de amplificación Protocolo alternativo: 1-5. Idem protocolo I 6. Ligar al plásmido Bluescript el DNA inmunoprecipitado (inserto) 7. Transformar E. coli con el plásmido recombinante y plaquear en medio con IPTG y X-gal 8. Elegir varias colonias blancas al azar y cultivar bacterias de cada colonia en medio líquido 9. Purificar plásmido de cada colonia 10. Secuenciar el inserto de cada colonia ¿Cuál protocolo eligiría Ud.? 50 Cromatina 3) basado en Weinmann et al. (2002) Genes and Develoment 16:235 Las estrategia mencionada en el problema anterior se llama “Inmunoprecipitación de cromatina” (ChIP), que también se usa para detectar modificaciones covalentes en las histonas que influyen en la expresión génica. En particular, combinada a microarrays (chips) genómicos, puede ser de gran utilidad, como lo demuestran los autores del trabajo citado, para el factor de transcripción E2F, que como veremos más adelante, está involucrado en el ciclo celular. Realizando ChIP con anticuerpo anti-E2F e hibridizando el inmunoprecipitado contra un microarray de clones de una library genómica humana enriquecidos en islas CpG, se obtuvo lo siguiente: Resultado de la hibridización del chip Detalles experimentales: Los clones (productos de PCR sin purificar) fueron depositados por un robot (microarrayer) como dots de 150 µm en un portaobjetos cubierto con polilisina. Luego los DNA fueron desnaturalizados antes de su uso. Por otro lado, la marcación del DNA inmunoprecipitado fue hecha con dUTP acoplado al colorante fluorescente rojo. La marcación del control sin anticuerpo fue hecha con dUTP acoplado al colorante fluorescente verde. Ambas sondas se usaron simultáneamente para hibridizar el panel (bloqueando previamente la polilisina libre) siguiendo el protocolo indicado en www.microarrays.org. Los portaobjetos fueron scanneados por medio de un scanner marca GenPix y las imágenes obtenidas fueron analizadas con el software GenePix Pro 3.0. Las señales rojo/verde > 2 fueron consideradas positivas. a) ¿Qué información se puede extraer de este experimento? b) ¿Cuáles serían los siguientes pasos a seguir para completar la información? c) ¿Qué otra metodología post-ChIP confirmaría los resultados mostrados? 51 Cromatina 4) basado en los hallazgos comentados por Kornblihtt et al. (2009), Nature Structural & Molecular Biology 16(9):902-3. Al digerir cromatina total de insectos o humana mediante nucleasa micrococal y someter los fragmentos de DNA “protegidos” resultantes (de aprox. 150 pb) a secuenciación “profunda” (en este caso por pyrosequencing), se observó con sorpresa que las secuencias obtenidas -para el caso de genes activos- correspondían preferencialmente a exones y no a intrones! La correlación fue aun mayor cuando los nucleosomas fueron purificados mediante inmunoprecipitación con anticuerpo anti-H2A.Z (una clase de histona H2A) antes de la pirosecuenciación. Más aun, comparando secuencias que mostraban solapamiento, se vio que también éstas tenían extremos idénticos. ¿Le llaman la atención estos resultados? ¿Habrá alguna relación entre el splicing y la organización de la cromatina en genes activos? ¿Se anima a elaborar un modelo? 52 Epigenética Imprinting Inactivación del cromosoma X 53 Epigenética 1) basado en Kaneda et al. (2004) Nature 429(6994):900-3. La DNMT3 eucariota (DNA [citosina-5] metil transferasa de novo) ha sido objeto de una intensa investigación porque regula procesos biológicos clave en células germinales (aunque no es indispensable para que ocurra la gametogénesis) y durante el desarrollo embrionario. Aunque la enzima no ha sido cristalizada como otro tipo de metil transferasas (como p. ej. de restricción en procariotas o de histonas en eucariotas), se la ha podido purificar y estudiado su mecanismo de catálisis en detalle. Se sabe que su gen mapea en el brazo corto del cromosoma 2 en humanos y que tiene 23 exones. Los exones 17-22 codifican al sitio catalítico de la enzima. a) Si se quiere generar ratones KO para el dnmt3, ¿qué región del gen wt eligiría Ud. para eliminar y reemplazar con el gen neo y así obtener una efectiva versión mutada in vitro, para luego transformar a las ES cells? b) Ratones knock-out homocigotas para dnmt3 resultaron letales embrionarios (Fig. 1). ¿Qué sugiere este hecho? ¿Qué modificaciones esperaría en la cromatina que envuelve al grueso de las islas CpG en los embriones abortados? dnmt3a -/wt Morfología de embriones knock-out para el gen dnmt3 (centro y derecha) y un control wild-type (izquierda). Los embriones mutantes muestran defectos tales como un cerebro más pequeño y un tubo neural abierto. 54 Epigenética 2) En la literatura científica, hay unos pocos ejemplos de transgenes reporter silenciados naturalmente, que se des-silencian debido a estrés por calor, ya sea en plantas adultas pre-floración (Lang-Mladek, et al, Molecular Plant 2010) o en larvas de moscas (Seong et al, Cell 2011). Tal situación de descilenciamiento se transmite a la progenie, que expresa el reporter aunque no haya sido estresada. a) ¿Qué macromoléculas (qué función bioquímica) son candidatas a ser consideradas como sensoras del aumento de temperatura y así provocar cambios epigenéticos? b) ¿Cree Ud. que los cambios epigenéticos responsables del des-silenciamiento deben ser estables en meiosis y por lo tanto aparecer en las gametas del individuo estresado, para poder explicar el fenómeno observado? Además, sorprendentemente, en ambos modelos biológicos mencionados, la cruza sexual entre un individuo adulto sin reporter que fue estresado y un individuo con reporter silenciado que no fue estresado también origina una progenie que expresa el reporter aunque no haya sido estresada. ¿Cómo se explica dicho resultado?, es decir: c) ¿Qué genes pudieron haberse activado en el individuo estresado cuyos productos pudieron haber actuado sobre el complemento genético del cigoto resultante de la fecundación? Problemas sobre Imprinting (3-7) 3) a) Proponga una estrategia experimental para averiguar si un gen humano en particular está sujeto a imprinting, aclarando: ¿Cuántos individuos por lo menos hacen falta? ¿Emparentados o no emparentados? ¿Analizaría DNA o RNA? ¿Es necesario tener información de polimorfismos? ¿Qué técnicas eligiría? b) Proponga una estrategia experimental para identificar a todos los genes humanos sujetos a imprinting, aclarando: ¿Cuántos individuos por lo menos hacen falta? ¿Emparentados o no emparentados? ¿Analizaría DNA o RNA? ¿Es necesario tener información de polimorfismos? ¿Qué técnicas eligiría? 4) a) peg1 es un gen autosómico que se expresa normalmente solamente a partir del alelo de origen paterno, el cual no se encuentra metilado. ¿Esperaría anomalías en la expresión de peg1 en ratones wild-type “clonados” por transferencia nuclear (tipo oveja Dolly)? b) Los autores del trabajo del problema 1), mediante cruzas y usando el sistema cre/lox, generaron ratones KO homocigotas en dnmt3a condicionales, en los cuales la recombinasa cre estaba bajo las órdenes del promotor/enhancer de un gen llamado TNAP (Tissue Non-Specific Alkaline Phosphatase), que a pesar de su nombre se expresa activamente sobre todo en células germinales (desde muy temprano, en el embrión) y gametas. Dichos ratones KO resultaron fértiles. ¿Qué resultados de expresión de peg1 esperaría Ud. en la descendencia obtenida de los siguientes cruzamientos?: i) un ratón knock-out condicional hembra x un ratón macho normal ii) un ratón knock-out condicional macho x un ratón hembra normal 55 Epigenética 5) basado en Prawitt et al (2005) Proc Natl Acad Sci U S A. 102(11): 4085– 4090. Bertaux et al (2005), J Biol Chem Vol. 280, No. 33, 29625–29636, Cai & Cullen, 2007 RNA 13(3): 313-6. El síndrome de Beckwith-Wiedemann (BWS) es una enfermedad hereditaria caracterizada por alta estatura, macroglosia (lengua tan grande que no cabe en la boca), hepatomegalia (hígado grande) y una predisposición a un tipo de cáncer de riñón llamado “tumor de Wilms”. La región genómica alterada parece ser el cromosoma 11p15 donde hay dos genes clave: IGF2 (abreviatura de insulin-like growth factor 2), situado río arriba; y H19, que codifica a un RNA no codificante, situado río abajo y que no está asociado a los síntomas de la enfermedad. Ambos genes son regulables positivamente por un mismo enhancer transcripcional con localización atípica: río abajo de H19. Sin embargo, se sabe que normalmente ambos genes son de expresión excluyente sobre el mismo cromosoma, es decir, si se expresa uno, no se expresa el otro. Las causas de dicha exclusión mutua en cis se atribuyen al hecho siguiente: río arriba y a pocas kb de H19, se halla una región llamada DMR (Región Metilada Diferencialmente), que afecta (por los mecanismos clásicos de des/acetilación de histonas) la expresión de H19. A su vez, DMR, cuando no está metilada, es reconocida por una proteína llamada CTCF, que actúa como “aislante” transcripcional, impidiendo la acción a distancia del enhancer sobre IGF2, pero no afectando su acción sobre H19 (ver figura 1). Figura 1: esquema de la región 11p15. telómero enhancer H19 DMR IGF2 Bgl II Bgl II 4 kb Para entender el mecanismo genético del origen de BWS, se han hecho los siguientes experimentos y observaciones: Figura 2: árbol genealógico de una familia con los individuos afectados. I.1 II.1 I.4 I.3 I.2 II.2 II.3 II.4 II.5 II.6 II.7 II.8 II.10 II.9 II. 4 III.8 III.1 III.2 III.3 III.4 III.5 III.6 III.7 IV.1 IV.2 IV.3 IV.5 IV.5 IV.5 III.9 IV.4 símbolos llenos: individuos con síntomas leves o severos de BWS símbolos vacíos: individuos sanos símbolos cruzados: fallecido rombo: sexo no determinado 56 III.10 IV.5 Epigenética Figura 3: Southern, usando DNA genómico de algunos individuos, cortado con la enzima BglII y un clon de H19 como sonda calle 1: DNA de cualquiera de los siguientes individuos: I.2, II.5, III.1, III.2, IV.2 calle 2: DNA de cualquiera de los siguientes individuos: I.1, I.3, I.4, II.2, II.6, III.3, III.6, IV.1 Figura 4: RT-PCR cuantitativa usando RNA de hepatocitos o linfocitos de algunos individuos y primers específicos para IGF2 y para H19. a) ¿Qué tipo de herencia sigue el BWS? b) ¿Qué características estructurales a nivel nucleótidico tendrá la región DMR y cómo puede influir sobre la expresión de H19? c) Proponga un modelo que explique los resultados genotípicos, de expresión génica y fenotípicos en: i) personas normales ii) los pacientes con BWS indicando en ambos casos las modificaciones epigenéticas dentro de la DMR en las gametas masculinas y femeninas (o en las células germinales precursoras). d) ¿Es consistente el modelo que Ud. propuso en c) con la alta expresión de H19 en la abuela I.2? e) Se sospecha que, además de IGF2 o H19, hay otros genes involucrados en tumores de Wilms, que podrían mapear en el cromosoma 11 o bien en otro, y que podrían estar duplicados, o ausentes por deleción. ¿Qué experimento podría hacerse para testar esta hipótesis? 57 Epigenética 6) basado en los experimentos de Jeannie Lee en Harvard Medical School. ¿Qué se espera con respecto a la viabilidad embrionaria de los ratones resultantes de los siguientes cruzamientos?: i) un ratón macho knock-out (quimera) para toda la región promotora/regulatoria del gen Tsix con ratón hembra normal, es decir XΔY x XX. ii) un ratón hembra de la F1 anterior con ratón macho normal, es decir XXΔ x XY ¿Qué mecanismos epigenéticos están implicados? La renombrada Dra. Jeannie Lee, Profesora de Genética y Patología en la Harvard Medical School y en el Massachusetts General Hospital, Boston http://www.hhmi.org/research/investigators/lee_bio.html 58 Epigenética 7) basado en el trabajo publicado en Chromosome Research 15: 147-161 (2007) por el Center for Kangaroo Genomics, Australia; y en el Proyecto Genoma Ornitorrinco, Nature 453: 175– 183 (2008). Los mamíferos metaterianos (marsupiales), ejemplificados por el popular canguro australiano (Fig. 1), divergieron de los mamíferos euterianos (placentarios) hace 180 millones de años. Figura 1. Canguro australiano corriendo velozmente Con el fin de investigar el patrón de inactivación del cromosoma X en marsupiales, se realizaron cruzas entre canguros de las sub-especies australianas Macropus robustus robustus y Macropus robustus erubescens. Aprovechando polimorfismos génicos entre ellas, a los individuos parentales y a su descendecia (F1) se les analizó la enzima HPRT (hipoxantina-fosfo-ribosiltransferasa), codificada por un gen localizado en el cromosoma X y expresada ubicuamente (Tabla I). Dicha proteína está muy estudiada porque está ausente en humanos afectados con el síndrome neurológico de Lesch-Nyhan. robustus 193 193 erubescens 180 180 F1(robustus x erubescens 193 193 ) F1(erubescens 180 x robustus ) 180 Tabla I. Se indica el número de aminoácidos de la enzima HPRT en los linfocitos de cada grupo de animales adultos. En ningún caso se observaron las dos isoformas simultáneamente en el mismo individuo. a) ¿Cuál es la identidad del cromosoma X inactivado en canguros adultos hembra? Compare con lo que Ud. sabe que sucede en ratones en el estadío embrionario temprano, en la placenta y en el individuo adulto. b) i) ¿Qué debe pasar en la línea germinal femenina con respecto a las marcas epigenéticas del cromosoma X heredado del padre? ii) ¿Qué debe pasar en la línea germinal masculina con respecto a las marcas epigenéticas del cromosoma X (heredado de la madre)? c) ¿Qué marcas epigenéticas esperaría encontrar y cuáles no esperaría encontrar en el cromosoma X inactivo en las células de los canguros hembra? ¿Cómo las detectaría en el laboratorio? Mediante experimentos de Southern usando subclones BAC de ratón como sondas, o mediante Hibridización Genómica Comparativa usando microarrays, se ha demostrado la ausencia de ortólogos de genes Xist y Tsix tanto en marsupiales como en monotremos. 59 Epigenética Los mamíferos monotremos, típicamente ejemplificados por el morfológicamente extraño ornitorrinco (“platypus”, en inglés) australiano (Fig. 2), ponen huevos como las aves y secretan un veneno como muchos reptiles. Su genoma, de tamaño similar al de los marsupiales y placentarios, y que también aloja a genes de microRNAs, consta de algunos cromosomas muy pequeños y 10 cromosomas sexuales, pareciéndose en este sentido más al genoma de reptiles y aves que al del resto de los mamíferos, de los cuales divergieron hace 210 millones de años. Figura 2. Ornitorrinco nadando plácidamente en aguas australianas d) En función de lo que ahora sabe de marsupiales, monotremos y mamíferos ¿qué hipótesis parsimoniosa puede conjeturar acerca de la evolución del sistema génico Xist/Tsix? 60 Epigenética Otro ejemplo de array sin hibridización: Methyl-Profiler™ DNA Methylation PCR Arrays 61 Silenciamiento génico 62 Silenciamiento génico 1) basado en Francis y Spiker (2005) Plant J. 41: 464-477. Los Tn (transposones de DNA) y el T-DNA de Agrobacterium sp se usan para hacer tagging con el propósito de identificar genes responsables de ciertos fenotipos en bacterias y plantas, respectivamente. Este tipo de estrategia, ya muy difundida para Arabidopsis thaliana, requiere la capacidad de reconocer los individuos mutantes que exhiben fenotipos causados por pérdida de función génica, como en el paper del grupo de Jerzy Paszkowski de la Guía de Seminarios. Fotografía de la parte aérea de una planta de Arabidopsis thaliana Usualmente, dentro de los T-DNA se incorpora un gen de resistencia al antibiótico kanamicina bajo las órdenes del promotor fuerte 35S, para seleccionar las plantas transformadas con el T-DNA. Sin embargo, Francis y Spiker vieron que esa modalidad de selección no es del todo práctica porque, independientemente del sitio de inserción, ocasiona que se descarten muchos individuos transgénicos, que también serían útiles para el propósito de tagging. a) Los individuos descartados que se mencionaron arriba corresponden a falsos negativos del sistema de selección basado en resistencia a kanamicina. ¿Se le ocurre por qué se generan estos falsos negativos? ¿Puede describir el mecanismo involucrado? (pista: participa una enzima exclusiva del reino vegetal y unos pocos eucariotas unicelulares, pero ausente en animales). b) ¿Qué modificaciones epigenéticas sobre el DNA esperaría encontrar en el gen de resistencia a kanamicina en los falsos negativos? Indique cuáles son, formule un modelo posible para explicar su aparición y cómo las detectaría en el laboratorio, indicando dos metodologías independientes. c) ¿Sería posible encarar un T-DNA-tagging omitiendo el sistema de selección mencionado? 63 Silenciamiento génico 2) Caenorhabditis elegans es un pequeño (~ 1 mm) nematodo modelo con un reducido número de células (aprox. 1000). Es posible en el laboratorio conseguir animalitos transgénicos al microinyectar genes o clones de una library en la gónada, donde se encuentran los óvulos (oocytes) de los progenitores hermafroditas (técnica de C. Mello, premio Nobel 2006). células musculares Estos gusanitos exhiben un movimiento ondulatorio (similar al de las víboras de gran tamaño) gracias a genes que se expresan en las 81 células musculares distribuidas en su pared corporal, p. ej. el gen unc, cuyo transcripto mide 800 bases. a) Con el propósito de clonar un gen (cualquiera) de silenciamiento posttranscripcional (PTGS), y sabiendo que los RNAs cortos son capaces de pasar de célula a célula, se siguió el siguiente protocolo, que consiste en etapas secuenciales: 1. Conseguir una población de gusanos Caenorhabditis elegans hemafroditas wild type 2. Proceder a una mutagénesis química masiva (con dosis moderada de mutágeno) 3. Esperar a tener individuos de la generación F2 4. Incubarlos en presencia de dsRNA unc en el medio de cultivo para que ingrese por la boca 5. Seleccionar los pocos individuos que se mueven 6. Microinyectarle a cada uno (en su línea germinal) un clon distinto de una library genómica wild type (construida en YACs), es decir generar una colección de transgénicos para probar complementación 7. Seleccionar un individuo paralítico de la progenie (siempre en presencia de dsRNA unc) 8. Analizar el inserto del clon YAC que logró reversión de fenotipo por complementación 9. Buscar genes ortólogos a los del inserto mediante BLAST en bases de datos ¿Encuentra Ud. racionalidad en esta estrategia? ¿Le satisface este protocolo tal cual, lo modificaría agregando o quitando alguna etapa o control, o lo rechazaría por completo? b) ¿Qué resultado de Northern (RNA total de todo el gusano) revelado con cDNA unc esperaría Ud. para los individuos indicados? Dibuje abajo las bandas esperadas (teniendo en cuenta que el dsRNA exógeno gatillador no es detectable en este análisis). long.(nt) 1 4 5 7 carril 1: gusanos del paso 1) carril 4: la gran mayoría de los gusanos del paso 4) carril 5: gusanos del paso 5) carril 7: gusanos del paso 7) 800 25 c) Si el dsRNA se administrara radioactivo (en todos sus fosfatos) a gusanos wild type, y luego se les extrajera y purificara el complejo “RISC”, ¿esperaría o no encontrar el RISC radioactivo? Ayúdese con un dibujo de los pasos involucrados en el mecanismo. 64 Silenciamiento génico 3) ¿Cómo comprobaría experimentalmente, usando un gen reporter y células de mamífero en cultivo, la interacción entre el mRNA de un gen en estudio y un miRNA endógeno predicha bioinformáticamente? 4) basado en Hao et al (2008), Nature 454: 890-893 Drosophila melanogaster y Caenorhabditis elegans son especies en las que está bien puesto a punto el screening funcional de genes a escala genómica, mediante RNAi, es decir, usando una library de dsRNAs (fabricada por transcripción in vitro de ambas hebras de muchas regiones genómicas codificantes, sin intrones, seguida por annealing de los RNAs complementarios (Foley et al. [2004] PLoS Biol. 2(8):E203) Los autores del trabajo citado, preocupados por el avance de pandemias de gripe en humanos en distintos países y ante la incertidumbre sobre la eficacia de las vacunas, se propusieron identificar genes celulares necesarios para el ciclo de vida del virus de la gripe A H1N1. Para eso, decidieron aprovechar la existencia de una library de dsRNA de Drosophila ya fabricada y usada por otros autores, pero antes obviamente tuvieron que modificar el virus de manera que pudiera infectar a células de Drosophila: reemplazaron las proteínas virales HA (hemaglutinina) y NA (neuraminidasa), reconocidas por los receptores celulares en mamíferos, por: 1) la proteína de envoltura del virus VSV, que es reconocida por receptores ubicuos; 2) la reportera GFP, respectivamente. El protocolo que siguieron consistió en depositar ordenadamente en placas multiwell cada uno de los 13.000 dsRNAs diferentes de la colección correspondientes a 13.000 genes de mosca (90% del genoma), depositar las células de mosca en todos los pocillos (wells) y a las 48 hs. infectar las células con el virus de la gripe modificado. ¿Cómo completaría Ud. el screening, teniendo en mente una futura posible terapia química anti-virus de la gripe A H1N1? ¿Qué control es absolutamente necesario hacer para no terminar identificando un gen celular esencial no relacionado con el ciclo de vida del virus? 65 Ciclo celular Cáncer Virus oncogénicos 66 Ciclo celular, cáncer, virus oncogénicos 1) Mediante el software del sitio http://www.invivogen.com/sirnawizard/design.php , diseñe el mejor shRNA para down-regular la expresión del (potencial) oncogen CDK4 en células Hela en cultivo. Escriba la secuencia completa: brazo sense, loop y brazo antisense. ---------------------------------------------------------------------------------------------------------------------------------2) basado en Maddison et al. (2004) Cancer Research 64: 6018. Empleando la técnica convencional de knockout (KO), se generaron ratones heterocigotas para el gen Rb modificado de tal manera que tuviera secuencias lox embebidas en sus intrones 19 y 20 (individuos RbloxP/+). A partir de óvulos fecundados de esos ratones, se hicieron transgénicos para el gen de la recombinasa procariota cre bajo el promotor del gen PB, específico de próstata adulta (individuos RbloxP/+ Cre+/-). Machos y hembras se cruzaron para obtener individuos Cre+/RbloxP/loxP, es decir los deseados Rb-/-, que fueron los seleccionados para el posterior análisis genotípico y fenotípico. Al cabo de 18 semanas, se sacrificaron luego de que unas horas antes se les hubo inyectado bromodeoxiuridina (BrdU) intraperitonealmente. a) Para verificar el éxito del KO condicional ¿sirve hacer PCR para seleccionar los animales buscados? En caso afirmativo, ¿con qué primers? ¿con qué células? b) Si el KO resultó exitoso y 100% eficiente, ¿qué proporción de animales seleccionados se espera con respecto al número de parentales? c) ¿Por qué los autores no habrán hecho KO del gen Rb en forma convencional, es decir en todas las células y a nivel embrionario? d) Mediante histoquímica, los autores observaron que los animales KO adultos seleccionados tenían epitelio prostático hiperplásico (mayor tamaño debido a un alto número de células). Sabiendo que los mamíferos tenemos dos genes parálogos de Rb (p107 y p130), ¿Ud. hubiera esperado un resultado semejante? e) ¿Para qué habrán inyectado BrdU? ¿Qué información pudo brindar? f) ¿Qué genes esperaría encontrar con expresión aumentada en la próstata de los animales seleccionados? ¿E2F, por ejemplo? -------------------------------------------------------------------------------------------------------------------3) Basado en Anticancer Agents Med Chem (2006) 6:377 y J Med Chem (2006) 49:4896 Grandes compañías farmacéuticas como Abbott están realizando screenings de compuestos orgánicos sintéticos para identificar inhibidores químicos de la kinasa de checkpoint Chk1, como por ejemplo, los que poseen la estructura básica 4-fenilpirrolo[3,4c]carbazol-1,3(2H,6H)-diona. Por cristalografía de Rayos X se observó que este tipo de sustancias compiten con el ATP por el sitio catalítico activo de la enzima. Estas drogas se administran contra tumores p53-/- junto con agentes terapéuticos químicos o físicos que dañan el DNA. ¿Cuál es la racionalidad del diseño de estas drogas? -------------------------------------------------------------------------------------------------------------------4) Basado en Ding et al (2006) J Med Chem. 49:3432 La proteína llamada MDM2 es una ligasa de ubiquitina, específica en las lisinas Cterminales de varias proteínas, incluyendo a p53. La ubiquitinación de p53 es una marca para su exportación desde el núcleo y degradación en el proteasoma celular. Compañías famacéuticas (p. ej. Merck y Hoffman-Roche) están estudiando la droga llamada “nutlin”, una pequeña molécula que desestabiliza la unión p53-MDM2. ¿Por qué mecanismo ejercería esta droga su acción antitumoral? ¿Serviría esta droga como terapia en todos los casos de cáncer? 67 Ciclo celular, cáncer, virus oncogénicos 5) basado en Michalides et al (2004) Cancer Cell 5(6):597-605 y Zwart et al (2007) EMBO J 26(15):3534-44 Hay algunos tumores de glándula mamaria que conservan el receptor de estrógenos (ER+) y que por lo tanto son dependientes de los estrógenos circulantes, lo cual justifica la implementación de terapias anti-estrógenos; mientras que hay otros tumores sin receptor de estrógenos (ER-), por lo tanto independientes de estrógenos, y que son más difíciles de combatir. Ejemplos de drogas anti-estrógenos que se usan en clínica médica son: a) inhibidores de aromatasa (enzima tipo citocromo P-450), responsable de biosíntesis de estrógenos. b) el tamoxifeno, estructuralmente similar al estradiol. El mecanismo de acción del tamoxifeno reside en el hecho de que compite con los estrógenos, porque se une al receptor de estrógenos, induciéndole un cambio de conformación más desplegada que impide que éste se una correctamente a proteínas co-activadoras de la transcripción. La incapacidad de responder a estrógenos finalmente lleva a apoptosis, debido a falta de expresión de genes target de estrógenos y sobre-expresión de genes de caspasas (proteasas proapóptóticas). Lamentablemente, a veces aparecen tumores ER+ resistentes a tamoxifeno, seguramente como consecuencia de adicionales mutaciones somáticas. A partir de cultivos primarios de ellos, se obtuvieron líneas celulares tumorales ER+, como la llamada CF-7 usada a menudo en investigación. Una metodología para detectar en el laboratorio el cambio de conformación de ER es FRET (Förster o Fluorescence Resonance Energy Transfer) en células vivas, que consiste en la transferencia de energía entre determinados fluoróforos, por ejemplo los polipéptidos fluorescentes GFP, YFP y CFP. Se basa en que la energía emitida por un fluoróforo puede ser absorbida por otro cuando ambos se sitúan en la misma molécula o en distintas pero cercanas (10 – 100 A de distancia), como se muestra en la figura: CFP Los autores citados han hecho los siguientes experimentos pero no con CF-7 (ER+) sino con células HeLa (ER-): Células HeLa transfectadas con la construcción YFP-ER-CFP (es decir, ER fusionado a CFP en una punta y a YFP en la otra punta) exhiben efecto FRET. Dicho efecto FRET se anula en presencia de tamoxifeno. La anulación del efecto FRET por el tamoxifeno no ocurre cuando las células se incuban con cAMP, que disocia a la kinasa pKA, activándola. En estas condiciones, a ER se lo ha detectado fosforilado en su Serina 305 La anulación del efecto del efecto FRET por el tamoxifeno sigue ocurriendo cuando las células en presencia de cAMP son transfectadas con una versión YFP-ER-CFP mutante tal que una Alanina reemplace a la Serina 305 del ER. Preguntas: a) ¿Qué se puede concluir acerca de un mecanismo probable de resistencia de algunos tumores de mama a tamoxifeno y qué experimento adicional sugeriría hacer? b) ¿Qué opina de la elección de la línea celular Hela para hacer los experimentos mencionados? 68 Ciclo celular, cáncer, virus oncogénicos Virus oncogénicos 1) Ejemplo de DNA virus basado en Bais et al (1998) Nature 391:86 El virus herpes (HV) humano tipo 8 se ha encontrado asociado a Sarcoma de Kaposi (KS), siendo reconocido como responsable de la patología, y por lo tanto ahora se lo llama KSHV. El análisis de su secuencia nucleotídica reveló varios ORFs, uno de los cuales resultó corresponder a un gen de la familia de los “G-protein coupled receptors” (GPCR), conocidos previamente como integrantes de una cascada de señalización -vía proteínas G triméricas y kinasas- activada por citoquinas durante procesos inflamatorios. Se sospecha que el gen GPCR de KSHV es responsable del fenotipo tumoral en KS. a) Diseñe un experimento usando células en cultivo y otro con animales para investigar si GPCR es realmente un oncogen. b) En caso de afirmarse la hipótesis anterior, ¿qué experimento haría para determinar cuál vía de kinasas –entre las mediadoras de la señalización entre receptores de membrana y el núcleo- está involucrada en la patogenia de KS? c) ¿Esperaría encontrar niveles altos de VEGF en KS? -------------------------------------------------------------------------------------------------------------------2) Ejemplo de RNA virus basado en Cato et al (1987) EMBO J. 6:363 El Virus de los Tumores Mamarios Murinos (MMTV) es un retrovirus oncogénico y suele causar tumores exclusivamente en las glándulas mamarias de ratones hembra. A diferencia de otros retrovirus oncogénicos como el legendario Rous Sarcoma Virus (RSV) descubierto en 1911, el MMTV no posee ningún oncogen. Lo que sí posee es un elemento de respuesta a hormonas (HRE), localizado en los LTR, que actúa como enhancer transcripcional en respuesta a hormonas esteroideas (se le une el receptor de esteroides, que migra desde el citoplasma al núcleo). Dé una explicación de cómo MMTV produce sus efectos oncogénicos y proponga un enfoque experimental para testear su hipótesis. Para reflexionar: ¿Valdrá la pena investigar para desarrollar estrategias anti-tumorales universales, es decir para combatir todo tipo de tumores, o tendría más probabilidad de éxito la investigación sobre terapias específicas para tumores particulares? 69 Telómeros y telomerasas 70 Telómeros y telomerasas 1) María Blasco y Carol Greider (Cell (1997) 91(1):25-34) analizaron el fenotipo de ratones knock-out (KO) homocigotas para el componente RNA de la telomerasa (clonado por Elizabeth Blackburn y Carol Greider [premios Nobel 2009] en 1989). Ellas observaron que estos animales y la descendencia resultante de la cruza entre ellos eran aparentemente normales, pero que en cada generación iban muriendo cada vez más jóvenes. El análisis fenotípico llegó hasta los animales de la generación 6, ya que éstos resultaron infértiles. Por otra parte, análisis citogenéticos (por FISH) revelaron claras diferencias cromosómicas: los telómeros de fibroblastos embrionarios de ratones (MEFs) de la generación 6 medían en promedio 15 kb, contrastando con los de MEFs de ratones wt, que medían en promedio 45 kb. a) Teniendo en cuenta que la tasa de pérdida de longitud de los telómeros en células murinas somáticas es 50-200 pb/división celular (dato obtenido de experimentos con células en cultivo), ¿a Ud. le sorprendió que hayan podido nacer ratones sin telomerasa? Para convencerse, estime el número aproximado de divisiones celulares que ocurren desde un cigoto hasta una gameta madura de un ratón adulto derivado de ese cigoto. Compare su respuesta con la respuesta a la similar pregunta d) del Problema 1 de la página 12. b) ¿Se podría haber hecho la estimación anterior analizando solamente el tamaño de los telómeros de animales wild type? ¿Por qué? c) Intente dar una explicación molecular del fenotipo de los ratones KO en cuanto a longevidad y fertilidad. d) ¿Es posible predecir si los ratones KO serán más propensos o menos propensos a contraer tumores naturales o provocados? 71 Telómeros y telomerasas 2) basado en Fitgerald et al. (1999) PNAS 96: 14813 y Shakirov & Shippen (2004) Plant Cell 16: 1959-1967 Se ha demostrado que los cromosomas de las plantas también tienen telómeros aunque mucho más cortos que en el reino animal- que consisten en repeticiones en tándem del heptámero TTTAGGG, en un número que depende del “ecotipo” (que significa variedad con genotipo característico). Para ver si su síntesis y función es como en protozoarios ciliados y mamíferos, se han realizado estudios en Arabidopsis thaliana (ecotipo Columbia), produciendo plantas transgénicas que llevan el cDNA de la subunidad catalítica de la telomerasa (AtTRT) de 3372 bp bajo un promotor constitutivo (no muy fuerte para evitar silenciamiento). Extractos proteicos nativos de hojas transgénicas fueron sometidos al protocolo TRAP (telomerase repeat amplification protocol) (resultado en Fig. 1). Como controles, también se usaron callos (embriones somáticos), o de meristema apical (células en el extremo del tallo por donde crece la planta) o bien de hojas totalmente diferenciadas. a) ¿Era esperable la ausencia de actividad de telomerasa en hojas diferenciadas? b) ¿En cuantos nucleótidos de longitud difieren entre sí los productos de amplificación visualizados como un “escalera” (ladder en inglés) en el gel post-PCR? Por otro lado, se obtuvieron transgénicas vía Agrobacterium tumefaciens que llevan un T-DNA conteniendo un gen marcador de selección. Sobre 10.000 individuos, se realizó un screening masivo por PCR usando un primer para uno de los bordes del T-DNA y otro primer para una secuencia del gen AtTRT. De esta manera, se encontró un solo individuo que dio producto de amplificación, el cual fue autopolinizado para obtener individuos KO homocigotas (llamados T1) y éstos dieron lugar a plantas de la siguiente generación (T2). Más tarde se obtuvo la tercera generación (T3), pero estos individuos resultaron estériles. Southern blots de algunas de estas plantas, usando sondas teloméricas, se muestran en la Fig. 2. 72 Telómeros y telomerasas WT T1 T2 T3 kb 54.5 4. Fig. 2. Southern blot de DNA de hojas clivado con la enzima Sma I (reconoce a 5’ CCCGGG 3’) y usando la sonda (TTTAGGG)4 c) ¿Cuál fue el fundamento del screening por PCR en la segunda serie de experimentos? d) Estudios citogenéticos de hojas de las plantas T3 revelaron la existencia de fusiones cromosómicas en algunas células. ¿Cuál puede ser la causa? e) Relacionando con el paper sobre telómeros visto en Seminarios, ¿cuál puede ser la razón molecular por la que no se lograron individuos T4? f) Estime el largo promedio aproximado de los telómeros en hojas de Arabidopsis wild type. ------------------------------------------------------------------------------------------------------------------3) En la actualidad, si se quiere conocer el efecto de la anulación de un gen determinado (knock-out) sobre el fenotipo en Arabidopsis, se pueden utilizar las múltiples líneas transgénicas, mutadas por inserción al azar de T-DNA, generadas por el Instituto Salk (La Jolla, California, USA), disponibles gratuitamente: http://signal.salk.edu/cgi-bin/tdnaexpress, y cuyas inserciones ya fueron mapeadas Accediendo a este sitio y sus links a “ncbi y “TAIR” (The Arabidosis Information Resource), averigüe: a) ¿Qué línea knock-out en el gen de telomerasa pediría al instituto Salk? (busque el # código) b) ¿en cuál cromosoma de Arabidopsis se encuentra el gen del componente proteico de la telomerasa? ¿Cuáles son sus genes vecinos? c) ¿Cuál es el código de este gen en GenBank? d) ¿Cómo realizaría el pedido a Salk de la línea de interés? ----------------------------------------------------------------------------------------------------------------------73 Telómeros y telomerasas 4) Un ratón adulto hembra (llamado “1”) amamantando a su cría fue usado para un experimento de clonado por transferencia nuclear: un núcleo de una de sus células de glándula mamaria fue aislado e introducido a un óvulo desprovisto de su propio núcleo, posibilitando más tarde el nacimiento de un ratón clonado (llamado “2”), al cual se lo ha estudiado desde su concepción. El ratón “2”, cuando llegó a adulto, fue usado para un nuevo y similar procedimiento de clonado, tomando un núcleo de su glándula mamaria, para generar otro ratón clonado (llamado “3”). Este nuevo ratón “3” murió muy joven y evidenciaba fusiones cromosómicas en sus células somáticas. Prediga el resultado del siguiente Southern usando DNA total obtenido a partir de gametas, de glándula mamaria en crecimiento o de embriones de estadíos tempranos (blastocistos, preimplantación uterina) de los tres animales. Los DNAs fueron clivados por la enzima ApaI y se usó el oligonucleótido (TTAGGG)10 como sonda. Justifique. Gametas 1 Gland. mam. 1 Embrión 2 gland. mam. 2 74 Embrión 3 gland. mam. 3 Genética Humana 75 Genética Humana 1) basado en Schwahn et al. (1998) Nat Genet 19:327, y otros en Hum Mol Genet La Retinitis Pigmentosa (RP) es una progresiva degeneración de células fotorreceptoras de la retina y una de las más frecuentes causas hereditarias de pérdida parcial de visión y hasta ceguera en humanos y perros siberianos. Hay distintas causas genéticas de esta enfermedad, por ejemplo mutaciones en genes de distintos fotorreceptores -que residen en los cromosomas 8 y X humanos- y por lo tanto se observan diferentes formas de herencia. Para identificar qué gen está mutado en dos familias en particular que consultan a un centro oftalmológico, se las ha analizado en cuanto a su fenotipo (Fig. 1) y genotipo en linfocitos sanguíneos (Tabla I), usando marcadores de RFLP que mapean en el cromosoma X y en el cromosoma 8. El trabajo intensivo con esos marcadores en el laboratorio permitió la deducción de los mapas físicos de las regiones genómicas que abarcan a estos marcadores y la obtención de clones YAC y BAC que corresponden a dichas regiones (Fig. 2). FAMILIA 1 FAMILIA 2 Fig. 1. Arboles genealógicos de dos familias estudiadas indicando las personas enfermas Tabla I. Marcadores moleculares usados en los análisis de ligamiento. Se indica el número de individuos recombinantes hallados en las familias estudiadas Marcador Nº recomb en familia #1 Nº recomb en familia #2 DXS7 7 10 NDP 6 8 DXS1707 4 5 503LE2 3 4 PH117 0 0 159RE1 0 0 OATL1 1 2 D8S2607 12 13 D8S2610 10 11 YACs y BACs cromosoma X Fig. 2. Mapas físicos de los intervalos genómicos humanos estudiados 76 Genética Humana a) ¿Cuáles de los marcadores RFLP elegiría para el clonado posicional del locus involucrado? Ubique a dicho locus en alguno de los mapas de la Fig. 2. b) Una vez elegidos los marcadores, ¿qué procedimiento seguiría para identificar un gen candidato involucrado en la enfermedad en las familias analizadas? Una vez identificado el gen, se lo llamó RP3. A cada lado de este gen se encontró una secuencia de 300 pb sin ningún ORF. Cada una de estas secuencias de 300 pb contiene una región promotora para la RNA polimerasa III y repeticiones directas de 7 pb en sus extremos. Basándose en la secuencia de RP3, se diseñaron primers para hacer PCR (Fig. 3) y RT-PCR (Fig. 4) del paciente 2967. Fig. 3. PCR de 2967 con primers para amplificar exones 1-2. Fig. 4. RT-PCR de 2967 para amplificar los exones 1-5 y 3-5. Se usó RNA total de retina. “-“significa control sin RT HPRT es un gen control A raíz de estos resultados, luego se determinó la secuencia completa de RP3 en el paciente 2967, que reveló una inserción de 6.0 kb en el extremo 3’ del intrón 1, compatible con una unidad transcripcional bicistrónica con dos ORFs, el segundo correspondiente a una transcriptasa reversa. c) ¿A qué corresponde la inserción encontrada en el intrón 1? ¿Es una rareza estructural? d) ¿A qué corresponden las secuencias flanqueantes? ¿Son una rareza estructural? ¿Pueden constituir la causa de la enfermedad del paciente 2967 ? e) ¿Cuál es la probable causa a nivel molecular de las alteraciones visuales en la familia 2 ? f) Por otro lado, al paciente 3102 y a su padre se les hizo SSCP del exón 2 (Fig. 5). ¿Qué información arroja ese resultado? ¿Cuál sería el paso a seguir para investigar las causas genéticas de las alteraciones visuales en la familia 1? Fig. 5. SSCP del exón 2 del paciente 3102 y de su padre g) El gen RP3 y sus adyacencias contienen islas CpG metilables. Al hacer Southern blots usando altas concentraciones de enzimas de restricción sensibles a metilación, se observó que éstas son capaces de cortar el 50% de los fragmentos de DNA que contienen el alelo mutado provenientes de retinas de las madres 3101 y 2966 ¿Con qué fenómeno es consistente este resultado? 77 Genética Humana 2) basado en Cecilia Lai et al, (2001) Nature 413(6855):519-23 y Enard et al (2002) [grupo de Svante Pääbo], Nature 418(6900):869-72. Existe una enfermedad genética hereditaria en humanos llamada Dispraxia Verbal del Desarrollo (DVD) caracterizada por incapacidad de realizar movimientos faciales finos, lo cual dificulta severamente el habla y el lenguaje desde una edad muy temprana. Con el propósito de clonar el gen responsable, se han estudiado los individuos de tres generaciones de varias familias afectadas, de las cuales se muestra el pedigree (árbol genealógico) de una de ellas (Fig. 1). I II III Figura 1. Pedigree de una familia mostrando los individuos afectados (símbolos llenos) a) ¿Qué tipo de herencia aparentemente sigue la enfermedad? Usando varias sondas que hibridizan a regiones de DNA polimórficas, se ha podido identificar a una de ellas, llamada NH0563, como ligada al gen buscado. b) ¿Cómo procedería de aquí en adelante, para lograr el objetivo deseado?: i) usaría una genoteca humana construida en BACs ii) usaría una library de cDNA de cerebro humano iii) otra opción (diga cuál) Finalmente, por la estrategia contestada en b), se llegó a dos genes candidatos en la región 7q31q32: uno expresado normalmente en estructuras del sistema nervioso durante la embriogénesis, el cual codifica al factor de transcripción “FOXP2” (llamado así porque contiene el dominio FOX o forkhead, de unión a DNA, similar al de genes homeóticos de Drosophila); y otro, expresado solamente en sistema nervioso adulto, que codifica a una kinasa. c) ¿Qué estudios sencillos haría Ud. con el DNA de personas de esta familia para tener más elementos a favor de uno u otro gen candidato? ¿Incluiría también a personas de familias no afectadas? Indique la metodología. La secuencia de FOXP2 (el gen candidato favorito) en los individuos I-2, II6, III5 y III-17 mostró, en uno de los dos alelos, una mutación puntual que genera una sustitución de arginina por histidina en la posición 553 de la proteína (se abrevia “R553H”, según la notación usual para sustituciones), que se halla en el dominio de unión a DNA y cerca del extremo carboxiterminal (ver figura en página siguiente). 78 Genética Humana Esquema de estructura primaria de la proteína FOXP2, mostrando sus dominios estructurales y funcionales: Q-rich WT DNA-binding (adicional) L-rich (dimeriz.) FOX NH2 acidic COOH RH mutación missense 553 RX (STOP) mutación Nuevo nonsense 328 ¿Es posible deducir si la mutación R553H es dominante por “haploinsuficiencia” del alelo normal o es dominante negativa? ¿Ayudaría para responder la pregunta tener en cuenta el hecho de que FOXP2 es un homodímero y que es muy probable que la mutación R553H en 1 subunidad anule la capacidad de unión a DNA de todo el dímero? ¿Serviría para responder la pregunta tener en cuenta el hecho de que se ha encontrado otra familia afectada con la mutación nonsense R328X (ver figura) en heterocigocis? ¿Serviría para responder la pregunta tener en cuenta el hecho de que se ha encontrado una niña enferma, de otra familia, que tiene una deleción de toda la región 7q31-q32 en heterocigocis? d) A pesar de los numerosos trabajos sobre FOXP2 publicados, aún no se ha logrado identificar el gen target que está normalmente regulado directamente por FOXP2. ¿Qué estrategia se podría intentar para lograrlo? Indique la metodología. Por otro lado, se hizo un estudio de evolución molecular, para lo cual se secuenció el gen FOXP2 de varios primates. Al alinear las secuencias de los genes ortólogos con el programa CLUSTALW y calcular, por medio del programa PAML (Yang et al [1998] Mol. Biol Evol. 15, 568), el número de cambios sinónimos y no sinónimos que fueron ocurriendo en los distintos linajes a partir de un hipotético gen ancestral común, se obtuvieron los resultados mostrados en la Figura 2. Figura 2. Sustituciones nucleotídicas de reemplazo (números antes de las barras) y silenciosas 79 Genética Humana (números después de las barras) en FOXP2, mapeadas sobre una filogenia de primates (y ratón como “outgroup”). Los rectángulos indican cambios aminoacídicos en la proteína. f) En base a estas evidencias, los autores apoyan un modelo en el cual la selección positiva del gen gen FOXP2 contribuyó favorablemente a la aparición de un eficiente lenguaje oral y por lo tanto a la expansión de la especie humana, con respecto a otros primates ¿Usted está de acuerdo con los autores? ----------------------------------------------------------------------------------------------------------------------Comentarios sobre la bibliografía de aspectos fisiológicos de FOXP2 (que ayudan a entender la genética de la DVD): El grupo de Svante Pääbo (fotografía en el capítulo de microarrays) en Leipzig, Alemania (Enard et al, Cell [2009] 137:961-971) mostró que en el modelo ratón, el reemplazo del gen FOXP2 por el alelo humano normal (logrado mediante “knock-in” en células embrionarias stem de ratón) provoca en los ratones adultos un aumento de la conectividad sináptica en los ganglios basales. Estos ganglios son núcleos neuronales del cerebro anterior donde reside el control del lenguaje, la cognición y la actividad motora. Por el contrario, el alelo humano mutado que se encuentra en pacientes con DVD provoca efectos opuestos en ratones knock-in. Por otro lado, un grupo alemán de Berlín (Haesler et al, PLoS Biol [2007] 5: e321) usó un modelo de ave (pinzón cebra, figura de abajo) para contribuir a la comprensión de la enfermedad genética DVD, convencido de que el habla de los humanos y el canto de los pájaros comparten patrones neuronales y conductuales. Estos investigadores mostraron: a) la expresión de FOXP2 aumenta en los ganglios basales durante el aprendizaje del canto, que se manifiesta en pájaros macho muy jóvenes; b) el silenciamiento de FOXP2 en los ganglios basales durante el período de aprendizaje (logrado mediante RNA doble hebra administrado localmente vía un vector lentiviral) provocó inexacta e incompleta imitación del canto de los machos adultos. foto del pinzón cebra, zebra finch en inglés (Taeniopygia guttata), típico de Australia (http://avibase.bsceoc.org/checklist.jsp?lang=ES®ion=auwa&list=howardmoore) Finalmente, un tercer grupo alemán (Kurt et al (2009) Brain Research, 1289:30-6), teniendo en 80 Genética Humana cuenta la obvia relación entre audición y lenguaje y rescatando datos de expresión de FOXP2 en cóclea y centros auditivos del cerebro, acaba de demostrar que ratones knockin con la mutación R553H muestran déficit de audición. Comentario sobre la bibliografía de aspectos estructurales finos de la proteína FOXP2 (que ayudan a entender la genética de la DVD): Un grupo en USA con la colaboración de Svante Pääbo (Stroud al [2006] Structure 14: 159-166) reporta la estructura del cristal del dominio forkhead purificado unido a un oligonucleótido, a una resolución de 1.9 A, pudiendo visualizar la formación del dímero. Comentario sobre la bibliografía de aspectos de biología celular de la proteína FOXP2 (que ayudan a entender la genética de la DVD): Es interesante destacar que un grupo japonés aborda por primera vez la biología celular de las proteínas FOXP2 mutadas (Biochem Biophys Res Commun [2007] 353: 869-874). Demuestran que tanto la que lleva la sustitución R553H como la truncada que carece del dominio de unión a DNA son incapaces de llegar al núcleo, formando agregados citoplasmáticos. En vista de estos resultados, por un lado no tiene mayor sentido evaluar in vitro su capacidad de unión a DNA y por el otro, lleva a pensar que podrían actuar como poderosas dominantes negativas en los pacientes heterocigotas. Comentario sobre la bibliografía en cuanto a diferencias funcionales a nivel bioquímico entre las proteínas ortólogas FOXP2 de chimpancé y humano que difieren en solamente dos aminoácidos Konopka et al (Nature 2009, 462:213-217): RNA total de neuronas humanas KO en FOXP2 pero transfectadas con una u otra versión de FOXP2 fue usado para transcriptómica usando un microarray de secuencias humanas. Resultado: aparecieron diferentes genes regulados (directa o indirectamente) entre cada una de las situaciones, por lo cual se podría concluir: 1) el dominio donde mapean ambas sustituciones también es un DNA-binding domain, dándole especificidad al factor de transcripción hacia determinados enhancers targets. 2) las sustituciones aminoacídicas que ocurrieron en el linaje humano determinaron pathways específicos con consecuencias en el desarrollo cerebral 81 Genética Humana 2) adaptado de DeJesus-Hernandez y col Neuron, 2011 por el Dr. Ezequiel Surace La Demencia Fronto-temporal (DFT) es una enfermedad neurodegenerativa que afecta a los lóbulos cerebrales frontales y temporales. A nivel histológico, se observan depósitos proteicos anómalos intraneuronales en las regiones afectadas. Clínicamente, la DFT se caracteriza por alteraciones en el comportamiento (desinhibición, conducta socialmente inapropiada) y en el lenguaje (afasia). Los síntomas se manifiestan en la edad adulta, generalmente a partir de los 50 años. Se sabe que entre el 20 y el 50% de los casos de DFT son hereditarios y se han identificado hasta el momento varios genes afectados. Por trabajos previos, se sabía que existen marcadores en el cromosoma 9 que segregaban con la DFT en un grupo importante de familias (incluida la familia que veremos a continuación). En particular, un grupo de investigadores se centró en una repetición hexanucleótidica (GGGGCC) localizada en un gen hasta el momento desconocido: el gen C9ORF72 (altamente conservado entre especies), cuya estructura predicha se muestra en la Figura 1. Ya se conocen varias enfermedades neurodegenerativas causadas por expansión de repeticiones. En este caso en particular, con el objetivo de estudiar la posible asociación entre la repetición mencionada y DFT, los investigadores analizaron el genotipo y fenotipo de los miembros de la familia DFT9 (Figura 2). a) Observando el árbol genealógico, ¿qué tipo de herencia parecería seguir esta DFT? 82 Genética Humana Los investigadores comenzaron por realizar la genotipificación de la repetición GGGGCC en esta familia mediante PCR, utilizando “primers” cuya posición de anclado se muestra en la Figura 1. b) Observando los resultados obtenidos para la PCR en la Figura 2, asigne el origen parental de cada alelo en los individuos de la generación III. ¿Qué particularidad observa entre los individuos afectados III1, III2 y sus hermanos III3 y III4 en cuanto al genotipo en GGGGCC? Para continuar con el estudio de esta repetición hexanucleotídica, los investigadores deciden realizar un Southern blot a partir de ADN genómico de los integrantes de la familia. Luego de la digestión del ADN con la enzima BamHI, corrida electroforética, transferencia y posterior hibridación con la Sonda A (Figura 1) obtienen el siguiente resultado: c) Con los datos obtenidos en la PCR y en el Southern, re-evalúe el genotipo para cada individuo de la familia, indicando el número de repeticiones GGGGCC (en caso de no poder obtener un número exacto, haga una estimación). Comparando los genotipos deducidos aquí, ¿cómo explica ahora el resultado obtenido en la PCR de la Figura 2? Por otro lado, un grupo de investigadores de otra universidad que analizó un grupo de familias similares a la que se muestra en este problema afirma que la DFT asociada a C9ORF72 presenta una herencia con penetrancia incompleta. d) Analizando los resultados obtenidos para la familia DFT9, ¿puede Ud dar datos que apoyen o refuten esa afirmación? Con el objetivo adicional de indagar sobre los posibles mecanismos patogénicos desencadenados por la expansión de GGGGCC en C9ORF72, los investigadores desarrollaron un anticuerpo que reconocía a un epitope codificado por el exón 4. De esta manera, querían investigar si las inclusiones proteicas intraneuronales (supuestamente tóxicas) observadas en cerebros de individuos afectados, se debía a un depósito anómalo de esta proteína hasta ahora desconocida. Para su sorpresa, la tinción con este anticuerpo de cortes post-mortem de cerebros de individuos con expansión de GGGGCC demostró una leve tinción citoplasmática sin presencia de gránulos intraneuronales. Paralelamente a este trabajo, un grupo que se encontraba estudiando otras enfermedades asociadas a expansión nucleótidica reportó la existencia de un mecanismo traduccional nuevo: la traducción proteica llamada “RAN” (del inglés “repeat-associated non-ATG translation”). Estos autores describieron que repeticiones nucleotídicas expandidas son capaces de formar RNA con estructuras del tipo horquilla (“hairpin”) y permitir la traducción proteica en cualquier marco de lectura aun a partir de sitios que no poseen AUG. Se postula que estructuras de horquilla estables son permisivas para un inicio de la traducción en sitios no-AUG. Con este dato en mente, nuestros investigadores realizaron una predicción bioinformática de la estructura secundaria del RNA con contenido 83 Genética Humana GGGGCC y observaron que poseía una estructura tipo horquilla que se hacía más estable cuanto mayor era el número de repeticiones. Para estudiar la posibilidad de que in vivo ocurriera traducción tipo RAN en C9ORF72 expandido, decidieron producir tres anticuerpos monoclonales que reconocieran, por separado, a repeticiones de los dipéptidos Glicina-Alanina, Glicina-Prolina ó Glicina-Arginina. e) ¿Cómo fue que llegaron a la conclusión que éstos debían ser los epitopes para generar los anticuerpos y así evaluar posible traducción RAN? Al realizar tinciones de cortes de cerebro de individuos con expansión en C9ORF72 usando cualquiera de los tres anticuerpos monoclonales, observaron una tinción granular en el citoplasma neuronal. f) ¿Qué controles debieron haber hecho para confirmar la especificidad de la tinción observada en cerebros con expansión en C9ORF72? Finalmente, para ahondar en el posible rol patogénico de la traducción tipo RAN en C9ORF72 y un posible efecto tóxico de los agregados proteicos observados, los investigadores realizaron estudios en neuronas corticales de rata en cultivo. Primero, clonaron, en vectores de expresión carentes de ATG, repeticiones variables de GGGGCC. Luego, los usaron por separado para transfectar neuronas; y realizaron: 1) un Western blot utilizando el anticuerpo anti-Glicina-Alanina y 2) un experimento de medición de la velocidad de transporte axonal de una molecula “cargo” (“cargamento” en español) marcada fluorescentemente (mediante microscopía con registro de imágenes en tiempo real). Los resultados se muestran en la Figura 4. g) Analizando el Western blot, ¿qué conclusiones obtiene sobre la posibilidad de traducción RAN y el número de repeticiones de GGGGCC? (recuerde la predicción de estructura secundaria del RNA). h) Tomando en consideración todos los resultados de la Figura 4, y teniendo en cuenta el siguiente dato: “Análisis de familias con expansión en C9ORF72 demostró que un número de repeticiones mayores a 30 está ligada a DFT”, proponga un posible mecanismo por el cual la expansión del hexanucleótido estudiado ejerce su acción patógenica. 84 Genética Humana Terapia génica 85 Terapia génica basado en Jin et al (2008) Cancer Res 68: 3601; y Deharvengt et al (2010) Cancer Gene Ther.17: 325-333. p57 es un gen del cromosoma 7 que codifica a una proteína inhibidora del complejo CDK2-ciclina D1, que actúa promoviendo la transición G1-S del ciclo celular. Suponga que Ud. trabaja en un laboratorio que tiene como objetivo intentar terapia génica anticáncer de páncreas (telomerasa-positivo) in situ en un modelo animal mamífero usando un vector basado en retrovirus. ¿Qué combinación de construcciones (formando parte de plásmidos) entre las siguientes usaría Ud. para co-transfectar a las células auxiliares empaquetadoras y así conseguir partículas infectivas en el medio de cultivo? Elija entre los cassettes de cada tipo: 1) de empaquetamiento, 2) de envoltura y 3) de genes terapéuticos Fundamente en función de las construcciones no elegidas 1) 1a )I LTR gag pol LTR Ψ 1b Pcmv 1c Pcmv gag X Ψ X pol LTR: long terminal repeat Ψ: señal de encapsidación ΔΨ: señal de encapsidación mutada PCMV: Promotor del virus CMV X: deleción de 1 kb Ψ 1d gag Pcmv pol Ψ 2) 2a 2b Pcmv env de HIV Pcmv env de VSV 86 Terapia génica 3) Pcmv p57 3a 3b Ψ Ptel p57 LTR LTR Ψ Ptel p57 hairpin LTR 3c 3d LTR Ψ LTR Ptel p57 RPRd LTR Ψ 3e LTR Ptel p57 LTR Pcmv RT Ψ 3f LTR LTR Pcmv ciclina D1 hairpin Ψ Ptel: Promotor de gen telomerasa (componente proteico) RPRd: RNA polimerasa RNA-dependiente RT: Transcriptasa Reversa 87 Problemas integratorios (tipo examen) 88 Problemas integratorios 1) basado en Trifunovic et al., Nature. (2004) 429(6990):417-23. y Stewart et al., PLoS Biol. (2008) Jan;6(1):e10 El genoma mitocondrial (mtDNA) de mamíferos es muy pequeño (16 kb): contiene una corta región no génica y solamente 13 genes que codifican a polipéptidos, todos involucrados en el ciclo de Krebs y cadena respiratoria, procesos cuya alta eficiencia es clave en una célula eucariota saludable; todos los demás polipéptidos mitocondriales están codificados en el núcleo. La perpetuación del genoma mitocondrial está garantizada por la DNA Polimerasa mitocondrial (llamada Pol γ), que es esencial. Su fidelidad es alta y similar a la de la DNA Pol III de E. coli y su equivalente nuclear en eucariotas, a juzgar por su idéntica frecuencia de incorporación de nucleótidos erróneos in vitro = 1 x 10-6. Sin embargo, el valor de reloj molecular de la región no génica del genoma mitocondrial en mamíferos es 1%/MY versus 0.1%/MY para regiones intergénicas e intrones del genoma nuclear de mamíferos (MY = millón de años). a) ¿A qué se podría atribuir esa diferencia de 1 orden de magnitud? Con la intención de investigar sobre la estabilidad del mtDNA en mamíferos (la cual se sabe se va perdiendo con la edad en individuos normales), se empezó por poner a punto un cultivo de células de blastocisto (stem embrionarias) de ratón XX (sexo femenino) pre-implantación. b) ¿esperaría encontrar el cromosoma X inactivado al azar o por imprinting en esas células en cultivo? En cualquier caso, ¿qué RNA no codificante esperaría encontrar asociado al cromosoma inactivado? c) ¿esperaría que los extremos cromosómicos de esas células reclutaran y activaran señales de daño genómico? d) en base al fenotipo de proliferación celular, ¿esperaría que la proteína p53 estuviera fosforilada todo el tiempo en esas células cultivadas? A continuación se transfectaron esas células en cultivo con el siguiente plásmido suicida: neoR: gen de resistencia a G418 con su propio promotor. E1, E2, E3 y E4: exones de Pol γ gancS: gen de sensibilidad a ganciclovir I1, I2 e I3: intrones de Pol γ E3 corresponde al dominio proteico donde reside la actividad 3´→ 5´ exonucleasa (proofreading), pero contiene un codón para Alanina en lugar del wild type para Aspártico, el cual es esencial para dicha actividad 89 Problemas integratorios A la semana se agregó G418 y a las 2 semanas, ganciclovir; a las 3 semanas, se cosecharon las células. Luego, el núcleo de una de esas células fue transplantado a un óvulo de ratón desprovisto de su propio núcleo; el pequeño embrión resultante desarrollado in vitro fue implantado en el útero de un ratón hembra que actuó como madre adoptiva. El experimento fue repetido varias veces hasta tener éxito y lograr una cría (ratoncito llamado F0). e) ¿Tendrá F0 telómeros anormalmente cortos, tal como le pasó a la oveja Dolly? f) Indique en la Figura, mediante flechas apuntando a la izquierda y a la derecha, posibles regiones para anclar primers de PCR, forward y reverse, para confirmar que F0 es el mutante esperado ¿Esperaría la mutación en todas las células de su cuerpo? ¿en homocigosis o en heterocigosis? Analizando por pirosecuencación el genoma mitocondrial de F0 recién nacido, se encontró que contenía muchas sustituciones nucleotídicas, comparando con el genoma mitocondrial murino publicado, en todos los tejidos somáticos analizados. Luego, se cruzó al F0 adulto con otro wild type macho para obtener animales F1 y por cruzas múltiples entre ellos se generaron F2, algunos de los cuales nacieron con aun más sustituciones nuevas (no heredadas) en su mtDNA que las que habían incorporado F0 y F1. Esos F2, aun siendo jóvenes, mostraron síntomas de vejez. g) Siendo el mtDNA heredado solamente por vía materna, ¿tienen sentido las cruzas realizadas? h) ¿A qué se deberán la inestabilidad genómica mitocondrial hallada y los signos de vejez prematura? 90 Problemas integratorios 2) basado en los últimos trabajos de Shinya Yamanaka, pionero mundial en células madre, premio Nobel 2012 MEFs (de ratón hembra) fueron incubados junto con tres (simultáneamente) tipos de partículas retrovirales deficientes en su replicación, previamente aisladas del medio donde se cultivaron las células empaquetadoras. Cada tipo de partícula llevaba, entre los dos LTR, una única y diferente secuencia de RNA codificante, además de la secuencia Ψ. Todas poseían la proteína de membrana env “G” del virus VSV. Después de unos días, las células fueron sembradas en cajas de Petri especiales, formando, después de un par de semanas, colonias con distintas morfologías. Estas colonias fueron propagadas de manera clonal. Se eligió una colonia, cuyas células, bautizadas “CCCC” (Células Creadas Casi Casualmente), fueron sometidas a los siguientes experimentos: i) Tratamiento de núcleos con gran cantidad de DNAsa I y posterior PCR específica para el exón 4 (160 pb) del gen Fbx15. Resultado: ausencia de amplificación, contrastando con los MEFs de partida, que dieron fragmento amplificado de 160 pb. ii) DNA genómico total con bisulfito, seguido de PCR para gen Fbx15. Resultado: muchas más C convertidas a T, comparando con MEFs iii) ChIP con anticuerpo anti-MeH3K9 seguido de Real-Time PCR para Fbx15 (Fig. 1). iv) ChiP con anticuerpo anti-HP1 (Heterochromatin Protein 1) seguido de RealTime PCR para Fbx15 (Fig 2). MEFs MEFs CCCC CCCC Figura 1. Análisis de Real-Time PCR para Fbx15. sobre DNA obtenido mediante ChIP con anticuerpo anti-MeH3K9. Figura 2. Análisis de Real-Time PCR para Fbx15. sobre DNA obtenido mediante ChIP con anticuerpo anti-HP1. v) inyección en blastocisto femenino e inmediata transferencia a útero de ratón de otra cepa. Resultado: nacimiento de ratones quimera! 91 Problemas integratorios Preguntas: a) ¿Se habrán integrado los cDNAs de origen retroviral en el algún sitio del genoma de las células manipuladas? ¿Qué secuencia actuó como promotor? ¿Para qué sirvió, y en qué células, el elemento Ψ? ¿Existe riesgo que esas células produzcan virus? b) ¿Qué sobresaliente propiedad es exhibida por las CCCC a diferencia de los MEFs originales? c) Uno de los cDNA transferidos fue Oct3/4 ¿Su acción pudo haber provocado el resultado de i)? En caso afirmativo, ¿qué complejos endógenos con actividad enzimática pudieron haber mediado para explicar la causalidad? d) ¿Cómo se compatibilizan los resultados de iii) y iv) con los de ii) y lo que Ud. sabe de interacciones moleculares involucradas en epigenética? Si lo desea, explique ayudándose con un dibujo de posible modelo que muestre los eventos sugeridos en forma secuencial. e) ¿Qué patrón de inactivación de los cromosomas X habrán tenido los MEFs originales? ¿Al azar o de acuerdo a su origen parental? ¿Y cómo será en KEFs (“kangaroo embryonic fibroblasts”)? 92 Problemas integratorios 3) basado en Yuan et al. (2003) Cancer Research 63: 4174-4180. Para identificar múltiples genes diferencialmente expresados en tumores de mama, se realizó una hibridización de cDNA total de células epiteliales de glándula mamaria tumorales de una paciente, marcado con dUTP rojo, vs. cDNA de células epiteliales de mama normales de la misma paciente, marcado con dUTP verde, sobre un microarray que contiene 30.000 genes humanos diferentes. Entre los varios casilleros del microarray que mostraron fluorescencia verde/rojo >3, se centró la atención en uno que correspondía a un gen catalogado por el Proyecto Genoma Humano con el nombre “ARHI”. Este gen no pertenece a ninguna familia génica, mapea en el cromosoma 1p31 y contiene una isla CpG en su enhancer. Para asegurarse de que el gen en el tumor no contiene mutaciones somáticas (y así convalidar los resultados como una verdadera expresión diferencial), se comenzó por determinar la secuencia de la isla en la paciente. Para ello, se la amplificó por PCR usando DNA genómico total como molde y primers específicos, el producto se ligó a un plásmido para transformar bacterias, luego se purificó el plásmido de 10 clones y finalmente se determinó la secuencia del inserto de cada uno de esos clones. Esta metodología también se siguió usando DNA genómico de la hija de esta paciente. En experimentos paralelos, los DNA genómicos fueron tratados con bisulfito antes de hacer las PCR. Los resultados fueron: Origen del DNA Nº clones con cada tipo de sec. Secuencias según protocolo standard Glándula mamaria normal de paciente 5 5 Tumor de paciente 6 AAGCCGCGGCAGTCTCTCCGAGCAGCGCATT GGGCCGCGGCAGTCTCTCCGAGCAGCGCATT AAGCCGCGGCAGTCTCTCCGAGCAGCGCATT GGGCCGCGGCAGTCTCTCCGAGCAGCGCATT GGGCCGCGGCAGTCTCTCCGAGCAGCGCATT AGGCCGCGGCAGTCTCTCCGAGCAGCGCATT 4 Glándula mamaria (normal) de la hija 4 6 Origen del DNA Nº clones con cada tipo de sec. Secuencias según protocolo con bisulfito Glándula mamaria Normal de paciente 5 AAGTCGCGGTAGTTTTTTCGAGTAGCGTATT GGGTTGTGGTAGTTTTTTTGAGTAGTGTATT AAGTCGCGGTAGTTTTTTCGAGTAGCGTATT GGGTCGCGGTAGTTTTTTCGAGTAGCGTATT GGGTCGCGGTAGTTTTTTCGAGTAGCGTATT AGGTTGTGGTAGTTTTTTTGAGTAGTGTATT Tumor de Paciente Glándula mamaria (normal) de la hija 5 7 3 4 6 en negrita se indican los dinucleótidos CpG de la isla 93 Problemas integratorios a) ¿A qué corresponden los dos tipos de secuencias diferentes hallados para cada muestra de DNA? b) ¿Qué indican los datos de secuencia post-bisulfito acerca de la región regulatoria del gen en células normales? c) ¿Qué resultados hubieran arrojado las secuencias post-bisulfito si el tratamiento con bisulfito se hubiera hecho sobre el producto de PCR, en lugar de hacerlo sobre DNA genómico? ¿Qué resultados hubieran arrojado las secuencias post-bisulfito derivadas del tumor si el tratamiento con bisulfito se hubiera realizado sobre un clon BAC -que contuviera al gen ARHI- proveniente de una genoteca del tumor, en lugar de hacerlo sobre DNA genómico? d) ¿Qué sugieren los resultados acerca de la modalidad de expresión de ARHI en células normales? Basándose en las secuencias de la hija ¿qué concluye con respecto a la herencia del alelo expresado? e) Los resultados post-bisulfito ¿apoyan los resultados de transcriptómica (microarray) en el tumor? ¿Qué diferencias en la estructura de la cromatina esperaría hallar entre la región regulatoria del gen en células tumorales vs. la presente en células normales? En base a los resultados, proponga una función para ARH1 y un evento posible que explique la génesis del tumor, indicando una enzima participante como iniciadora. f) Qué marcas epigenéticas en lisinas de histonas esperaría encontrar en el enhancer estudiado en el tumor? Dibuje un posible modelo que explique el cross-talk entre dichas marcas y las analizadas en este problema. g) Luego de cultivar las células tumorales de la paciente durante varios “pasajes” ¿esperaría encontrar en esas células una activación de proteínas del pathway de respuesta a daño tales como ATM, ATR, CHK1, CHK2 y -H2AX? 94 Problemas integratorios 4) Hace algunos años, se sospechaba que en mamíferos, la proteína p53 tiene muchos genes target. a) Explique la metodología que se habrá elegido para identificar a los múltiples genes target de p53. ¿Qué gen/es se habrá elegido en primer lugar, como control positivo de tal metodología? b) Basándose en los datos del paper de Esnault et al (en la guía de seminarios: “Dinamismo de los genomas; transposones”), estime el orden de magnitud de la probabilidad de que, en una célula humana, un LINE endógeno se movilice hacia el gen p53, lo interrumpa y predisponga a un cáncer. Datos eventualmente útiles: tamaño del gen p53: 10 Kb número de copias del gen p53 en el genoma: 1 (en el cromosoma 17) número de exones de p53: 11 tamaño promedio de un LINE: 7 Kb número de copias de LINEs en el genoma humano: aprox. 100.000 tamaño del genoma humano haploide: 3 x 109 pb 95 Problemas integratorios 5) basado en Chong et al, Nature Genetics (2007) 39: 614–622; Zhu et al, Hum Genet 2007; Xie et al, Hum Mol Genet 2006 La fibromatosis gingival hereditaria (HGF) es una rara enfermedad de la boca que consiste en un desarrollo anormal pero benigno de tejidos gingivales (encías). El locus responsable no se conoce pero se sabe que se encuentra en el cromosoma 11p15 y muy ligado al marcador D11S4046 (LOD score = 8.70). Estudiando una familia de la India afectada de HGF se observó un patrón de herencia esperable de acuerdo a lo que se sabe (similar al de la enfermedad de Angelman), como se muestra en la Fig. 1, pero curiosamente también se observó una rama de la familia donde se ve el patrón opuesto. Todos los individuos enfermos y todos los transmisores sanos tenían una misma variante polimórfica del marcador D11S4046, ausente en los sanos no transmisores. Fig. 1. Arbol genealógico (simulado) de una familia afectada de HGF. Los símbolos llenos señalan a los individuos con síntomas de HGF. El asterisco (*) señala a los únicos individuos vivos heterocigotas para una mutación (heredada) en el gen DNMT3L (ver texto más abajo), que se expresa solamente en la línea germinal masculina diploide (antes de la meiosis) pero no en el cigoto ni embrión ni células somáticas adultas. Todos los demás individuos vivos son wild type homocigotas para el gen DNMT3L. En un intento de descubrir las causas moleculares de la excepción observada, se analizó el genotipo de todos con respecto al gen DNMT3L, localizado en el cromosoma 21q22.3 y que codifica a la DNA (citosina) Metil Transferasa 3L, activa solamente en la espermatogénesis pre-meiosis. El análisis reveló que el individuo varón II.6 y dos de sus hijas son heterocigotas para una mutación treonina → lisina, que afecta la estabilidad de la enzima. Esa mutación es dominante debido a que el alelo wild type no alcanza para lograr su función bioquímica de manera apropiada (en Genética, se dice que en estos casos, el alelo sano es “haploinsuficiente”). La mutación recién descripta explica el patrón de herencia atípico de la enfermedad, hallazgo interesante porque indica un caso de “efecto paterno”, reportado en invertebrados pero no en vertebrados. Sin embargo, el individuo enfermo III.17, no heredó la mutación en DNMT3L de su padre, es decir es wild type en los dos alelos de ese gen. Estudiando más en profundidad al padre II.6, se le analizó el patrón de metilación de una isla CpG en el locus D11S4046 de células somáticas por la técnica del bisulfito. En la Fig. 2 se muestra el resultado. 96 Problemas integratorios Fig. 2. Resultado de la reacción del bisulfito para ese locus en células somáticas. Cada línea horizontal representa una reacción de secuenciación post-subclonado (un epialelo). Los círculos llenos indican citosinas metiladas. Los círculos blancos, citosinas no metiladas. Como control se incluyó al niño III.20 Preguntas: a) Proponga un mecanismo molecular capaz de explicar la atípica transmisión de HGF del padre (individuo II.6) a la hija III.17. ¿Por qué el genotipo DNTM3L fue irrelevante en el desarrollo o no de la enfermedad en sus cuatro hijos? b) ¿Es esperable encontrar alguna anomalía en cuanto al imprinting en general en los cuatro hijos de II.6? ¿Habrá fallado la inactivación de uno de los dos cromosomas X (preimplantación embrionaria) en sus tres hijas? c) ¿La mutación en el alelo HGF que causa enfermedad se comporta como dominante? ¿Analizando qué individuo/s tiene sentido la pregunta? En caso afirmativo, ¿es posible deducir si dicho alelo produce una proteína dominante negativa o por el contrario es un alelo nulo, es decir que no produce ninguna proteína funcional? d) ¿Es necesario indefectiblemente contar con una genoteca construida en BACs para llegar a identificar el gen cuya versión mutada es responsable de la HGF? ¿A partir de qué locus comenzaría el caminado cromosómico para llegar a un gen candidato? 97 Problemas integratorios 6) basado en los resultados de Callegari et al (Hepatology 2012); y Moshiri et al (Gastroenterol Hepatol Bed Bench 2014) Los niveles del microRNA-221 (miR-221) están aumentados en hepatocarcinoma y por lo tanto se sospechaba que constituyen una de las causas de la progresión de tumores hepáticos. Para confirmar su hipótesis, y para contar con un nuevo modelo útil en una eventual terapia química y génica contra esta enfermedad, los autores generaron ratones transgénicos con alta expresión de miR-221 en hepatocitos. A nivel fenotípico, estos ratones mostraron resultados esperados: lesiones hepáticas espontáneas y una inusual aceleración del desarrollo tumoral inducido por mutágenos como la dietilnitrosamina. a) Comparando hepatocitos del ratón normal y del transgénico, ¿esperaría que los telómeros tengan igual o diferente largo promedio? ¿Qué técnica sencilla elegiría para confirmarlo? Dibuje el resultado esperado. b) Si se realizara ChIP sobre núcleos de hepatocitos del tumor, y se usara anticuerpo contra Histona H2AX fosforilada (γ-H2AX), ¿esperaría Ud. que inmunoprecipite DNA correspondiente a genes cercanos a los telómeros? c) Teniendo en cuenta que el target específico de miR-221 es el mRNA de la proteína p27, la cual es inhibidora de una CDK (kinasa dependiente de ciclinas) que fosforila a Rb, ¿Ud. le encuentra sentido que dicho miRNA tenga efecto tumorigénico? d) ¿El miR-221 tiene una función sobre el ciclo celular similar u opuesta a la del miR-34 visto en el paper de Gregory Hannon (pág 62 de la Guía de Seminarios)? Con la intención de “secuestrar” al miR-221 montado en RISC, estos investigadores diseñaron además un RNA de unos 100 nt que contiene repetida cuatro veces (1, 2, 3, 4 en la Figura de la página siguiente, panel A) la secuencia complementaria al componente antisentido de miR-221. A ese RNA artificial lo llamaron “esponja”, aludiendo a la función deseada. Los autores probaron la eficiencia de esa “esponja” molecular, en el contexto de un vector adenovirusasociado (AAV), en una línea celular (que expresa miR221 endógeno) co-transfectada con el gen reportero luciferasa fusionado a la porción 3’UTR del mRNA de p27 (Figura, panel A). e) ¿En base a los resultados de la Figura (paneles B y C), ¿le parece en principio promisoria la “esponja” molecular diseñada, para probarla sobre los ratones transgénicos modelo? ¿Cuál habrá sido la idea de medir niveles de la proteína actina (panel C)? 98 Problemas integratorios 99 Descargar 1. Apuntes 2. Apuntes de enseñanzas medias 3. Biología, Botánica y Zoología Guia Problemas 2016.doc Determinación del origen de la carne mediante la detección de CYTBT-I 2015-8.pdf EXAMEN DE BIOLOGÍA MOLECUL4R GRUPO A JUNIO−99 Proceso de replicación • Farmacia • Traducción en Procariotas • Replicación de los genes • Problema Telomérico • DNA Polimerasa • RNA Polimerasa CyTBT-I 2012-6.pdf CYTBT-I 2013-8-1.pdf Investigadores españoles descubren el `gen Examen del curso de Variaciones Geonómicas GENES Y GENOMAS: LA PARADOJA DE LA COMPLEJIDAD instrucciones: escribe sobre la línea qué tipos de texto son los ¿Qué es la bioética hoy studylib.es © 2017 DMCA Alertar