Download Genoma Humano - Blog de Química Biológica Patológica
Document related concepts
Transcript
Química Biológica Patológica Técnicas de Biología Molecular aplicadas a Bioquímica Clínica 2015 Tema 1 Dra. Silvia Varas curso.tecmol@gmail.com Tema 1 Genoma Humano Proyecto Genoma Humano Controversias Éticas Mutaciones mas comunes según Human Gene Mutation Database Deleciones y Mutaciones puntuales Estrategias de laboratorio DEFINICIONES Genoma: es el set completo de genes de un organismo Transcriptoma: completo set de genes que se expresan (todas las moléculas de RNA) Proteoma: completo set de polipéptidos codificado por un genoma completo GENOMA Es la base de la herencia de un organismo Larga secuencia de ADN que contiene toda la información que define a un organismo. Físicamente, esta formado por diferentes moléculas de ADN o cromosomas Funcionalmente, el genoma esta dividido en genes Cada gen es la secuencia de ADN que codifica para un tipo de RNA (algunos son polipéptidos posteriormente). Genoma Humano Su detallado conocimiento esta ligado al proyecto genoma humano En 1986 el Dpto de Energía de los EEUU lideró la iniciativa y puso en marcha el mayor proyecto biomédico de la historia. Oficialmente se inicia en octubre 1990. Hasta conseguir la secuenciación completa en 2005. Proyecto Genoma Humano El Proyecto Genoma Humano ha identificado la mayoría de los genes presentes en el núcleo de las células humanas y ha establecido la localización que ocupan estos genes en los 23 pares de cromosomas del núcleo. Proyecto Genoma Humano En 1990 se inició oficialmente. En los 1ºcinco años: construir mapas genéticos (de ligamiento) y de mapas físicos (clones) de todo el genoma. En el etapa de mayor actividad del programa se secuenciaba 1000 nt/seg. Francis Collins (director del CONSORCIO Proyecto Genoma Humano) y Craig Venter (gerente de Celera Genomics) MAPAS Genéticos: marcadores usados en estudios de ligamiento RFLP VNTR, STR SNP Físicos Mapas de restricción STS Sitio Etiquetado de pares de bases (Pequeña secuencia de localización y secuencia conocida. Inicialmente separados en 100Kb). Proyecto Genoma Humano: representación Si cada par de nucleótidos se dibuja para abarcar 1 mm, entonces el genoma humano se extendería 3.200 kilometros lo suficiente para cruzar la línea a través del centro de África (línea roja). A esta escala, habría, en promedio, un gen codificante para proteína cada 130 m. Un gen promedio se extendería por 30 m, pero las secuencias codificantes de este gen podría abarcar algo más de 1 metro. Genoma Humano: citas International Human Genome Sequencing Consortium (2001) Initial sequencing and analysis of the human genome. Nature 409, 860–933. International Human Genome Sequencing Consortium (2004) Finished: the euchromatic sequence of the human genome. Nature 431, 931– 45. Genoma humano El genoma humano haploide consiste de 3200 millones pb de DNA Se suponía en un principio que el genoma humano podría tener unos 50.000 a 100.000 genes genes distribuidos en los 23 pares de cromosomas de la célula Genoma humano: Historia Si 6.000 genes pueden producir una levadura, y 14.000 a una mosca, ¿cuántos se necesitan para codificar un ser, una criatura compleja humano, curiosa y lo suficientemente inteligente como para estudiar su propio genoma? Hasta que los investigadores completaron el primer borrador de la secuencia del genoma humano, la estimación más citada fue 100.000. Pero ¿de dónde esa cifra? ¿Y de donde sale la nueva estimación de sólo 25.000? Walter Gilbert, un físico convertido en biólogo y quien ganó el Premio Nobel por el desarrollo de técnicas de secuenciación de ADN, fue uno de los primeros en lanzar una estimación aproximada del número de genes humanos. A mediados de la década de 1980, Gilbert sugerido que los humanos podrían tener 100.000 genes, una estimación basada en el tamaño medio de los pocos genes humanos conocidos en el momento (aproximadamente 3x104 pares de nucleótidos) y el tamaño de nuestro genoma (3x109 pares de nucleótidos). Hizo un cálculo que produjo un número con una redondez agradable tal, que terminó siendo citado ampliamente en artículos y libros de texto. Comparación de secuencias de nucleótidos de muchos vertebrados diferentes revela regiones de alta conservación La secuencia de nucleótidos examinado en este diagrama es de un pequeño segmento del gen humano para una proteína transportadora de membrana plasmática. La secuencia del exón se conserva en todas las especies, incluyendo el pollo y pescado. Tres bloques de la secuencia del intrón que se conservan en los mamíferos, pero no en la de pollo o pescado, se muestran en azul. las funciones de secuencias de intrones más conservadas en el genoma humano (incluyendo estos tres) no son conocidos. Tipos de Secuencia Constitución Gran % del genoma humano consiste de secuencia repetidas. Incluyen grandes duplicaciones y repeticiones sencillas. Los genes ocupan solo el 25% del genoma humano, pero las secuencias que codifican proteínas son solo una pequeña parte de esa fracción(1%). La mayor parte del genoma humano está compuesto de no codificante y secuencias de nucleótidos repetitivos. Las LINEs, SINEs, transposones similar a retroviral, y los transposones-ADN son elementos genéticos móviles que se han multiplicado en nuestro genoma mediante la replicación de sí mismos y la inserción de las nuevas copias en diferentes posiciones. Las repeticiones simples son secuencias de nucleótidos cortas (menos de 14 pares de nucleótidos) que se repiten una y otra vez durante largos períodos. Las duplicaciones de segmentos son bloques grandes del genoma (1000-200.000 pares de nucleótidos) que están presentes en dos o más lugares en el genoma. Las secuencias únicas que no son parte de ningún intrones o exones (verde oscuro) incluyen elementos reguladores de genes, así como las secuencias cuyas funciones no se conocen. Los bloques más altamente repetidas de ADN en la heterocromatina aún no se han secuenciado por completo; por lo tanto, cerca del 10% de las secuencias de ADN humano que no están representados en este diagrama SINE (Short Interspersed Nuclear Elements, elementos nucleares dispersos cortos): elementos Alu, 250-280 nucleótidos, con unas 1.500.000 copias. Los LINE (Long Interspersed Nuclear Elements, o elementos nucleares dispersos largos) constituyen un 20 por ciento del genoma humano. Son secuencias con un con un tamaño de varias kilobases Transposones ADN Organización del Cromosoma 48x106=1,5% A) El cromosoma 22, uno de los más pequeños cromosomas humanos, contiene 48 X 106 pares de nucleótidos y constituye aproximadamente el 1,5% de todo el genoma humano. La mayor parte del brazo izquierdo del cromosoma 22 se compone de secuencias cortas repetidas de ADN que son empacados en una forma particularmente compacta de la cromatina (heterocromatina). (B) una expansión de diez veces de una porción del cromosoma 22 muestra unos 40 genes. los de color marrón oscuro se conocen como genes y los rojos se predice genes. (C) una porción ampliada de (B) muestra toda la longitud de varios genes. (D) el arreglo intrón-exón de un gen típico se muestra después de una ampliación de diez veces más. cada exón (rojo) codifica para una porción de la proteína, mientras que la secuencia de ADN de los intrones (gris) es relativamente poco importante. (Adaptado de la Human Genome Sequencing Consortium International, Nature 409:860-921, 2001 Proyecto Genoma Humano: ESTADISTICAS Se estima que el genoma humano contiene en torno a los 20 000-25 000 genes. Alrededor de un 50 por ciento del genoma humano está constituido por ADN repetitivo. Se puede estimar que la densidad media de genes es de 1gen/ 100 kb, aunque existen regiones ricas en genes (algunas zonas del cromosoma 19, por ejemplo) y otras regiones que son muy pobres en genes (como el cromosoma Y). Por tanto, se puede deducir una frecuencia media de 10 genes/ Mb de secuencia. El tamaño promedio de un gen humano es de 20-30 kb, aunque hay grandes diferencias de unos genes a otros. El número de exones que forman un gen es muy variable (desde genes que tienen un solo exón hasta algunos genes con 100 exones o más), pero podemos establecer un valor promedio de 7-8 exones/gen. El tamaño medio de un exón es de 150 nucleótidos. Por lo que respecta a los intrones, en cambio, existe una enorme variabilidad de tamaños, y no es infrecuente encontrar en casi todos los genes algún intrón de gran tamaño. El tamaño medio de un ARNm es de 1,8-2,2 kb incluyendo las regiones notraducidas flanqueantes. La longitud media de una región codificante es de 1,4 kb. Proyecto Genoma Humano: HALLAZGOS El rasgo más notable del genoma humano es el pequeño porcentaje que codifica para proteínas, RNAs estructurales y RNAs catalíticos. Casi la mitad del ADN restante se compone de elementos genéticos móviles que han colonizado nuestro largo genoma durante el tiempo evolutivo. Una segunda característica notable del genoma humano es el tamaño grande del promedio de los genes (27.000 pares de nucleótidos). Sólo se requieren alrededor de 1.300 pares de nucleótidos que codifica una proteína de tamaño medio (unos 430 aminoácidos en los seres humanos). La mayor parte del ADN que permanece en un gen consiste en largos tramos de ADN no codificadora en los intrones entre los exones que codifican proteínas relativamente cortos Además de los intrones y exones, cada gen se asocia con secuencias de ADN reguladoras que aseguran que el gen se expresa en el nivel y el momento adecuado, y en el tipo apropiado de célula. En los seres humanos, estas secuencias de ADN reguladoras están normalmente distribuidos en decenas de miles de pares de nucleótidos, mucha de la cual parece ser ADN "espaciador". Los exones y secuencias reguladoras comprenden menos del 2% del genoma humano. Otra característica sorprendente del genoma humano es su número relativamente pequeño de genes. Las estimaciones anteriores habían sido de alrededor de 100.000. Aunque el número exacto todavía no está claro, estimaciones revisadas indican que el número de genes humanos en alrededor de 25.000, nos compara al números de genes de animales multicelulares más simples, tales como Drosophila (14.000), C. elegans (19.000). Proyecto Genoma Humano: búsqueda del número de genes Si a una secuencia la leemos de a tripletes solo hay 3 posibles caminos de la traducción a aminoácidos. Estas posibilidades se llaman marcos de lectura En ADN genómico: cuando se busca en el recuento teórico del número de genes se tuvieron se buscaron el número de ORFs (open reading frames): secuencias de 100 codones comprendida entre un codón de inicio (AUG) de la traducción y un codón de terminación, descontando las secuencias que corresponden a los intrones en caso de haberlas. Se encuentra acotado por los UTRs, o secuencias no traducidas. Existen programas que son usados para la búsqueda de ORFs, los cuales se inician con el codón ATG, y terminan con un codón de terminación TAA, TAG, o TGA. POLIMORFISMO / SNP Se llama polimorfismo genético a la coexistencia de múltiples alelos en un locus de una población. Un locus es polimorfico cuando esta presente >1% en una población. Cuando 2 alelos se comparan y hay solo 1 nt de diferencia se llama SNP, (pronunciado como snips) (single nucleotide polymorphisms). Hay mas de 10 millones de SNP Se han identificado mas de 6 millones de SNP Hay 1 SNP/1330 pb. Los Polimorfismos de un solo nucleótido (SNPs) son secuencias en el genoma que difieren en un solo par de nucleótidos entre una porción de la población y otra. Proyecto Genoma Humano: Individualidad Genética No hay 2 personas iguales (excepto gemelos) Cuando se compra la misma región del genoma en 2 personas difiere en 0,1% 3 millones de diferencias en el genoma La mayoría son de un único cambio de nucleótidos llamados SNPs La gran ventaja de los SNP sobre los demás tipos de marcadores, además de ser tan abundantes y estar muy uniformemente distribuidos por todo el genoma humano, es la posibilidad de analizarlos mediante métodos automatizables a gran escala, como los microarrays Proyecto Genoma Humano: Individualidad Genética Otro importante origen de la variación heredadas de nuestros ancestros es la duplicación y deleción de grandes blocks de DNA. Cuando el genoma de cualquier persona es comparada con el genoma de referencia estándar se observa al menos 100 diferencias que involucran grandes blocks de secuencia. Algunas de estas diferencias son muy comunes, sin embargo otras estas presentes en una pequeña minoría de la población. En un estudio, por ejemplo, los investigadores compararon el genoma de un ser humano "normal" con la secuencia original generada por el Proyecto Genoma Humano y encontraron que se diferenciaban por 297 variantes estructurales de segmentos de tamaño intermedio (8 kilobases): 139 inserciones, 102 deleciones y 56 inversiones. Este es un nivel notable e inesperado de la variación genómica a gran escala ¿El genoma humano es patentable? El 11 de Noviembre de 1997, la UNESCO aprobó la DECLARACIÓN UNIVERSAL SOBRE GENOMA HUMANO Y LOS DERECHOS DEL HOMBRE, fijando tres principios: La dignidad del individuo cualesquiera sean sus características genéticas. Rechazo al determinismo genético. El Genoma Humano es PATRIMONIO DE LA HUMANIDAD. Controversias éticas El conocimiento del genoma humano tiene también diversas implicaciones éticas, jurídicas y sociales, estimulando un debate internacional sobre algunos aspectos: Patentar secuencias de genes humanos para uso comercial. Confidencialidad en la información obtenida, como por ejemplo, poner la información sobre genética humana a disposición de empresas de seguros. La libertad a no saber si se es o no portador de una enfermedad genética. EN RESUMEN: GENOMA HUMANO Longitud del ADN Número de genes 3,2x109 pb Gen mas largo 2,4 x106 pb 25.000 Tamaño medio de gen Menor nº de exones /gen Mayor nº de exones /gen Nº medio de exones /gen 27.000 pb 1 178 10,4 Tamaño del exón mas largo 17.106 pb Tamaño medio de exon Nº de pseudogenes % de la secuencia del DNA en los exones (secuencias que codifican proteínas % de la secuencia del DNA en secuencias altamente conservadas* % de DNA elementos altamente repetitivos *: incluye 145 pb Mas de 20.000 1,5% 3,5% 50% DNa que codifica 5’ y 3’ UTRs (untranslated regions of mRNAs), genes de RNAs estructural y cataliticos, regiones regulatorias de ADN y regiones conservadas de función desconocidas. Polimorfismo y Mutación Cuando la frecuencia alelica, del alelo más raro es del uno por ciento o mayor, ese locus se llama locus polimórfico, y esa variación se denomina polimorfismo. Cuando la variación es menos frecuente es una mutación, es más grave y desencadenan una enfermedad Human Gene Mutation Database (HGMD) http://www.hgmd.org/ Número Total de Mutaciones Missense/nonsense Splicing 9% 2% 56% Regulatory Small deletions 15% Small insertions Gross deletions 6% 5% 7% Small indels, Repeat variations, Gross insertions/duplications, Complex rearrangements Total: 148.413 mutaciones informadas 24-06-14 Espectro de diferentes tipos de mutaciones en genes humanos (Human Gene Mutation Database) Mutaciones sin sentido Mutaciones con cambio de sentido 14.363 mutaciones en 783 genes Espectro de diferentes tipos de mutaciones en genes humanos (Human Gene Mutation Database) 24-6-14 Complex rearrangements 1504 Gross insertions/duplications 2600 Repeat variations 434 Small indels 2173 Gross deletions 10963 Small insertions 9423 Small deletions 22610 Regulatory 2884 Splicing 13641 Single base pair substitutions Missense/nonsense 82176 Mutaciones sin sentido/con cambio de sentido Mutaciones Puntuales Hay de 2 TIPOS: La clase más común es la transición de una pirimidina por otra pirimidina. O de una purina por otra purina. La menos común es la transversión en la cual una purina reemplaza a una pirimidina o viceversa 80% Missense (Mutaciones con cambio de sentido) Nonsense (Mutaciones sin sentido) 20% Mutaciones Puntuales: Sustituciones de una única par de base en genes que causan enfermedades hereditarias Hotspots Son regiones del genoma donde la frecuencia de las mutaciones esta incrementada en al menos 1 orden de magnitud. Una causa es la metilación de 5metil-citosinatimidina En los hotspots (5-CH -C) la mutación es una transición de G-C por A-T 3 DELECIONES DE GENES Las deleciones son responsables de mas 500 enfermedades hereditarias en humanos. Y estas deleciones pueden ser clasificadas en base a la longitud del ADN delecionado. Algunas deleciones consiste de solo unas pocas pares de bases hasta varias cientos de kilobases DELECIONES DE GENES 2,5 a 5% de pacientes con hemofilia A son debidos a deleciones en el gen F8C (Factor VIII) con perdida de 26 exones de un longitud 186 Kb 84% de los pacientes con deficiencia sulfatasa esteroidal (STS), con perdida de 10 exones de una longitud de 146 kb de ADN genómico. Grandes deleciones son comunes en la distrofia muscular de Duchenne, GH, RLDL y el gen de 1-globina PEQUEÑAS DELECIONES Existe un total de 2.368 deleciones de genes causantes de enfermedades con una longitud de 20 bp o menos Espectro de diferentes tipos de mutaciones en genes humanos (Human Gene Mutation Database) 24-6-15 Complex rearrangements 1504 Gross insertions/duplications 2600 Repeat variations 434 Small indels 2173 Gross deletions 10963 Small insertions 9423 Small deletions 22610 Regulatory 2884 Splicing 13641 Single base pair substitutions Missense/nonsense 82176 Mutaciones sin sentido/con cambio de sentido MUTACIONES PUNTUALES En la región regulatoria En el splicing Sin sentido (nonsense) Con cambio de sentido (missense) Estrategias en el laboratorio de Biología Molecular Grandes Deleciones Southern Blotting Microsatellites and SNPs GAP-PCR MAPH and MLPA Long-range PCR Mutaciones Puntuales y deleciones pequeñas RFLP-PCR(ER-PCR) Mutagenesis mediada por PCR Alelo-Específicas: MAS-PCR ARMS- MARMS DOT-ASO Estrategias en el laboratorio de Biología Molecular II Desconozco la mutación o polimorfismo SSCP (single strand conformation polymorphism) DGGE (Denaturing Gradient Gel Electrophoresis) SSCP SSCP (single strand conformation polymorphism) es un método simple y accesible para detectar alteraciones en la secuencia en un fragmento obtenido por PCR Fundamento: se basó en el hecho de que los fragmentos de ADN de una sola hebra relativamente cortos pueden migrar en un gel no desnaturalizante no sólo de su tamaño sino también por su secuencia. Pasos Amplificación: La muestra se enriquece en ssADN por medio de una PCR asimétrica (uno de los primers esta en mayor cantidad que el otro). Los fragmentos de ADN amplificados se someten a la desnaturalización con calor o agentes químicos, tales como formamida. Posteriormente, los fragmentos de ADN desnaturalizados se someten a electroforesis a través de un gel de poliacrilamida no desnaturalizante. El carril 1 corresponde al patrón WT para cualquier locus dado analizado. 2- Control homocigota para la mutación A y 4- para la B 3- corresponde a un caso heterocigotos A 5- doble heterocigota para las mutaciones A y B, 6-Homocigota pequeña delecion . 7- Heterocigotos y homocigotos para una pequeña deleción. 8- Heterocigotos para una pequeña inserción. Inserción Delecion DGGE (Denaturing Gradient Gel Electrophoresis) Los productos de PCR son cargados en un gel con un gradiente desnaturalizante simple complejo 20% Típicamente 20-80% formamida ADN doble cadena migra hasta encontrar su melting El melting es determinado por su secuencia y contenido de GC 80% Las diferentes secuencias migran a diferentes distancias • DESNATURALIZACIÓN DEL DNA 1. Composición de bases 2. Longitud DNA doble 3. Presencia de agentes desnaturalizantes Agentes desnaturalizantes. Formamida: Baja la T° de melting a 0,72°C cada 1% DGGE (Denaturing Gradient Gel Electrophoresis) II Ventajas Puedo cortar las bandas y secuenciar Puedo detectar pequeñas diferencias en la secuencia de DNA Desventajas Puede haber complejidad en el chorreado de las muestras Requiere una aparatología específica TUBOS EPPENDORF 200 l 500 l 1,5ml Pipetas Automáticas P-1000 100-1000 l P-200 20-200 l P-100 10-100 l P-10 0,5-10 l Termocicladores Extracción de ADN Todos los alumnos harán una extracción de muestra de sangre por punción venosa. Bibliografía Eric D. Green: The Human Genome Project and Its Impact on the Study of Human Disease Stylianos E. Antonarakis, Michael Krawczak, David N. Cooper: The Nature and Mechanisms of Human Gene Mutation