Download Análisis Conformacional 2
Document related concepts
Transcript
Clase # 8: Análisis Conformacional (II) Prof. Ramón Garduño Juárez Modelado Molecular Diseño de Fármacos Introducción • Conformación: estructura tri-dimensional de una molécula. • Análisis conformacional es el estudio de las conformaciones de una molécula y su influencia en las propiedades de esta molécula. • La mayoría de las biomoléculas funcionan a través de conformaciones específicas. • Distribución de sus conformaciones y sus energías correspondientes siguen la distribución de Boltzmann • Mínimo Global Tópicos • Búsqueda Conformacional: 1. Búsqueda Sistemática 2. Construcción de Modelos 3. Búsqueda Aleatoria 4. Geometría de Distancias 5. Dinámica Molecular • Clustering • Búsqueda del mínimo global: Algoritmo Genético y Recocido Simulado Geometría de Distancias • Usa distancias en lugar de coordenadas para definir las conformaciones. N(N-1)/2 distancias inter-atómicas en una molécula. • Este enfoque aumenta la dimensión del espacio de búsqueda de 3N en coordenadas Cartesianas o N en espacio diedro. • El beneficio de este potencial es que en cada grado de libertad el espacio de búsqueda es más pequeño. • Por ejemplo, en espacio Cartesiano, cada átomo puede estar dentro de -100 Ángstrom a +100 Ángstrom. Pero en espacio distancia, ciertos pares de átomos pueden tener un intervalo más estrecho. (Los ejemplos se verán después). • Explora el espacio de conformación al generar distancias aleatorias. • Representa la conformación con una matriz de distancia. Geometría de Distancias: Procedimiento • Cuatro pasos: – Se calcula la Matriz de límites superior e inferior – Distancias aleatorias se asignan dentro de estos límites – La Matriz de Distancias se convierte a coordenadas Cartesianas – Refinamiento de la conformación (minimización). • Ampliamente usada en RMN donde las distancias son medidas experimentalmente. • Este es uno de los métodos en la predicciónde la estructura de proteínas. Pasos iniciales: Suavizado triangular • U(ac) <= U(ab) + U(bc) • L(ac) >= L(ab) – U(bc) a a U(ab)b b U(bc) U(ac) c a c L(ab) a L(ac) c b c U(bc)b Dinámica Molecular • • • • El sistema sigue la ecuación de movimiento de la segunda Ley de Newton. Imita la realidad física de la dinámica del sistema molecular. En principio ésta puede seguir el mismo paso que una molécula realiza hacia su estado de mínima energía. Sin embargo, la limitación de los recursos de cómputo y funciones de energía potencial inadecuadas evitan la aplicación directa de la dinámica molecular a la búsqueda conformacional. Dinámica Molecular en la búsqueda conformacional • Simulaciones a temperatura alta, la energía cinética extra previene que el sistema se atrape en un mínimo local. • Se minimiza para generar las estructuras deseadas. Comparación • Datos de la Sección 9.7 • Conformaciones con energías dentro de 3kcal/mol del mínimo global para cicloheptadecano (C17H34). Después de 30 días de búsqueda: • Sistemática 211 • Cartesianas aleatorias 222 • Diedros aleatorios 249 • Geometría de distancias 176 • Dinámica Molecular 169 • Combinación de todas 262 Encontrando el mínimo global : Algoritmo Evolutivo • • • • Algoritmo Genético Programación Evolutiva Estrategias de Evolución Los tres métodos tienen un esquema similar: – – – – – Generan una población de soluciones Evalúan cada solución La población cambia con el tiempo Generan nuevas soluciones (apareamiento) Nueva solución: hijos; vieja solución: padres Algoritmo Genético • M posibles soluciones • Representados por un cromosoma: 100101100 (por ejemplo: uso de ángulo torsional) • Evalúa cada conformación (e.g. usa el campo de fuerza de la mecánica molecular) • Escoge a los padres con tendencia hacia las conformaciones de más baja energía (e.g. usa la selección de la ruleta) • Entrecruza en un punto azaroso, o mutaciones en ciertos puntos. • Repite el ciclo. • Muchas variantes: – Los individuos mejor evaluados permanecen sin cambio – Solo se remplazan los peores casos – Entrecruce en dos-puntos • Previene convergencia prematura – Controla la ‘presión selectiva’, que es la probabilidad relativa de que el individuo mejor adaptado en una población sea escogido como un padre relativo a los individuos promedio. • Programación Evolutiva: • No emplea el cruzamiento • Usa solo mutaciones • Estrategia Evolutiva: • Usa tanto cruzamiento como mutación • Toda la población actual está sujeta a cruzamiento y mutaciones. • Usa el rango directo más que la probabilidad temperatura Búsqueda del Mínimo Global : Recocido Simulado Algoritmo de Clustering • Muchas de las conformaciones muestreadas con los métodos ya mencionados son muy similares. • Se necesita un algoritmo para seleccionar un conjunto pequeño de las conformaciones representativas. • Agrupa objetos similares. • Un análisis de cluster mide la similitud o disimilitud de un par de objetos. • RMSD o ángulo de torsión se pueden usar como medidas. Método de encadenamiento • Calcula las distancias entre todos los pares • Agrupa el par más cercano • Calcula de nuevo las distancias entre este grupo con todas las otras conformaciones: – Encadenamiento Vecino-cercano (cadena simple) – Encadenamiento Vecino-lejano (cadena completa) • La iteración termina cuando el número predefinido de clusters se ha formado o cuando los requisitos de distancia predefinida se ha satisfecho. Ajuste Molecular • RMSD • Ajuste Flexible • Dinámica molecular restringida Aplicación: resolviendo estructuras de proteína • Rayos-X – – – – Iniciar la construcción del modelo Minimización Dinámica molecular restringida Refinamiento de la estructura • RMN – Geometría de Distancias – Dinámica molecular restringida – Refinamiento de la estructura Base de Datos Estructurales • PDB (protein databank) • Más de 10,000 estructuras de proteína resueltas por Rayos-X y RMN. Reduciendo la dimensionalidad de una base de datos • Dimensionalidad: numero de variables que se usan para describir cada conformación. • A menudo se encuentra que existen correlaciones significativas entre estas variables. • Análisis de Componentes Principales; se usan comúnmente para reducir la dimensionalidad. – Un componente principal es una combinación lineal de las variables. – Sec 9.14.1