Download Instrucciones para la preparación de Ponencias para Informática 2009
Document related concepts
Transcript
SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ANÁLISIS DE SECUENCIAS DE ARN MENSAJERO COMPUTER SYSTEM FOR THE DESIGN OF SMALL INTERFERENCE RNA BY THE ANALISYS OF MESSENGER RNA SEQUENCES Vladir Antonio Parrado Cruz1, Edecio Ramón Rodríguez Batista2, Roberto Duniel Rivero Soto3, Alexander Tornet4, Ricardo Bringas Pérez5 1, 2, 3 Universidad de las Ciencias Informáticas, Cuba, vparrado@uci.cu , erodriguez@uci.cu , rrivero@uci.cu Ctra San Antonio km 21/2 La Lisa, Ciudad Habana 4, 5 Centro de Ingeniería Genética y Biotecnología, Cuba, alexander.tornet@cigb.edu.cu, ricardo.bringas@cigb.edu.cu RESUMEN trascrito de un gen. Se tiene en cuenta para el aná- El uso de los ARN pequeños de interferen- lisis la variabilidad genética entre individuos a través cia (siRNA por sus siglas en Inglés) para el silen- de los Polimorfismos de Nucleótidos Simples (SNP ciamiento de genes, se perfila como una poderosa por sus siglas en inglés). Se trabaja con información herramienta terapéutica para combatir enfermeda- almacenada en bases de datos y ficheros para ha- des no solo en humanos, sino también en otros cer la búsqueda lo más eficiente posible. Garantiza organismos. Un componente fundamental de esta la portabilidad de la aplicación desarrollada bajo tecnología lo constituyen las herramientas informáti- ambientes multiplataforma, fundamentalmente con cas para el diseño de los siRNA. En internet existen herramientas de software libre. aplicaciones webs que permiten realizar este diseño, pero la seguridad de los resultados que se desean obtener y los algoritmos que implementan son aún requerimientos indispensables. Se presenta un sistema que permite realizar diseños de siRNA en dos variantes: conocida la secuencia de mRNA o ensamblando la misma a partir de la información del genoma humano. Además brinda información de datos de genes, transcritos y la representación gráfica de dichos datos y de los sitios blancos encontrados en la secuencia. Los sitios blancos pueden buscarse en secuencias comunes a todos los transcritos de un gen y en secuencias específicas a un “VIII Congreso Internacional de Informática en la Salud”. 1 Palabras Clave: ARN de interferencia, genes, miRNA, SNP, siRNA. ABSTRACT The use of small interference RNA (siRNA) is portrayed as a powerful therapeutic tool to fight diseases in humans and economically valued species. An important component of the siRNA development is the design software. For that aim there are many publicly available web applications out there on the Internet, but still the exact knowledge of the search algorithms employed and the confidentiality over the queries and their results remain as concerns. Here a system is presented that allows to design siRNA in two different ways: either from the mRNA secuence or from well known genetic identifiers from the human genome. The system complements its func- Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo | “SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS DE ARN MENSAJERO” tionality giving information of the genes, transcripts, the graphic representation of that data and of the target sites found in the sequence. The target sites can be looked for in sequences common to all transcripts of a gene or in sequences specific to a transcript of a gene. The target sites can display the Single Nucleotide Polymorphism (SNP) points or the former can be excluded from the analysis in the basis of containing such points. We work with information stored in data bases and disk-files to make the search as efficient as possible. The systems has been developed using free software tools and with portability and multi-platform deploy in mind. KeyWords: Small interference RNA, genes, miRNA, SNP, siRNA, . 1. INTRODUCCIÓN Las secuencias genómicas contienen la información necesaria para llevar a cabo la síntesis de proteínas y de moléculas de RNA, responsables de las características estructurales y funcionales de un organismo. Las cadenas de Ácido Desoxirribonucleico (DNA por sus siglas en inglés) contenidas en los cromosomas son las portadoras de esta información. En el DNA de los cromosomas se encuentran los genes, que son segmentos que contienen la información necesaria para la síntesis de otras moléculas. Mecanismos bioquímicos en el núcleo celular seleccionan y transcriben parte de la información en un gen formando una copia de su mensaje en moléculas de mRNA, proceso que se conoce como transcripción del DNA. Las moléculas de mRNA son utilizadas entonces para la síntesis de la proteína correspondiente en los ribozomas (traducción). El mensaje genético se transmite en dos etapas sucesivas, en las que el RNA es un intermediario imprescindible. Existen mecanismos de regulación en todas las etapas de la transcripción y la traducción. Algunos de esos mecanismos de regulación pueden interferir a nivel del RNA el proceso de traducción a cadenas de aminoácidos. Existe una maquinaria celular que a partir de RNAs de cadena corta inhibe el efecto de cadenas de mRNA complementarios. Más específicamente, los RNAs de cadena corta son interceptados por un mecanismo que incluye la acción de la endonucleasa Dicer y del Complejo Silenciador Inducido por RNA (RISC por sus siglas en inglés) [1], para bloquear la traducción del mRNA. Se conocen de genes [2] que codifican secuencias de RNA (miRNA) que activan el mecanismo de interferencia. En 1998 Andrew Fire y Craig Mello [3], descubrieron que se podía activar el efecto de interferen“VIII Congreso Internacional de Informática en la Salud”. 2 cia inyectando RNA de doble cadena (dsRNA por sus siglas en inglés) con algunas decenas de nucleótidos en la célula. A estos dsRNA se les denominó “RNAs pequeños de interferencia” o siRNA. Lo importante de este descubrimiento es que se podían utilizar secuencias complementarias a genes “legítimos” en la célula, y que entonces el mecanismo de interferencia no solo bloquearía la expresión de los dsRNA inyectados, sino también la de los genes del organismo seleccionados por los investigadores. El mecanismo de silenciamiento génico a través de RNA, puede activarse generalmente por dos vías: cuando se expresa un miRNA o por la aparición de dsRNA. El dsRNA puede proceder de virus, transposones (y el sistema actúa como defensa) o por inyecciones artificiales realizadas por investigadores.Hoy se sabe que este mecanismo está conservado en la mayor parte de los organismos con células eucariotas1. Esta técnica de silenciamiento de genes mediante los siRNAs se perfila como una poderosa herramienta terapéutica, por lo que puede ser utilizado como una forma de terapia génica: si cierta enfermedad es el efecto del aumento en la expresión de un gen específico y se conoce su identidad, se podría “apagar” su expresión por medio de inyecciones de dsRNA. En estudios más profundos [4] se dedujo, que la creación de forma artificial de un siRNA sería una herramienta experimental para combatir y buscar soluciones a problemas de enfermedades en animales, plantas y el genoma humano. Actualmente, existe un gran número de científicos y especialistas que realizan estudios sobre el diseño de siRNA y su aplicación en el silenciamiento de genes. Algunas de las aplicaciones desarrolladas para el diseño de siRNA son: siRNA Target Finder[5, 6], siRNA Design Software [7, 8], Dharmacon siDESIGN Center [9], DEQOR [10, 11], IDT´Scitools RNAi Design [12], GenScript siRNA Target Finder [13], siDirect [14, 15], siRNA Wizard v3.1 [16], BIOPREDsi [17], Invitrogen [18]. Todas estas aplicaciones fueron revisadas. Es importante mencionar que las aplicaciones más avanzadas son comerciales o de la propiedad de compañías privadas. Estas aplicaciones requieren el uso de internet y por lo tanto es necesario introducir en ellas la secuencia o los identificadores de los genes que se desea silenciar. En algunas investigaciones no es conveniente divulgar esta información, por lo que 1 (mirbase, 2010) incluye especies de animales desde hidras y poríferos hasta homo sapiens por el dominio de los animales, y desde las clorofitas en el clado viriplantae. Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo | “SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS DE ARN MENSAJERO” muchas empresas o grupo de investigación prefieren usar localmente este tipo de aplicación. El poseer un desarrollo propio tiene también la ventaja de poder incorporar nuevas ideas y algoritmos que se deriven del proceso investigativo. Además se conoce con exactitud lo que se implementa y cómo se hace. Se ha implementado una herramienta informática con tecnología ciente-servidor propia y con interfaz web que permite a los especialistas realizar sus estudios sobre este tema. 2. METODOLOGÍA Se diseñó, implementó y validó un sistema informático para el diseño de siRNA. Este sistema está compuesto por dos subsistemas: un servidor (siRNA Web Services) y un cliente (alasSiRNADesign). siRNA Web Services es un servicio web que brinda una serie de funciones relacionadas con la información que se necesita de la base de datos y la implementación de los principales algoritmos, que se describen en el siguiente acápite. alasSiRNADesign es un cliente web que utiliza los servicios del servidor para consultar y mostrar las peticiones de los usuarios. Ambos fueron implementados en java. La metodología de desarrollo de software utilizada para la construcción del sistema fue OpenUp, una metodología ágil que genera menos artefactos y documentación que RUP, pero que contempla los elementos indispensables de la Ingeniería de Software. Se realizan por tanto todos los artefactos de las fases de OpenUp tanto para siRNA Web Services como para alasSiRNA-Design. • Obtención de los sitios blancos comunes a todos los transcritos de un gen • Obtención de los sitios blancos específicos a un transcrito de un gen 3.1.1. ALGORITMO PARA ENSAMBLAJE DE LA SECUENCIA DE ARN MENSAJERO El algoritmo parte de la búsqueda de la información de un gen o de un transcrito. Posteriormente se buscan los exones correspondientes a dicho transcrito (los transcritos también tienen intrones, pero estos no forman la secuencia, sino que se quedan dentro del núcleo celular y son eliminados del mRNA resultante por procesos de “splicing”) y con las posiciones iniciales y finales de cada transcrito y teniendo en cuenta el cromosoma, se busca la secuencia en el fichero del cromosoma correspondiente. A medida que se van teniendo las secuencias de cada uno de los exones, se van concatenando para finalmente obtener la secuencia de mRNA. En el caso en que la orientación de la secuencia del exón sea negativa hay que invertir la secuencia, pues la secuencia de mRNA debe quedar orientada positivamente (de 5’ a 3’). Aquí se modela computacionalmente lo que sería el proceso de “splicing” a nivel celular, obteniéndose una secuencia de nucleótidos. En la figura siguiente se muestra el proceso antes descrito: 3. RESULTADOS Y DISCUSIÓN 3.1. DISEÑO DE ALGORITMOS Se cuenta con una base de datos en un gestor (PostgreSQL) y además 24 ficheros que contienen los cromosomas pertenecientes a la especie humana. Cada organismo tiene 23 pares de cromosomas, pero son 24 ficheros porque el par 23 está definido por los cromosomas “Y” y ”X”, dependiendo del sexo. Con la referencia en la base de datos a estos ficheros se localizan las secuencias en los mismos. El diseño de la base de datos es el punto de partida para que se puedan diseñar los algoritmos de interés. A continuación se describe el diseño de los principales algoritmos: • Ensamblaje de secuencia de ARN mensajero • Análisis de la secuencia ARN mensajero para obtención de sitios blancos • Obtención de los sitios blancos teniendo en cuenta los SNP “VIII Congreso Internacional de Informática en la Salud”. 3 Fig. 1: Proceso de ensamblaje de la secuencia de mRNA, donde se observa que está constituida por la concatenación de todos los exones, en este caso, de un transcrito de un gen. Elaboración propia. 3.1.2. ALGORITMO PARA ANALIZAR LA SECUENCIA MRNA Y OBTENER LOS SITIOS BLANCOS Una vez obtenida la secuencia de mRNA, el análisis de la misma parte de un grupo de reglas que deben Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo | “SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS DE ARN MENSAJERO” cumplir los sitios blancos. El algoritmo propuesto por Reynolds, realiza una sumatoria de las reglas que cumple el sitio blanco y selecciona aquellos que tengan al menos una puntuación de seis [19]. A diferencia de este algoritmo el especialista puede seleccionar, a su necesidad, las reglas que considera deben cumplir los siRNA a diseñar. Tiene además la posibilidad de seleccionar el porciento de cumplimiento de las reglas con que se cuenta y cuántas reglas desea que se cumplan como mínimo. De esta forma la flexibilidad aumenta. En células eucariotas los dsRNAs de longitud de más de 30 nucleótidos pueden disparar el mecanismo de interferón que el organismo utiliza para contrarrestar afectaciones por microbios (tales como virus y bacterias). Se provoca prácticamente una eliminación global de la síntesis de proteína en la célula [20]. Los siRNAs son también dsRNAs, solo que está demostrado que estos tienen la longitud suficiente (21-22 nt) para suprimir la expresión de un gen específico y lo suficientemente corto como para no activar el mecanismo de interferón [21]. El algoritmo selecciona sitios blancos de 21 nucleótidos, iterando por toda la secuencia de mRNA. Verifica las reglas y las opciones seleccionadas para cada secuencia de 21nt. Cuando obtiene un sitio que cumpla con todas las condiciones, es almacenado y posteriormente mostrado al usuario que realiza el estudio. El proceso se describe en el pseudocódigo siguiente: Algoritmo 1: Ensamble de secuencia Entrada: seqMRna lista de nucleótidos r Opciones dadas por el usuario r1 comienza con AA r2 T en la posición 10 r3 A en la posición 3 r4 A en la posición 19 r5 CG entre 30-50% r6 ausencia de GC en la posición 19 r7 ausencia de G en la posición 13 r8 A/T entre las posiciones 15 y 19 cmr cantidad mínima de reglas inicio cantidadGC = 0 para i 0 a 21 hacer base = seqMRna[i] si base = ’C’ o base = ’G’ entonces cantidadGC = cantidadGC + 1 total_puntos = Cantidad de opciones ri activas puntos = 0 para i 0 a longitud(seqMRna) - 20 hacer Invocar ChequeosPositivos( r, seqMRna, puntos ) Invocar ChequeoR5(r, seqMRna, puntos, cantidadGC) Invocar ChequeosNegativos( r, seqMRna, puntos ) Invocar ChequeoR8( r, seqMRna, puntos ) si i + 21 < longitud(seqMRna) entonces “VIII Congreso Internacional de Informática en la Salud”. 4 sitio_blanco = extraer_nucleotidos( seqMRna, i, i+ 21 ) si puntos >= cmr entonces adicionar(sitio_blanco) sino si puntos = total_puntos entonces adicionar (sitio_blanco) Excepto una de las reglas las demás son seleccionadas del artículo de Reynolds ([19]), el cuál contiene un estudio detallado y además una validación estadística que se recomienda al lector. Estas reglas se implementan en al menos un caso en las herramientas: DEQOR, Dharmacon siDesign Center, GenScript siRNA Target Finder, IDT´s RNAi Design, siDirect, siRNA design software, Invitrogen, siRNA target Finder, siRNA Wizard 3.1. 3.1.3. ALGORITMO PARA ANALIZAR LA SECUENCIA MRNA Y OBTENER LOS SITIOS BLANCOS TENIENDO EN CUENTA LOS SNP Un transcrito tiene varios exones. Los exones tienen posición inicial y final de la secuencia de nucleótidos en el fichero del cromosoma al que pertenece. Un SNP tiene la posición en la que se encuentra en dicho fichero, por lo que en el rango que se encuentra un exón puede haber varios SNP. El algoritmo realiza varias consultas a la base de datos. La primera busca todos los exones de un transcrito entrado por el usuario. Luego con la posición inicial y final de cada exón del transcrito, se devuelven todas las posiciones donde se encuentran los SNP. Se crea una lista de enteros con la misma cantidad de elementos que contiene la secuencia de mRNA (con todos los exones concatenados). Esta lista se actualiza poniendo un número uno en cada posición donde se encuentre un SNP y un cero donde no haya (son dos listas paralelas). De esta forma se asocian una lista de SNPs con la lista de nucleótidos de la secuencia de mRNA. Tabla I: Referencia de la secuencia de mRNA con los SNP mRNA A A U U C G G A SNP 0 0 1 0 0 0 1 0 Luego el especialista puede seleccionar entre dos opciones: 1. Realizar el análisis en la secuencia de mRNA y obtener todos los sitios blancos incluyendo los SNP de cada sitio blanco (el especialista puede ver el sitio blanco en detalles, donde el SNP es marcado). 2. Realizar el análisis eliminando los SNP. Se excluyen los sitios blancos donde se encuentre al menos un SNP. En la figura siguiente se muestran los detalles: Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo | “SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS DE ARN MENSAJERO” Fig. 3: Búsqueda de sitios blancos comunes a todos los transcritos de un gen. Elaboración propia. Fig. 2: Búsqueda de sitios blancos teniendo en cuenta los SNP. Elaboración propia. Solo en uno de los sistemas revisados [22] se dice que tienen en cuenta los SNP para el análisis, pero se realizaron pruebas que evidencian que esa opción no está disponible en dicho sistema. Se implementó un algoritmo propio con este fin. Se ofrece la posiblidad de realizar un análisis tanto de una secuencia de mRNA con total ausencia de SNPs (y de esta forma se garantiza que no se obtengan sitios blancis que contengan estos puntos de variación) o dejar los SNPs en la secuencia de mRNA y mostrar (en caso de existir) el nucleótido que puede variar en el sitio blanco. 2.1.4. ALGORITMO PARA OBTENER LOS SITIOS BLANCOS COMUNES A TODOS LOS TRANSCRITOS DE UN GEN Con la información de un gen previamente seleccionado, se buscan todos los transcritos del mismo. Se obtienen todos los exones (posiciones inicial y final) por cada transcrito. Se itera por cada exón de cada transcrito, buscando la intersección con los demás exones de acuerdo a sus posiciones inicial y final. Se concatenan todas aquellas secuencias que se interceptan. En el caso donde un exón es “cortado” antes de su posición final o inicial, se concatena un carácter “|”, para preveer que se identifiquen sitios blancos que no tengan sentido biológico. Así se obtiene la secuencia de mRNA perteneciente a la unión de todos los exones de dichos transcritos, o sea, es una secuencia coincidente para todos. Luego se aplica el algoritmo de búsqueda de sitios blancos en esta secuencia. En la figura siguiente se muestra la gráfica que detalla el proceso: “VIII Congreso Internacional de Informática en la Salud”. 5 2.1.5. ALGORITMO PARA OBTENER LOS SITIOS BLANCOS ESPECÍFICOS A UN TRANSCRITO DE UN GEN Este algoritmo es la antítesis del algoritmo anterior. Se parte de un gen y se buscan todos los transcritos de dicho gen, el usuario selecciona el transcrito para el cual se quiere la secuencia específica. Se obtienen los exones (posiciones inicial y final) de cada transcrito del gen. Se itera por cada exón del transcrito seleccionado y se desechan las partes coincidentes con los demás exones de los otros transcritos. Se almacena la secuencia que no coincida con ningún otro exón de otro transcrito. Se concatenan todas las porciones de secuencias específicas y de esta forma se obtiene la secuencia de mRNA. Igualmente, se concatena un carácter “|”, para preveer que se identifiquen sitios blancos que no tengan sentido biológico. Luego se aplica el algoritmo de búsqueda de sitios blancos en esta secuencia. En la figura se detalla el proceso: Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo | “SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS DE ARN MENSAJERO” Fig. 4: Búsqueda de sitios blancos específicos a un transcrito de un gen. Elaboración propia. 2.2. DESARROLLO DEL SISTEMA INFORMÁTICO El Sistema informático para el diseño de siRNA está compuesto por dos subsistemas: el servidor (siRNA Web Services) y el cliente (alasSiRNADesign). siRNA Web Services es un servicio web (WS por sus siglas en inglés) que brinda una serie de funciones relacionadas con la información que se necesita de la base de datos y la implementación de los principales algoritmos(entre los que se destacan los mencionados anteriormente). alasSiRNADesign es un cliente web que utiliza los servicios del servidor para consultar y mostrar las peticiones de los usuarios. Ambos fueron implementados en java. Las funcionalidades de siRNA Web Services son: 1. Realizar análisis de las secuencias mRNA. 2. Realizar análisis de las secuencias mRNA teniendo en cuenta los SNP. 3. Buscar datos de un gen. 4. Buscar datos de un transcrito. 5. Calcular Energía Libre. 6. Ensamblar secuencia común a todos los transcritos de un gen. 7. Ensamblar secuencia específica de un transcrito de un gen. 8. Listar SNPs que estén en determinada región del cromosoma. 9. Listar SNPs que coinciden con los miRNAs. Las funcionalidades de alasSiRNA-Design son: 1. Realizar análisis de las secuencias mRNA. 2. Mostrar datos de un gen. 3. Mostrar datos de un transcrito. 4. Mostrar datos de miRNAs. 5. Mostrar la secuencia común a todos los transcritos de un gen. 6. Mostrar la secuencia específica de un transcrito de un gen. Hasta ahora solo se ha utilizado el genoma humano. Se cuenta además con la base de datos que hace referencia a esta información. El sistema está concebido para que se puedan almacenar otros genomas. El diseño del sistema con tecnología cliente-servidor tiene como objetivo compartir información invirtiendo la menor cantidad de recursos. Debido a esto la información que utiliza el sistema informático implementado se almacena cen“VIII Congreso Internacional de Informática en la Salud”. 6 tralmente en una base de datos al igual que los ficheros de los genomas, sin necesidad de duplicar información. De esta forma puede brindar servicios haciendo un uso racional de los recursos. Los usuarios solo necesitan de una computadora con un navegador web y de la red para utilizar el sistema. El servidor, implementado como WS, brinda servicios a cualquier aplicación cliente que se realice. Otras aplicaciones que requieran información de genes, transcritos, exones, secuencias de mRNA, SNP, miRNA y genes targets de miRNA del genoma humano también pueden beneficiarse de este servicio. El alasSiRNA-Design utiliza el servidor, con el objetivo de ejecutar todas las peticiones que provienen del usuario. Dicho cliente, a través de la interfaz web recibe las peticiones de los investigadores e invoca la funcionalidad correspondiente en el servidor. Con esta concepción de escalabilidad el sistema puede ser utilizado por múltiples usuarios a la vez. Las pruebas realizadas [23] demuestran que pueden estar conectados 70 usuarios a la vez sin que se afecte la integridad y la capacidad de respuesta del sistema. En la implementación realizada se analiza una secuencia de mRNA conformada a partir de la información del gen o transcrito introducido como criterios de búsqueda. Estas búsquedas se hacen sobre la base de datos y ficheros de cromosomas almacenados localmente. La base de datos diseñada posee la información necesaria y suficiente para realizar las funcionalidades del sistema. No se almacenan datos innecesarios. Se implementó una herramienta para actualizar esta base de datos a partir de los ficheros seq_gene.md, seq_gene.q [24], seq_snp.md [25], hsa.gff [2] descargados de los sitios NCBI [26] y miRBase [2]. Los datos de las tablas Gene, Transcript y Exon se actualizan de seq_gene.md, los de la tabla SNP de seq_snp.md y los de miRNA de seq_gene.q y hsa.gff. El proceso de actualización se puede realizar cuando se estime conveniente. Se utiliza información pública, pero en un ambiente local. Las herramientas como siRNAWizard v3.0, siDirect, siRNA Target Finder, DEQOR solo permiten el análisis de secuencias de mRNA introducidas por el usuario en un campo de texto. IDT´Scitools RNAi Design, siRNA Design Software, Dharmacon siDESIGN Center, RNAi Design, GenScript siRNA Target Finder, realizan consultas a una base de datos utilzando identificadores de los genes. Ambas opciones se brindan como alternativas en alasSiRNADesign. Silenciar determinados genes puede abrir vías Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo | “SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS DE ARN MENSAJERO” terapéuticas para tratar enfermedades como cáncer, problemas autoinmunes, infecciones víricas y en otras ramas como la economía. Algunos ejemplos de sus aplicaciones en el mundo: Se han creado tomates (Lycopersicons esculentum) transgénicos que llevan un gen artificial que produce un RNA anti sentido para bloquear la expresión de otro gen implicado en la síntesis de etileno, la hormona vegetal que provoca maduración (reducen su expresión un 90 %). Así, estos tomates se conservan mucho más y su vida útil crece considerablemente [27]. Desde el punto de vista médico, ya se ha logrado frenar la replicación del VIH [28] y del virus de la hepatitis “A” [29] exponiendo cultivos celulares humanos a siRNAs. En un artículo reciente [30] se demuestra que el gen RHOC acelera la metástasis en el cáncer de mama y la intensidad de su expresión es regulada por el miR-10b, que es un miRNA de los que se muestran en alasSiRNA-Design. El silenciamiento de dicho gen puede entonces retardar la aparición de metástasis. En el sitio web “cancer MicroRNA” [31] se pueden encontrar varios artículos que relacionan a los miRNA con el desarrollo y regulación del cáncer y otras enfermedades. 4. CONCLUSIONES Los algoritmos implementados y la integración de información sobre SNP y sitios targets de miR-NA mejoran el diseño de los siRNAs e incorporan al diseño información sobre la variabilidad genética de los individuos. La obtención siRNAs comunes a todos los transcritos de un gen o específicos a solo un transcrito del gen, brinda una opción no encontrada en otras aplicaciones disponibles en Internet. El diseño de un web services da una funcionalidad adicional al sistema extendiendo sus posibilidades de uso a aplicaciones no restringidas al tema del silenciamiento de genes. 5. REFERENCIAS BIBLIOGRÁFICAS [1]- E. Bernstein, A. Caudy, S. Hammond, y G. Hannon, “Role for a bidentate ribonuclease in the initiation step of RNA interference,” Nature, vol. 409, no. 6818, pp. 363–365, 2001. [2]- mirbase. “miRBase: the microRNA database,” 2008: http://mirbase.org. “VIII Congreso Internacional de Informática en la Salud”. 7 [3]- A. Fire, S. Xu, M. Montgomery, S. Kostas, S. Driver, C. Mello et al., “Potent and specific genetic interference by double-stranded RNA in Caenorhabditis elegans,” NATURE-LONDON-, pp. 806– 810, 1998. [4]- I. Bustos Jaimes, C. Castañeda Patlán, J. Oria Hernández, E. Rendón Huerta, H. Reyes Vivas, I. Romero Álvarez, A. Universitaria, y D. México, “Biología molecular de rotavirus: una mirada a través de la interferencia de rna,” Mensaje Bioquímico, vol. 32, 2008. [5]- L. Wang y F. Mu, “A Web-based design center for vector-based siRNA and siRNA cassette,” Bioinformatics, vol. 20, no. 11, p. 1818, 2004. [6]sirna target finder: 2010: http://www.ambion.com/techlib/misc/siRNAfinder.ht ml [7]- S. Yiu, P. Wong, T. Lam, Y. Mui, H. Kung, M. Lin, y Y. Cheung, “Filtering of ineffective siRNAs and improved siRNA design tool,” Bioinformatics, vol. 21, no. 2, p. 144, 2005. [8]- S. Y. Y. M. V. K. TW Lam, Prudence WH Wong. (2009). sirna design software. Department of Computer Science, The University of Hong Kong. [En línea]. Disponible en: http://i.cs.hku.hk/sirna/software/sirna.php [9]- Dharmacon, “siDESIGN Center,” 2010: .http://www.dharmacon.com/DesignCenter/. [10]- A. Henschel, F. Buchholz, y B. Habermann, “DEQOR:a web-based tool for the design and quality control of siRNAs,” Nucleic acids research, vol. 32, no. Web Server Issue, p. W113, 2004. [11]- B. F. H. B. Henschel, A. (2009) Design and quality control of rnai (deqor). DEQOR. [En línea]. Disponible en: http://cluster1.mpicbg.de/Deqor/deqor.html [12]- W. Gong, Y. Ren, Q. Xu, Y. Wang, D. Lin, H. Zhou, y T. Li, “Integrated siRNA design based on surveying of features associated with high RNAi effectiveness,” BMC bioinformatics, vol. 7, no. 1, p. 516, 2006. [13]- genscript, “siRNA Target Finder,”. [En línea]. Disponible en: https://www.genscript.com/sslbin/app/rnai [14]- Y. Naito, T. Yamada, K. Ui-Tei, S. Morishita, y K. Saigo, “siDirect: highly effective, target-specific siRNA design software for mammalian RNA interference,” Nucleic acids research, vol. 32, no. Web Server Issue, p. W124, 2004. [15]- siDirect. (2009) highly effective, target specific sirna online design site. siDirect. [En línea]. Disponible en: http://genomics.jp/sidirect/index.php?type=fc [16]- invivogen, “sirna wizard: The online tool to Parrado Cruz, Vladir; Batista Rodríguez, Edecio; Bringas Pérez, Ricardo | “SISTEMA INFORMÁTICO PARA EL DISEÑO DE ARN PEQUEÑOS DE INTERFERENCIA MEDIANTE EL ÁNALISIS DE SECUENCIAS DE ARN MENSAJERO” choose and design short hairpin rnas,” 2010: http://www.sirnawizard.com/ [17]- BIOPREDsi. (2009) Biopredsi. Friedrich Miescher Institute for Biomedical Research. [En línea]. Disponible en: http://www.biopredsi.org/design.html [18]- Invitrogen. (2009) Block rnai designer. Invitrogen Corporation. [En línea]. Disponible en: https://rnaidesigner.invitrogen.com/rnaiexpress/setO ption.do?designOption [19]- A. Reynolds, D. Leake, Q. Boese, S. Scaringe, W. Marshall, A. Khvorova et al., “Rational siRNA design for RNA interference,” Nature biotechnology, vol. 22, no. 3, pp. 326–330, 2004. [20]- J. Santoyo, J. Vaquerizas, y J. Dopazo, “Highly specific and accurate selection of siRNAs for high-throughput functional assays,” Bioinformatics, vol. 21, no. 8, p. 1376, 2005. [21]- S. Elbashir, W. Lendeckel, y T. Tuschl, “RNA interference is mediated by 21-and 22nucleotide RNAs,” Genes and development, vol. 15, no. 2, p. 188, 2001. [22]- Y. Park, S. Park, Y. Choi, D. Lee, M. Won, y Y. Kim, “AsiDesigner: exon-based siRNA design server considering alternative splicing,” Nucleic acids research, 2008. [23]- Y. Pérez Castellón y R. Leyva Hernández, “Pruebas de liberación, su aplicación al sistema informático: Silenciamiento de genes (sirna),” Tesis de grado, Universidad de las Ciencias Informáticas, 2009. [24]- N. C. for Biotechnology Information,“Human genome,” Noviembre 2009: “VIII Congreso Internacional de Informática en la Salud”. 8 ftp://ftp.ncbi.nih.gov/genomes/Hsapiens/mapview. [25]- S. Sherry, M.Ward, M. Kholodov, J. Baker, L. Phan, E. Smigielski, y K. Sirotkin, “dbSNP: the NCBI database of genetic variation,” Nucleic acids research, vol. 29, no. 1, p. 308, 2001. [26]- NCBI, 2009: http://www.ncbi.nlm.nih.gov/ [27]- A. Xiong, Q. Yao, R. Peng, X. Li, P. Han, y H. Fan, “Different effects on ACC oxidase gene silencing triggered by RNA interference in transgenic tomato,” Plant Cell Reports, vol. 23, no. 9, pp. 639–646, 2005. [28]- M. Martínez, A. Gutiérrez, M. ArmandUgón, J. Blanco, M. Parera, J. Gómez, B. Clotet, y J. Esté, “Suppression of chemokine receptor expression by RNA interference allows for inhibition of HIV-1 replication,” Aids, vol. 16, no. 18, p. 2385, 2002. [29]- Y. Kusov, T. Kanda, A. Palmenberg, J. Sgro, y V. Gauss-Muller, “Silencing of hepatitis A virus infection by small interfering RNAs,” Journal of virology, vol. 80, no. 11, p. 5599, 2006. [30]- L. Ma, J. Teruya-Feldstein, y R. Weinberg, “Tumour invasion and metastasis initiated by microRNA-10b in breast cancer,” Nature, vol. 449, no. 7163, pp. 682–688, 2007. [31]- c. MicroRNA. (Diciembre, 2009) Micrornacancer. [En línea]. Disponible en: http://www.nature.com/nature/journal/v435/n7043/ed summ/e050609-16.html