Download Objetivos Salta en imágenes - Ingeniería en Sistemas de Información
Transcript
Siguiente » WICC 2015 WICC 2015 Autoridades Comité Académico Coordinadores Artículos aceptados Objetivos Tesis de Doctorado Compiladores El Workshop de Investigadores en Ciencias de la Computación (WICC) es organizado anualmente por la Red de Universidades Nacionales con Carreras de Informática (RedUNCI) y se lleva a cabo en alguna de las Universidades que integran la Red. El primer WICC se realizó en 1999 en la Universidad Nacional de San Juan. El objetivo del Workshop es permitir el intercambio de ideas y experiencias entre investigadores, de modo de fomentar la vinculación y potenciar el desarrollo coordinado de actividades de Investigación, Desarrollo e Innovación. WICC 2015, 17º edición del WICC, organizado localmente por el Departamento de Informática de la Universidad Nacional de Salta, Provincia de Salta, se llevará a cabo en la misma universidad, los días 16 y 17 de abril de 2015. Enlace al Sitio Web del Workshop Salta en imágenes Siguiente » « Anterior | Siguiente » WICC 2015 Autoridades Autoridades Comité Académico Coordinadores Artículos aceptados WICC 2015 Tesis de Doctorado Compiladores Universidad Nacional de Salta, Provincia de Salta Rector: CPN Víctor Hugo Claros Departamento de Informática - Facultad de Ciencias Exactas Director: Mgr. Gustavo Daniel Gil Red de Universidades Nacionales con Carreras de Informática (RedUNCI) Coordinador Titular: Ing. Armando De Giusti (UN La Plata) Coordinador Alterno: Lic. Feierherd Guillermo (UNTDF) Junta Directiva: Mag. Dapozo Gladys (UNNE) Lic. Hugo Padovani (U Morón) Ing. Marcelo Estayno (UN Lomas de Zamora) Dra. Fabiana Piccoli (UN San Luis) Lic. Jorge Finocchieto (U CAECE) Lic. Horacio Kuna (UN Misiones ) Lic. Fernanda Carmona (UN Chilecito) Lic. Raúl Kantor (UN Rosario) Comité Organizador Local MSc. Daniel ARIAS FIGUEROA Mgr. Gustavo GIL Lic. Martín DIAZ Lic. María Laura MASSE PALERMO Mg. Sergio ROCABADO Mg. Rosa MACAIONE Lic. Jorge SILVERA Lic. Marcela LOPEZ C.U. Eduardo FERNANDEZ Lic. Carina REYES Lic. Claudia IBARRA Esp. Loraine GIMNSON SARAVIA « Anterior | Siguiente » « Anterior | Siguiente » WICC 2015 Comité Académico Autoridades Comité Académico Coordinadores WICC 2015 Artículos aceptados Tesis de Doctorado Compiladores Universidades Nombre Y Apellido UBA-Ciencias Exactas Fernandez Slezak, Diego UBA-Ingenieria Echeverria, Adriana UN La Plata De Giusti, Armando UN Sur Simari, Guillermo UN San Luis Esquivel, Susana UNCPBA Acosta, Nelson UN Comahue Vaucheret, Claudio UN La Matanza Spositto, Osvaldo UN La Pampa Alfonso, Hugo UN Lomas de Zamora Estayno, Marcelo UN Tierra del Fuego Feierherd, Guillermo UN Salta Gil, Gustavo Daniel UN Patagonia Austral Márquez, Maria Eugenia UTN Bursztyn, Andrés UN San Juan Otazú, Alejandra UADER Aranguren, Silvia UN Patagonia SJB Buckle, Carlos UN Entre Ríos Tugnarelli, Mónica UN Nordeste Dapozo, Gladys UN Rosario kantor, Raúl UN Misiones Kuna, Horacio UNNOBA Russo, Claudia UN Chilecito Carmona, Fernanda UN Lanús García Martínez, Ramón UN Santiago del Estero Durán, Elena Esc. Sup. Ejercito Castro Lechstaler, Antonio UN Litoral Loyarte, Horacio UN Río IV Arroyo, Marcelo UN Córdoba Brandán Briones, Laura UN Jujuy Paganini, José UN Rio Negro Vivas, Luis UN Villa María Prato, Laura UN Luján Scucimarri, Jorge UN Catamarca Barrera, María Alejandra UN La Rioja Nadal, Claudio UN Tres de Febrero Cataldi, Zulma UN Tucumán Luccioni, Griselda UNAJ Morales, Martin UN Chaco Austral Zachman, Patricia U Morón Padovani, Hugo René UAI De Vicenzi, Marcelo U Belgrano Guerci, Alberto U Kennedy Panizzi, Marisa U Adventista del Plata Bournissen, Juan UCAECE Finocchieto, Jorge U Palermo Ditada, Esteban UCA Grieco, Sebastian U Salvador Zanitti, Marcelo U Aconcagua Gimenez, Rosana U Gastón Dachary Belloni, Edgardo « Anterior | Siguiente » « Anterior | Siguiente » WICC 2015 Base de Datos y Minería de Datos Autoridades Comité Académico Coordinadores Id Título Artículos aceptados Agentes y Sistemas Inteligentes 6858 Arquitectura, Redes y Sistemas Minería de Textos: Sistemas de Búsqueda de Respuestas Agustin Bini (UCASAL) agubini@hotmail.com Operativos Cynthia Lorena Corso (UTN) Aspectos Teóricos de Ciencia de la Computación Base de Datos y Minería de Datos Autores M. Alicia Perez (UCASAL) aperez@ucasal.net, Alejandra Carolina Cardoso (UCASAL) acardoso@ucasal.net, Diseño de almacén de datos para el análisis eficiente de 6860 la información de incidentes informáticos y mantenimientos. Computación Gráfica, Imágenes y Visualización cynthia@bbs.frc.utn.edu.ar, Claudio Luque (UTN-FRC) cluque@prominente.com.ar, Leonardo Ciceri (UTN-FRC) leocic@bbs.frc.utn.edu.ar, Matias Donnet (UTN-FRC) 55017@sistemas.frc.utn.edu.ar Ingeniería de Software Javier Díaz (UNLP) javierd@info.unlp.edu.ar, Innovación en Educación en Laura Lanzarini (UNLP) laural@lidi.info.unlp.edu.ar, M. Emilia Charnelli (UNLP) Informática Innovación en Sistemas de Software 6861 Analítica del Aprendizaje y la personalización de la Educación. Procesamiento de Señales y Sistemas de Tiempo Real gbaldino@linsi.edu.ar, Alejandra Schiavoni (UNLP) ales@info.unlp.edu.ar, Ana Paola Amadeo (UNLP) pamadeo@linti.unlp.edu.ar Procesamiento Distribuído y Paralelo Lucía Rosario Malbernat (CAECE) lmalbernat@ucaecemdp.edu.ar, Seguridad Informática Tecnología Informática Aplicada en Educación mcharnelli@linti.unlp.edu.ar, Guillermo Baldino (UTN FRLP) Maria Patricia Clemens (CAECE) 6862 Aplicación de Técnicas de Data Mining en Gestión de Docentes de Educación Superior mpclemens@ucaecemdp.edu.ar, Analia Elena Varela (CAECE) Tesis de Doctorado avarela@ucaecemdp.edu.ar, Compiladores Ezequiel Matías Urrizaga (CAECE) eurrizaga@ucaecemdp.edu.ar 6864 Instrumento fiable para la Determinación de Perfiles Sociales y Culturales de estudiantes universitarios Myriam Herrera (UNSJ) mherrera@iinfo.unsj.edu.ar, Adriana Mallea (UNSJ) mherrera@iinfo.unsj.edu.ar, Flavia Millán (UNSJ) mherrera@iinfo.unsj.edu.ar Utilización de NoSQL para resolución de problemas al trabajar con cantidades masivas de datos Giovanni Róttoli (UTN-FRBA) gd.rottoli@gmail.com, M Lopez-Nocera (UTN-FRBA) zappapet@yahoo.com, Ma Florencia Pollo Cattaneo (UTN-FRBA) flo.pollo@gmail.com Minería de datos para un Sistema de alerta temprana de deserción en carreras de Ingeniería Hernàn Ahumada (UNCa) hcahumada@tecno.unca.edu.ar, Hugo R. Dip (UNCa) hrdip@tecno.unca.edu.ar, Carlos Gabriel Herrera (UNCa) cgherrera@tecno.edu.ar, Juan Carlos Leguizamon Almendra (UNCa) daa@tecno.unca.edu.ar 6905 Algoritmos Eficientes para Busquedas a Gran Escala Integrando Datos Masivos. Gabriel Tolosa (UNLu) tolosoft@unlu.edu.ar, Santiago Banchero (UNLu) sbanchero@unlu.edu.ar, Esteban A Rissola (UNLu) earissola@unlu.edu.ar, Tomas Delvechio (UNLu) tdelvechio@unlu.edu.ar, Santiago Ricci (UNLu) sricci@unlu.edu.ar, Esteban Feuerstein (UBA) efeuerst@dc.uba.ar 6940 Análisis comparativo de dos Sistemas de Bases de Datos Silvina Migani (UNSJ) silvina.migani@gmail.com, XML Cristina Vera (UNSJ) civera2@yahoo.com.ar 6865 6880 Técnicas de Minería de Datos como alternativa a las 6955 Técnicas Estadísticas de Discriminación y Clasificación Multivariadas Clásicas 6966 Recuperación y Procesamiento en Grandes Volúmenes de Datos María Paula Dieser (UNLPAM) pauladieser@exactas.unlpam.edu.ar, María Cristina Martin (UNLPAM) maritamartin@exactas.unlpam.edu.ar, Erica Schlaps (UNLPAM) maritamartin@exactas.unlpam.edu.ar, Vanina Celeste Bolaños (UNLPAM) maritamartin@exactas.unlpam.edu.ar, Lorena Verónica Cavero (UNLPAM) maritamartin@exactas.unlpam.edu.ar, María de los Angéles Irribarra (UNLPAM) maritamartin@exactas.unlpam.edu.ar, Claudina Solaro (UNLPAM) maritamartin@exactas.unlpam.edu.ar, Laura Wagner (UNLPAM) maritamartin@exactas.unlpam.edu.ar, Diamela Titionik (UNLPAM) maritamartin@exactas.unlpam.edu.ar Luis Britos (UNSL) lebritos@unsl.edu.ar, Maria E. Di Gennaro (UNSL) mdigena@unsl.edu.ar, Jacqueline Fernandez (UNSL) jmfer@unsl.edu.ar , Graciela Verónica Gil Costa (UNSL) gvcosta@unsl.edu.ar, Fernando Kasián (UNSL) fkasian@unsl.edu.ar, Acciones Id Título Autores Jair Lobos (UNSL) jairlobos@gmail.com, Verónica Ludueña (UNSL) vlud@unsl.edu.ar, Marcela Printista (UNSL) mprinti@unsl.edu.ar, Nora Reyes (UNSL) nreyes@unsl.edu.ar, Patricia Roggero (UNSL) proggero@unsl.edu.ar, Guillermo Trabes (UNSL) guillermotrabes@hotmail.com, Edgar Chávez (CICESE) elchavez@cicese.mx, Claudia Deco (UNR) deco@fceia.unr.edu.ar Modelo de Sentiment Analysis para la clasificación de 6975 noticias en tiempo real en el Mercado de Valores de Buenos Aires Juan Pablo Braña (UAI) juan.brana@uai.edu.ar, Alejandra Litterio (UAI) alejandra.litterio@uai.edu.ar, Cristina Camos (UAI) cristina.camos@uai.edu.ar, Alejandro Fernandez (UAI) alejandroa.fernandez@uai.edu.ar Serqio Quiroga (UNSJ) sergioquiroga@gmail.com, 6984 Minería de datos en la detección de desperfectos en el alumbrado público María Alejandra Malberti Riveros (UNSJ) amalberti@gmail.com, Raúl Oscar Klenzi (UNSJ) rauloscarklenzi@gmail.com Claudio Delreiux (UNS) cad@uns.edu.ar, Damián Pablo Barry (UNPSJB) Clasificación de Información en BigData mediante la 6991 utilización de Técnicas de Inteligencia Artificial y Análisis de Redes Sociales damian_barry@unpata.edu.ar, Romina Stickar (UNPSJB) romistickar@gmail.com, Renato Mazzanti (UNPSJB) renato.mazzanti@gmail.com, Carlos Buckle (UNCOMA) carlos.buckle@gmail.com, Rodrigo René Cura (UNPSJB) rodrigo.renecura@gmail.com, Marcos Zarate (UNCOMA) marcosdzarate@gmail.com Adriana Martin (UNSJ) adrianamartin1@gmail.com, Susana Beatriz Chavez (UNSJ) schvz@gmail.com, María Antonia Murazzo (UNSJ) marite@unsj- 6992 MongoDB en ambiente Cloud Híbrido con OpenStack cuim.edu.ar, maritemurazzo@gmail.com, Nelson R. Rodriguez (UNSJ) nelson@iinfo.unsj.edu.ar, Francisca Adriana Valenzuela (UNSJ) franciscaadriana.valenzuela@gmail.com Ernesto Mangia (UADER) mellorente@arnet.com.ar, Omar Denis (UADER) mellorente@arnet.com.ar, M. E. Llorente (UADER) mellorente@arnet.com.ar, Javier Besso (UADER) mellorente@arnet.com.ar, 6999 Implementación de un Modelo Multidimensional para un Datawarehouse sobre pacientes diabéticos 7002 Geometría Computacional y Bases de Datos 7017 Bases de Datos no Convencionales: ?Indices y Lenguajes de Consulta Desarrollo de un Sistema Experto para el Proyecto de 7026 Investigación "Generador Automático de Modelos de Datos Normalizados en Bases de Datos Relacionales" Ald Daniel Sigura (UADER) mellorente@arnet.com.ar, Alejandro Hadad (UADER) mellorente@arnet.com.ar, Bartolomé Drozdowicz (UNER) bdrozdo@santafeconicet.gov.ar María Gisela Dorzán (UNSL) mgdorzan@unsl.edu.ar, Susana Esquivel (UNSL) esquivel@unsl.edu.ar, Olinda Edilma Gagliardi (UNSL) oli@unsl.edu.ar, Guillermo Leguizamón (UNSL) legui@unsl.edu.ar, Pablo Rafael Palmero (UNSL) prpalmero@unsl.edu.ar, María Teresa Taranilla (UNSL) tarani@unsl.edu.ar, Gregorio Hernandez Peñalver (UPM) gregorio@fi.upm.es Jorge Arroyuelo (UNSL) bjarroyu@unsl.edu.ar, Susana Esquivel (UNSL) esquivel@unsl.edu.ar, Alejandro Grosso (UNSL) agrosso@unsl.edu.ar, Verónica Ludueña (UNSL) vlud@unsl.edu.ar, Cintia Valeria Martinez (UNSL) cintiavmartinez@hotmail.com, Nora Reyes (UNSL) nreyes@unsl.edu.ar, Edgar Chávez (CICESE) elchavez@cicese.mx, Gonzalo Navarro (UCHILE) gnavarro@dcc.uchile.cl, Manuel Hoffhein (UTALCA) mahahein3@gmail.com, Rodrigo Paredes (UTALCA) raparede@utalca.cl Luis Esteban Damiano (UTN-FRC) ldamiano@sistemas.frc.utn.edu.ar, María Alejandra Paz Menvielle (UTN) pazmalejandra@gmail.com, Roberto Miguel Muñoz (UTN-FRC) rmuñoz@sistemas.frc.utn.edu.ar, María Soledad Romero (UTN-FRC) romeroma.soledad@gmail.com, Juan Carlos Cuevas (UTN-FRC) juancarloscu@gmail.com, Carlos Bartó (UTN) cbarto@efn.uncor.edu, Nicolás Fiorito (UTN-FRC) fiorito.nicolas@gmail.com, Mauricio Spalletti (UTN-FRC) spalletti.mauricio@gmail.com Cristobal R. Santa María (UNLaM) csanta_maria@ing.unlam.edu.ar, Técnicas de Minería de Datos Aplicadas al 7028 Victoria Santa María (UBA) vctrsntmr@gmail.com, Procesamiento de ADN de Comunidades Microbiológicas Fernando Galanternick (UBA) Acciones Id Título Autores Acciones fgalanternick@gmail.com, Luis López (UNLaM) llopez@ing.unlam.edu.ar, Juan Carlos Otaegui (UNLaM) juancarlosotaegui@yahoo.com.ar, Marcelo Soria (UBA) soria@agro.uba.ar Gerardo E. Schneider (UNER) gschneider@bioingenieria.edu.ar, 7069 Gestión y procesamiento de imágenes aéreas de caña de azúcar Agustín Solano (UNER) aguchosolano@gmail.com, Alejandra Kemerer (UNER) gschneider@bioingenieria.edu.ar, Alejandro Hadad (UNER) hadad@santafeconicet.gov.ar Laura Lanzarini (UNLP) laural@lidi.info.unlp.edu.ar, Waldo Hasperué (UNLP) whasperue@lidi.info.unlp.edu.ar, César Estrebou (UNLP) cesarest@lidi.info.unlp.edu.ar, Franco Ronchetti (UNLP) fronchetti@lidi.info.unlp.edu.ar, Redes Neuronales Artificiales. Aplicaciones en Minería 7100 de Datos y Procesamiento de Señales Temporales Augusto Villa Monte (UNLP) avillamonte@lidi.info.unlp.edu.ar, Germàn Aquino (UNLP) gaquino@lidi.info.unlp.edu.ar, Facundo Quiroga (UNLP) fquiroga@lidi.info.unlp.edu.ar, Luis Rojas (UNPSJB) luisf.09@gmail.com, Patricia Jimbo Santana (EPDE) pjimbo@pcpsolutions.com Viviana Mercado (UNPA) 7112 Atribución de Autoría y Determinación de la Orientación Política en Documentos Periodísticos vmercado@uaco.unpa.edu.ar, Andrea Villagra (UNPA) avillagra@uaco.unpa.edu.ar, Guillermo Leguizamón (UNSL) legui@unsl.edu.ar, Marcelo Errecalde (UNSL) merreca@unsl.edu.ar Aportes Esperados de la Técnica de Ärboles de decisión 7127 al aplicarlos a datos generados con la metodología BLENDED LEARNING Marcelo Omar Sosa (UNCa) sosamod@hotmail.com, Eugenia Cecilia Sosa Bruchmann (UNCa) sosab_ec@hotmail.com Anabella De Battista (UTN-FRCU) debattista@frcu.utn.edu.a, Andrés Pascal (UTN-FRCU) 7129 Indexación y Búsquedas de Bases de Datos pascalj@frcu.utn.edu.ar, Juan Pablo Nuñez (UTN-FRCU) nunezjp@frcu.utn.edu.ar, Soledad Retamar (UTN-FRCU) retamars@frcu.utn.edu.ar, Norma Edith Herrera (UNSL) nherrera@unsl.edu.ar, Gilberto Gutierrez (UBB) ggutierr@ubiobio.cl Algoritmo Genético para la asignación eficiente de recursos en casos de Catástrofes Climáticas Marcos Trotti (UNCPBA) marcostrotti@gmail.com, Rosa Dos Reis (UNCPBA) msdosreis@econ.unicen.edu.ar, Moises Bueno (UNCPBA) bueno@econ.unicen.edu.ar, Daniel Xodo (UNCPBA) dxodo@exa.unicen.edu.ar Construyendo Campo Productivo en zona norte de Sant 7182 a Cruz, como política de Vinculación Tecnológica, a través de un Sistemas de Información Geográfica María Eugenia De San Pedro (UNPA) edesanpedro@uaco.unpa.edu.ar, Marta Lasso (UNPA) mlasso@uaco.unpa.edu.ar, Natalia Serón (UNPA) nseron@uaco.unpa.edu.ar, A. Carrizo (UNPA) acarrizo@uaco.unpa.edu.ar, Cristian Montenegro (UNPA) cmontenegro@uaco.unpa.edu.ar, L Ramos (UNPA) ramosluis_1@hotmail.com 7168 7191 Sistemas de apoyo a la toma de decisiones. Una aplicación en el área de Gestión Universitaria 7215 Indexando Bases de Datos de Texto Claudia López de Munain (UNPSJB) klaucvj@gmail.com, Anahi Sandoval (UNPSJB) anahi_asand@hotmail.com, Marcela Torrent (UNPSJB) marcelatorrent@gmail.com Norma Edith Herrera (UNSL) nherrera@unsl.edu.ar, Carina Mabel Ruano (UNSL) cmruano@unsl.edu.ar, Darío Ruano (UNSL) dmruano@unsl.edu.ar, Susana Esquivel (UNSL) esquivel@unsl.edu.ar « Anterior | Siguiente » Utilización de NoSQL para resolución de problemas al trabajar con cantidades masivas de datos Giovanni Daián Róttoli1, 2, Marcelo López Nocera1, Ma. Florencia PolloCattaneo1,2 1 Grupo de Estudio en Metodologías de Ingeniería de Software (GEMIS). Facultad Regional Buenos Aires. Universidad Tecnológica Nacional. Argentina. 2 Ingeniería en Sistemas de Información, Facultad Regional Concepción del Uruguay. Universidad Tecnológica Nacional. Argentina {flo.pollo, gd.rottoli}@gmail.com, zappapet@yahoo.com Resumen Las bases de datos relacionales (RDBMS) se han utilizado tradicionalmente para resolver una amplia variedad de problemas asociados a datos de diversa naturaleza. Sin embargo, con el advenimiento de Big Data, se han presentado nuevos desafíos que esta arquitectura no ha podido resolver eficientemente. Dicha situación dio origen a nuevas tecnologías que no utilizan SQL como lenguaje de consulta y además plantean nuevas arquitecturas para el modelado de los datos. Son conocidas genéricamente bajo el nombre “NoSQL” y son alternativas que podrían resolver estas cuestiones asociadas con cantidades masivas de datos. El presente trabajo lleva adelante un estudio de campo para ver en qué casos se obtiene mejor resultado utilizando cada una de estas innovadoras tecnologías. Palabras clave: SQL, Big Data, NoSQL, Persistencia Políglota. Contexto El proyecto planteado articula líneas incipientes de trabajo del Grupo de Estudio en Metodologías de Ingeniería de Software (GEMIS) de la Facultad Regional Buenos Aires (FRBA) y Concepción del Uruguay (FRCU) de la Universidad Tecnológica Nacional (UTN) Introducción Las bases de datos tradicionales, de arquitectura relacional, que usan el lenguaje SQL, y frecuentemente englobadas bajo la abreviatura RDBMS, parecen no ofrecer soluciones eficientes para un variado universo de nuevos problemas relacionados con el tratamiento de datos masivos, conocidos genéricamente como Big Data (por caso, el análisis en línea de los datos recabados de las redes sociales). Esto provocó, entre otras cosas, el advenimiento de NoSQL [1]. El concepto NoSQL tiene su auge en el año 2009, y se refiere a todas aquellas tecnologías de bases de datos que no utilizan el lenguaje ANSI SQL para sus consultas [1]. Se trata generalmente de proyectos de código abierto, que corren en grupos de servidores, utilizan una arquitectura de procesamiento distribuido, tienen modelos de datos distintos del relacional tradicional, permitiendo el uso de agregados (listas, registros, etc.), y operan sin esquemas, permitiendo agregar o quitar elementos a la base de datos de manera sencilla, sin que esto represente un problema [1]. Estas características hacen posible palear las principales problemáticas aportadas por la masividad de los nuevos conjuntos de datos, entre las cuales se encuentra: 1. El bajo rendimiento para grandes volúmenes de datos [1][6][7][8]. 2. La discordancia de la impedancia (los datos en memoria tienen una estructura distinta a la que se almacena en la base de datos física) [1][5]. 3. La necesidad de escalado del almacenamiento físico, ya sea aumentando la capacidad de los servidores, lo cual es caro y limitado, o utilizando servidores colaborativos, lo cual no es soportado por las bases de datos tradicionales [2][3][6][7][8][10]. 4. La imposibilidad de las bases de datos relacionales de utilizar estructuras de datos complejas anidadas, lo cual surge a partir de la necesidad de modelar datos de estructuras poco usuales que, si se modelaran de una manera clásica, por un lado no resultaría en un modelo fiel de la realidad en cuestión, y por otro disminuiría la eficiencia total de las consultas de manera considerable [1][4][6][7][8]. NoSQL engloba una gran cantidad de alternativas que operan bajo paradigmas completamente distintos y lenguajes de consulta muy variados. Ante tal gran abanico de posibilidades, las grandes empresas, como Google1 o Amazon2 , optan por utilizar estas tecnologías, que inclusive desarrollan por su cuenta para adaptarlas exclusivamente a sus necesidades particulares. 1 2 Google - www.google.com Amazon - www.amazon.com Entre las opciones NoSQL, se pueden destacar cuatro grupos o tipos principales, los cuales se diferencian entre sí por el paradigma de modelado de datos que utilizan. Estos son: las bases de datos de Clave-Valor, las de Familia de Columnas, las Documentales y las Gráficas, cada una con sus propias particularidades, ventajas y desventajas a considerar a la hora de elegir por alguna de ellas. [2][4][5][6][7][8]. Por otro lado, se debe tener en cuenta que la encapsulación de servicios puede ayudar al cambio de las tecnologías de almacenamiento de datos a medida que las necesidades y evolucionan. La separación por capas de las partes de las aplicaciones permite introducir NoSQL en una aplicación preexistente, pudiendo además coexistir arquitecturas SQL y NoSQL, aprovechando las ventajas de cada una de ellas. Esto último se conoce como persistencia políglota [5] y [9], es decir, el uso de diferentes almacenamientos de datos en distintas circunstancias. Como ejemplo, podemos mencionar la utilización de una base de datos NoSQL Gráfica para mantener las relaciones de compras entre usuarios y productos, y una SQL para mantener los datos de los usuarios. Otro ejemplo, consistiría en la utilización de una base de datos Documental para guardar historiales médicos, debido a su falta de esquemas, y una base de datos Clave-Valor para vincular los pacientes con datos sobre su habitación, médico a cargo, u otros datos, debido a su rapidez de consulta y sencillez en el manejo de datos simples. Entre las principales características de la persistencia políglota, podemos enumerar [9]: • La implicación de diferentes tecnologías de datos para manejar las diversas necesidades de almacenamiento de los mismos. • La aplicación de dicha arquitectura en la totalidad de los datos de una empresa o para un subconjunto de ellos. • La reducción del impacto de los cambios en la totalidad del sistema, al encapsular los distintos servicios de bases de datos. • El aumento de la complejidad de las aplicaciones al necesitar manipular diversidad de lenguajes de consulta y particularidades de los motores de bases de datos. Por todos estos motivos y para muchas situaciones que lo requieran, comenzar a utilizar motores de bases de datos NoSQL, o bien, persistencia políglota parecen ser opciones más que satisfactorias para las organizaciones. Sin embargo, el impacto de realizar estos cambios puede resultar en costos elevados, problemas de rendimiento y otros relacionados a la seguridad de los datos, debido a la necesidad de adaptar el modelo de datos actual a los diferentes paradigmas NoSQL[2][7][8]. El presente proyecto, propone el estudio del comportamiento de las bases de datos NoSQL al ser utilizadas con un modelo de datos diferente, para conocer el impacto de ello, esperando encontrar evidencias que indiquen que un modelo políglota permitiría mitigar dicho impacto de una mejor manera. Líneas de Investigación, Desarrollo e Innovación En el último tiempo, con la llegada de las nuevas tecnologías de Bases de Datos y la tendencia NoSQL, muchas empresas quieren migrar sus datos a estas plataformas por diferentes motivos [9]. Muchas veces, diseñar una estructura de bases de datos NoSQL que se adapte a la estructura de los datos actual, implica sacrificar ciertas características como el rendimiento, la normalización de las tablas, etc., para que ambas arquitecturas sean totalmente compatibles [5] y [6]. Surgen así interrogantes como ¿cuál es el rendimiento entre las bases de datos NoSQL si se mantiene la estructura de los datos entre una y otra? y ¿qué tan beneficioso es mantener un modelo “genérico” entre las distintas bases de datos y aprovechar solamente las características de los motores? Una organización que se encuentra en vías de crecimiento, se plantea estas preguntas, siendo la incertidumbre sobre el futuro lo que le dificulta tomar una decisión sobre la estructura de sus datos. Por ello, se propone realizar una serie de pruebas con datos de distinta naturaleza, a los que se los modelará de manera relacional y según los distintos paradigmas NoSQL (Documentales, Gráficas, Clave-Valor y Familia de Columna), y cada uno de dichos modelos se implantará en motores de bases de datos tanto relacional, como es PostgreSQL3, y NoSQL, como son MongoDB4 (Documentos), Cassandra5 (Familia de Columnas), Redis6 (ClaveValor) y Neo4J7 (Gráfos). De esta manera, se realizará un modelo adecuado para las bases de datos documentales y, si es posible, se trasladará esa estructura de datos hacia las demás tecnologías. Así mismo, este procedimiento se repetirá con todos los tipos de bases de datos nombrados anteriormente. Para llevar a cabo el proyecto propuesto, se plantean las siguientes actividades: 3 PostgreSQL – http://www.postgresql.org/ MongoDB – http://www.mongodb.org/ 5 Cassandra – http://cassandra.apache.org/ 6 Redis – http://redis.io/ 7 Neo4J – http://neo4j.com/ 4 1. Obtención de datos característicos: por lo menos 3 juegos de datos de distinta naturaleza. Por ejemplo, datos correspondientes a compras realizadas por personas, datos médicos de pacientes, sus historiales y relaciones con médicos, y datos de redes sociales. 2. Modelado 2.1. Modelado de los datos de forma relacional, documental, gráfica, clavevalor, y familia-columnas. 2.2. Traslado de cada modelo a los diferentes motores de base de datos SQL y NoSQL. 2.3. Pruebas mediante consultas complejas (que requieran la utilización de operaciones como Inner Join por ejemplo), y en cada uno de los motores para cada uno de los modelos desarrollados. Obtención de tiempos de ejecución de las consultas. 3. Análisis de Datos 3.1. Determinar si existen casos donde una estructura de tal característica no influye en la eficiencia de las consultas bajo un determinado paradigma. 3.2. Determinar si las estructuras de datos resultantes resultan comprensibles y la utilización de los datos no ocasionaría problemas futuros. Resultados y Objetivos Mediante la ejecución del procedimiento descripto en el apartado anterior, se obtendrán los tiempos de consulta correspondientes a cada uno de los modelos de datos en los distintos motores de bases de datos. A partir del análisis de los mismos, se podrá determinar si la migración de los datos desde una base de datos SQL o NoSQL a otra, puede realizarse (aunque sea en una primera instancia) sin mayores modificaciones de la estructura de los mismos. Se pretende además, confirmar que un modelo políglota sería la mejor alternativa a adoptar ante un escenario plural, para aprovechar las características de los distintos motores, o bien para realizar las migraciones de datos de manera modular. Formación de Recursos Humanos Este proyecto busca tanto la obtención de nuevos conocimientos como la motivación de los implicados para que asciendan dentro del escalafón de la carrera de investigadores. El grupo de trabajo se encuentra integrado por dos investigadores formados y un investigador en formación. Además se encuentra en desarrollo un Trabajo Final de Especialidad. Se pretende formar especialistas en el análisis de adopción de procesos vinculados con la Ingeniería de Software. Finalmente, en el marco de este proyecto de investigación se prevé la radicación de una Tesis de Maestría en Ingeniería en Sistemas de Información. Referencias [1]. P. Sadalage, M. Fowler. NoSQL Distilled, A Brief Guide 1to the Emerging World of Polyglote Persistence. AddisonWesley, Boston, USA, 1st. Edition, 2013 [2]. R. Hecht. NoSQL Evaluation. International Conference on Cloud and Service Computing. ISBN:978-1-45771637-9.P.336-341.2011. URL: http://rogerking.me/wpcontent/uploads/2012/03/DatabaseSystem sPaper.pdf (verificado el 23/02/2015) [3]. D. López. “Análisis de las posibilidades de uso de Big Data en las organizaciones”. Universidad de Cantabria, Santander, España, 2012. URL: http://repositorio.unican.es/xmlui/bitstrea m/handle/10902/4528/TFM%20%20David%20L%C3%B3pez%20Garc% C3%ADaS.pdf?sequence=1 (Verificado el 27/02/2015) [4.] A. Ramírez, H. Helio, C. Herrera, J. Francined. Un viaje a través de bases de datos espaciales. NoSQL: Redes de ingeniería, Univ. Distrital Francisco J de Caldas, Bogotá, Colombia, vol.4, no2, págs. 35-47, agosto-diciembre 2013 URL: http://revistas.udistrital.edu.co/ojs/index.p hp/REDES/article/download/5923/7426 (verificado el 21-02-2015) [5]. A. Nayak, A. Poriya, D. Poojary. “Types of NOSQL Databases and its Comparison with Relational Databases”. International Journal of Applied Information Systems (IJAIS) – ISSN: 2249-0868 Foundation of Computer Science FCS, New York, USA Volume 5– No.4, March 2013 URL: http://research.ijais.org/volume5/number4 /ijais12-450888.pdf (verificado el 21-02-2015) [6]. C. Strauch, W. Kriha. “NoSQL databases”. 2011. URL: http://www.christofstrauch.de/nosqldbs.pdf (verificado el 21-02-2015) [7]. H. Del Busto, G. Hansel, O. Enríquez. “Bases de datos NoSQL”. Revista Telemática, vol. 11, no 3, 2013 URL: http://revistatelematica.cujae.edu.cu/index .php/tele/article/view/74/74 (verificado el 21-02-2015) [8]. F. Bugiotti, L. Cabibbo. “A Comparison of Data Models and APIs of NoSQL Datastores”. Dipartamento di Ingegneria della Università di Roma, 2013 URL: http://www.bugiotti.it/downloads/publicat ions/noamSEBD13.pdf (verificado el 21-02-2015) [9]. C. Nance, T. Losser, R. Iype, G. Harmon. “NoSQL vs RDBMS - why there is room for both”, Proceedings of the Southern Association for Information Systems Conference, Savannah, GA, USA March 8th–9th, 2013 URL: http://sais.aisnet.org/2013/Nance.pdf (verificado el 21-02-2015) [10]. M. Mannino. Administración de Base de Datos. ISBN 9789701061091. MCGRAW-HILL / Interamericana de México.3ra Edición. 2007