Download BASE DE DATOS ESPACIALES Javier Tolosa, Luis Pulido, Carlos
Document related concepts
Transcript
BASE DE DATOS ESPACIALES Javier Tolosa, Luis Pulido, Carlos Gamboa Especialización en Sistemas de Información Geográfica, Universidad Distrital Francisco José de Caldas Bogotá, Colombia javiertolosa@gmail.com carlosagamboa@gmail.com guin.luis@gmail.com Resumen- En el momento de la concepción de las bases de datos espaciales en indispensable tener en cuenta que el tipo de base de datos espacial que se va a utilizar depende de las necesidades y requerimientos de la estructura de la información con que se tenga y en cierto modo de los recursos con los que se disponga, puesto que en la medida que se tenga una gran cantidad de información, mayor recurso tecnológico requiere y de esta forma el costo del software y del conocimiento para la manipulación y administración requiere de profesionales con un mayor grado de conocimientos en la materia; independientemente del programa en que se desee implementar los pasos iniciales requieren de un modelamiento concienzudo de acuerdo de los requerimientos y necesidades del usuario final, esto quiere decir que es necesario la identificación de los conceptos dentro de la idea del negocio, identificar las relaciones existentes entre las temáticas o entidades y determinar estructuradamente las características de cada una de las componentes que permitan almacenar la información, de manera que se acomode en la medida de lo posible a las formas normalizadas o prexistentes del modelamiento de las bases de datos espaciales. INTRODUCCIÓN La información y los datos que obtiene diariamente a partir de las nuevas Tecnologías de la Información y Conocimiento (TIC), como se observa actualmente con servidores de mapas como google earth, servidores de la NASA, USGS en formato raster u open street maps, tracks de disposistivos móviles GPS que se soportan sobre un servidor que almacena esta información, generan información geográfica de forma abundante, información que anteriormente no se tenia y no existía la infraestructura de tecnológica para la manipulación de este información, sin embargo esta información debe ser procesadas para convertirse en insumo sea útil para satisfacer cualquier tipo de necesidad . En la actual revolución social el acceso y manejo de la información denominada Sociedad de la Información donde un conjunto exuberante de datos se encuentran contenidos en nuevos soportes y que dan origen a la Sociedad del Conocimiento, en la que se transmite información con el fin de estimular la creación de nuevos conocimientos mediante la educación, se establece la información como un elemento accesible, que se puede poseer, que da poder, que da conocimiento. MARCO TEORICO Con el desprendimiento de la información con respecto a los equipos informáticos físicos se logro un gran avance en materia de usabilidad, portabilidad y eficiencia en materia de la generación de sistemas de información geográficos sencillos y autónomos en su retroalimentación y administración, aspecto que incrementa notablemente la vida útil de estos sistemas y por consiguiente de las bases de datos espaciales que soportan y gestionan este tipo de información. Los sistemas de información, como tecnología de la información nos ayudan a manejar la información, lo que sabemos (what we know), permitiendo y facilitando la organización, almacenamiento, acceso, manejo, manipulación, síntesis y aplicación de conocimiento para la solución de problemas, a partir de un conjunto de recursos, que normalmente incluyen hardware, software, información, datos, aplicaciones, comunicaciones y personas. la gestión, manejo y almacenamiento de los datos espaciales y no espaciales; mediante el desarrollo e implementación de sistemas de gestión, acceso y consulta denominados Manejadores de Bases de Datos Espaciales (SMBD), pilar y núcleo de las tareas de análisis de información y generación de conocimiento que sobre el espacio los Sistemas de Información Geográfica (SIG) involucran en multitud de procesos de planeación, toma de decisiones y gestión de aspectos en determinados casos de importancia estratégica y vital, debido a que en cada proceso se debe inferir las necesidades y exteriorización Archivo de Datos Un conjunto de registros relacionado conforma un. Registros relacionados implican que estos representan diferentes ocurrencias del mismo tipo de clases de personas, cosas, eventos o fenómenos. El desarrollo de los primeros sistemas de almacenamiento y consulta hasta los modernos sistemas de bases de datos ha sido definido por diversos factores: 1. 2. Es común usar los términos Datos e Información como sinónimos, sin embargo ambos términos transmiten diferentes conceptos: • • Los Datos son hechos que describen sucesos y entidades, es una palabra en plural que se refiere a un cuerpo de de hechos o figuras que han sido recolectadas sistemáticamente para uno o más propósitos específicos [5]. Las colecciones o conjuntos de datos pertenecientes a un mismo contexto y que son almacenados sistemáticamente y de forma persistente para su posterior uso, se denominan Bases de Datos (BD) [7] Los datos en una libreta o directorio telefónico constituirían una base de datos; de hecho ni libreta, ni las hojas con los números impresos o escritos en ellas constituirían la BD, esta solo estaría definida por el conjunto de datos que se encuentran allí: Atributo es La unidad mínima de almacenamiento en una base de datos espacial es un data-ítem o elemento de dato, este representa una ocurrencia de una característica particular correspondiente a una entidad (persona, evento, fenómeno o cosa), y generalmente se denomina Su nombre, su teléfono, son cada uno independientemente atributos Registro es un grupo relacionado de elementos de dato, constituyen un (record). los datos son ocurrencias de diferentes características correspondientes a la misma persona, evento, etc. Los atributos que conforman un registro pueden ser de diferente tipo, texto (string, char, varchar, varchar2), valores numéricos (integer, float, double, number, etc), imágenes, etc. Todos los atributos de una misma persona, constituyen un registro. 3. La constante necesidad de superar las limitaciones de los sistemas de procesamiento. Posibilitar el uso de los avances en la tecnología de la computación. El cambio conceptual del uso de los datos. Dichos factores han generado en múltiples campos de aplicación, la implementación de diferentes alternativas mediante SMBD. Estas permiten categorizar los SMBD de acuerdo a [4]: Los beneficios de este esquema, radican en su simplicidad, flexibilidad y productividad, puesto que los datos se almacenan de forma simple, en Tablas como listas bidimensionales de registros, generalmente definidas como Relacion: cuya estructura es fácil de entender y transmitir a otros sistemas relacionales. De igual forma SQL facilita una mayor productividad, al ser un lenguaje de fácil aprendizaje. Aunque la mayor ventaja del modelo de datos relacional, es la capacidad que tienen los usuarios de crear, ingresar y extender si es necesario sus propios tipos de datos. La aparente simple estructura que implica el modelo relacional ha probado ser flexible y útil en un amplio rango de áreas de aplicación, estimándose que un 95% de los datos almacenados en SMBD, se encuentran bajo un modelo relacional (SMBDR)[3], y es por ende el modelo dominante en el mercado, con productos como: DB2 de IBM, Informix, Oracle, Sybase, Microsoft Access y SQLServer, FoxBase y Paradox [13]. Las limitaciones de los SMBDR radican principalmente en la incapacidad de este modelo de almacenar y consultar Objetos Completos y de Amplio Significado directamente en la BD, elementos como imágenes, audio/video, y como se presentara en secciones posteriores elementos espaciales; pues el sistema fue originalmente diseñado para el manejo datos tradicionalmente asociados a transacciones bancarias, manejo de recursos y personal, control de recursos e inventario [3]. Modelo de datos orientado a objetos. De la cada vez más creciente necesidad por combatir las limitaciones de los SMBDR y permitir el uso y difusión de datos sobre la Internet, los programadores desarrollan e introducen en la década de 1990, los conceptos de programación Orientada a Objetos [13]. Los sistemas manejadores orientados a objetos (SMBDOO) proveen la capacidad de un acceso consistente, seguro, y capacidad de almacenamiento de Objetos Completos (comportamiento y atributos) en la base de datos. Un Objeto se define como un paquete de información autocontenida, describiendo las características o atributos (Estado) y capacidades (Comportamiento) de una entidad de estudio. La interacción entre dos objetos se denomina Relación, un conjunto de Objetos del mismo tipo se denomina Clase [3]. Los SMBDOO involucran 4 importantes características a partir de la conjunción de las tecnologías de la programación orientada a objetos y el manejo de bases de datos. la extensión del modelo relacional para el manejo de objetos [4]. Modelo de datos objeto relacional. Los SMBD Objeto Relacional (SMBDOR), son sistemas que cuentan con el robusto manejo de transacciones de un sistema relacional y con la capacidad de manejar objetos con la flexibilidad de almacenamiento y acceso de los sistemas orientado a objetos. Los diferentes esquemas de extensión de un modelo relacional a un modelo orientado a objetos, comercialmente disponibles como IBM DB2, Informix Dynamic Server, Microsoft SQL Server y Oracle generalmente ofrecen como característica la posibilidad que el usuario defina sus propios tipos de datos, funciones de manipulación acceso e indexado, sin necesidad de grandes cambios a los SMBDR ya existentes en la organización, y permitiendo a los programadores el usos de programación en lenguajes orientados a objetos como VisualBasic, Java y C++[12]. Evolución de la arquitectura en SMBD. 1. 2. 3. 4. La Herencia, permite el desarrollo de soluciones a problemas complejos en términos de objetos ya existentes. El Encapsulamiento, describe el hecho de que cada objeto empaqueta y protege una descripción de su estado y comportamiento. La Identidad, permite a un objeto diferenciarse de otros, y por ende ser independiente. El Polimorfismo describe el proceso por el cual cada objeto tiene su propia implementación para las operaciones definidas Este esquema representa una manera más natural de pensar y abordar problemas a solucionar. Otras de las ventajas de este modelo radican en que las operaciones definidas no dependen de una aplicación en particular [13], permitiendo el manejo de datos persistentes como los almacenados en una BD y, datos transitorios o semipermanentes como los encontrados en otros programas en ejecución. Sin embargo y a pesar de su indudable elegancia, estos sistemas no han probado ser lo suficientemente exitosos a nivel comercial como se había predicho, las causas de dicho revés radican principalmente en la masiva cantidad de SMBDR instalados y en funcionamiento, lo que ha limitado el desarrollo en implementación de los modelos OO [3] y [12], y a la importante implementación que sobre los SMBDR cada proveedor ha realizado buscando La implementación de los SMBD en una determinada arquitectura de hardware y software, define muchos de los aspectos de funcionamiento y estructura del sistema de gestión, almacenamiento y análisis de los datos en la BD. Múltiples opciones de configuración pueden ser definidas, sin embargo se presentan de acuerdo con Yeung, et al (2008) las características de los sistemas centralizados y distribuidos, mediante una arquitectura cliente/servidor (ver Figura 7), pues es este esquema de procesamiento el más ampliamente difundido es SMBD. Los primeros SMBD fueron desarrollados sobre Mainframes o computadoras centrales con grandes capacidades de almacenamiento, mediante un ambiente operativo multitarea, donde varios procesadores trabajan de forma concurrente en una sola unidad de procesamiento. En estos sistemas, la BD, las aplicaciones de manejo y otro tipo de aplicaciones se almacenaban en un único computador central, por eso se denomina a esta arquitectura como Centralizada. Con el amplio avance en las tecnologías de la comunicación y la mayor difusión y capacidad de los sistemas de computo personal en la década de 1990, la arquitectura de los SMBD avanzo rápidamente hacia el concepto de Sistema Distribuido, en el que las operaciones de manejo de la base de datos se encuentran separadas de las funciones de almacenamiento [3], no solo en términos de la separación física y geográfica de las estaciones a partir de las ventajas de un ambiente de trabajo en red donde los recursos son compartidos, también en términos de separación lógica de las operaciones y el almacenamiento de la BD en dichos computadores [7]. Este tipo de arquitectura se define como Cliente/Servidor, pues son los clientes los que requieren datos o servicios de procesamiento de servidores que llevan a cabo las tareas (proveer servicios) para satisfacerlos [3]. La mayoría de los SMBD hoy en día son construidos a partir del concepto de sistemas de procesamiento distribuido. El aumento en poder de procesamiento en las estaciones de usuario (microcomputadores), permitió remplazar las terminales mudas, y llevar a cabo algunas de las tareas de procesamiento en el lado del cliente, pasando de un modelo centralizado o denominado de Servidor pesado (Figura 7a) a un modelo de Cliente pesado (Figuras 7b y 7c), existen también terminales de usuario (workstations) que permiten la ejecución de todos los procesos sobre los datos de la BD que se encuentran disponibles de forma remota (Figura 7d). Una extensión al modelo de dos niveles, es la arquitectura de tres niveles (Three-tier architecture), su principal característica es que las funciones en cada nivel son independientes a la implementación. En esta arquitectura las tareas de procesamiento de datos, pasan desde el nivel del cliente al nivel de aplicaciones, pues el servidor de aplicaciones es mucho más poderoso que los clientes, lo que implica que no es necesario ahora contar con costosas estaciones de trabajo con altas prestaciones para dichas tareas. Esta arquitectura se define como configuración de Cliente Ligero (Thin Client) (ver Figura 7e), y es la base de los actuales sistemas de bases de datos basados en la web, donde una pequeña aplicación del lado del cliente (web browser) permite el acceso a servidores de aplicaciones y almacenamiento [7]. Es común denominar a cada uno de los niveles de esta arquitectura como: Nivel de Presentación, Lógica del negocio y Servidor de datos [3]. Naturaleza de los datos. A partir de las características de los datos, y desde una perspectiva de las BD, los SMBD pueden categorizarse como Espaciales y No-Espaciales [4]. Aunque este aspecto en la evolución de los SMBD no implica un “descubrimiento” y/o desarrollo reciente en la abstracción y representación de la información relacionada con el espacio, si ha generado una amplia corriente de investigación y desarrollo en el manejo y procesamiento en el campo de los SMBD en los últimos 25 años [12]. Los datos relacionados con fenómenos en una determinada región en el espacio se denominan Datos Espaciales [19], esta relación se establece a partir de un atributo denominado Espacial, generalmente un conjunto de pares de coordenadas [4] que definen su posición y posiblemente su forma, orientación y tamaño [6] Es mediante este atributo espacial que es posible definir como el objeto es representado, su Geometría, así como la forma en que un dato o conjunto de datos espaciales se relacionan en el espacio, Topología. Otras denominaciones asociadas al término datos espaciales son: datos espacialmente referenciados [16], datos geográficos [3], datos geográficamente referenciados o datos geoespaciales [4]. En los dos primeros términos, sin el uso del prefijo geo, se hace referencia en un amplio sentido a objetos geométricos (líneas, polígonos, puntos, cubos, etc) en un espacio bidimensional o tridimensional definido para propósitos específicos, como el diseño a gran escala (VLSI, realidad virtual, diseño estructural, análisis molecular, etc) y la biometría y . El empleo del prefijo geo, implica que los datos están relacionados a la superficie terrestre o su cercanía [3], a un espacio denominado geográfico, a partir de un determinado sistemas de coordenadas definido que permite su integración y operación [4]. Los datos No-Espaciales, también denominados atributos, datos característicos o atributos descriptivos [9] son datos sobre un fenómeno almacenados en la BD que son independiente de las consideraciones geométricas (aspatial data) [22], este tipo de datos es por lo general de tipo alfanumérico. Existe otro tipo de datos, que aunque poseen atributos o características espaciales, estos no pueden ser empleados directamente como información relacionada a un espacio geográfico, y se suelen denominar Datos Pseudoespaciales [4], como por ejemplo los datos sobre la dirección en una ciudad, datos geográficos alfanuméricos, como estadísticas demográficas, información censal etc, imágenes y/o fotografías. Estos datos requieren ser convertidos a datos espacialmente referenciados, procesos largos y por lo general costosos, llevados a cabo mediante herramientas SIG denominados respectivamente Geocodificacion y Georreferenciacion [8]. Almacenamiento de los Datos Espaciales. Representación de los Datos Espaciales. La representación, almacenamiento y modelamiento de las características espaciales de una entidad o fenómeno es decir su atributo espacial, en una BD son determinadas por la adopción de un modelo geométrico discreto. Este proceso parte de un modelo de objetos discretos, que representan con límites claramente definidos ocurrencias espaciales de fenómenos o categorías definidas por el observador [3]. En la figura 8, cada ocurrencia o entidad (L1 o L2) representan un único objeto espacialmente definido. La descripción de las características espaciales geométricas en un espacio , generalmente asumiendo que la dimensión d es 2, y que las coordenadas y distancias son euclidianas [9], parte de un conjunto de Primitivas [16] o Abstracciones [21] que permiten las construcción de formas más complejas, mediante la transformación de las propiedades espaciales en propiedades de pares de numero reales [23]. La primitiva fundamental, en términos geométricos es el Punto, entidades 0-dimensionales únicamente descritas por sus coordenadas geográficas x e y [9], [16], [19], [21], [23] y [24], (ej: puntos P1 a P6 en la Figura 8); esta permite representar en términos espaciales la ocurrencia de un fenómeno sin importar su forma, o dependiendo de la escala de abstracción áreas demasiado pequeñas respeto al espacio que las contienen. Mediante la definición de la relación de un conjunto siempre finito y secuenciado de puntos, se establece la Línea [16] y [21], se utiliza también términos como Polilínea [9] o de acuerdo al Modelo Geométrico estándar para aplicaciones geoespaciales definido por el Open Geospatial Consortium (OGC) como Curva [24], elementos 1dimensionales que facilitan la descripción de atributos espaciales de los objetos especialmente sus fronteras (boundaries) [23], por ejemplo en la Figura 8 los puntos P1 y P2 definen la línea A, los puntos P4 y P1 la línea G, las líneas F y A conformarían la Polilinea FA. Un conjunto finito de curvas, o una polilínea cerrada definen un Polígono [23] y [9], Región [19] y [21], Área [16] o de acuerdo con OGC una Superficie, como un elemento geométrico 2-dimensional [24] y [17], que representa una región del plano delimitado por su frontera asimilable a entidades espaciales con una extensión y área considerable, en la figura 8 las líneas A, B, C y G o en otras palabras la polilinea ABCG forman el polígono L1. Convencionalmente los SMBD fueron diseñados para el almacenamiento y manejo de datos alfanuméricos representados por cadenas de caracteres, valores numéricos, fechas, valores booleanos o expresiones lógicas, los SMBDR no cuentan con el adecuado soporte para el almacenamiento y procesamiento de datos espaciales como puntos, líneas y superficies [4], un ejemplo como el presentado en la figura 8, con el único propósito de servir como ilustración, y en el que el atributo espacial definido por la geometría (polilinea) de cada uno de los elementos de área se almacena en un único atributo no podría definirse en un SMBDR, pues no existe un tipo de dato polilinea definida para este modelo de datos [12] y se estaría violando el concepto de atomicidad, por ende no se cumpliría con la estructura normalizada que todo esquema relacional debe poseer [16]. El esquema planteado inicialmente para la solución de estos inconvenientes consiste en una colección de tablas relacionadas en el SMBDR, permitiendo la descomposición en valores atómicos del las primitivas geométricas de los datos espaciales (ver Figura 9) [12], aunque este esquema se fundamenta en la consulta y acceso mediante SQL, las principales desventajas radican en que se viola el principio de independencia de los datos, lo que implica que las consultas sobre la información requieren del conocimiento de la compleja estructura y organización de los datos, estructura que reduce la velocidad de acceso y consulta, dificultando tambien la definición de nuevos tipos de datos espaciales y la imposibilidad de expresar relaciones geométricas como adyacencia o consultas espaciales [9], estructura denominada por lo tanto como no-topológica [4]. Se plantea entonces para mediados de la década de 1980 la implementación un sistema hibrido, denominado Base de Datos Geo-relacional, en este esquema los datos que representan atributos no espaciales se almacenan en un SMBDR, mientras que los datos espaciales son almacenados de forma separada en estructuras de almacenamiento generalmente de tipo propietario que varían de acuerdo a la implementación diseñada por cada vendedor para su acceso [4] y [16], esta arquitectura aunque permite superar algunas de las graves limitaciones del modelo relacional, implica que la coexistencia de dos sistemas requiere la definición de modelos de datos diferentes que pueden limitar el uso e integración de estos, limitando la funcionalidad del SMBD en procesos de consulta y optimización, por lo que se denomina este enfoque como Débilmente Acoplado (Loosely Coupled), esquema implementado en entornos de procesamiento y análisis de datos espaciales como ArcInfo desarrollado por ESRI, así como MGE y TiGRis de Intergraph [9]. Como ya se había mencionado en 3.1.3, es mediante un esquema Orientado a Objetos y Objeto Relacional que las capacidades de almacenamiento de datos complejos pueden implementarse en el SMBD mediante ADT definidos como Tipos de Datos Espaciales (SDT Spatial Data Types) que proporcionan a los SMBDOO y SMBDOR las capacidades para el manejo y procesamiento de datos espaciales. El estándar que permite la definición del esquema de implementación y almacenamiento se llevo a cabo gracias al trabajo de la comunidad (usuarios y proveedores de datos, hardware y software con énfasis espacial) representada por el OGC y bajo el auspicio del Comité Internacional de Estándares (International Standards Organization) ISO, y se implementa a partir de modelo de geometría orientado a objetos descrito en el OpenGIS Simple Feature Specification for SQL (ver Figura 10) [3] y [24]. Mediante esta especificación la Geometría de un objeto es definida a partir de la composición de objetos de tipo punto, línea y superficie y sus combinaciones o agregaciones que permiten la definición de cualquier objeto espacial, con un determinado sistema de coordenadas y proyección. GEODATABASE “La Geodatabase es un modelo que permite el almacenamiento físico de la informacióngeográfica”. Consta de dos elementos fundamentales: • • Un archivo de almacenamiento de información geográfica, el cual se encuentra en un sistema gestor de bases de datos relacionales (SGBDR); como por ejemplo, Microsoft Access, Oracle, Microsoft SQL, Server, IBM DB2 e informix. Un modelo de datos, el cual contiene los objetos con reglas y comportamientos específicos [25]. Las Geodatabase tiene elementos estructurales los cuales son: Feature Class: Representa un elemento espacial que tiene atributos alfa numéricos, datos espaciales y comportamiento. Table Object: Objeto no espacial. Feature Data Set: Agrupación conceptual de Feature Class. TIPOS DE GEODATABASE Hay tres tipos de Geodatabase, los cuales dependen de la arquitectura (como se almacena y la funcionalidad), según el componente de almacenamiento de la Geodatabase, estas se pueden clasificar en tres tipos: 1. Geodatabase Personal Se almacena en una base de datos Microsoft Access, permitiendo crear y editar elementos (relaciones espaciales, redes geométricas, topología, etc.). No soporta la edición en modo multiusuario, por ser este una limitante del SGBDR. Puede almacenar hasta 2 GB. 2. Geodatabase de Fichero Implementada empleando exclusivamente ArcInfo, ArcEditor y ArcView, emplea una estructura de archivos, debido a que no esta implementada sobre un sistema gestor de bases de datos. Admite un único editor y no soporta el mecanismo de versiones, tiene capacidad de almacenamiento ilimitada (con un limite de 1 TB por tabla, ampliable hasta 256 TB). 3. Geodatabase Empresarial (ArcSDE) Implementada sobre SGBDR Empresariales, como por ejemplo: Oracle Entreprise, SqlServer Profesional, entre otras. La tecnologia ArcSDE y los productos ArcGIS (ArcGIS Desktop y ArcGIS Server) permiten almacenar información geográfica en SGDB. La principal característica de este tipo de GDB, es que emplea el Middleware ArcSDE para la gestión espacial de los datos, conforme a esto, estas se pueden clasificar según el ArcSDE que empleen en: • Geodatabase Enterprise ArcSDE Geodatabase tradicional con ArcSDE diseñada para sistemas corporativos a gran escala. Puede estar implementada sobre Oracle, Microsoft SQL Server (2000 ó 2005), IBM DB2 ó IBM Informix; permite la edición en modo multiusuario sin límites y el trabajo con versiones. Disponible con ArcGis Server Enterprise. • Geodatabase Workgroup ArcSDE Está implementada sobre Microsoft SQL Server 2005 Express. Soporta funciones como versionado y archivado. Diseñada para organizaciones con grupos de usuarios de hasta diez personas en lectura/edición. Tamaño Máximo de 4 GB por Geodatabase. Disponible con el nivel Workgroup de ArcGIS Server. • Geodatabase Personal ArcSDE Implementada sobre Microsoft SQL Server 2005 Express. Presenta un tamaño máximo de 4 GB por Geodatabase y admite un máximo de cuatro usuarios (uno en edición); posee funcionalidad avanzada como versionado, archivado y replicación de la información[25]. Los modelos de datos que presenta ArcGIS están constituidos en plantillas que permiten modelar y capturar el comportamiento de los elementos del mundo real en el interior de un Geodatabase. Estos modelos poseen herramientas para que la importación de datos en la Geodatabase sea rápida y efectiva; además, están construidos bajo estándares industriales que pueden ser modificados mediante ArcEditor y ArcInfo satisfaciendo necesidades de cada usuario [25]. MODELO DE DATOS GEOGRAFICOS Un modelo de datos geográfico es una abstracción del mundo real. Emplea un conjunto de objetos (dato) que soporta el despliegue de mapas, consultas, edición y análisis; los modelos de datos espaciales son: ARQUITECTURA DE LA GEODATABASE La arquitectura de la Geodatabase se basa en tres aspectos fundamentales: SGBDR, Tecnología ArcSDE y lógica de Negocio. 1. Almacenamiento en SGDBR Los SGBDR proporcionan un modelo sencillo para almacenar y gestionar la información en tablas (almacenamiento de la información geográfica en disco, definición de tipos de artículo, consultad o transacciones multiusuario) 2. Tecnología ArcSDE La tecnología ArcSDE está integrada en ArcGIS Desktop y ArcGIS Server. Sirve como conexión entre los clientes GIS y el SGBDR permitiendo a los usuarios almacenar, acceder y gestionar la información almacenada en el sistema gestor. ArcSDE es imprescindible para usuarios que necesiten versionado y transacciones largas cómo: Trabajos con históricos, edición distribuida, entornos de edición multiusuario. 3. Lógica de Negocio La lógica de negocio permite implementar elementos más complejos como feature class, feature data sets, catálogos raster, topologías, redes, etc. los cuales implementan y modelan el comportamiento geográfico. Esta lógica esta implementada usando una combinación de funcionalidad avanzada de SGBDR y ArcObjects. 1. Vector Data Model (Modelo de Datos Vectorial) Representa la estructura de datos vectorial; los elementos que posee son punto, línea y polígono y los conceptos de topología que maneja están relacionados con conectividad, longitud y dirección, área y adyacencia. 2. Raster Data Model (Modelo de Datos Raster) Representa la estructura por celdas o píxeles. Realiza representación de puntos, líneas y polígonos en una grilla la cual soporta datos discretos, continuos y no datos. 3. 3. TIN Data Model (Modelo TIN) Representado en superficies funcionales y modelos sólidos. Para muchas aplicaciones la forma vectorial de representar los elementos geográficos es la que presenta más precisión y conveniencia; existen aplicaciones que requieren de formas de representación Raster o TIN. Los elementos geográficos características ó cualidades: presentan ciertas Forma de los Elementos: En Geodatabase los elementos tienen un campo espacial en el cual se almacena la geometría, la cual puede ser de tres tipos: Puntos y Multipluntos, Polilíneas y Polígonos (segmentos de línea conectados, cerrados y que no se cortan)[27]. Referencia Espacial: La Geometría de los elementos es almacenada basada en valores X, Y en el sistema de coordenadas cartesianas. La referencia espacial especifica como las coordenadas X,Y de un conjunto de elementos es proyectada sobre la superficie del planeta[27]. Atributos: Los elementos geográficos mantienen atributos como campos en tablas basados en un modelo relacional, los atributos poseen las siguientes características: • • • • En Geodatabase la herencia se dá a partir de atributos. La herencia Múltiple no es soportada porque genera ambigüedad, presentándose juego de atributos múltiple. A través de la herencia se factorizan atributos. En Geodatabase todos los atributos son públicos[26]. Subtipos: Los elementos geográficos se agrupan en clases, la cual es un conjunto homogéneo de elementos básicamente del mismo tipo, aunque pueden tener variaciones considerables. Los subtipos se pueden definir como una disgregación lógica basada en atributos, algunas ventajas de los subtipos son: • • • • • • • • Relaciones consigo mismo. Herencia múltiple. Más de una relación entre dos clases. La relación muchos a muchos presenta gran dificultad en Geodatabase por lo tanto se debe evitar al máximo. Aspectos Importantes de las Relaciones: • • • Toda relación debe tener un nombre. Las relaciones poseen valor etiquetados: Origin Class (determina quien domina la relación), Class Origin Primary Key (Cuál es la clase que provee la llave primaria), Origin Foreign Key (cómo se llama la llave foránea), Origin Primary Key (cómo se llama la llave primaria). Entre subtipos pueden existir relaciones particulares, asociando elementos particulares. Este tipo de relaciones es muy útil para modelar redes utilizando la regla de conectividad. • Dominios Son los valores válidos que pude tomar un atributo, en Geodatabase existen tres tipos de dominio: valor, redes geométricas y rango. Algunos aspectos fundamentales son: • • • • • Evitan ingreso de datos erróneos en la base. Permite un valor por defecto, inclusive para cada subtipo. Asegura una mayor compatibilidad y los datos. Permiten crear reglas de unión y división. Los dominios son obligatorios para los subtipos. Topología: Mayor expresividad en cuanto a su clasificación temática. Análisis del comportamiento de elementos cuando se separan o reúnen. Clasificación de objetos por atributos. Facilidad de Administración[26] Relaciones: Todos los elementos geográficos mantienen relación con algún otro objeto, ya sea espacial (ó geográfica) ó no; se conocen como Relation Ship Class. En Geodatabase está prohibido cierto tipo de relaciones: Es un tipo muy específico de relación entre elementos geográficos, la topología describe relaciones especiales de adyacencia, coincidencia, conectividad, contenencia, etc., en un mapa. En SIG permite análisis e integridad de los datos. Se presentan dos tipos de topología: La topología plana en 2D y Red Geométrica (Geometric Network), utilizada para modelar redes geométricas. Aspectos Generales de la Topología en Geodatabase: • • Ayuda a mantener la integridad de los datos. La topología no es almacenada en la Base de Datos, es procesada por ArcMap ó ArcCatalogo. Se almacena las propiedades errores y excepciones. • • • La topología sólo se evalúa. Las propiedades de la topología son: Los Feature Class que participan, distancia de tolerancia, rango y reglas topológicas. La topología es considerada como un elemento dentro de la Geodatabase enfocada a aspectos geométricos en 2D. IV. CONCLUSIONES Los requerimientos definidos en la conceptualización del modelo entidad relación determinan el tipo de SGBD a desarrollar , es decir el tipo de información y los procesos dentro del modelo determinan si se implanta una base de datos tipo nativa, middleware o geodatabase. Middleware “El Middleware es un software de conectividad que ofrece un conjunto de servicios que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas heterogéneas. Funciona como una capa de abstracción de software distribuida, que se sitúa entre las capas de aplicaciones y las capas inferiores (sistema operativo y red). El Middleware nos abstrae de la complejidad y heterogeneidad de las redes de comunicaciones subyacentes, así como de los sistemas operativos y lenguajes de programación, proporcionando una API para la fácil programación y manejo de aplicaciones distribuidas. Dependiendo del problema a resolver. Tipos de Middleware Las middleware se pueden clasificar de acuerdo a su estabilidad y su tolerancia a fallos, una de estas clasificaciones es SQL-oriented Data Access, el cual tiene las siguientes características: • • • • “Es un middleware que conecta aplicaciones con motores de bases de datos. Traduce SQL generico al SQL nativo de la BD a otros lenguajes. Segmento dominado por los fabricantes de bases de datos. La conexión suele se sincrónica” [32]. Por lo general el middleware del lado cliente está implementado por el Sistema Operativo subyacente, el cual posee las librerías que implementan todas las funcionalidades para la comunicación a través de la red.” [29]. “Middleware es una incorporación relativamente reciente en la computación. Obtuvo popularidad en los 80 como una solución al problema de cómo conectar nuevas aplicaciones con viejos sistemas. De todas maneras el término ha sido usado desde 1968. La elección del RDBMS depende de las necesidades y características de la información que se quiere montar sobre la base de datos espacial, es importante tener en cuenta que cada una de estas tendencias en cuanto a RDBMS presentan ventajas y desventajas que se deben de evaluar con el usuario en el momento de empezar aha implementar la base de datos espacial. La mayoría de Las bases de datos espaciales soportan los tipos de datos básicos de punto, línea y polígono. Algunos añaden otros tipos de datos del estándar de transferencia de datos espaciales (SDTS), como las cadenas de área y de red, que funcionan bien en un estándar de transferencia pero son cuestionables en un sistema operacional. Cada producto introduce su propio conjunto de operadores espaciales, difiriendo uno del otro tanto en sintaxis como en semántica. Y cada uno de ellos ofrecía lo que consideraba ser restricciones de integridad espacial esenciales, como impedir que se cruzaran los límites de un polígono. REFERENCIAS [1] Cisneros, Ines. Garcia Ductor, Carolina y Lozano Jurado, Isabel M. ¿Sociedad de la información û sociedad del conocmiento?. Disponible en http://tecnologiaedu.us.es/edutec/paginas/43.html. [2] Longley, Paul. Goodchild, Michael F. Maguire, David J. Rhind, David W. Editores. Geographical Information Systems and Science. Segunda Edicion. John Wiley and Sons, West Sussex, England 2005. 517 páginas. [3] Yeung, Albert K.W. Hall, Brent G. Spatial Database Systems, Design, Implementation and Project Management. The GeoJournal Library, volume 87. Springer. Dordrecht, The Netherlands. 2007. 545 páginas. [4] Yeung, Albert K. Data Organization and Structure, NCGIA Core Curriculum in GIScience, http://www.ncgia.ucsb.edu/giscc/units/u051/u051.html, publicado el 15 de Octubre de 1998. Consultado el 1 de Noviembre de 2008. [5] Meyer, Thomas H. Non-Spatial Databases Models, NGCIA Core Curriculum in GIScience, http://www.ncgia.ucsb.edu/giscc/units/u045/u045.html, [6] Wikimedia Foundation. Wikipedia, La Enciclopedia Libre. http://es.wikipedia.org/wiki/Wikipedia:Portada. [7] Adler. David W. IBM® DB2® Spatial Extender - Spatial data within the RDBMS. Very Large Data Bases Proceedings of the 27th International Conference on Very Large Data Bases. Paginas: 687 - 690. [8] Rigaux, Philippe. Scholl, Michel. Voisard, Agnès. Spatial Databases With Application To Gis. Morgan Kaufmann Publishers. San Francisco, EE.UU. 2002. 440 páginas. [9] Weinberger, Jason. The Spatial RDBMS in the Enterprise. Publicado el 13 de Octubre de 2001. Directions Magazine. Disponible en http://www.directionsmag.com/article.php?article_id=2 59. [10] Shekhar, Shashi. Xiong, Hui. Editores. Encyclopedia of GIS. Springer-Verlag New York, EE.UU. 2008. 1377 páginas. [11] Shekhar, Shashi. Chawla, Sanjay. Spatial Databases: A Tour. Prentice Hall, EE.UU. 2003. 262 páginas.