Download 1 introducción
Document related concepts
Transcript
CALVO, M. (1993) Capitulo 2 (paginas 41-63): Organización y estructura de las bases de datos empleadas en los sistemas de información geográfica. Sistemas de información geográfica digitales. Sistemas Geomáticos. Oñati, Instituto Vaso de Administración Pública. Rubén García García 1 INTRODUCCIÓN Los datos empleados en cartografía pueden agruparse en dos clases de Bases de Datos: Bases de Datos Gráficas (BDG) Bases de Datos Alfanuméricas ( BDA) Que vienen acompañados por sus respectivos sistemas de Gestión: Sistemas de Gestión de Bases de Datos Gráficas (SGBDG) Sistemas de Gestión de Bases de Datos Alfanuméricas (SGBDA) Si bien el usuario de un Sistema de Información Geográfica no tiene porque conocer en profundidad cual es la organización interna de una base de datos, si que resulta de interés que conozca cuales son los principales rasgos o estructuras de esta organización, para que pueda realizar una gestión optima sobre los Sistemas de Información Geográfica. 2 LA GESTION DE LOS DATOS En las utilidades o formas de gestión de las Bases de datos aparecen dos soluciones fundamentales: A. Que el programa de Base de Datos disponga de sus propias funciones de Gestión. B. Que el programa utilice un “interface” o interprete entre los datos y su sistema de Gestión externo a la Base. La gestión de los datos gráficos y alfanuméricos se realiza en un Sistema de Información Geográfica en conjunto. 2 3 CONSIDERACIONES ESPECIFICAS SOBRE LOS DATOS GESTIONADOS POR UN SISTEMA DE INFORMACIÓN GEOGRAFICA Estos datos son informaciones sobre la representación geográfica o cartográfica de los elementos integrantes del territorio (sujeto a gestión), así como otras informaciones complementarias o asociadas a estos que también deberían intervenir en el proceso de análisis. Podemos asegurar que todas las estructuras contienen información, pero no todas las informaciones pueden estar sostenidas por las mismas estructuras. La tipología de los datos geográficos o territoriales hace necesaria la consideración de los siguientes puntos: A. El territorio sufre frecuentes alteraciones, tanto en su estricto carácter físico ( temperaturas, limite de propiedades...) como en su carácter asociado (legislación, revalorización, decisiones políticas). B. El volumen y complejidad de datos relacionado con el territorio. C. El número de especialistas vinculados al territorio es considerable. Urbanistas, Tipógrafos, Arquitectos, Ingenieros, Abogados, Geógrafos..., esto hace que la temática a tratar también sea numerosa. D. Las relaciones entre los objetos que componen el territorio son complejas. E. La naturaleza de los datos es muy variada y diversa. Existirán datos bi-dimensionales, tri-dimensionales, temporales... F. El tipo de gestión que se desee realizar alcanzara a numerosas disciplinas. 4. NIVELES DE UN SISTEMA DE GESTION DE BASES DE DATOS 3 En realidad podemos considerar al sistema de gestión como un “intermediario” o interface entre los datos y el usuario del sistema. Este interface puede actuar en tres niveles de gestión o interactividad que son: A. Nivel mínimo.- En este es posible realizar cambios de datos con ficheros de importación- exportación pero sin interactividad. La gestión no puede realizarse de forma directa sobre los datos en conjunto. Un cambio en un dato grafico no alterara a los correspondientes datos alfanuméricos vinculados al mismo, hasta que no se realice una actualización. B. Nivel intermedio.- Es aquel en el que se pueden escribir datos no gráficos desde la base de datos grafica, la interactividad se produce exclusivamente desde la sesión grafica. C. Nivel máximo.- Es aquel en el que las posibilidades son las mismas que para el nivel medio, pero en el que existe un “control” de “integridad” de los respectivos datos. Esto hace que si se desea borrar un dato no-grafico, si se destruye el grafico o vice-versa, debe producirse una modificación en ambas Bases de datos. 5. TIPOS DE SISTEMAS DE GESTION DE BASES DE DATOS. 5.1 Sistema de Gestión de la Base de datos Jerárquico o ramificado Los datos se organizan en conjuntos de registros asociados por relaciones denominadas “enlaces” estructurados de forma arborescente. Esta organización no es aleatoria, si no que por el contrario se debe a unas condiciones de dependencia lógica, existentes entre los datos. Este tipo de sistema “ramificado” o arborescente presenta dos problemas fundamentales: a. Existe un importante riesgo de que aparezca una inconsistencia en caso de que se realice alguna modificación. 4 b. El almacenamiento de la información presupone un importante “consumo de memoria” por lo que en caso de existir muchos datos, el espacio ocupado puede resultar problemático. 5.2 Sistema de gestión de la Base de datos en red Son estructuras de datos organizados en registros, con relaciones entre ellos denominados “vínculos” pero sin que existe una estructura arborescente como en los SGBD jerárquicos. Los vínculos aparecen de forma expresa y son los que se utilizan para unir entre sí las distintas unidades o registros. Este sistema de gestión en red presenta los siguientes problemas: a. Los vínculos pueden resultar excesivamente complejos. La “red” de vínculos puede convertirse en una estructura muy complicada, lo que afecta de forma directa a la claridad y a la velocidad de la gestión. b. Son modelos de estructuras excesivamente “rígidas” (debido especialmente a la existencia física del vinculo) 5.3 Modelo de Sistema de Gestión de Bases de Datos Relacional Es un sistema de organización de los datos en “tablas” bi-dimensionales en las que las filas representan los registros, y las columnas los atributos. El enlace o relación entre las tablas se realiza mediante las columnas de atributos, sin necesidad de que exista un vinculo, como en las estructuras en red. Se considera que un sistema es medianamente relacional si satisface tres condiciones fundamentales: - Toda la información de la base de datos se representa mediante valores en las tablas. - No existen apuntadores visibles para el usuario entre las distintas tablas de la base de datos. - El sistema debe permitir, sin limitaciones ligadas a consideraciones internas, los siguientes operadores relacionales: Restricción 5 (“selección de registros”, solo se seleccionaran de una tabla los registros necesarios y sus asociados), Proyección (“selección de campos”, solo se seleccionarán de las tablas los atributos necesarios), Vinculación (“enlace automático”, entre tablas a partir de la existencia de un campo común de relación). Una Base de datos se considerará totalmente relacional sí: - Realiza todas las operaciones de “base” del álgebra relacional sin limitaciones ligadas a consideraciones internas. Estos operadores son: A- De conjunto: unión, substracción y producto cartesiano. B- Verdaderos: proyección y restricción. C- Adicionales: vinculación, intersección y división. - Si soporta los dos controles de integridad de base del modelo relacional: A- Control de unicidad de clave de una relación. B- Control de integridad relacional. Las principales ventajas de este sistema son: - Son estructuras de tratamiento rápido y de fácil manejo. - El tratamiento de datos puede hacerse de forma diferenciada. - Son estructuras muy adecuadas cuando el número de datos alfanuméricos elevado. - Son apropiadas para información asociada a la existente en los mapas. - Posee un lenguaje de gestión (SQL) de gran claridad y facilidad de uso. Los inconvenientes son: - Los problemas de coherencia e integridad pueden aparecer con relativa facilidad y son difíciles de resolver, al poder existir un excesivo numero de tablas y direcciones. - Requiere ordenadores potentes. - No son muy adecuados para los datos gráficos. 6 5.4 Modelo de Sistema de gestión de la Base de datos orientado a objeto Consiste en agrupar en entidades u objetos todas las propiedades y los procedimientos o programas que permiten manipularlos y tratarlos. Los procedimientos que permiten su manipulación son grupos o listas de instrucciones que permiten: crearlos, estructurarlos, representarlos, asignarles propiedades o informaciones gráficas o alfanuméricas, evaluar dichas informaciones, borrarlos, etc....Esta agrupación puede resumirse de la siguiente manera: - La gestión se realiza mediante procedimientos (lenguajes orientados a objeto) fáciles de leer y mantener. - El control de la coherencia es aquel que se refiere a los propios objetos, por lo que es fácilmente asegurable. Los objetos pueden contener datos gráficos y alfanuméricos indistintamente. - Los objetos pueden estructurarse en “familias” que tienen además atributos de “herencia”. Esta posibilidad de “heredar” atributos hace posible la transmisión de características entre objetos, o la propia adquisición de las mismas por el simple hecho de pertenecer a una determinada familia.. - Un grupo de objetos pueden estar relacionados entre sí por las siguientes causas: por codificación, designación, naturaleza geométrica, lógica derivada de los elementos a los que representan, o por cualquier atributo común. Conceptos ligados a un sistema de gestión de base de bases de datos orientados a objeto: - Objeto: Colección de elementos y de datos estructurados e identificados por una referencia única. - Propiedad: Características de un objeto, asociadas íntimamente a su nombre y clase. - Clase (familia): Grupos de objetos con idénticas propiedades “genéricas”. Por ejemplo: parcelas. - Método (control): Operación asociada a una clase o familia que manipula o informa sobre el estado de un objeto o parte del mismo. 7 - Procedimientos: Bloques de parámetros que permiten la “conexión” o el lanzamiento de métodos entre objetos. Por ejemplo el número de edificios dentro de las parcelas. - Desencadenadores (daemonds): procedimientos que se ejecutan de forma continua y automática mientras se desarrolla el trabajo. - Herencia: Transmisión de propiedades de una clase (antecedente) hacia una subclase (descendiente). - Macrobjeto: Grupo de objetos que forman un nuevo objeto unión de todos ellos. Con todo lo explicado anteriormente podríamos definir un Sistema de Gestión de base de Datos orientada a objeto para su aplicación a un SIG como: Aquellos que organizan bases de datos cartográficas en clases de objetos jerárquicos, gestionando determinados procesos mediante “mensajes” o procedimientos objeto y desencadenando otros de forma automática (daemonds). Las principales ventajas de este sistema son: - Tienen una estructura muy parecida a la del mundo real representada en un mapa. - Presentan un elevado grado de claridad, manteniéndose incluso con un gran número de objetos. - El mantenimiento de la estructura no se ve afectado por la creación o el borrado de objetos. - Las “herencias” entre clases de objetos hacen que se ahorre mucho espacio en la memoria del ordenador, al no tener que repetir atributos. - Los lenguajes orientados a objeto son de gran potencia y los programas tienen estructuras sencillas, claras y muy fáciles de mantener. Por el contrario, los inconvenientes son: - La velocidad de gestión es proporcional al número de objetos, por lo que si existen muchos esta puede resultar excesivamente lenta. - No son demasiado adecuados para el almacenamiento de datos alfanuméricos. 8 5.5 Sistemas mixtos. Los Sistemas de gestión Relacionales son muy apropiados para la gestión de datos alfanuméricos, y pueden ser geo-referenciales. Su gestión se realiza mediante dialogo con el usuario mediante un lenguaje como el SQL, por el contrario admiten mal la información grafica. Los orientados a objeto son apropiados para el tratamiento de datos georeferenciados que aparecen en los mapas. Su estructura los hace muy apropiados para la gestión grafica y poseen unos lenguajes de programación muy potentes. Por el contrario son poco adecuados para la información alfanumérica. Los SIG gestionan datos con gran abundancia tanto de datos gráficos como alfanuméricos por lo que el enlace entre las dos estructuras mencionadas resulta muy interesante. En base a estas premisas se han desarrollado sistemas de gestión capaces de permitir la coexistencia de ambos tipos de datos, el relacional y el orientado a objeto. Este enlace puede hacerse mediante la existencia de un campo común en los objetos que coincida con alguno de los atributos de una tabla del sistema relacional de forma que los direccione entre sí. De esta forma, el dibujo o los datos georeferenciados estarán contenidos en un sistema orientado a objeto y los datos geo-referenciables en uno relacional. Las principales ventajas de este sistema son: - El mapa se mantiene y actualiza con un sistema orientado a objeto. - Los datos alfanuméricos se almacenan en sistemas relacionales. - La gestión la realizara el usuario mediante el lenguaje SQL - Los datos podrán ser sometidos a procedimientos orientados a objeto. - El mantenimiento de la estructura hace necesario una jerarquización de los usuarios. Esto implica que no todos los usuarios podrán acceder a la totalidad de los datos, y que no todos podrán realizar las mismas acciones, de manera que se protege la información. Los inconvenientes son: - La conexión entre sistemas puede ralentizar el proceso. - En ocasiones es necesario programar ambos sistemas para facilitar la comunicación y la gestión. 9 - La coexistencia de dos Sistemas de Gestión de Bases de Datos puede multiplicar el número de instrucciones del SIG complicando su aprendizaje y la ejecución de gestiones. - La comunicación y transferencia de datos entre Bases puede hacer aparecer algunos problemas de estructura y coherencia. 10