Download modelamiento de datos
Document related concepts
Transcript
TPS Nelcy Sierra 394152 Luego de las cintas magnéticas, el uso de los discos en 1960 fue un adelanto muy efectivo, ya que por medio de este soporte se podía consultar la información directamente, esto ayudó a ahorrar tiempo. A diferencia de las cintas magnéticas, ya no era necesaria la secuencialidad, y este tipo de soporte empieza a ser ambiguo. Los discos dieron inicio a las bases de datos, de red y jerárquicas, pues los programadores con su habilidad de construcción y manipulación de estructuras junto con las ventajas de los discos era posible guardar estructuras de datos como listas y árboles. En la década de 1970 el científico informático Edgar Frank Codd en un artículo llamado "Un modelo relacional de datos para grandes bancos de datos compartidos" ("A Relational Model of Data for Large Shared Data Banks") definió el modelo relacional, publicó una serie de reglas para la evaluación de administradores de sistemas de datos relacionales y formas no procedimentales de consultar los datos, así nacieron las bases de datos relacionales. La simplicidad del modelo relacional y la posibilidad de ocultar completamente los detalles de implementación al programador fueron realmente atractivas. En la década de 1980 las bases de datos relacionales pudieron competir con las bases de datos jerárquicas y de red, ya que su nivel de programación era bajo y su uso muy sencillo. En esta década el modelo relacional ha conseguido posicionarse del mercado de las bases de datos. El proyecto de investigación Ingres fue también comenzado por este tiempo y consistía en extender el modelo relacional para que trabajara con modelos mas complejos de datos, muchos modelos de Objetos y Objetos relacionales tienen sus principios en Ingres. La relación entre las entidades de este modelo siempre es del tipo padre - hijo. La forma visual de este modelo es de árbol invertido, en la parte superior están los padres y en la inferior los hijos. Los nodos inferiores se subordinan a los que se hallan a su nivel inmediato superior. Un nodo que no tiene padre es llamado raíz, y uno que no tiene hijos se llama hoja. Ventajas Estructura simple, la organización era fácil de entender. Organización padre/hijo. Este modelo es el indicado para ilustrar este tipo de relaciones. Rendimiento: los registros se almacenan como punteros físicos a otros registros, de modo que el movimiento a través de la base de datos era rápido. Desventajas: Diseño muy sólido y estable en el tiempo: se hacen muy complicadas las posteriores modificaciones, así como las labores de mantenimiento. Por ejemplo al borrar un nodo padre, desaparecen también sus subordinados y sólo podrá añadirse un nodo hijo, si existe el nodo padre. Ausencia de relaciones entre los nodos hijos: Los accesos se ven limitados teniendo que pasar por los niveles superiores para llegar a uno que permita acceder a la información solicitada. Además es complicado establecer comparaciones entre informaciones situadas a un mismo nivel de la estructura. Para acceder a los datos en la base de datos, un programa podría: • Hallar una pieza particular mediante su número (como por ejemplo la puerta izquierda). • Descender al primer hijo (el tirador de la puerta). • Ascender hasta su padre (el cuerpo). • Moverse de lado hasta el siguiente hijo (la puerta derecha). Se trata también de una organización jerárquica de nodos, pero un hijo puede tener más de un padre (relación muchos a muchos). Representa una mejora al modelo jerárquico. Cada Producto puede ser distribuido por más de un Vendedor, así mismo cada Vendedor puede encargarse de diferentes Ciudades. Ventajas: El acceso a la información es más flexible en comparación con el jerárquico, que es más restringido. Las múltiples relaciones padre/hijo permitían a una base de datos en red representar datos que no tuvieran una estructura jerárquica sencilla. Desventajas: La velocidad de acceso a la información es más lenta. Aumento de la complejidad del diseño de la estructura. Al igual que el modelo jerárquico, resultaba rígido: Las relaciones de conjunto y la estructura de los registros tenían que ser especificadas de antemano y modificar la estructura requería típicamente la reconstrucción completa. Es la organización más difundida en la actualidad debido a su sencillez para realizar operaciones de adición, eliminación y modificación en contraste con la mayor rigidez de las organizaciones Jerárquicas y de Red. Ofrece la mayor flexibilidad ya que los datos se almacenan en tablas diferentes, conformadas así mismo por filas y columnas. Las tablas relacionadas poseen un campo común, el campo clave, mediante el cual la información almacenada en una tabla puede enlazarse con la información almacenada en otra. Las tablas se pueden modificar fácilmente siguiendo un diseño prestablecido por los programadores buscando la mejor manera posible de obtener una integridad total de la información. Por ejemplo: En un pequeño negocio, se puede contar con una Tabla de Clientes y Tabla de Pedidos: Las órdenes que pertenecen a un determinado cliente son identificadas colocando el campo de identificación del cliente en la orden (campo clave de la tabla de clientes), lo cual permite enlazar las dos tablas. Ventajas Las ventajas frente a las anteriores son: La rapidez y facilidad con la que permite transformar el modelo de datos. La sencillez de la estructura. La posibilidad de adaptación a una serie de entornos de datos más amplia. Desventajas Presentan deficiencias con datos gráficos, multimedia y sistemas de información geográfica y experimentos científicos. Las bases de datos orientadas a objetos (BDOO) se propusieron con el objetivo de satisfacer las necesidades de las aplicaciones anteriores y así, complementar pero no sustituir a las bases de datos relacionales. No se puede manejar herencia. Forma de organizar un conjunto de datos elementales con el fin de facilitar su manipulación. En ella se define la organización, relación y el conjunto de operaciones (como insertar nuevos elementos o eliminar los existentes) que se pueden realizar sobre los datos. Es una representación gráfica que describe la estructura de los datos, para determinar la forma en que van a ser organizados, guardados y manipulados; constituyendo una herramienta que facilita su interpretación. Es un objeto en el mundo real que es distinguible de otros, a partir de sus atributos y del cual se desea almacenar información. Las entidades pueden ser de diversa naturaleza: Tangible: Persona, vehículo, casa, etc. Intangible: Proyecto, materia, etc. Eventual: Compra, venta, vuelo, etc. Rol: Empleado, cliente, vendedor, etc. Localización: Sucursal, bodega, etc. Es el conjunto de todas las entidades del mismo tipo. Tipos de entidades: Regulares: Son las entidades normales que tienen existencia por sí mismas sin depender de otras. Débiles: Su existencia depende de otras. Por ejemplo la entidad tarea laboral sólo podrá tener existencia si existe la entidad trabajo. Pequeña pieza de información Punto de unión de varios elementos. Es una etapa en donde se logra claridad sobre lo que desea el usuario y la forma en la cual se le va a presentar la solución que está buscando. Conjunto de datos relacionados entre sí y representados de forma horizontal en una tabla. Elemento que describe o identifica cada entidad dándole características propias. Es una correspondencia o asociación entre dos o más entidades. Cada relación tiene un nombre que describe su función. Las relaciones se representan gráficamente mediante rombos y su nombre aparece en el interior. Es una forma en la que cada uno de los elementos de la entidad participa de la relación. Tipos: Uno a Uno En una relación uno a uno, cada registro de la Tabla A sólo puede tener un registro coincidente en la Tabla B y viceversa. Uno a Muchos La relación uno a varios es el tipo de relación más común. En este tipo de relación, un registro de la Tabla A puede tener muchos registros coincidentes en la Tabla B, pero un registro de la Tabla B sólo tiene un registro coincidente en la Tabla A. Muchos a Muchos En una relación varios a varios, un registro de la Tabla A puede tener muchos registros coincidentes en la Tabla B y viceversa. Son un conjunto de atributos que identifican de forma única a una entidad. Tipos de llaves: Llave primaria, principal (PK) Es la que identifica en un campo de forma exclusiva, cada uno de los registros que existan en la tabla. Permite: -Acelerar las consultas -Orden -Impide duplicaciones de registros -Una adecuada relación entre tablas Llave alternativa o candidata Es aquella que no ha sido seleccionada como primaria, pero que también puede identificar de forma única a una fila dentro de una tabla. Llave foránea/externa/ajena/secundaria Es uno o más campos de una tabla que hacen referencia al campo o campos de clave principal de otra(s) tabla, una llave foránea indica cómo están relacionadas las tablas. Los datos en los campos de llave foránea y llave principal deben coincidir, aunque los nombres de los campos no sean los mismos. Se denomina así debido a que precisamente permite representar relaciones entre entidades (objetivo del modelado de datos). Componentes: Entidades (sustantivo) Atributos (adjetivo) Relaciones (verbos) Los pasos para construir el modelo son: Identificar las entidades Definir los atributos Encontrar la relación Generar la cardinalidad Símbolos principales: Rectángulos: Representan conjuntos de entidades. Elipses: Se emplean para los atributos. Rombos: Para las relaciones entre entidades. Contienen verbos. Líneas: Utilizadas para unir atributos con conjuntos de entidades y éstos con las relaciones. Las entidades del modelo E-R son transformados al modelo relacional siguiendo estas instrucciones: Las entidades pasan a ser tablas. Los atributos pasan a ser columnas. Los identificadores principales pasan a ser claves primarias