Download que es base de datos.

Document related concepts

Modelo relacional wikipedia , lookup

Normalización de bases de datos wikipedia , lookup

Base de datos relacional wikipedia , lookup

Modelo de base de datos wikipedia , lookup

Base de datos jerárquica wikipedia , lookup

Transcript
QUE ES BASE DE DATOS.
Una base de datos es una colección de información organizada de forma que un programa de
ordenador pueda seleccionar rápidamente los fragmentos de datos que necesite. Una base de
datos es un sistema de archivos electrónico.
Las bases de datos tradicionales se organizan por campos, registros y archivos. Un campo es
una pieza única de información; un registro es un sistema completo de campos; y un archivo es
una colección de registros. Por ejemplo, una guía de teléfono es análoga a un archivo.
Contiene una lista de registros, cada uno de los cuales consiste en tres campos: nombre,
dirección, y número de teléfono.
Definir el término base de datos
Definición de Bases de Datos.- Un conjunto de información almacenada en memoria
auxiliar que permite acceso directo y un conjunto de programas que manipulan esos
datos
Base de Datos es un conjunto exhaustivo no redundante de datos estructurados organizados
independientemente de su utilización y su implementación en máquina accesibles en tiempo
real y compatibles con usuarios concurrentes con necesidad de información diferente y no
predicable en tiempo.
Explicar
Sus
Orígenes
Y
Antecedentes
Surgen desde mediados de los años sesenta la historia de las bases de datos, en 1970 Cód.
propuso el modelo relacional, este modelo es el que ha marcado la línea de investigación por
muchos años, ahora se encuentran los modelos orientados a objetos.
Describir las ventajas del
Ventajas de las bases de datos.-
uso
de
la
base
de
datos
en
la
organización
1. Independencia de datos y tratamiento.
Cambio en datos no implica cambio en programas y viceversa (Menor coste de
mantenimiento).
2. Coherencia de resultados.
Reduce redundancia :
Acciones lógicamente únicas.
Se evita inconsistencia.
3. Mejora en la disponibilidad de datos
No hay dueño de datos (No igual a ser públicos).
Ni aplicaciones ni usuarios.
Guardamos descripción (Idea de catálogos).
4. Cumplimiento de ciertas normas.
Restricciones de seguridad.
Accesos (Usuarios a datos).
Operaciones (Operaciones sobre datos).
5. Otras ventajas:
Más oriente gestión de almacenamiento.
Efecto sinérgico.
TIPOS DE MODELOS DE DATO
Existen fundamentalmente tres alternativas disponibles para diseñar las bases de
datos: el modelo jerárquico, el modelo de red y el modelo relacional. MODELO
JERARQUICO. Puede representar dos tipos de relaciones entre los datos: relaciones de
uno
a
uno
y
relaciones
de
uno
a
muchos.
MODELO DE RED. Este modelo permite la representación de muchos a muchos, de tal
forma que cualquier registro dentro de la base de datos puede tener varias ocurrencias
superiores a él. El modelo de red evita redundancia en la información, a través de la
incorporación
de
un
tipo
de
registro
denominado
el
conector.
MODELO RELACIONAL. Este modelo se está empleando con más frecuencia en la
práctica, debido a las ventajas que ofrece sobre los dos modelos anteriores, entre
ellas, el rápido entendimiento por parte de usuarios que no tienen conocimientos
profundos
sobre
Sistemas
de
Bases
de
Datos.
BASES DE DATOS DISTRIBUIDAS. Las bases de datos distribuidas se están utilizando
cada vez más en la misma medida en que se usan las arquitecturas de cliente-servidor
y groupware. Los principales problemas que se generan por el uso de la tecnología de
bases de datos distribuidas son en lo referente a duplicidad de datos y a su integridad
al momento de realizar actualizaciones a los mismos. Además, el control de la
información puede constituir una desventaja, debido a que se encuentra diseminada
en
diferentes
localidades
geográficas.
TENDENCIAS FUTURAS. En el futuro la mayoría de las organizaciones cambiarán la
forma convencional de manejo de la información a la arquitectura de base de datos a
las ventajas derivadas de su uso. El uso de las bases de datos distribuidas se
incrementará de manera considerable en la medida en que la tecnología de
comunicación de datos brinde más facilidades para ello. El uso de bases de datos
facilitará y soportará en gran medida a los Sistemas de Información para la Toma de
Decisiones.
NORMALIZACIÓN DE DATOS
Normalización es un proceso que clasifica relaciones, objetos, formas de relación y
demás elementos en grupos, en base a las características que cada uno posee. Si se
identifican ciertas reglas, se aplica una categoría; si se definen otras reglas, se aplicará
otra categoría.
Estamos interesados en particular en la clasificación de las relaciones BDR. La forma de
efectuar esto es a través de los tipos de dependencias que podemos determinar dentro de
la relación. Cuando las reglas de clasificación sean más y más restrictivas, diremos que
la relación está en una forma normal más elevada. La relación que está en la forma
normal más elevada posible es que mejor se adapta a nuestras necesidades debido a que
optimiza las condiciones que son de importancia para nosotros:
La cantidad de espacio requerido para almacenar los datos es la menor posible;
La facilidad para actualizar la relación es la mayor posible;
La explicación de la base de datos es la más sencilla posible.
El proceso de normalización de bases de datos consiste en aplicar una serie de reglas a las
relaciones obtenidas tras el paso del modelo entidad-relación al modelo relacional.
Las bases de datos relacionales se normalizan para:

Evitar la redundancia de los datos.

Evitar problemas de actualización de los datos en las tablas.

Proteger la integridad de los datos.
En el modelo relacional es frecuente llamar tabla a una relación, aunque para que una tabla
sea considerada como una relación tiene que cumplir con algunas restricciones:

Cada tabla debe tener su nombre único.

No puede haber dos filas iguales. No se permiten los duplicados.

Todos los datos en una columna deben ser del mismo tipo
LA “N” EN FORMA NORMAL
En la teoría de bases de datos relacionales, las formas normales (NF) proporcionan los criterios
para determinar el grado de vulnerabilidad de una tabla a inconsistencias y anomalías lógicas.
Mientras sea más alta la forma normal aplicable a una tabla, es menos vulnerable a
inconsistencias y anomalías. Cada tabla tiene una "forma normal más alta" (HNF): por
definición, una tabla siempre satisface los requisitos de su HNF y de todas las formas normales
más bajas que su HNF; también por definición, una tabla no puede satisfacer los requisitos de
ninguna forma normal más arriba que su HNF.
Las formas normales son aplicables a tablas individuales; decir que una base de datos entera
está en la forma normal n es decir que todas sus tablas están en la forma normal n.
Los recién llegados al diseño de bases de datos a veces suponen que la normalización procede
de una manera iterativa, es decir un diseño 1NF primero se normaliza a 2NF, entonces a 3NF,
etcétera. Ésta no es una descripción exacta de cómo la normalización
Trabaja típicamente. Una tabla sensiblemente diseñada es probable que esté en 3NF en la
primera tentativa; además, si está en 3NF, también es extremadamente probable que tenga
una forma HNF de 5NF. Conseguir formas normales "más altas" (sobre 3NF) usualmente no
requiere un gasto adicional de esfuerzo por parte del diseñador, porque las tablas 3NF
usualmente no necesitan ninguna modificación para satisfacer los requisitos de estas formas
normales más altas.
PRIMERA FORMA NORMAL
Para que una relación esté en primera forma normal (1 FN), debe ser solamente una relación
propia, una matriz m por n, donde:
Ninguna celda de la matriz está vacía;
El valor n cualquier columna está definido por el dominio para dicho
atributo.
Cada tulpa tiene una clave que la identifica en forma unívoca, pero dicha
clave no significa orden.
La aplicación determina la relación
Para que una relación sea normalizada en pasos adicionales, debe encontrarse en la primera
forma normal. Colocar los datos en la primera forma normal está a cargo del diseñador de la
aplicación. Estos datos se encuentran disponibles de alguna manera inicialmente. Si la
aplicación existe en forma manual, o ha sido anteriormente computarizada pero no todavía
como relación, el diseñador reorganiza los datos de modo de conformar una matriz 1FN.
La segunda inicial más importante es la dimensión de la relación ¿cuántos componentes
existen en la tulpa o cuántas columnas en la tabla? ¿De qué manera se compara esto con el
número de campos en el documento fuente?
En la figura se puede observar un documento como muestra, una factura típica. Parte de la
información es fija y otra variable. La figura nos muestra un formulario impreso dentro del cual
se ha agregado información. La impresión puede dividirse en dos categorías.
Información descriptiva para el usuario
•Nombres de atributos.
La información impresa es necesariamente fija. Podemos observar el nombre de la compañía
en la figura, así como otras particularidades (tales como el número de teléfono que no figura
aquí). Otros nombres impresos corresponden a los atributos cuyos valores se escriben en el
momento en que el formulario es llenado. Estos nombres de atributos son también los
nombres de campos para almacenar los datos en el sistema. Los que se escribe son los valores
de atributos.
La información convertida queda formada en tupas. La próxima pregunta es cuantas tupas
representarán a la formación en esta forma. Debe notarse que el número de partes ordenadas
varía de una factura o pedido a otro.