CLAVE:
SE OBTIENE UNA TABLA.
FN= FASE
REDUNDANCIA DE DATOS = (MUCHAS VUELTAS) NINGUNA EXPLICACIÓN DE DATOS NO HAY RELACION
CON LAS TABLAS.
QUE NO HAYA AMBIGÜEDAD NI REDUNDANCIA SE PUEDE PERDER DATOS
DEFINICIÓN:
El
proceso de normalización es un proceso de descomposición de los esquemas de
relación hasta que
todas
las relaciones alcancen la forma normal deseada. En general, interesa:
© Determinar
las llaves candidato (míniales) de cada relación.
© Determinar
la forma normal de la relación.
© ¿Está en
FNBC? Si no, normalizar.
© ¿La
normalización no asegura la preservación de información y dependencias? Conformarse
con 3FN
Objetivo
Las
bases de datos relacionales se normalizan para:
© Minimizar la
redundancia de los datos.
© Disminuir
problemas de actualización de los datos en las tablas.
© Proteger la
integridad de datos.
En
el modelo relacional es frecuente llamar tabla a una relación; para que una
tabla sea considerada como una relación tiene que cumplir con algunas
restricciones:
© Cada tabla
debe tener su nombre único.
© No puede
haber dos filas iguales. No se permiten los duplicados.
© Todos los
datos en una columna deben ser del mismo tipo
REGLAS
DE NORMALIZACIÓN:
El
punto de partida del proceso de normalización es un conjunto de tablas con sus
atributos, el denominado esquema relacional. Se pretende mejorar dicho esquema
de datos. Se dice que una tabla está en una determinada forma normal si
satisface un cierto número de restricciones impuestas por la correspondiente
regla de normalización. La aplicación de una de estas reglas a un esquema
relacional produce un nuevo esquema relacional en el que no se ha introducido
ningún nuevo atributo.
Un
esquema relacional se compone de una serie de ternas T(A,D) donde T es el
nombre de una tabla, A el conjunto de los atributos de esa tabla y D el conjunto
de dependencias funcionales que existen entre esos atributos.
Si
una tabla no satisface una determinada regla de normalización, se procede a
descomponerla en otras dos nuevas que sí las satisfagan. Esto usualmente
requiere decidir qué atributos de la tabla original van a residir en una u otra
de las nuevas tablas. La descomposición tiene que conservar dos propiedades
fundamentales:
1. No
pérdida de información.
Sea
T(A,D) que se divide en T1(A1,D1) y T2(A2,D2). A partir de los atributos
comunes en ambos esquemas es posible determinar los atributos de T1 no
presentes en T2 (es decir, el conjunto A1 - A2) o bien los atributos de T2 no
presentes en T1 (el conjunto diferencia A2 - A1). Desde cualquier esquema se
consigue recuperar los datos del otro mediante un mecanismo de clave ajena que
permite reconstituir el esquema original de partida. Expresado mediante
dependencias funcionales, la intersección de los conjuntos de atributos A1 y A2
debe determinar funcionalmente la diferencia de los conjuntos de atributos A1 -
A2 o bien A2 - A1.
2. No
pérdida de dependencias funcionales.
La
normalización consiste pues en descomponer los esquemas relacionales (tablas)
en otros equivalentes (puede obtenerse el original a partir de los otros) de
manera que se verifiquen unas determinadas reglas de normalización.
Evidentemente las reglas de normalización imponen una serie de restricciones en
lo relativo a la existencia de determinados esquemas relacionales. Según se
avance en el cumplimiento de reglas y restricciones se alcanzará una mayor
forma normal. Existen
cinco
formas normales hacia las cuales puede conducir el proceso de normalización de
forma incremental más una forma normal independiente de las otras.
El
proceso de normalización consiste en
aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo
entidad-relación al modelo relacional.
Las
bases de datos relacionales se normalizan para:
© Evitar la
redundancia de los datos.
© Disminuir
problemas de actualización de los datos en las tablas.
© Proteger la
integridad de los datos.
En
el modelo relacional es frecuente llamar tabla a una relación, aunque para que
una tabla sea considerada como una relación tiene que cumplir con algunas
restricciones:
© Cada tabla
debe tener su nombre único.
© No puede
haber dos filas iguales. No se permiten los duplicados.
© Todos los
datos en una columna deben ser del mismo tipo.
Primera Forma Normal (1FN)
Una
relación está en primera forma normal cuando todos sus atributos son
atómicos. Una tabla está en Primera
Forma Normal si:
© Todos los
atributos son atómicos. Un atributo es atómico si los elementos del dominio son
indivisibles, mínimos.
© La tabla
contiene una clave primaria única.
© La clave
primaria no contiene atributos nulos.
© No debe
existir variación en el número de columnas.
Los
Campos no clave deben identificarse por la clave (Dependencia Funcional)
© Debe Existir
una independencia del orden tanto de las filas como de las columnas, es decir,
si los datos cambian de orden no deben cambiar sus significados
© Una tabla no
puede tener múltiples valores en cada columna.
© Los datos
son atómicos (a cada valor de X le pertenece un valor de Y y viceversa).
© Esta forma
normal elimina los valores repetidos dentro de una BD
Segunda Forma Normal (2FN)
Una
relación está en 2FN si está en 1FN y si los atributos que no forman parte de
ninguna clave dependen de forma completa de la clave principal. Es decir que no
existen dependencias parciales. (Todos los atributos que no son clave principal
deben depender únicamente de la clave principal).
En
otras palabras podríamos decir que la segunda forma normal está basada en el
concepto de dependencia completamente funcional. Una dependencia funcional es completamente funcional si al eliminar los
atributos A de X significa que la dependencia no es mantenida, esto es que .
Una dependencia funcional es una
dependencia parcial si hay algunos atributos
que pueden ser eliminados de X y la dependencia todavía se mantiene,
esto es .
Tercera Forma Normal (3FN)
La
tabla se encuentra en 3FN si es 2FN y si no existe ninguna dependencia
funcional transitiva entre los atributos que no son clave.
Un
ejemplo de este concepto sería que, una dependencia funcional X->Y en un
esquema de relación R es una dependencia transitiva si hay un conjunto de
atributos Z que no es un subconjunto de alguna clave de R, donde se mantiene
X->Z y Z->Y.
Por
ejemplo, la dependencia SSN->DMGRSSN es una dependencia transitiva en
EMP_DEPT de la siguiente figura. Decimos que la dependencia de DMGRSSN el
atributo clave SSN es transitiva vía DNUMBER porque las dependencias
SSN→DNUMBER y DNUMBER→DMGRSSN son mantenidas, y DNUMBER no es un subconjunto de
la clave de EMP_DEPT. Intuitivamente, podemos ver que la dependencia de DMGRSSN
sobre DNUMBER es indeseable en EMP_DEPT dado que DNUMBER no es una clave de
EMP_DEPT.
Formalmente,
un esquema de relación está en 3 Forma
Normal Elmasri-Navathe, si para toda dependencia funcional , se cumple al menos
una de las siguientes condiciones:
© es super
llave o clave.
© es atributo
primo de ; esto es, si es miembro de alguna clave en .
© Además el
esquema debe cumplir necesariamente, con las condiciones de segunda forma
normal.
Por
ejemplo {DNI, ID_PROYECTO} HORAS_TRABAJO
(con el DNI de un empleado y el ID de un proyecto sabemos cuántas horas de
trabajo por semana trabaja un empleado en dicho proyecto) es completamente
funcional dado que ni DNI HORAS_TRABAJO
ni ID_PROYECTO HORAS_TRABAJO mantienen
la dependencia. Sin embargo {DNI, ID_PROYECTO}
NOMBRE_EMPLEADO es parcialmente dependiente dado que DNI NOMBRE_EMPLEADO mantiene la dependencia.
Forma normal de Boyce-Codd (FNBC)
La
tabla se encuentra en FNBC si cada determinante, atributo que determina
completamente a otro, es clave candidata. Deberá registrarse de forma anillada
ante la presencia de un intervalo seguido de una formalización perpetua, es
decir las variantes creadas, en una tabla no se llegaran a mostrar, si las ya planificadas,
dejan de existir.
© Formalmente,
un esquema de relación está en FNBC, si
y sólo si, para toda dependencia funcional
válida en , se cumple que es súper llave o clave.
© De esta
forma, todo esquema que cumple FNBC,
está además en 3FN; sin embargo, no todo esquema que cumple con 3FN, está en FNBC.
Formas Normales de Alto Nivel
Cuarta Forma Normal (4FN)
Una
tabla se encuentra en 4FN si, y sólo si, para cada una de sus dependencias
múltiples no funcionales X->->Y, siendo X una super-clave que, X es o una
clave candidata o un conjunto de claves primarias.
Quinta Forma Normal (5FN)
Una
tabla se encuentra en 5FN si:
La
tabla esta en 4FN
No
existen relaciones de dependencias no triviales que no siguen los criterios de
las claves. Una tabla que se encuentra en la 4FN se dice que esta en la 5FN si,
y sólo si, cada relación de dependencia se encuentra definida por las claves
candidatas.
Buena información me sirvió para mi tarea
ResponderBorrar