Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo...

54
Catedra de Base de Datos Facultad de Ciencias Exactas y Tecnología Universidad Nacional de Tucumán Ciclo Lectivo 2019

Transcript of Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo...

Page 1: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Catedrade BasedeDatosFacultaddeCienciasExactasyTecnología

UniversidadNacionaldeTucumán

CicloLectivo2019

Page 2: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Unidad5–Normalizacion.

Conceptosdenormalizaciónenlavinculacióny/orelacióndetablasycontenedoresde

basesdedatos.Normalización.FormasNormales.Anomalías.TipificacióndeFormas

Normales.Estudiode1FN,2FN,3FNyFNdeBoyce-Codd.

ProgramaAnalíticodelaMateria

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 3: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

BASES DE DATOS

Introducción

BasesdeDatos Mg.Ing.GustavoE.Juárez

Page 4: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Normalización

LateoríadelmodelorelacionalyelprocesodenormalizacióndelasBasesdeDatos,fue

desarrolladoporEdgarFrankCoddensuspapers:

• “Arelationalmodelforlargeshareddatabanks”–ACM–1970.

• “Furthernormalizationofthedatabaserelationalmodel”–RUSTIN–1972.

En estos papers investiga, identifica las causas y define las primeras tres “formas

normales”.

Comentario:

Una relación es una forma normal específica si satisface el conjunto de requisitos o

restriccionesparadichaforma.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 5: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Normalización

Introducción:

Con el fin de corregir algunas redundancias y anomalías, EF Codd (1972) propuso tres

formas normales, 1FN, 2FN y 3FN, logrado tener pérdida menores a causa del proceso

de descomposición, (preservación de la dependencia) de la relación inicial universal

en relaciones más pequeñas, sobre la base de las dependencias funcionales (FDS).

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 6: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Normalización

Poco después, Heath y Boyce y Codd (1974) identificaron algunas insuficiencias de la

definición de 3FN, por lo que redefinieron la 3FN y se le cambió el nombre Forma

Normal de BoyceCodd - FNBC.

Ronald Fagin (1977) fue el primero en describir la cuarta forma normal, 4NF, basado

en las dependencias multivaluadas - MVDS (Zaniolo, Fagin, Delobel), así como la quinta

forma normal, 5NF (Fagin, 1979) o forma normal de proyección-enlace (PJ / NF), la

cual se basa en unir dependencias (JDS).

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 7: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Normalización–TiposyModeladodeDatos

Dependencias Funcionales Es un tipo de relación entre atributos

Dependencias Multivaluadas Dos tuplas (A,m) donde A es un conjunto

y m es una Función de A

Inclusión Es la existencia de atributos en una tabla R, cuyos valores deben ser un subconjunto de valores de los

atributos correspondientes en la otra tabla S

Enlace / Join Una tabla de T está sujeta a una condición de

enlace (JOIN) si T siempre se puede recrear al unirse varias Tablas, cada una con un

subconjunto de los atributos de T

Problemas

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 8: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Normalización-Objetivos

• Desarrollar una “buena” descripción de los datos, sus relaciones y sus restricciones.

• Identificarunconjunto“adecuado”derelaciones.

• MejorarelDiseñoLógico.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 9: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Normalización-Propósitos

• Producir un conjunto estable de relaciones que sea unmodelo fiel de las

operacionesdelaempresa.

• Lograrundiseñoflexiblequepermitaextenderelmodelocuandosenecesite

representarnuevosatributos,conjuntosdeentidadesyrelaciones.

• Diseñar la base de datos fortaleciendo ciertos tipos de restricciones de

integridad.

• Reducirlaredundanciaenlasbasesdedatos,paraahorrarespacioyenposde

evitarinconsistenciasenlosdatos.

ABSTRACCION

ESCALABILIDAD

ANOMALIA

COMPLETITUD

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 10: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

BASES DE DATOS

Anomalias

BasesdeDatos Mg.Ing.GustavoE.Juárez

Page 11: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Anomalías

Definición:

“Una anomalía es un estado inconsistente, incompleto o contradictorio

de la base de datos“(Ricardo).

Una tabla que cumple con unamínima definición de relación puede no tener una

estructuraeficazuapropiada.

Si hubiera anomalías presentes en la relación, esta sería incapaz de representar cierta

información, pudiendo perder información a partir de procesar actualizaciones,

corriendo el riesgo de que los datos se vuelvan inconsistentes.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 12: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

TipificacióndelasAnomalías

1. Anomalías de Inserción: ocurre cuando no se puede ingresar una

ocurrenciahastaquesetengaunhechoadicionalacercadeotraentidad.

2. AnomalíasdeModificación:ocurrecuandosemodificaunvalor,ynose

verificanlosvaloresingresados,losquefinalmentesonconsolidadosenla

basededatos.UnaSoluciónaesteproblemaposibleesdividirlarelación

endosrelaciones.

3. Anomalías de Eliminación: ocurre cuando se elimina una tupla o un

valorespecifico,yestehechoafectaaotrasentidades.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 13: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Anomalíasdeinserción,actualizaciónyborrado

Considerelasiguienterelación:

NewClass (classNo, stuId, stuLastName, facId, schedule, room, grade)

Aclaraciones:

• Enesteejemplosesuponequesolamenteexisteunmiembrodelpersonaldocente

paracadaclase(estoes:nohayenseñanzaenequipo).

• Se supone que cada clase siempre tiene asignado el mismo salón.

Cátedra:SistemasdeBasesdeDatosAvanzados

DepartamentoSistemas FacultadRegionalTucumán

UniversidadTecnológicaNacional

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 14: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Anomalíasdeinserción,actualizaciónyborrado

La tabla NewClass

Anomalía de actualización. Suponga que quiere cambiar el horario de ART103A a MWF12. Es

posible que pueda actualizar los dos primeros registros de la tabla NewClass, pero no el

tercero, lo que resulta en un estado inconsistente en la base de datos. Entonces sería imposible

decir el verdadero horario para dicha clase. Ésta es una anomalía de actualización.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 15: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Anomalíasdeinserción,actualizaciónyborrado

La tabla NewClass

Anomalía de inserción. Ocurre cuando intenta agregar información acerca de un curso para el cual

todavía no hay estudiantes registrados. Por ejemplo, suponga que crea una nueva clase, con valores

MTH110A, F110, MTuTh10, H225 para classNumber, facId, schedule y room. No es posible registrar la

información del curso, aun cuando tenga los valores para estos atributos. Dado que la clave es

{courseNo,stuId}, no tiene permiso para insertar un registro con un valor nulo para stuId. Puesto que no

tiene posibilidad de representar esta información de clase, tiene una anomalía de inserción.

MTH110A F110 MTUTH10 H225

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 16: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Anomalíasdeinserción,actualizaciónyborrado

La tabla NewClass

Anomalía de borrado. Cuando borra el registro del único estudiante que toma un curso

particular, ocurre una anomalía de borrado. Por ejemplo, si el estudiante S1001 se retira de

HST205A, perdería toda la información acerca de dicho curso. Sería deseable conservar la

información del curso, pero no puede hacerlo sin un stuId correspondiente. De igual modo, si un

estudiante abandona el único curso que toma, se pierde toda la información acerca de dicho

estudiante.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 17: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

BASES DE DATOS

Formas Normales

BasesdeDatos Mg.Ing.GustavoE.Juárez

Page 18: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

FormasNormalesCoddmediante la publicación de trabajos como “A relationalmodel for a large

shareddatabanks”,y“Furthernormalizationofthedatabaserelationalmodel”,

definiólas1FN,2FNy3FN(Primera,SegundayTerceraFormaNormal).

Mástarde,otrosautorescontinuaroninvestigandolospatronesdeanomalíasque

ocurríanenlasBasesdeDatosyespecificaronlassiguientesformasnormales:

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 19: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

FormasNormales

Lasrelacionessepuedenclasificarportipodeanomalíasdemodificaciónalas

cualessonvulnerables.

EnlaDécadade1970losteóricosrelacionalesinvestigaronacercadeestostipos.

Cuando alguno encontraba una anomalía, la clasificaba y pensaba en una

maneradeprevenirla, las cuales con el tiempo y luegode estudiarnumerosas

ocurrencias,recibieronelnombredeFormasNormales.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 20: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

FormasNormales

Tanto para el Análisis Conceptual como para el desarrollo del Modelo Lógico, es

necesarioconsiderarciertasespecificacionesquefaciliteneltrabajoconlasTablas.

Enestesentido,Sommerville(1988)dijo

"unbuendiseño,eslaclavedeunaeficienteingenieríadelsoftware.Unsoftware

biendiseñadoesfácildeaplicarymantener,ademásdesercomprensibley

fiable.Sistemasmaldiseñados,aunquepuedanfuncionar,seráncostososde

mantener”. .

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 21: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

FormasNormales-Definición

“Lanormalizacióneslatransformacióndelasvistasdeusuariocomplejasydel

almacéndedatosaunjuegodeestructurasdedatosmáspequeñasyestables.

Ademásdesermássimplesyestables,lasestructurasdedatossonmásfácilesde

mantenerqueotrasestructurasdedatos”.

(Kendall,2005)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 22: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

FormasNormalesParamejorareldesempeñodeunabasededatos,asícomoevitarredundanciaen

la información que contiene y, en consecuencia, generar condiciones para un

mejordiseño,elanalistadesistemasdebeconocerlasformasdenormalizacióny

condicionesenlasqueladesnormalizaciónesrecomendable.

El estudio de este tema te permitirá identificar las tres primeras reglas de

normalizacióndeestructurasdebasesdedatos(1FN,2FNy3FN),atravésdelos

pasosparanormalizar odesnormalizaruna, con el fin de implementarmejores

diseñosalasmismas.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 23: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

FormasNormales-DesnormalizacionLas reglas de normalización no consideran el rendimiento. En algunos casos es

necesarioconsiderarladesnormalizaciónparamejorarelrendimiento.

Definición

“Ladesnormalizaciónesladuplicaciónintencionadadecolumnasenvariastablas,lo

cualaumentalaredundanciadedatos”.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

VentajadeunamayorvelocidaddeprocesamientoVSDesventajadedatosanómalos.

Page 24: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

MARCOHISTORICODELASFORMASNORMALES

FormasNormales Definidapor

PrimeraFormaNormal(1NF)E.F.Codd(1970)C.J.Date(2003)

SegundaFormaNormal(2NF) E.F.Codd(1971)TerceraFormaNormal(3NF) E.F.Codd(1971)

FormaNormaldeBoyce-Codd(BCNF)

RaymondF.BoyceandE.F.Codd(1974)

CuartaFormaNormal(4NF) RonaldFagin(1977)QuintaFormaNormal(5NF) RonaldFagin(1979)

FormaNormaldeDominioClave(DKNF)

RonaldFagin(1981)

SextaFormaNormal(6NF) C.J.Date,HughDarwenyNikosLorentzos(2002)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 25: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

FormasNormalesEsposibleentendermejorelprocesodenormalizaciónmediante lautilizaciónde

conjuntos incluidos unos de otros, en donde las formas normales se encuentran

anidadasconunmismocentro.

El objetivo del diseño debe ser poner el

esquema en la forma normal más alta,

queesprácticayadecuadaparalosdatosen

labasededatos.

Lanormalizaciónrequieretenerenclarola

semánticadelmodelo.

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 26: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

FormasNormalesCoronel, Morris y Rob (2011) refieren que la normalización es utilizada en

diferentesmomentos:

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Nueva estructura1. Cuando diseñan una nueva estructura de bases

de datos fundamentada en

l a s n e c e s i d a d e s d e

negoc ios de usuar ios finales.

Análisis de relaciones entre atributos

2. Después de que el diseño inicial está completo, el diseñador puede usar normalización para analizar las relaciones que existen entre los atributos dentro de cada entidad, para determinar si la estructura se puede mejorar por medio de normalización.

Mejora en el Diseño3. Por medio de un análisis de relaciones entre los atributos o campos de la estructura de datos, el diseñador puede usar el proceso de normalización para mejorarla, a fin de crear un diseño apropiado de bases de datos.

Modificación de Estructura

4. Para diseñar una nueva estructura de datos o modificar una ya existente, el proceso de normalización es el mismo.

Page 27: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

PRIMERA FORMA NORMAL

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 28: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Restricciones

Paraqueunatablaseaunarelacióndebecumplirconciertasrestricciones:

1. Lasceldasdebenserdeunvalorúnico.Nosepuedetenernirepetirgrupos

nitenerseriesencalidaddevalores.

2. Todaslasentradasenunamismacolumnadebenserdelmismotipo.

3. Cadacolumnatieneunnombreúnicoyelordenenlascolumnasenlatabla

noesimportante.

4. Dosrenglonesenlatablanopuedenseridénticosyelordendelosrenglones

notieneimportancia.

PRIMERA FORMA NORMAL (PFN o 1FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 29: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Para describir la primera forma normal se usará un contraejemplo. Si supone que a un

estudiante se le permite tener más de una especialidad, y se intenta almacenar

especialidades múltiples en el mismo campo del registro del estudiante, la tabla

NewStu puede parecerse a la que muestra la Figura.

Este ejemplo viola la definición de la primera forma normal. La pregunta es como corregimos la anomalia?

PRIMERA FORMA NORMAL (PFN o 1FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 30: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Definición 1FN:

“Una relación está en la primera forma normal (1FN) si y sólo si cada

atributo tiene valor sencillo para cada tupla”.

Esto significa que cada atributo en cada fila, o cada “celda” de la tabla, contiene sólo

un valor. Una forma alternativa de describir la primera forma normal es decir que los

dominios de los atributos de la relación son atómicos.

Esto significa que en el dominio no se permiten conjuntos,

listas, campos repetidos o grupos.

PRIMERA FORMA NORMAL (PFN o 1FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 31: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Los valores en el dominio deben ser valores únicos que no se puedan descomponer más.

En la Figura se ve la violación de esta regla en los registros de los estudiantes S1006 y

S1010, quienes ahora tienen dos valores mencionados para major.

PRIMERA FORMA NORMAL (PFN o 1FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 32: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

PRIMERA FORMA NORMAL (PFN o 1FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 33: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

SEGUNDA FORMA NORMAL

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 34: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Definición:

“SiResunesquemaderelación,yAyBsonconjuntosdeatributosnovacíosenR,sedice

queBesfuncionalmentedependienteenAsiysólosicadavalordeAenRtieneasociado

exactamenteunvalordeBenR”

Estoseescribecomo:

queseleecomo“AdeterminafuncionalmenteaB”.

Unadependenciafuncionalesunaconexiónentreunoomásatributos.Porejemplosise

conoceelvalordeDNI,seinfiereunaconexiónconApellidooNombre.

A B

SEGUNDA FORMA NORMAL (SFN o 2FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 35: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

DependenciafuncionalcompletaySegundaFormaNormal(SFNo2FN)Para la relación que se muestra en la Figura, se tienen las siguientes dependencias

funcionales además de las triviales:

SEGUNDA FORMA NORMAL (SFN o 2FN)

{courseNo, stuId} → {stuLastName} {courseNo, stuId} → {facId}

{courseNo, stuId} → {room}{courseNo, stuId} → {grade}

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 36: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Dado que no hay otra clave candidata, se elige {courseNo, stuId} para la clave primaria.

De nuevo, al ignorar las dependencias funcionales triviales, también se tienen las

dependencias funcionales

courseNo → facId courseNo → schedule

courseNo → room stuId → lastName

De modo que se encuentran atributos que son funcionalmente dependientes en la

combinación {courseNo, stuId}, pero también funcionalmente dependientes en un

subconjunto de dicha combinación.

Se dice que tales atributos no son por completo dependientes funcionales de la

combinación.

SEGUNDA FORMA NORMAL (SFN o 2FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 37: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Definición 2FN:

“Una relación está en segunda forma normal (2FN) si y sólo si

está en primera forma normal y todos los atributos

no clave son completamente dependen completamente de la clave”.

Claro está, si una relación es 1FN y la clave consiste en un solo atributo, la relación es

automáticamente 2FN. Tiene que preocuparse por 2FN sólo cuando la clave sea

compuesta.

SEGUNDA FORMA NORMAL (SFN o 2FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 38: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

DependenciafuncionalcompletaySegundaFormaNormal(SFNo2FN) Es importante notar que, cuando se usa esta notación menos formal, los atributos a la

derecha de la flecha se pueden “descomponer” y citar como DF separadas, pero los

atributos en el lado izquierdo deben permanecer unidos, pues es su combinación la que

es determinante. Las dependencias funcionales son

SEGUNDA FORMA NORMAL (SFN o 2FN)

courseNo → facId, schedule, room

stuId → lastName

courseNo,stuId → grade

facId, schedule, room, lastName

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 39: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Al usar proyección, se descompone la relación NewClass en el siguiente conjunto de

relaciones:

Register (courseNo, stuId, grade)

Stu (stuId, stuLastName)

Class2 (courseNo, facId, schedule, room)

.

SEGUNDA FORMA NORMAL (SFN o 2FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 40: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

TERCERA FORMA NORMAL

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 41: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Aunque las relaciones de la segunda forma normal son mejores que las de la primera forma normal,

todavía pueden tener anomalías de actualización, inserción y borrado. Considere la siguiente

relación:

TERCERA NORMAL (TFN o 3FN)

La Figura muestra una instancia de

esta relación. Aquí, la única clave

candidata es stuId y se usará como la

clave primaria. Todo otro atributo de la

relación es funcionalmente dependiente

de la clave, así que se tiene la siguiente

dependencia funcional, entre otras:

stuId → credits

NewStudent (stuId, lastName, major, credits, status)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 42: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Sin embargo, dado que el número de créditos determina el status, también se tiene

credits → status

Por tanto, stuId de manera funcional determina status en dos formas, directa y

transitivamente, a través del atributo no clave status. Al usar transitividad se tiene

(stuId → credits) ∧ (credits →status)⇒ (stuId → status)

TERCERA NORMAL (TFN o 3FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 43: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Definición Dependencia Funcional Transitiva:

“Si A, B y C son atributos de la relación R, tales que A → B

y B → C, entonces C es transitivamente dependiente de A”.

Para la Tercera Forma Normal se quiere eliminar ciertas dependencias transitivas. Las

dependencias transitivas causan anomalías de inserción, borrado y actualización.

TERCERA NORMAL (TFN o 3FN)

A B→ C→---------------------→

Dependencia Transitiva

Dependencia Funcional

Dependencia Funcional

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 44: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Debido a estos problemas, es deseable remover las dependencias transitivas y crear un

conjunto de relaciones que satisfagan la siguiente definición.

Definición 3FN:

“Una relación está en tercera forma normal (3FN) si, siempre que

exista una dependencia funcional no trivial X → A,

entonces o X es una superclave o A es un miembro

de alguna clave candidata”.

TERCERA NORMAL (TFN o 3FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 45: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Las características de la tercera forma normal implican que cada atributo no clave

debe depender de la clave, toda la clave y nada más que la clave.

Al comprobar la tercera forma normal, se busca si algún atributo no clave candidata

(o grupo de atributos) es funcionalmente dependiente de otro atributo no clave (o

grupo).

Si existe tal dependencia funcional, se remueve de la relación el atributo

funcionalmente dependiente, y se le coloca en una nueva relación con su determinante.

El determinante puede permanecer en la relación original.

TERCERA NORMAL (TFN o 3FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 46: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

DependenciaTransitivayTerceraFormaNormal(TFNo3FN)

Para el ejemplo NewStudent, dado que la dependencia indeseable es

credits → status, y status no es parte de alguna clave candidata, se forma el conjunto

de relaciones:

NewStu2 (stuId, lastName, major, credits) Stats (credits, status)

TERCERA NORMAL (TFN o 3FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 47: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

De hecho, se puede decidir no almacenar status en la base de datos, y calcular el

status para aquellas vistas que la necesiten. En este caso, simplemente se elimina la

relación Status.

Este ejemplo no involucra múltiples claves candidatas. Si en la relación original se

tiene una segunda clave candidata, socialSecurityNumber, se tendría

socialSecurityNumber → status

TERCERA NORMAL (TFN o 3FN)

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 48: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Compendio de Formas Normales

Integración de conocimientos adquiridos

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 49: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Definición 1FN:

“Una relación está en la primera forma

normal (1FN) si y sólo si cada

atributo tiene valor sencillo para cada

tupla”.

Definición Dependencia Funcional:

“SiResunesquemaderelación,yAyB

sonconjuntosdeatributosnovacíosenR,sediceque

BesfuncionalmentedependienteenAsiysólosicada

valordeAenRtieneasociadoexactamenteunvalor

deBenR”.

Definición 2FN:

“Una relación está en segunda forma normal (2FN) si y sólo si

está en primera forma normal y todos los atributos

no clave son completamente dependientes funcionales sobre la clave”.

Compendio de Formas Normales

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 50: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

• La normalización es una técnica utilizada para diseñar tablas en las que las

redundancias de datos se reducen al mínimo.

• Las primeras tres formas normales (1FN, 2FN y 3FN) son las más utilizadas. Desde un

punto de vista estructural, las formas de mayor nivel son mejores que las de menor

nivel, porque aquellas producen relativamente pocas redundancias de datos en la base

de datos.

• En otras palabras, 3FN es mejor que 2FN y ésta, a su vez, es mejor que 1FN. Casi todos

los diseños de negocios utilizan la 3FN como forma ideal.“Una relación está en la

primera forma normal (1FN) si y sólo si cada

Conclusiones

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 51: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Definición Dependencia Transitiva:

“Si A, B y C son atributos de la relación R, tales que A → B

y B → C, entonces C es transitivamente dependiente de A”.

Definición 3FN:

“Una relación está en tercera forma normal (3FN) si la relacion esta en

Segunda Forma Normal (2FN), siempre que

exista una dependencia funcional no trivial X → A,

entonces o X es una superclave o A es un miembro

de alguna clave candidata”.

Compendio de Formas Normales

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 52: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Bibliografía

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 53: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Referencias

• Paper “A relational model for a large shared data banks”, E. F. Codd.

• Libro “Fundamentos de Bases de Datos”, Rovarini P., De La Vega H.

• Libro “Sistemas de Bases de Datos. Conceptos Fundamentales”, R. Elmasrhi – S. Navathe.

2ª Edic. Edit . Addison – Wesley.

• Faculta de Ingeniería. Universidad de Talca (CHI).

http://ing.utalca.cl/~jperez/bd/documentos/al.pdf

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS

Page 54: Catedra de Base de Datos - Universidad Nacional de Tucumán · Normalización La teoría del modelo relacional y el proceso de normalización de las Bases de Datos, fue desarrollado

Sitio Web de la Cátedra http://catedras.facet.unt.edu.ar/bd

BasesdeDatos Mg.Ing.GustavoE.Juárez

BASES DE DATOS