Estadística Computacional I Maestría en Estadística Aplicada.

36
Estadística Computacional I Maestría en Estadística Aplicada

Transcript of Estadística Computacional I Maestría en Estadística Aplicada.

Page 1: Estadística Computacional I Maestría en Estadística Aplicada.

Estadística Computacional I

Maestría en Estadística Aplicada

Page 2: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

2

Nociones Fundamentales

Atributo: Una interrelación funcional de un conjunto de objetos en otro conjunto de objetos.

Page 3: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

3

Nociones Fundamentales

Se pueden representar atributos de una manera más sencilla (Siempre que no se vaya a utilizar el atributo como objeto en otra relación). Un atributo está determinado de manera unívoca para cada instancia.

Page 4: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

4

Nociones Fundamentales

Valor nulo de un atributo: un valor de atributo que no existe para una instancia específica

ALUMNO

Nombre Dirección

Página web

Cédula

Page 5: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

5

Nociones Fundamentales

Clave: Valor que puede utilizarse para identificar de manera unívoca una instancia.

Clave externa o identificador: atributo léxico o conjunto de atributos léxicos cuyos valores siempre identifican un único objeto. Usualmente nos referiremos a las claves externas simplemente como claves

Page 6: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

6

Nociones Fundamentales

Herencia: Si un objeto es especialización de otro objeto, entonces este hereda todos los atributos e interrelaciones del objeto que especializa

Page 7: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

7

Ejemplos:

Page 8: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

8

cardinalidades

Cardinalidades en las relaciones

Page 9: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

9

cardinalidades

Cardinalidades más realistas

Page 10: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

10

Especialización de los clientes No todos los clientes tienen que ser personas

individuales

Page 11: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

11

Modelo de datos

Uniendo los razonamientos anteriores

Page 12: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

12

Modelo de datos a partir de informes existentes (Modelo de datos para compras) Suponga que dispone de la siguiente

información

Page 13: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

13

Modelo de datos para compras

Page 14: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

14

Ejercicio

Realice el modelo de datos para la facturación de un proyecto

Page 15: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

15

Otras nociones fundamentales Agregado: Una interrelación vista como un

conjunto de objetos

Page 16: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

16

Otras nociones fundamentales Agregados. Interrelación n-aria

Page 17: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

17

Otras nociones fundamentales Objeto Conceptual: un objeto que representa

un tipo de cosa Objeto físico: objeto que representa una cosa

física específica

Page 18: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

18

El Modelo Relacional

Tabla cuenta

Page 19: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

19

El modelo relacional

Dados los conjuntos D1, D2, …. Dn una relación r es un subconjunto de

D1 x D2 x … x Dn

Así, una relación es un conjunto de las n-tuplas (a1, a2, …, an) donde cada ai Di

Ejemplo: Si

nombre_cliente = {Juan, Sara, Carlos, Luis, …}

/* Conjunto de todos los nombres de los clientes*/

calle_cliente = {Primera, Naciones, Parque, …} /* conjunto de todos los nombres de

calles*/

ciudad_cliente = {Quito, Guayaquil, Cuenca, …} /* conjunto de todos los nombres de

ciudades */

Then r = { (Juan, Primera, Quito),

(Sara, Naciones, Quito),

(Carlos, Parque , Guayaquil),

(Luis, Parque, Guayaquil) }

es una relación sobre nombre_cliente x calle_cliente x ciudad_cliente

Page 20: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

20

Tipos de atributos

Cada atributo de una relación tiene un nombre Al conjunto de valores permitidos para un atributo

se lo llama el dominio del atributo. Los valores de los atributos se requiere que sean

atómicos; o sea indivisibles. Ejemplo: El valor de un atributo puede ser el número de

cuenta pero no un conjunto de números de cuentas Un dominio se dice atómico si todos los miembros

son atómicos. El valor nulo (null)es miembro de todo dominio.

Page 21: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

21

Esquema de la relación

Diferenciar entre esquema de la base de datos (diseño lógico) y ejemplar (instantánea) de la base de datos.

A1, A2, …, An son atributos

R = (A1, A2, …, An ) es un esquema de la relación

Ejemplo:

esquema_cliente = (nombre_cliente, calle_cliente,

ciudad_cliente)

r(R) denota la relación r bajo el esquema relacional REjemplo:cliente (esquema_cliente)

Page 22: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

22

Instancia de una relación

Los valores actuales (instancia de la relación) son especificados por una tabla.

JuanSaraCarlosLuis

nombre_cliente

PrimeraNacionesParqueParque

calle_cliente

QuitoQuitoGuayaquilGuayaquil

ciudad_cliente

cliente

Atributos(columnas)

tuplas(filas)

Page 23: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

23

En una relación no importa el orden El orden de las tuplas es irrelevante (pueden

ser almacenadas en un orden arbitrario)

nombre_cliente

PrimeraNacionesParqueParque

calle_cliente

QuitoQuitoGuayaquilGuayaquil

ciudad_cliente

JuanSaraLuisCarlos

Page 24: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

24

Base de datos

Una base de datos consiste de múltiples relaciones.

La infromación de una empresa está dividida en partes, cada relación almacena una parte de la información.

cuenta : guarda información acerca de las cuentas impositor : guarda información acerca de el tipo de cuenta que tiene cada cliente cliente : guarda información acerca de los clientes.

Guardar toda la información como una única relación tal como banco(número_cuenta, saldo, nombre_cliente, ..)puede ocasionar repetición de información.

Page 25: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

25

La relación cliente

Page 26: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

26

La relación impositor

Page 27: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

27

Claves

Sea K R K es una superclave de R si los valores de K

son suficientes para identificar una única tupla de cada relación posible r(R)

Ejemplo: {nombre_cliente, calle_cliente} y

{nombre_cliente}

ambas son superclaves, si se asume que dos

clientes no pueden tener el mismo nombre.

Page 28: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

28

Claves

K es una clave candidata si K es minimal

Ejemplo: {nombre_cliente} es una clave candidata

para Cliente, dado que es una superclave y ningún

subconjunto suyo es una superclave.

Clave primaria: una clave candidata elegida como

medio principal de identificar tuplas en una relación. Se debe escoger un atributo cuyo valor nunca o casi nunca

cambie.

Page 29: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

29

Claves externas

Un esquema de la relación puede tener un atributo que corresponda a la clave primaria de otra relación. A éste atributo se le denomina clave externa. Ejemplo: nombre_cliente y numero_cuenta atributos de impositor son

claves externas para cliente y cuenta respectivamente.

Page 30: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

30

Álgebra relacional

Lenguaje de consulta procedimental (el usuario instruye al sistema para que lleve a cabo una serie de operaciones en la base de datos para calcular el resultado deseado)

Seis operaciones básicas Selección: Proyección: Unión: Diferencia de conjuntos: – Producto cartesiano: x Renombramiento:

Los operadores toman una o dos relaciones como entradas y producen como resultado una nueva relación.

Page 31: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

31

Ejemplo operación selecciónA B C D

1

5

12

23

7

7

3

10

A B C D

1

23

7

10

Relation r

A=B ^ D > 5 (r)

Page 32: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

32

Operación Selección

Notación: p(r) p se denomina el predicado de selección Se define como:

p(r) = {t | t r y p(t)}

Donde p es una fórmula de calculo proposicional que consiste de proposiciones conectadas por: (y), (o), (no)Cada proposición es de la siguiente manera:

<atributo> op <atributo> o <constante> donde op es : =, , >, . <.

Example of selection:

Page 33: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

33

Ejemplo de operación Proyección A B C

10

20

30

40

1

1

1

2

A C

1

1

1

2

=

A C

1

1

2

Relation r:

A,C (r)

Page 34: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

34

Operación Proyección

Notation:

donde A1, A2 son nombres de atributos y r es el nombre

de la relación. El resultado se define como la relación de k columnas

obtenidas al borrar las columna que no se especifican. Las filas repetidas son removidas del resultado. Ejemplo: para eliminar el atributo nombre_sucursal de la

relación cuenta

)( ,,, 21r

kAAA

Page 35: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

35

Ejemplo de operación Unión

A B

1

2

1

A B

2

3

rs

A B

1

2

1

3

Relations r, s:

r s:

Page 36: Estadística Computacional I Maestría en Estadística Aplicada.

ESCUELA POLITÉCNICA NACIONAL Dra. Sandra E. Gutiérrez

36

Operación Unión

Notación: r s Definida como:

r s = {t | t r o t s} Para que r s sea válida.

1. r, s deben tener la misma ariedad (mismo número de atributos)2. Los dominios de los atributos deben ser compatibles

Ejemplo: para encontrar todos los lientes que tienen un

préstamo o una cuenta