Bases de datos distribuidas

34
Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón

description

Bases de datos distribuidas. Carlos Rojas Kramer Universidad Cristóbal Colón. Orígenes. Evolución acelerada de los sistemas de información Crecimiento no planeado de la información al interior de las organizaciones Dispersión en sitios geográficamente distantes - PowerPoint PPT Presentation

Transcript of Bases de datos distribuidas

Page 1: Bases de datos distribuidas

Bases de datos distribuidas

Carlos Rojas Kramer

Universidad Cristóbal Colón

Page 2: Bases de datos distribuidas

Orígenes

• Evolución acelerada de los sistemas de información

• Crecimiento no planeado de la información al interior de las organizaciones

• Dispersión en sitios geográficamente distantes

• Sistemas tecnológicamente diferentes

Page 3: Bases de datos distribuidas

Orígenes

• Necesidad de compartir e integrar la información dispersa

• Se requiere un tipo de tecnología diferente al tradicional

• La Base de Datos Distribuida es una buena solución a lo anterior.

Page 4: Bases de datos distribuidas

Definición

• Una Base de Datos Distribuida (BDD) es una colección de datos relacionados lógicamente, pero dispersos entre diversos sitios de una red de computadoras. [Ceri y Pelagatti]

• Cada sitio en la red tiene capacidad de procesamiento autónomo y puede ejecutar aplicaciones locales.

Page 5: Bases de datos distribuidas

BDD (ilustración esquemática)

Page 6: Bases de datos distribuidas

Razones para la dispersión

• Naturaleza de la información

• Motivos económicos

• Consideraciones de desempeño

• Necesidades de fiabilidad

• Requerimientos de disponibilidad

• Etc.

Page 7: Bases de datos distribuidas

Consecuencias de la dispersión

• Incremento en la complejidad de diseño

• Mayores dificultades para la instrumentación de las soluciones

• Administración y resolución de problemas implican aplicación de mejores recursos

• Necesidad de apego a estándares

Page 8: Bases de datos distribuidas

Software para BDD

• DDBMS = Distributed DataBase Management System

• Debe permitir la creación, el uso y el mantenimiento de la BDD

• Debe realizar funciones típicas de un DBMS no distribuido

• También debe soportar otras funciones

Page 9: Bases de datos distribuidas

Funciones extra para un DDBMS

• Capacidad de accesar sitios remotos y transmitir consultas y datos entre diversos sitios a través de una red de computadoras

• Capacidad de rastrear la pista de distribución y de replicación de los datos en el catálogo del DDBMS

Page 10: Bases de datos distribuidas

• Capacidad de elaborar estrategias de ejecución para consultas y transacciones que accesan datos en más de un sitio

• Capacidad de mantener la consistencia en las copias de un elemento de información

Page 11: Bases de datos distribuidas

• Capacidad de recuperarse ante caídas de sitios individuales y fallos de un enlace de comunicación

• Capacidad de decidir cual de las copias de un elemento de información será accesada

Page 12: Bases de datos distribuidas

Componentes de un DDBMS

• Componente de manejo de Base de Datos (DB)

• El componente de Comunicación de Datos (DC)

• El Diccionario de Datos (DD), el cual es

extendido para representar información sobre la

distribución de los datos sobre la red

• El componente de base de datos distribuida (BDD)

Page 13: Bases de datos distribuidas

Tipos de DDBMs

• Clasificados según su grado de:

– homogeneidad / heterogeneidad

– autonomía

– transparencia de la distribución

Page 14: Bases de datos distribuidas

Grado de homogeneidad

• Un DDBMS homogéneo se caracteriza principalmente por la utilización del modelo descendente para la conceptualización del diseño de la BD, en donde la fragmentación vertical u horizontal de un esquema global de datos determina la naturaleza de cada uno de los componentes de la BDD

Page 15: Bases de datos distribuidas

• Un DDBMS heterogéneo se caracteriza por la diversidad de DBMSs, modelos de diseño, sistemas operativos, conceptualización del diseño y hardware utilizado en cada uno de sus componentes de BD

Page 16: Bases de datos distribuidas

• La heterogeneidad debida a diversos DBMSs es común en organizaciones que crecen sin una planeación en cuanto a sus sistemas de información.

• Dichos sistemas evolucionan paulatinamente en diferentes DBMSs o diferentes modelos de conceptualización, tales como: jerárquico, de red, relacional u orientado a objetos

Page 17: Bases de datos distribuidas

Tipos de heterogeneidad según Larson y Sheth

Page 18: Bases de datos distribuidas

Heterogeneidad semántica

• Ocurre cuando existe una diferencia en el significado, interpretación o uso del mismo modelo de datos

Page 19: Bases de datos distribuidas

Sistemas de Multibase de Datos

• MDBMS = multi database management system

• También llamado Sistema de Base de Datos Federado

• Es un tipo de DDBMS

• Se compone de una colección de DBMS con alto grado de autonomía

Page 20: Bases de datos distribuidas

MDBMS (cont.)

• Cada servidor es un DBMS centralizado independiente y autónomo que tiene sus propios usuarios locales, transacciones locales y administrador de base de datos (DBA)

• Por lo mismo, cada uno posee un alto grado de autonomía local

Page 21: Bases de datos distribuidas

• En un MDBMS cada servidor puede autorizar el acceso a porciones específicas de la BD definiendo un esquema de exportación, el cual especifica la parte de la BD a la cual puede tener acceso una cierta parte de usuarios no locales

• Los MDBMS son catalogados como un sistema híbrido entre los sistemas distribuidos y los centralizados

Page 22: Bases de datos distribuidas

Grado de autonomía

• Es el grado de independencia de operación de cada uno de los DBMS componentes del DDBMS

Page 23: Bases de datos distribuidas

Autonomía de diseño

• La capacidad de que cada Base de Datos Componente (BDC) decida los aspectos concernientes con su diseño. Es decir, las personas involucradas son libres de decidir cualquier particularidad e incluso decidir que DBMS usar.

Page 24: Bases de datos distribuidas

Aspectos a considerar en la autonomía de diseño

– El universo de datos relevante para el sistema

– La representación (modelo de datos, lenguaje de consultas) y el nombrado de los datos

– La conceptualización o interpretación semántica de los datos (heterogeneidad semántica)

– Restricciones usadas para administrar los datos

– La funcionalidad del sistema

– La asociación y compartición con otros sistemas y

– La implementación (p.e. registros y estructuras de archivos).

Page 25: Bases de datos distribuidas

Autonomía de comunicación

• La habilidad de que una BDC decida comunicarse o no con otro componente de una misma federación

Page 26: Bases de datos distribuidas

Autonomía de ejecución

• Es la habilidad de una BDC para ejecutar operaciones locales sin la interferencia de operaciones externas, en el orden que la BDC lo decida

Page 27: Bases de datos distribuidas

Autonomía de asociación

• Cada BDC decide cuánto y cuándo puede compartir su funcionalidad y recursos con otros componentes, inclusive la capacidad de asociarse o retirarse de una o más federaciones

Page 28: Bases de datos distribuidas

Grado de Transparencia de Distribución

• Si el usuario percibe un solo esquema integrado sin información alguna relativa a la fragmentación, replicación o distribución, se dice que el DDBMS tiene un alto grado de transparencia de distribución.

• Si el usuario puede ver toda la fragmentación, el reparto y la aplicación, el DDBMS no tiene transparencia de distribución

Page 29: Bases de datos distribuidas

Distribución de los datos

Page 30: Bases de datos distribuidas

Fragmentación

• La fragmentación de una base de datos consiste en descomponer en partes los datos, siguiendo algún patrón conveniente y relacionado con la forma como estos serán alimentados y explotados.

Page 31: Bases de datos distribuidas

Tipos de fragmentación

• Tipos primitivos de fragmentación:– Horizontal– Vertical

• Tipos derivados:– Horizontal derivada– Mixta

Page 32: Bases de datos distribuidas

Objetivos ideales

• Separar el concepto de fragmentación de los datos del concepto de localización (o ubicación) de los mismos.

• Control explícito de la redundancia

• Independencia de DBMSs locales

Page 33: Bases de datos distribuidas

Tipos de transparencia

• Transparencia de fragmentación

• Transparencia de localización

• Transparencia de replicación

• Transparencia de correspondencia

Page 34: Bases de datos distribuidas

Niveles de transparencia

1. Transparencia de fragmentación

2. Transparencia de localización

3. Transparencia de correspondencia local

4. Sin transparencia