Bases de Datos Distribuidas

27
BASES DE DATOS DISTRIBUIDAS

Transcript of Bases de Datos Distribuidas

Page 1: Bases de Datos Distribuidas

BASES DE DATOS DISTRIBUIDAS

Page 2: Bases de Datos Distribuidas

MOTIVACIÓN DE LAS BDD Necesidad de:

Integración + Distribución

Bases de datos

distribuidas

Bases de datos

Redes de ordenadores

Page 3: Bases de Datos Distribuidas

INTEGRACIÓNProblemas derivados del desarrollo de BD

independientes: Datos redundantes SGBD distintos Plataformas variadas (pc’s, workstations, etc.)

Consecuencias: Inconsistencias en los otros datos Dificultad de interoperatividad Aislamiento de los distintos grupos de usuarios

Necesidad de los Sistemas de Información integrados que respondan a los objetivos globales de la empresa.

Page 4: Bases de Datos Distribuidas

DISTRIBUCIÓN Finalidad: Acercar la informática a los usuarios.

Compartiendo Optimizando

Necesidad de Sistemas de Información Distribuidos que doten de autonomía a los usuarios y que consigan mayor eficiencia.

Page 5: Bases de Datos Distribuidas

NO OBSTANTE….

Page 6: Bases de Datos Distribuidas

DEFINICIONES Bases de Datos Distribuidas (BDD)

Colección de múltiples bases de datos, lógicamente interrelacionadas, distribuidas sobre una red de ordenadores.

Sistema de Gestión de BDD (SGBDD) Producto software capaz de gestionar una BDD,

suministrando mecanismos de acceso que hacen transparente la distribución.

El SGBDD es el software que gestiona de manera transparente la base de datos distribuida.

SISTEMA DE BDD = BDD + SGBDD

Page 7: Bases de Datos Distribuidas

BD DISTRIBUIDAS VS BD CENTRALIZADAS

Page 8: Bases de Datos Distribuidas

BASES DE DATOS DISTRIBUIDAS

RED DE COMUNICACIO

NES

ORDENADORSGBD

D

BD LOCA

L

ORDENADORSGBD

D

BD LOCA

L

ORDENADORSGBD

D

BD LOCA

L

ORDENADORSGBD

D

BD LOCA

L

Page 9: Bases de Datos Distribuidas

CARACTERÍSTICAS DE LAS BDD Los datos deben estar físicamente en más de un ordenador

(distintas sedes)

Las sedes deben estar interconectadas mediante una red (cada sede es un nodo de la red)

Los datos han de estar lógicamente integrados (recuperación y actualización) tanto en local como remoto (esquema lógico global y único)

En una única operación se puede acceder (recuperar o actualizar) datos que se encuentran en más de una sede (acceso a datos locales o remotos)

Todas las acciones que necesiten realizarse sobre más de una sede serán transparentes al usuario (transparencia de distribución para el usuario)

Page 10: Bases de Datos Distribuidas

ALMACENAMIENTO DISTRIBUIDO Dada una relación R:

RÉPLICA: copia de R en emplazamiento diferente

FRAGMENTACIÓN: R dividida en fragmentos diferentes almacenados en sitios diferentes

RÉPLICA Y FRAGMENTACIÓN: R dividida en fragmentos que son replicados en sitios diferentes

Page 11: Bases de Datos Distribuidas

VENTAJAS DE LAS BDD (I) ORGANIZATIVAS:

Adaptación a la organización de la institución (unión de compañías/descentralización), respondiendo a cambios

Almacenar los datos donde son generados y/o usados, la mayor parte locales

Proporcionar autonomía local, controlándose desde cada nodo. Política general contra política local

ECONÓMICAS: Costos de comunicación y de creación de pequeños

sistemas

Page 12: Bases de Datos Distribuidas

VENTAJAS DE LAS BDD (II) TÉCNICAS:

Flexibilidad, acceso desde distintos lugares y por distintas personas a la vez

Fiabilidad/disponibilidad, en un determinado momento / intervalo. Varios sitios, duplicaciones, evitan fallos

Modularidad Mejora del rendimiento, BD más pequeñas,

operaciones de menor volumen Crecimiento incremental, añadiendo poder de

procesamiento y almacenamiento. Se pueden agregar computadoras adicionales a la red conforme aumentan el número de usuarios y su carga de procesamiento

Page 13: Bases de Datos Distribuidas

DESVENTAJAS DE LAS BDD Complejidad del sistema, desarrollo de software más

costoso, problemas de sincronización, dificultad para conocer la corrección de los algoritmos paralelos, detección de caídas de nodos

Dependencia de la red de comunicaciones, sobrecarga de procesamiento de mensajes

Dificultad de diseño, fases adicionales Poca madurez de los productos comerciales,

orientados a replicación Funciones de administración compleja, sincronización

y coordinación Dificultad de cambio, inexistencia de metodologías Personal especializado

Page 14: Bases de Datos Distribuidas

DESVENTAJAS DE LAS BDD (II)

El rendimiento puede ser peor para el procesamiento distribuido que para el procesamiento centralizado.

El procesamiento de base de datos distribuida puede resultar menos confiable que el procesamiento centralizado.

Su mayor complejidad, a menudo se traduce en altos gastos de construcción y mantenimiento.

Page 15: Bases de Datos Distribuidas

CRITERIOS DE DISEÑO Se definieron 12 reglas:

1. Autonomía local2. No depender de un sitio central3. Operatoria continua4. Independencia de la localidad5. Independencia de la fragmentación6. Independencia de la replicación7. Procesamiento de querys distribuidas8. Transacciones distribuidas9. Independencia del hardware10. Independencia del SO11. Independencia de la red12. Independencia de la base de datos

Page 16: Bases de Datos Distribuidas

CRITERIOS DE DISEÑO>>LAS DOCES REGLAS

Autonomía Local. Es parte de un SD pero también atiende requerimientos

locales. No dependencia de un sitio central.

Todos los sitios son remotos. Cada sitio tiene su diccionario de datos y seguridad.

Operación continua. Operatoria 7 x 24 Hot backup (es una copia efectuada en los datos aunque estén

todavía disponibles para los usuarios y pueden estar siendo actualizados.)

Independencia con respecto a la localización. El usuario final no conoce la localidad física. No hay diferencias de lugares específicos.

Page 17: Bases de Datos Distribuidas

CRITERIOS DE DISEÑO>>LAS DOCES REGLAS

Independencia con respecto a la fragmentación. Poder almacenar información relacionada en sites diferentes. Hay dos tipos:

Horizontal Diferentes filas de la misma tabla se almacenan en

diferentes sitios. Organizaciones con ramificaciones y las mismas tablas.

Vertical Las columnas de la misma tabla se encuentran en sitios

diferentes. Problemas de disponibilidad (o dependencia) si se cae el nodo. No habría problemas si tenemos una base de datos distribuida

replicada.

Page 18: Bases de Datos Distribuidas

CRITERIOS DE DISEÑO>>LAS DOCES REGLAS

Independencia de réplica. Habilidad de crear copias del master en sitios remotos. Llamados snapshots pueden contener TODO. Pueden replicarse como read-only y refresh definido.

Procesamiento distribuido de consultas. Es más que ejecutar consultas sobre más de una base. Se ejecuta en el nodo en la que está el usuario. Se particiona en sub-consultas.

Page 19: Bases de Datos Distribuidas

CRITERIOS DE DISEÑO>>LAS DOCES REGLAS

Manejo distribuido de transacciones. Manejo del modificaciones a la desde una consulta

simple. Se implementa con algoritmo two-phase commit

Asegura que todas las bases tienen éxito en los subupdatesanes del commit definitivo.

Un fallo en una, hace fallar toda la transacción. Hay nuevas técnicas que permiten commit parciales

Independencia del Hardware El query (consulta) obtiene información de un IBM, PC,

MAC, etc.

Page 20: Bases de Datos Distribuidas

CRITERIOS DE DISEÑO>>LAS DOCES REGLAS

Independencia con respecto al sistema operativo. El query (consulta) obtiene información de un WIN,

UNX, MVS, etc Independencia con respecto a la red.

Los diferentes protocolos no tienen efecto sobre la BDD. Soportan multiprotocolos.

Mundos síncronos (mainframes IBM) Mundos asíncronos (UNX)

Independencia con respecto al DBMS Recuperar y almacenar de muchas bases y

arquitecturas.

Page 21: Bases de Datos Distribuidas

COMPONENTES DE UNA BDD BD locales SGBDD Red de comunicaciones Diccionario o directorio global

Page 22: Bases de Datos Distribuidas

EL SGBDD (I) Las RESPONSABILIDADES del SGBDD serán:

Transparencia de red Transparencia de fragmentación Transparencia de copias o duplicación

Propagación de actualizaciones Procesamiento de consultas distribuidas, definición de

estrategias Mantener un diccionario integrado Control de concurrencia, integridad de la BDD,

consistencia entre las múltiples copias de los datos Fiabilidad de los SGBDD, capaz de recuperar y devolver a

las bases de datos implicadas en el fallo un estado consistente y estable

Soporte de sistema operativo Bases de datos heterogéneas, mecanismos de traducción

Page 23: Bases de Datos Distribuidas
Page 24: Bases de Datos Distribuidas

EL SGBDD (II) Un SGBDD tiene, conceptualmente, tres

COMPONENTES principales Procesador de datos locales (PDL)

Gestión de datos local Procesador de aplicaciones distribuidas (PAD)

Responsable de las funciones de distribución Software de comunicaciones

Suministra las primitivas y los servicios de comunicaciones que necesita el PAD

Cada sede puede tener un PDL y un PAD o bien sólo uno de ellos

Page 25: Bases de Datos Distribuidas

TIPOLOGÍA DE LAS BDD SEGÚN EL GRADO DE HOMOGENEIDAD DE LOS

SGBD LOCALES: SGBDD homogéneos: todos los SGBD locales son iguales SGBDD heterogéneos: los SGBD locales son distintos

SEGÚN EL GRADO DE AUTONOMÍA FUNCIONAL: SGBDD federados: total autonomía funcional (multibase

de datos) SGBDD sin ninguna autonomía funcional local

SEGÚN EL GRADO DE AUTONOMÍA ORGANIZATIVA: Autonomía total: las decisiones se toman a nivel local Organización centralizada

Page 26: Bases de Datos Distribuidas

ESQUEMAS DE UNA BDD

Page 27: Bases de Datos Distribuidas

DUDAS