Bases de Datos Distribuidas
-
Upload
gustavo-diaz-moreno -
Category
Documents
-
view
11 -
download
0
Transcript of Bases de Datos Distribuidas
BASES DE DATOS DISTRIBUIDAS
MOTIVACIÓN DE LAS BDD Necesidad de:
Integración + Distribución
Bases de datos
distribuidas
Bases de datos
Redes de ordenadores
INTEGRACIÓNProblemas derivados del desarrollo de BD
independientes: Datos redundantes SGBD distintos Plataformas variadas (pc’s, workstations, etc.)
Consecuencias: Inconsistencias en los otros datos Dificultad de interoperatividad Aislamiento de los distintos grupos de usuarios
Necesidad de los Sistemas de Información integrados que respondan a los objetivos globales de la empresa.
DISTRIBUCIÓN Finalidad: Acercar la informática a los usuarios.
Compartiendo Optimizando
Necesidad de Sistemas de Información Distribuidos que doten de autonomía a los usuarios y que consigan mayor eficiencia.
NO OBSTANTE….
DEFINICIONES Bases de Datos Distribuidas (BDD)
Colección de múltiples bases de datos, lógicamente interrelacionadas, distribuidas sobre una red de ordenadores.
Sistema de Gestión de BDD (SGBDD) Producto software capaz de gestionar una BDD,
suministrando mecanismos de acceso que hacen transparente la distribución.
El SGBDD es el software que gestiona de manera transparente la base de datos distribuida.
SISTEMA DE BDD = BDD + SGBDD
BD DISTRIBUIDAS VS BD CENTRALIZADAS
BASES DE DATOS DISTRIBUIDAS
RED DE COMUNICACIO
NES
ORDENADORSGBD
D
BD LOCA
L
ORDENADORSGBD
D
BD LOCA
L
ORDENADORSGBD
D
BD LOCA
L
ORDENADORSGBD
D
BD LOCA
L
CARACTERÍSTICAS DE LAS BDD Los datos deben estar físicamente en más de un ordenador
(distintas sedes)
Las sedes deben estar interconectadas mediante una red (cada sede es un nodo de la red)
Los datos han de estar lógicamente integrados (recuperación y actualización) tanto en local como remoto (esquema lógico global y único)
En una única operación se puede acceder (recuperar o actualizar) datos que se encuentran en más de una sede (acceso a datos locales o remotos)
Todas las acciones que necesiten realizarse sobre más de una sede serán transparentes al usuario (transparencia de distribución para el usuario)
ALMACENAMIENTO DISTRIBUIDO Dada una relación R:
RÉPLICA: copia de R en emplazamiento diferente
FRAGMENTACIÓN: R dividida en fragmentos diferentes almacenados en sitios diferentes
RÉPLICA Y FRAGMENTACIÓN: R dividida en fragmentos que son replicados en sitios diferentes
VENTAJAS DE LAS BDD (I) ORGANIZATIVAS:
Adaptación a la organización de la institución (unión de compañías/descentralización), respondiendo a cambios
Almacenar los datos donde son generados y/o usados, la mayor parte locales
Proporcionar autonomía local, controlándose desde cada nodo. Política general contra política local
ECONÓMICAS: Costos de comunicación y de creación de pequeños
sistemas
VENTAJAS DE LAS BDD (II) TÉCNICAS:
Flexibilidad, acceso desde distintos lugares y por distintas personas a la vez
Fiabilidad/disponibilidad, en un determinado momento / intervalo. Varios sitios, duplicaciones, evitan fallos
Modularidad Mejora del rendimiento, BD más pequeñas,
operaciones de menor volumen Crecimiento incremental, añadiendo poder de
procesamiento y almacenamiento. Se pueden agregar computadoras adicionales a la red conforme aumentan el número de usuarios y su carga de procesamiento
DESVENTAJAS DE LAS BDD Complejidad del sistema, desarrollo de software más
costoso, problemas de sincronización, dificultad para conocer la corrección de los algoritmos paralelos, detección de caídas de nodos
Dependencia de la red de comunicaciones, sobrecarga de procesamiento de mensajes
Dificultad de diseño, fases adicionales Poca madurez de los productos comerciales,
orientados a replicación Funciones de administración compleja, sincronización
y coordinación Dificultad de cambio, inexistencia de metodologías Personal especializado
DESVENTAJAS DE LAS BDD (II)
El rendimiento puede ser peor para el procesamiento distribuido que para el procesamiento centralizado.
El procesamiento de base de datos distribuida puede resultar menos confiable que el procesamiento centralizado.
Su mayor complejidad, a menudo se traduce en altos gastos de construcción y mantenimiento.
CRITERIOS DE DISEÑO Se definieron 12 reglas:
1. Autonomía local2. No depender de un sitio central3. Operatoria continua4. Independencia de la localidad5. Independencia de la fragmentación6. Independencia de la replicación7. Procesamiento de querys distribuidas8. Transacciones distribuidas9. Independencia del hardware10. Independencia del SO11. Independencia de la red12. Independencia de la base de datos
CRITERIOS DE DISEÑO>>LAS DOCES REGLAS
Autonomía Local. Es parte de un SD pero también atiende requerimientos
locales. No dependencia de un sitio central.
Todos los sitios son remotos. Cada sitio tiene su diccionario de datos y seguridad.
Operación continua. Operatoria 7 x 24 Hot backup (es una copia efectuada en los datos aunque estén
todavía disponibles para los usuarios y pueden estar siendo actualizados.)
Independencia con respecto a la localización. El usuario final no conoce la localidad física. No hay diferencias de lugares específicos.
CRITERIOS DE DISEÑO>>LAS DOCES REGLAS
Independencia con respecto a la fragmentación. Poder almacenar información relacionada en sites diferentes. Hay dos tipos:
Horizontal Diferentes filas de la misma tabla se almacenan en
diferentes sitios. Organizaciones con ramificaciones y las mismas tablas.
Vertical Las columnas de la misma tabla se encuentran en sitios
diferentes. Problemas de disponibilidad (o dependencia) si se cae el nodo. No habría problemas si tenemos una base de datos distribuida
replicada.
CRITERIOS DE DISEÑO>>LAS DOCES REGLAS
Independencia de réplica. Habilidad de crear copias del master en sitios remotos. Llamados snapshots pueden contener TODO. Pueden replicarse como read-only y refresh definido.
Procesamiento distribuido de consultas. Es más que ejecutar consultas sobre más de una base. Se ejecuta en el nodo en la que está el usuario. Se particiona en sub-consultas.
CRITERIOS DE DISEÑO>>LAS DOCES REGLAS
Manejo distribuido de transacciones. Manejo del modificaciones a la desde una consulta
simple. Se implementa con algoritmo two-phase commit
Asegura que todas las bases tienen éxito en los subupdatesanes del commit definitivo.
Un fallo en una, hace fallar toda la transacción. Hay nuevas técnicas que permiten commit parciales
Independencia del Hardware El query (consulta) obtiene información de un IBM, PC,
MAC, etc.
CRITERIOS DE DISEÑO>>LAS DOCES REGLAS
Independencia con respecto al sistema operativo. El query (consulta) obtiene información de un WIN,
UNX, MVS, etc Independencia con respecto a la red.
Los diferentes protocolos no tienen efecto sobre la BDD. Soportan multiprotocolos.
Mundos síncronos (mainframes IBM) Mundos asíncronos (UNX)
Independencia con respecto al DBMS Recuperar y almacenar de muchas bases y
arquitecturas.
COMPONENTES DE UNA BDD BD locales SGBDD Red de comunicaciones Diccionario o directorio global
EL SGBDD (I) Las RESPONSABILIDADES del SGBDD serán:
Transparencia de red Transparencia de fragmentación Transparencia de copias o duplicación
Propagación de actualizaciones Procesamiento de consultas distribuidas, definición de
estrategias Mantener un diccionario integrado Control de concurrencia, integridad de la BDD,
consistencia entre las múltiples copias de los datos Fiabilidad de los SGBDD, capaz de recuperar y devolver a
las bases de datos implicadas en el fallo un estado consistente y estable
Soporte de sistema operativo Bases de datos heterogéneas, mecanismos de traducción
EL SGBDD (II) Un SGBDD tiene, conceptualmente, tres
COMPONENTES principales Procesador de datos locales (PDL)
Gestión de datos local Procesador de aplicaciones distribuidas (PAD)
Responsable de las funciones de distribución Software de comunicaciones
Suministra las primitivas y los servicios de comunicaciones que necesita el PAD
Cada sede puede tener un PDL y un PAD o bien sólo uno de ellos
TIPOLOGÍA DE LAS BDD SEGÚN EL GRADO DE HOMOGENEIDAD DE LOS
SGBD LOCALES: SGBDD homogéneos: todos los SGBD locales son iguales SGBDD heterogéneos: los SGBD locales son distintos
SEGÚN EL GRADO DE AUTONOMÍA FUNCIONAL: SGBDD federados: total autonomía funcional (multibase
de datos) SGBDD sin ninguna autonomía funcional local
SEGÚN EL GRADO DE AUTONOMÍA ORGANIZATIVA: Autonomía total: las decisiones se toman a nivel local Organización centralizada
ESQUEMAS DE UNA BDD
DUDAS