Bases de Datos Avanzadas: Bases de Datos Distribuidas

download Bases de Datos Avanzadas: Bases de Datos Distribuidas

of 66

  • date post

    07-Mar-2015
  • Category

    Documents

  • view

    33
  • download

    7

Embed Size (px)

Transcript of Bases de Datos Avanzadas: Bases de Datos Distribuidas

  • Diapositiva 1
  • Bases de Datos Avanzadas: Bases de Datos Distribuidas
  • Diapositiva 2
  • NDICE 1. Introduccin y Conceptos. 2. Ventajas, Complejidad e Inconvenientes de las BDD. 3. Almacenamiento distribuido de datos: FRAGMENTACIN, REPLICACIN Y ASIGNACIN DE DATOS PARA EL DISEO DE BDD. 4. Transparencia de la red. 5. Procesamiento distribuido de consultas. 6. Transacciones distribuidas.
  • Diapositiva 3
  • BDD: INTRODUCCIN Y CONCEPTOS Bases de Datos Distribuidas mezcla de dos tecnologas : La tecnologa de base de datos. La tecnologa de redes y comunicacin de datos. Esta ltima tecnologa ha avanzado mucho en los ltimos aos gracias al desarrollo de las comunicaciones celulares y por satlite, Redes de rea Metropolitana (MAN), estandarizacin de protocolos como TCP/IP; y por sobre todo, gracias a la explosin de Internet. Las organizaciones ya no estn interesadas, como en los 80s, en bases de datos centralizadas gigantes. Hoy se tiende a la descentralizacin de procesos, a nivel del sistema, mientras que, a nivel lgico, se consigue una integracin de las fuentes de informacin dentro de BDs geogrficamente distribuidas.
  • Diapositiva 4
  • BDD: INTRODUCCIN Y CONCEPTOS.... Las BDD aportan al dominio de la gestin de bases de datos las ventajas de la computacin distribuida. En la cual un conjunto de elementos de procesamiento (no necesariamente homogneos) interconectados por una red cooperan en forma coordinada en la ejecucin de tareas, dividiendo problemas grandes e inmanejables en piezas ms pequeas que se resuelven en forma coordinada. La viabilidad econmica de este enfoque tiene dos razones: (1) Se aprovecha ms la potencia del ordenador en la resolucin de tareas complejas. (2) Cada elemento de procesamiento se puede gestionar en forma independiente en el desarrollo de tareas locales (autonoma).
  • Diapositiva 5
  • BDD: INTRODUCCIN Y CONCEPTOS.... Entonces, podemos definir: Base de Datos Distribuida (BDD): coleccin de mltiples bases de datos interrelacionadas lgicamente, distribuidas sobre una red de computadores y manejadas por un SGBDD. Sistema de Gestin de Bases de Datos Distribuido (SGBDD): Sistema de software que maneja BDDs y que hace de la distribucin algo transparente al usuario. SISTEMA DE BDD = BDD + SGBDD Las siguientes figuras contrastan distintas arquitecturas de bases de datos:
  • Diapositiva 6
  • Diferentes arquitecturas de sistemas de bases de datos Arquitectura con nada compartido
  • Diapositiva 7
  • Diferentes arquitecturas de sistemas de bases de datos Arquitectura en red con una BD centralizada en uno de los sitios
  • Diapositiva 8
  • Diferentes arquitecturas de sistemas de bases de datos... Verdadera Arquitectura de una Base de Datos Distribuida DB
  • Diapositiva 9
  • Cliente BD Servidor Servidor Sitio 1Sitio 2 Sitio 3 Sitio n Red de Comunicaciones.....
  • Diapositiva 10
  • Ejemplo de BD distribuida Nodo E1Nodo E2 RED Alumnos Comunicacin a travs de la red Nodo Rectorado Escuelas
  • Diapositiva 11
  • Ejemplo de BD distribuida: Nodos de las Escuelas: DNI Escuela Nombre Nota ingreso Beca Nodo del Rectorado: Escuela Ubicacin Nmero alumnos Nuevo alumno en la secretara del E1: transaccin local. Nuevo alumno en el rectorado: transaccin global
  • Diapositiva 12
  • BDD: INTRODUCCIN Y CONCEPTOS.... Los datos deben estar fsicamente en ms de una sede. Cada sede o computadora es un nodo de la red. Cada nodo proporciona un entorno de ejecucin de transacciones, tanto local, como global. Esquema lgico global nico: Los datos han de estar lgicamente integrados, para realizar recuperacin y actualizacin tanto en forma local como remota. En una nica operacin se puede acceder (recuperar o actualizar) datos que se encuentran en ms de una sede. Tipos de transacciones: Locales: cuando se accede a los datos de la sede que inici la transaccin. Globales: se accede a datos de sedes distintas al nodo que inici la transaccin.
  • Diapositiva 13
  • Pasos a seguir para disear una BDD: 1. Diseo del "esquema conceptual" el cual describe la base de datos integrada (esto es, todos los datos que son utilizados por las aplicaciones que tienen acceso a las bases de datos). 2. Diseo "fsico" de la base de datos, esto es, mapear el esquema conceptual a las reas de almacenamiento y determinar los mtodos de acceso. 3. Diseo de la fragmentacin, este es, determinar la forma en que las relaciones globales se subdividen en fragmentos horizontales, verticales o mixtos. 4. Diseo de la asignacin de los fragmentos, esto es, determinar la forma en que los fragmentos se mapean a las imgenes fsicas.
  • Diapositiva 14
  • Diseo de BDD Las 12 Reglas de Date 1 Autonoma local Los nodos o localidades de un SD deben ser independientes entre si en el mayor grado posible. Caractersticas de cada nodo Tiene su propio DBMS El DBMS controla todos los aspectos del nodo Las operaciones de acceso a datos locales utilizan slo recursos locales Hay cooperacin entre los nodos para el acceso distribuido de datos.
  • Diapositiva 15
  • Diseo de BDD Las 12 Reglas de Date... 2 No es necesario un sitio central Todos los sitios/nodos deben ser tratados como iguales De existir un sitio central, habra un cuello de botella De existir un sitio central, el sistema sera vulnerable, porque una falla hara fallar a todo el sistema Para el protocolo de commit de dos fases se necesita un sitio central pero slo durante la ejecucin de una transaccin
  • Diapositiva 16
  • 3 Operacin continua Un sistema BDD no debera estar nunca fuera de servicio Para proporcionar mayor confiabilidad y mayor disponibilidad se requiere: Soporte para backups on line, total o incremental Soporte para recuperaciones rpidas de BD. DBMS tolerante a fallos (con hardware acorde) Diseo de BDD Las 12 Reglas de Date...
  • Diapositiva 17
  • 4 Independencia de localizacin Los usuarios y las aplicaciones no necesitan conocer la ubicacin fsica de los datos. Actan como si fuesen locales a ellos. Sin transparencia local deberan distinguirse los datos locales de los datos remotos. Simplifica los programas de usuario. Punto crtico: el Diccionario de Datos Usuarios y aplicaciones se refieren a los datos mediante alias El DD debe mantener una tabla con los elementos de datos, sus alias y sus ubicaciones Un DDBMS debe mantener y utilizar el DD an cuando los datos se mueven entre localidades El DD debe estar replicado en las localidades y las rplicas deben mantenerse actualizadas.
  • Diapositiva 18
  • Diseo de BDD Las 12 Reglas de Date... 5 Independencia de Fragmentacin de datos Los usuarios pueden comportarse como si los datos no estuvieran fragmentados (no necesitan conocer los fragmentos fsicos en que est dividida cada coleccin lgica de datos) La fragmentacin es necesaria por razones de rendimiento. Los datos pueden estar almacenados en la ubicacin donde son usados con mayor frecuencia para que la mayora de las operaciones sean locales y se reduzca el trfico de la Red.
  • Diapositiva 19
  • Diseo de BDD Las 12 Reglas de Date... 6 Independencia de la Replicacin de datos Replicacin El usuario debe comportarse como si los datos no estuvieran replicados (a nivel lgico los usuarios no necesitan tener en cuenta si los datos tienen rplicas o no) Recordemos que esto significa: Mejor rendimiento: las aplicaciones operan sobre copias locales en vez de comunicarse con sitios remotos. Mejor disponibilidad: un objeto replicado est disponible mientras haya al menos una copia. Desventaja: propagar las actualizaciones.
  • Diapositiva 20
  • Diseo de BDD Las 12 Reglas de Date... 7 Procesamiento de consultas distribuidas La performance de una consulta debe ser independiente del sitio donde se realiza la consulta El SD debe disponer de mecanismos para optimizar las consultas y en el especial para reducir la carga de trfico necesaria.
  • Diapositiva 21
  • Diseo de BDD Las 12 Reglas de Date... 8 Gestin de transacciones distribuidas El SD debe disponer de mecanismos adecuados para el control de concurrencia y la recuperacin de transacciones distribuidas Debe mantenerse la atomicidad de las transacciones. Control de recuperacin de informacin. Control de concurrencia. Protocolos utilizado para preservar la atomicidad: dos fases o tres fases los ms conocidos.
  • Diapositiva 22
  • Diseo de BDD Las 12 Reglas de Date... 9 Independencia de hardware Es necesario tener la posibilidad de ejecutar el mismo DBMS en diferentes plataformas de Hardware. 10 Independencia del SO Es necesario tener la posibilidad de ejecutar el mismo DBMS en sitios con diferentes sistemas operativos.
  • Diapositiva 23
  • Diseo de BDD Las 12 Reglas de Date... 11 Independencia de red El SD debe poder operar con diferentes redes de comunicaciones. 12 Independencia del DBMS Debe permitirse la heterogeneidad, es decir, que cada sitio pueda funcionar con un SGBD diferente, incluso basado en un modelo de datos diferente, siempre y cuando compartan una interface comn.
  • Diapositiva 24
  • Ventajas, Complejidad e Inconvenientes de las BDD 1-Gestin de datos distribuidos con diferentes niveles de transparencia: Transparencia de distribucin: un SGBDD debera ocultar al usuario el emplazamiento de los datos, es decir los detalles del almacenamiento de los archivos (relaciones o tablas) dentro del sistema. Transparencia de red: hace referencia a la liberacin del usuario de los detalles operacionales de la red. transpa