2 BD Introduccion

download 2 BD Introduccion

of 13

description

BD Introduccion

Transcript of 2 BD Introduccion

Bases de datos en Grid

Introduccin a las Bases de Datos1Introduccin: Bases de DatosColeccin de datos relacionados lgicamente.Conjunto de datos no redundantes, almacenados en un soporte informtico, organizados de forma independiente de su utilizacin y accesibles simultneamente por distintos usuarios y aplicaciones.Las bases de datos son necesarias cuando el volumen o la organizacin de los datos hace imposible un seguimiento a mano de los mismos por el usuario.Si bien muchas aplicaciones grid no necesitan acceder a bases de datos, el middleware hace uso de la mismas para diversas tareas como el control de rplicas de los datos.2Ventajas del uso de bases de datosGlobalizacin de la informacin.Eliminacin de informacin redundante.Eliminacin de informacin inconsistente. Si el sistema est desarrollado a travs de archivos convencionales, esta es una operacin costosa y potencialmente peligrosa.Permite compartir informacin. Varios sistemas o usuarios pueden utilizar una misma entidad.Permite mantener la integridad en la informacin. Solo se almacena la informacin correcta.Independencia de datos. La independencia de datos implica un divorcio entre programas y datos; es decir, se pueden hacer cambios a la informacin que contiene la base de datos o tener acceso a la base de datos de diferente manera, sin hacer cambios en las aplicaciones o en los programas.3Tipos de Bases de datosJerrquica.Estructura en rbol (padre/hijo).Relaciones uno-a-uno o uno-a-muchos.Pero no muchos-a-muchos.Problemas:Redundancia de la informacin.Borrado en cascada.Red.Evita el problema de redundancia con conectores.Relacionales y objeto-relacionales.Orientadas a objetos.Acceso directo a objetos desde programas OO. Tipos de datos flexibles, abstraccin, etc.Fracaso comercial.XML.

4SGBD: Sistema Gestor de Bases de DatosEs el conjunto de programas que permiten: definir, manipular y utilizar la informacin que contienen las bases de datos, realizar todas las tareas de administracin necesarias para mantenerlas operativas, mantener su integridad, confidencialidad y seguridad. Una BD nunca se accede o manipula directamente sino a travs del SGBD. Se puede considerar al SGBD como el interfaz entre el usuario y la BD.Se pueden considerar tres niveles:Externo.Lgico.Interno.Algunos de los ms conocidos son: Relacionales y Objeto-Relacionales: IBM DB2, Informix, Oracle, MySQL, PostGress, SQL Server XML: Tamino, Apache Xindice, Berkeley dbXMLOO: Objectivity5Propiedades ACIDAcrnimo ingls que se refiere a las siguientes propiedades de un SGBD transaccional:Atomicity (Atomicidad): Todas las operaciones de una transaccin son ejecutadas o ninguna.Consistency (Consitencia): Solo se ejecutan transacciones que dejen a la base de datos en un estado consistente al final, es decir, que no violen las reglas de integridad (integrity constraints).Isolation (Aislamiento): ninguna operacin fuera de la transaccin puede ver el estado de los datos en un estado intermedio de esta.Durability (Durabilidad): una vez realizada la operacin, sta persistir y no se podr deshacer aunque falle el sistema. Estas propiedades permiten que los datos puedan ser compartidos de forma segura.6El modelo relacionalDesarrollado por E.F. Codd a finales de los sesenta.Es el ms extendido hoy en da. Motivos de su xito:ofrecen sistemas simples y eficaces para representar y manipular los datos se basan en un modelo, el relacional, con slidas bases tericas (matemticas): lgebra y teora de conjuntos.La estructura fundamental es la relacin o tabla.SQL es el lenguaje que se utiliza para manejar este tipo de bases de datos.Estndar ANSI (1986), ISO (1987). Versin actual SQL3. Aunque la mayora de las bases de datos solo implementan el entry level del SQL92.El modelo objeto-relacional que hoy implementan las compaas ms importantes (IBM, Microsoft y Oracle) es una extensin del mismo. Estandarizado en SQL3.7El modelo relacional (2)La estructura fundamental del modelo relacional es la "relacin", una tabla bidimensional constituida por lneas (tuplas) y columnas (atributos). Las relaciones representan las entidades que se consideran interesantes en la base de datos.Cada instancia de la entidad corresponde a una tupla de la relacin, mientras que los atributos de la relacin representan las propiedades de la entidad. En realidad, siendo rigurosos, una relacin es slo la definicin de la estructura de la tabla, es decir su nombre y la lista de los atributos que la componen. Cuando se puebla con las tuplas, se habla de "instancia de relacin". Las tuplas en una relacin son un conjunto en el sentido matemtico del trmino, es decir una coleccin no ordenada de elementos diferentes. 8El modelo relacional (3)Para distinguir una tupla de otra, se recurre al concepto de "llave primaria (primary key): un conjunto de atributos que permiten identificar unvocamente una tupla en una relacin. Naturalmente, en una relacin puede haber ms combinaciones de atributos que permitan identificar unvocamente una tupla ("llaves candidatas"), pero entre stas se elegir una sola para utilizar como llave primaria. Los atributos de la llave primaria no pueden asumir el valor nulo (que significa un valor no determinado), porque en ese caso no permitiran identificar una tupla concreta en una relacin. Esta propiedad de las relaciones y de sus llaves primarias se denomina integridad de las entidades (entity integrity).9Diseo de Bases de Datos (Relacionales)Se pueden considerar tres niveles:Conceptual: proceso de construir un modelo de la informacin que se quiere almacenar.Independiente de toda consideracin fsica.Modelo de Entidad-Relacin (E-R).Lgico: traslada la representacin conceptual a una estructura lgica (relaciones).Estructura de los datos (tablas)Integridad de los datosFsico10NormalizacinEl proceso de normalizacin es un estndar que consiste, bsicamente, en un proceso de conversin de las relaciones entre las entidades, evitando:La redundancia de los datos: repeticin de datos en un sistema. Anomalas de actualizacin: inconsistencias de los datos como resultado de datos redundantes y actualizaciones parciales. Anomalas de borrado: prdidas no intencionadas de datos debido a que se han borrado otros datos. Anomalas de insercin: imposibilidad de adicionar datos en la base de datos debido a la ausencia de otros datos. Existen 4 formas normales bsicas.Existen algunas ms menos extendidas y prcticas.

11Las cuatro formas normalesSe dice que una tabla se encuentra en primera forma normal (1NF) si y solo si cada uno de los campos contiene un nico valor para un registro determinado. La segunda forma normal compara todos y cada uno de los campos de la tabla con la clave definida. Si todos los campos dependen directamente de la clave se dice que la tabla est es segunda forma normal (2NF).Se dice que una tabla est en tercera forma normal si y solo si los campos de la tabla dependen nicamente de la clave, dicho en otras palabras los campos de las tablas no dependen unos de otros. Una tabla est en cuarta forma normal si y slo si para cualquier combinacin clave - campo no existen valores duplicados. 12SQLAcrnimo ingls para: Structured Query Language Estndar. El SQL-92 entry level ha sido lo ms usado durante muchos aos. En 1999 sali una versin nueva del estndar (SQL3), que ha sufrido algunas modificaciones en 2003.Tres tipos de sentencias SQL:DDL (Data Definition Language)Crear/modificar tablas, ndices, vistas (CREATE,ALTER)DML (Data Manipulation Language)Consultas a la base de datos. (SELECT)Insertar, actualizar y borrar datos.(INSERT,UPDATE,DELETE)DCL (Data Control Language).Gestin de los permisos (GRANT, REVOKE.)13