IAGP2 Bases Datos Organizacion Ficheros Firmado

download IAGP2 Bases Datos Organizacion Ficheros Firmado

of 35

Transcript of IAGP2 Bases Datos Organizacion Ficheros Firmado

  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    1/35

    pdfcrowd comClick to customize your PDFs

    Informtica Aplicada a la Gestin Pblica. Facultad de Derecho (GAP)UMU

    Captulo 5. Bases de datos. Organizacin deficheros.

    5.1 Soportes5.2 Procesamiento de Ficheros5.3 Organizacin y operaciones con ficheros

    1.- Soportes

    Son los dispositivos quealmacenan los datos, hay dostipos:

    Soportes de AccesoDirecto a los datos (Ej.:discos). Son los msempleados.

  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    2/35

    pdfcrowd comClick to customize your PDFs

    Soportes de AccesoSecuencial (Ej.: cintasmagnticas). Se suelenusar en copias deseguridad.

    Cilindro lgico: Est formadopor todas las pistas que tenganel mismo nmero en todos los

    discos del disco duro. Tieneimportancia cuando hablamos de la velocidad en la transferencia, lainformacin que se quiere leer simultneamente se almacena en el mismocilindro lgico para evitar tener que desplazar a menudo el brazo de lascabezas lectoras.

    Caractersticas de soportes magnticos. Para el caso de las cintas ydiscos magnticos podemos mencionar las caractersticas mnimas quedebemos conocer:

    Cinta

    - Densidad de grabacin = n de bytes por pulgada, que es una unidad nolegal en la mayora de los pases, donde es obligatorio el uso del SistemaInterneacional de Unidades (bpi)

    Normalmente la cinta contiene varias pistas, de forma que una densidad de800 bpi, representa tener grabados 800 caracteres por pulgada, o lo que es lomismo 315 caracteres por centmetro (1 pulgada = 2.54 centmetros).

    - Capacidad bruta = n de bytes que puede almacenar

    Se calcula multiplicando la densidad de grabacin (bpi) por su longitud, quesuele venir dada en pies (1 pie = 12 pulgadas). Por ejemplo una cinta conuna densidad de grabacin de 800 bpi y una longitud de 3200 pies podralmacenar:

    capacidad = 3200 x 12 x 800 = 30720000 bytes.

    - Velocidad de transferencia = n de bytes que se pasan a la CPU porsegundo

    Planeta escepticismo

    Escepticismo

    ARP-SAPC

    Crculo escptico

    Magonia

    Pensar. Argentina

    Escpticos. Colombia

    Arev. Venezuela

    James Randi. EE.UU.

    CSI. EE.UU.

    TUTORAS

    Escepticismo enEspaa

    Escepticismo enAmrica

    Sugerencias

    y consultasNombre:

    eMail:

    Tel (opcional):

    http://pdfcrowd.com/http://pdfcrowd.com/customize/http://www.marisolcollazos.es/Planeta-escepticismohttp://www.escepticismo.es/http://www.arp-sapc.org/http://www.circuloesceptico.org/http://blogs.elcorreodigital.com/magonia/posthttp://www.pensar.org/http://www.escepticoscolombia.org/http://arev.wordpress.com/http://www.randi.org/http://www.csicop.org/http://www.barzanallana.es/tutorias
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    3/35

    pdfcrowd comClick to customize your PDFs

    Normalmente en la informacin de las cintas viene la velocidad delectura/escritura en pulgadas por segundo (ips), por lo que es necesariocalcular la velocidad de t ransferencia. Por ejemplo en una cinta con unavelocidad de 75 ips con una densidad de grabacin de 800 bpi, tendramos:

    velocidad de transferencia = 75 ips x 800 bpi = 60000 bps = 60 Kb/s

    Disco

    - Capacidad = n de bytes que puede almacenar

    Normalmente viene dado en Kbyte, Mbyte, o Gigabyte (byte es equivalente aocteto)

    - Velocidad de transferencia. Es lo mismo que para la cinta cuando la lecturase hace de forma secuencial. Viene expresada en Kb/s

    - Tiempo medio de acceso, es el tiempo medio que se tarda en acceder a unregistro. Viene expresado en milisegundos. Ejemplo: 38.4 ms

    Normalmente la informacin que va a ser manejada con frecuencia sealmacenar en discos, mientras que las cintas se suelen reservar casiexclusivamente para las copias de seguridad.

    2.- Procesamiento de Ficheros

    Es la forma de solicitar la informacin al disco. Existen dos mtodos paraello:

    Modo Secuencial: Se lee la informacin de un fichero de registro enregistro teniendo que leer todos los que hay antes del que buscamos.Se emplea bien por deseo, bien por imposicin del tipo de soporte queestamos usando. El acceso secuencial es recomendable cuando sequiere trabajar con muchos registros del fichero.

    Modo Directo: Se puede acceder a un registro si tener que leertodos los anteriores (basta con un pequeo nmero de lecturas). Haydos maneras:

    Consulta osugerencia:

    Proteccin de datos: la informacin

    proporcionada se usar

    nicamente para responder a la

    consulta. No se almacenan los

    datos.

    Submit

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    4/35

    pdfcrowd comClick to customize your PDFs

    Clculo: Cada regin tiene una clave sobre la que seaplica un clculo que indica el lugar de grabacin(Hashing).

    ndices: existe un ndice independiente o asociado alfichero en el cual se busca el registro y se nos indicadonde est.

    3.- Organizacin y operaciones con ficheros

    Organizacin son los modos de disponer los registros del fichero en elsoporte. Existen tres modos principales:

    Secuencial: Un registro a continuacin de otro.

    Directo: Los registros binarios se disponen en el soporte atendiendo a

    un algoritmo de clculo.

    Indexado: Los registros generalmente se almacenan secuencialmentey van con un ndice.

    Las operaciones que se pueden hacer con los ficheros pueden utilizar todoslos registros del fichero o slo una parte de ellos. Las operaciones queutilizan todos los registros de los ficheros son siguientes:

    - Creacin. Consiste en la grabacin, por primera vez, sobre un soporte delos registros de un fichero.

    - Apertura y cierre. Para poder hacer cualquier operacin con los registros deun fichero ha de estar abierto. En el tiempo que no se utilizan los datos quealmacena el fichero debe permanecer cerrado para evitar problemas con lainformacin que almacena. Para empezar a trabajar con los datos de unfichero la primera operacin es abrirlo, y cuando se termine de trabajar conl, cerrarlo.

    - Borrado. Consiste en la eliminacin de todo el fichero. Esta operacinpuede realizarse de dos formas: prohibiendo de un modo definitivo el acceso

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    5/35

    pdfcrowd comClick to customize your PDFs

    al fichero, de modo que no se pueda leer o escribir en l, o bien, eliminandola informacin referente al fichero que est grabada en el soporte que locontiene. En el primer caso, el fichero puede ser recuperado.

    - Ordenacin o clasificacin. Consiste en cambiar el orden en que estngrabados los registros del fichero en el soporte. Los registros se ordenansegn el contenido de uno o ms campos en forma ascendente odescendente. En el primer caso el primer registro es el que tiene el menorvalor en el campo utilizado para clasificar los registros, y en el segundo caso,

    el primer registro contendr, en el campo util izado para clasificar losregistros, el valor mas alto de todos los registros del fichero.

    - Duplicado o copia. Esta operacin consiste en crear un nuevo ficheroidntico a uno ya existente. Es muy recomendable como medida deseguridad, por si en algn momento se estropea un fichero. Si esto ocurrierasiempre se dispondra de la copia para poder recuperarlo.

    - Fusin o intercalacin. Se denomina tambin mezcla. Consiste en obtener,a partir de dos ficheros ordenados por un mismo campo y con la mismaestructura, otro fichero que contenga todos los registros de ambos y que se

    mantenga ordenado por el mismo campo.

    - Particin. Consiste en dividir un fichero en varios, de acuerdo con algunacondicin que han de cumplir los registros.

    Adems de estas operaciones en las que se ven afectados todos losregistros del fichero se pueden realizar otras operaciones en las que slo seutilicen una parte de los registros. En estas operaciones ser necesario,primero, localizar el registro o los registro con los que queremos trabajar yluego realizar la operacin. Las operaciones mas utilizadas de este tipo son

    las de:- Actualizacin o mantenimiento. Esta operacin consiste en manteneractualizados los datos almacenados en los registros del fichero, tecleandonuevos datos cuando se conocen, modificando datos ya existente oeliminando datos que ya no se necesitan. Las operaciones de actualizacinse conocen con los nombres de:

    - Altas: Consiste en aadir nuevos registros al fichero

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    6/35

    pdfcrowd comClick to customize your PDFs

    - Bajas: Consiste en eliminar registros del fichero, eliminando sucontenido, o simplemente, bloqueando el acceso a los datos quecontiene

    - Modificaciones: Consiste en cambiar el contenido de uno o mscampos de un registro del fichero

    Recuperacin. Consiste en acceder a la informacin almacenada en losregistros del fichero para su consulta. Las operaciones de recuperacin msutilizadas son:

    - Consultas: Consiste en acceder a uno o varios registros para ver elcontenido de todos sus campos o solo parte de ellos. Normalmenteeste tipo de operacin da como resultado una salida por pantalla delos datos que queremos consultar.

    - Listados: Se diferencia de la consulta en la forma, en que sepresenta la informacin que se consulta. En este caso la salida de lainformacin ser en papel, por la impresora o a un fichero con formato(por ejemplo PDF) en forma de lista ordenada.

    4.- Ficheros Lineales (Modo Secuencial)

    Los registros estn dispuestos uno a continuacin de otro. Existen dosformas de este tipo: simple y encadenado.

    Simple

    La disposicin de los ficheros (uno detrs de otro) se traduce en unalmacenamiento sin huecos entre ellos.

    Nota: un registro fsico es el bloque fijo que se transfiere del disco a lamemoria principal, y por tanto puede contener ms de un registro lgico.

    A continuacin veremos las principales caractersticas de los ficheros

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    7/35

    pdfcrowd comClick to customize your PDFs

    lineales simples:

    A) Consulta muy rpida en procesamiento secuencial.

    B) Modificaciones del fichero:

    Si el soporte es secuencial la modificacin obliga a hacer unacopia del fichero. Al realizar una insercin hay que desplazarhacia atrs todos los que siguen. Al efectuar un borrado hayque desplazar hacia delante todos los registros que seguan alregistro borrado, y por ltimo para modificar un registro tambinhay que hacer una copia ya que para modificarlo hay que leerloentero, con lo cual, una vez ledo, la cabeza ya ha pasado porl y habra que volverla hacia at rs (cosa que no podemoshacer).

    Si el soporte es directo es posible hacer modificacionessencillas, pero la insercin y el borrado requieren una copia delfichero. Para hacer dicha copia se emplea el Algoritmo de laLnea de Balance que consiste en tener un fichero de

    movimientos que almacena los registros que van a sufrirmodificacin. Este fichero y aquel del que proceden los datosdeben tener la misma clave, se procesa el primer registro deambos y se graba en otro fichero la modificacin (si procede)de ese registro, o bien si en el fichero de movimientos se indicael borrado no se copia.

    C) Proceso lento para consultas puntuales

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    8/35

    pdfcrowd comClick to customize your PDFs

    D) Aprovechan mucho el espacio de almacenamiento (slo se precisa eljusto para los datos)

    E) Posibilidad de usar cualquier tipo de soporte.

    F) Problema para procesar un fichero por ms de una clave (campo deregistro), ya que si un registro est ordenado en funcin de una clave nopuede estarlo por otra. Las soluciones a este problema son: o bien se tienen

    dos ficheros iguales o ms (tantos como clasificaciones diferentes haya)cada uno ordenado con respecto a una clave, o bien se clasifica el ficherocada vez que se quiera acceder (lo cual es muy lento).

    Encadenado

    Los ficheros lineales encadenados mejoran a los simples. Los registros seprocesan en el orden lgico (uno detrs de otro), pero este no tiene porquecoincidir con el orden fsico (los registros se enlazan por punteros). Esimprescindible un soporte de acceso directo.

    Los registros deben contener un campo extra para almacenar el puntero (quepuede dar la direccin exacta del siguiente registro o bien ser una direccinrelativa respecto del comienzo del fichero). Se crea para evitar las copiasimplicadas en el proceso de insercin y borrado estos procesos sloconllevan un reajuste de punteros.

    Los punteros son entre registros fsicos, y recordemos que en un registrofsico cabe ms de un registro lgico.

    Este tipo de organizacin se usa mucho con diferentes estructuras:

    A) Listas Simples. Son de acceso o procesamiento secuencial ysuelen ser pilas o colas. Son las ms sencillas y responden a ladescripcin general que se ha hecho para los ficheros secuencialesencadenados.

    B) Listas Mltiples.

    Son tambin de acceso secuencial, es decir, que para llegar aun registro lgico, hay que pasar previamente por todos los

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    9/35

    df dClick to customize your PDFs

    anteriores a l. En este tipo de listas cada registro lleva ms deun puntero.Permiten tener clasificados los registros por ms de una clave,teniendo varios campos de puntero.Suele haber un registro ndice que es cabeza de todas laslistas, o sea, es un registro de punteros que apuntan alprincipio de la lista correspondiente a la ordenacin quedeseemos.Como los registros no se almacenan secuencialmente, y sin

    embargo si se accede secuencialmente, este acceso es mslento porque la cabeza tiene que ir dando saltos.Regularmente se deben reorganizar los datos para acelerar elacceso a travs de la clave ms habitual.

    C) Anillos. Se emplean como estructura de muchos de los modelosde bases de datos.

    D) rboles. Tienen dos funciones principales: la construccin dendices y de ficheros.

    El tipo de rbol que se emplea generalmente es el binario, en suvariante de rbol binario de bsqueda, se usa porque permite quese procesen los registros de forma directa y porque es sencillo hacerun recorrido secuencial en ellos, al procesar el rbol en in-orden.

    Los rboles binarios no de bsqueda sirven para desarrollar cualquiertipo de estructura jerrquica siguiendo la tcnica del enlace al sucesor- enlace al gemelo. En esta tcnica el hijo izquierdo de cada nodo esun sucesor, y el hijo derecho un gemelo. Veamos como se aplicaraesta tcnica al siguiente rbol:

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    10/35

    df dClick to customize your PDFs

    En los rboles la consulta y la insercin son sencillas. Lassupresiones se pueden hacer o bien por marca (no se precisareorganizar), o bien supresiones reales que tienen la ventaja de que nodejan huecos en la estructura. Las organizaciones encadenadas seprestan bien a compartir espacio en el soporte con otras

    organizaciones encadenadas que haya. La estructura de rbol tienemuy pocas desventajas.

    Sin embargo uno de los principales problemas de las demsestructuras encadenadas, es que si se hacen muchas supresiones,quedan excesivos huecos, con lo que el fichero se desaprovechaexcesivamente. Para evitar esto existen dos tcnicas: la recuperacinde huecos y la gestin dinmica del espacio libre .

    La recuperacin de huecos consiste en que al crear el fichero sereserva espacio y se encadenan los huecos por medio de punteros

    (por tanto los registros deben ser de longitud fija). Siempre se tiene unpuntero sealando a la primera posicin libre del fichero (que es elhueco al que se acude a la hora de realizar una nueva insercin). Sifuese necesario hacer una supresin, el puntero de insercin pasara aapuntar al registro borrado, y dicho registro apuntara a donde estabaapuntando el puntero de insercin antes de realizar el borrado.Veamos un ejemplo:

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    11/35

    df dCli k t t i PDF

    En un principio tenemos el fichero distribuido de esta manera dondecada cuadro representa un registro (los sombreados son registrosocupados). El puntero marcado es el de insercin.

    Si borramos uno de los registros ocupados, por ejemplo el de lasegunda fila y la segunda columna, el fichero quedara como sigue:

    Como vemos el puntero de insercin apunta ahora al registro queacaba de ser borrado, por tanto cuando hagamos la prxima insercinse realizar en dicho registro.

    La gestin dinmica del espacio libre permite:

    Tener registros de longitud variable.

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    12/35df dCli k t t i PDF

    Que los nuevos registros se inserten lo ms cercaposible de los anteriores.Reorganizar los huecos para que queden juntos, estoquiere decir que al hacer supresiones habr movimientode registros a nivel fsico.

    Este mtodo se podra representar grficamente de la siguiente forma:

    R1 R2 R3 R4 Hueco Hueco

    Si borramos R2 quedara:

    R1 R3 R4 Hueco Hueco Hueco

    5.- Ficheros con ndices (modo indexado)

    En este modo de organizacin, al fichero le acompaa un fichero dendice que tiene la funcin de permitir el acceso directo a los registrosdel fichero de datos. Estos ndices son anlogos a los de los libros, sinos interesa leer un captulo dado se puede recurrir al ndice queindica la pgina de inicio, y se accede al libro por esa pgina, sintener que mirar en todas las pginas anteriores para localizarlo.

    Caractersticas

    Las caractersticas ms importantes de un fichero indexado, son lassiguientes:

    a) El diseo del registro tiene que tener un campo, o combinacin decampos, que permita identificar cada registro de forma nica, es decir,que no pueda haber dos registros que tengan la misma informacin enl. Este campo es el denominado campo clave y es el que va a servirde ndice. Un mismo fichero puede tener ms de un campo clave, peroal menos uno de ellos no permitir valores duplicados y se le llamaclave primaria. A las restantes se les llama claves alternativas.

    b) Permiten utilizar el modo de acceso secuencial y el modo de

    f

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    13/35df dCli k t t i PDF

    acceso directo para leer la informacin guardada en sus registros.

    El modo de acceso directo se hace conociendo el contenido delcampo clave del registro que queremos localizar. Con esa informacinel sistema operativo puede consultar el ndice y conocer la posicindel registro dentro del fichero.

    En el modo de acceso secuencial los registros son ledos ordenadospor el contenido del campo clave, independientemente del orden en

    que se fueron grabando (el orden lgico no es igual al orden fsico),debido a que el acceso a los datos se hace a travs del ndice, quepara hacer ms fcil la bsqueda de los registros permanece siempreordenado por el campo clave.

    c) Solamente se puede grabar en un soporte de acceso directo. comopor ejemplo el disco magntico. Si esto no fuera as no podra emplearel acceso directo.

    Organizacin del ndice

    El ndice se puede organizar de diversas formas, las ms tpicas son:secuencial, multinivel y rbol.

    A travs del ndice se puede procesar un fichero de forma secuencial ode forma directa, segn la clave de indexacin, y estoindependientemente de como est organizado el fichero por s mismo.

    El ndice debe estar organizado en funcin de alguno de los camposde los registros de datos. Se pueden tener tantos ndices como sequiera variando la clave (o campo) que se emplee. El ndice estformado por registros (entradas) que contienen:

    Clave de organizacin.

    Puntero(s) al fichero de datos, en concreto al registro quecorresponda.

    Los ndices se pueden clasificar en dos tipos, segn cada entradaseale a la direccin de un registro del fichero de datos (ndice total odenso), o bien apunte a un grupo de registros del fichero de datos que

    d b t d d ( di d ) E l d

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    14/35df dCli k i PDF

    debe estar ordenado (ndice escaso o no denso). En el caso dendices totales, el fichero puede estar desordenado.

    Con el segundo tipo se podra procesar directamente el fichero dedatos de forma secuencial.

    Los ndices totales o densos no suelen utilizarse de forma simple,sino combinados con ndices escasos ms cortos, de esta manerapueden almacenarse en memoria principal obteniendo as un accesoms rpido.

    A continuacin veremos las tres formas principales de organizar losndices:

    Secuencial

    En esta forma de organizacin se usan cadenas de punteros Dentro

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    15/35fClick to customize your PDFs

    En esta forma de organizacin se usan cadenas de punteros. Dentrode ella podemos distinguir dos tipos:

    A. Simple Casi no se utiliza, en ella las inserciones ysupresiones son realizadas por copia.

    B. Encadenada: Se emplea ms que la anterior, an as tiene elproblema de que si crece mucho el fichero de datos, crece

    tambin el nmero de entradas, provocando que la bsqueda,al ser secuencial no se ptima para un acceso directo.

    Multinivel o Jerarquizada

    Consiste en varios ndices secuenciales encadenados. Tendremos unndice a los registros de datos y otros ndices que apuntarn a unndice de nivel menor.

    Este mtodo surge para mejorar la organizacin secuencialencadenada. Los ndices de nivel alto suelen ser escasos y los deprimer nivel densos.

    Al igual que en la organizacin secuencial, si aumenta el nmero de

    registros sigue aumentando el nmero de entradas

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    16/35

    Click to customize your PDFs

    registros s igue aumentando el nmero de entradas.

    rbol

    Viene a mejorar el problema del crecimiento de entradas en un nivel.Se pretende que el nmero de entradas en cada nivel sea fijo, y lo quecrezca sea el nmero de niveles.

    Se usan diferentes tipos de rboles, binarios (de bsqueda y AVL),

    multirrrama y B+

    6.- ndices Secundarios

    Hasta ahora se ha hablado de ndices primarios (aquellos queemplean claves primarias, es decir una clave, un registro).

    Puede ser que nos interese tener un ndice para claves que no seanprimarias, o sea una clave para ms de un registro, stos son los

    llamados ndices secundarios. Su principal caracterstica es que, alcontrario que en los primarios donde el direccionamiento pudiera serreal (posicin exacta en el disco) o relativo (en funcin de la posicindel fichero), en los secundarios se emplea el direccionamientosimblico, la clave proporciona la clave primaria del registro, y no sudireccin ni fsica, ni relativa, y el sistema emplea la clave primariapara localizar ese registro), en definitiva, emplea punteros indirectos.

    La ventaja de este direccionamiento es que podemos hacer muchosndices secundarios y a la hora de modificar los ficheros, lasdirecciones fsicas cambian, con lo que se deben cambiar tambin los

    ndices primarios (actualizarlos) esta operacin puede llevar muchotiempo, sin embargo, al usar direccionamiento simblico no esnecesario modificar los ndices, puesto que no tienen punteros aningn sitio.

    Veamos, a continuacin, algunas generalidades de los ficheros en losque se usa este tipo de direccionamiento:

    Reciben el nombre de ficheros invertidos.A partir de un dato (clave secundaria), se obtiene una clave

    primaria que lleva a ms datos

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    17/35

    pdfcrowd.comClick to customize your PDFs

    primaria que lleva a ms datos.Exis ten dos tipos de ficheros invertidos: Los ficherostotalmente invertidos y los ficheros parcialmente invertidosEn los Ficheros Totalmente Invertidos de una clavesecundaria se obtienen todas las primarias relacionadas. Ej.:

    Este tipo de ficheros cuentan con una ventaja aadida, que es la depoder responder a ciertas preguntas sin tener que usar el fichero dedatos (Nmero de alumnos en Murcia?)

    Los Ficheros Parcialmente Invertidos se utilizan para evitarque el ndice crezca mucho. Cuando buscamos por medio deuna clave secundaria, no aparecen todas las claves primariasrelacionadas a ella, sino que slo aparece la primera claveprimaria, y dentro del fichero de datos Ejisten punteros a losregistros de igual clave secundaria. Estos ficheros tambin sonllamados Ficheros Multilista. La tcnica ms usada es la deusar "punteros empotrados" en el fichero de datos. Los ficherosde este tipo son los ms utilizados, empleando paraimplementar el ndice un rbol tipo B.

    ndices mltiples.

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    18/35

    pdfcrowd.comClick to customize your PDFs

    Son ndices formados por ms de un atributo (campo). Se suelenemplear estructuras de array (rejillas) n-dimensionales. En las celdasde las rejillas en las que hubiera concordancia habra un punterosimblico al registro que correspondiera. Son ms rpidos peroocupan mucho ms espacio.

    Ficheros indexados ms utilizados.

    Se organizan muy frecuentemente de una forma secuencial indexadaorientada desde dos puntos de vista:

    A) ndices Secuenciales Multinivel. Estn orientadoshacia el hardware para evitar los problemas de lainsercin en la organizacin secuencial simple. Ejistendos mtodos: ISAM y VSAM

    B)ndices de rboles B (Generalmente B+).

    1. ndices Secuenciales Multinivel.

    I. ISAM (Mtodos de Acceso Secuencial Indexado).

    Este mtodo usa un fichero de datos secuencial y unndice secuencial.

    Divide el espacio del soporte en tres zonas: rea deDatos, rea de ndices y rea de Desborde, las cualesse subdividen en otras segn la estructura de los

    soportes. Los datos se organizan en pistas (que es launidad de transferencia con la memoria principal) ystas en cilindros lgicos.

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    19/35

    pdfcrowd.comClick to customize your PDFs

    La pista 0 de todos los cilindros se reserva para crearlos llamados ndices de pistas y alguna ms para losexcedentes del cilindro (al final).

    Cuando se llene una pista se pasa a la siguiente pistalibre de ese mismo cilindro (se va rellenando cilindro acilindro). Al rellenar una pista se crea en el ndice depista una entrada con la clave de mayor orden de esapista y un puntero a esa pista.

    Al llenar un cilindro, en el rea de ndices se crea unaentrada en el ndice de cilindros con la clave de mayororden y un puntero al cilindro.

    Puede existir un tercer ndice, el ndice maestro, muypequeo que apunta al ndice del cilindro.

    La mejora que obtenemos con este mtodo es que alpoder llevar una pista entera a memoria principal setrabaja ms rpido si al hacer una insercin excedo eltamao de la pista el/los registro/s excedente/s va/n alas pistas del rea de excedentes del cilindro.

    Tratamiento de los registros excedentes.

    Pueden almacenarse en una zona (un cilindro o ms)

    exclusiva para ellos. Otra forma sera reservar pistas

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    20/35

    pdfcrowd.comClick to customize your PDFs

    p ppara los registros excedentes al final de cada cilindro.Por ltimo una tercera forma consiste en una mezcla delas dos anteriores, es decir tener pistas al final de loscilindros y una zona exclusiva.

    Esta 3 forma es la ms utilizada, ya que la 1 presentael inconveniente de tener que hacer movimientos de lascabezas del disco para acceder a los excedentes, y la2, aunque no t iene este problema tiene otros dosinconvenientes: que se puede agotar el espacioreservado o bien que por miedo a que esto ocurra sedesaproveche mucho espacio en el soporte.

    Para localizarlos segn que tcnica empleemostardaremos mucho (bsqueda secuencial, ndice depistas para los Excedentes). La tcnica ms empleadaconsiste en que en el ndice de pistas cada entradasean en realidad dos entradas, una para los registrosalmacenados normalmente, y otra para los

    Ejcedentarios. Por tanto cada entrada estar compuestapor una entrada N que ser un puntero a la pista y comoclave la mayor de la pista, y una entrada O que tiene unpuntero a la menor entrada correspondiente a esa pistaque est en el rea de Excedentes y como clave lamayor de dichos Excedentes. Veamos un esquema quenos aclare esto un poco:

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    21/35

    pdfcrowd.comClick to customize your PDFs

    Nota: En caso de no haber excedentes la entrada O esigual que la N.

    A continuacin veremos un ejemplo de insercin queprovocar la aparicin de un registro Ejcedente:Supongamos que tenemos la distribucin que semuestra en la siguiente figura, y queremos aadir un

    registro con la clave 15:

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    22/35

    pdfcrowd.comClick to customize your PDFs

    Una vez introducido el 15, las pistas quedaran as:

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    23/35

    pdfcrowd.comClick to customize your PDFs

    Como vemos ahora la entrada O tiene como clave la delmayor excedente, que en este caso es el nico.Veamos ahora que ocurrira si hubiese ms de unregistro excedente, para ellos supongamos queintroducimos la clave 16.

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    24/35

    pdfcrowd.comClick to customize your PDFs

    Ahora, la entrada O nos indica cual es el mayorexcedente, y su puntero seala al menor excedente.Los registros excedentes de la misma pista seencadenan formando una lista desde el menor al mayor.

    La entrada O tambin es til para saber a donde debe irun registro (a qu pista), en nuestro caso por ejemplo, siintroducimos el 49, ya sabramos que pertenece a la

    pista 1 y que ira a la zona de excedentes de dichapista

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    25/35

    pdfcrowd.comClick to customize your PDFs

    pista.

    Para no tener muchos excedentarios se suelen crearregistros falsos hacia el final de las pistas. Tienen dosfunciones: si llega un registro con la misma clave queuno falso simplemente sobreescribimos el falso y si noel que saldra sera uno falso que no amplia la zona dexjcedentes. Esta es la nica forma de dejar huecos quese puede emplear en ISAM.

    II.- VSAM (Mtodo de Acceso a Memoria Virtual).

    Son tres modos de organizacin:

    Uno para ficheros secuenciales (ESDS)Otro para ficheros de acceso directo o registros dedireccin calculada (RRDS)

    Otro para ficheros secuenciales indexados (KSDS)

    ESDS = Conjunto de datos en secuencia de entrada.KSDS = Conjunto de datos en secuencia de clave.

    A) KSDS.

    Los tres modos se diferencian de ISAM en que sonindependientes del hardware o soporte. VSAMindependiza las unidades de transferencia del soporte.Su unidad de transferencia son los intervalos de control,los ficheros son mucho ms transportables que los de

    ISAM.

    Los intervalos se agrupan en reas de control (puede sero no un cilindro).

    Dentro de los intervalos de control se pueden dejarespacios libres al final de los mismos y en un reapueden haber intervalos completamente vacos.

    KSDS permite que el ndice est organizado como un

    rbol B+

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    26/35

    pdfcrowd.comClick to customize your PDFs

    rbol B+.

    El tamao de un rea de control suele estar definido porel sistema, lo que se permite es definir el nmero deintervalos que se quiere que estn vacos. Podemosdefinir la longitud de los intervalos de control.

    rea de Datos + rea de ndices = Cluster

    En el rea de ndices se tendr un rbol B+. Cada nododel rbol ser un intervalo de control. En las hojas seencuentran todas las claves y los nodos de las hojasestn enlazados por punteros. Las hojas forman lo quese llama conjunto de secuencias. Los elementos dedicho conjunto son los nodos con entradas que sern:como clave la mayor contenida en un intervalo de controldel rea de datos, y un puntero a ese intervalo del reade datos.

    Cuando hay varios intervalos vacos habrn nodos que loindiquen y un puntero a esos intervalos.

    El acceso directo se hace con la bsqueda en el rbol.El acceso secuencial se hace empleando los punteroshorizontales que enlazan las hojas del ndice.

    Veamos un esquema que representa como sera el rboldel rea de ndices, y como estara unido al rea dedatos.

    Los registros de datos pueden ser de longitud fija ovariable, y al principio de cada intervalo hay unoscaracteres de control que indican el nivel de ocupacin(interesa al hacer un recorrido secuencial).

    Al eliminar un registro los que estn a su derecha semovern a la izquierda dejando siempre los espacioslibres al final del intervalo. Y si algn intervalo quedaravaco aparecer en el conjunto de secuencias como una

    entrada de vaco (esto se llama reclamacin dinmica deespacio l ibre)

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    27/35

    pdfcrowd.comClick to customize your PDFs

    espacio l ibre).

    Este proceso (junto a otros que veremos) evitan lanecesidad de tener zonas de excedentes.

    Procesos de Particin de Intervalos y de reas.

    En una insercin si hay espacio al final no hayproblema. Si el intervalo estuviera completo lo que se

    hace es partir en dos el intervalo de control, pasando aocupar una de las mitades alguno de los intervalos libresque queden. A continuacin podemos ver un esquemaque nos sirve de ejemplo de una situacin en la que estoocurrira:en un rea de control los intervalos

    Esto provoca que sea posible que en un rea de controllos intervalos no estn en orden de clave, pero lo quesiempre estar ordenado es el conjunto de secuencias,

    por eso en el recorrido secuencial se emplean las hojas.

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    28/35

    pdfcrowd.comClick to customize your PDFs

    Lo que queremos decir con esto queda Expresado en elsiguiente esquema.

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    29/35

    pdfcrowd.comClick to customize your PDFs

    Si se nos acaban los intervalos libres en un rea y hayque insertar, lo que se divide en dos es el rea decontrol. Al particionarse s que se colocan los intervalosen orden de clave, adems tambin se particionaran las

    hojas del rbol de ndices. La particin del rea decontrol se hace considerando todos los registros delrea llevando la mitad a un rea y la otra mitad a otrorea (se procura crear intervalos con espacio libre).

    El retraso que puede haber en el procesamientosecuencial al tener que desplazar las cabezas secompensa con el hecho de no tener necesidad de reade excedentes.

    El inconveniente que tiene con respecto a ISAM es quehay que dejar ms espacios libres, a cambio el localizar

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    30/35

    pdfcrowd.comClick to customize your PDFs

    los registros es mucho ms rpido.

    B) RRDS. Ficheros con registros de direccin calculadao de organizacin directa

    La direccin de los registros en el soporte viene dadapor un clculo sobre la clave primaria de los registros detal forma que si aplicamos siempre el mismo clculo

    sobre una misma clave se obtiene el mismo resultado(que permite llegar hasta el registro).

    Puede haber direccin real (se especifica exactamentedonde est) o direccin relativa (posicin respecto alfichero). Para localizar los registros se aplica el clculoa la c lave del registro buscado.

    El clculo se llama algoritmo de direccionamiento y serdefinido por el usuario.

    La desventaja de este mtodo es que cuando el rangode claves es superior al de registros se desperdiciaespacio en el soporte.

    El algoritmo que se suele emplear es "aleatorizado", esdecir que obtiene nmeros aleatorios pero siempredentro del rango de claves (Mtodo Hashing).

    Puede ocurrir que para claves diferentes se obtenga lamisma direccin. A los registros que les ocurre esto se

    llaman sinnimos y deberan estar en la mismaposicin, lo cual es imposible, por tanto tendremosexcedentes.

    Generalmente la direccin tendr espacio suficiente paraalmacenar ms de un registro. Este espacio suele serde una pgina. A estos espacios se les llama cubos.Los cubos permiten emplear registros de tamaovariable aunque se estn empleando direcciones

    relativas (los cubos son de tamao fijo y en ellos sebusca secuencialmente).

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    31/35

    pdfcrowd.comClick to customize your PDFs

    Algoritmos aleatorios (Hashing) ms usuales.

    (1)Truncamiento. (75527 -> 75 / 527 -> 527)

    Reduce el rango en funcin del nmero de registros querealmente existe, truncando la clave, o sea quedndotecon slo una parte de la clave (los menos significativos,

    los ms importantes, etc..)

    (2)Extraccin. (75527 -> 552)

    Nos quedamos con las cifras centrales.

    (3)Seleccin.( 7 5 5 2 7 -> 5 7 5 )

    Tomamos determinadas posiciones de la clave y lascolocamos en el orden que nosotros queramos.Generalmente se emplea en compaa de otros.

    (4)Multiplicacin.

    Multiplicar una parte de la clave por otra parte de lamisma (y luego por ejemplo truncar el resultado).

    (5)Cambio De Base.

    Suponer la base en una base diferente a la suya ypasarla a la base en que est.

    (6)Divisin Por Nmero Primo.

    Se divide la clave por un nmero primo y como resultadotomamos el resto. Tiene la ventaja de no precisarclculos posteriores ya que al ser el nmero primo mso menos igual al nmero de registros posibles en elfichero, el resto s iempre estar en el rango permitido.

    (7)Clave No Numrica.

    Obti di i l ti S t f l l

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    32/35

    pdfcrowd.comClick to customize your PDFs

    Obtiene direcciones relativas. Se transforma la clave nonumrica en numrica (por ejemplo obtener elequivalente binario del carcter).

    El mtodo ms utilizado es el 6.

    Cmo tratar los sinnimos?

    Existen dos mtodos para el tratamiento de sinnimos:

    El primero buscar una nueva posicin en el espacioreservado al fichero y que est libre, y el segundomtodo emplear la zona de excedentes.

    *El primer mtodo presenta dos posibilidades:

    a) Sondeo lineal o asignacin consecutiva.

    Cuando un registro produce una direccin ocupada, sebusca en la siguiente direccin, a continuacin de esa,si est ocupada se pasa a la siguiente, y assucesivamente hasta hallar un espacio libre.

    El inconveniente es que t iende a acumular a losregistros en zonas de soporte, lo que amplia laposibilidad de que hayan sinnimos.

    b)Doble Hashing.

    Si aplicando el clculo se obtiene una direccinocupada, lo que hacemos es a esa direccin obtenidaaplicar o bien el mismo clculo, o bien otro distintoconsiguindose as una mayor dispersin de losregistros.

    f(k) -> D

    f(D) -> D

    Si D est ocupado se suelen usar zonas de excedentes.

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    33/35

    pdfcrowd.comClick to customize your PDFs

    * En cuanto al segundo mtodo existen dos formas deorganizar la zona de excedentes:

    a)Secuencial Simple.

    Los sinnimos se colocan secuencialmente en el ordende llegada. Este mtodo se usa cuando se presuponen

    pocos sinnimos.

    b) Secuencial Encadenado de rboles B (GeneralmenteB+).

    a.

    El sinnimo va a la primera posicin libre de la zona deEjcedentes y se encadena con un puntero a la posicinoriginal que le correspondera al registro en cuestin. Si

    viene un segundo sinnimo se encadena al primero quelleg.

    Ventajas e inconvenientes de los ficheros con registrosde direccin calculada.

    - Necesita soportes de acceso directo(Inconveniente)

    - Es mejor que los ndices cuando se requiereacceso a registros individuales y de forma

    desordenada. (Ventaja)

    - Desperdicia espacio en el soporte(Inconveniente).

    - Slo es aplicable a una clave del fichero(Inconveniente).

    Generalmente se emplea esta organizacin para

    la clave primaria y otra diferente para las clavessecundarias.

    http://pdfcrowd.com/http://pdfcrowd.com/customize/
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    34/35

    pdfcrowd.comClick to customize your PDFs

    Bsqueda escptica

    Buscar en mis pginas

    Texto a buscar Bsqueda en la Universidad de Murcia

    courses:.fr.de.pt.jp

    http://pdfcrowd.com/http://pdfcrowd.com/customize/http://www.um.es/docencia/barzana/II/II_Programa03_04.htmlhttp://digital.el-esceptico.org/http://www.difundefirefox.com/http://www.estadisticasgratis.com/http://www.formationco.com/http://www.omnibildung.de/http://www.educalivre.com/http://www.coursenavi.com/http://www.um.es/docencia/barzana/IAGP/IAGP2-Bases-datos-introduccion.htmlhttp://www.um.es/docencia/barzana/http://www.um.es/docencia/barzana/IAGP/IAGP2-Bases-datos-relacionales.htmlhttp://www.addtoany.com/subscribe?linkname=P%C3%A1gina%20de%20Rafael%20Barzanallana.%20Univ.%20de%20Murcia&linkurl=http%3A%2F%2Fwww.um.es%2Fdocencia%2Fbarzana%2Frdf.rsshttp://www.addtoany.com/share_save#url=http%3A%2F%2Fwww.um.es%2Fdocencia%2Fbarzana%2FIAGP%2FIAGP2-Bases-datos-organizacion-ficheros.html&title=IAGP.%20Bases%20de%20datos.%20%20Organizaci%C3%B3n%20de%20ficheros&description=Organizaci%C3%B3n%20ficheros.%20Informatica%20Aplicada%20a%20la%20Gesti%C3%B3n%20P%C3%BAblica
  • 8/8/2019 IAGP2 Bases Datos Organizacion Ficheros Firmado

    35/35

    pdfcrowd.comClick to customize your PDFs

    Rafael Menndez-Barzanallana AsensioDepartamento Informtica y Sistemas. Universidad de Murcia

    Bajo Licencia Creative Commons 3.0Actualizado 2010/12/04

    Imprimir

    http://pdfcrowd.com/http://pdfcrowd.com/customize/http://www.barzanallana.es/http://www.addtoany.com/share_save#url=http%3A%2F%2Fwww.um.es%2Fdocencia%2Fbarzana%2FIAGP%2FIAGP2-Bases-datos-organizacion-ficheros.html&title=IAGP.%20Bases%20de%20datos.%20%20Organizaci%C3%B3n%20de%20ficheros&description=Organizaci%C3%B3n%20ficheros.%20Informatica%20Aplicada%20a%20la%20Gesti%C3%B3n%20P%C3%BAblica