Trabajop de Informatica II

download Trabajop de Informatica II

of 10

description

Informtica

Transcript of Trabajop de Informatica II

  • Facultad de Ciencias Fsicas y Matemticas

    ARCHIVOS1. NOCIN DE ARCHIVOS: _ Hablando de estructuras de datos, estos se

    almacenan o estn almacenados en la memoria central o principal. Este tipo de almacenamiento, conocido por almacenamiento principal o primario, tiene la ventaja de su pequeo tiempo de acceso y, adems, que este tiempo necesario para acceder a los datos almacenados en una posicin del dispositivo (memoria principal), sin embargo no siempre es posible almacenar los datos en la memoria central o principal de la computadora, debido a las limitaciones de su uso tenemos.

    La cantidad de datos que puede manipular un programa no puede ser muy grande debido a la limitacin de la memoria de la computadora.

    La existencia de los datos en la memoria principal est supeditada al tiempo que la computadora est encendida y el programa ejecutndose. Esto supone que los datos desaparecen de la memoria principal cuando la computadora se apaga o se deja de ejecutar el programa.

    Estas limitaciones dificultan:

    La manipulacin de gran nmero de datos, ya que en ocasiones pueden no caber en la memoria principal (aunque hoy en da han desaparecido las limitaciones que la primera generacin de PC presentaba con la limitacin de la memoria a 640Kbytes, no admitindose informacin a almacenar mayor de esa cantidad en el caso de computadoras IBM PC y compatibles ).

    La transmisin de salida de resultados de un programa puede ser tratada como entrada a otro programa.

    Para poder superar estas dificultades se necesitan dispositivos de almacenamiento Secundario (memorias externas o auxiliares) como cintas discos magnticos, perforadas, etc. Donde se almacenar la informacin o datos que podr ser recuperada para su tratamiento posterior. Las estructuras de datos aplicadas a coleccin de datos en almacenamientos secundarios se llaman organizacin de archivos. La nocin de archivo est relacionada con los conceptos de:

    Almacenamiento permanente de datos.

    Fraccionamiento o particin de grandes volmenes de informacin en unidades ms pequeas que pueden ser almacenadas en memoria central y procesadas por un programa.

  • Facultad de Ciencias Fsicas y Matemticas Un archivo es un conjunto de datos en una coleccin de entidades

    elementales o bsicas denominadas registros, que son de igual tipo y consta a su vez de diferentes entidades de nivel ms bajo denominadas campos.

    1.2CAMPOS: Los caracteres se agrupan en campos de datos. Un campo es un tem o elemento de datos elementales, tales como un nombre , nmero de empleados, ciudad, numero de identificacio,etc

    Un campo est caracterizado por su tamao o longitud y su tipo de datos (cadena de caracteres, entero lgico, etc.). Los campos pueden incluso variar en longitud. En la mayora de los lenguajes de programacin los campos de longitud variable no estn soportados y se suponen de longitud fija.

    2. REGISTROS: Un registro es una coleccin de informacin, normalmente relativa a una entidad particular. Un registro es una coleccin de campos lgicamente relacionados, que pueden ser tratados como una unidad pro algn programa. Los registros pueden ser todos de longitud fija

    Los registros organizados en campos se denominan registros lgicos.

    Nota. El concepto de registro es similar al concepto de estructura, ya que ambas estructuras de datos permiten almacenar datos de tipo heterogneo

    3. ARCHIVOS: Un archivo es una coleccin de datos relacionados entre s con aspectos en comn y organizados para un propsito especfico.

    Un archivo en una computadora es una estructura diseada para contener datos estn organizados de tal modo que puedan ser recuperados fcilmente, actualizados o borrados y almacenados de nuevo en el archivo con todos los campos realizados.

    Por ejemplo. Un archivo de una clase escolar contiene un conjunto de registros de los estudiantes de la clase. Los archivos de nominas de una empresa, inventarios, stocks, etc.

    4. BESES DE DATOS: una coleccin de archivos a los que puede accederse por un conjunto de programas y que contienen todos ellos datos relacionados constituye una base de datos. As, una base de datos de una universidad puede contener archivos de estudiantes, archivos de nminas, inventarios de equipos, etc.

  • Facultad de Ciencias Fsicas y Matemticas5. ESTRUCTURA JERRQUICA: Los conceptos carcter, campo, registro, archivo y

    base de datos son conceptos lgicos que se refieren al medio en que el usuario de computadoras ve los datos y se organizan. Las estructuras de datos se organizan de un modo jerrquico, de modo que el nivel ms alto lo constituye la base de datos y el nivel ms bajo el carcter.

    6. CONCEPTO Y DEFINICIN: Aunque en el aparato anterior ya se han comentado algunos trminos relativos a la teora de archivos, en este apartado se enunciarn todos los trminos ms utilizados en la gestin y diseo de archivos.

    CLAVE (indicativo). Una clave o indicativo es un campo de datos que identifica el registro y lo diferencia de otros registros. Esta clave debe ser diferente para cada registro. Claves tpicas son nombres o nmeros de identificacin

    REGISTRO FISICO O BLOQUEO: Un registro fsico o bloque es la cantidad ms pequea de datos que pueden transferirse en una operacin de entrada/salida entre la memoria central y los elementos perifricos o viceversa.

    Un bloque puede contener uno o ms registros lgicos.

    Un registro lgico puede ocupar menos de un registro fsico, un registro fsico o ms de un registro fsico.

    Por ejemplo un registro fsico es: una tarjeta perforadora, una lnea de impresin, un sector de un disco magntico, etc.

    FACTOR BLOQUEO: Otra caracterstica que es importante en relacin con los archivos es el concepto de factor de bloqueo o blocaje. El nmero de registro lgico que puede contener un registro fsico se denomina factor de de blocaje.

    Se puede dar las siguientes situaciones:

    EREGISTRO LGICO >REGISTRO FSICO. En un bloque se contienen varios registros fsicos por bloque; se denominan registros expandidos.

    REGISTRO 1 REGISTRO 2 REGISTRO 4 ESPACIOS ENTRE BLOQUES

  • Facultad de Ciencias Fsicas y Matemticas

    ESTE ES UN BLOQUE

    REGISTROS LGICOS=REGISTRO FSICO. El factor de bloqueo es 1 y se dice que los registros no estn bloqueados.

    REGISTRO LIGICO

  • Facultad de Ciencias Fsicas y Matemticasf. Los archivos en memoria auxiliar permiten una gran capacidad de

    almacenamiento.

    7. SOPORTES SECUENCIALES Y DIRECCIONALES :

    El medio fsico donde se almacenan los datos. Los tipos de soporte utilizados en la gestin de archivos son:

    Soportes secuenciales.

    Soportes direccionales.

    Los soportes secuenciales. Son aquellos en los que los registros, informaciones, estn escritos unos a continuacin de otros y para acceder a un determinado registro n se necesita pasar por los n-1 registros anteriores.

    Los soportes direccionales .se estructuran de modo que las informaciones registradas se pueden localizar directamente por su direccin y no se requiere pasar por los registros precedentes. En estos soportes los registros deben poseer un campo clave que los diferencie del resto de los registros del archivo. Una direccin en un soporte direccinale puede ser nmero de sector en un disco.

    Los soportes direccionales son los discos magnticos, aunque pueden actuar como soporte secuencial.

    8. ORGANIZACIN DE ARCHIVOS:

    La organizacin de archivo define la forma en que se estructuran los datos de un archivo. Se consideran tres organizaciones fundamentales:

    Organizacin secuencial.

    Organizacin directa o aleatoria.

    Organizacin secuencial indexada.

    8.1. GANIZACIN SECUENCIAL.

    Es sucesin de registros almacenados consecutivamente sobre el soporte externo, de tal modo que para acceder a un registro n dado es obligatorio pasar por todos los n-1 artculos que le preceden.

    Los registros se graban consecutivamente cuando el archivo se crea y se debe acceder consecutivamente cuando se leen dichos registros.

  • Facultad de Ciencias Fsicas y Matemticas8.2. ORGANIZACIN DIRECTA.

    Un archivo est organizado de modo directo cuando los datos se sitan en el archivo y se accede a ellos directamente mediante su posicin.

    Esta organizacin tiene la ventaja de que se pueden leer y escribir registros en cualquier orden y posicin. La desventaja que tiene es que necesita programar la relacin existente entre el contenido de un registro y su posicin que ocupa.

    Las condiciones para que un archivo sea de organizacin directa son:

    -Almacenado en un soporte direccionadle (un disco o un paquete de discos).

    -Los registros deben contener un campo especfico denominado clave que identifica cada registro de modo nico, es decir, dos registros distintos no pueden tener un mismo valor de clave.

    -Existencia de una correspondencia entre los posibles valores de la clave y las direcciones disponibles sobre el soporte.

    9. ORGANISACION SECUENCIAL INDEXADA.

    Un archivo est organizado en forma secuencial indexada s.

    El tipo de sus registros contiene un campo clave identificador.

    Los registros estn situados en un soporte direccionadle por el orden de los valores indicados por la clave.

    Un ndice para cada posicin direccionadle, la direccin de la posicin y el valor de la clave; en esencia, el ndice contiene la clave del ltimo registro y la direccin de acceso del primer registro del bloque.

    Un archivo en organizacin secuencial indexada consta de las siguientes partes:

    1. rea de datos o primaria.

    2. rea de ndices

    3. rea desbordamiento o excedentes.

    10. OPERACIONES SOBRE ARCHIVOS Las operaciones que se pueden realizar son:

    Creacin: Es la primera operacin que se hace a un archivo de datos. Actualizacin: Consulta (lectura), insercin, supresin, modificacin. Reunin: Obtencin de un archivo a partir de varios archivos. Rotura: Obtencin de varios archivos a partir de un archivo.

  • Facultad de Ciencias Fsicas y Matemticas

    11. GESTIN DE ARCHIVOS Las operaciones bsicas para la gestin de archivos, que tratan con la propia estructura Del archivo Son: crear, abrir, cerrar y borrar archivos. CREAR UN ARCHIVO: Es la operacin mediante el cual se introduce la informacin Correspondiente al archivo en un soporte de almacenamiento de datos. Para crear un nuevo archivo dentro de un sistema de computadora se necesita los

    1. siguientes pasos: Nombre dispositivo: indica el lugar donde se situar el archivo cuando se

    cree. Nombre del archivo: identifica el archivo entre los restantes archivos de una

    PC. Tamao del archivo: indica el espacio necesario para la creacin del archivo Organizacin del archivo: tipo de organizacin del archivo. Tamao del bloque o registro fsico: cantidad de datos que se leen o

    escriben en cada operacin de E/S. La instruccin en pseudocdigo que permite crear un archivo es: Crear (var_tipo_archivo, nombre_fsico)

    ABRIR UN ARCHIVO: La accin de abrir un archivo es permitir al usuario localizar y acceder a os archivos que fueron creados anteriormente.

    El formato de instruccin es: abrir (var_tipo_archivo, modo, nombre_fsico) CERRAR UN ARCHIVO: El propsito de la operacin de cerrar un archivo es

    permitir al usuario cortar el acceso o detener el uso del archivo, permitiendo a otros usuarios acceder al archivo.

    Formato: cerrar (var_tipo_archivo) BORRAR ARCHIVOS: La instruccin de borrar tiene como objetivo la supresin

    de un archivo del soporte. La informacin necesaria para borrar un archivo es: nombre del dispositivo. nombre del archivo.

    12. Flujos:

    Los flujos son una forma flexible y eficiente para leer y escribir datos.

    Existe una estructura interna de C, FILE, la cual representa a todas los flujos y est definida en stdio.h. Por lo tanto simplemente se necesita referirse a la estructura para realizar entrada y salida de datos.

    Para usar los flujos entonces se debe declarar una variable o apuntador de este tipo en el programa. No se requiere conocer ms detalles acerca de la definicin. Se debe abrir un flujo antes de realizar cualquier E/S, despus se puede acezar y entonces se cierra.

    El flujo de E/S usa un BUFFER, es decir, un pedazo fijo de rea temporal de la memoria (el buffer) es ledo o escrito a un archivo. Lo siguiente se muestra en la figura. Observar que el apuntador del archivo actualmente apunta a ste buffer.

  • Facultad de Ciencias Fsicas y MatemticasModelo de entrada salida usando un buffer.

    Esto conduce a un uso eficiente de E/S pero se debe tener cuidado: los datos escritos a un buffer no aparecen en un archivo (o dispositivo) hasta que el buffer es escrito (con \n se puede hacer). Cualquier salida anormal del cdigo puede causar problemas.

    Mantenimiento de archivos:

    Este tipo de operacin incluye todos los procesos que se efectuando sobre un archivo desde su creacin hasta su eliminacin.

    Esta operacin consta de dos operaciones diferentes:

    Actualizacin.

    Consulta

    Actualizacin: la actualizacin viene hacer la operacin de eliminar o modificar los datos ya existentes o si no introducir nuevos datos. Las operaciones de actualizacin son:

    Altas: Esta operacin consiste en la adicin de un nuevo registro.

    Bajas: Esta operacin cosiste en eliminar algn registro del archivo.

    Modificaciones: Esta operacin consiste en cambiar total o parcialmente el contenido de uno de sus registros.

    consulta : la operacin de consulta tiene como funcin u objetivo visualizar la informacin que contiene el archivo, de manera completa o parcial. Este tipo de operacin debe contemplar diversos aspectos que faciliten la posibilidad de conservacin de datos .Estos aspectos son:

    Se puede elegir el tipo de visualizacin del contenido ya sea por pantalla o por listado por impresora

    Se puede detener la consulta a voluntad del usuario

    Listado por listados o campos individuales o bien listado total del archivo.

    Procesamiento de archivos

    Es la forma usada para sacar la informacin (registros) de los ficheros que se encuentran almacenados en el soporte (cintas, discos, disco duro HD, etc.).

    El tipo de soporte condiciona este acceso, as pues podemos distinguir entre:

  • Facultad de Ciencias Fsicas y Matemticas

    1. Acceso secuencial: En este acceso los registros se leen uno a uno desde el registro primero hasta el registro que se busca, o hasta el final si no se ha encontrado). Se puede usar tanto en dispositivos secuenciales como direccionales.

    2. Acceso directo: Permite seleccionar un registro directamente (con un numero mnimo de lecturas) a travs de su clave sin necesidad de buscar

    en ninguno mas. Este tipo de acceso puede realizarse de dos formas:

    Clculo: Cada registro viene con una clave implementada, sobre la que se aplica un clculo (casting) y el resultado de este ya indica el lugar de grabacin (la direccin en memoria dentro del soporte).

    ndice: Existe un ndice asociado independiente al fichero en el cual se busca el registro y nos dice en qu direccin de memoria se encuentra dicho registro requerido.

    13. Hashing:

    Se trata de unos algoritmos ya realizados por programadores que obtienen nueceros aleatorios, pero siempre dentro del rango de capacidad del soporte usado. Esos nmeros luego definen la direccin en memoria donde se va a almacenar registro. El algoritmo hashing sea cual sea debe cumplir las siguientes condiciones.

    Maximizar el espacio disponible en el dispositivo de almacenamiento. Debe de dar como resultado prcticamente todos las direcciones posibles, con margen muy amplio, si hay un margen grande de direcciones que nunca van a salir ser peor, y as reduciremos el espacio en el dispositivo de almacenamiento.

    Establecer una relacin lgica entre la direccin fsica y la direccin lgica. O lo que es lo mismo una relacin entre la clave obtenida o resultado (el que se guarda junto al registro en el fichero) y direccin que contiene el registro.

    Producir el menor nmero de registros que con distintas claves nos creen las mismas direcciones de almacenamiento.

    Que el abanico de resultados del casting no se salga de las posibilidades de capacidad del dispositivo. Porejemplo, tenemos un disco duro y supongamos que tenemos en el hasta 10.000 direcciones de memoria, en cada direccin memoria podemos almacenar un dato. Pues el hashing debe devolver un valor menor o igual a 10.000, no puede dar un valor mayor, puesto que ese registro luego no se podra guardar en el disco. Algunas tcnicas empleadas en hashing son: el truncamiento, extraccin, seleccin, etc.

  • Facultad de Ciencias Fsicas y Matemticas14. Acceso indexado: En este tipo de acceso se usa una tabla auxiliar que contiene la clave y

    la direccin relativa del registro que queremos seleccionar. Una vez localizado en esa tabla se accede directamente al registro.

    15.Acceso dinmico: Se basa en un acceso directo a un registro y a los dems se accede secuencialmente. Va directo a unas marcas, luego de marca a marca va secuencial.

    ARCHIVOS