La organización lógica y física de los sistemas de archivo y sus mecanismos de acceso de archivo

10
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5 INSTITUTO TECNOLÓGICO SUPERIOR DE COATZACOALCOS I.S.C. Aurora Moreno Rodríguez Gómez Serrano José Roberto Sistemas operativos Ingeniería Informática 4to Semestre Grupo “A” 5ta. Unidad Investigación La organización lógica y física de los sistemas de archivo y sus mecanismos de acceso de archivo Vo. Bo. __________________________ Abril del 2016 Feb 2016 Jun 2016 Coatzacoalcos, Veracruz.

Transcript of La organización lógica y física de los sistemas de archivo y sus mecanismos de acceso de archivo

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

INSTITUTO TECNOLÓGICO SUPERIOR DE COATZACOALCOS

I.S.C. Aurora Moreno Rodríguez

Gómez Serrano José Roberto

Sistemas operativos

Ingeniería Informática

4to Semestre

Grupo “A”

5ta. Unidad

Investigación

“La organización lógica y física de los sistemas de archivo y sus

mecanismos de acceso de archivo”

Vo. Bo.

__________________________

Abril del 2016

Feb 2016 – Jun 2016

Coatzacoalcos, Veracruz.

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

La organización lógica y física de los sistemas de archivo y sus

mecanismos de acceso de archivo.

Se refiere a las diferentes maneras en las que puede ser organizada la información

de los archivos, así como las diferentes maneras en que ésta puede ser accesada.

Dado que hay 2 niveles de visión de los archivos (físico y lógico), se puede hablar

también de 2 aspectos de organización de archivos: Organización de archivos

lógicos y de archivos físicos.

El sistema de archivos está relacionado especialmente con la administración del

espacio de almacenamiento secundario, fundamentalmente con el almacenamiento

de disco.

Una forma de organización de un sistema de archivos puede ser la siguiente:

Se utiliza una “raíz ” para indicar en qué parte del disco comienza

el “directorio raíz ” .

El “directorio raíz ” apunta a los “directorios de usuarios”.

Un “directorio de usuario” contiene una entrada para cada uno de los

archivos del usuario.

Cada entrada de archivo apunta al lugar del disco donde está almacenado el

archivo referenciado.

Esta forma de organización se muestra en la Fig. 5.1.

Fig. 5.1Organización de un sistema de

archivos utilizando directorios.

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

Los nombres de archivos solo necesitan ser únicos dentro de un directorio de

usuario dado.El nombre del sistema para un archivo dado debe ser único para el

sistema de archivos.

En sistemas de archivo “jerárquicos” el nombre del sistema para un archivo suele

estar formado como el “nombre de la trayectoria” del directorio raíz al archivo.

Organización lógica.

La mayoría de las computadoras organizan los archivos en jerarquías

llamadas carpetas, directorios o catálogos. (El concepto es el mismo

independientemente de la terminología usada.) Cada carpeta puede contener un

número arbitrario de archivos, y también puede contener otras carpetas. Las otras

carpetas pueden contener todavía más archivos y carpetas, y así sucesivamente,

construyéndose un estructura en árbol en la que una «carpeta raíz» (el nombre varía

de una computadora a otra) puede contener cualquier número de niveles de otras

carpetas y archivos. A las carpetas se les puede dar nombre exactamente igual que

a los archivos (excepto para la carpeta raíz, que a menudo no tiene nombre). El uso

de carpetas hace más fácil organizar los archivos de una manera lógica.

La mayor parte de las estructuras de organizaciones alternativas de archivos se

encuentran dentro de estas cinco categorías:

Pilas

Fig. 5.2 Archivo de pilas: Registro de longitud variab le. Conjunto variab le de campos. Orden cronológico.

Es la forma más fácil de organizar un archivo. Los datos se recogen en el orden en

que llegan.

Su objetivo es simplemente acumular una masa de datos y guardarla.

Los registros pueden tener campos diferentes o similares en un orden distinto. Cada

campo debe ser autodescriptivo, incluyendo tanto un campo de nombre como el

valor. La longitud de cada campo debe indicarse implícitamente con delimitadores,

explícitamente incluidos como un sub-campo más.

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

El acceso a los registros se hace por búsquedas exhaustiva y son fáciles de

actualizar. Si se quiere encontrar un registro que contiene un campo particular y un

valor determinado, es necesario examinar cada registro de la pila hasta encontrar

el registro deseado. Si se quieren encontrar todos los registros que contienen un

campo particular o que tienen un valor determinado para ese campo, debe buscarse

el archivo entero.

Se aplica cuando los datos se recogen o almacenan antes de procesarlos o cuando

no son fáciles de organizar. Esta clase de archivo aprovecha bien el espacio cuando

los datos almacenados varían en tamaño y estructura. Fuera de estos usos

limitados, este tipo de archivos no se adapta a la mayoría de las aplicaciones.

Archivos secuenciales

Fig. 5.3 Archivo secuencial: Registro de longitud fija. Conjunto fijo de campos en orden constante. Orden

secuencial por el campo clave.

Es la forma más común de estructura de archivos.

Se emplea un formato fijo para los registros, son de la misma longitud y constan del

mismo número de campos de tamaño fijo con un orden determinado.

Se necesita almacenar los valores de cada campo; el nombre del campo y la

longitud de cada uno son atributos de la estructura del archivo. Cada registro tiene

un campo clave que lo identifica (generalmente es el primero de cada registro). Los

registros se almacenan en secuencia por la clave.

Se utilizan normalmente en aplicaciones de procesos por lotes, ya que es la única

organización de archivos que se puede guardar tanto en cintas como en discos.

Para las aplicaciones interactivas que incluyen peticiones o actualizaciones de

registros individuales, los archivos secuenciales no son óptimos. El acceso requiere

una búsqueda secuencial de correspondencias con la clave. Si el archivo entero o

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

gran parte de él pueden traerse a la memoria principal de una sola vez, se podrán

aplicar técnicas de búsquedas más eficientes. Al acceder un registro de un archivo

secuencial grande, se produce un procesamiento extra y un retardo considerable.

La organización física del archivo en una cinta o disco se corresponde exactamente

con la organización lógica del archivo, por lo tanto el procedimiento habitual es

ubicar los nuevos registros en un archivo de pila separado, es llamado archivo de

registro o archivo de transacciones.

Una alternativa es organizar físicamente el archivo secuencial como una lista

enlazada, en cada bloque físico se almacena uno o más registros y cada bloque del

disco contienen un puntero al bloque siguiente. La inserción de un nuevo registro

implica la manipulación de puntero, pero no requiere que el nuevo registro ocupe

una posición particular del bloque físico.

Archivos secuenciales indexados

Fig. 5.4 Archivo secuencial indexado.

Los registros se organizan en una secuencia basada en un campo clave

presentando dos características, un índice del archivo para soportar los accesos

aleatorios y un archivo de desbordamiento. El índice proporciona una capacidad de

búsqueda para llagar rápidamente al registro deseado y el archivo de

desbordamiento es similar al archivo de registros usado en un archivo secuencial,

pero está integrado de forma que los archivos de desbordamiento se ubiquen

siguiendo un puntero desde su registro predecesor.

La estructura más simple tiene como índice un archivo secuencial simple, cada

registro del archivo índice tiene dos campos, un campo clave igual al del archivo

principal y un puntero al archivo principal. Para encontrar un campo especifico se

busca en el índice hasta encontrar el valor mayor de la clave que es iguale o precede

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

al valor deseado de la clave, la búsqueda continua en el archivo principal a partir de

la posición que indique el puntero.

Cada registro del archivo principal tiene un campo adicional que es un puntero al

archivo de desbordamiento. Cuando se inserta un nuevo registro al archivo, también

se añade al archivo de desbordamiento. El registro del archivo principal que precede

inmediatamente al nuevo registro según la secuencia lógica se actualiza con un

puntero del registro nuevo en el archivo de desbordamiento, si el registro

inmediatamente anterior está también en el archivo de desbordamiento se

actualizará el puntero en el registro.

Para procesar secuencialmente un archivo completo los registros del archivo

principal se procesarán en secuencia hasta encontrar un puntero al archivo de

desbordamiento, el acceso continúa en el archivo de desbordamiento hasta que

encuentra un puntero nulo, entonces renueva el acceso donde se abandonó en el

archivo principal.

Archivos indexados

Fig. 5.5 Archivo indexado.

A los registros se accede solo a través de sus índices. No hay resticción en la

ubicación de los registros, al menos un índice contiene un puntero a cada registro y

pueden emplearse registros de longitud variable.

Se suelen utilizar dos tipos de índices, uno exhaustivo que contiene una entrada

para cada registro del archivo principal y se organiza como un archivo secuencial

para facilitar la búsqueda, el otro índice es parcial que contiene entrada a los

registros donde esté el campo de interés.

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

Con registro de longitud variable, algunos registros no contendrán todos los campos

y cuando se añade un registro al archivo principal, todos los archivos de índices

deben actualizarse.

Archivos directos o de dispersión

Explotan la capacidad de los discos para acceder directamente a cualquier bloque

de dirección conocida.

Se requiere un campo clave en cada registro.

Los archivos directos son muy usados donde se necesita un acceso muy rápido,

donde se usan registros de longitud fija y donde siempre se accede a los registros

de una vez.

Organización física.

Los datos son arreglados por su adyacencia física, es decir, de acuerdo con el

dispositivo de almacenamiento secundario. Los registros son de tamaño fijo o de

tamaño variable y pueden organizarse de varias formas para constituir archivos

físicos.

Cinta magnética.

Fig. 5.6 Cintas magnéticas

En este dispositivo el archivo físico está formado por un conjunto de registros físicos,

y los bloques están organizados en forma consecutiva, ya que se asigna en igual

forma.

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

Además tales registros puede contener etiquetas que permitan un mayor control

sobre los datos almacenados, y son las siguientes:

- Etiqueta de volumen.- Contiene información que permite identificar la cinta, el

nombre del propietario y cualquier información general requerida.

- Etiqueta de archivo.- Se utilizan por pares para indicar el inicio y fin del archivo,

contiene información acerca del nombre del archivo, fecha de creación.

- Etiqueta de usuario.- Sirven para guardar información adicional de importancia

para el usuario; no son procesados por el sistema operativo.

Discos Magnéticos.

Fig. 5.7 Discos magnéticos

El archivo físico en un disco es una colección de registros físicos de igual tamaño,

los cuales pueden estar organizados en forma consecutiva, ligada o con una tabla

de mapeo.

En la organización contigua, el archivo utiliza registros físicos contiguos, siguiendo

la secuencia normal de direcciones.

La organización encadenada consiste un conjunto de bloques, cada uno de los

cuales tiene un campo destinado para indicar la dirección del siguiente registro, o

sea, para lo que se ha llamado enlace o liga.

Otra forma de organización es la tabla de mapeo que consiste en una tabla de

apuntadores a los registros físicos que forman el archivo.

La organización física de un archivo en el almacenamiento secundario depende de

la estrategia de agrupación y de la estrategia de asignación de archivos.

Para elegir una organización de archivos se deben tener en cuenta ciertos criterios:

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

Si un archivo va a procesar solamente por lotes, accediendo cada vez a todos los

registros, entonces el acceso rápido para la recuperación de un único registro es

una preocupación mínima. Un archivo almacenado en CD-ROM nunca será

actualizado, por lo que la facilidad de actualización no se considera. Para

la economía de almacenamiento, debería existir una mínima redundancia de los

datos, ésta redundancia es el medio fundamental para incrementar la velocidad de

acceso a los datos.

Este tipo de organización muestra a su vez, 2 aspectos importantes: Métodos De

Asignación De Espacio Libre y Asignación De Espacio De Almacenamiento

Del Archivo.

Existen varios mecanismos para acceder los archivos: Directorios, descriptores de

archivos, mecanismos de control de acceso y procedimientos para abrir y cerrar

archivos.

Descriptores de archivos.

El descriptor de archivos o bloque de control de archivos es un bloque de control

que contiene información que el sistema necesita para administrar un archivo.

Es una estructura muy dependiente del sistema.

Puede incluir la siguiente información:

Nombre simbólico del archivo.

Localización del archivo en el almacenamiento secundario.

Organización del archivo (método de organización y acceso).

Tipo de dispositivo.

Datos de control de acceso.

Tipo (archivo de datos, programa objeto, programa fuente, etc.).

Disposición (permanente contra temporal).

Fecha y tiempo de creación.

Fecha de destrucción.

Fecha de la última modificación.

Suma de las actividades de acceso (número de lecturas, por ejemplo).

Los descriptores de archivos suelen mantenerse en el almacenamiento secundario;

se pasan al almacenamiento primario al abrir el archivo.

Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5

El descriptor de archivos es controlado por el sistema de archivos; el usuario puede

no hacer referencia directa a él.

A cada uno de los archivos se le asigna un descriptor el cual contendrá toda la

información que necesitará el sistema de archivos para ejecutar con él los

comandos que se le soliciten. El descriptor se mantendrá en memoria principal

desde que el archivo es abierto hasta que sea cerrado, y debe tener al menos la

siguiente información, identificación del archivo, lugar de almacenamiento,

información del modo de acceso.

Identificación del archivo. Consiste de dos partes que es el nombre simbólico que

es el que le da el usuario y un identificador interno que es asignado por el sistema

operativo (número). Lugar de almacenamiento así como el tamaño del archivo.

Modo de acceso. Se debe indicar en forma explícita quien puede accesar el archivo

y conque derecho.

Mecanismo de control de acceso.

Control de un sistema de información especializado en detectar los intectos de

acceso, permitiendo el paso de las entidades autorizadas, y denegando el paso a

todas las demás. Involucra medios técnicos y procedimientos operativos.

Mecanismo que en función de la identificación ya autenticada permite acceder a

datos o recursos.

Los Directorios son utilizados por el sistema operativo para llevar un registro de los

archivos que incluye el nombre, los atributos y las direcciones en disco donde se

almacenan los datos del archivo referenciado.

Open (abrir): antes de utilizar un archivo, un proceso debe abrirlo. La finalidad es

permitir que el sistema traslade los atributos y la lista de direcciones en disco a la

memoria principal para un rápido acceso en llamadas posteriores.

Close (cerrar): cuando concluyen los accesos, los atributos y direcciones del disco

ya no son necesarios, por lo que el archivo debe cerrarse y liberar la tabla de espacio

interno.

Referencias:

http://sistemasoperativos.angelfire.com/html/5.4.html

http://sistemasoperativos.angelfire.com/html/5.5.html