La organización lógica y física de los sistemas de archivo y sus mecanismos de acceso de archivo
-
Upload
mani-villa -
Category
Engineering
-
view
54 -
download
0
Transcript of La organización lógica y física de los sistemas de archivo y sus mecanismos de acceso de archivo
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
INSTITUTO TECNOLÓGICO SUPERIOR DE COATZACOALCOS
I.S.C. Aurora Moreno Rodríguez
Gómez Serrano José Roberto
Sistemas operativos
Ingeniería Informática
4to Semestre
Grupo “A”
5ta. Unidad
Investigación
“La organización lógica y física de los sistemas de archivo y sus
mecanismos de acceso de archivo”
Vo. Bo.
__________________________
Abril del 2016
Feb 2016 – Jun 2016
Coatzacoalcos, Veracruz.
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
La organización lógica y física de los sistemas de archivo y sus
mecanismos de acceso de archivo.
Se refiere a las diferentes maneras en las que puede ser organizada la información
de los archivos, así como las diferentes maneras en que ésta puede ser accesada.
Dado que hay 2 niveles de visión de los archivos (físico y lógico), se puede hablar
también de 2 aspectos de organización de archivos: Organización de archivos
lógicos y de archivos físicos.
El sistema de archivos está relacionado especialmente con la administración del
espacio de almacenamiento secundario, fundamentalmente con el almacenamiento
de disco.
Una forma de organización de un sistema de archivos puede ser la siguiente:
Se utiliza una “raíz ” para indicar en qué parte del disco comienza
el “directorio raíz ” .
El “directorio raíz ” apunta a los “directorios de usuarios”.
Un “directorio de usuario” contiene una entrada para cada uno de los
archivos del usuario.
Cada entrada de archivo apunta al lugar del disco donde está almacenado el
archivo referenciado.
Esta forma de organización se muestra en la Fig. 5.1.
Fig. 5.1Organización de un sistema de
archivos utilizando directorios.
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
Los nombres de archivos solo necesitan ser únicos dentro de un directorio de
usuario dado.El nombre del sistema para un archivo dado debe ser único para el
sistema de archivos.
En sistemas de archivo “jerárquicos” el nombre del sistema para un archivo suele
estar formado como el “nombre de la trayectoria” del directorio raíz al archivo.
Organización lógica.
La mayoría de las computadoras organizan los archivos en jerarquías
llamadas carpetas, directorios o catálogos. (El concepto es el mismo
independientemente de la terminología usada.) Cada carpeta puede contener un
número arbitrario de archivos, y también puede contener otras carpetas. Las otras
carpetas pueden contener todavía más archivos y carpetas, y así sucesivamente,
construyéndose un estructura en árbol en la que una «carpeta raíz» (el nombre varía
de una computadora a otra) puede contener cualquier número de niveles de otras
carpetas y archivos. A las carpetas se les puede dar nombre exactamente igual que
a los archivos (excepto para la carpeta raíz, que a menudo no tiene nombre). El uso
de carpetas hace más fácil organizar los archivos de una manera lógica.
La mayor parte de las estructuras de organizaciones alternativas de archivos se
encuentran dentro de estas cinco categorías:
Pilas
Fig. 5.2 Archivo de pilas: Registro de longitud variab le. Conjunto variab le de campos. Orden cronológico.
Es la forma más fácil de organizar un archivo. Los datos se recogen en el orden en
que llegan.
Su objetivo es simplemente acumular una masa de datos y guardarla.
Los registros pueden tener campos diferentes o similares en un orden distinto. Cada
campo debe ser autodescriptivo, incluyendo tanto un campo de nombre como el
valor. La longitud de cada campo debe indicarse implícitamente con delimitadores,
explícitamente incluidos como un sub-campo más.
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
El acceso a los registros se hace por búsquedas exhaustiva y son fáciles de
actualizar. Si se quiere encontrar un registro que contiene un campo particular y un
valor determinado, es necesario examinar cada registro de la pila hasta encontrar
el registro deseado. Si se quieren encontrar todos los registros que contienen un
campo particular o que tienen un valor determinado para ese campo, debe buscarse
el archivo entero.
Se aplica cuando los datos se recogen o almacenan antes de procesarlos o cuando
no son fáciles de organizar. Esta clase de archivo aprovecha bien el espacio cuando
los datos almacenados varían en tamaño y estructura. Fuera de estos usos
limitados, este tipo de archivos no se adapta a la mayoría de las aplicaciones.
Archivos secuenciales
Fig. 5.3 Archivo secuencial: Registro de longitud fija. Conjunto fijo de campos en orden constante. Orden
secuencial por el campo clave.
Es la forma más común de estructura de archivos.
Se emplea un formato fijo para los registros, son de la misma longitud y constan del
mismo número de campos de tamaño fijo con un orden determinado.
Se necesita almacenar los valores de cada campo; el nombre del campo y la
longitud de cada uno son atributos de la estructura del archivo. Cada registro tiene
un campo clave que lo identifica (generalmente es el primero de cada registro). Los
registros se almacenan en secuencia por la clave.
Se utilizan normalmente en aplicaciones de procesos por lotes, ya que es la única
organización de archivos que se puede guardar tanto en cintas como en discos.
Para las aplicaciones interactivas que incluyen peticiones o actualizaciones de
registros individuales, los archivos secuenciales no son óptimos. El acceso requiere
una búsqueda secuencial de correspondencias con la clave. Si el archivo entero o
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
gran parte de él pueden traerse a la memoria principal de una sola vez, se podrán
aplicar técnicas de búsquedas más eficientes. Al acceder un registro de un archivo
secuencial grande, se produce un procesamiento extra y un retardo considerable.
La organización física del archivo en una cinta o disco se corresponde exactamente
con la organización lógica del archivo, por lo tanto el procedimiento habitual es
ubicar los nuevos registros en un archivo de pila separado, es llamado archivo de
registro o archivo de transacciones.
Una alternativa es organizar físicamente el archivo secuencial como una lista
enlazada, en cada bloque físico se almacena uno o más registros y cada bloque del
disco contienen un puntero al bloque siguiente. La inserción de un nuevo registro
implica la manipulación de puntero, pero no requiere que el nuevo registro ocupe
una posición particular del bloque físico.
Archivos secuenciales indexados
Fig. 5.4 Archivo secuencial indexado.
Los registros se organizan en una secuencia basada en un campo clave
presentando dos características, un índice del archivo para soportar los accesos
aleatorios y un archivo de desbordamiento. El índice proporciona una capacidad de
búsqueda para llagar rápidamente al registro deseado y el archivo de
desbordamiento es similar al archivo de registros usado en un archivo secuencial,
pero está integrado de forma que los archivos de desbordamiento se ubiquen
siguiendo un puntero desde su registro predecesor.
La estructura más simple tiene como índice un archivo secuencial simple, cada
registro del archivo índice tiene dos campos, un campo clave igual al del archivo
principal y un puntero al archivo principal. Para encontrar un campo especifico se
busca en el índice hasta encontrar el valor mayor de la clave que es iguale o precede
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
al valor deseado de la clave, la búsqueda continua en el archivo principal a partir de
la posición que indique el puntero.
Cada registro del archivo principal tiene un campo adicional que es un puntero al
archivo de desbordamiento. Cuando se inserta un nuevo registro al archivo, también
se añade al archivo de desbordamiento. El registro del archivo principal que precede
inmediatamente al nuevo registro según la secuencia lógica se actualiza con un
puntero del registro nuevo en el archivo de desbordamiento, si el registro
inmediatamente anterior está también en el archivo de desbordamiento se
actualizará el puntero en el registro.
Para procesar secuencialmente un archivo completo los registros del archivo
principal se procesarán en secuencia hasta encontrar un puntero al archivo de
desbordamiento, el acceso continúa en el archivo de desbordamiento hasta que
encuentra un puntero nulo, entonces renueva el acceso donde se abandonó en el
archivo principal.
Archivos indexados
Fig. 5.5 Archivo indexado.
A los registros se accede solo a través de sus índices. No hay resticción en la
ubicación de los registros, al menos un índice contiene un puntero a cada registro y
pueden emplearse registros de longitud variable.
Se suelen utilizar dos tipos de índices, uno exhaustivo que contiene una entrada
para cada registro del archivo principal y se organiza como un archivo secuencial
para facilitar la búsqueda, el otro índice es parcial que contiene entrada a los
registros donde esté el campo de interés.
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
Con registro de longitud variable, algunos registros no contendrán todos los campos
y cuando se añade un registro al archivo principal, todos los archivos de índices
deben actualizarse.
Archivos directos o de dispersión
Explotan la capacidad de los discos para acceder directamente a cualquier bloque
de dirección conocida.
Se requiere un campo clave en cada registro.
Los archivos directos son muy usados donde se necesita un acceso muy rápido,
donde se usan registros de longitud fija y donde siempre se accede a los registros
de una vez.
Organización física.
Los datos son arreglados por su adyacencia física, es decir, de acuerdo con el
dispositivo de almacenamiento secundario. Los registros son de tamaño fijo o de
tamaño variable y pueden organizarse de varias formas para constituir archivos
físicos.
Cinta magnética.
Fig. 5.6 Cintas magnéticas
En este dispositivo el archivo físico está formado por un conjunto de registros físicos,
y los bloques están organizados en forma consecutiva, ya que se asigna en igual
forma.
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
Además tales registros puede contener etiquetas que permitan un mayor control
sobre los datos almacenados, y son las siguientes:
- Etiqueta de volumen.- Contiene información que permite identificar la cinta, el
nombre del propietario y cualquier información general requerida.
- Etiqueta de archivo.- Se utilizan por pares para indicar el inicio y fin del archivo,
contiene información acerca del nombre del archivo, fecha de creación.
- Etiqueta de usuario.- Sirven para guardar información adicional de importancia
para el usuario; no son procesados por el sistema operativo.
Discos Magnéticos.
Fig. 5.7 Discos magnéticos
El archivo físico en un disco es una colección de registros físicos de igual tamaño,
los cuales pueden estar organizados en forma consecutiva, ligada o con una tabla
de mapeo.
En la organización contigua, el archivo utiliza registros físicos contiguos, siguiendo
la secuencia normal de direcciones.
La organización encadenada consiste un conjunto de bloques, cada uno de los
cuales tiene un campo destinado para indicar la dirección del siguiente registro, o
sea, para lo que se ha llamado enlace o liga.
Otra forma de organización es la tabla de mapeo que consiste en una tabla de
apuntadores a los registros físicos que forman el archivo.
La organización física de un archivo en el almacenamiento secundario depende de
la estrategia de agrupación y de la estrategia de asignación de archivos.
Para elegir una organización de archivos se deben tener en cuenta ciertos criterios:
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
Si un archivo va a procesar solamente por lotes, accediendo cada vez a todos los
registros, entonces el acceso rápido para la recuperación de un único registro es
una preocupación mínima. Un archivo almacenado en CD-ROM nunca será
actualizado, por lo que la facilidad de actualización no se considera. Para
la economía de almacenamiento, debería existir una mínima redundancia de los
datos, ésta redundancia es el medio fundamental para incrementar la velocidad de
acceso a los datos.
Este tipo de organización muestra a su vez, 2 aspectos importantes: Métodos De
Asignación De Espacio Libre y Asignación De Espacio De Almacenamiento
Del Archivo.
Existen varios mecanismos para acceder los archivos: Directorios, descriptores de
archivos, mecanismos de control de acceso y procedimientos para abrir y cerrar
archivos.
Descriptores de archivos.
El descriptor de archivos o bloque de control de archivos es un bloque de control
que contiene información que el sistema necesita para administrar un archivo.
Es una estructura muy dependiente del sistema.
Puede incluir la siguiente información:
Nombre simbólico del archivo.
Localización del archivo en el almacenamiento secundario.
Organización del archivo (método de organización y acceso).
Tipo de dispositivo.
Datos de control de acceso.
Tipo (archivo de datos, programa objeto, programa fuente, etc.).
Disposición (permanente contra temporal).
Fecha y tiempo de creación.
Fecha de destrucción.
Fecha de la última modificación.
Suma de las actividades de acceso (número de lecturas, por ejemplo).
Los descriptores de archivos suelen mantenerse en el almacenamiento secundario;
se pasan al almacenamiento primario al abrir el archivo.
Gómez Serrano José Roberto 4 “A” ing. informática Unidad 5
El descriptor de archivos es controlado por el sistema de archivos; el usuario puede
no hacer referencia directa a él.
A cada uno de los archivos se le asigna un descriptor el cual contendrá toda la
información que necesitará el sistema de archivos para ejecutar con él los
comandos que se le soliciten. El descriptor se mantendrá en memoria principal
desde que el archivo es abierto hasta que sea cerrado, y debe tener al menos la
siguiente información, identificación del archivo, lugar de almacenamiento,
información del modo de acceso.
Identificación del archivo. Consiste de dos partes que es el nombre simbólico que
es el que le da el usuario y un identificador interno que es asignado por el sistema
operativo (número). Lugar de almacenamiento así como el tamaño del archivo.
Modo de acceso. Se debe indicar en forma explícita quien puede accesar el archivo
y conque derecho.
Mecanismo de control de acceso.
Control de un sistema de información especializado en detectar los intectos de
acceso, permitiendo el paso de las entidades autorizadas, y denegando el paso a
todas las demás. Involucra medios técnicos y procedimientos operativos.
Mecanismo que en función de la identificación ya autenticada permite acceder a
datos o recursos.
Los Directorios son utilizados por el sistema operativo para llevar un registro de los
archivos que incluye el nombre, los atributos y las direcciones en disco donde se
almacenan los datos del archivo referenciado.
Open (abrir): antes de utilizar un archivo, un proceso debe abrirlo. La finalidad es
permitir que el sistema traslade los atributos y la lista de direcciones en disco a la
memoria principal para un rápido acceso en llamadas posteriores.
Close (cerrar): cuando concluyen los accesos, los atributos y direcciones del disco
ya no son necesarios, por lo que el archivo debe cerrarse y liberar la tabla de espacio
interno.
Referencias:
http://sistemasoperativos.angelfire.com/html/5.4.html
http://sistemasoperativos.angelfire.com/html/5.5.html