Tecnología RAID

download Tecnología RAID

of 29

description

Tecnología RAID 5RAID 1+0

Transcript of Tecnología RAID

Tecnologa RAID

RAID: INTRODUCCION

Debido a la rpida expansin de la informtica a nivel mundial, ms personas estn en contacto con el mundo de las computadoras y la informtica, teniendo principalmente 2 enfoques, el primero los tipos de personas que hacen uso de las computadoras a nivel personal y por el otro lado las personas que hacen uso de estas a nivel profesional. Todo ha servido para una evolucin ms rpida de los distintos componentes que integran las computadoras, es decir que cada da hay avances en esta rea, en donde cada vez se ven dispositivos nuevos con caractersticas nuevas y sobre todo con capacidades que superan a las anteriores.Partiendo de datos histricos en los que se hace referencia a que desde hace ms de 20 aos la capacidad de proceso de los procesadores ha aumentado un 40 % cada ao y en el mismo periodo de tiempo, los discos han doblado su capacidad cada ao, mientras que su costo se ha reducido a la mitad. Desgraciadamente, el aumento del rendimiento de los discos duros ha sido menos importante en comparacin con el rendimiento del sistema, ya que tan solo ha mejorado un 50 % durante los ltimos aos.En base al escenario anterior podemos observar que existe un problema con los discos duros, que son menos eficaces que el redimiendo general del sistema, provocando una descompensacin entre el tratamiento de la informacin del sistema que es muy rpida y la lectura - grabacin de datos en el disco duro que es muy lenta.Por lo anterior mencionado se propuso un sistema para guardar informacin en varios discos duros a la vez por lo que acceso se haca ms rpido ya que la carga se distribua entre los diferentes discos duros, a esto se le llamo cadenas redundantes de discos de bajo costo (RAID).Pero a la hora de saber cmo podemos optimizar nuestro RAID nos encontrbamos con algunos problemas, como puede ser el encontrar la perfecta relacin calidad precio y es ah cuando surgieron los diferentes niveles de RAID, que no son ms que combinaciones de caractersticas especiales que al combinarse generan una especificacin del RAID que se adecua a diferentes escenarios.

RAID: HISTORIA

A Norman Ouchi de IBM le fue concedida en 1978 la Patente USPTO n 4,092,732, titulada Sistema para recuperar datos almacenados en una unidad de memoria averiada (System for recovering data stored in failed memory unit), cuyas demandas describen los que ms tarde sera denominado escritura totalmente dividida (full striping). Esta patente de 1978 tambin menciona la copia espejo (mirroring o duplexing), que ms tarde sera denominada RAID 1, y la proteccin con clculo de paridad dedicado, que ms tarde sera denominada RAID 4, que eran ya arte previo en aquella poca.La tecnologa RAID fue definida por primera vez en 1987 por un grupo de informticos de la Universidad de California, Berkeley. Este grupo estudi la posibilidad de usar dos o ms discos que aparecieran como un nico dispositivo para el sistema.En 1988, los niveles RAID 1 a 5 fueron definidos formalmente por David A. Patterson, Garth A. Gibson y Randy H. Katz en el ensayo Un Caso para Conjuntos de Discos Redundantes Econmicos (RAID) A Case for Redundant Arrays of Inexpensive Disks (RAID), publicado en la Conferencia SIGMOD de 1988. El trmino RAID se us por vez primera en este ensayo, que dio origen a toda la industria de los conjuntos de discos.

RAID: Qu es?

Significa matriz redundante de discos independientes.RAID es un mtodo de combinacin de varios discos duros para formar una nica unidad lgica en la que se almacenan los datos de forma redundante. Ofrece mayor tolerancia a fallos y ms altos niveles de rendimiento que un slo disco duro o un grupo de discos duros independientes.En este mtodo, la informacin se reparte entre varios discos, usando tcnicas como el entrelazado de bloques (RAID nivel 0) o la duplicacin de discos (RAID nivel 1) para proporcionar redundancia, reducir el tiempo de acceso, y/o obtener mayor ancho de banda para leer y/o escribir, as como la posibilidad de recuperar un sistema tras la avera de uno de los discos.Un RAID, para el sistema operativo, aparenta ser un slo disco duro lgico (LUN).La tecnologa RAID protege los datos contra el fallo de una unidad de disco duro. Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta que se sustituya la unidad defectuosa.RAID ofrece varias opciones, llamadas niveles RAID, cada una de las cuales proporciona un equilibrio distinto entre tolerancia a fallos, rendimiento y coste.Todos los sistemas RAID suponen la prdida de parte de la capacidad de almacenamiento de los discos, para conseguir la redundancia o almacenar los datos de paridad.Los sistemas RAID profesionales deben incluir los elementos crticos por duplicado: fuentes de alimentacin y ventiladores redundantes y Hot Swap. De poco sirve disponer de un sistema tolerante al fallo de un disco si despus falla por ejemplo una fuente de alimentacin que provoca la cada del sistema.

RAID: INTERNO

Un sistema RAID implementado internamente, hace referencia al uso de los discos propios del servidor y su hardware especializado para el uso de RAID.

Servidor Rack: Los servidores montados en rack proporcionan espacio adicional para el crecimiento gracias a su diseo vertical.

Discos Duros del Servidor Adecuados para su uso en RAID

RAID: INTERNO

Servidor Blade:Cada servidor Blade es una delgada "tarjeta" que contiene nicamentemicroprocesador,memoriaybuses. Es decir, no son directamente utilizables ya que no disponen de fuente de alimentacin ni tarjetas de comunicaciones.

Discos Duros del Servidor Adecuados para su uso en RAID

RAID: EXTERNO

Un sistema RAID externo se basa en el uso de un STORAGE, donde se implementa el RAID por hardware que luego se conecta al servidor donde este seria de almacenamiento de datos.

RAID: SOFTWARE

Se basa en la instalacin de un Software en el sistema operativo que controlara el RAID cuyos discos podrn ser de tipo IDE o SATA. Estos ya no son transparentes para el sistema operativo, pues es l quien tiene que hacer todo el trabajo de mantener las copias de los datos, distribuirlos entre todos los discos, etc, lo que, obviamente, consume recursos del sistema como memoria y, sobre todo, CPU. Adems, es necesario que sea soportado por el sistema operativo. Hoy en da, el RAID por software est implementado en sistemas operativos profesionales, como Linux, o Windows 2000 o XP. La ventaja es su precio, pues no hacen falta controladoras especificas ni nada similar; tan slo dos o ms discos duros conectados al ordenador.

RAID: HARDWARE

En una implementacin de hardware que a travs de la BIOS. Le corresponden controlar el RAID ya que cuenta con capacidad de proceso propia y dispone de una interfaz SCSI o SATA para la conexin de los discos que conforman el array o matriz.Es el mtodo ms eficiente de implementar un sistema RAID, En este caso, el usuario compra una tarjeta RAID que conecta al bus PCI, y a esta tarjeta conecta los discos duros que desee. El ordenador simplemente ver un nico disco duro, pues todas las operaciones de copia de datos, distribucin entre discos duros y checksums son realizadas por la propia tarjeta, de forma totalmente transparente al ordenador. Incluso en sistemas profesionales con montajes en rack, los discos duros pueden ser desconectados y conectados con el sistema encendido, de forma que no hace falta parar el servidor en el caso de que uno de los discos falle. El inconveniente de esta opcin es el precio, que hace que slo se use en servidores profesionales de alto rendimiento.

RAID 0

Realiza striping de datos a nivel bloque sin informacin de paridad con una distribucin equitativa de estos entre dos o ms discos. Este nivel mejora el rendimiento pero no aporta tolerancia a fallos. En caso de avera en cualquiera de los componentes de array el sistema fallar en su totalidad.

Un RAID 0 puede ser creado con discos de diferentes tamaos, si bien el espacio de almacenamiento del conjunto estar limitado por el tamao del disco de menor capacidad.

RAID 1

Crea una copia idntica (espejo) de un conjunto de datos en dos o ms discos. En esta configuracin no se hace striping de datos, si bien consigue un alto nivel de tolerancia a fallos.Para alcanzar un mximo rendimiento se recomienda el uso de controladoras de disco duplicadas, de esta forma ser posible leer de los dos discos al mismo tiempo incrementando la tasa de transferencia de lectura al doble de la generada por un disco individual sin alterar el ratio de escritura.

Se desperdicia el 50% de la capacidad de almacenamiento del sistema haciendo que el coste por megabyte til sea mayor.

RAID 2

Este nivel no presenta ninguna ventaja relevante sobre RAID 3 y en la actualidad resulta ser el nico nivel RAID de la especificacin original que no se utiliza.Funciona con striping de datos a nivel de bit en todos los discos, dedicando algunos de estos a almacenar informacin de verificacin y correccin de errores (error checking and correcting, ECC). Los discos son sincronizados por la controladora para funcionar al unsono, generando tasas de trasferencias extremadamente altas.

La tasa de transferencia de datos puede llegar a ser extremadamente alta.

RAID 3

Es un nivel raramente utilizado.Opera con striping de datos a nivel byte y dedica un disco del array para almacenar la informacin de paridad que permitir reconstruir la informacin en caso de fallos.Toda la informacin se escribe en paralelo entre los discos del array mejorando el rendimiento del sistema gracias al incremento en la tasa de transferencia de datos que esta funcionalidad conlleva.

RAID 4

Opera con striping de datos a nivel bloque con un disco de paridad dedicado (similar a RAID 3 excepto que divide a nivel de bloque en lugar de a nivel de bytes). Ante el fallo de uno de los discos del array, podremos, a partir de la informacin de paridad, reconstruir en un disco de reserva los datos de la unidad averiada.RAID 4 puede atender varias peticiones simultneas de lectura, siempre que la controladora lo soporte, y tambin de escritura, pero en este ltimo caso al residir toda la informacin de paridad en un nico disco, ste se convertira en un cuello de botella para el sistema.

Un disco de paridad dedicado puede convertirse en un cuello de botella en escritura.

RAID 5

Por su bajo coste RAID 5 es una de las implementaciones ms populares. Utiliza striping de datos a nivel de bloque distribuyendo la informacin de paridad entre todos los discos que conforman el array. Esta combinacin proporciona un excelente rendimiento y buena tolerancia a fallos.Cuando las aplicaciones requieren muchas escrituras de tamao inferior a la divisin de datos establecida (stripe), el rendimiento ofrecido por RAID 5 no es el ptimo.

RAID 5 precisa al menos tres discos aunque las implementaciones ms habituales estn formadas por arrays con cinco unidades.

RAID 5E

El trmino RAID 5E hace referencia a la variante de RAID 5 que incorpora discos de reserva. Estos discos pueden estar en modo conectado y preparado (hot spare) o simplemente en espera (standby spare), para cubrir los fallos de cualquiera de las unidades que conforman el array. No representan mejora en el rendimiento del sistema, pero minimizan las labores de administracin cuando se producen fallos y reducen el tiempo de reconstruccin (en configuraciones con discos hot spare). Tcnicamente un disco de reserva no forma parte del array hasta que uno de los discos falla y se reconstruye la informacin sobre l.

RAID 6

Dado su coste, existen pocas implementaciones comerciales. Funciona con striping de datos a nivel de bloque con doble paridad distribuida entre todos los discos y en una posicin diferente para cada divisin (stripe), proporcionando proteccin ante fallos tanto por averas en discos como en la reconstruccin de discos.RAID 6 es ineficiente cuand o el array est formado por una cantidad pequea de discos.Las operaciones de escritura se ven penalizadas por los clculos implcitos a la doble paridad.Mayor coste que otros niveles RAID.RAID 6 no es uno de los niveles incluidos en la especificacin original de RAID.

RAID 6E

Idntico a RAID 5E pero aplicado a un array RAID 6.Es decir se trata de un RAID 6 que incluye discos de reserva en modo hot spare o standby spare.

Se suele llamar RAID 6E a los que incluyendiscos de reserva. Estos discos pueden estar conectados y preparados (hot spare) o en espera (standby spare). En los RAID 6E, los discos de reserva estn disponibles para cualquiera de las unidades miembro. No suponen mejora alguna del rendimiento, pero s se minimiza el tiempo de reconstruccin (en el caso de los discoshot spare) y las labores de administracin cuando se producen fallos.

Un disco de reserva no es realmente parte del conjunto hasta que un disco falla y el conjunto se reconstruye sobre el de reserva.

RAID: NIVELES ANINADOS

Muchas controladoras permiten combinar niveles RAID, es decir, que un RAID pueda usarse como elemento bsico de otro en lugar de discos fsicos. La nomenclatura de los RAID anidados es normalmente el resultado de la unin de los nmeros correspondientes a los niveles RAID usados. Por ejemplo, RAID 01 es el resultado de combinar RAID 0 con RAID 1 (en este caso se suele utilizar la nomenclatura RAID 0+1 para evitar confusiones con RAID 1). Conceptualmente consiste en mltiples arrays de nivel 0 con un nivel 1 encima que agrupa dichos niveles 0 (ver imagen ms abajo).

Como puede deducirse anidar niveles RAID tiene por objetivo combinar un determinado nivel RAID que proporcione redundancia con otro que aumente el rendimiento del sistema, y la prioridad que le demos a dichas funcionalidades determinar cul de los dos ser el de mayor nivel.

Los niveles RAID anidados ms conocidos son:

RAID 01 (0+1): Un espejo de divisiones (Stripes). RAID 10: Una divisin de espejos. RAID 30: Una divisin de niveles RAID con paridad dedicada. RAID 50: Una divisin de niveles RAID con paridad distribuida. RAID 60: Una divisin de niveles RAID con doble paridad distribuida. RAID 100: Una divisin de una divisin de espejos. RAID 101: Un Espejo de espejos.

RAID 10 (1+0)

Primero se crea un espejo RAID 1 y luego, sobre los anteriores, se establece un RAID 0. El resultado es un array dotado de redundancia con una mejora de rendimiento al no precisar escritura de paridad.Para que no se pierdan datos cada RAID 1 deber mantener al menos uno de sus discos sin fallos.En cada divisin RAID 1 pueden fallar todos los discos salvo uno sin que se pierdan datos. Sin embargo, si los discos que han fallado no se reemplazan, el restante pasa a ser un punto nico de fallo para todo el conjunto. Si ese disco falla entonces, se perdern todos los datos del conjunto completo. Como en el caso del RAID 0+1, si un disco que ha fallado no se reemplaza, entonces un solo error de medio irrecuperable que ocurra en el disco espejado resultara en prdida de datos.Debido a estos mayores riesgos del RAID 1+0, muchos entornos empresariales crticos estn empezando a evaluar configuraciones RAID ms tolerantes a fallos que aaden un mecanismo de paridad subyacente. Entre los ms prometedores estn los enfoques hbridos como el RAID 0+1+5 (espejo sobre paridad nica) o RAID 0+1+6 (espejo sobre paridad dual). El RAID 10 es a menudo la mejor eleccin para bases de datos de altas prestaciones, debido a que la ausencia de clculos de paridad proporciona mayor velocidad de escritura.

RAID: PROPIETARIOS

En general las implementaciones de RAID realizadas por cada fabricante presenta algunas particularidades sobre la especificacin original, sin embargo algunas compaas han desarrollado soluciones RAID totalmente propietarias.

Entre ellas mencionar:

RAID 1.5: Desarrollado por HighPoint. RAID 50EE: Desarrollado por Himperia. RAID 7: Desarrollado por Storage Computer Corporation. RAID S (Parity RAID): Desarrollado por EMC Corporation. RAID Z: Desarrollado por Sun Microsystem. SERVER RAID: Desarrollado por IBM.

RAID: DISCO

Utilizar discos rpidos para montar un RAID no suele estar justificado. Son mucho ms caros. Los discos rpidos suelen serlo debido a una mayor agilidad de las cabezas para posicionarse en la pista necesaria. Los cambios de pista es la operacin que ms tiempo consume en un disco duro, pero a diferencia por ejemplo de MSDOS en Linux estn optimizadas de manera que la informacin no se accede en el mismo orden que es solicitada sino que se comporta de manera similar a un ascensor inteligente que va memorizando las peticiones y las va atendiendo por el orden ms conveniente. Tambin se usan otrasestrategiasque aumentan el rendimiento minimizando el nmero de accesos a disco, comomemoriascache. La velocidad de giro de los discos suele ser muy parecida pero puede haber diferencias en cuanto a densidad y nmero de cabezas que afectaran significativamente a la velocidad de transferencia. Este parmetro s que interesa tenerlo en cuenta. Por todo esto la recomendacin sera usar preferiblemente discos SCSI iguales o similares y baratos. La velocidad vendr por el acceso concurrente a los mismos.

RAID: VENTAJAS Y DESVENTAJAS

RAID 0RAID 1RAID 2RAID 3

Discos2 Discos2 Discos3 Discos3 Discos

VentajasPermite el acceso a ms de un disco a la vez, logrando una tasa de transferencia ms elevada.Proteccin de la informacin en caso de fallos del disco y/o de la controladora.Buena proteccin de la informacin en caso de fallos del disco.Elevada tasa de transferencia de datos tanto de lectura como de escritura con alta disponibilidad del array.

DesventajasNo se dispone de informacin de paridad y por tanto no ofrece funcionalidad de tolerancia a fallos.Ineficiencia debido a las tareas de escritura en el disco espejo.Elevado coste. Segn el tipo de configuracin requiere un gran nmero de discos.No ofrece solucin al fallo simultneo de dos discos.

RAID 4RAID 5RAID 6RAID 10

Discos3 Discos3 Discos4 Discos4 Discos

VentajasAlta disponibilidad del array con elevada tasa de transferencia de datos.Proporciona un buen rendimiento con mnima prdida de capacidad de almacenamiento.Tolerancia a fallos extremadamente alta.Combina el rendimiento de lectura de RAID 0 con la tolerancia a fallos de RAID 1.

DesventajasLa controladora requerida es compleja y por lo tanto costosa.Menores prestaciones que en RAID 1. No ofrece solucin al fallo simultneo en dos discos.Utiliza el equivalente a dos unidades de disco para funciones de paridad por lo que el coste por megabyte til es mayor.Pierdes la mitad de capacidad aunque es la ms resistente a fallos. No ofrece ningn tipo de proteccin frente a fallos. Si slo un disco cae se perder la informacin.

RAID: CUAL USAR?

El nivel RAID determina la tolerancia a fallos proporcionada por el sistema, el rendimiento en cuanto a tasa de transferencia de datos, y por ltimo la forma de distribucin de datos entre los discos que conforman el array.El nivel adecuado de RAID a utilizar depende de bsicamente de dos factores: Las aplicaciones que vayamos a utilizar. La inversin que estemos dispuestos a realizar.Cada aplicacin presenta unos requerimientos concretos en cuanto a rendimiento y tolerancia a fallos. En funcin de la importancia que tenga cada uno de estos podremos determinar el nivel RAID ms idneo.Sea cual sea nuestra situacin de forma generalista podemos decir que:

RAID 0: Presenta la ms alta tasa de transferencia pero sin tolerancia a fallos. Resulta especialmente apropiado para aplicaciones que requieran operaciones secuenciales con ficheros de gran tamao donde el rendimiento sea ms importante que la seguridad de los datos (p.ej. servidores de BBDD, vdeo, imgenes, CAD/CAM,).

RAID 1: Resulta ms lento que un disco individual si bien aporta redundancia total. Est diseado para entornos donde el rendimiento de lectura o la disponibilidad de la informacin han de ser altos, y donde la recuperacin de datos no es asumible o resulta muy costosa (p.ej. aplicaciones financieras o de gestin,).

RAID 2: Es adecuado para aplicaciones que demanden una altsima tasa de transferencia de datos, no siendo la opcin idnea para aquellas que precisen una elevada tasa de I/O (no existen implementaciones comerciales de este nivel de RAID).

RAID 3: Especialmente indicado para sistemas mono-usuario y aplicaciones que requieran transferencia de archivos de datos de un gran tamao (vdeo, imgenes, data warehouse,). En la actualidad raramente se utiliza.

RAID: CUAL USAR?

RAID 4: Idneo para almacenar !chero de gran tamao (p.ej. aplicaciones grficas).

RAID 5: Es recomendable para entornos de procesamiento de transacciones donde el nivel de entrada/salida y de lectura/escritura resultan intensos (p.ej. video vigilancia, servidor de aplicaciones y/o archivo para empresas).

RAID 6: Diseado para entornos donde la disponibilidad de la informacin es extremadamente crtica y prevalece sobre cualquier otro aspecto. Es similar a RAID 5 pero con mayor nivel de tolerancia a fallos (p.ej. cualquier aplicacin de las denominadas de misin crtica).

RAID 10: Pensado para entornos que requieran alto rendimiento y tolerancia a fallos (p.ej. servidores de bases de datos).

RAID 50: Presenta una mayor tolerancia a fallos que RAID 5 a la vez que mantiene la tasa de transferencia de ste (p.ej. aplicaciones de misin crtica con alto requerimiento y tolerancia a fallos).

RAID 60: Aporta un rendimiento de RAID 6 pero con mayor tolerancia a fallos. En trminos de rendimiento global resulta ligeramente inferior a RAID 50 siendo este hecho despreciable cuando lo prioritario es la seguridad y proteccin de los datos (p.ej. cualquier aplicacin que requiera mxima tolerancia a fallos).

RAID: SEGERENCIAS

Use dos unidades nuevas si est creando un RAID 0 de rendimiento. Se recomienda que use dos unidades SATA del mismo tamao. Si usa dos unidades de distintos tamaos, la capacidad del disco duro ms pequeo ser el almacenamiento base para cada unidad. Por ejemplo, si un disco duro tiene una capacidad de almacenamiento de 80GB y el otro disco duro tiene 60GB, la capacidad mxima de almacenamiento del disco de 80GB ser de 60GB, y el almacenamiento total del conjunto RAID 0 ser de 120GB.

Puede utilizar dos unidades nuevas o utilizar una unidad ya existente y una unidad nuevo si est creando una serie RAID 1 (reflexin) para la proteccin (la unidad nueva debe ser del mismo tamao o mayor que la unidad existente). Si utiliza dos unidades de distintos tamaos, el disco duro de menor capacidad ser el tamao base de almacenamiento. Por ejemplo, si uno de los discos duro tiene una capacidad de almacenamiento de 80 GB y el otro disco duro tiene 60 GB, la capacidad mxima de almacenamiento para la RAID 1 se establece en 60GB.

Verifique el estado de sus discos duros antes de configurar su nueva serie RAID.

RAID: CONCLUSIONES

En base a lo anteriormente expuesto se concluye lo siguiente: Que los sistemas RAID, fueron definidos por primera vez en el ao 1987 por un grupo de informticos de la universidad de California, Berkeley, en donde se estudi la posibilidad de usar dos o ms discos que funcionarn como un nico dispositivo para el sistema.

Que un Nivel 5 de RAID implementa la divisin de datos a nivel de bloques, distribuyendo la informacin de paridad entre todos los miembros del conjunto de discos.

Que para que pueda ser implementado un nivel 5 de RAID es requerimiento tener como mnimo 3 discos duros y que tericamente no tiene un valor mximo.

Que se ha expuesto la configuracin de manera exitosa de un sistema de RAID nivel 5, bajo un sistema operativo Linux, con la caracterstica especial de que todo el proceso se ha documentado para que pueda ser una herramienta valiosa para la implementacin de este sistema de discos.

RAID: BIBLIOGRAFIA

La seccin conceptual de este documento fue investigada bajo las siguientes fuentes bibliogrficas.

Sitios Virtuales Consultados:

http://es.wikipedia.org/wiki/RAID http://www.mastermagazine.info/termino/6464.php http://www.agalisa.es/article64.html

21