DRP Exchange

download DRP Exchange

of 66

Transcript of DRP Exchange

Disaster recovery PCorp para servicios Microsoft

V1.3

Contenido1 Objetivos y Alcances .............................................................................................................................. 4

2

3

4

5

6

1.1 Objetivos del documento ......................................................................................................................................4 1.2 Resumen del documento .......................................................................................................................................4 1.3 Nomenclaturas.......................................................................................................................................................5 1.4 Nombres de Servidores parte del pCorp ...............................................................................................................5 Anlisis de amenazas y Caractersticas de CORP ................................................................................... 5 2.1 Clculo de riesgo ....................................................................................................................................................5 2.2 Anlisis de amenazas en Corp................................................................................................................................5 2.3 Resultado de este Anlisis .....................................................................................................................................6 2.4 Diagrama general de la Infraestructura .................................................................................................................7 2.5 Dependencias entre los sub-sistemas....................................................................................................................7 2.6 Niveles de disponibilidad estimados......................................................................................................................7 Diagnostico y Tareas mitigadoras de primer nivel ................................................................................ 8 3.1 Diagnosticar falla ...................................................................................................................................................8 3.2 Mitigacin de primer nivel en AD y servicios relacionados ...................................................................................8 3.3 Identificar y solucionar contingencia primer nivel en Exchange ...........................................................................9 Procedimientos genricos para DRP ................................................................................................... 10 4.1 Falla de servidor Exchange...................................................................................................................................10 4.2 Restaurar la configuracin del sistema Operativo ...............................................................................................10 4.3 Recuperar la configuracin de un servidor Exchange ..........................................................................................10 4.4 Recuperar servidor como Dial Tone ....................................................................................................................11 4.5 Incrementar el nivel de diagnostico ....................................................................................................................11 4.6 Problemas de inicio System Attendant ................................................................................................................12 4.7 Recuperacin de Cluster ......................................................................................................................................12 4.7.1 Identificacin del origen del error ..................................................................................................................12 4.7.2 Sustituir Nodo Daado ....................................................................................................................................13 4.8 Recuperacin de recursos de disco en cluster .....................................................................................................14 4.8.1 Cambio de firma de discos Cluster ..................................................................................................................14 4.8.2 Restauracin de una base de datos en un clster ..........................................................................................15 4.8.3 Restauracin de un recurso de disco de qurum ...........................................................................................15 4.8.4 Cambiar disco Quorum ...................................................................................................................................15 4.8.5 Cambiar de discos en Cluster (no Quorum) ....................................................................................................15 4.9 Perdida de datos en Base ....................................................................................................................................15 4.10 Recuperacin de base de Datos ...........................................................................................................................16 4.11 Recuperar un Domain Controller .........................................................................................................................17 4.11.1 Restauracin Non Authoritative. .............................................................................................................17 4.11.2 Restauracin Authoritative Active Directory .............................................................................................17 4.11.3 Restauracin Active Directory en un Hardware diferente. ........................................................................18 4.12 Configurar alertas para acceso a archivos sin autorizacin y de intentos de inicio de sesin .............................19 DRP de Exchange ................................................................................................................................. 20 5.1 Falla de servidor Exchange...................................................................................................................................20 5.1.1 Recuperar servidor de Exchange .....................................................................................................................20 5.1.2 Recuperar Servidor Cluster .............................................................................................................................21 5.2 Falla servicio en Exchange ...................................................................................................................................21 5.3 Exchange no encuentra AD o parte de l ............................................................................................................22 5.3.1 No encuentra servidores DC ...........................................................................................................................22 5.3.2 No est disponible AD completa o parcialmente ............................................................................................22 5.3.3 Falla de Base de Datos ....................................................................................................................................22 5.3.4 Recuperacin de algunos Buzones ..................................................................................................................23 5.3.5 Restauracin de Buzn que ha sido Borrado de Exchange. ............................................................................25 5.4 Failover de servicio Cluster ..................................................................................................................................26 5.4.1 Fail-over de Cluster Exchange .........................................................................................................................26 5.4.2 Fail-back al servidor Original ...........................................................................................................................26 DRP de AD ........................................................................................................................................... 27

2

6.1 Recuperacin de base de Datos de Active Directory ...........................................................................................27 6.1.1 Corrupcin total de Active Directory ..............................................................................................................27 6.1.2 Perdida de datos de Active Directory .............................................................................................................27 6.2 Domain controller con roles FSMO falla ..............................................................................................................28 6.3 Prepare a Domain Controller for Non-Authoritative SYSVOL Restore .................................................................29 7 DRP de DNS y DHCP ............................................................................................................................. 30 7.1 Verificar estado general de DNS server ...............................................................................................................30 7.2 Servicio DNS no inicia ..........................................................................................................................................30 7.3 Falla General de DNS Active Directory .................................................................................................................30 7.4 Perdida o corrupcin de zona DNS ......................................................................................................................31 7.5 Falla de un servidor DHCP ....................................................................................................................................31 7.6 Cliente no obtiene DHCP IP address ....................................................................................................................32 8 Actualizaciones propuestas al pCorp actual ........................................................................................ 33 8.1 Mejorar Servicio DNS ...........................................................................................................................................33 8.2 Mantener Servicio WINS ......................................................................................................................................37 8.3 Mejorar tolerancia a fallas de DHCP ....................................................................................................................38 8.4 Asegurar y optimizar objetos AD .........................................................................................................................40 8.4.1 Configurar fuente de tiempo a la jerarqua de dominio .................................................................................40 8.4.2 Limpiar estructura de Polticas de dominio (GPO) ..........................................................................................40 8.4.3 Fijar y/o Eliminar objetos hurfanos de Active directory ...............................................................................41 8.5 Revisin de AV y excusiones ................................................................................................................................41 8.5.1 Exclusiones de directorios ...............................................................................................................................42 8.5.2 Exclusiones de procesos ..................................................................................................................................42 8.5.3 Exclusiones de extensiones de nombres de archivo .......................................................................................42 8.5.4 Exclusiones actuales ........................................................................................................................................43 8.5.5 Revisar Dsaccess Exchange .............................................................................................................................43 8.5.6 Performance de Domain Controller, opcin con 64 bits .................................................................................43 8.6 Cambiar Plataforma fsica a Vmware ...................................................................................................................44 8.7 Incorporar alternativa Exchange 2010 .................................................................................................................45 8.7.1 Funcionalidades de Exchange 2010 ................................................................................................................45 8.7.2 Alta disponibilidad en Exchange Server 2010 .................................................................................................45 8.7.3 Requerimientos de directorio para Exchange 2010 ........................................................................................46 8.7.4 Diseo Fsico de Exchange Server 2010 ..........................................................................................................47 8.7.5 Consideraciones de Almacenamiento .............................................................................................................47 8.7.6 Requisitos para alta disponibilidad y resistencia de sitios ..............................................................................47 8.7.7 Coexistencia con otras plataformas ................................................................................................................49 8.8 Mejorar el soporte a fallas completas de Datacenter .........................................................................................50 8.8.1 PCorpificacin general de resistencia de sitios ...............................................................................................50 9 Probar pCorp de contingencia ............................................................................................................. 51 9.1 Checklist Configuracin y Pruebas de Dominio ...................................................................................................51 9.2 Checklist Pruebas Servicio Outlook......................................................................................................................52 9.3 Checklist Pruebas de Operacin Plataforma AD/Exchange .................................................................................52 9.4 Checklist Pruebas de Operacin - Clientes de Correo .........................................................................................53 9.5 Checklist Pruebas de Operacin - Disponibilidad del servicio .............................................................................53 9.6 Pruebas Alta Disponibilidad Exchange .................................................................................................................53 10 Anexos ................................................................................................................................................. 55 10.1 Procedimientos disponibles en Internet para Active Directory ...........................................................................55 10.2 Procedimientos disponibles en Internet para Exchange Server ..........................................................................57

3

1 Objetivos y Alcances1.1 Objetivos del documentoEl objetivo del documento es mejorar el proceso existente de recuperacin a desastres de la plataforma de Microsoft instalada en la infraestructura de Corporacin, principalmente orientado a los servicios crticos tales como mensajera, directorio y servicios de apoyo a redes tales como DNS y DHCP. Muchos tipos de errores pueden implicar la reparacin o restauracin de una o varias partes del sistema. En este documento se intenta definir una estrategia para prepararse y responder ante la eventualidad que se presenten.

1.2 Resumen del documentoAl preparar un pCorp de recuperacin a desastres para la plataforma Microsoft en Corporacin, debemos tener en cuenta muchos factores, y dentro de estos, se incluyen principalmente los siguientes: Productos utilizados Dimensin de la plataforma Fallas que ya se han presentado Visin futura de los requerimientos y el negocio Con estos podemos definir un rea, donde generar un marco de soluciones y alternativas que se pueden considerar en caso de alguna contingencia, ya que las posibilidades son mltiples y siempre habr algo que quede fuera de lo considerado. Basndonos en nuestra experiencia acerca de fallas ms recurrentes se pueden tener un conjunto de situaciones que hay que considerar inicialmente e ir agregando en el futuro otros issues y soluciones a contingencias, ya sea se hayan presentado o se visualicen como posibles. La siguiente lista corresponde a las situaciones que son recurrentes y que requieren un pCorp para abordarlas cuando se produzcan: Para Exchange Falla servidor Exchange o Recuperar servidor de Exchange o Recuperar Servidor Cluster Falla servicio en Exchange Exchange no encuentra AD o No encuentra servidores DC o Corrupcin de Base de datos AD Perdida de datos en Base o Falla completa de Base de Datos o Recuperacin de algunos Buzones Items FailOver de Cluster Para AD Domain Controller falla Domain controller con roles FSMO falla Borrado/corrupcin de Datos parciales de dominio Borrado de un objeto en AD Para DNS Falla de DNS Corrupcin de DNS en AD Para DHCP Falla de un servidor DHCP Cliente no obtiene DHCP IP address

4

1.3 NomenclaturasEste documento cuenta con muchas abreviaciones y siglas propias de la tecnologa utilizada, las ms frecuentemente usadas en este documento son las siguientes: Acrnimo DetalleAD DC GC MBX OWA VMware ESM ADUC Windows Active Directory ServidorDomain Controller Servidor Catlogo Global Servidor Mailbox, BridgeHead y Public Folder Servidor Outlook Web Access Servicio de virtualizacin VMWare Consola Exchange System Manager (Exch 2003) Consola Active Directory Users and Computers

1.1 Nombres de Servidores parte del planEstos servidores tendrn cambios en el software y hardware, por lo cual estas funciones pasarn a ser atendida por un nuevo servidor, los cuales se identificaran ahora con estos nombres:ServidorDC1 DC2 DC3 DC6 DC7

Domain IP192.168.1.51 192.168.1.53 192.168.1.49 192.168.1.52 192.168.1.204

Controllers RolDC DC DC DC DC HOLDING HOLDING HOLDING HOLDING HOLDING

UbicacinSantiago Santiago Santiago Santiago Santiago

ServidorBH01 BH03 BH05 OWA1 OWA2 PF01 MBX1 VIRTCLU1 VIRTCLU2 VIRTCLU3 VIRTCLU4

Exchange IP192.168.2.23 192.168.3.169 192.168.1.242 200.14.104.87 200.14.104.88 192.168.2.26 192.168.4.25 192.168.2.19 192.168.2.11 192.168.2.12 192.168.2.18

Server RolBridgeHead BridgeHead BridgeHead Servidor OWA Servidor OWA Servidor PF Server MBX Cluster MBX Cluster MBX Cluster MBX Cluster MBX

UbicacinSantiago Santiago Santiago Santiago Santiago Santiago Santiago Santiago Santiago Santiago Santiago

2

Anlisis de amenazas y Caractersticas

2.1 Clculo de riesgoPara verificar cuales son los riesgos y como podran impactar a Corporacin en caso de presentarse, se realizar un clculo del riesgo, el cual utiliza como entradas, los activos del sistema de informacin y las amenazas que probablemente pueden afectar al sistema. Dentro del anlisis necesario acerca de los riesgos manejados dentro de la infraestructura de Corporacin, se presenta la siguiente tabla para su clculo, en la que se puede ver columnas de distintos tipos: Columna de los activos (en Gris) Columnas de Amenazas por incidentes catastrficos (en Verde) Columnas de Amenazas por Persona Benigna (en amarillo) Columnas de Amenazas por Persona Malintencionada (en caf) Cada uno de estos activos est valorado en base al impacto que generara una falencia de ste, con un Valor de Activo entre 1 y 5, siendo 1 poco impacto y 5 impacto grave. Adems se considera a cada Activo que es vulnerable a una amenaza, con probabilidad entre 1 y 10 de ser afectado y se evala como lo afectan las amenazas , generando un ndice de Riesgo en base al siguiente clculo:

( Probabilidad Amenazas) * (Valor Activo) = ndice de RiesgoComo ya existen varias contramedidas implementadas, a algunos activos se los considera protegidos y a otros no. Si este ndice de Riesgo es muy elevado y afecta a un activo no protegido, estamos frente a una Exposicin de ese activo y por lo cual requiere ser considerado como parte de un pCorp de contramedidas.

2.2 Anlisis de amenazasEn la siguiente tabla muestra el detalle los activos, amenazas y contramedidas, con la valorizacin estimada para cada una de ellas:

5

Cuenta desactivadas

Accesos restringidos

Duplic.HW/Enlaces

Valor Activo (Impacto en caso de falla) 5 2 3 1 4 2 3 4 5 3 2 3 3 4 3 3 4 3 2 2 1 4 3 4 4 4 4 2 1 4 3 2 4 3

Contramedidas Existentes

Datacenter Redundante

Capacitacin

Firewall

Antivirus/Spyware

Redundancia HW

UPS

Activos

Incidentes catastrficos Corrimiento Tierra/AvaCorpcha Construccin Defectuosa

Pers.benigna Persona malintencionadaEmpleado actual descontento Ex-Empleado descontento Empleado desinformado Virus(Cdigo Malicioso) Usuario desinformado

Empleado negligente

Accidente industrial

Clase

Nombre

HW HW HW HW HW SIST SIST SIST SIST SIST SIST SIST SIST SIST SIST SIST SIST SIST SIST SW SW INFO INFO INFO INFO INFO INFO INFO INFO INFO INFO INFO INFO INFO

Centros de datos Equipos de escritorio Notebook PDA Servidores Acceso a VPN Aire acondicionado Almacenamiento de datos Aplicacin ventas Web App.colaboracin Archivos compartidos Correo DHCP service Firewall UPS Servicio de directorio Routers y switch Sistema DNS Sitios Web internos Software de servidor Software de usuario final Cdigo fuente Datos de contacto de clientes Datos de pedidos Datos de publicidad Datos financieros DatosRRHH Informacion infraestructura Documentacin de producto Medios extrables (cintas,CD) Pedidos de proveedores PKI sistema informtico PCorpes estratgicos Tarjetas inteligentes

1 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 0 1 1 27

1 2 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 0 1 1 25

1 2 2 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 0 1 0 25

0 1 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 7

1 1 2 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 0 1 1 25

0 1 2 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 0 1 1 24

1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 0 1 0 21

0 0 1 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 4

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

3 8 1 0 3 5 5 3 3 3 3 3 3 3 0 3 3 3 3 1 2 0 1 1 1 1 1 1 1 0 1 0 1 0 70

0 7 7 6 4 4 3 4 4 4 4 4 4 3 2 4 2 4 4 0 0 0 1 2 1 1 1 1 1 0 1 0 1 0 84

6 8 6 0 5 6 0 1 6 6 6 6 6 2 0 6 2 6 6 6 6 0 1 2 0 0 0 0 1 2 1 0 2 0 105

2 3 3 3 1 0 2 1 2 2 1 2 1 1 1 1 1 1 2 2 6 1 1 2 1 1 1 1 2 1 3 1 2 3 58

0 2 2 1 1 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 3 0 1 0 0 0 0 1 1 0 1 1 0 2 18

2 2 2 1 2 2 2 1 2 2 1 2 1 1 1 1 1 1 2 2 6 1 1 2 1 1 1 1 2 1 3 1 2 3 57

0 1 1 0 2 3 0 1 3 3 1 3 1 5 0 1 3 1 3 3 1 1 1 2 1 1 1 1 2 0 2 1 2 0 51

0 1 1 1 1 0 0 1 1 1 0 2 0 1 0 0 0 0 1 0 0 1 1 1 3 1 1 1 2 2 1 1 1 1 28

Espionaje industrial

Corte Red datos

Corte elctrico

Inundacin

Terrorismo

Terremoto

Disturbios

Tormenta

Falla HW

Incendio

Hacker

1 1 1 1 2 1 3 3 2 2 2 2 2 1 1 2 1 2 2 2 6 2 1 2 2 1 1 1 2 1 2 1 2 2 60

0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 1 1 0 0 1 1 2 1 0 0 1 0 12

0 3 3 0 2 1 0 4 3 1 3 3 3 1 0 3 3 3 4 6 9 1 1 0 0 0 0 1 1 0 1 1 0 1 62

95 92 123 20 116 54 63 100 160 93 54 102 81 96 33 81 92 81 66 54 44 32 33 60 40 28 32 20 17 56 66 14 80 57

Esfuerzos Mitigacin

2.3 Resultado de este AnlisisDe la tabla indicada se obtuvieron los resultados requeridos acerca de cuales activos estaban vulnerables y requieren protegerse con contramedida. Estos son los siguientes:Tipo Activo Hardware Sistemas Nombre Activo Notebook Aplicacin ventas Web Valor 4 5 ndice Riesgo 123 160 Contramedida Debe respaldarse de Carpetas importantes con agente de backup Modelo de 3 capas, DB en cluster, Midleware redundante y aplicacin Web con NLB . Adems se replica el sitio

6

Indice Vulnerabilidad

Con respecto a otros activos que tambin requieren atencin estn los siguientes:Tipo Activo Hardware Hardware Sistemas Sistemas Sistemas Nombre Activo Centro de datos Servidores Almacenamientos de Datos Correo Firewall Valor 5 4 4 3 3 ndice Riesgo 105 116 100 102 96 Contramedida Hay dos centros de Datos actualmente Existen varias medidas de proteccin: UPS, redundancia, Cluster, contratos de Mantencin. Redundancia de discos, controladoras, UPS Plataforma distribuida en internet y on-premise Redundancia para el Firewall, control de accesos

2.4 Diagrama general de la InfraestructuraEl diagrama incluye varias de las caractersticas que tiene la infraestructura y que se quiere proteger en Corp.

2.5 Dependencias entre los sub-sistemasEn este esquema se pueden detectar las siguientes dependencias simplificadas de los sistemas: ElementoClientes Http Clientes MAPI Cliente Dominio

1ra dependenciaComunicaciones Comunicaciones Comunicaciones

2da dependenciaFirewall Servidores Exchange Servidores DNS

3era dependenciaServidores Exchange Storage SAN Servidores AD

4ta dependenciaServidores AD Servidores AD Hardware

Al revisar exhaustivamente podremos ver que siempre se depende de una serie de factores en cadena para que funcione como un conjunto unificado. Dado este conjunto es necesario tener pCorpes de contingencia para todos aquellos sub-sistemas de los cuales hay mas dependencias, ya sea otros sub-sistemas o de clientes finales. Tambin es importante asignar prioridad, aquellos que son vitales para el desempeo del negocio. Tomando ests ideas nos avocaremos a los ms relevantes desde la perspectiva de servicios Microsoft y de los que dependen tanto usuarios como otros sistemas: Active Directory, DNS, DHCP y Exchange server.

2.6 Niveles de disponibilidad estimadosRevisando la tabla adjunta, nos damos cuenta que las caractersticas presentadas se asemejan principalmente a sistema de mensajera de 4to. Nivel. Esto nos da un promedio de inactividad anual de 52,56 minutos, o sea casi 1 hora por ao.

Descripcin del nivel

Nivel de disponibilid ad99% o superior

Sistema de mensajera de primer nivel : Corresponde a un sistema con las siguientes caractersticas: 1 Firewall con DMZ 1 Servidor de seguridad (ISA, Relay) 1 DC-GC 1 DNS

7

1 Exchange Sistema de mensajera de segundo nivel: Un sistema de segundo nivel cumple los requisitos de un sistema de primer nivel, pero tambin incluye varios controladores de dominio, varios servidores DNS, un servidor de supervisin independiente y una solucin de almacenamiento bsica de Storage redundante de discos independientes (RAID) que no est en una SAN. Sistema de mensajera de tercer nivel: Un sistema de mensajera de tercer nivel cumple los requisitos de un sistema de segundo nivel, pero tambin incluye una solucin de almacenamiento RAID de gama media mediante SAN e implementa BaCorpceo de carga de red (NLB) en los servidores Front-end de Exchange. Sistema de mensajera de cuarto nivel: Un sistema de mensajera de cuarto nivel cumple los requisitos de un sistema de tercer nivel, pero tambin incluye una solucin de almacenamiento RAID de gama alta, una solucin SAN de gama alta, copia de seguridad y restauracin mediante el servicio de instantneas de volumen y Organizacin en clster activo/pasivo de Microsoft Windows (con varios nodos pasivos) para todos los servidores de servicios de fondo de Exchange. Sistema de mensajera de quinto nivel: Un sistema de mensajera de quinto nivel cumple los requisitos de un sistema de cuarto nivel, pero tambin incluye conmutacin por error completa del sitio (en caso de que se produzca un error en un sitio) mediante el uso de un diseo de varios sitios que incluye una solucin de organizacin en clster dispersa geogrficamente.

99,5% o superior

99,9% o superior

99,99% o superior

99,999% o superior

3 Diagnostico y Tareas mitigadoras de primer nivel3.1 Diagnosticar fallaPara el diagnostico de la anomala se debern realizar algunas pruebas para generar el diagnostico para tomar decisiones acerca de cul es el mejor camino para levantar el estado de contingencia, en base a las siguientes preguntas: 1. La falla es aislada a algunos clientes generalizada? 2. Los usuarios se autentican normalmente al dominio de cl.Corp.com? 3. Hay resolucin de nombres DNS? 4. La falla se presenta en los clientes Outlook y OWA? 5. El problema se manifiesta en el correo saliente, entrante o ambos? 6. Los clientes Outlook pueden acceder a su buzn? 7. Otros servicios tales como de directorio estn afectados tambin?

3.2 Mitigacin de primer nivel en AD y servicios relacionadosEn algunas oportunidades, se presentan dificultades que tiene impacto en los usuarios pero que la solucin (que puede ser temporal) es relativamente fcil. Es as como es conveniente tener identificado algunos de estos casos ms generales y tener preparado un pCorp para enfrentarlos. FallaNo hay resolucin nombres de Maquina

SolucinVerificar conectividad con Ping IP DNS server Verificar estado servicio DNS, en servidores DNS Principal Verificar estado servicio WINS, en servidores WINS Principal

Hay problemas con la modificacin y generacin de cuentas Problemas de acceso para un solo servidor Windows

Revisar que todos los roles FSMO, estn funcionando correctamente, en especial schema admin. Ejecutar comando NETDOM QUERY FSMO y verificar si estn operativos esos servidores Registrarlos en DNS Server Ipconfig /registerdns y para Wins con NBTStat RR Verificar conectividad con Ping a: DC1 DC2 Revisar con SET L en estacin con problemas y ver a que servidor se conectan. Luego revisar acceso con ping y nslookup a este servidor. Verificar configuracin de DNS en estacin Verificar aplicacin y actualizacin de Antivirus corporativo Identificar que estacin es la bloquea las cuentas revisando log de eventos Security Revisar conectividad a servidores Proxy: proxy.Corp.cl Conectarse a servidores Proxy: proxy.Corpchile.cl y verificar servicios

Los usuarios no se autentican al dominio

Usuarios se bloquen sus Password recurrentemente Se detectan problemas para Navegar en Internet

8

3.3 Identificar y solucionar contingencia primer nivel en ExchangeEl siguiente cuadro propone algunas orientaciones bsicas para identificar la causa del problema y ojala mantener el servicio operativo a continuacin de descubrir el origen de la contingencia:

Pregunta:Evaluar Impacto: La falla es aislada generalizada?

RespuestaEn caso de ser aislada (solo algunos clientes):

Accin comprobatoriaEs necesario ver cuantos clientes y como se ven afectados. Ejecutar comando IPconfig para verificar IP recibida y que NO sea 169.254.X.X Ping a Verificar donde se autentica con comando SET L, debe ser alguno de . No puede ser local

En caso de ser total, verificar las condiciones bsicas

1. 2. 3.

Ping para Verificar conexin a DC. Logon con Escritorio Remoto a servidor Verificar que los servicios Microsoft Exchange estn arriba : Servicio Debe estar Microsoft Exchange System Attendant Iniciado Iniciado Microsoft Exchange Information Store Iniciado Microsoft Exchange MTA Stacks Iniciado Microsoft Exchange Routing Engine Iniciado Microsoft Exchange Management

4.

La falla se presenta en todos los tipos de clientes

Solo en clientes Outlook (MAPI)

Afecta solo a clientes OWA, POP3 IMAP

El problema se manifiesta solo en correo saliente, entrante?

Solo en correo Saliente

Se presenta en correo entrante

Otros servicios estn afectados tambin?

Si, hay otros servicios

Verificar que el envo de correo hacia y desde Internet est funcionando. Si no funciona revisar los siguientes servidores: BH01, BH03, BH05 5. Verificar conexin a pgina web en internet. Si no funciona hacer ping a www.google.cl y ver si resuelve la direccin (es muy probable que el ping no responda). Si no lo resuelve verificar servicio DNS en DC1. Verificar los pasos 1,2,3,4,5 En consola de ESM Verificar que bases de datos estn Montadas Verificar funcionamiento de acceso RPC con: telnet 135 (La Terminal/pantalla debe quedar en negro) Verificar los pasos 1,2,3,4,5 Adems probar desde IExplorer la siguiente URL: http://OWA1/exchange y ver si posible conectarse al servicio OWA Si lo anterior no funciona verificar el estado del servicio en la consola remota del mismo servidor VIRTCLU2, a travs de la siguiente URL: http://VIRTCLU2/exchange. probar con tambin con los siguientes: VIRTCLU1, VIRTCLU3, VIRTCLU4 En el caso de clientes POP3 e IMAP ejecutar los siguientes comandos: telnet OWA1 110 y telnet OWA2 143. Si lo anterior tampoco funciona en la consola remota del mismo servidor OWA1, ejecutar como comando IISRESET Verificar de salida a internet Verificar los pasos 1,2,3,4,5 Verificar las colas de los servidores: BH01, BH03, BH05 Ejecutar comando desde BH01, BH03 y BH05: telnet 192.168.99.164 25 y verificar respuesta de comandos SMTP Verificar envo de correos directamente al servidor MTA: recomendado ver articulo MS: http://support.microsoft.com/kb/153119 Solo para algunos buzones: Verificar los pasos 1,2,3,4 Ver que est direccin SMTP correcta en configuracin de buzn (propiedades, email address) Para todos los buzones: Verificar los pasos 1,2,3,4 Verificar si servicio SMTP est operativo en BH01, BH03 y BH05 a travs de un comando: telnet BH01 25 telnet BH03 25 Desde consola de servidor BH01, BH03 y BH05, seleccionar tracking de correos recibidos en los ltimos 10 minutos. Recomendado ver articulo MS: http://technet.microsoft.com/enus/library/aa997573.aspx Ping a todos: y esperar respuesta Verificar con el comando SET L que la estacin haga logon a alguno de los DC: DC1, DC2, DC3, DC6, DC7 Logon con terminal Service a todos los DC: Verificar en otros server afectados el log de eventos de aplicaciones

9

4 Procedimientos genricos para DRP4.1 Falla de servidor ExchangeUna de las fallas ms temidas es la falla del servidor Exchange, principalmente por ser un servicio transversal dentro de las compaas y afecta a todos los perfiles de usuario. A la hora de seleccionar una estrategia de recuperacin ante desastres, es importante que estar familiarizado con los diversos conceptos de recuperacin ante desastres. Restaurar el servidor: Un conjunto de Backup completo incluye un Backup de los datos de estado del sistema, de los programas instalados (binarios) de Exchange y de la mayora de los datos de los discos duros. Reconstruir el servidor: Esta opcin implica la realizacin de una nueva instalacin de Windows Server con la ejecucin de Exchange 2003 en modo de DisasterRecovery y, a continuacin, la restauracin de las bases de datos de Exchange. Utilizar un servidor independiente: Puede usar un servidor de recuperacin independiente como parte de la estrategia de reconstruccin del servidor. Esta opcin implica el mantenimiento de servidores de recuperacin disponibles con el sistema operativo y otro software instalados. Para la recuperacin del servidor fallido pueden haber varias estrategias, pero aqu nos concentraremos en la solucin basado en el rol de servidor y cun rpido se quiere recobrar ste (con o sin todos los datos). Dentro de los roles de los servidores Exchange 2003 estn: Back-end (Servidor bsico, y BridgeHead) y Front-end (servidor OWA).

4.2 Restaurar la configuracin del sistema OperativoCuando el servidor de reemplazo est disponible, es importante configurar las particiones de discos de manera idntica al servidor original. Cuando el hardware este configurado adecuadamente se puede iniciar la instalacin del sistema operativo Windows 2003 Server 32-bit. Es importante instalar los componentes de Windows requeridos para Exchange Server 2003 as como los Service pack y Hotfix requeridos. Tambin se debe asignar el mismo nombre de mquina que el servidor original y para lo cual sta ltima debe estar completamente off-line y agregar el servidor recin instalado al dominio Active Directory, previamente reseteando la cuenta de maquina del servidor original, tal como indica la figura:

.

4.3 Recuperar la configuracin de un servidor ExchangeSe puede recuperar la parametrizacin de un Servidor Exchange fallido, debido a que casi toda la configuracin se puede descargar desde AD. Primero se debe instalar un nuevo servidor con Windows 2003 y luego usando el parmetro /disasterRecovery en el setup de Exchange recuperar la configuracin desde AD. Para realizar una recuperacin de desastres correcta, debe elegir los mismos componentes para la recuperacin de desastres que se instalaron en el servidor que desea recuperar.

10

Compruebe que hay una copia de seguridad vlida de las bases de datos (si se quiere recuperar luego estos). Debe montar los almacenes una vez reiniciado el servidor. La instalacin de una recuperacin de desastres reemplaza la jerarqua de directorios y las claves del Registro sin volver a agregar la informacin a Active Directory. Debe tener el servidor configurado con las mismas unidades de disco para luego pasar los datos Si ejecuta Exchange Server en un clster, NO puede realizar una instalacin con el parmetro /disasterrecovery El parmetro /DisasterRecovery puede ser usado para recuperar la configuracin completa desde Active Directory de todos los tipos de roles de Servidores Exchange 2003 exceptuando aquello es que estn montados en configuracin de Cluster. Adicionalmente a aplicar las configuraciones almacenadas en AD, el Setup re-instala archivos y servicios requeridos para esos roles. Esto significa en la prctica que solo algunas personalizaciones realizadas necesitaran ser recreadas manualmente otra vez, Por ejemplo: Bases de datos, personalizaciones de OWA, certificados SSL.Para estas ltimas se recomienda tambin tener un respaldo en una ubicacin distinta al servidor que se protege. Algunas razones adicionales que motivan la ejecucin de una instalacin de recuperacin de desastres con el comando setup.exe /disasterrecovery son las siguientes: La carpeta Bin ha sido eliminada accidentalmente. Las claves del Registro de MSExchange se eliminan y no hay ninguna copia de seguridad del Registro. Se ha optado por iniciar un servidor con la misma configuracin del fallido, pero sin Datos (conocido como mtodo Dial tone. Es un mtodo rpido de recuperar la operatividad de un servidor que no tenga datos como por ejemplo un Bridge server o OWA)

4.4 Recuperar servidor como Dial TonePara mayor flexibilidad en la restauracin de buzones y Mailbox store, hay una caracterstica llamada Recovery Storage Group. El Recovery Storage Group es un Storage Group especializado que puede coexistir con los Storage Group normales de Exchange, aunque el servidor ya cuente con el nmero mximo de stos. Puede restaurar almacenes de buzones de Exchange 2003 desde cualquier Storage Group de la organizacin de Exchange. Despus de restaurar un Mailbox store en el Storage Group de recuperacin, mueva los datos del buzn recuperado desde el Recovery Storage Group al Storage Group normal. Con este mtodo, se puede recuperar un Mailbox Store completo (toda la informacin de la base de datos, incluidos los datos de registro) o un nico buzn. Los buzones del Storage Group de recuperacin estn desconectados y los usuarios con clientes de correo no pueden tener acceso a ellos. No se puede utilizar el Recovery Storage Group para recuperar bases de carpetas pblicas. El Recovery Storage Group tambin permite ofrecer un servicio Exchange Dial-tone Restore de forma rpida tras una falla. Esta capacidad significa que los usuarios pueden crear y recibir correo mientras se estn restaurando sus datos existentes. Con frecuencia, esta manera es la forma ms rpida de restaurar el servicio de correo. Como es probable que el volumen de datos generados por los usuarios sea inferior a la cantidad de datos que hay en la base de datos existente, combinar los datos del Exchange Dial-tone Restore en el Mailbox store original una vez recuperado ste resulta ms rpido que mover el contenido de la base de datos original a un nuevo mailbox Store

4.5 Incrementar el nivel de diagnosticoEl nivel de diagnostic Logging determina qu sucesos adicionales de Exchange se escriben en el Event Viewer de Aplicacin. Se puede utilizar el diagnostic Logging para registrar sucesos significativos relacionados con la autenticacin, las conexiones y las acciones de los usuarios. De manera predeterminada, los archivos de logging del Event Viewer son .evt y se encuentran en esta carpeta: %SystemRoot% \System32\Config. El registro de diagnsticos se configura de forma independiente para cada servicio en el servidor. Este procedimiento describe cmo configurar el registro de diagnsticos: 1. En Exchange System Manager, clic derecho en el Exchange server, y seleccionar Properties. 2. En el tab Diagnostics Logging, en la lista Services, seleccionar un servicio Exchange 2003 sobre el cual se incrementar el nivel de logging. 3. En la lista Categories, seleccione la categora y el nivel de logging que se desea.

11

4.6 Problemas de inicio System AttendantSystem Attendant es el componente de Exchange 2003 que se encarga de administrar el acceso a AD. El servicio System Attendant incluye diversos componentes internos, como DSAccess y DSProxy, que se comunican con Active Directory y almacenan en cach la informacin de directorios para aumentar la velocidad a la cual se recupera la informacin y para reducir la carga de trabajo en los DC y los catlogo globales. Para realizar troubleshooting podramos seguir el siguiente procedimiento: 1. Haga clic en Start, seleccione Programs, Microsoft Exchange y, a continuacin, haga clic en System Manager. 2. Expanda Organizacin Exchange y, a continuacin, expanda Servers. 3. Haga clic con el botn derecho en el servidor y, despus, haga clic en Properties. Si el System Attendant no se est ejecutando, recibir el mensaje de error siguiente: The Microsoft Exchange System Attendant service is unavailable. Verify that the Server is running and that the System Attendant service has been started. ID no: c1031668 4. Haga clic en el tab Diagnostic Logging y, a continuacin, haga clic en MSExchangeSA en la lista Services. 5. En la lista Categories, haga clic en cada uno de los subcomponentes siguientes y, a continuacin, haga clic en el logging level adecuado en el cuadro Logging Level: o Mailbox Management o NSPI Proxy o RFR Interface o OAL Generator o Proxy Generation o RPC Calls 6. Utilice el Event Viewer para controlar los sucesos registrados. Es posible que System Attendant no se inicie en los escenarios siguientes: El System Attendant de Exchange Server 2003 acta como proxy entre las solicitudes de versiones anteriores de programas cliente (Outlook 97 y Outlook 98) y el servicio de directorio de Microsoft Active Directory, y enva las solicitudes del cliente (para clientes como Outlook 2000) a Active Directory. Si System Attendant no encuentra ningn controlador de dominio al que enviar las solicitudes o referencias proxy, System Attendant no se inicia. Se puede determinar el servidor de destino revisando los sucesos que registra el System Attendant en el Event Viewer. System Attendant carga las siguientes DLL en su espacio de direcciones: o Dsaccess.dll o Dsproxy.dll o Seckm.dll o Abv_dg.dll o Ds2mb.dll o Madfb.dll o Oabgen.dll Si cualquiera de estos archivos falta, est daado o se le han aplicado los permisos incorrectos, el Operador de sistema no se inicia.

4.7 Recuperacin de ClusterUna diferencia importante en los procesos de recuperacin de desastres para los clsteres es la tarea de identificar el origen del error de un recurso concreto. Si se produce un problema, hay que determinar primero si el error es en un solo nodo (lo que indica que hay problemas con los archivos del nodo) o en todos los nodos (lo que indica que hay problemas con los objetos del clster o con los recursos compartidos del clster). Si no puede reparar el nodo o el clster entero, considere la posibilidad de sustituir el nodo o de recuperar el nodo, el clster o los recursos (como el recurso de disco de qurum, o las bases de datos)

4.7.1 Identificacin del origen del errorUna tarea importante de los procesos de recuperacin de desastres de los clsteres consiste en identificar el origen que provoca el error del recurso. Para determinar el origen del error:

12

Busque en el registro de aplicacin de Event Viewer: Empiece por buscar sucesos MSExchangeCluster. La descripcin debera ayudar a determinar el origen del problema.

Configure el registro detallado del Servicio de Cluster: Aunque los clsteres de servidores registran los errores y sucesos en el registro Sucesos del sistema, puede solucionar el problema con mayor rapidez si habilita el registro detallado del Servicio de Cluster para obtener un archivo de texto denominado Cluster.log. How to Turn On Cluster Logging in Microsoft Cluster Server

4.7.2 Sustituir Nodo DaadoExisten dos alternativas para ejecutar este procedimiento: Sustituya todo el hardware daado del nodo con errores, restaure la copia de seguridad completa de equipo o la copia de seguridad de Windows y vuelva a unir el nodo al clster. Crear un nuevo nodo mediante la instalacin del sistema operativo Windows Server 2003, Exchange y software adicional (como Service Pack). Despus, una el nodo al clster. Asegrese de que el hardware de un nodo de sustitucin es tan bueno o incluso mejor que el hardware de los otros nodos del clster Expulsar el nodo daado del clster de la siguiente forma:

Instalar el sistema operativo Windows Server 2003 y unir el nuevo nodo al dominio. Conectar el nuevo nodo al recurso de disco compartido (SAN). Agregar el nodo de reemplazo al clster.

Instalar Exchange en el nodo de reemplazo. Actualizar con SP y hotFix a Nodo as que tenga el mismo nivel de actualizacin que otros nodos.

13

4.8 Recuperacin de recursos de disco en clusterSi los recursos de disco utilizados por los grupos del clster estn daados, es posible que se deba sustituir el disco duro con errores y restaurar el contenido del disco perdido a partir de un Backup.

4.8.1 Cambio de firma de discos ClusterUn clster utiliza firmas de disco para identificar y montar volmenes. Si la firma de disco para un recurso de disco compartido cambia, puede impedir el inicio del Servicio de Cluster. En dicho caso aplicar lo siguiente: 1. Asegrese de que el disco realmente se expone a travs de la conexin compartida sern visible por el sistema operativo. Con Cluster Administrator en System Tools/Device Manager/Disk Drives. Todos los nodos deben ver el mismo nmero de de discos. 2. Si es posible mover todos los recursos de discos a un nico nodo 3. Verificar las firmas de los discos mostrados por dumpcfg, las que deben coincidir con la lista que se deriva de la clave del registro: HKLM/System/CurrentControlSet/Services/Clusdisk/Parameters 4. Si las firmas en la lista no coinciden con la lista de claves del registro, debe identificar correctamente los discos en que sus firmas se ha cambiado y ellos restablecer a las firmas esperadas. Para ello: Apague nodos todos menos uno. Documente el nmero de disco: Computer Management, clic en Storage y, a continuacin, haga clic en Disk Management. En Logical Disk Manager anote el nmero de disco y la etiqueta que est asociado con el disco con errores. Esta informacin es a la izquierda de la informacin de la particin. Por ejemplo: disco 0. Comparar la informacin que se muestra con el mensaje con Description: ID1034 en Event viewer. 5. Si no se ven los discos de DiskMgmt.msc, establecer el servicio Cluster y el clster disk en manual y, a continuacin, reiniciar el nodo (todos los dems nodos deben permanecer apagados). Para ello, seguir esto: Haga clic en Start , seleccione Programs/Administrative Tools y, a continuacin, haga clic en Computer Management. Haga clic en Device Manager en el panel izquierdo y, a continuacin, haga clic en Show Hidden Devices en el men View . En el panel derecho, vea la seccin de unidades que no son Plug and Play y haga doble clic en el Clusdisk Driver. En la ficha Drivers , cambiar la opcin Startup type del System a Disabled. En el panel izquierdo, haga doble clic en " Services and Applications" y, a continuacin, haga clic en "Services". En el panel derecho, haga doble clic en el servicio de Cluster y, a continuacin, haga clic en Disabled en el Startup type . Reinicie el nodo y, a continuacin, repita el paso 1. 6. Escribir la firma que el servicio de Cluster Server espera en el disco: Obtenga la firma esperada de la seccin " Description " de la mensaje de error Event ID 1034. Por ejemplo: "The expected signature of the disk was 12345678.". Copie DumpCfg.exe desde el Kit de recursos de Windows en el nodo local. En el smbolo del sistema, escriba dumpcfg.exe . En la seccin[DISKS] , se muestra el nmero de disco y la firma para todos los discos disponibles. Validar la firma de disco real con la que el servicio Cluster espera. Escribir la firma esperada en el disco utilizando el siguiente comando, donde es 12345678 la firma de disco en formato hexadecimal y 0 es el nmero de disco que reemplaz (que se obtuvo el paso anterior): Dumpcfg.exe -s 12345678 0 7. Establezca el servicio de Cluster Server a automtico y establezca el Cluster Disk al sistema en el nodo. Iniciar el Cluster Disk device e inicie el servicio Cluster. 8. Abra el Administrador de clsteres y, a continuacin, poner el disco en lnea. 9. Encienda todos los dems nodos, uno en uno y pruebe el fail-Over manual.

14

4.8.2 Restauracin de una base de datos en un clsterSi se pierde alguna unidad que contiene archivos de base de datos o archivos de logs, se debe utilizar los backups de las bases de datos para recuperar dichas unidades. Para restaurar un backup de las bases de datos de los nodos de clster de Exchange, debe realizar el procedimiento similar al empleado para restaurar bases de datos de un servidor independiente. La nica diferencia entre estos procesos es que, cuando restaura las bases de datos de los nodos de clster, se utiliza el recurso Nombre de red del equipo Servidor virtual (VS) en lugar de emplear el nombre de equipo.

4.8.3 Restauracin de un recurso de disco de qurumEl recurso qurum es un disco compartido que contiene todos los cambios que se han aplicado a la base de datos del clster. El recurso de disco de qurum es accesible para otros recursos del clster. Ahora si hay un fail-over en otro, todos los nodos del clster tendrn acceso a los cambios ms recientes de la base de datos. Si la unidad que contiene el recurso de disco de qurum se daa, puede utilizar para restaurarla el artculo "Se recupera de un registro de qurum perdido o daado".

4.8.4 Cambiar disco QuorumLa unidad de qurum tiene dos responsabilidades: El log del clster se replica a los dems nodos del clster de servidores (%SystemRoot%\Cluster\Clusdb) Si hay una prdida de comunicacin entre los nodos del clster, se genera una dualidad, en la que el propietario del recurso de qurum disco se convierte en el propietario slo del clster y todos los recursos. Cuando este no funciona correctamente, los nodos supervivientes arbitran para tomar posesin del dispositivo. Utilice el siguiente procedimiento para designar una unidad diferente para el dispositivo de qurum (si el servicio de Cluster Server no puede iniciar porque el disco de qurum no est disponible, utilice el / FIXQUORUM modificador para iniciar el servicio de Cluster Server): 1. Inicie el Cluster Administrator (CluAdmin.exe). 2. Haga clic con el botn derecho en el nombre de clster y, luego haga clic en Properties. 3. Haga clic en el tab Qurum. 4. En el cuadro Quorum resource, haga clic en un recurso de disco diferente. 5. Si el disco tiene ms de una particin, haga clic en la particin donde desea que los datos especficos del clster van a mantener y, a continuacin, haga clic en OK.

4.8.5 Cambiar de discos en Cluster (no Quorum)Un mtodo simple de realizar esta labor sin tener que asignar nuevas firmas a los discos, ni reconfigurar la aplicacin es el siguiente: 1. Conectar la nueva unidad de disco al cluster 2. Formatear, etiquetar, y asignar alguna letra disponible para el nuevo drive (X:\, por ejemplo) 3. Bajar el grupo del cluster que se est cambiando de unidad (S:\, por ejemplo) 4. Copiar todos los datos (database o archivos) entre las unidades del cluster, desde la que se remover a la nueva unidad ( de S:\ a X:\) 5. A continuacin, en la unidad original, asignar otra Letra disponible (Y:\, por ejemplo) 6. Ahora en la re-asignar letra a nueva unidad. 7. En Cluster administrator, parmetros del recurso de disco, verificar que recurso sea la nueva unidad en base a etiquetas. 8. Bring-on para el grupo, y verificar el correcto funcionamiento 9. Finalmente eliminar del grupo al recurso de disco que tiene antiguo Drive.

4.9 Perdida de datos en BaseCuando los datos de Exchange resultan daados o se pierden, debe recuperarlos de un Backup. Hay varias situaciones en las que la restauracin a partir de un Backup puede ser necesario, por ejemplo: Una o ms bases de datos de un Storage Group estn daadas: La funcionalidad de restauracin de una nica base de datos de Exchange se puede utilizar para restaurar las bases de datos daadas sin interrumpir el acceso a otras bases en el mismo servidor. Error de hardware que provoca la prdida de los log de transacciones o de las bases de datos: En este caso, es posible que tenga que recuperar todos los grupos de almacenamiento, incluidos sus logs y archivos de base de datos asociados.

15

Error en un servidor de buzn o de carpetas pblicas que requiere la reconstruccin del servidor: En este caso, la recuperacin ante desastres suele implicar la reconstruccin del servidor desde su sistema operativo.

4.10 Recuperacin de base de DatosPuede haber algunas situaciones en las cuales no tengamos propiamente el backup actualizado disponible y/o no sea conveniente realizar una restauracin por que el misma Backup tambin se encuentra daado. Para esto existe herramientas que se instaCorp junto a los binarios de Exchange que son conocidas como Eseutil e Isinteg. Estas herramientas son utilidades de comando de lnea que ejecutan varias tareas de reparacin y la cuales no han cambiado mucho desde sus primeras versiones. Eseutil e ISinteg, como en sus anteriores versiones est localizada la carpeta Bin bajo el path de instalacin de Exchange que por defecto es C:\Program Files\Microsoft\Exchange Server. Antes de user ESEUTIL e ISINTEG asegurese de lo siguiente: Haga un Backup de la base de datos Exchange incluso si se piensa que esta daada Use ISINTEG y ESEUTIL comprendiendo lo que realmente puede hacer. Asegurese de completer todos los test antes de hacer cambios con ESEUTIL e ISINTEG. Desmontar el Mailbox Store y ahi sera accessible para offline defrag, tests y otros).

Eseutil: Es la herramienta para desfragmentar una base en modo Offline, chequear su integridad y reparar dao o perdida de datos. Tenga en cuenta el espacio libre en disco requerido para ejecutar estas opciones, el cual puede ser al menos el tamao de la base de datos y en cuyo caso podra usar la opcin /t para indicar un almacenamiento temporal. Para revisar desfragmentacin, ejecutar el comando de la siguiente manera, cambiando los path: C:\Program Files\Exchsrvr\Bin\eseutil /MS R:\Program Files\Exchsrvr\MDData1\Priv1.edb Para desfragmentar Offline, ejecutar el comando de la siguiente manera, cambiando los path: C:\Program Files\Exchsrvr\Bin\eseutil /d R:\Program Files\Exchsrvr\MDData1\Priv1.edb Para revisar integridad, ejecutar el comando de la siguiente manera, adecuando los path: C:\Program Files\Exchsrvr\Bin\eseutil /g R:\Program Files\Exchsrvr\MDData1\Priv1.edb Para recuperacin a desastres, asegurese que la base realmente no puede iniciar, revise en el log de eventos la causa de la falla, haga un backup de la base, por ultimo reinicie el servidor y si todo aun no funciona, ejecute el comando de la siguiente manera, modificando los path (hay que tener claro que es posible prdida de datos): C:\Program Files\Exchsrvr\Bin\eseutil /P R:\Program Files\Exchsrvr\MDData1\Priv1.edb Isinteg: Es usado para realizar test del information Store y corregir algunos errores detectados. Debe ejectarse varias veces ISINTEG FIX test alltests hasta que no se reporten errores

16

4.11 Recuperar un Domain ControllerEl proceso de restore retorna el controlador de dominio a su estado de tiempo previ a la realizacin del respaldo. Las opciones disponibles para la recuperacin son las siguientes.

4.11.1 Restauracin Non Authoritative.Aplicable en el caso de que un controlador de dominio se tenga que recuperar de un error de hardware o reemplazo, en casos que los datos en otros controlador de dominio son ms nuevos que los del backup y la restauracin de un controlador de dominio requiera la copia de seguridad ms reciente. Despus del proceso de restauracin, la replicacin de Active Directory se inicia automticamente en base a la propagacin de cualquier cambio de otros Domain Controllers que se produjeron despus de realizada la copia de seguridad. Este proceso de restauracin corresponde a un mecanismo donde se sustituye Active Directory desde el punto de vista de entradas, schema, configuracin y opcionalmente los contextos de nombres de global catalog, segn el tiempo de backup mediante respaldo y replicacin controladores de dominio. La restauracin Non authoritative a travs de MD5 Checksum compara la informacin y contenido de SYSVOL replicando solamente los cambios necesarios. El procedimiento de restauracin fue el siguiente: Reinicia el servidor presionando cuando corresponda la tecla F8. Selecciona modo Directory Services Restore Mode. Selecciona el sistema operativo que se desea iniciar en modo restore. Realiza la autenticacin en modo local (Administrador local del equipo). Ejecutar NTBACKUP y seleccionar Restore Wizard. Seleccionar el apropiado respaldo asegurando que los check box System Disk y System State se encuentren seleccionados. Hacer click en Advanced y asegurarse de que se aplique Restore junctions points. Selecciona Original Location en Drop down box Restore Files to En Advanced Restore options asegurarse que los siguientes campos estn marcados. Restore Security y Restore Junctions point, and restore file and folders data Ander junctions points to the original location. Preserve existing volume mount points. Hacer click en Finish. Una vez completado, haga click en Yes para reiniciar el equipo.

4.11.2 Restauracin Authoritative Active DirectoryEste tipo de recuperacin permite seleccionar objetos o subrboles especficos de objetos de un respaldo de Active Directory y restaurarlos en un controlador de dominio. Lo anterior, provoca que la replicacin de Active Directory restablezca el estado de los objetos que sobrescriban las copias actualmente mantenidas en todos los Domain Controllers de dominio (el Estado del sistema). Los objetos restaurados reciben mayor USN que el conjunto actual de objetos de dominio. Bajo este proceso, el volumen SYSVOL es marcado como autoritativo (o maestro) para el resto de controladores de dominio, siendo replicado a quienes conforman la plataforma. Reinicia el servidor presionando cuando corresponda la tecla F8. Selecciona modo Directory Services Restore Mode. Selecciona el sistema operativo que se desea iniciar en modo restore. Realiza la autenticacin en modo local (Administrador local del equipo). Ejecutar NTBACKUP y seleccionar Restore Wizard. Seleccionar el apropiado respaldo asegurando que los check box System Disk y System State se encuentren seleccionados. Hacer click en Advanced y asegurarse de que se aplique Restore junctions points. Selecciona Original Location en Drop down box Restore Files to

17

En Advanced Restore options asegurarse que los siguientes campos estn marcados. Restore Security. Restore Junctions point, and restore file and folders data Ander junctions points to the original location. Preserve existing volume mount points. Hacer click en Finish. Rechazar el reinicio del equipo. Hacer click en Restore Tab.Asegurarse de que este seleccionada la opcin Alternate Location en Restore Files To. Nota: Con esta opcin se restaurar el System State a un ubicacin alternativa, no es necesario para este caso que se restaure el disco de sistema dentro de las selecciones posibles de NTBACKUP para respaldo a un ubicacin alternativa. Este tipo de restauracin solo restaurar SYSVOL, boot files y registro a dicha ubicacin alternativa. Cuando el proceso de restore finalice, cierre la aplicacin NTBACKUP. Luego de lo anterior, abra una ventana de comando y digite ntdsutil, presione Enter. Luego, escriba Authoritative Restore y presiones Enter. Digite, Restore database.En cuadro Authoritative Restore Confirmation Dialog, click OK. Digite Quit, repetidamente hasta salir de la aplicacin. Reinicie el servidor. Una vez que el sistema haya reiniciado y luego de que SYSVOL, haya sido publicado debe copiar los archivos y carpetas desde el directorio SYSVOL a la Ubicacin Alternativa (Alternative Location). Entre los archivos que debe considerar, se encuentra Scripts, Polticas de dominio y polticas de grupo. Por ejemplo: Copie el contenido de la presente carpeta: c:\\sysvol\c_\winnt\Sysvol\Domain\scripts\. Una vez lo anterior, agregue a la siguiente carpeta: c:\Winnt\SYSVOL\Sysvol\domain\scripts\

4.11.3 Restauracin Active Directory en un Hardware diferente.El articulo Technet Q263532: Disaster Recovery of Active Directory on Dissimilar Hardware, describe el proceso de levantar Active Directory en otra mquina es para Windows 2000 y no considera las dificultades que entrega la activacin de la licencia en Windows 2003. Por lo tanto este proceso es invlido, y lo mejor es tener tolerancia a falla de Active Directory a travs de otra mquina que tambin sea Domain Controller.

18

4.12 Configurar alertas para acceso a archivos sin autorizacin y de intentos deinicio de sesinPuede configurar la utilidad Performance Logs and Alerts para supervisar intentos fallidos de inicio de sesin y de intentos de acceso a archivos del equipo con errores.. Tambin puede configurar alertas para enviar un mensaje y notifica si se produce una potencial infraccin de seguridad. 1. Ir a Herramientas administrativas en Performance Logs and Alerts, haga clic en Alerts . 1. Clic con el botn derecho haga clic en New Alert Settings. En Name, ingrese un nombre que identifique a la alerta 2. Agregue un Comentario con algn detalle de la alerta y luego agregar Counters con botn Add 3. Seleccionar el tem: Use local computer counters y en Performance object clic en Server, y en Select counters from list clic en Errors Access Permissions y luego add 4. Tambien seleccionar: Errors Granted Access y Errors Logon y luego Add, cerrar ventana con Close 5. En el Tab General en cada uno de los counters agregados haga los siguiente: o En el cuadro Alert when the value, click en Over. o En el cuadro Limit , escriba el nmero de errores que pueden producirse antes de generar una alerta. Clic en el tab Action y especificar la accin que desea que se producen cuando se desencadene una alerta: o Si desea que el servicio registros y alertas de rendimiento para crear una entrada en el registro de aplicacin del Event Viewer cuando se produce una alerta, haga clic para seleccionar Log on entry in the application event log. o Si desea que el servicio registros y alertas de rendimiento para desencadenar el servicio Messenger por consola para enviar un mensaje, haga clic para seleccione la casilla de verificacin Send a network message to y, a continuacin, escriba la direccin IP o el nombre del equipo en el que debe aparecer el mensaje alerta. o Para iniciar un registro de counter log cuando una alerta se desencadene, seleccione la casilla de verificacin Start Performance data log y, a continuacin, especifique el registro de contador que desea ejecutar. o Para ejecutar un comando o programa cuando una alerta se produce, active la casilla de verificacin Run this program y, a continuacin, escriba la ruta de acceso del archivo y el nombre del programa o comando que desea ejecutar o haga clic en Browse para buscar el archivo. Cuando se produce una alerta, el servicio crea un proceso y ejecuta el archivo de comando especificado. El servicio tambin copia argumentos de lnea de comandos que defina en la lnea de comandos que se utiliza para ejecutar el archivo. Haga clic en Command Line Arguments y, a continuacin, active las casillas de verificacin para incluir los argumentos que desee cuando se ejecuta el programa. Haga clic en el tab Schedule , especifique el inicio y detener horas para la exploracin y, a continuacin, haga clic en OK . El contador no supervisa error inicios de sesin interactivo en la consola o mediante el protocolo de escritorio remoto (RDP). En su lugar, el contador slo supervisa los inicios de servidor mensaje bloque (SMB) comunicaciones sesin (por ejemplo, cuando un usuario intenta abrir un archivo en el servidor pero carecen de permisos al recurso compartido). El objeto de servidor en el Monitor de rendimiento slo hace referencia a recursos compartidos.

19

5 DRP de Exchange5.1 Falla de servidor ExchangeAnte la falla de un servidor Exchange, primero identificaremos que rol tiene y a continuacin nos informaremos si corresponde o no a un cluster. Para eso nos apoyaremos en el nombre de la maquina y alguna documentacin y/o conocimiento que podamos rescatar acerca de ella. Los nombres de las maquinas tienen declarado implcitamente varias de sus caractersticas: Por Ejemplo la maquina: 3KPELIMBH01, se puede descomponer en: 3K: Maquina Windows 2003 PE: Del dominio pe.Corp.com LIM: Ubicada en Lima BH : Con rol BridgeHead 01: Correlativo a su numeracin Fuera de esta normativa estn los servidores virtuales de Cluster, los cuales tienen nombre de Arboles, tales como: VIRTCLU2, VIRTCLU1, VIRTCLU3, VIRTCLU4.

5.1.1 Recuperar servidor de ExchangePara recuperar un servidor con alguno de estos roles debemos tener en cuenta lo siguiente: Bridgehead: Este tipo de servidor se encarga del transporte de los correos dentro y fuera de la organizacin Exchange. Se caracterizan por tener discos con dedicacin exclusiva a colas de mensajes, por lo dems toda la configuracin es posible rescatarla de Active Directory. Para la recuperacin seguir las siguientes instrucciones: 1. Recuperar servidor o equivalente basado en procedimiento:4.1Falla de servidor Exchange 2. Verificar que discos dedicados a Colas sean los equivalentes a los existentes. 3. Ejecutar setup de Exchange en base a comandos indicados en: 4.3 Recuperar la configuracin de un servidor Exchange 4. Aplicar nivel de actualizacin de Exchange que tiene servidor reinstalado: 5. Reiniciar y verificar operacin de Colas de mensajes en servidor recuperado. 6. Instale otras aplicaciones, tales como Antivirus, agentes de monitoreo Outlook Web Access: Un servidor OWA es un servidor que est en la DMZ y tiene varios puertos TCP que lo comunican con la el servidor Exchange Back-end y los Domian Controller. Para su recuperacin, y considerando el hecho que no tiene datos, se remienda como el mtodo apropiado, reinstalar este u otro servidor con setup de recuperacin y seguir los siguientes pasos: 1. Instalar este u otro Hardware nuevo con Windows 2003 Standard: 4.1Falla de servidor Exchange 2. Conectarlo a la red Interna y al dominio 3. Instalar Exchange 2003 standard, con setup de recuperacin: 4.3 Recuperar la configuracin de un servidor Exchange 4. Configurar servidor como Front-end 5. Configurar servidor con la misma IP (DMZ) que mantena el servidor antiguo 6. Trasladar servidor a red DMZ, y probar conectividad 7. Probar funcionamiento de servidor OWA 8. Instale otras aplicaciones, tales como Antivirus, agentes de monitoreo Servidores con Multirol: Son aquellos que en la tabla mostrada al inicio aparecen con el rol Server MBX Server PF. Estos servidores normalmente cumplen la funcin de Bridgehead, Mailbox y Public folder y por lo tanto tienen mutiplicidad de roles. Para ellos el procedimiento de recuperacin es para un servidor Bridgehead server con la salvedad que hay que agregar la recuperacin de Datos: 1. Recuperar servidor o equivalente basado en procedimiento:4.1Falla de servidor Exchange 2. Verificar que discos sean los equivalentes a los existentes. 3. Ejecutar setup de Exchange en base a comandos indicados en: 4.3 Recuperar la configuracin de un servidor Exchange 4. Aplicar nivel de actualizacin de Exchange que tiene servidor reinstalado:

20

5. 6.

Reiniciar y verificar operacin servidor recuperado, conectando clientes, verificando flujo de correo. Instalar otras aplicaciones, tales como Antivirus, agentes de monitoreo

5.1.2 Recuperar Servidor ClusterEn el caso de los servidores que son cluster, el procedimiento que incluye el parmetro /DisasterRecovery no se puede aplicar. Por lo dems los procesos DRP para restaurar clsteres son similares a los de restauracin de datos en servidores stand-alone. Si se produce un error en uno de los nodos de un clster (Fail-over), el Servicio de Cluster Server asume el control del clster. Despus del Fail-over, uno de los posibles nodos propietarios del grupo de recursos intenta tomar control de dicho grupo. Si todos los recursos pueden ponerse en lnea para el nuevo nodo, ese nodo contina realizando las tareas que antes efectuaba el nodo daado. Del mismo modo, si se produce un error en uno de los recursos de un Servidor virtual (VS), el VS se pondr fuera de conexin. Si ninguno de los nodos puede poner en lnea los recursos del VS, los recursos de dicho servidor virtual no estarn disponibles para los clientes hasta que se resuelva el problema. Falla un nodo del cluster: En el caso de falla de un nodo activo, ya sea por fallas en el hardware, conexin a red o energa, se produce el fail-over automtico re-asignado el grupo al nodo pasivo. A continuacin se debe revisar las causas de la falla y una vez que estn identificadas podra aplicar o no el procedimiento descrito en: 4.5.1 Sustituir Nodo Daado. Eso depender de las causas ya que podra ser un simple desconexin de la red elctrica o un apagado accidental de la maquina que es nodo activo. Falla de todos los nodos: Esto indica que hay problemas con los objetos del clster o con los recursos compartidos del clster. En cualquier caso es necesario tener claridad cul es el origen de la falla. En el primer caso o sea falla de alguno de los objetos del cluster, es posible recrear estos de la siguiente forma, tomando nota antes de cualquier configuracin que no sea por default: 1. En Cluster Administrator, click derecho en recurso System Attendant, click Take Offline. 2. Luego Clic derecho en el recurso System Attendant y seleccionar delete. No utilizar la opcin Remove Exchange Server. No habr perdida de datos cuando se borre el recurso System Attendant. Cuando se recree, los objetos de recurso sern creados usando la informacin guardada en Active Directory 3. En el arbl buscar, Resources, boton derecho y apuntar a New, y entonces click en Resource. Complete el wizard para re-crear el recurso System Attendant. La mayora de las opciones no es disponible debido a que son ledas de Active Directory. 4. Asegurese que recurso System Attendant depende de los recursos Disk y Name 5. Asegurese que recurso System Attendant esta recreado en el nodo que es propietario del recurso de disco del Grupo 6. A continuacin los dems recursos sern mostrador en el cluster administrator 7. Reiniciar recursos. Falla Almacenamiento compartido: En el caso que la falla est relacionado a algn componente de disco o dependiente de este, el procedimiento a seguir es alguno de los indicados en: 4.6 Recuperacin de recursos de disco en cluster

5.2 Falla servicio en ExchangeEn el caso de falla de un servicio de Exchange el procedimiento necesariamente parte con el anlisis de las causas que ocasionan el problema. Los pasos se pueden resumir de la siguiente manera: 1. Bajar Servicio System attendant y aceptar que se bajen todos los otros 2. Iniciar en el siguiente orden los servicios de Exchange y verificar que suban correctamente o Microsoft Exchange System attendant o Microsoft Exchange Information Store o Microsoft Exchange MTA stacks o Microsoft Exchange Routing Engine 3. Ante la falla de alguno de estos, revisar ID en Event Viewer de Aplicacin. 4. Identificar la causa mas probable y/o el ID con el error 5. Para los issues mas comunes revisar los siguientes artculos: o Microsoft Exchange System Attendant Service does not start, Problemas de inicio System Attendant

21

o The Microsoft Exchange Information Store service does not start o The MTA Stacks service may not start o SMTP Service wont start Si el servicio exchange esta montado en clustering, este ultimo tiene el control de los servicios y todas las operaciones de inicio y bajada de servicios deben realizarse a travs de Cluster Administrator. De igual manera en casoi de falla se deben seguir el orden indicado y verificar en el Event Viewer de aplicacin los efectos de cada subida y bajada de recursos. Podra ser necesario Incrementar el nivel de diagnostic.

5.3 Exchange no encuentra AD o parte de lExchange Server 2003 depende completamente del servicio Active Directory para sus operaciones. Active Directory proporciona toda la informacin acerca de buzones, servicios de listas de direcciones y otra informacin relacionada con el destinatario. La mayor parte de la informacin de configuracin de Exchange 2003 se almacena tambin en Active Directory. En los siguientes casos podra presentarse dificultades de acceso al directorio:

5.3.1 No encuentra servidores DCLos pasos a seguir son los siguientes: 1. Verificar que Domain Controller estn operativos y funcionales 2. Verificar que servidor DNS en Exchange server sea vlido 3. Verificar que Domain Controller responden con el performance adecuado y no estn degradados 4. Con System Manager, Expanda Organizacin Exchange y Servers. Haga clic con el botn derecho en el servidor y, despus, haga clic en Properties. 5. Verificar en Directory Access que cada tems tenga asignado automticamente un servidor

6. 7.

Si no estn asignados automticamente, remover Check Box y asignar manualmente a algun DC que le tengamos confianza en el acceso y la integridad. En caso contrario verificar en Event Viewer de aplicacin ID con error para troubleshooting

5.3.2 No est disponible AD completa o parcialmenteEsto debera corresponder a algn grado de corrupcin de AD y en ese caso habra que actuar con extrema cautela. Normalmente para corregir esto se requiere reparar esa parte del directorio, ya sea la particin de Configuracin o la de Schema. Normalmente para hacer esto hay que tomarla desde algn respaldo vlido, pero debido a que los cambios en esos casos son irreversibles no se puede obtener solo esa particin sin afectar a las otras. Suponiendo que el camino escogido sea aplicar un restore completo este debe ser del tipo autoritativo. Ver la referencia: 4.11.2 Restauracin Authoritative Active Directory

5.3.3 Falla de Base de DatosPuede haber algunas situaciones en las cuales no tengamos propiamente el backup actualizado disponible y/o no sea conveniente realizar una restauracin por que el misma Backup tambin se encuentra daado. Para esto existe herramientas que se instaCorp junto a los binarios de Exchange que son conocidas como Eseutil e Isinteg. Estas herramientas son utilidades de comando de lnea que ejecutan varias tareas de reparacin y la cuales no han cambiado mucho desde sus primeras versiones. Eseutil e ISinteg, como en sus anteriores versiones est localizada la carpeta Bin bajo el path de instalacin de Exchange que por defecto es C:\Program Files\Microsoft\Exchange Server. Antes de user ESEUTIL e ISINTEG asegurese de lo siguiente:

22

Verifique que los errores indicado en Event Viewer de aplicacin e intente solucin haciendo troubleshooting en base a ID detectado. Haga un Backup de la base de datos Exchange incluso si se piensa que est daada Verifique el espacio libre disponible en disco que sea al menos del mismo tamao de la base Verifique a travs de la forma ms inofensiva de Eseutil propuesta por los switches (para detalles de uso de Eseutil Verificar en 4.10 Recuperacin de base de Datos) 1. eseutil /mh: Indica si el ultlimo shutdown fue limpio 2. eseutil /ml: Similar pero adems revisa los Logs 3. eseutil /mk: Provee informacin del checkpoint 4. eseutil /k: Revisa integridad de information Stores Tambin en el supuesto que falle la base de Datos al montarse debido a un evento: ESE ID 494 - Recovery failed with error -1216. Tambien pueden aparecer ESE BACKUP ID 904 y ID 905 en ese caso aplicar reparacin de log files con Eseutil /R. Finalmente en base a las correcciones y resultados de los comandos anteriores hay que decidir si se ejecuta la reparacin forzada de la base con el parametro: /P

5.3.4 Recuperacin de algunos BuzonesMuchas veces es necesario recuperar solo parcialmente datos borrados o perdidos de una base de datos, la parte ms atomizada que se puede recuperar, es un item de correo o un mail. Para realizar esta tarea se utiliza tanto las opciones de los software de 3ros. como la ventaja ofrecida por Exchange 2003, llamada Recovery Storage Group. Esta opcin de monta una segunda copia de una base de datos que tpicamente se recobr de un backup y que se destina para extraer datos tales como buzones o items de estos, a un buzn en produccin incluso con el usuario conectado. Para realizar esto se utiliza el procedimiento indicado a continuacin: 1. Crear un Recovery Storage Group en Exchange System Manager, siguiendo la imagen

2.

Luego se debe configurar la ubicacin de sus archivos

3.

Se requiere ahora seleccionar la base de Datos que ser recuperada con Add Database to Recover

23

4. 5. 6.

Realizar ahora la recuperacin de la base de Datos con el software de Backup (Tivoli DSM). Verificar que el directorio Recovery Storage Group est limpio y sin archivos. A continuacin la base queda montada y con los mismos Buzones a produccin Se debe realizar entonces la recuperacin del buzn con datos perdidos

7.

La opcin Recovery Mailbox Data, pide que confirmemos el destino final

8.

Es necesario indicar que hacer con los datos recuperados: Merge copy

9.

En el supuesto que se quisieran recuperar todos los buzones de una base de datos se seleccionan todos

24

5.3.5 Restauracin de Buzn que ha sido Borrado de Exchange.1. Se crea un Recovery Storage Group, con el buzon y ejecutando el restore en servidor. Indicando la opcin this databese can be overwrite by a restore queda de la siguiente forma:

2.

Desde ESM, en tools, indicar MailBox Recovery Center, Advanced, y especificar el Mailbox Store del servidor

3.

Seleccionar los buzones a reconectar e indicar: Find Match y luego Reconnect.

4.

Desde Active Dorectory Users and Computers buscar los buzones que se re-conectaron e indicar Move MaiBox

5.

Mover buzones entre Mailbox store del mismo servidor

6.

Con esto quedan operativos los buzones, y solo resta remover el RSG, para lo cual hay que desmontar el Mailbox store de recuperacin.

25

7.

Finalmente borrar el Mailbox store de recuperacin

5.4 Failover de servicio Cluster5.4.1 Fail-over de Cluster ExchangeLas causas por que forzar el movimiento hacia el nodo de pasivo del cluster normalmente son: Mantencin Instalacin de Software Mantencin Instalacin de Hardware Es importante tener en cuenta que se debe usar la herramienta cluster administrator para generar el fail-over. Tambin hay que tener en cuenta: 1. Tener ventana de tiempo necesaria para efectuar los trabajos. 2. Conectarse a consola de ambos nodos con terminal Service y con una cuenta privilegios adecuados. 3. Con herramienta "cluster administrator", confirmar cual es el nodo activo y cul es el pasivo

4. En "cluster administrator", seleccionar Grupo Exchange que se desea mover. 5. En este con botn derecho indicar move Group y luego a cual nodo pasivo

5.4.2 Fail-back al servidor OriginalUna vez que el servidor original se ha recobrado los pasos para devolver este al nodo activo en produccin son los mismos que el caso anterior, pero indicando el servidor como servidor destino o Reconstruccin completa de cluster o Falla de Quorum Disk o Falla de unidad LUN

26

6 DRP de ADQue se corrompa Active Directory, no solo implicar que los usuarios NO puedan validarse al Dominio, sino adems no podrn acceder sus recursos y a su correo, ya que el Active Directory contiene la Configuracin de la Organizacin de Exchange. Teniendo en cuenta lo anterior, el AD es una base de datos Multimaster, por lo que se replica constantemente otros Domain Controller existentes en la Foresta, esto quiere decir que la corrupcin ser transmitida a los otros DC.

6.1 Recuperacin de base de Datos de Active DirectoryLos mecanismos de recuperacin deben cubrir las siguientes dos causas: Corrupcin Base de datos (Implica Restore Authoritative). Perdida de datos (Implica Restore NO-Authoritative). En cualquier caso de recuperacin de AD, sta se realiza desde un controlador de dominio. As el resto de los Domain Controllers tomarn la base de datos desde ste y sern automticamente recuperados, sin necesidad de recuperarlos todos. En el primer caso la recuperacin nos dejara en un estado similar al cual se tomo el respaldo En el segundo caso solo se restaurarn partes de la particin de Dominio, como por ejemplo una OUy por lo cual requiere una actualizacin del nro. de secuencia. El procedimiento para realizar esta actividad esta descrito a en el subcaptulo 4.11Recuperar un Domain Controller. En cuanto a los tiempos estimados el siguiente cuadro aporta una estimacin:N Tiempo estimado 1 15 min 2 30 min 3 30 min 4 15 min 5 30 min 6 30 min Total 2,5 hrs Actividad Reiniciar servidor Domain Controller del Sitio, en modo Directory Service Restore Mode (con F8) Restaurar el system state del Domain Controller, sin reiniciar. Ejecutar comando NTDSUTIL -> authoritative restore -> Enter -> restore database Reiniciar el servidor Esperar que la replica mandatoria de Domain Controller, sobre el otro controlador de dominio se ejecute Revisar estado de los objetos de Active Directory

6.1.1 Corrupcin total de Active DirectoryTal como se indic el tipo de restore que se debe realizar aqu es Restore Authoritative, lo cual ocacionar que los datos que queden de restauracin realizada en ese Domain Controller, se replicar a todos los otros del dominio. Para realizar esto seguir la siguiente gua: 1. Asegurarse que la falla requiere una restauracin total del dominio 2. De igual manera tomar como resguardo un backup del System State de algn Domain controller, idealmente un Global Catalog. 3. Seguir las instrucciones indicadas en: 4.11.2 Restauracin Authoritative Active Directory 4. Abrir command prompt y tipear ntdsutil. 5. En el prompt de ntdsutil, tipear authoritative restore. 6. En el Prompt de ntdsutil authoritative restore, escribir restore database. 7. En el cuadro de dialogo Authoritative Restore Confirmation, clic OK. 8. Tipear quit hasta salir de Ntdsutil.exe. 9. Reiniciar servidor. Este sera ahora authoritative para el dominio, y los cambios sern replicados a los otros domain controllers. 10. Verificar replica con comando repadmin /showrepl

6.1.2 Perdida de datos de Active DirectoryEn este caso se recuperaran datos perdidos de una OU, sin la intencin de afectar toda la base de directorio. Para esto debemos hacer lo siguiente: 1. Asegurarse que la falla requiere la restauracin parcial de AD 2. Para asegurarse tomar un backup del System State de Domain controller, un Global Catalog. 3. Seguir las instrucciones indicadas en: 4.11.1 Restauracin Non Authoritative 4. Abrir command prompt y escribir ntdsutil.

27

5. 6.

En el prompt ntdsutil, tipearauthoritative restore . En prompt ntdsutil authoritative restore, tipear: Restore Subtree OU=ouname,DC=domain,DC=domainroot Por ejemplo, si sin querer se borr la unidad Organizacional Marketing en el dominio cl.Corp.com, escribir: Restore Subtree OU=Marketing, DC=cl,DC=Corp,DC=COM 7. En el cuadro de dialogo Authoritative Restore Confirmation , clic OK. 8. Tipear quit hasta salir de Ntdsutil.exe. 11. Restart el servidor. Esta OU estar marcada como authoritative para el directorio los cambios sern replicados a los otros domain controllers. 9. Verificar replica con comando repadmin /showrepl

6.2 Domain controller con roles FSMO fallaEn este caso se requiere reasignar nuevamente los roles para poder operar adecuadamente la plataforma. En el caso del dominio en Santiago: cl.Corp.com, los servidores tienen repartido de las siguiente forma los roles FSMO: Schema owner 3kCorpscldc01.Corp.com Domain role owner 3kCorpscldc01.Corp.com PDC role DC2.cl.Corp.com RID pool manager DC2.cl.Corp.com Infrastructure owner DC3.cl.Corp.com Se puede visualizar que los 5 roles estn repartidos en 2 dominios: Corp.com y cl.Corp.com. Los pasos para forzar nuevos servidores operation Master los siguientes: 1. En el Command Prompt, ejecutar ntdsutil. 2. En el prompt ntdsutil: escribir roles y presionar ENTER. 3. En el prompt fsmo maintenance : escribir connections. 4. En el prompt server connections tipear connect to server servername , donde servername es el nombre de DC que asumir la operacin de master role. 5. Luego que se confirma la conexin, tipear quit y presionar ENTER.. 6. Dependiendo del rol que se piense reasignar, ingrese el comando de la tabla y presione ENTER: Role Credentials CommandDomain Naming Master Schema Master Infrastructure Master PDC Emulator Enterprise Admins Enterprise Admins Domain Admins Domain Admins seize domain naming master seize schema master seize infrastructure master seize pdc

RID Master 7.

Domain Admins

seize rid master

El sistema solicitar una confirmacin. Este entonces intentar transferir el rol. Cuando la transferencia falla alguna informacin de error es mostrada y el sistema procede a la reasignacin. Despus que la transferencia se completa una lista de roles y nombres Ldap que mantiene cada rol es mostrada. 8. Durante la reasignacin del rol de RID master, el que mantiene el rol intenta sincronizar con sus partners de replicacin. Si no puede establecer la comunicacin ser mostrado un Warning y se debe confirmar que se desea trasferir el rol haciendo clic en Yes, para proceder. 9. Tipear quit hasta salir de Ntdsutil.exe. 10. Verificar con comando Netdom query FSMO, ubicacin de los roles

28

6.3 Prepare a Domain Controller for Non-Authoritative SYSVOL RestoreEste procedimiento se aplica cuando se corrompe completamente al estructura de sysvol y es necesario iniciar una restauracin non-autoritativa de SYSVOL mediante la modificacin del valor de la BurFlags (backup/restore flags) entrada en el registro. Cambiando el valor a D2 (hexadecimal) o 210 (decimal) antes de desconectar un controlador de dominio inicia una automtica de restauracin no autoritativa de SYSVOL cuando el controlador de dominio se reinicia. Existen entradas separadas para la configuracin de Burflags: global y para conjunto de replica especifica Para iniciar una restauracin non-autoritativa de SYSVOL cuando es la nica replica que slo est representado en el DC, establezca el valor de BurFlags global en: HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\NtFrs\Parameters\Backup/Restore\Process at Startup Si otros conjuntos de rplicas estn presentes en el DC y que desea restaurar slo SYSVOL, establezca el valor especfico de la rplica en: HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\NtFrs\Parameters\Cumulative Replica Sets\SYSVOL GUID Modificacin de la entrada BurFlags para conjunto de replica especifica requiere identificar el GUID SYSVOL en el Registro: 1. En cuadro de Run escribir regedit y luego OK. 2. Buscar la clave HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\NtFrs\Parameters 3. Expandir Parameters. 4. Modificar uande las entradas BurFlags como sigue: Para modificar la entrada BurFlags global: Expandir Backup/Restore, clic en Process at Startup. Para modificar la entrada de un conjunto especifico de replica BurFlags: ExpandIR ambos Cumulative Replica Sets y Replica Sets. Coincidir GUID bajo Replica Sets con los identicos GUID en Cumulative Replica Sets, y clic en el GUID coincidente en Cumulative Replica Sets. 1. En el lado de Detalles, doble-clic BurFlags. 2. En el cuadro Value data escribir D2 hexadecimal o 210 decimal, y luego clic OK

29

7 DRP de DNS y DHCP7.1 Ve