03 August 2009

IM y EM - ITIL V3

Incident Management (IM)

Los objetivos de IM son: - Retornar a la situación de operación normal a la brevedad - Minimizar el impacto en la operación del Negocio - Mantener los niveles óptimos de Calidad y Disponibilidad del Servicio

El Alcance está definido de la siguiente forma: - Cualquier evento que genera o puede llegar a generar una disrupción en un servicio - Requerimientos registrados o reportados por personal técnico - No todos los eventos son Incidentes

Modelos de Incidentes Métodos acordados compuestos de pasos predefinidos para el manejo de un proceso Garantiza que los incidentes “estándar” se manejen de una forma predefinida – Actividades para preservar las evidencias – Plazo de Ejecución y umbrales – Procedimientos de Escalación – Responsabilidades

Plazos de EjecuciónDeben ser acordados para todas las etapas – Basados en los objetivos de respuesta y resolución: SLA, OLA – Se debieran usar herramientas para automatizar los plazos y escalamientos – Los grupos de soporte deben estar informados

Incidentes GravesMenor plazo de Ejecución y mayor urgencia. Incidente con mayor impacto o prioridad: Potencial impacto en el Negocio.

Las actividades de la Gestión del incidente son: 1- Identificación del incidente 2- Registración 3- Categorización 4- Priorización 5- Diagnóstico inicial 6- Escalación 7- Investigación y desarrollo 8- Resolución y recuperación 9- Cierre

IM utiliza métricas para el monitoreo y reporte. Esto sirve para determinar la efectividad y eficiencia. Las métricas serían: - Cantidad total de incidentes - Desglose de incidentes por etapa - Cantidad de incidentes aún sin solución - Cantidad y porcentaje de incidentes graves - Costo promedio por incidente, etc.

Los desafíos de IM son: - Habilidad para detectar los incidentes en forma temprana - Asegurar que todos los incidentes se registren - Disponibilidad de la Información: Problemas y Errores Conocidos - Integración con: • Relaciones entre CI’s y el historial • SLM: para evaluar correctamente el impacto y prioridad • SLM: para usar procedimientos de escalación definidos

Las principales actividades del Incident Manager son: - Es responsable por la efectividad y eficiencia - Genera información de gestión - Administra el trabajo del personal de soporte a Incidentes (1er & 2do nivel) - Monitorea la efectividad del proceso y recomienda mejoras - Desarrolla y mantiene los sistemas para la gestión de incidentes (IMS, Incident Management systems) - Gestiona los Incidentes graves - Desarrolla y mantiene los procesos y procedimientos

Event Management (EM)

Los objetivos de EM son: - Detectar y analizar eventos - Determinar acciones de control apropiadas - Automatizar actividades de la Gestión de Operaciones - Ser el punto de contacto para la ejecución de procesos y actividades - Comparar la performance y el comportamiento actual frente a los estándares del diseño y los SLAs

Existen tipos de eventos diferentes:

- Indicación de operación normal: Notificación de cuando se completó un trabajo planificado, Un usuario que accede a una aplicación y Un e-mail que se despacha a su casilla

- Indicación de excepción: Un usuario que trata de acceder con una clave incorrecta, Un procesador que está trabajando por encima del umbral establecido y Escaneo de PC que indica un software no autorizado

- Indicación de una operación inusual pero no excepcional: Una situación que puede requerir un monitoreo más cuidadoso

Rol del Event Manager

Dado que los eventos ocurren en distintos contextos y por diferentes razones, no es necesaria la figura de un Event Manager. Las actividades se delegan a las Gerencias del Service Desk o de Operaciones de TI.

- Service Desk: Comunicación (Informar a quien corresponda) e Investigación y resolución de eventos (Escalar al equipo de Operaciones apropiado).

- Service Design: Clasificar y Definir: motores de correlación y respuestas automáticas

- Service Transition: Garantizar el funcionamiento apropiado y correcto de los eventos generados y sus respuestas.

- Service Operation: Ejecutar la Gestión de eventos para los sistemas bajo su control

- Technical & Application Management: Involucrados en lo que respecta a los Incidentes y problemas relacionados con los eventos