15 nov 2010

Gestion de Problemas de ITIL

Gestión de Problemas

Las funciones principales de la Gestión de Problemas son:
·   Investigar las causas subyacentes a toda alteración, real o potencial, del servicio TI.
·   Determinar posibles soluciones a las mismas.
·   Proponer las peticiones de cambio (RFC) necesarias para restablecer la calidad del servicio.
·   Realizar Revisiones Post Implementación (PIR) para asegurar que los cambios han surtido los efectos buscados sin crear problemas de carácter secundario.
La Gestión de Problemas puede ser:
Reactiva: Analiza los incidentes ocurridos para descubrir su causa y propone soluciones a los mismos.
Proactiva: Monitoriza la calidad de la infraestructura TI y analiza su configuración con el objetivo de prevenir incidentes incluso antes de que estos ocurran.
Las interacciones y funcionalidades de la Gestión de Problemas se resumen sucintamente en el siguiente interactivo:

            ¿Qué ITIL Gestión del Problema hacer?
El objetivo último de la gestión problema consiste en determinar cuál podría ser la causa de los problemas y evitar que se desarrolle. En otras palabras, la administración de problemas es la prevención a los problemas. Mientras que hay otros departamentos, tales como gestión de incidentes, acuerdo que con los clientes y volver a la normalidad el servicio, gestión de problemas se centra en encontrar formas de prevenir un problema se produzca en primer lugar. Mediante la aplicación de medidas preventivas, una organización de TI puede garantizar que sus productos estadía completa durante más tiempo.
Para dividir el trabajo, gestión de problemas divide las cosas en dos categorías.
·         El primero es el problema que es una causa desconocida de los incidentes. La causa se desconoce, pero hay un incidente que debe ser resuelto. Por lo tanto, el problema en este caso es lo incidente y sus causas.
·         La segunda categoría es el error conocido. Este es un problema que ha sido diagnosticado. Ahora que el departamento sabe lo que está causando el problema y cuál es el problema concreto, pueden entrar y comenzar a hacer cambios.
La forma en que el trabajo de dos es sencillo. El proceso de control de errores trabaja para diagnosticar los errores conocidos de forma continua hasta que se eliminan. Por otro lado, el proceso de control problema es identificar la causa raíz de los incidentes. También clasificación de los problemas y registrar los diferentes problemas.
Una vez que el problema se ha reducido, crear un informe que se envía al escritorio de gestión de servicios, así como la mesa de incidente. De esta manera, cuando un cliente llama, estas dos comunicaciones son capaces de manejar mejor el problema y guiar al cliente a través de una serie de pasos para deshacerse del problema.
Introducción y Objetivos
Esta tiene como exclusivo objetivo el restablecer lo más rápidamente la calidad del servicio y no el determinar cuales han sido los orígenes y causas del mismo.
Cuando algún tipo de incidente se convierte en recurrente o tiene un fuerte impacto en la infraestructura TI es la función de la Gestión de Problemas el determinar sus causas y encontrar posibles soluciones.
Cabe diferenciar entre:
Problema: causa subyacente, aún no identificada, de una serie de incidentes o un incidente aislado de importancia significativa.
Error conocido: Un problema se transforma en un error conocido cuando se han determinado sus causas.
Los principales conceptos involucrados en el proceso de Gestión de Problemas y su relación con la Gestión de Incidentes se resumen en el siguiente interactivo:

Entre las funciones principales de la Gestión de Problemas figuran:
·   Identificar, registrar y clasificar los problemas.
·   Analizar y determinar las causas de los problemas y proponer soluciones.
·   Realizar un seguimiento post-implementación de todos los cambios para asegurar su correcto funcionamiento.
·   Realizar informes que documenten no sólo los orígenes y soluciones a un problema sino que también sirvan de soporte a la estructura TI en su conjunto.
·   Analizar tendencias para prevenir incidentes potenciales.
Los principales beneficios de una correcta Gestión de Problemas:
·   Un aumento de la calidad general de los servicios TI.
·   Se minimiza el número de incidentes.
·   Los incidentes se solucionan más rápidamente y, generalmente, en la primera línea de soporte TI ahorrando recursos e innecesarios escalados.
Las principales dificultades a la hora de implementar la Gestión de Problemas se resumen en:
·   Mantener actualizadas las bases de datos asociadas requiere un compromiso por parte de todos los agentes implicados que frecuentemente requiere un seguimiento cercano de los responsables de la infraestructura TI.
·   Aumento de los costes por la contratación de personal especializado, aunque estos se vean sobradamente compensados por los beneficios derivados.

Proceso
Las principales actividades de la Gestión de Problemas son el:
Control de Problemas: se encarga de registrar y clasificar los problemas para determinar sus causas y convertirlos en errores conocidos.
Control de Errores: registra los errores conocidos y propone soluciones a los mismos mediante RFCs que son enviadas a la Gestión de Cambios. Asimismo efectúa la Revisión Post Implementación de los mismos en estrecha colaboración con la Gestión de Cambios.
El siguiente diagrama muestra los procesos implicados en la correcta Gestión de Problemas:

Proceso - Control de Problemas
El principal objetivo del Control de Problemas es conseguir que estos se conviertan en Errores Conocidos para que el Control de Errores pueda proponer las soluciones correspondientes.
El Control de Problemas se compone en esencia de tres fases:

1. Identificación y Registro
Una de las tareas principales de la Gestión de Problemas es identificar los mismos. Las principales fuentes de información utilizadas son:
·   La base de datos de Incidentes: en principio cualquier incidente del que no se conocen sus causas y que se ha cerrado mediante algún tipo de solución temporal es potencialmente un problema. Sin embargo, se habrá de analizar si este incidente es aislado o su impacto en la estructura TI antes de elevarlo a la categoría de problema.
·   Análisis de la infraestructura TI: en colaboración con la Gestión de Disponibilidad y de Capacidad, la Gestión de Problemas debe analizar los diferentes procesos y determinar en que aspectos se debe reforzar los sistemas y estructuras TI para evitar futuros problemas.
·   Deterioro de los Niveles de Servicio: el descenso del rendimiento puede ser una indicación de la existencia de problemas subyacentes que no se hayan manifestado de forma explicita como incidentes.
Todas las áreas de la infraestructura TI deben colaborar con la Gestión de Problemas para identificar problemas reales y potenciales informando a ésta de cualquier síntoma que pueda ser señal de un deterioro en el servicio TI.
El registro debe incorporar, entre otra, información sobre:
·   Causas del problema.
·   Síntomas asociados.
·   Soluciones temporales.
·   Servicios involucrados.
·   Niveles de prioridad, urgencia e impacto.
·   Estado: activo, error conocido, cerrado.
2. Clasificación y Asignación de Recursos
La clasificación del problema engloba desde las características generales de éste, tales como si es un problema de hardware o software, que áreas funcionales se ven afectadas y detalles sobre los diferentes elementos de configuración (CIs) involucrados en el mismo.
Una vez clasificado y determinada su prioridad se deben de asignar los recursos necesarios para su solución. Estos recursos deben ser suficientes para asegurar que los problemas asociados son tratados eficazmente y así minimizar su impacto en la infraestructura TI.
3. Análisis y Diagnóstico: Error conocido
Los objetivos principales del proceso de análisis son:
·   Determinar las causas del problema.
·   Proporcionar soluciones temporales a la Gestión de Incidentes para minimizar el impacto del problema hasta que se implemente los cambios necesarios que lo resuelvan definitivamente.
Es esencial tener en cuenta que no siempre el origen del problema es un error de hardware o software. Es moneda frecuente que el problema este causado por:
·   Errores de procedimiento.
·   Documentación incorrecta.
·   Falta de coordinación entre diferentes áreas.
Una vez determinadas las causas del problema éste se convierte en un Error Conocido y se remite al Control de Errores para su posterior procesamiento.

Proceso - Control de Errores

Una vez que el Control de Problemas ha determinado las causas de un problema es responsabilidad del Control de Errores el registro del mismo como error conocido.

Identificación y Registro de errores
El registro de los errores conocidos es de vital importancia para la Gestión de Incidentes pues debe llevar asociado, siempre que esto sea posible, algún tipo de solución temporal que permita minimizar el impacto de los incidentes asociados.
Análisis y Solución
Se deben investigar diferentes soluciones para el error evaluando en cada momento:
·   El posible impacto de las mismas en la infraestructura TI.
·   Los costes asociados.
·   Sus consecuencias sobre los SLAs.
Una vez determinada la solución óptima al problema y antes de elevar una RFC a la Gestión de Cambios han de tenerse en cuenta las siguientes consideraciones:
·   ¿Es conveniente demorar la solución? Ya sea porque se prevén cambios significativos en la infraestructura TI a corto plazo o por el escaso impacto del problema en cuestión.
·   ¿Es la solución temporal aportada suficiente para mantener unos niveles de calidad de servicios aceptable?
·   ¿Los beneficios justifican los costes asociados?
Sea cual sea la respuesta, todo la información sobre el error y su solución se registrará en las bases de datos asociadas. En el caso en el que se considere que el problema necesita ser solucionado se emitirá una RFC. Será responsabilidad de la Gestión de Cambios la implementación de los cambios de infraestructura propuestos.
Revisión Post Implementación y Cierre
Antes de dar el problema por resuelto y cambiar su estado a “cerrado” se debe analizar el resultado de la implementación de la RFC elevado a la Gestión de Cambios (PIR).
Si los resultados de esta PIR son los deseados y se pueden cerrar todos los incidentes relacionados con este problema se considera concluido el proceso y se emiten los informes correspondientes.

Control del Proceso

El objetivo de la Gestión de Problemas no es otro que el de mejorar el funcionamiento de la infraestructura TI y para evaluar su eficacia es imprescindible realizar un continuo seguimiento de los procesos relacionados y evaluar su rendimiento.
En particular una buena gestión de problemas debe traducirse en una:
·   Disminución del número de incidentes y una más rápida resolución de los mismos.
·   Mayor eficacia en la resolución de problemas.
·   Gestión proactiva que permita identificar problemas potenciales antes de que estos se manifiesten o provoquen una seria degradación de la calidad del servicio.
La correcta elaboración de informes permite evaluar el rendimiento de la Gestión de Problemas y aporta información de vital importancia a otras áreas de la infraestructura TI.
Entre la documentación generada cabría destacar:
·   Informes de Rendimiento de la Gestión de Problemas: donde se detalle el número de errores resueltos, la eficacia de las soluciones propuestas, los tiempos de respuesta y el impacto en la Gestión de Incidentes.
·   Informes de Gestión Proactiva: donde se especifiquen las acciones ejercidas para la prevención de nuevos problemas y los resultados de los análisis realizados sobre la adecuación de las estructuras TI a las necesidades de la empresa.
·   Informes de Calidad de Productos y Servicios: donde se evalúe el impacto en la calidad del servicio de los productos y servicios contratados y que eventualmente puedan permitir adoptar decisiones informadas sobre cambios de proveedores, etc.
Una eficaz Gestión de Problemas también requiere determinar claramente quienes son los responsables de cada proceso. Sin embargo, en pequeñas organizaciones es recomendable no segmentar en exceso las responsabilidades para evitar los costes asociados: sería poco eficaz y contraproducente asignar unos recursos humanos desproporcionados al proceso de identificación y solución de problemas.

3 comentarios: