De onde vêm os incidentes ? Todo serviço possui erros, falhas ou vulnerabilidades que podem causar incidentes e podem se originar de qualquer uma das quatro dimensões do gerenciamento de serviço.

Por exemplo:

  • Um parte de um software pode ter um bug;
  • Algum equipamento pode ter memória corrompida ou problemas em componentes;
  • Um fornecedor pode não ter condições para resolver problemas de um serviço, de acordo com as metas acordadas;
  • Alguns erros podem permanecer não identificados ou não resolvidos durante o desenvolvimento e implantação do serviço e podem representar um risco para os serviços ativos.

O ITIL define um problema como uma causa, ou causa potencial, de um ou mais incidentes. Um erro conhecido é um problema que foi analisado, mas não resolvido. Então, como gerenciamos esses problemas e erros conhecidos antes que eles causem problemas mais sérios? Vejamos a prática de Gestão de Problemas do ITIL 4.

O que é Gestão de Problemas?

O objetivo da Gestão de Problemas é reduzir a probabilidade e o impacto dos incidentes, identificando as causas reais e potenciais dos mesmos e gerenciando soluções alternativas e erros conhecidos.

Os problemas estão relacionados a incidentes, mas é importante diferenciá-los na forma como são gerenciados:

  • Os incidentes têm um impacto sobre os usuários ou processos de negócios e devem ser resolvidos para que a atividade normal de negócios possa ocorrer.
  • Os problemas são as causas dos incidentes, portanto, eles exigem investigação e análise para identificar as causas, desenvolver soluções alternativas e recomendar soluções de longo prazo. Isso reduz o número e o impacto de incidentes futuros.

3 fases de Gestão de Problemas

A Gestão de Problemas envolve três fases distintas:

1 – Identificação do Problema

Atividades de identificação de problemas identificam e registram problemas por:

  • Execução de análise de tendência de registros de incidentes;
  • Detecção de problemas duplicados e recorrentes;
  • Identificação de riscos que um incidente possa ocorrer novamente;
  • Análise de informações recebidas de fornecedores e parceiros;
  • Análise de informações recebidas de desenvolvedores de software internos, equipes de teste e equipes de projeto.

2 – Controle de Problemas

As atividades de controle de problemas incluem análise de problemas e documentação de soluções alternativas e erros conhecidos. Assim como os incidentes, os problemas serão priorizados com base no risco que representam em termos de probabilidade e impacto nos serviços. O foco deve ser dado aos problemas que apresentam maior risco para os serviços e gerenciamento de serviços.

Ao analisar incidentes, é importante lembrar que eles podem ter causas inter-relacionadas, que podem ter relacionamentos complexos. Portanto, a análise do problema deve ter uma abordagem holística, considerando todas as causas contributivas, como aquelas que causaram a ocorrência do incidente, pioraram o incidente ou mesmo o prolongaram.

Pausa para um recado: para obter mais informações, consulte os artigos ITIL em nosso blog. Também é importante se inscrever para receber textos como este. Para isso, deixe seu nome e endereço de e-mail no formulário abaixo:


Quando um problema não pode ser resolvido rapidamente, geralmente é útil localizar e documentar uma solução alternativa para incidentes futuros, com base no entendimento do problema. Uma solução alternativa é definida como uma solução que reduz ou elimina o impacto ou a probabilidade de um incidente ou problema para o qual uma resolução completa ainda não está disponível.

Um exemplo de solução alternativa poderia ser reiniciar serviços em um aplicativo ou chavear para um equipamento secundário de apoio. As soluções alternativas são documentadas em registros de problemas e isso pode ser feito em qualquer estágio, sem necessariamente ter que esperar a conclusão da análise. No entanto, se uma solução alternativa foi documentada no início do controle do problema, ela deve ser revisada e aprimorada após a conclusão da análise do mesmo.

Uma solução alternativa eficaz para o incidente pode se tornar uma forma permanente de lidar com alguns problemas, nos quais a resolução dele não é viável ou econômica. Se for esse o caso, o problema permanecerá no status de erro conhecido e a solução alternativa documentada será aplicada quando ocorrerem incidentes relacionados. Cada solução alternativa documentada deve incluir uma definição clara dos sintomas e do contexto ao qual se aplica. Soluções alternativas podem ser automatizadas para maior eficiência e aplicação mais rápida.

3 – Controle de Erro

As atividades de controle de erros gerenciam erros conhecidos e podem permitir a identificação de possíveis soluções permanentes. Quando uma solução permanente requer controle de mudanças, isso deve ser analisado do ponto de vista de custo, risco e benefícios.

O controle de erros também reavalia regularmente o status de erros conhecidos que não foram resolvidos, levando em consideração o impacto geral sobre os clientes e / ou a disponibilidade do serviço e o custo das soluções permanentes e a eficácia das soluções alternativas. A eficácia das soluções alternativas deve ser avaliada sempre que uma solução alternativa é usada, pois ela pode ser aprimorada com base na avaliação.

Relacionamento entre Gestão de Problemas e outras práticas

Gestão de Incidentes
As atividades dessas duas práticas estão intimamente relacionadas e podem complementar-se (por exemplo, identificar as causas de um incidente é uma atividade de Gestão de Problemas que pode levar à resolução do incidente), mas também podem entrar em conflito (por exemplo, investigar a causa de um incidente pode atrasar as ações necessário para restaurar o serviço).
Gestão de Riscos
As atividades de Gestão de Problemas visam identificar, avaliar e controlar os riscos em qualquer uma das quatro dimensões do gerenciamento de serviços. Portanto, pode ser útil adotar ferramentas e técnicas de gerenciamento de risco.
Habilitação de Mudança
A Gestão de Problemas normalmente inicia a resolução por meio do controle de mudanças e participa da revisão pós-implementação. No entanto, a aprovação e a implementação estão fora do escopo da Gestão de Problemas.
Gestão do Conhecimento
A saída da Gestão de Problemas inclui informações e documentação sobre soluções alternativas e erros conhecidos. Além disso, o Gestão de Problemas pode utilizar informações em um sistema de gerenciamento de conhecimento para investigar, diagnosticar e resolver problemas.
Melhoria Contínua
As atividades de Gestão de Problemas podem identificar oportunidades de melhoria em todas as quatro dimensões do gerenciamento de serviços. Soluções para problemas podem ser documentadas em um registro de melhoria contínua ou adicionadas a um backlog do produto.

Aspectos pessoais da Gestão de Problemas

Muitas atividades da Gestão de Problemas dependem do conhecimento e da experiência da equipe, ao invés de procedimentos detalhados e documentados.

Habilidades e capacidades em Gestão de Problemas incluem a habilidade de entender sistemas complexos e pensar sobre como diferentes falhas podem ter ocorrido.

O desenvolvimento desta combinação de capacidade analítica e criativa requer orientação e tempo, bem como treinamento adequado de técnicas como Cynefin, Kepner e Tregoe, 5-Porquês, diagramas de Ishikawa e análise de Pareto, Design Thinking entre outras.

Gestão de Problemas na Cadeia de Valor do Serviço

Como a Gestão de Problemas lida com erros no ambiente operacional, els está envolvida principalmente na melhoria, entrega e suporte às atividades da cadeia de valor do serviço, conforme mostrado abaixo:

Envolver
Os clientes podem desejar se envolver na priorização de problemas, e o status e os planos para o Gestão de Problemas devem ser comunicados.
Design e Transição
O Gestão de Problemas fornece informações que ajudam a melhorar os testes e a transferência de conhecimento.
Obter e Construir
Os defeitos do produto podem ser identificados pelo Gestão de Problemas e gerenciados durante esta atividade.
Entregar e apoiar
A Gestão de Problemas dá uma contribuição significativa, evitando a repetição de incidentes e apoiando a resolução oportuna de incidentes.
Melhorar
O gerenciamento eficaz de problemas fornece o entendimento necessário para reduzir o número de incidentes e o impacto dos incidentes que não podem ser evitados.

Final

A Gestão de Problemas é extremamente importante para localização e solução definitiva de incidentes. Esse é o foco. É possível, e recomendado, termos soluções de contorno para erros conhecidos, mas a intenção é sempre resolver o Problema de forma definitiva e com baixo custo.