Gerenciamento de Incidente Neste módulo, iremos apresentar o Processo de Gerenciamento de Incidente, mostrando como pode ser tratado as requisições dos usuários Durante este módulo iremos: Apresentar o propósito do processo de Gerenciamento de Incidente Entender os principais conceitos envolvidos Entender o fluxo de tratamento de um incidente Entender como lidar com prioridades e escalonamento Apresentar principais benefícios do processo
Missão Restaurar o serviço normal o mais rápido possível com o mínimo de interrupção, minimizando os impactos negativos nas áreas de Negócio
Escopo O escopo do Gerenciamento de Incidente é muito amplo e pode incluir itens que afetem o serviço ao cliente como por exemplo: Falha de hardware Erro de software Solicitações de informações Troca de senha Novos funcionários Solicitação para compra de suprimentos (cartucho de tinta,mouse) Problemas de desempenho
Objetivos Restaurar o serviço normal o mais rápido possível com o mínimo de interrupção, atendendo aos prazos de ANSs estabelecidos. Minimizar os impactos negativos nas áreas de Negócio. Manter os usuários informados sobre o status de seus incidentes. Identificar incidentes que podem voltar a ocorrer novamente e se achar viável, repassar para a equipe de Gerenciamento de Problema.
Conceitos Incidente: qualquer evento que não é parte padrão da operação de um serviço que causa, ou pode causar uma interrupção ou redução da qualidade do serviço. Requisição de Serviço: pode ser resumido como qualquer solicitação/contato que não é uma falha na Infra-estrutura de TI. Problema: é quando a causa raiz de um ou mais incidentes é desconhecida. Erro Conhecido: quando a causa raiz de um problema é conhecida e já se tem uma solução de contorno. Solução de Contorno (work-around): este é um método de contornar um incidente a partir de uma reparação temporária.
Entradas, Saídas e Atividades Incidentes entram no processo Service Desk Operações Redes Outras fontes de incidentes Procedimentos de Requisição de Serviço Roteamento Processo de Gerenc. de Incidente Detecção e Registro de Incidentes Classificação e Suporte Inicial Diagnóstico e Resolução Recuperação Encerramento Propriedade, Monitoração, Acompanhamento e Comunicação RDM Gerenciamento de Mudança Soluções de contorno BD de Problemas e Erros conhecidos Detalhes Configuração BDGC Comunicação
Ciclo de Vida de um Incidente Propriedade, Monitorar, Acompanhar, Comunicar Detecção e Registro do Incidente Classificação e Suporte Inicial Requisição de Serviço? N Investigação e Diagnóstico Resolução, Recuperação e Restauração Fechamento do Incidente S Procedimento de requisição de serviços
Ciclo de Vida de um Incidente Atividades Incidente é Detectado / reportado Status Novo Classificação Aceito Suporte Inicial Assumido Agendado Investigação e diagnóstico Em andamento Aguardando Resolução e recuperação Resolvido Fechamento do Incidente Fechado
Priorização Impacto Alto Médio Baixo Urgência Alta Média 1 2 2 3 3 4 Baixa 3 4 5 Impacto = criticidade para o negócio Urgência = velocidade que o incidente precisa ser resolvido Nesta tabela, temos um exemplo de tempo que pode ser acordado para resolver cada incidente com base na sua prioridade. Prioridade 1 2 3 4 Descrição Crítica Alta Média Baixa Tempo para atendimento 1 hora 4 horas 24 horas 48 horas 5 Planejada -
Categorização Tipo de Incidente Categoria Principal Sub-categoria Prioridade Falha Software MS Word MS Excel ERP 2 2 1 Hardware Servidores PCs 1 2 Solicitação de Serviço Troca de Senha Troca de Cartucho Tinta Ajuda ao usuário Sistema Contabilidade Sistema Faturamento 1 3 2 1
Escalonamento Hierárquico Diretor Gerente 1 Gerente 2 Desktop Aplicações Operações Rede Funcional
Níveis de Suporte Service Desk 1º Nível 2º Nível 3º Nível n Nível Detectar e registrar Procedimento De requisição De Serviço S Requisição N Suporte Inicial Resolvido N Investigar Diagnosticar Solução Restauração Resolvido Solução Restauração N Investigar Diagnosticar Resolvido N etc Encerra Solução Restauração
Relação entre Incidente, Problema, Erro Conhecido e RDM Erro na Infra-estrutura Incidente Problema Erro Conhecido RDM Solução Estruturada Incidente = evento que não é parte da operação padrão e afeta qualidade Problema = Causa desconhecida Erro Conhecido = Causa diagnosticada + solução de contorno (workaround) RDM = Requisição de Mudança na Infra-estrutura ou no Serviço
Funções A função de Gerente de Incidente na maioria das organizações é atribuída para o Gerente de Service Desk. A função de gerente de Incidente inclui responsabilidades para: Monitorar a eficiência e eficácia do processo Controlar o trabalho dos grupos de suporte Fazer recomendações para melhorias Desenvolver e manter o sistema de Gerenciamento de Incidente Reportar a gerência de TI e outras áreas de processo
Relacionamentos Gerenciamento de Configuração Gerenciamento de Problema Gerenciamento de Mudança Informação sobre Infra-estrutura de TI Incidentes com causa Raiz desconhecida Erros conhecidos & Soluções de contorno RDMs Requisições de Serviço Clientes Soluções Gerenciamento de Incidente Informação I n f o r m a ç ã o Gerenciamento de Nível de Serviço Gerenciamento de Disponibilidade Gerenciamento de Capacidade Gerenciamento Financeiro Gerenciamento de Continuidade Gerenciamento de Liberação
Fatores Críticos de Sucesso Sistema para automatizar o Gerenciamento de Incidentes para a Central de Serviços Banco de Dados de Gerenciamento da Configuração (BDGC) atualizado Base de conhecimento com FAQs, Erros Conhecidos, Soluções de Contorno Vínculo estreito com o Gerenciamento de Nível de Serviço A equipe de Service Desk teve ter conhecimento necessário Estruturação dos níveis de suporte
Problemas Comuns Falta de gestão ou comprometimento da equipe Falta de entendimento das necessidades do negócio Falta de revisão das práticas Falta de objetivos, metas e responsabilidades Sem provisão de ANS com clientes Falta de conhecimento da equipe Falta de integração com outros processos Falta de ferramentas Resistência a mudanças
Custos Alguns itens que devem ser contabilizados na implementação do GNS: Ferramentas de apoio (Hardware e Software) Custos com a Equipe Instalação (Acomodação) Treinamento Documentação Base Conhecimento
Provimento de Informações Gerenciais Revisões diárias de incidentes individuais e status de Problemas com referência a níveis de serviços Revisões de gestão semanal Revisões de gestão mensal Informações sobre serviços pró-ativos
Principais Benefícios Impacto dos Incidentes reduzidos (devido ao tempo de resolução) Suporte aos ANS s Eliminação de Incidentes perdidos Melhor utilização da equipe de suporte, atingindo uma eficiência melhor Exportação de Dados para o Gerenciamento de Problema Melhoria na satisfação do Usuário Menos interrupção da Equipe de suporte de segundo/terceiro nível
IPDs - Indicadores Principais de Desempenho Número total de incidentes por área de Negócio, departamento, natureza Número de Incidentes resolvidos por operador Redução do tempo médio de Solução Distribuição de Solução entre os níveis de suporte Percentual de incidentes resolvidos com a Base de Conhecimento
Retorno Sobre o Investimento - ROI Com a implantação deste processo, haverá uma redução do downtime do usuário Exemplo do Benefício: Se reduzirmos o downtime do usuário em 1 minuto por dia, teremos uma economia de R$ 83,300,00 por ano ( 500 usuários x 200 dias x R$ 0,833 por minuto)