Diretoria de Pesquisas e Informações Estratégicas II Encontro Nacional Sobre Cooperação para Prevenção e Combate à Corrupção Fiscalização preditiva com uso de inteligência Gilson Libório Diretor de Pesquisas e Informações Estratégicas 55 (61) 2020-7277 liborio@cgu.gov.br
Big data is high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making. Gartner G A R T N E R
ESPERANÇA Ouvimos sempre que estamos esperando algo... Ouvimos sempre que estamos esperando alguém... Precisamos fazer: Eu, Tu, Ele, NÓS é ESPERANÇAR
Técnicas Utilizadas Auditoria Contínua Análise Multicritério Classificação Regressão Mineração de Textos Modelagem de Tópicos Detecção de Anomalia Análise de Redes Sociais Clusterização Inteligência de Negócio
Atividades - Evolução patrimonial - Credit Score fornecedores da APF - RISCO de corrupção - Mineração de dados fracionamento - Mineração de texto denúncia, LAI
Uso de Credit Score para Classificar Fornecedores da APF Identificação de fornecedores com perfil semelhante aos cadastrados no Cadastro Nacional de Empresas Inidôneas e Suspensas (CEIS)
CREDIT SCORING C l i e n t e! F o r n e c e d o r
Frutos de Parceria $$ para avaliar o ODP.estadual 83%
Análise de Risco de Corrupção de Servidores Públicos Federais Identificação de risco de corrupção através da análise cadastral, histórica e comportamental do servidor público
Desafio: Transformar dados em indicadores confiáveis Como? Estatística Mineração de Dados Computação em Larga Escala Conhecimento Especializado dos Analistas da DIE
Metodologia Mineração de Dados Suporte Estatístico Inicial 2 k l i 1 j 1 2 O E E ij ij ij Seleção de Atributos Relevantes Aprendizagem de Máquina Embasamento Teórico Implantação de Modelo no Sistema SIM Tratamento Básico de Dados Pré-Processamento de Dados Validação de Modelos Modelo Final Confiável? Discretização Sampling Agregação Pivoteamento Normalização Datasets Ajuste de Modelos Teste de Modelo Final Padronização Atualização
Detecção Preventiva de Fracionamento de Compras Identificação de fracionamento de compras públicas de forma preventiva, antes mesmo que ela se concretize
Dados Utilizados análise do especialista SIASG CPF CNPJ CNAE Compras de materiais e serviços de TI 2005 a 2010 42 atributos ~ 70 mil registros? IDs? centavos e bilhões 26 atributos
Confirmar operação?? Possível Fracionamento O sistema identificou que há outras compras semelhantes a essa, que podem caracterizar um fracionamento. Usuário XXXX, matrícula YYYY, tem certeza que deseja continuar?
Triagem Automática de Denúncias Identificação e encaminhamento automático de denúncia para as principais áreas envolvidas de acordo com texto informado na denúncia
Fluxo da Triagem de Denúncias Denúncias PROTOCOLO Ouvidoria (35 mil) Habilitadas DSSAU DSEDU. DRDAG 91 diferentes áreas da CGU Lixo Eletrônico (17 mil ) Inabilitadas Dados insuficientes Não é competência CGU.. Arquivadas Já foi Ficalizada
Desafios Erros de Ortografia Lixo Eletrônico
Identificação Automática de Tipos de Pedidos mais Frequentes da LAI Identificação dos principais assuntos abordados nos mais de 300 mil pedidos de informação no e-sic
Problema da LAI Como você organizaria + de 300 mil pedidos? Operações Úteis Descrever pequeno resumo Achar documento por tema Achar documentos correlatos Modelagem de Tópicos Descobrir tópicos em uma grande quantidade de documentos Descrever uma coleção de documentos via tópicos
Tópicos - Negado 44.322 pedidos (~14,71%)
Tópicos - Negado Concurso Público "gostaria de ser informada sobre a minha classificacao final no concurso... relativa ao edital... ou seja quero a classificacao obtida apos a eliminacao de 1715 candidatos nas provas de aptidao fisica psicologica exames medicos e investigacao social atenciosamente e desde ja agradeco..." "gostaria de obter as seguintes informacoes 01 quantidade de servidores concursados do poder executivo federal e o gasto mensal com os salarios destes servidores 02 quantidade de servidores nomeados em cargo de confiaca do poder executivo federal e o gasto mensal com os salarios destes servidores 03 quantidade de servidores aposentados vinculados ao poder executivo federal e o gasto mensal com a aposentadoria destes servidores" "venho requerer minha classificacao apos provas objetivas e subjetiva teste de aptidao fisica e exames medico considerando as eliminacoes no concurso no concurso publico para provimento de vagas e formacao de cadastro de reserva no cargo de... da terceira classe prova aplicada pela banca... a banca examinadora se omite da prestacao da informacao ou a presta equivocadamente... " "solicito informar a quantidade de empregados do cargo de analista de sistemas que foram promovidos de estagio do cargo conforme a seguir desde a implantacao do... analista de sistemas 1 do estagio jr para o pleno 2 do estagio jr para o pleno 2 do estagio pl para o..."
Tempo de processamento (min) Pontuação do Agrupamento Desafios Tempo de Execução? Big Data?! Quantos Tópicos? 700 600 0,9 0,8 500 400 0,7 0,6 0,5 300 0,4 200 0,3 100 0,2 0,1 0 10.000 20.000 130.000 300.000 Número de pedidos 0 1 10 20 30 40 50 60 70 80 90 100 Número de tópicos 10 horas x 100 rodadas = 1.000 horas ou ~ 41 dias se 100 núcleos (paralelo) 10 horas
Prêmios Eficiência na Administração Pública Conhecimento Governamental Governo para cidadãos Gestão da Informação Informação de Custos e Qualidade do Gasto no Setor Público
Diretoria de Pesquisas e Informações Estratégicas II Encontro Nacional Sobre Cooperação para Prevenção e Combate à Corrupção OBRIGADO Gilson Libório Diretor de Pesquisas e Informações Estratégicas 55 (61) 2020-7277 liborio@cgu.gov.br