AFC Consultoria Estatística Treinamento Modelagem Estatística para Big Data em Seguros
Apresentação Em um cenário onde a dinâmica dos negócios evolui rapidamente e a formação acadêmica dos profissionais não acompanha estas transformações com a mesma velocidade, a educação continuada na forma de cursos livres, oferecida por consultorias com expertise na área, vem preencher esta lacuna oferecendo ao profissional a possibilidade de estar sempre preparado para os desafios de um mercado competitivo. As boas práticas aplicadas à gestão de riscos são determinantes para a sustentabilidade dos negócios realizados por empresas seguradoras, onde as subscrições e o provisionamento técnico são orientados por modelos que embutem componentes aleatórios. A escolha dos modelos que melhor se ajustam as incertezas decorrentes dos riscos assumidos deve ser feita por profissionais bem fundamentados teoricamente. Além das melhores escolhas, uma sólida base teórica permite a correta interpretação da complexa interação que existe entre as variáveis modeladas. Outro aspecto importante é que a busca por uma formação teórica está em perfeita sinergia com a visão prática que o cotidiano corporativo exige dos profissionais envolvidos com a gestão de risco de subscrição, na medida em que a teoria aliada à prática irão produzir os melhores números para subsidiar as decisões estratégicas da empresa. Neste sentido, a AFC Consultoria Estatística oferece o treinamento Modelagem Estatística para Big Data em Seguros, um curso de capacitação de média duração (80 horas/aula), com o objetivo de contribuir com a qualificação do corpo técnico das empresas seguradoras, difundindo conhecimento relevante de métodos estatísticos e atuariais aplicados ao mercado de seguros. 2
O Big Data De forma objetiva, Big Data é um volume tão grande de informações, geradas por diversas fontes, que já não é mais possível de serem tratadas com as ferramentas usualmente utilizadas para esse fim. O conceito se completa com a capacidade de se tirar valor dessa enorme quantidade de dados de forma rápida, diversificada e confiável. São os conhecidos 5 V s que fundamentam o Big Data: Volume: enorme quantidade de dados. Valor: investimento necessário para gerar retorno para as empresas. Velocidade: a gestão dessas informações deve ser rápida, senão, perde-se o valor. Veracidade: os dados devem ser consistentes, senão, perde-se o valor. Variedade: são diversas as suas fontes geradoras. São múltiplas as aplicações dessa ferramenta, como, por exemplo, na publicidade, onde as empresas desejam se comunicar com os mais distintos grupos de consumidores, com o objetivo de conhecer suas preferências; na saúde, onde hospitais armazenam as informações dos pacientes no momento da triagem e dos futuros diagnósticos, assim, do cruzamento desses dados é possível antecipar diagnósticos e indicar tratamentos. Na indústria dos seguros o tratamento de grandes bases de dados sempre foi o alicerce da precificação e do provisionamento, porém, o acesso a um big data aliado ao desenvolvimento dos modelos preditivos permitem às empresas seguradoras oferecerem novas coberturas, maior capacidade de prevenção dos sinistros e produtos mais customizados à necessidade do segurado, como, por exemplo, a telemetria associada ao seguro de automóvel que permite a seguradora ter uma melhor compreensão dos hábitos individuais do motorista. 3
Estrutura do Curso O curso está dividido em módulos que serão apresentados no decorrer de 80 horas/treinamento. A composição do curso por módulos apresenta o seguinte formato: Módulo I: Introdução ao Big Data e ao software R 12 horas/aula Módulo II: Análise Exploratória de Dados 12 horas/aula Módulo III: Análise Multivariada de Dados 12 horas/aula Módulo IV: Modelos de Regressão 20 horas/aula Módulo V: Métodos Preditivos 24 horas/aula O curso será realizado regularmente as segundas (das 19:00 às 22:40), na Av. Paulista, 1471 12º andar Conjunto 1203. O local do treinamento fica ao lado da estação de metrô Trianon-Masp. Para os alunos que utilizam condução própria existe estacionamento particular na Av. Paulista, 1420. As aulas terão início em 04/06/2019 com término em 15/10/2019 (calendário detalhado segue em anexo). Inscrições Informações podem ser obtidas pelos telefones (11) 97130-4343 e as inscrições podem ser realizadas, no período de 22/04/2019 a 24/05/2019, pelo preenchimento e envio do formulário de inscrição (afcconsultoriaestatistica.com.br) para aldy@afcconsultoriaestatistica.com.br. O número de inscritos necessários para a realização do treinamento é de 14 participantes e a confirmação sobre a abertura da turma será enviada aos participantes no dia 27/05/2019. 4
Investimento O investimento necessário será de R$ 5.400,00 que pode ser dividido: Inscrição no valor de R$ 900,00 (até 24/05/2019); 05 parcelas de R$ 900,00 (junho de 2019 a outubro de 2019). Condições Finais 1. O investimento no treinamento inclui material didático, coffee break e certificado. 2. O material didático será distribuído em meio eletrônico (pdf) antes de cada aula, para que os alunos tenham conhecimento do conteúdo que será ministrado. 3. A emissão do certificado está condicionada a uma frequência mínima de 75% no treinamento. 4. O número de vagas no treinamento é limitado a 20 participantes. 5. O uso de computadores para realização de atividades práticas durante o treinamento é indispensável. Solicitamos que os participantes tragam notebooks próprios para a realização dessas atividades. 5
Módulo I Introdução ao Big Data e ao software R Conteúdo Introdução ao Big Data O que é Big Data Analytics? Conceitos de Big data, Inteligência Artificial e Machine Learning Tipos de análise em Big Data Cases de Big Data Big Data for Insurance Entendendo a estrutura de dados em Big Data Introdução à Linguagem de Computação Estatística R Primeiros passos Preparação e manipulação de base de dados utilizando o R Automatizando análises: criando suas próprias funções Gerando relatórios dinâmicos via RMarkdown Duração: 12 horas/aula. 6
Módulo II Análise Exploratória de Dados Conteúdo Natureza dos dados em seguros Distribuições de frequências Medidas descritivas Outliers e missing values Inferência Estatística Introdução e conceitos básicos Estimação e intervalos de confiança Testes de hipóteses Cruzamento entre variáveis Análise exploratória Medidas de associações e correlações Duração: 12 horas/aula. Pré-requisitos: Conhecimento básico de Excel e uso do software R. 7
Módulo III Análise Multivariada de Dados Conteúdo Tipos de variáveis Classificação das técnicas Análise fatorial Cluster analysis Aplicações em seguros Duração: 12 horas/aula. Pré-requisitos: Conhecimento básico de Excel e uso do software R. 8
Módulo IV Modelos de Regressão Conteúdo Modelo de Regressão Linear Simples e Multivariada Estimação dos parâmetros por mínimos quadrados Avaliação do modelo Estimador da variância Decomposição da soma de quadrados Tabela de análise de variância Propriedades dos estimadores Distribuições amostrais dos estimadores dos parâmetros Intervalos de confiança e testes de hipóteses em regressão linear Análise de resíduos gráficos e testes estatísticos Multicolinearidade Métodos de seleção de variáveis Modelo de Regressão Logística (variável resposta binária) Introdução e conceitos básicos Inferência em regressão logística Adequação e interpretação do modelo Aplicações práticas Duração: 20 horas/aula. Pré-requisitos: Conhecimento básico de Excel e uso do software R. 9
Módulo V Métodos Preditivos Conteúdo Introdução à Mineração de Dados Modelagem descritiva versus modelagem preditiva Aplicações e tipos de problemas Processos KDD e CRISP-DM Árvores de Classificação e Regressão Conceitos básicos de árvores de classificação e árvores de regressão Crescimento de uma árvore: algoritmo de particionamento recursivo Otimizando o poder de uma árvore de classificação: critérios de poda de ramos Avaliando o poder preditivo: critérios de informação Problemas clássicos do uso de árvores de decisão: análise exploratória, previsão, redução de dimensionalidade e imputação de dados faltantes Estudos de caso Extensões de Árvores de Decisão: bagging, boosting e florestas aleatórias O uso de Árvores de Decisão para o Agrupamento das Variáveis de Precificação (melhor segmentação dos clientes) Redes Neurais Introdução a redes neurais A Rede Multilayer Perceptron: topologia e especificação Aplicações Duração: 24 horas/aula. Pré-requisitos: Uso do software R. 10
Coordenação e Instrutores Aldy Fernandes da Silva (Coordenador e Instrutor) Bacharel em Estatística pela UFMG, onde atuou como docente, Mestre em Estatística pelo IME/USP e Doutor em Engenharia de Produção pela POLI/USP. Atualmente, é Professor Extracarreira na Fundação Getúlio Vargas EAESP e Professor Pesquisador do Mestrado em Ciências Contábeis da Fundação Escola de Comércio Álvares Penteado (FECAP), onde desenvolve pesquisa na área de modelagem de risco em seguros e métodos estatísticos aplicados à administração, contabilidade e atuária. Foi instrutor, na FECAP, do curso de extensão Estatística Aplicada a Seguros (2005 a 2009). É consultor e sócio administrador da AFC Consultoria e Assessoria em Estatística S/C Ltda, onde atuou como consultor em modelagem estatística na área de provisões técnicas da Itaú Seguros, entre outras. Realizou treinamentos de modelagem estatística in company e para colaboradores de diversas empresas como Itaú Seguros, Unibanco Seguros, Bradesco Vida e Previdência, Brasilprev, Allianz, Tokio Marine, Porto Seguro, entre outras. Antônio Aurelio Duarte (Instrutor) Bacharel em Ciências Atuariais pela Universidade de São Paulo (USP) e Mestre em Contabilidade e Finanças pela Fundação Escola de Comércio Álvares Penteado (FECAP), com especialização em Engenharia Econômica e Gestão Financeira/Atuarial. Atuou por dez anos no mercado financeiro como operador de mesa de aplicação e possui vinte anos de experiência profissional como Atuário de consultoria e instituições financeiras de grande porte, atuando na precificação, controle de solvência e provisionamento técnico de Seguros, Previdência e Capitalização. 11
Humberto Gallucci Netto Bacharel em Economia pela Faculdade de Economia, Administração e Contabilidade FEA/USP (2010). Mestrado e Doutorado em Administração de Empresas (com ênfase em Finanças) pela Fundação Getúlio Vargas. Foi Visiting Scholar na Norhwestern University. Professor Assistente na Universidade Federal de São Paulo. Tem experiência na área de Administração, com ênfase em Administração Financeira, atuando principalmente nos seguintes temas: venture capital, private equity e governança corporativa. Joelson Oliveira Sampaio Doutor em Teoria Econômica pela Universidade de São Paulo. Doutor em Finanças Corporativas e Mercados Financeiros pela Fundação Getúlio Vargas. Pós-doutor em economia pela Faculdade de Economia, Administração e Contabilidade FEA/USP. Research Assistent at Kellogg Business School. Professor de Finanças do Mestrado Profissional em Administração da FECAP. Professor de Finanças da Escola de Economia de São Paulo EESP/FGV. Tem experiência na área de Finanças e Economia, com ênfase em Finanças Empresariais (corporate finance), atuando principalmente nos seguintes temas: venture capital e private equity, mercado de capitais e governança corporativa. Raphael Abdala Rodrigues Bacharel em Ciências Atuariais pela Pontifícia Universidade Católica (PUC), e MBA em Gestão Empresarial pela FGV, com especialização em Métodos Quantitativos pela Fundação Escola de Comércio Álvares Penteado (FECAP). Atuou por 16 anos como atuário de instituições financeiras de grande porte, atuando na precificação, controle de solvência, provisionamento técnico de seguros, solvência e otimização de contratos de resseguro. 12
Calendário do Treinamento Treinamento - Modelagem Estatística para Big Data em Seguros Calendário 2019 JANEIRO FEVEREIRO MARÇO DOMINGO 6 13 20 27 3 10 17 24 31 3 10 17 24 31 SEGUNDA 7 14 21 28 4 11 18 25 4 11 18 25 TERÇA 1 8 15 22 29 5 12 19 26 5 12 19 26 QUARTA 2 9 16 23 30 6 13 20 27 6 13 20 27 QUINTA 3 10 17 24 31 7 14 21 28 7 14 21 28 SEXTA 4 11 18 25 1 8 15 22 1 8 15 22 29 SÁBADO 5 12 19 26 2 9 16 23 2 9 16 23 30 DIAS LETIVOS - - - ABRIL MAIO JUNHO DOMINGO 7 14 21 28 5 12 19 26 2 9 16 23 30 SEGUNDA 1 8 15 22 29 6 13 20 27 3 10 17 24 TERÇA 2 9 16 23 30 7 14 21 28 4 11 18 25 QUARTA 3 10 17 24 1 8 15 22 29 5 12 19 26 QUINTA 4 11 18 25 2 9 16 23 30 6 13 20 27 SEXTA 5 12 19 26 3 10 17 24 31 7 14 21 28 SÁBADO 6 13 20 27 4 11 18 25 1 8 15 22 29 DIAS LETIVOS - - 4 Total de Aulas - 1º Semestre de 2019 = 04 JULHO AGOSTO SETEM BRO DOMINGO 7 14 21 28 4 11 18 25 1 8 15 22 29 SEGUNDA 1 8 15 22 29 5 12 19 26 2 9 16 23 30 TERÇA 2 9 16 23 30 6 13 20 27 3 10 17 24 QUARTA 3 10 17 24 31 7 14 21 28 4 11 18 25 QUINTA 4 11 18 25 1 8 15 22 29 5 12 19 26 SEXTA 5 12 19 26 2 9 16 23 30 6 13 20 27 SÁBADO 6 13 20 27 3 10 17 24 31 7 14 21 28 DIAS LETIVOS 5 4 4 OUTUBRO NOVEMBRO DEZEMBRO DOMINGO 6 13 20 27 3 10 17 24 1 8 15 22 29 SEGUNDA 7 14 21 28 4 11 18 25 2 9 16 23 30 TERÇA 1 8 15 22 29 5 12 19 26 3 10 17 24 31 QUARTA 2 9 16 23 30 6 13 20 27 4 11 18 25 QUINTA 3 10 17 24 31 7 14 21 28 5 12 19 26 SEXTA 4 11 18 25 1 8 15 22 29 6 13 20 27 SÁBADO 5 12 19 26 2 9 16 23 30 7 14 21 28 DIAS LETIVOS 3 - - Legenda DIAS DA SEMANA PERÍODO DE INSCRIÇÃO DATAS DO TREINAMENTO FINAIS DE SEMANA (*) FERIADOS Calendário 2018 Total de Aulas - 2º Semestre de 2019 = 16 13