CLASSIFICAÇÃO DE CHURN NO SEGURO AUTOMÓVEL RUI MARCO ALMEIDA, VICTOR LOBO Agenda: 1. Introdução 2. Objectivos 3. Base de Dados 4. Principais resultados 5. Rating dos Inquiridos 6. Discussão e principais conclusões 2 1
1. Introdução Churn: - Tem origem na expressão inglesa CHANGE AND TURN e é vulgarmente usado para reflectir a DESCONTINUAÇÃO de um contrato (Lazarov & Capota, 2007). -ÉoMOVIMENTO DE CLIENTES entre vários fornecedores de um dado serviço (Au & Ma, 2003; Hadden et al., 2005; Hongxia, Min, & Jianxia, 2009; Hung et al., 2006). Consideramos Churners os inquiridos que declaram ter mudado de seguradora automóvel no último ano (2006 para 2007). 3 1. Introdução O Churn tem um grande IMPACTO ECONÓMICO Por exemplo (Van den Poel & Larivière, 2004): - Diminui a necessidade de RECRUTAR NOVOS, clientes; - Permite à companhia concentra-se nas NECESSIDADES dos clientes actuais; - Clientes com maior antiguidade - Tendem a gastar MAIS DINHEIRO; - Proferem boas referências através do WORD-OF-MOUTH; - São MENOS ONEROSOS; - São MENOS SENSÍVEIS às estratégias de Marketing da concorrência; - Recrutar novos clientes é SEIS A SETE VEZES MAIS CARO que a retenção. 4 2
1. Introdução Suponhamos que (Van den Poel e Larivière, 2004): - Uma companhia tem um milhão de clientes, - A sua taxa de retenção é de 93% (Churn e 7% ) - Cada cliente tem uma contribuição líquida de 50 ano. Calcular os resultados para uma TAXA DE RETENÇÃO ALTERNATIVA DE 94% ao longo de 25 ANOS. 5 1. Introdução Aumenta os resultados da companhia em 27.5M ao fim de um período de 25 anos (considerando um desconto de 6%). Contribuição Cumulativa (em 1000 ) 450000 400000 350000 300000 250000 200000 150000 100000 50000 Impacto das Taxas de retenção nos Resultados financeiros 419.7M 392.2M 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Anos 75% Retenção 93% Retenção 94% Retenção 6 3
1. Introdução É comum distinguir-se dois tipos de Churn: INVOLUNTÁRIO Vs. VOLUNTÁRIO Um cliente deixa de pagar e a companhia cancela o fornecimento dos serviços. O cliente decide CONSCIENTEMENTE abandonar os serviços da Companhia. É este o Churn que as companhias necessitam de combater. 7 1. Introdução Gestão de Churn: - Refere-se às estratégias e aos esforços que uma companhia faz para reter os seus clientes mais rentáveis. Podem ser: - Não Dirigidas - Dirigidas - Reactivas - Pró-Activas CLASSIFICAÇÃO DE CHURN 8 4
2. Objectivo Desenvolver um novo produto para a Marktest que consiste em modelos de classificação de probabilidade de Churn para os possuidores de Seguro Automóvel. Recorrendo a dados dos estudos regulares Barómetro de Seguros e Transferências de Seguros. 9 3. Base de Dados Proveniente de dois estudos da Marktest - Barómetro de Seguros (Ano 2006) - Avaliar os comportamentos e percepções dos Portugueses face aos seguros. - Transferências de Seguros (Ano 2007) - Avalia/quantifica as taxas de transferências inter-companhias/churn existentes no Seguro Automóvel. - É feito por recontacto dos inquiridos do primeiro estudo. 10 5
3. Base de Dados - A Base de Dados de treino para os nossos modelos de Churn resulta da união de duas Bases de Dados: Usamos os dados respeitantes às apólices de particulares, que habitualmente tomam as decisões respeitantes ao Seguro Automóvel e cuja apólice está em nome próprio. - A base de dados de Treino contêm 1.661 registos. - Dispomos de cerca 85 variáveis relevantes; 40 directamente relacionadas como seguro automóvel; 21 variáveis criadas. 11 4. Principais resultados - Resultados fracos em todos os modelos testados. - Foi feito BOOSTING de modo a melhorar a qualidade do sinal (Base de Dados Boosted). Base de Dados de Treino Base de Dados Boosted (n=1.661 ) (n=2.642 ) 12 6
4. Principais resultados - Validação cruzada recorrendo a três conjuntos de dados: - Conjunto de Treino (60%) - Conjunto de Validação (20%) - Conjunto de Teste (20%) - A distribuição pelos vários conjuntos foi ESTRATIFICADA. 13 4. Principais resultados Desenvolvemos TRÊS MODELOS de classificação de probabilidade de Churn Estes baseiam-se nas seguintes variáveis: Árvore de Decisão Rede Neuronal Probit MAIS_CONTACTO MAIS_CONTACTO MAIS_CONTACTO PARTICIPAÇÃO PARTICIPAÇÃO PARTICIPACAO IDADE IDADE IDADE GÉNERO GÉNERO GENERO CLIENTE_EXCLUSIVO CLIENTE_EXCLUSIVO CLIENTE_EXCLUSIVO N_AUTO MUD_SEGURADORA TOTAL PREMIO_250 N_AUTO MUD_SEGURADORA TOTAL VIDA HABITAÇÃO COB_EXTRA RC_MAIS 14 7
4. Principais resultados Os modelos finais demonstraram as seguintes taxas de erro: Conjunto de dados Árvore de Decisão Rede Neuronal Probit Treino 35.1 29.3 39.4 Validação 35.4 35.8 40.3 Teste 43.9 36.7 45.7 A REDE NEURONAL foi o modelo com melhor desempenho. 15 4. Principais resultados E o que apresenta a matriz de confusão mais limpa. Não Churners identificados Tende a classificar os Churners como potenciais Churners eos Não Churners como potencialmente Não Churners. Churners identificados Árvore Probit Falsos Negativos Falsos Positivos 16 8
4. Principais resultados Árvore de Decisão (3 níveis) 17 4. Principais resultados Modelo Probit Variável Coeficiente Declive Média Constante 0,715 4,781 Mais_Contacto -0,373-0,148 Cliente_Exclusivo -0,307-0,121 Habitação -0,243-0,096 Género 0,241 0,096 Participação 0,226 0,090 Idade -0,008-0,003 Tal como na ÁRVORE DE DECISÃO o CONTACTO é determinante 18 9
4. Rating dos Inquiridos Constuimos um Rating baseado no n.º de classificações positivas N.º Classificações como Churner % Proposta de Nomenclatura Nenhuma 36.7 Não Churner/Cliente Fiel Uma 26.7 Baixo Risco de Churn Duas 20.3 Risco de Churn Considerável Três 16.3 Risco de Churn Elevado Base 2573 Cerca de 1/3 DOS SEGURADOS inquiridos apresenta um risco de churn muito baixo 19 6. Discussão e principais conclusões Conseguimos desenvolver TRÊS MODELOS de classificação de Churn. Para desenvolver os modelos necessitamos de fazer BOOSTING àbd. AREDE NEURONAL foi o modelo que apresentou a taxa de erro mais baixa. O ganho obtido ao nível das taxas de erro, as matrizes de confusão mais limpas e o Lift superior a 1 sugerem que a utilização dos modelos teria potencialmente um ELEVADO VALOR PARA AS COMPANHIAS. 20 10
6. Discussão e principais conclusões O modelo que tem potencialmente mais valor para a optimização de uma campanha de retenção é a REDE NEURONAL pois é o modelo com uma matriz de confusão mais limpa. Com a ajuda da ÀRVORE possível identificar alguns grupos de risco: Os inquiridos que têm POUCO CONTACTO com a companhia e têm MENOS DE 55.5 anos são potenciais Churners. Os inquiridos que TÊM CONTACTO com a companhia, têm MENOS DE 27.5 anos e são HOMENS. Os modelos sugerem ainda que posse de determinados produtos, como o Seguro HABITAÇÃO, é vinculante. 21 That s all Folks! 22 11