V ESAMP 16-20/10/2017, Cuiabá, Brasil SEGMENTAÇÃO DE GRANDES BASES DE DADOS: UMA APLICAÇÃO EM PREVISÃO DE RISCO DE CRÉDITO Francisco Louzada ICMC-USP pg 1 Francisco SãoLouzada Carlos, 2017 Brazil Meeting International Committee 24 November 2015 Slide: 1
OUTLINE Ø CONTEXTUALIZAÇÃO CICLO DE VIDA DO CLIENTE E A METODOLOGIA ESTATÍSTICA Ø GESTÃO DA INFORMAÇÃO VIA MODELAGEM ESTATÍSTICA Ø SEGMENTAÇÃO DA BASE Ø INDUÇÃO/DEDUÇÃO Ø POTENCIAL Ø MODELAGEM DE PROPENSÃO PONTUAL Slide: 2
IDÉIAS INICIAIS Ø IMPORTANTE: Como utilizar a informação contida nos dados para maximizar o resultado do negócio? Como inserir a Informação em um processo de decisão relacionado a alguma etapa do ciclo de vida do cliente? Slide: 3
IDÉIAS INICIAIS Ø CLIENTE TEM VIDA, É COMO UM FILHO!!! Ele é desejado Planejado Concebido Nasce Tem infância Cresce Torna-se Adulto Envelhece Falece... Slide: 4
Etapas do ciclo de vida do cliente Ø Prospecção Ø Aquisição Ø Ativação Ø Retenção Ø Re-ativação Slide: 5
CICLO DE VIDA DO CLIENTE DEFICITÁRIO RENTABILIZAÇÃO / FIDELIZAÇÃO DEFICITÁRIO PROSPECÇÃO AQUISIÇÃO ATIVAÇÃO RETENÇÃO RE-ATIVAÇÃO Tempo Base Slide: 6
RISCO DE CHURNING DENTRO DO CICLO DE VIDA DO CLIENTE Momentos diferentes Tempo Base Slide: 7
EFEITO DO CICLO DE VIDA NA MODELAGEM ESTATÍSTICA Para cada uma das etapa do ciclo de vida do cliente Devem ser relacionadas e descritas diferentes Técnicas de Modelagem que serão consideradas Slide: 8
GESTÃO DA INFORMAÇÃO VIA MODELAGEM ESTATÍSTICA OPORTUNIDADES PROSPECÇÃO Ø Segmentação de mercado Ø Pré-seleção de prospects: Ø Risco / Resposta / Perfil Ø Análise de crédito AQUISIÇÃO Ø Definição de Limite GESTÃO DO CLIENTE RETENÇÃO SALVAMENTO Ø Oferta de Produtos Ø Análise de risco/comportamento Ø Cross-sales / Up-sales Ø Precificação Ø Segmentação Ø CRM RE-AQUISIÇÃO/ COBRANÇA Ø Análise da propensão a re-aquisição Ø Definição de políticas de cobrança Slide: 9
PROCEDIMENTO INICIAL DE MODELAGEM DB VISÃO MARKETING CORPORATIVO NECESSIDADE DE SEGMENTAÇÃO INFORMAÇÃO 7,5 Milhões de Clientes Var. Cadastrais Var. Negócio CONHECIMENTO Aumentar conhecimento sobre o Cliente Entender comportamento Antecipar oportunidades Descobrir Prospects BASEADA EM VARIÁVEIS GENÉRICAS Slide: 10
TIPOS USUAIS DE SEGMENTAÇÃO 1 2 3 4 5 6 7 q SEGMENTAÇÃO DEMOGRÁFICA q SEGMENTAÇÃO GEOGRÁFICA q SEGMENTAÇÃO POR BENEFÍCIO q SEGMENTAÇÃO POR OCASIÃO q SEGMENTAÇÃO POR NÍVEL DE UTILIZAÇÃO DE UM PRODUTO q SEGMENTAÇÃO POR ESTILO DE VIDA q SEGMENTAÇÃO HOLÍSTICA Slide: 11
MOTIVAÇÃO PARA A BUSCA DE UM OUTRO PROCEDIMENTO QUESTÃO OS ANALISTAS DE DADOS TÊM CONHECIMENTO SUBJETIVO SOBRE OS CLIENTES. TAL CONHECIMENTO PODE SER UTILIZADO PARA SEGMENTAR A BASE. Slide: 12
CONSEQUÊNCIA: PROCEDIMENTO INICIAL DE MODELAGEM DB VISÃO MARKETING CORPORATIVO SEGMENTAÇÃO INDUZIDA BASE Visão do Marketing INFORMAÇÃO 7,5 Milhões de Clientes Var. Cadastrais Var. Negócio CONHECIMENTO Aumentar conhecimento sobre o Cliente Entender comportamento Antecipar oportunidades Descobrir Prospects CRIAÇÃO DO TIPO DO CLIENTE BASE VALOR DO CLIENTE Slide: 13
SEGMENTAÇÃO DA BASE A segmentação do DB será baseada na construção do insight sobre potenciais clusters (cliente ou prospect) formado a partir de 3 pilares de Percepções: BASE: Cadastro do Cliente Renda domiciliar Padrão de gastos Renda disponível para consumir serviços Registro das ações de compra - Visão do consumo de serviços do Grupo Outros Percepção do Potencial dos Clientes e Prospectors Percepção Induzida BASE: Tipo de Cliente Determinação do Valor do Cliente Desenvolvimento de Score de Valor Percepção Deduzida BASE: Tempo de base ou Value Contribution Score Composição do Score de Valor do Cliente Slide: 14
SEGMENTAÇÃO DA BASE Percepção Induzida High 5 7 6 5 7 High Low 1 2 4 3 High 6 8 1 3 2 4 Percepção Deduzida Potencial Slide: 15
SEGMENTAÇÃO DA BASE TIPO DE CLIENTE VALOR DO CLIENTE > > 10.000 120 8.000 120 a 10.000 110 6.000 100 a 110 8.000 4.0000 95 a a 100 6.000 0 a < 4.000 95 < 0 TIPO DE CLIENTE DIAMANTE Super + (D) PLATINA Super (PL) OURO Padrão (O) + PRATA Padrão (PR) BRONZE Básica (BR) SEM GRAU (SG) Slide: 16
SEGMENTAÇÃO DA BASE CLUSTERIZAÇÃO Ø Baseada na criação de um índice, Value Contribution Score (VCS), o qual é baseado na composição da variável Valor do Cliente, a qual é composta por diferentes fontes de valores. Ø O Valor do Cliente é visto como uma composição de forças negativas e positivas. Produto 1 Produto 2 Valor do Cliente - Custo 2 - Custo 1 Produto 3 Slide: 17
SEGMENTAÇÃO DA BASE CLUSTERIZAÇÃO 200 Cluster 1 0 Cluster 2-200 -400 SEGMENTAÇÃO 1-600 -800-1000 Cluster 3-1000 0 1000 2000 SEGMENTAÇÃO 2 Slide: 18
SEGMENTAÇÃO DA BASE NOMEAÇÃO DOS CLUSTERS Ø Direcionada pela contribuição Média das Fontes de Valor por Cluster Contribuições Médias no Valor Total (%) Special Construção Padrão Faturamento Veículo 1.7 16.6 68.6 Faturamento Mat.Construção 1.8 331.3 32.8 Faturamento Eletr.Domésticos 0.1 0.1 81.6 Valor Financiado Veículo - 2.9-18.9-26.8 Valor Financiado Mat.Construção 8.6-122.8-18.8 Valor Financiado Eletr.Domésticos - 8.8-7.2-21.0 Valor CP Call Center 17.7 37.5 67.2 Valor Custódia 0.0 0.0 0.2 Valor Seguro 1.6 4.0 2.3 Valor Cartão 49.7 2.0 3.3 Valor Consórcio 55.1 5.9 9.8 Valor Leasing 41.0 2.3 7.0 Slide: 19
CARACTERIZAÇÃO DOS CLUSTERS CARACTERIZAÇÃO GERAL Ø Visão geral do Cliente Ø Valor total Ø Número de clientes Ø Valor médio de todos os clusters Ø Porcentagem dos valores em relação ao valor total geral Ø Porcentagem dos valores em relação ao número total de clientes CARACTERIZAÇÃO INDIVIDUAL DO CLUSTER Ø Caracterização dos clientes dentro de cada cluster através de: Ø Variáveis cadastrais Ø Variáveis transacionais Ø Perfil do Cliente Slide: 20
VALOR Classificação do Cliente D P L O P R B R Total= $ 113.894.286 (sem considerar SG) 501037.62 44.0% 250584.96 22.0% 50074.14 4.4% 115779.14 10.2% 26912.90 2.4% 34333.37 3.0% 51783.84 14876.44 8537.43 4.5% 1.3% 0.7% 2106.98 13144.06 50174.40 0.2% 1.2% 4.4% 16459.92 1058.68 2078.98 1.4% 0.1% 0.2% 70.4% 15.6% 6.5% 5.8% SG - 3740.61-26722.68-239790.17 1.7% Special Padrão Construção Clusters Slide: 21
NÚMERO CLIENTES Classificação do Cliente D P L O P R B R SG 95 1.1% 787 8.9% 924 10.4% 75 0.8% 1193 13.5% 245 2.8% Total=8.845.385 285 3.2% 258 2.9% 267 3.0% 470 5.3% 119 1.3% 348 3.9% 95 1.1% 243 2.7% 154 1.7% 1814 20.5% 329 3.7% 1144 12.9% Special Padrão Construção Clusters 5.4% 14.5% 15.1% 26.6% 18.5% 19.6% Slide: 22
PERFIL CLIENTES POR CLUSTER 6 Produtos por domicílio (130 meses acum. de Tempo de Base) Valor do Cliente = 5.000,00 49% Classe C, 64% são homens, 27% cursaram superior 62% casados Cluster com menor n o de pessoas por domicílio Regiões: 56% sudeste, 17% sul e 15% nordeste 9.6% (8) 39% renda domiciliar > R$ 4.000,00 2,8% possuem XXX e 5,1% tem YYYY 69% compraram através de Call Center 35% pagavam carnê e 22% utilizavam cartão como forma de pagamento 59% dos domicílios possuem email Os Inativos estão inativos, em média, há 28 meses Parcerias: 65% AAAA, 30% BBBB, 28% CCCC, 11% DDDD e 6% EEEE Slide: 23
SEGMENTAÇÃO HOLÍSTICA RESULTADO FINAL 1 ALICERCE DIRECIONADOR PARA A GESTÃO DA BASE 2 VISUALIZAÇÃO MACRO E MICRO DA BASE DE CLIENTES 3 POSSIBILIDADE DE COMPOSIÇÃO DOS RESULTADOS Slide: 24
MODELAGEM DE PROPENSÃO PONTUAL PERCEPÇÃO DOS POTENCIAIS
PERCEPÇÃO DOS POTENCIAIS DOS CLIENTES Ø Para cada segmento podemos desenvolver modelos de propensão, tanto pontual quanto temporal. Dentro destas classes de modelos podemos citar os modelos para inadimplência, abandono, aquisição de um novo produto, compra etc. VALUE CONTRIBUTION SCORE (5) TIPO DE CLIENTE (6) (8) (1) (7) (3) Alto Potencial Médio Potencial Baixo Potencial (2) (4) Slide: 26
PERCEPÇÃO DOS POTENCIAIS DOS CLIENTES BRONZE PRATA OURO DIAMANTE PLATINA CONSTRUÇÃO PADRÃO SPECIAL Slide: 27
CARACTERÍSTICA BÁSICA DOS MODELOS DE PROPENSÃO PERGUNTA Qual a Propensão a Adimplência do Cliente? RESPOSTA Se o Cliente tem ou não propensão MODELOS DE PROPENSÃO PONTUAL Slide: 28
MODELAGEM DE PROPENSÃO POR CLUSTER PONTUAL Ø Inadimplência Ø Abandono Ø Aquisição de um Novo Produto Ø Compra Ø Outros Slide: 29
MODELO DE PROPENSÃO Características dos Indivíduos Modelo Estatístico Propensão Score (%) < 15 10 (A) 15-35 16 (B) 35-65 32 (C) 65-85 60 (D) >85 75 (E) Ranking pela Propensão A B A E E A B A C D Potenciais Clientes Slide: 30
MODELOS DE PROPENSÃO Modelos de Regressão Logist Regression SVM Árvores de Classificação CART CHAID Exhaustive CHAID Redes Neurais Naive Bayes MAR Splines Slide: 31
BASE PLANEJAMENTO AMOSTRAL PARA MODELAGEM DE PROPENSÃO q Horizonte de Previsão: intervalo de tempo entre a entrada na base e a observação do desempenho do mesmo, ou seja, classificação em BOM ou MAU. q REGRA: 12 a 18 meses Thomas (2002) propõe um intervalo de 12 meses, o qual é mais utilizado na prática. Horizonte <<< 12 meses è subestima o percentual de maus não refletindo uma situação real. Horizonte >>> 12 meses è variáveis explanatórias potenciais distantes do evento: diminuindo a correlação com o mesmo. Slide: 32
BASE PLANEJAMENTO AMOSTRAL PERÍODO DE DESEMPENHO: onde se observa a ocorrência do evento de interesse, mesmo tamanho que o HORIZONTE DE PREVISÃO Período de Desempenho Mês 1 Meses 12 Observo Características dos Clientes Observo a ocorrência ou não do evento Slide: 33
BASE PLANEJAMENTO AMOSTRAL VARIÁVEL RESPOSTA: resposta binária, ou seja, BOM ou MAU dependendo do desempenho de crédito dentro do HORIZONTE DE PREVISÃO estabelecido, de normalmente 12 meses. 1 2 x x x x Variável Resposta Mau ( y=1 ) Mau ( y=1 ) Indivíduos 3 4 5 x x x Bom ( y=0 ) Mau ( y=1 ) Mau ( y=1 ) 6 Bom ( y=0 ) 12 meses (Período de Desempenho) tempo Slide: 34
BASE PLANEJAMENTO AMOSTRAL Efeito sazonal q Compor a amostra com 12 safras de clientes com horizonte de previsão também de 12 meses Periódo de Desempenho Variável resposta: ocorrência do evento de interesse Periódo de Contratação Observação das vars.explanatórias mês 1 / X1 mês 2 / X1 mês 3 / X1 mês 12 / X1 mês 2 / X2 mês 1 / X2 mês 11 / X2 mês 12 / X2 X1 Slide: 35
EXEMPLO DADOS Objetivo: medir o risco de inadimplência de potenciais clientes que buscam adquirir um produto de crédito Variável ESTCIVIL TP_CLIENTE SEXO SIT_RESID P_CARTAO IDADE TEMPORES TPEMPREG TEL_COMERC OP_CORRESP Descrição Estado civil do cliente: solteiro / casado/ divorciado / viúvo Tipo de cliente Sexo do cliente: Masc./ Fem. Condição da residência: própria / alugada Possui Cartão? (Sim / Não) Idade do cliente (em anos) Tempo de residência na casa atual (em anos) Tempo de emprego atual (emmeses) Declarou telefone comercial? Opção de Correspondência: Residencial / Comercial COMP_RENDA Comprometimento da renda: até10% / 10%-20% / mais de 20%; LIM_CRED CEP_COM CEP_RES G_PROF REGIAO Status Tempo Valor do Crédito Solicitado CEP Comercial (2 posições) CEP Residencial (2 posições) Grupo de profissão Região do Cliente Flag: Bom ou Mau Tempo até observar o evento inadimplência Slide: 36
EXEMPLO DISTRIBUIÇÃO DO RISCO SCORING TAXA INADIMPLÊNCIA PARTICIPAÇÃO % DA CLASSE 0-100 78.5 % 2.2 % 101-200 57.3 % 3.1 % 201-300 35.8 % 3.9 % 301-400 15.9 % 7.8 % 401-500 8.1 % 15.0 % 501-600 5.4 % 17.7 % 601-700 3.7 % 19.7 % 701-800 3.3 % 15.1 % 801-900 2.6 % 11.3 % 901-1000 1.9 % 4.2 % TOTAL 9.2 % 100.0 % Slide: 37
Ex.: MODELAGEM DE PROPENSÃO PONTUAL Ø Distribuição do Risco SCORING TAXA INADIMPLÊNCIA PARTICIPAÇÃO % DA CLASSE 0-100 78.5 % 2.2 % 101-200 57.3 % 3.1 % 201-300 35.8 % 3.9 % 301-400 15.9 % 7.8 % 401-500 8.1 % 15.0 % 501-600 5.4 % 17.7 % 601-700 3.7 % 19.7 % 701-800 3.3 % 15.1 % 801-900 2.6 % 11.3 % 901-1000 1.9 % 4.2 % TOTAL 16.2 % 100.0 % Slide: 38
RESULTADO FINAL GESTÃO SEGMENTADA DO RELACIONAMENTO 1 2 3 4 ESTRUTURAÇÃO VALORAÇÃO RELACIONAMENTO EXECUÇÃO Slide: 39
RESULTADO FINAL GESTÃO DO RELACIONAMENTO ESTRUTURAÇÃO VALORAÇÃO - DBMs Dados Cadastrais Dados Relacionamento Dados Transacionais - Valoração do Cliente - Segmentação Holística Induzida Deduzida - Qualificação de dados - Enriquecimento da base - Extração de Conhecimento Slide: 40
RESULTADO FINAL GESTÃO DO RELACIONAMENTO RELACIONAMENTO - Determinação/caracterização dos Clusters de Relacionamento - Macro-Modelos de propensão - Micro-Modelos de propensão Importante: - Direcionamento clusterizado do relacionamento EXECUÇÃO Aquisição Prospects diversas modalidades Retenção Clientes diversas modalidades renovações Venda Adicional up selling cross selling Slide: 41
INTEGRAÇÃO DOS MODELOS AOS PROCESSOS DE NEGÓCIO ESTRATÉGIA DE RELACIONAMENTO CRM SEGMENTAÇÃO DA BASE Estratégia por Cluster MODELAGEM Estratégia por Cluster ABANDONO INADIMPLÊNCIA IMPLEMENTAR Estratégia por Cluster Modelo Comercial VENDA ADICIONAL Estratégia por Cluster VANTAGEM: A Estratégia (por Cluster) orienta a definição de scripts para o relacionamento, em todos os pontos de contato com o Cliente. Slide: 42
Resultado A Modelagem de Segmentação Holística possibilita o desenvolvimento de um procedimento adequado de Gestão Estatística do Relacionamento com o Cliente, orientado para a definição de scripts em todos os pontos de contato com o Cliente. Slide: 43
Bibliografia Louzada, F. ; Ferreira, P. H. ; Silva, V. On the Segmentation of Big Data Sets. Working Paper, 2017. Louzada, F. ; Ara, A. ; Fernandes, G. Classification methods applied to credit scoring: Systematic review and overall comparison. Surveys in Operations Research and Management Science, Online, 2016. Louzada-Neto, F. ; Diniz, Carlos Alberto Ribeiro ; Silva, P. H. F. Procedimentos estatísticos para segmentação de base de dados. Revista Brasileira de Pesquisas de Marketing, Opinião e Mídia, v. 5, p. 32-39, 2010. Slide: 44
Muito Obrigado!!! E-mail louzada@icmc.usp.br