Exemplo de Aplicação do DataMinig



Documentos relacionados
ADM041 / EPR806 Sistemas de Informação

Unidade I FINANÇAS EM PROJETOS DE TI. Prof. Fernando Rodrigues

Artigo 04 Exercício Comentado Balanço Patrimonial PROFESSORA: Ivana Agostinho. Hoje vamos resolver um exercício sobre Balanço Patrimonial.

MANUAL DO GESTOR DE FINANÇAS

Viabilidade Financeira: Calculo da TIR e VPL

Educação Financeira. Crédito Consignado. Módulo 3: Gerenciamento de dívidas

PERGUNTAS MAIS FREQÜENTES SOBRE VALOR PRESENTE LÍQUIDO (VPL)

REDE DE ENSINO LFG AGENTE E ESCRIVÃO PF Disciplina: Noções de Contabilidade Prof. Adelino Correia Aula nº09. Demonstração de Fluxo de Caixa

ANEXO F: Conceitos Básicos de Análise Financeira

Plano de Negócios Faculdade Castro Alves Cursos de Administração.

MANUAL DO GESTOR DE FINANÇAS

INDICADORES ABRAINC/FIPE DO MERCADO IMOBILIÁRIO

Prof. Cleber Oliveira Gestão Financeira

Prof. Cleber Oliveira Gestão Financeira

OS IMPACTOS DA FILOSOFIA JIT SOBRE A GESTÃO DO GIRO FINANCIADO POR CAPITAL DE TERCEIROS

5 Conclusões e Recomendações

TENHA MAIS MÃO NAS SUAS CONTAS

COMO CALCULAR E ANALISAR A CAPACIDADE DE

Gestão Financeira. Prof. Eduardo Pozzi

Jogos. Redes Sociais e Econômicas. Prof. André Vignatti

CÓDIGO CRÉDITOS PERÍODO PRÉ-REQUISITO TURMA ANO INTRODUÇÃO

UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO CENTRO UNIVERSITÁRIO NORTE DO ESPÍRITO SANTO DISCIPLINA: ECONOMIA DA ENGENHARIA

1 Introdução 1.1. Contextualização

Pindyck & Rubinfeld, Capítulo 15, Mercado de Capitais::REVISÃO

APSP. Análise do Projeto do Sistema Produtivo. Aula 7. 22/8/2006 Por: Lucia Balsemão Furtado 1

Geração e Interpretação de Mapas de Produtividade. Laboratório de Agricultura de Precisão II

MS877 PROJETO SUPERVISIONADO II Técnicas de Análise de Investimentos

Ciclo Operacional. Venda

TAXA INTERNA DE RETORNO (TIR) PERGUNTAS MAIS FREQÜENTES

Tratamento das Receitas e Despesas Financeiras

1. Introdução ao uso da calculadora

A Grande Importância da Mineração de Dados nas Organizações

CAPÍTULO 2 MATEMÁTICA FINANCEIRA

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Planejamento Estratégico de TI. Prof.: Fernando Ascani

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

O Plano Financeiro no Plano de Negócios Fabiano Marques

CONTABILIDADE SOCIETÁRIA AVANÇADA Revisão Geral BR-GAAP. PROF. Ms. EDUARDO RAMOS. Mestre em Ciências Contábeis FAF/UERJ SUMÁRIO

Avaliando o que foi Aprendido

CAPÍTULO 2. DEMONSTRAÇÕES FINANCEIRAS, IMPOSTOS, e FLUXO DE CAIXA. CONCEITOS PARA REVISÃO

COMPARAÇÃO DOS MÉTODOS DE SEGMENTAÇÃO DE IMAGENS OTSU, KMEANS E CRESCIMENTO DE REGIÕES NA SEGMENTAÇÃO DE PLACAS AUTOMOTIVAS

INDICADORES FINANCEIROS NA TOMADA DE DECISÕES GERENCIAIS

Contabilidade Básica

CAP. 2 CONSIDERAÇÕES SOBRE OS CRITÉRIOS DE DECISÃO

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Sumário. 1 Introdução. Demonstrações Contábeis Decifradas. Aprendendo Teoria

08 Capital de giro e fluxo de caixa

A transformação e o custo do dinheiro ao longo do tempo *

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

CARACTERIZAÇÃO DO CAPITAL DE GIRO

Previdência Complementar

REDUÇÃO DA TAXA DE POUPANÇA E AS EMPRESAS NÃO FINANCEIRAS:

ANÁLISE E APLICAÇÃO DOS ÍNDICES DE LIQUIDEZ APLICADOS AS EMPRESAS EM GERAL COM BASE EM SEUS EMONSTRATIVOS CONTÁBEIS

Técnicas de Caixa Preta de Teste de Software

Podemos encontrar uma figura interessante no PMBOK (Capítulo 7) sobre a necessidade de organizarmos o fluxo de caixa em um projeto.

ECONOMIA. Profa. Juliane Ganem Site: julianematematica.webnode.com

Construção de Modelos de Previsão de Risco de Crédito Utilizando Técnicas de Estatística Multivariada

Objetivos. Engenharia de Software. O Estudo de Viabilidade. Fase do Estudo de Viabilidade. Idéias chave. O que Estudar? O que concluir?

Direcional Engenharia S.A.

Gerenciamento de Projeto: Criando o Termo de Abertura II. Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br

Cálculo de Juros Simples e Composto no Excel - Parte 1

BALANÇO PATRIMONIAL / composição 1

NCRF 2 Demonstração de fluxos de caixa

Importância da normalização para as Micro e Pequenas Empresas 1. Normas só são importantes para as grandes empresas...

PESQUISA DE JUROS. Estas reduções podem ser atribuídas aos fatores abaixo:

Texto para Coluna do NRE-POLI na Revista Construção e Mercado Pini Abril 2012

Profa. Ma. Divane A. Silva. Unidade II CONTABILIDADE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

ÍNDICES DE LUCRATIVIDADE. Margem Bruta. VL = Vendas Líquidas (ou Receitas Líquidas ou Faturamento Líquido)

SISTEMAS DE INCENTIVOS QREN INFORMAÇÃO PARA ACESSO À LINHA DE CRÉDITO INVESTE QREN

Aula 7 - Cálculo do retorno econômico

LOGÍSTICA Professor: Dr. Edwin B. Mitacc Meza

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Crédito. Adm. Geral. Para que Estudar Análise de Investimento e Financiamento? Título da aula: Decisões de Investimento e Financiamento I

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)

Pequenas e Médias Empresas no Canadá. Pequenos Negócios Conceito e Principais instituições de Apoio aos Pequenos Negócios

DOAR DEMONSTRAÇÃO DAS ORIGENS E APLICAÇÕES DE RECURSOS UMA REVISÃO DOS CONCEITOS MAIO / Autor - Manoel Moraes Jr

Vamos, então, à nossa aula de hoje! Demonstração de Fluxo de Caixa (2.ª parte) Método Indireto

GABARITO DOS EXERCÍCIOS EXERCÍCIOS PROPOSTOS (Fator de Acumulação de Capital Pagamento Simples)

CIÊNCIAS CONTÁBEIS MATEMATICA FINANCEIRA JUROS SIMPLES

UWU CONSULTING - SABE QUAL A MARGEM DE LUCRO DA SUA EMPRESA? 2

Portugal Enquadramento Económico

Cálculo utilizando variáveis do tipo DATA

INCORPORAÇÃO PAPEL DE TRABALHO DA INCORPORAÇÃO. Subsidiária S.A S.A. Ativos

UNIVERSIDADE FEDERAL DO CEARÁ FACULDADE DE ECONOMIA, ADMINISTRAÇÃO, ATUÁRIA, CONTABILIDADE E SECRETARIADO DEPARTAMENTO DE ADMINISTRAÇÃO

Guia Declaração Imposto de Renda Investimentos. Março de Brasil

Conceitos e princípios básicos de Matemática Financeira aplicada à vida cotidiana do cidadão

Unidade IV INTERPRETAÇÃO DAS. Prof. Walter Dominas

TRABALHO DE ECONOMIA:

Balanço de Pagamentos

Endereçamento IP 09/05/2014. Endereçamento IP CLASSE B CLASSE A CLASSE A CLASSE C

Prof. Msc. Paulo Muniz de Ávila

COMO DETERMINAR O PREÇO DE LANÇAMENTO DE UMA AÇÃO NA ADMISSÃO DE NOVOS SÓCIOS

PROPOSTA MICRO-FRANQUIAS

SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2

Transcrição:

Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta de Conhecimento em Bancos de Dados, o KDD. Rigorosamente o Data Mining se restringe a obtenção de modelos, ficando as etapas anteriores como coleta e seleção dos dados, pré-processamentos dos dados, transformação dos dados e o próprio DM como instâncias do KDD. Sem a estatística não seria possível termos o Data Mining, visto que a mesma é a base a partir da qual o Data Mining é construído. Existe muito conhecimento escondido na imensa quantidade de dados disponíveis nos bancos de dados das empresas. Com o Data Mining, pode-se transformar esses dados brutos em informação valiosa para auxiliar o processo decisório. Data Mining não substitui técnicas estatísticas tradicionais. Ao invés disto, Data Mining é uma extensão dos métodos estatísticos. O poder cada vez maior dos computadores com custos mais baixos, aliado à necessidade de análise de enormes conjuntos de dados com milhões de linhas, permitiu o desenvolvimento de técnicas baseadas na exploração de soluções possíveis. As técnicas de DM podem ser aplicadas em diversas áreas: 1

Vendas e Marketing Finanças Seguros e Planos de Saúde Transporte Medicina Telecomunicações Mercado Financeiro Vantagens do Data Mining O uso de Data Mining pode trazer as seguintes vantagens: Modelos são de fácil compreensão: pessoas sem conhecimento estatístico (por exemplo, analistas financeiros ou pessoas que trabalham com data base marketing) podem interpretar o modelo e compará-lo com suas próprias idéias. O usuário ganha mais conhecimento sobre o comportamento do cliente e pode usar esta informação para otimizar os processos dos negócios. Grandes bases de dados podem ser analisadas: grandes conjunto de dados, de até vários gigabytes de informação podem ser analisados com Data Mining. Data Mining descobre informações não esperadas: como muitos modelos diferentes são validados, alguns resultados inesperados podem surgir. Em diversos estudos, descobriu-se que combinações de fatores particulares apresentaram resultados inesperados. 2

Variáveis não necessitam de recodificação: Data Mining lida tanto com variáveis numéricas (quantitativas) quanto categóricas (qualitativas). Estas variáveis aparecem no modelo exatamente da mesma forma em que aparecem na base de dados. Modelos são precisos: os modelos obtidos por Data Mining são validados por técnicas de estatística. Desta forma, as predições feitas por modelos são precisas. CLASSIFICAÇÃO DE CRÉDITO EM UM BANCO Mil clientes de um banco solicitaram o uso de crédito ao banco, e de acordo com a fidelidade de pagamento dos clientes, eles receberam um rótulo de inadimplentes ou não, ou seja, criou-se uma variável dicotômica, com as categorias crédito bom e crédito ruim. Iniciamos o trabalho com o objetivo de ajustar um modelo que fosse capaz de predizer a categoria dos clientes, para o banco poder decidir se ia conceder ou não crédito ao ou não. Para tal, foram consideradas cerca de vinte variáveis acerca dos clientes do banco tais como: Saldo da conta do cliente Histórico do Crédito Propósito do crédito Quantidade de crédito disponível Dinheiro em poupança 3

Tempo no presente emprego Sexo, idade e estado civil Tempo na atual residência Número de créditos no banco Profissão Idade da conta Outros planos de parcelamento Taxa de parcelamento em relação à renda líquida Vale ressaltar que da amostra total, 70% dos clientes tinham crédito bom e 30% tinham crédito ruim. Portanto após seleção dos dados aplicamos o método da Regressão Logística, pois a variável de interesse é categórica, neste caso dicotômica. Em mineração de dados é comum ajustar diversos tipos de modelos, aqui poderia ajustar também modelos baseados em métodos de Árvores de Classificação, mas aqui vamos analisar apenas o primeiro. Após definir alguns parâmetros para se ajustar o modelo como método de seleção de variáveis, ponte de corte para classificação, etc e validação do modelo obtemos uma matriz de confusão que nos dá a análise de quão bom o modelo ficou para se classificar corretamente os clientes, ou seja, porcentagem de erro de classificação, assim constatamos se o poder de generalização ou predição do modelo foi satisfatório. Outra forma de verificar a qualidade do modelo é o ROI (Return Of Investiment). A matriz de confusão apresentou um erro de 27% quando o ponto de corte foi o menor possível, pois pontos de cortes grandes resultavam em erros maiores. 4

O ROI, após definição de alguns parâmetros como, taxa de juros ao mês, custo fixo, etc, apresentou um maior retorno de investimento quando o ponto de corte foi o maior aceitável, cerca de 48, 42% de retorno do dinheiro investido. A partir desses dois resultados vemos que para errar menos o banco deve emprestar mais dinheiro (classificar clientes como bom pagador). No caso do ROI, é melhor emprestar menos para não desperdiçar dinheiro, e assim, maximizar o lucro com relação às despesas. Referências [1] BRAGA, L. P. V. Introdução à Mineração de Dados. Rio de Janeiro, E- papers Serviços Editoriais, 2005 5