Uma comparação do Estado da Arte de técnicas de
|
|
- Célia Machado de Oliveira
- 8 Há anos
- Visualizações:
Transcrição
1 Uma comparação do Estado da Arte de técnicas de classificação com aplicações em finanças Porthos R. A. Motta 1 1 Universidade Federal de Goiás (UFG) Caixa Postal Goiânia GO Brazil {porthos.motta}@gmail.com Abstract. This article describes a comparison model classification algorithms using data repository Australian Credit Approval of the UCI and ata from a financial instituition (FI), in order to verify the performance using various comparison criteria, where hte KNN algorithm obtained best result in the test and training in the UCI classification data and baagging classification tree on data from the IF. Resumo. Este artigo descreve um modelo de comparação de algoritmos de classificação, utilizando dados do repositório Australian Credit Approval do UCI e dados de uma instituição financeira (IF), com o intuito de verificar o desempenho, utilizando vários critérios de comparação, onde o algoritmo KNN obteve melhor resultado na classificação de teste e de treinamento dos do UCI e o Bagging classification tree nos dados da IF. Este artigo descreve um modelo de comparação de algoritmos de classificação, utilizando dados do repositório Australian Credit Approval do UCI e dados de uma instituição financeira (IF), com o intuito de verificar o desempenho, utilizando vários critérios de comparação, onde o algoritmo KNN obteve melhor resultado na classificação de teste e de treinamento dos do UCI e o Bagging classification tree nos dados da IF. Palavras chaves: Classificadores, UCI, Instituição Financeira. 1. Introdução A mineração de dados é uma área do conhecimento utilizada para resolver vários tipos de problemas como os de classificação. A inadimplência é um assunto de interesse de várias IF s. A partir de certas características, é possível classificar um cliente como adimplente e inadimplente. A partir dessa classificação é possível classificar novos dados após a utilização de algoritmos, com o objetivo de obter informação de interessante da instituição, e que possar ser utilizada para rever os processos internos de avaliação de crédito. Os classificadores pertencem ao aprendizado supervisionado, que tem como objetivo a resolução de problemas preditivos, e tem sido amplamente aplicado em conjuntos de dados de vários domínios científicos, como economia, ciências biológicas, ciências sociais e exatas, por exemplo.
2 Um classificador avalia o conjunto de dados e por meio de um algoritmo particiona-o de acordo com os rótulos das classes, porém nem todo o conjunto de dados pode ser classificado por todos os classificadores com a mesma acurácia, sendo que para cada tipo de dados existe um ou vários classificadores específicos. Eles oferecem uma forma eficiente de tratar informações financeiras, sendo a área de finanças de interesse da inteligência computacional (IC). Os dados utilizados nos algoritmos precisam passar por etapas de limpeza por meio do pré-processamento a fim de reduzir os noise (ruídos) e lidar com valores missing (faltantes), analisar a relevância por meio da seleção de features (características), a fim de remover atributos irrelevantes ou redundantes e pela transformação dos dados por meio de técnicas de normalização e generalização. [Han and Kamber 2006][Duda et al. 2012] [Bishop 2006]. Neste trabalho serão investigados a performance de 7 algoritmos de classificação. Na seção 2 será apresentado os trabalhos relacionados, na seção 3 os métodos utilizados, na seção 4 os resultados experimentais, na 5 a conclusão, na seção 6 os trabalhos futuros e por fim as referências. 2. Trabalhos correlatos As técnicas de mineração de dados (MD) podem ser utilizadas para resolver inúmeros tipos de problemas, seja resumir dados, encontrar associações, definir regras, extrair características, analisar alterações, efetuar agrupamentos,detectar anomalias e efetuar classificação. Pode-se dizer que a classificação é uma das técnicas utilizadas com frequência nos problemas relacionados à área de MD e de reconhecimento de padrões (RP). E como dito anteriormente, dado um conjunto de valores de atributos ou características associadas a uma classe, é possível predizer em qual classe estes valores fornecidos pertencerão. [Yap et al. 2011] utilizou a mineração de dados para melhorar a avaliação da qualidade de crédito via modelos de credit scoring. Fez uso dos algoritmos de regressão logística e de árvore de decisão. [Bee Wah and Ibrahim 2010] usou modelos de previsão de mineração de dados para classificar os candidatos de cartão de crédito. Os algoritmos de regressão logística, rede neural de retro propagação e árvore de classificação e regressão, foram utilizadas. A análise Comparativa de Algoritmos de classificação em diferentes conjuntos de dados do repositório UCI usando a ferramenta open souce WEKA para execução dos algoritmos J48 e Multiplayer Perceptron (MPL) foi proposta por [Arora and Suman 2012], onde percebeu-se que o este obteve melhores resultados que aquele. 3. Métodos Os classificadores a serem utilizados neste trabalhos estão descritos na figura Base de dados de teste Os conjuntos de dados utilizados na investigação foram os dados do domínio financeiro obtido do repositório online UCI chamado Australian Credit Aproval.
3 Figure 1. Classificadores Por meio de uma perspectiva empírica, será utilizada a base supra citada, composta por uma matriz que consiste de dados de aprovação de crédito, sendo um conjunto interessante, por possuir um mix de atributos contínuos, nominais e com poucos e muitos dígitos. Existem 690 instâncias e 14 atributos ou características. Os valores faltantes ou missing que apareceram em 37 casos, foram substituídos pela moda quando atributos categóricos e pela média nos casos dos contínuos, e a classe distribuída em bom ou classe1 com 307 (44,5 %) e mau ou classe2 com 383 (55,5 %). O segundo conjunto de dados foi obtido de uma IF de Goiás que contém dados rotulados dos clientes adimplentes e inadimplentes, e possui 8372 objetos e 10 características, onde 4096 (48,92 %) são classificados como adimplentes e 4276 (51,08 %) como inadimplentes. Para o trabalho em questão foi utilizado de cada conjuntos de dados 80 % para treinamento e o restante 20 % para a etapa de teste de acurácia dos algoritmos de classificação selecionados, tanto na base UCI quanto na da IF Medidas de desempenho dos classificadores Para a avaliação do desempenho de algoritmos utilizamos várias medidas como: Classification Accuracy (CA) que é dada pela porcentagem de predições que estão corretas, Sensitivity (Sens), Specifiticity (Spec),Information Score (IS), Brier Score (Brier), Mathews correlation coeficient (MCC), conforme figura 2. As medidas Area Under ROC curve (AUC), F-Measure(F1), Precision(Prec) e
4 Figure 2. Fórmulas de alguns indicadores Recall(Recall) são obtidos a partir da matriz de confusão ou tabela de contingência. 4. Resultados experimentais e analise dos algoritmos Apresentaremos os resultados do experimento, bem como os valores obtidos pelas medidas de avaliação. Orange DataMining [Demšar et al. 2013] é um toolbox, multiplataforma, open source de mineração de dados escrito na linguagem python. Os algoritmos de classificação foram escritos em c++ para melhorar o tempo de execução, sem qualquer chamada a python, a fim de evitar sobrecarga desnecessária. Todos os experimentos foram feitos em uma estação de trabalho com processador Intel(R) Core(TM) i GHz com memória RAM 16,0 GB, no sistema Windows 8.1 Pro de 64 bits e processador com base em x64. O conjunto de testes são dados independentes do conjunto de treinamento a fim de evitara ocorrência de overfitting ou superajuste. Para cada algoritmo foi utilizada uma parametrização específica. Os resultados obtidos utilizando as medidas descritas anteriormente estão relacionados na figura 3. A matriz de confusão dos três melhores classificadores estão indicadas na figura 4. A partir dos resultados das figuras 3 e 4, constatou-se que o classificador KNN foi o melhor para a base UCI e o bagging de árvore de classificação mostrou-se o melhor devido a diferença do resultado do indicador IS que foi maior em relação ao classificador MLP. 5. Conclusão Neste artigo foi possível avaliar a performance de vários algoritmos de classificação, utilizando várias medidas, e duas bases de dados, uma do UCI e outra real de uma IF de Goiásra a base da IF.
5 Figure 3. Indicadores para base de dados Real e Australian UCI Figure 4. Matriz de confusão e curva roc O problema de classificação de clientes foi solucionado uma vez que os dados foram bem selecionados e normalizados e as etapas de treino favoreceram a obtenção dos resultados. Assim, percebe-se a importância de utilizar não só a matriz de confusão, mas também outros indicadores como Recall, MCC, F-Measure, para auxiliar no processo de tomada de decisão do melhor classificador, e neste estudo eles foram calculados utilizando o Orange Toolkit. Foi Interessante utilizar dados do UCI e reais para treino e teste dos algoritmos,que demonstra o funcionamento dos classificadores por meio de um modelo pré-estabelecido para depois utilizá-lo em dados reais. Dessa forma os resultados podem auxiliar a instituição financeira a classificar clientes por meio das características apresentadas. 6. Trabalhos Futuros Para trabalhos futuros, sugere-se a utilização de algoritmos de otimização ou de algum tipo de estratégia evolucionária em conjunto com os classificadores a fim de avaliar os resultados. Propõe-se também aumentar a quantidade de características a fim de verificar se ocorrerá alguma alteração no resultado do algoritmo escolhido como melhor classificador para o conjunto de dados. References Aggarwal, C. C. (2014). Statistical Analysis Data Mining Applications. CRC Press.
6 Arora, R. and Suman (2012). Article: Comparative analysis of classification algorithms on different datasets using weka. International Journal of Computer Applications, 54(13): Full text available. Bee Wah, Y. and Ibrahim, I. (2010). Using data mining predictive models to classify credit card applicants. In Advanced Information Management and Service (IMS), th International Conference on, pages Bishop, C. (2006). Pattern Recognition and Machine Learning. Information Science and Statistics. Springer. Cortes, C. and Vapnik, V. (1995). Support-vector networks. Mach. Learn., 20(3): Demšar, J., Tomaž, Erjavec, A., Črt Group, Hočevar, T., Milutinovič, M., Možina, M., Polajnar, M., Toplak, M., e Starič, A., Štajdohar, M., Umek, L., Žagar, L., Ž, J., Žitnik, M., and Zupan, B. (2013). Orange: Data mininig toolbox in python. Journal of Machine Learning Research, 14: Dietterich, T. G. (2000). Essemble methods in machine learning. [Online; accessed 26- Dezembro-2014]. D.Michie (1996). Machine Learning, Neural and Statistical Classification. ACM. Duda, R., Hart, P., and Stork, D. (2012). Pattern Classification. Wiley. Freeman, J. A. and Skapura, D. M. (1991). Neural networks: algorithms, applications, and programming techniques. Addison-Wesley. Han, J. and Kamber, M. (2006). Data Mining: Concepts and Techniques, 2nd ed.the Morgan Kaufmann Series in Data Management Systems, Jim Gray, Series Editor. Morgan Kaufmann Publishers. Hastie, T., Tibshirani, R., and Friedman, J. (2009). The Elements of Statistical Learning: Dataminig, Inference, and Prediction. Springer. Haykin, S. (2009). Neural Networks and Learning Machines. Number v. 10 in Neural networks and learning machines. Prentice Hall. John, G. and Langley, P. (1995). Estimating continuous distributions in bayesian classifiers. In In Proceedings of the Eleventh Conference on Uncertainty in Artificial Intelligence, pages Morgan Kaufmann. Kasabov, N. K. (1998). Foundations of Neural Networks, Fuzzy Systems, and Knowledge Engineering. The MIT Press. Marsland, S. (2009). Machine Learning: An Algorithmic Perspective. Chapman Hall/CRC Machine Learning Pattern. Nisbet, R., Elder, J., and Miner, G. (2009). Statistical Analysis Data Mining Applications. Elsevier. Skapura, D. (1996). Building Neural Networks. ACM Press Series. ACM Press. Yap, B. W., Ong, S. H., and Husain, N. H. M. (2011). Using data mining to improve assessment of credit worthiness via credit scoring models. Expert Systems with Applications, 38(10):
Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka
Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala [quinta-feira, 7:30 12:00] Atendimento Segunda
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem
Leia maisInteligência Computacional [2COP229]
Inteligência Computacional [2COP229] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/24) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Componentes clássicos da
Leia maisSISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER
SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo
Leia maisMINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES
MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES Kelton Costa; Patricia Ribeiro; Atair Camargo; Victor Rossi; Henrique Martins; Miguel Neves; Ricardo Fontes. kelton.costa@gmail.com; patriciabellin@yahoo.com.br;
Leia maisSistema de mineração de dados para descobertas de regras e padrões em dados médicos
Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas
Leia maisAplicação de Ensembles de Classificadores na Detecção de Patologias na Coluna Vertebral
Aplicação de Ensembles de Classificadores na Detecção de Patologias na Coluna Vertebral Hedenir M. Pinheiro Instituto de Informática Universidade Federal de Goiás (UFG) Caixa Postal 131 74001-970 Goiânia
Leia maisHierarquia de modelos e Aprendizagem de Máquina
Hierarquia de modelos e Aprendizagem de Máquina Fabrício Jailson Barth BandTec Maio de 2015 Sumário Introdução: hierarquia de modelos e aprendizagem de máquina. O que é Aprendizagem de Máquina? Hierarquia
Leia maisPLANO DE ENSINO. Mestrado em Matemática - Área de Concentração em Estatística
1. IDENTIFICAÇÃO PLANO DE ENSINO Disciplina: Estatística Multivariada Código: PGMAT568 Pré-Requisito: No. de Créditos: 4 Número de Aulas Teóricas: 60 Práticas: Semestre: 1º Ano: 2015 Turma(s): 01 Professor(a):
Leia maisTÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE
TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação
Leia maisMINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br
MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para
Leia maisWeb Data mining com R: aprendizagem de máquina
Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de
Leia maisParalelização do algoritmo SPRINT usando MyGrid
Paralelização do algoritmo SPRINT usando MyGrid Juliana Carvalho, Ricardo Rebouças e Vasco Furtado Universidade de Fortaleza UNIFOR juliana@edu.unifor.br ricardo@sspds.ce.gov.br vasco@unifor.br 1. Introdução
Leia maisADM041 / EPR806 Sistemas de Informação
ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes
Leia maisUNIVERSIDADE FEDERAL DE SANTA CATARINA
UNIVERSIDADE FEDERAL DE SANTA CATARINA CIÊNCIAS DA COMPUTAÇÃO MÁQUINAS DE COMITÊ APLICADAS À FILTRAGEM DE SPAM Monografia submetida à UNIVERSIDADE FEDERAL DE SANTA CATARINA para a obtenção do grau de BACHAREL
Leia maisData, Text and Web Mining
Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web
Leia maisAula 02: Conceitos Fundamentais
Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que
Leia maisUNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA
UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA ANÁLISE DE AGENTES CLASSIFICADORES PARA CATEGORIZAÇÃO AUTOMÁTICA DE DOCUMENTOS DIGITAIS PROPOSTA DE TRABALHO
Leia maisKDD E MINERAÇÃO DE DADOS:
KDD E MINERAÇÃO DE DADOS: Introdução e Motivação Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt Fatos: Avanços em TI e o crescimento
Leia maisUniversidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados
Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:
Leia maisAvaliando o que foi Aprendido
Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função
Leia maisTécnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos
Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Theo Silva Lins, Luiz Henrique de Campos Merschmann PPGCC - Programa de Pós-Graduação
Leia maisANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD
ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD RESUMO Thereza P. P. Padilha Fabiano Fagundes Conceição Previero Laboratório de Solos
Leia maisMLP (Multi Layer Perceptron)
MLP (Multi Layer Perceptron) André Tavares da Silva andre.silva@udesc.br Roteiro Rede neural com mais de uma camada Codificação de entradas e saídas Decorar x generalizar Perceptron Multi-Camada (MLP -
Leia maisUTILIZANDO O SOFTWARE WEKA
UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia
Leia maisData Mining II Modelos Preditivos
Data Mining II Modelos Preditivos Prof. Doutor Victor Lobo Mestre André Melo Mestrado em Estatística e Gestão de Informação Objectivo desta disciplina Fazer previsões a partir de dados. Conhecer os principais
Leia maisO Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados
SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento
Leia maisExemplo de Aplicação do DataMinig
Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta
Leia maisCurva ROC. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE
Curva ROC George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Introdução ROC (Receiver Operating Characteristics) Curva ROC é uma técnica para a visualização e a seleção de classificadores baseado
Leia maisMineração de dados em triagem de risco de saúde
Mineração de dados em triagem de risco de saúde Thales Vaz Maciel 1 ; Vinicius Rosa Seus 2 ; Karina dos Santos Machado 3 ; Eduardo Nunes Borges 4 1234 Centro de Ciências Computacionais, Fundação Universidade
Leia maisANÁLISE E MINERAÇÃO DE DADOS EM UM JOGO DE EMPRESAS PARA APOIO AO ENSINO DE CONCEITOS DE GESTÃO DA PRODUÇÃO, VENDAS E ESTRATÉGIAS DE NEGÓCIOS
ANÁLISE E MINERAÇÃO DE DADOS EM UM JOGO DE EMPRESAS PARA APOIO AO ENSINO DE CONCEITOS DE GESTÃO DA PRODUÇÃO, VENDAS E ESTRATÉGIAS DE NEGÓCIOS Daniel Ferreira de Barros Junior (UNINOVE ) danielf@uninove.br
Leia maisUNIVERSIDADE PRESBITERIANA MACKENZIE Faculdade de Computação e Informática MATRIZ CURRICULAR ELETIVAS
MATRIZ CURRICULAR S LIVRE ESCOLHA Núcleo Temático: HUMANAS Disciplina: LÍNGUA BRASILEIRA DE SINAIS 34 h/a (.34 ) Teóricas Etapa: 4ª Compreensão de aspectos composicionais da Língua Brasileira de Sinais
Leia maisTÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais
UNIVERSIDADE ESTADUAL DE PONTA GROSSA PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO APLICADA CRISTIAN COSMOSKI RANGEL DE ABREU TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem
Leia maisA Grande Importância da Mineração de Dados nas Organizações
A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil
Leia maisIN0997 - Redes Neurais
IN0997 - Redes Neurais Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática - CIn Departamento de Sistemas da Computação aluizioa@cin.ufpe.br Conteúdo Objetivos Ementa
Leia maisPadronização de Processos: BI e KDD
47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:
Leia maisDisciplina de Projetos e Análise de Algoritmos. Aula 1 - Apresentação aos Algoritmos Computacionais
Aula 1 - Apresentação aos Algoritmos Computacionais O que é a Disciplina? Disciplina de Projeto e Análise de Algoritmos Esta é uma disciplina de Algoritmos em nível de Pós-Graduação! Temas a serem abordados:
Leia maisExtração de Conhecimento & Mineração de Dados
Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática
Leia maisData Mining Software Weka. Software Weka. Software Weka 30/10/2012
Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.
Leia maisMarcelo K. Albertini. 17 de Abril de 2014
Introdução a Mineração de Dados Marcelo K. Albertini 17 de Abril de 2014 2/1 Organização do curso Prof. Marcelo Keese Albertini Sala: Bloco 1A - sala 1A230 Horário de atendimento: Sexta-feira 14h-17h ou
Leia maisSistemas de Apoio à Decisão
Sistemas de Apoio à Decisão Data Mining & Optimização Victor Lobo Objectivos gerais Abrir horizontes em temas actuais Aprender técnicas usadas em Sistemas de apoio à decisão ou Business Intelligence Métodos
Leia maisPredição do Valor Econômico de uma Oportunidade Exploratória de Petróleo
Predição do Valor Econômico de uma Oportunidade Exploratória de Petróleo Trabalho de Mestrado Marcos A. Affonso 1 (Aluno), Leila Andrade 2 (Orientador), Kate Revoredo 3 (Coorientador) Programa de pós-graduação
Leia maisAnálise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags
Universidade Federal de Pernambuco Graduação em Ciência da Computação 2012.2 Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Proposta de Trabalho de Graduação Aluno:
Leia maisUNIVERSIDADE CATÓLICA PORTUGUESA Centro Regional das Beiras Pólo de Viseu Instituto Universitário de Desenvolvimento e Promoção Social
UNIVERSIDADE CATÓLICA PORTUGUESA Centro Regional das Beiras Pólo de Viseu Instituto Universitário de Desenvolvimento e Promoção Social DISCIPLINA Controlo Informático da Gestão LICENCIATURA Informática
Leia maisTÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE
TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Aplicações de Behavior Scoring Roteiro - Introdução - Diferença entre Credit scoring e
Leia maisTópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados Sylvio Barbon Junior barbon@uel.br 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa I Etapa II Inteligência de Negócios Visão
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento
Leia maisProfs. Luiz Laranjeira, Nilton Silva, e Fabrício Braz
Laboratório de Dependabilidade e Segurança Lades Profs. Luiz Laranjeira, Nilton Silva, e Fabrício Braz RENASIC/CD-CIBER CD Ciber CTC - Comitê Técnico Científico RENASIC CD Comitê Diretor ASTECA VIRTUS
Leia maisUniversidade Federal do Vale do São Francisco - UNIVASF Colegiado de Engenharia de Computação CECOMP
Algoritmos e Programação Ricardo Argenton Ramos Baseado nos slides do professor Jadsonlee da Silva Sá Ementa Conceito de algoritmo. Lógica de programação e programação estruturada. Linguagem de definição
Leia maisCC-226 Introdução à Análise de Padrões
CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster
Leia maisINTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA
INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,
Leia maisUNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ PRÓ-REITORIA DE GRADUAÇÃO. PLANO DE ENSINO - PERÍODO LETIVO/ANO 2008 ANO DO CURSO: 5 o
UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ PRÓ-REITORIA DE GRADUAÇÃO PLANO DE ENSINO - PERÍODO LETIVO/ANO 2008 ANO DO CURSO: 5 o Curso: Informática Modalidade: Bacharelado Turno: Integral Centro: Centro
Leia maisDescoberta de Domínio Conceitual de Páginas Web
paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado
Leia maisCategorização de Textos baseada em Conceitos
Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Encontro de PLN Categorização de Textos baseada em Conceitos Silvia Maria
Leia maisMINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO
MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 12 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local
Leia mais3 Metodologia de Previsão de Padrões de Falha
3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar
Leia maisPALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.
1024 UMA ABORDAGEM BASEADA EM REDES PERCEPTRON MULTICAMADAS PARA A CLASSIFICAÇÃO DE MASSAS NODULARES EM IMAGENS MAMOGRÁFICAS Luan de Oliveira Moreira¹; Matheus Giovanni Pires² 1. Bolsista PROBIC, Graduando
Leia maisComplemento II Noções Introdutória em Redes Neurais
Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações
Leia maisSistemas de Apoio à Decisão Árvores de decisão V 1.2, V.Lobo, EN/ISEGI, 2010
V., V.Lobo, EN/ISEGI, O que é a árvore de decisão? Arvores de decisão Victor Lobo Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Nós (testes, ou conceitos) Comprimento
Leia maisINTELIGÊNCIA COMPUTACIONAL
INTELIGÊNCIA COMPUTACIONAL Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Dados pessoais Rosalvo Ferreira de Oliveira Neto MSc. em ciência da computação (UFPE) rosalvo.oliveira@univasf.edu.br
Leia maisProjeto de Redes Neurais e MATLAB
Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação
Leia maisUNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO
UNIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2010.2 ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno!
Leia maisEstudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1
Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Rafaela Giroto, 10º módulo de Ciência da Computação,
Leia maisAnálise de Técnicas de Mineração de Dados
Análise de Técnicas de Mineração de Dados Taylor Pablo Evaristo Silva 1, Lívia Márcia Silva 1 1 Universidade Presidente Antônio Carlos - Departamento de Ciência da Computação (UNIPAC) Rua Palma Bageto
Leia maisSistema Inteligente Não-Linear de Apoio à Aprendizagem 1 Rangel RIGO, Ana Paula Laboissière AMBRÓSIO
Sistema Inteligente Não-Linear de Apoio à Aprendizagem 1 Rangel RIGO, Ana Paula Laboissière AMBRÓSIO rangelrigo@gmail.com, apaula@inf.ufg.br Instituto de Informática Universidade Federal de Goiás (UFG)
Leia maisO que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.
O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar
Leia maisMineração de Dados: Introdução e Aplicações
Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro
Leia maisReconhecimento de entidades nomeadas em textos em português do Brasil no domínio do e-commerce
Reconhecimento de entidades nomeadas em textos em português do Brasil no domínio do e-commerce Lucas Hochleitner da Silva 1,2, Helena de Medeiros Caseli 1 1 Departamento de Computação Universidade Federal
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Apresentação da Disciplina Alessandro L. Koerich 2008 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem
Leia maisPré processamento de dados II. Mineração de Dados 2012
Pré processamento de dados II Mineração de Dados 2012 Luís Rato Universidade de Évora, 2012 Mineração de dados / Data Mining 1 Redução de dimensionalidade Objetivo: Evitar excesso de dimensionalidade Reduzir
Leia maisProtótipo de um Sistema Móvel para a Extração de. Características em Fragmentos de Imagem de Tecido. Cólico
Protótipo de um Sistema Móvel para a Extração de Características em Fragmentos de Imagem de Tecido Cólico Application Prototype for Mobile Devices to Features Extraction in Image Fragments Colic Tissue
Leia maisTRATAMENTO E ANÁLISE DE SINAIS DE BAIXA FREQUÊNCIA PARA EMULAÇÃO DE CANAL RÁDIO
TRATAMENTO E ANÁLISE DE SINAIS DE BAIXA FREQUÊNCIA PARA EMULAÇÃO DE CANAL RÁDIO Davi Schmutzler Valim Faculdade de Engenharia Elétrica CEATEC davi_valim@puccampinas.edu.br Resumo: O trabalho trata de fazer
Leia maisSTUDY ABOUT INFLUENCE ON ACADEMIC PERFORMANCE OF STUDENTS USERS OF SOCIAL NETWORKS
STUDY ABOUT INFLUENCE ON ACADEMIC PERFORMANCE OF STUDENTS USERS OF SOCIAL NETWORKS Elton Rabelo (Instituto de Ensino Superior e Pesquisa INESP, MG, Brasil) - eltonneolandia@yahoo.com.br Thiago Magela Rodrigues
Leia mais4 Avaliação Experimental
4 Avaliação Experimental Este capítulo apresenta uma avaliação experimental dos métodos e técnicas aplicados neste trabalho. Base para esta avaliação foi o protótipo descrito no capítulo anterior. Dentre
Leia maisBanco de Dados - Senado
Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs
Leia maisEstudo comparativo de métodos de segmentação de imagens digitais de aves
Estudo comparativo de métodos de segmentação de imagens digitais de aves Felipe de Sousa NOBRE; Paulo César Miranda MACHADO Escola de Engenharia Elétrica e de Computação - UFG felipesnobre@gmail.com, pcesar@eee.ufg.br
Leia maisFUNDAÇÃO DE APOIO AO ENSINO TÉCNICO DO ESTADO DO RIO DE JANEIRO FAETERJ Petrópolis Área de Extensão PLANO DE CURSO
FUNDAÇÃO DE APOIO AO ENINO TÉCNICO DO ETADO DO RIO DE JANEIRO PLANO DE CURO 1. Identificação Curso de Extensão: INTRODUÇÃO AO ITEMA INTELIGENTE Professor Regente: José Carlos Tavares da ilva Carga Horária:
Leia maisPROJETO DE PESQUISA MODALIDADE INICIAÇÃO CIENTÍFICA (BOLSA PIC/FACIT/FAPEMIG)
PROJETO DE PESQUISA MODALIDADE INICIAÇÃO CIENTÍFICA (BOLSA PIC/FACIT/FAPEMIG) MONTES CLAROS FEVEREIRO/2014 COORDENAÇÃO DE PESQUISA PROGRAMA DE INICIAÇÃO CIENTÍFICA DISPOSITIVOS MÓVEIS INTELIGENTES ORIENTADOR:
Leia maisUNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS
UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário
Leia maisAprendizagem de Máquina
Plano da Apresentação Aprendizagem de Máquina Alessandro L. Koerich 2007 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Professor & Experiência Acadêmica Horários
Leia mais3 Metodologia para Segmentação do Mercado Bancário
3 Metodologia para Segmentação do Mercado Bancário Este capítulo descreve a metodologia proposta nesta dissertação para a segmentação do mercado bancário a partir da abordagem post-hoc, servindo-se de
Leia maisPrevisão do Índice da Bolsa de Valores do Estado de São Paulo utilizandoredes Neurais Artificiais
Previsão do Índice da Bolsa de Valores do Estado de São Paulo utilizandoredes Neurais Artificiais Redes Neurais Artificiais Prof. Wilian Soares João Vitor Squillace Teixeira Ciência da Computação Universidade
Leia maisData Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento
Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um
Leia maisProf. Júlio Cesar Nievola Data Mining PPGIa PUCPR
Uma exploração preliminar dos dados para compreender melhor suas características. Motivações-chave da exploração de dados incluem Ajudar na seleção da técnica correta para pré-processamento ou análise
Leia maisDescoberta de Conhecimento em Bases de Dados. Classificação
Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Classificação Descoberta
Leia maisContexto de Big Data, Ciência de Dados e KDD
Contexto de Big Data, Ciência de Dados e KDD Fabrício J. Barth! Disciplina de Modelagem Descritiva e Preditiva! Pós-Graduação em Big Data e Analytics 100 10 quantidade de informações Sempre houve:!! Produção
Leia maisDESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO
Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO Aluno: Rafael
Leia maisAVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS
AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS Hugo Marques Casarini Faculdade de Engenharia de Computação
Leia maisData Mining: Ferramenta JAVA
Data Mining: Ferramenta JAVA JAVA para Data Mining Weka 3: Data Mining Software em Java http://www.cs.waikato.ac.nz/ml/weka/ Coleção de algoritmos para as tarefas de data mining; Free software. WEKA: JAVA
Leia maisWeb Data Mining com R
Web Data Mining com R Fabrício J. Barth fabricio.barth@gmail.com VAGAS Tecnologia e Faculdade BandTec Maio de 2014 Objetivo O objetivo desta palestra é apresentar conceitos sobre Web Data Mining, fluxo
Leia maisMINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP
MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP 1 Data de entrega dos originais à redação em 15/03/2013 e recebido
Leia maisAlgoritmo K-Means Paralelo com base no MapReduce para Mineração de dados agrícolas
312 Algoritmo K-Means Paralelo com base no MapReduce para Mineração de dados agrícolas Lays Helena Lopes Veloso 1, Luciano José Senger 1 1 Departamento de Informática Universidade Estadual de Ponta Grossa
Leia maisPROGRAMA. Curso: Mestrado em Educação e Comunicação Multimédia. diurno. Ciclo: 2º. pós-laboral. Ano: 1º Semestre: 1º
PROGRAMA Ciclo: 2º Curso: Mestrado em Educação e Comunicação Multimédia diurno pós-laboral Ano: 1º Semestre: 1º Unidade Curricular: FUNDAMENTOS DE LÓGICA E ALGORITMOS DE PROGRAMAÇÃO Código: Departamento:
Leia maisRevista Hispeci & Lema On Line ano III n.3 nov. 2012 ISSN 1980-2536 unifafibe.com.br/hispecielemaonline Centro Universitário UNIFAFIBE Bebedouro-SP
Reconhecimento de face utilizando banco de imagens monocromáticas e coloridas através dos métodos da análise do componente principal (PCA) e da Rede Neural Artificial (RNA) [Recognition to face using the
Leia maisPós-Graduação em Engenharia Elétrica Inteligência Artificial
Pós-Graduação em Engenharia Elétrica Inteligência Artificial João Marques Salomão Rodrigo Varejão Andreão Inteligência Artificial Definição (Fonte: AAAI ): "the scientific understanding of the mechanisms
Leia maisFORMULÁRIO PARA APRESENTAÇÃO DE PROJETO DE PESQUISA - PIBIC TÍTULO DO PROJETO Mineração de Grafos usando Ontologias COORDENADOR
Governo do Estado do Rio Grande do Norte Secretariado de Estado da Educação e Cultura - SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE - UERN Pró-Reitoria de Pesquisa e Pós-Graduação PROPEG Departamento
Leia mais