Mineração de dados em triagem de risco de saúde

Tamanho: px
Começar a partir da página:

Download "Mineração de dados em triagem de risco de saúde"

Transcrição

1 Mineração de dados em triagem de risco de saúde Thales Vaz Maciel 1 ; Vinicius Rosa Seus 2 ; Karina dos Santos Machado 3 ; Eduardo Nunes Borges Centro de Ciências Computacionais, Fundação Universidade do Rio Grande, Rio Grande - Rio Grande do Sul, Brasil (Recebido em 22 de setembro de 2014; aceito em 16 de outubro de 2014) Com a grande quantidade de dados gerados por sistemas de informação, utilizados em diversas áreas organizacionais, a necessidade de explorar esses dados torna-se evidente, com o fim de transformá-los em conhecimento interessante. O objetivo deste artigo é descrever, passo a passo, a pesquisa pela descoberta de conhecimento no domínio da triagem médica. O foco do estudo está nas fases de pré-processamento e na mineração de dados, especificamente na tarefa de classificação. É discutida a aplicação do algoritmo C4.5, denominado no software WEKA como J48, proposta uma abordagem sensível à custo e apresentados os resultados obtidos. Palavras-chave: triagem médica, descoberta de conhecimento em bases de dados, mineração de dados. Data Mining in Health Risk Triage With the large amount of data generated by information systems, used in many organizational areas, the need to explore such data becomes evident, in order to transform them into interesting knowledge. This paper s goal is to describe, step by step, this research for knowledge discovery in the domain of medical triage. The study is focused on the stages of pre-processing and data mining, specifically in a classification task. We discuss the application of the C4.5 algorithm, named J48 in the WEKA software, propose a cost-sensitive approach and present the obtained results. Keywords: medical triage, knowledge discovery from data, data mining. 1. INTRODUÇÃO De acordo com Han, Kamber e Pei [1], é possível observar um rápido crescimento na quantidade de dados que é coletada nas organizações. A descoberta de conhecimento em bases de dados, ou knowledge discovery from data (KDD), consiste na atividade de transformar grandes quantidades de dados em informação que possa ser usada na prática, ou que produza relevância em determinada área de conhecimento [2]. O processo de KDD compreende três principais etapas: pré-processamento, mineração de dados e pós-processamento [2]. No pré-processamento, os dados, conforme disponibilizados, são preparados para as etapas seguintes do processo. Ocorre a conversão dos dados, em uma forma bruta, para um formato mais apropriado, através da limpeza e remoção de dados ruidosos, por exemplo. Subsequentemente, ocorre a aplicação de técnicas de mineração de dados, com a possibilidade da execução de diversos tipos de algoritmos sobre um conjunto de dados, com o objetivo de produzir um modelo. No pós-processamento, o modelo obtido é analisado, avaliado e apresentado de maneira compreensível por humanos [3]. Entende-se que o problema a ser tratado em KDD é o de transformar um conjunto de dados em um modelo utilizável, com determinado propósito, e que possibilite o entendimento humano. Um exemplo seria a possibilidade de predizer a ocorrência de uma importante situação em determinado domínio de conhecimento. No caso do domínio da saúde, de acordo com Shama e Mansotra [4], esta é uma das áreas de maior importância para a aplicação de mineração de dados, podendo potencializar o auxílio no controle de infecções, diagnósticos e tratamento de várias doenças, além de gestão de recursos da saúde, gestão hospitalar e administração da saúde pública, por exemplo. 1

2 Dentro deste contexto, Kohn [5] explica que a mineração de dados já tem sido utilizada de forma intensa e em larga escala por muitas organizações de saúde, o que torna esta ciência cada vez mais popular, se não essencial. O objetivo deste trabalho consiste em obter, por meio de um processo de descoberta de conhecimento, um modelo de classificação que possa ser aplicado no auxílio à triagem de risco de vida, na medicina. Entende-se que atividades de triagem possuem o objetivo de identificar o risco de vida em pacientes através da análise de seus sinais vitais. A partir desta introdução, o presente artigo está organizado com a seção 2 apresentando os materiais utilizados e métodos aplicados no estudo, o que inclui uma descrição detalhada do conjunto de dados e informações sobre as atividades de pré-processamento que foram realizadas. Resultados são apresentados na seção 3, onde as atividades de classificação e os modelos obtidos são descritos e discutidos. Por fim, a seção 4 conclui o trabalho e apresenta possibilidades de continuidade em trabalhos futuros. 2. MATERIAIS E MÉTODOS Para execução deste estudo, foi utilizado um conjunto de dados referente à triagem de risco de vida em uma Unidade de Pronto Atendimento (UPA) do Sistema Único de Saúde (SUS), descrito detalhadamente na subseção 2.1. Os dados foram pré-processados a partir das técnicas relatadas na subseção 2.2, onde também é apresentada a problemática do desbalanceamento ocorrente no conjunto de dados em estudo. A etapa de mineração de dados foi realizada com a utilização do software Waikato Environment for Knowledge Analysis (WEKA) [6]. A tarefa de mineração de dados utilizada foi a de classificação, que consiste na construção de um modelo para a predição de dados categóricos [1]. Inicialmente, foi aplicado um algoritmo baseado em arvores de decisão, o C4.5 [7], disponível no software WEKA sob a implementação J48. Também foi observada a aplicação de sensibilidade à custo no algoritmo de classificação descrito. Na ferramenta WEKA, a utilização da sensibilidade à custo consiste na aplicação de um meta-classificador em conjunto com um classificador base, tornando-o sensível à valores de custos que são manipuláveis [6]. Relaciona-se, fortemente, o desbalanceamento entre classes com a abordagem de aprendizado sensível ao custo, em classificação [1]. Entende-se, por exemplo, que, em diagnóstico médico, um caso de falso negativo seja deveras mais custoso do que um caso de falso positivo. Isto é explorado de forma mais abrangente na seção O CONJUNTO DE DADOS O conjunto de dados utilizado neste estudo é referente à dados de sinais vitais que profissionais de medicina e enfermagem consideram a fim de determinar o grau de risco de vida em pacientes durante a atividade de triagem. Também está presente a categoria de risco indicada em cada instância. Conforme exposto anteriormente, estes dados foram oriundos da projeção do banco de dados inerente ao sistema de informação utilizado em uma UPA e o conjunto é composto por registros de atividades de triagem individuais. Os atributos preditivos do conjunto de dados e suas respectivas descrições são apresentados na Tabela 1. A determinação do valor de risco é o principal objetivo da triagem, sendo este o atributo alvo dos modelos a serem inferidos. Esse campo possui variação de valores de 1 a 4, que representam, respectivamente, as classificações de risco Eletiva, Baixo, Médio e Alto O PRÉ-PROCESSAMENTO Pré-processamento de dados é uma etapa importante no processo de mineração de dados e descoberta de conhecimento, onde as anomalias e inconsistências de dados são detectadas e

3 corrigidas [1]. Durante o pré-processamento, limpeza de dados, integração, redução, transformação, e outras medidas possíveis são executadas sobre os dados. Tabela 1: Descrição dos atributos do conjunto de dados utilizados neste trabalho. Atributos id pas das fc fr temperatura peso oxigenacao ao mrm mrv risco datahora usuario Descrição Identificação para o tratamento. Pressão sanguínea sistólica. Pressão sanguínea diastólica. Frequência cardíaca. Frequência respiratória. Temperatura no momento da triagem. Peso no momento da triagem. Saturação de oxigênio sanguínea (SpO2). Resposta ocular, como parte da Escala de Coma de Glasgow (GCS). Melhor resposta motora, como parte da GCS. Melhor resposta verbal, como parte da GCS. Risco de morte: 1-Eletiva, 2-Baixo, 3-Médio, 4-Alto. Horário e data da triagem. Nome do profissional que aplicou a triagem. O conjunto de dados é apresentado na forma de um arquivo de valores separados por vírgulas (CSV), onde os valores estão entre aspas e informações de cabeçalho não estão presentes. Inicialmente, observando-se os dados, foi possível verificar que os valores de vários atributos em algumas instâncias mantinham o valor zero. No domínio de conhecimento em medicina, é entendido que um valor zero para qualquer sinal vital é uma indicação de ausência de valor válido ou de morte do paciente. Considerou-se que, neste caso, o registro de morte do paciente não é uma possibilidade devido ao processo do domínio de negócio. Portanto, o primeiro passo da limpeza de dados foi a conversão de valores iguais a zero em valores nulos, considerando que zero não é a representação mais adequada para eles mas, sim, a sua não existência. Além disto, notou-se que todas as instâncias têm registrados os mesmos valores para os campos ao, mrm e mrv, respectivamente, inteiros de 4, 5 e 6 (os mais altos níveis para cada indicador GCS). Isso indica que esses três campos de dados tenham sido desconsiderados quando da verificação de sinais vitais durante a triagem, o que implica, diretamente, em os mesmos não produzirem relevância estatística ou no cálculo das métricas de entropia ou ganho de informação para fins de classificação em mineração de dados. Devido à irrelevância considerável, a remoção destes três campos foi realizada como parte da limpeza dos dados do conjunto. Os campos denominados id, datahora e usuario também foram removidos do conjunto de dados a ser analisado, uma vez que foram considerados irrelevantes para efeitos de análise de risco de vida em triagem. Entende-se que, caso mantidos, poderiam causar ramos de uma árvore de decisão que não produzam qualquer relevância para o modelo, resultando em confusão e overfitting, uma situação indesejada em aprendizagem de máquina, quando um modelo é adequado fortemente a um conjunto de dados em específico, apenas, e não se aplica na prática por este motivo. O conjunto de dados continha, inicialmente, instâncias. Entretanto, armazenavam dados nulos e foram descartadas do experimento. 325 registros continham dados discrepantes, ou seja, possuíam valores inaceitáveis, extremamente maiores ou menores que valores considerados para humanos e foram eliminados também. Assim, manteve-se instâncias no conjunto de dados utilizado como entrada neste estudo. Além da limpeza dos dados, para aplicar a tarefa de classificação, foi necessário converter o tipo de dados do campo risco para o tipo categórico, pois os valores estavam apresentados como numéricos e representam, na verdade, rótulos nominais para graus de risco de morte.

4 Para o subconjunto de selecionado há uma diferença considerável no total de casos que pertencem a cada classe de risco (atributo-alvo). Por exemplo, entre os pacientes que foram atribuídos a classificação de baixo risco e os que têm sido atribuídos a etiqueta de alto risco, existe uma diferença de, aproximadamente, 150 para 1 (Tabela 2). Tabela 2: Total de instâncias por classe para o subconjunto selecionado. Grau de Risco Total de Instâncias Eletivo 3802 Baixo 6173 Médio 981 Alto 41 Mesmo com essa diferença entre o total de instâncias em cada classe do atributo alvo, nenhuma técnica de reamostragem foi aplicada ao conjunto de dados estudado durante a fase de pré-processamento. Essa decisão ocorreu em detrimento à natureza da técnica de classificação aplicada neste estudo, chamada de aprendizagem sensível à custo [3]. A descrição do experimento e os resultados são apresentados na próxima seção. 3. RESULTADOS E DISCUSSÃO A tarefa de classificação aplicada neste trabalho tem por objetivo determinar o risco que foi atribuído a cada instância, com base nos demais atributos preditivos. O algoritmo de árvore de decisão J48 foi aplicado com os parâmetros número mínimo de instâncias por nó igual a 2 e fator de confiança mínima utilizada em podas igual a O experimento foi configurado para testar o modelo obtido com uma abordagem de validação cruzada com 10 partições. O resultado da avaliação do modelo gerado, considerando a acurácia, foi de 59,33%. A acurácia de um modelo é considerada, geralmente, como o principal indicador de sucesso da classificação e, para este experimento, a acurácia apresentada não teve um valor muito alto. Contudo, isto não foi visto como um problema para este estudo, pois a acurácia não foi considerada como o único critério de sucesso. Verificou-se na matriz de confusão (Tabela 3), resultante do teste do modelo gerado, que, dentre as ocorrências de erros de classificação, houveram predições de risco para níveis mais altos e, também, mais baixos do que eram, na realidade. Além disto, foi observado que o modelo gerado não possibilitou a identificação de casos quaisquer da classe correspondente ao nível de risco alto, embora esteja explícita a existência de casos do tipo. Os números de acertos na classificação podem ser observados na diagonal principal da matriz, enquanto os erros podem ser verificados fora da diagonal principal da matriz abaixo (Tabela 3). Tabela 3: Matriz de confusão obtida com a aplicação do algoritmo J48 no conjunto de dados. A B C D Classe A = Eletivo B = Baixo C = Médio D = Alto Devido à natureza da triagem de risco de vida, entende-se que ambas estas características, inerentes ao modelo gerado, não são aceitáveis. Isto acontece pela conveniência prática do domínio do negócio em que faz-se admissível que um caso de determinado nível de risco seja classificado como maior do que realmente é, enquanto o inverso não é aceitável [1]. Exemplos disto, na prática, seriam eventuais casos de risco baixo sendo triados como risco médio ou eventuais casos de risco médio sendo triados como risco alto, os quais podem ser aceitáveis, enquanto o contrário não. Além disto, o fato de que este modelo, obtido inicialmente,

5 não atribuiu o mais alto nível de risco a qualquer instância o torna absolutamente inadequado para uso na prática. Mecanismos de classificação em mineração de dados trabalham com a análise do custo em suas operações de tomada de decisão e é possível fazer essas operações sejam sensíveis a seus custos [3]. Em aplicação, isto significa que os valores de custo de classificação podem ser manipulados para induzir um algoritmo a considerar determinadas possibilidades de classificação. No presente estudo, foi possível verificar que esta característica foi causada pela anteriormente referida diferença entre o número de instâncias pertencentes a cada classe, onde classes com o maior número de instâncias de treinamento apresentam menor custo de predição do que classes com menor número de instâncias de treinamento. Isto levou o algoritmo de classificação a propor classificações apenas para classes cuja quantidade de instâncias correspondentes era majoritária no conjunto de dados, especificamente, riscos eletivos e baixo, mas descartando, estatisticamente, classificações como riscos médio e alto. Diante dos resultados não promissores apresentados à uma abordagem simples de classificação com o algoritmo J48, foi considerada uma nova, onde, por meio de um metaclassificador sensível à custo em associação com o algoritmo J48, é possível definir se a atividade será realizada através de avaliação sensível à custo ou aprendizado sensível à custo [6], sendo esta utilizada neste estudo. Esta possibilidade permite que os profissionais definam uma matriz de custo, ou seja, artefato que tem a capacidade de definir, à certas áreas de uma matriz de confusão, um custo mais elevado do que o padrão em condições ordinárias. Isto permite com que um algoritmo de classificação tente evitar a classificação de ocorrências nas áreas determinadas. Entende-se que isto tem o potencial de aumentar a precisão e/ou a relevância do modelo no domínio do negócio. Utilizando o algoritmo J48 com o meta-classificador sensível à custo para proporcionar aprendizagem sensível à custo com uma matriz de custo conforme demonstrado na Tabela 4, o percentual de acurácia na classificação caiu para 56,56% e a respectiva matriz de confusão é apresentada na Tabela 5. Tabela 4: Matriz de custo utilizada pelo algoritmo J48 sensível à custo Tabela 5: Matriz de confusão obtida com a aplicação do algoritmo J48 sensível à custo. A B C D Classe A = Eletivo B = Baixo C = Médio D = Alto Ao analisar as árvores de decisão resultantes de cada um dos experimentos descritos, foi observado que, em oposição ao modelo gerado pela utilização do algoritmo J48 sem sensibilidade à custo, onde nenhuma instância de triagem foi classificada como alto risco, o modelo gerado com a capacidade de sensibilidade à custo foi capaz de possibilitar a ocorrência de classificações em todas classes. A matriz de confusão disposta na Tabela 5 também evidencia este resultado. Um exemplo disto pode ser notado bem ao início da árvore de decisão gerada pela utilização do modelo, na qual supostas triagens de pacientes com os sinais vitais de pressão arterial sistólica entre 128 mmhg e 169 mmhg, temperatura menor ou igual a 37,1 ºC, oxigenação entre 84 SpO2 e 88 SpO2 e frequência cardíaca maior do que 146 BPM seriam classificadas como de alto risco.

6 4. CONCLUSÃO Mesmo que, associando o algoritmo de classificação J48 com um meta-classificador para aprendizado sensível à custo, a atividade tenha sido desempenhada com uma diferença de 2.77% na acurácia de classificação, conhecimento sobre o domínio do negócio inerente contribuiu para a descoberta de que, em determinados casos (e neste específico), esta não deve ser considerada a única métrica de sucesso. As matrizes de confusão apresentadas em ambos experimentos mostraram que, através da associação de aprendizado sensível à custo ao classificador, foi possível obter um modelo gerado por aprendizado de máquina que seja aplicável no domínio de negócio de triagem médica e passível de avaliação na prática. 5. REFERENCIAS BIBLIOGRÁFICAS 1. Han, Jiawei; Kamber, Micheline. Data Mining. Concepts and Techniques. Second edition. The Morgan Kaufmann Series in Data Management Systems. Elsevier Inc., Tan, Pang-Ning; Steinbach, Michael; Kumar, Vipin. Introduction to Data Mining Witten, Ian H.; Frank, Eibe; Hall, Mark A. Data Mining. Pratical Machine Learning Tools and atechniques. Third edition. The Morgan Kaufmann Series in Data Management Systems. Elsevier Inc., Shama A. Mansotra V. Emerging applications of data mining for healthcare management - A critical review International Conference on Computing for Sustainable Global Development (INDIACom), New Dehli. pages Kohn, H C and Tan G. Data Mining Applications in Healthcare. Journal of Healthcare Information Management - Vol. 19, No. 2. Pages Mark Hall, Eibe Frank, Geoffrey Holmes, Bernhard Pfahringer, Peter Reutemann, Ian H. Witten (2009); The WEKA Data Mining Software: An Update; SIGKDD Explorations, Volume 11, Issue Kohavi, R; Quinlan, J. R. Data mining tasks and methods: Classification: decision-tree discovery. Handbook of data mining and knowledge discovery, pages , 2002.

Mineração de dados em triagem de risco de saúde

Mineração de dados em triagem de risco de saúde Mineração de dados em triagem de risco de saúde Thales Vaz Maciel 1 Vinicius Rosa Seus 1 Karina dos Santos Machado 1 Eduardo Nunes Borges 1 Resumo: Com a grande quantidade de dados gerados por sistemas

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS Hugo Marques Casarini Faculdade de Engenharia de Computação

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

ANÁLISE E MINERAÇÃO DE DADOS EM UM JOGO DE EMPRESAS PARA APOIO AO ENSINO DE CONCEITOS DE GESTÃO DA PRODUÇÃO, VENDAS E ESTRATÉGIAS DE NEGÓCIOS

ANÁLISE E MINERAÇÃO DE DADOS EM UM JOGO DE EMPRESAS PARA APOIO AO ENSINO DE CONCEITOS DE GESTÃO DA PRODUÇÃO, VENDAS E ESTRATÉGIAS DE NEGÓCIOS ANÁLISE E MINERAÇÃO DE DADOS EM UM JOGO DE EMPRESAS PARA APOIO AO ENSINO DE CONCEITOS DE GESTÃO DA PRODUÇÃO, VENDAS E ESTRATÉGIAS DE NEGÓCIOS Daniel Ferreira de Barros Junior (UNINOVE ) danielf@uninove.br

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES Kelton Costa; Patricia Ribeiro; Atair Camargo; Victor Rossi; Henrique Martins; Miguel Neves; Ricardo Fontes. kelton.costa@gmail.com; patriciabellin@yahoo.com.br;

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Determinação dos Fatores Críticos na Análise de Desempenho de Alunos de Pósgraduação Utilizando Metodologia de Mineração de Dados

Determinação dos Fatores Críticos na Análise de Desempenho de Alunos de Pósgraduação Utilizando Metodologia de Mineração de Dados Resumo Determinação dos Fatores Críticos na Análise de Desempenho de Alunos de Pósgraduação Utilizando Metodologia de Mineração de Dados Autoria: Elizabeth de Oliveira Carpenter, Gerson Lachtermacher O

Leia mais

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012 Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.

Leia mais

Fabrício J. Barth. Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com

Fabrício J. Barth. Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com Uma Introdução à Mineração de Informações Fabrício J. Barth Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com Outubro de 2010 Objetivo Apresentar

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

Considerações sobre Conhecimento Incerto e Redes Bayesianas

Considerações sobre Conhecimento Incerto e Redes Bayesianas Considerações sobre Conhecimento Incerto e Redes Bayesianas Felipe S. Gurgel 1, Maiquel de Brito 1 1 Universidade Federal de Santa Catarina - UFSC Departamento de Automação e Sistemas - DAS UFSC/CTC/DAS

Leia mais

Web Data Mining com R

Web Data Mining com R Web Data Mining com R Fabrício J. Barth fabricio.barth@gmail.com VAGAS Tecnologia e Faculdade BandTec Maio de 2014 Objetivo O objetivo desta palestra é apresentar conceitos sobre Web Data Mining, fluxo

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina SEMINC 2001 57 O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina MARIZA FERRO HUEI DIANA LEE UNIOESTE - Universidade Estadual do Oeste do Paraná CECE Centro de Engenharias e

Leia mais

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Theo Silva Lins, Luiz Henrique de Campos Merschmann PPGCC - Programa de Pós-Graduação

Leia mais

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Rafaela Giroto, 10º módulo de Ciência da Computação,

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

FUNDAÇÃO DE ENSINO EURÍPIDES SOARES DA ROCHA CENTRO UNIVERSITÁRIO EURÍPIDES DE MARÍLIA UNIVEM CURSO DE BACHARELADO EM SISTEMAS DE INFORMAÇÃO

FUNDAÇÃO DE ENSINO EURÍPIDES SOARES DA ROCHA CENTRO UNIVERSITÁRIO EURÍPIDES DE MARÍLIA UNIVEM CURSO DE BACHARELADO EM SISTEMAS DE INFORMAÇÃO FUNDAÇÃO DE ENSINO EURÍPIDES SOARES DA ROCHA CENTRO UNIVERSITÁRIO EURÍPIDES DE MARÍLIA UNIVEM CURSO DE BACHARELADO EM SISTEMAS DE INFORMAÇÃO DANIEL DA SILVA DISNER MINERAÇÃO DE DADOS PARA OBTENÇÃO DE CONHECIMENTO

Leia mais

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP 1 Data de entrega dos originais à redação em 15/03/2013 e recebido

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Data mining na descoberta de padrões de sintomas com foco no auxílio ao diagnóstico médico

Data mining na descoberta de padrões de sintomas com foco no auxílio ao diagnóstico médico Data mining na descoberta de padrões de sintomas com foco no auxílio ao diagnóstico médico Alexander Rivas de Melo Junior 1, Márcio Palheta Piedade 1 1 Ciência da Computação Centro de Ensino Superior FUCAPI

Leia mais

Árvores de Decisão. Índice

Árvores de Decisão. Índice Árvores de Decisão Índice 1. Introdução... 2 2. Árvores de decisão e a tarefa de classificação... 6 3. Principais conceitos vinculados à indução de árvores de decisão... 15 3.1 Top-Down Induction of Decision

Leia mais

Mineração de Dados Aplicada à Modelagem da Incidência da Anemia Infecciosa Equina (AIE), no Pantanal Sul-matogrossense

Mineração de Dados Aplicada à Modelagem da Incidência da Anemia Infecciosa Equina (AIE), no Pantanal Sul-matogrossense Mineração de Dados Aplicada à Modelagem da Incidência da Anemia Infecciosa Equina (AIE), no Pantanal Sul-matogrossense Helano P. de Lima 1, Urbano G. P. de Abreu 2, Stanley R. de M. Oliveira 1, Silvia

Leia mais

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Thiago Ferauche, Maurício Amaral de Almeida Laboratório de Pesquisa em Ciência de Serviços

Leia mais

PROCESSAMENTO TEXTUAL EM PÁGINAS DA WEB

PROCESSAMENTO TEXTUAL EM PÁGINAS DA WEB PROCESSAMENTO TEXTUAL EM PÁGINAS DA WEB Aluno: Pedro Lazéra Cardoso Orientador: Eduardo Sany Laber Antecedentes Na primeira fase da Iniciação Científica, o aluno deu continuidade ao projeto que estava

Leia mais

EXTRAÇÃO DE PADRÕES RELACIONADOS A PROFESSORES DO ENSINO BÁSICO - UM ESTUDO EM BASES DE DADOS DESBALANCEADAS

EXTRAÇÃO DE PADRÕES RELACIONADOS A PROFESSORES DO ENSINO BÁSICO - UM ESTUDO EM BASES DE DADOS DESBALANCEADAS EXTRAÇÃO DE PADRÕES RELACIONADOS A PROFESSORES DO ENSINO BÁSICO - UM ESTUDO EM BASES DE DADOS DESBALANCEADAS Stella Oggioni da Fonseca sfonseca@iprj.uerj.br Universidade do Estado do Rio de Janeiro, Instituto

Leia mais

Web Data Mining com R: design de projetos para criação de modelos preditivos

Web Data Mining com R: design de projetos para criação de modelos preditivos Web Data Mining com R: design de projetos para criação de modelos preditivos Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário e Objetivos Etapas em estudos preditivos Escolha

Leia mais

Universidade do Estado de Santa Catarina UDESC Centro de Ciências Tecnológicas CCT CEP 89223-100 Joinville SC Brasil

Universidade do Estado de Santa Catarina UDESC Centro de Ciências Tecnológicas CCT CEP 89223-100 Joinville SC Brasil SISTEMA DE APOIO À TOMADA DE DECISÃO PARA O MONITORAMENTO DE ALARMES PATRIMONIAIS UTILIZANDO INDUÇÃO DE ÁRVORES DE DECISÃO Alex L Sousa, André B Leal, Claudio C Sá, Ricardo F Martins Programa de Pós-Graduação

Leia mais

Protótipo de um Sistema Móvel para a Extração de. Características em Fragmentos de Imagem de Tecido. Cólico

Protótipo de um Sistema Móvel para a Extração de. Características em Fragmentos de Imagem de Tecido. Cólico Protótipo de um Sistema Móvel para a Extração de Características em Fragmentos de Imagem de Tecido Cólico Application Prototype for Mobile Devices to Features Extraction in Image Fragments Colic Tissue

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Introdução e Motivação Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt Fatos: Avanços em TI e o crescimento

Leia mais

servidores Web com RapidMiner

servidores Web com RapidMiner Mineração de regras de associação em servidores Web com RapidMiner Fabrício J. Barth fabricio.barth@gmail.com Resumo Este texto apresenta o uso da ferramenta RapidMiner na mineração de regras de associação

Leia mais

APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1.

APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1. APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1. SQUIZANI, Cleonice Schell 2 ; MORALES, Yuri 2 ; VIEIRA, Sylvio André Garcia 2 1 Trabalho de pesquisa - UNIFRA

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

Potencial de técnicas de mineração de dados para modelos de alerta da ferrugem do cafeeiro

Potencial de técnicas de mineração de dados para modelos de alerta da ferrugem do cafeeiro Potencial de técnicas de mineração de dados para modelos de alerta da ferrugem do cafeeiro Cesare Di Girolamo Neto 1, Luiz Henrique Antunes Rodrigues 2, Thiago Toshiyuki Thamada 1, Carlos Alberto Alves

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

Identificação de Padrões em Registros de Doenças com Técnicas de Mineração de Dados

Identificação de Padrões em Registros de Doenças com Técnicas de Mineração de Dados Identificação de Padrões em Registros de Doenças com Técnicas de Mineração de Dados Resumo. Nas últimas décadas, tem aumentado à necessidade de um processo automatizado para a descoberta de informações

Leia mais

Disciplina de Text Mining

Disciplina de Text Mining Disciplina de Text Mining Fabrício J. Barth fabricio.barth@gmail.com Pós Graduação em Big Data - Faculdade BandTec Novembro de 2015 Objetivo O objetivo deste curso é apresentar a área de Text Mining. Serão

Leia mais

UMA ANÁLISE COMPARATIVA ENTRE TÉCNICAS E FERRAMENTAS DE MINERAÇÃO DE DADOS UTILIZADAS NA ACADEMIA E NA INDÚSTRIA EM RECIFE

UMA ANÁLISE COMPARATIVA ENTRE TÉCNICAS E FERRAMENTAS DE MINERAÇÃO DE DADOS UTILIZADAS NA ACADEMIA E NA INDÚSTRIA EM RECIFE UMA ANÁLISE COMPARATIVA ENTRE TÉCNICAS E FERRAMENTAS DE MINERAÇÃO DE DADOS UTILIZADAS NA ACADEMIA E NA INDÚSTRIA EM RECIFE Thiago Affonso de M. N. Viana Instituto Federal de Pernambuco Av. Prof Luiz Freire,

Leia mais

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR

Mineração de Dados. Prof. Júlio Cesar Nievola Especialização em Inteligência Computacional PPGIA - PUCPR Mineração de Dados PPGIA - PUCPR Agenda 1. Histórico 2. Definições e Características 3. Processo e Tarefas de DM 4. Pré-Processamento 5. Representação do Conhecimento 6. Principais Tarefas 7. Procedimentos

Leia mais

MODELO INTEGRADO PARA ANÁLISE DO DESLIGAMENTO DE EMPREGADOS: UM ESTUDO DE CASO

MODELO INTEGRADO PARA ANÁLISE DO DESLIGAMENTO DE EMPREGADOS: UM ESTUDO DE CASO MODELO INTEGRADO PARA ANÁLISE DO DESLIGAMENTO DE EMPREGADOS: UM ESTUDO DE CASO Felipe de Moraes Oliveira Thiago de Melo Rezende PETROBRAS Av. República do Chile 65, Rio de Janeiro RJ. CEP 20031-912 felipe.moraes@petrobras.com.br

Leia mais

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados Sylvio Barbon Junior barbon@uel.br 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa I Etapa II Inteligência de Negócios Visão

Leia mais

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Universidade Federal de Pernambuco Graduação em Ciência da Computação 2012.2 Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Proposta de Trabalho de Graduação Aluno:

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

DETERMINAÇÃO DE FATORES CRÍTICOS PARA O IDH-M A PARTIR DE TÉCNICAS DE MINERAÇÃO DE DADOS

DETERMINAÇÃO DE FATORES CRÍTICOS PARA O IDH-M A PARTIR DE TÉCNICAS DE MINERAÇÃO DE DADOS DETERMINAÇÃO DE FATORES CRÍTICOS PARA O IDH-M A PARTIR DE TÉCNICAS DE MINERAÇÃO DE DADOS Ludmila Maria Leite de Carvalho Coradine Faculdades Ibmec RJ Av. Presidente Wilson, 118 Centro Rio de Janeiro RJ

Leia mais

Data Mining II Modelos Preditivos

Data Mining II Modelos Preditivos Data Mining II Modelos Preditivos Prof. Doutor Victor Lobo Mestre André Melo Mestrado em Estatística e Gestão de Informação Objectivo desta disciplina Fazer previsões a partir de dados. Conhecer os principais

Leia mais

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação

Classificação: Definição. Classificação: conceitos básicos e árvores de decisão. Exemplos de Tarefas de Classificação Classificação: Definição Mineração de dados Classificação: conceitos básicos e árvores de decisão Apresentação adaptada do material de apoio do livro: Introduction to Data Mining Tan, Steinbach, Kumar

Leia mais

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha WCGE II Workshop de Computação Aplicada em Governo Eletrônico Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Automatização do processo de determinação do número de ciclos de treinamento de uma Rede Neural Artificial

Automatização do processo de determinação do número de ciclos de treinamento de uma Rede Neural Artificial Automatização do processo de determinação do número de ciclos de treinamento de uma Rede Neural Artificial André Ricardo Gonçalves; Maria Angélica de Oliveira Camargo Brunetto Laboratório Protem Departamento

Leia mais

IDENTIFICATION OF DISEASE PATTERNS IN DATA MINING TECHNIQUES

IDENTIFICATION OF DISEASE PATTERNS IN DATA MINING TECHNIQUES Blucher Mechanical Engineering Proceedings May 2014, vol. 1, num. 1 www.proceedings.blucher.com.br/evento/10wccm IDENTIFICATION OF DISEASE PATTERNS IN DATA MINING TECHNIQUES T. M. R. Dias 1, P. M. Dias

Leia mais

Extração Automática de Palavras-chave de Textos da Língua Portuguesa

Extração Automática de Palavras-chave de Textos da Língua Portuguesa Extração Automática de Palavras-chave de Textos da Língua Portuguesa Maria Abadia Lacerda Dias, Marcelo de Gomensoro Malheiros Centro Universitário UNIVATES Lajeado RS Brasil {mald,mgm}@univates.br Abstract.

Leia mais

Mineração de Dados na Descoberta do Padrão de Usuários de um Sistema de Educação à Distância

Mineração de Dados na Descoberta do Padrão de Usuários de um Sistema de Educação à Distância Mineração de Dados na Descoberta do Padrão de Usuários de um Sistema de Educação à Distância Janaina R Penedo, Eliane P Capra Universidade Federal do Estado do Rio de Janeiro (UNIRIO) Av. Pasteur, 296

Leia mais

Hierarquia de modelos e Aprendizagem de Máquina

Hierarquia de modelos e Aprendizagem de Máquina Hierarquia de modelos e Aprendizagem de Máquina Fabrício Jailson Barth BandTec Maio de 2015 Sumário Introdução: hierarquia de modelos e aprendizagem de máquina. O que é Aprendizagem de Máquina? Hierarquia

Leia mais

Aplicação de Data Mining para Sugestão de Investimentos na Bolsa de Valores

Aplicação de Data Mining para Sugestão de Investimentos na Bolsa de Valores Aplicação de Data Mining para Sugestão de Investimentos na Bolsa de Valores Lucas M. Braz 1, Rafael Ferreira 1, Diego Dermeval 1, Douglas Véras 1, Henrique Pacca 1 1 Instituto de Computação Universidade

Leia mais

Paralelização de Tarefas de Mineração de Dados Utilizando Workflows Científicos 1

Paralelização de Tarefas de Mineração de Dados Utilizando Workflows Científicos 1 Paralelização de Tarefas de Mineração de Dados Utilizando Workflows Científicos 1 Carlos Eduardo Barbosa, Eduardo Ogasawara, Daniel de Oliveira, Marta Mattoso PESC COPPE Universidade Federal do Rio de

Leia mais

Gerenciamento de Qualidade

Gerenciamento de Qualidade UNIVERSIDADE ESTADUAL PAULISTA INSTITUTO DE BIOCIÊNCIAS, LETRAS E CIÊNCIAS EXATAS DEPARTAMENTO DE CIÊNCIAS DE COMPUTAÇÃO E ESTATÍSTICA Gerenciamento de Qualidade Engenharia de Software 2o. Semestre de

Leia mais

WEKA-G: mineração de dados paralela em grades computacionais

WEKA-G: mineração de dados paralela em grades computacionais Revista de Sistemas de Informação da FSMA n. 4 (2009) pp. 2-9 http://www.fsma.edu.br/si/sistemas.html WEKA-G: mineração de dados paralela em grades computacionais A. Pimenta, P. Valentim, Faculdade Ruy

Leia mais

Domótica Inteligente: Automação Residencial baseada em Comportamento

Domótica Inteligente: Automação Residencial baseada em Comportamento Domótica Inteligente: Automação Residencial baseada em Comportamento Julio André Sgarbi, Flavio Tonidandel Centro Universitário da FEI UniFEI Av. Humberto de A. C. Branco, 3972 - CEP:09850-901 - São Bernardo

Leia mais

Ferramentas Livres de Armazenamento e Mineração de Dados

Ferramentas Livres de Armazenamento e Mineração de Dados Ferramentas Livres de Armazenamento e Mineração de Dados JasperBI, Pentaho, Weka 09/2009 Eng. Pablo Jorge Madril pmadril@summa.com.br Summa Technologies www.summa.com.br Eng. Pablo Jorge Madril pmadril@summa.com.br

Leia mais

Aplicação de um Metamodelo de Contexto a uma Tarefa de Investigação Policial

Aplicação de um Metamodelo de Contexto a uma Tarefa de Investigação Policial Aplicação de um Metamodelo de Contexto a uma Tarefa de Investigação Policial Lucas A. de Oliveira, Rui A. R. B. Figueira, Expedito C. Lopes Mestrado em Sistemas e Computação Universidade de Salvador (UNIFACS)

Leia mais

Predição do Valor Econômico de uma Oportunidade Exploratória de Petróleo

Predição do Valor Econômico de uma Oportunidade Exploratória de Petróleo Predição do Valor Econômico de uma Oportunidade Exploratória de Petróleo Trabalho de Mestrado Marcos A. Affonso 1 (Aluno), Leila Andrade 2 (Orientador), Kate Revoredo 3 (Coorientador) Programa de pós-graduação

Leia mais

Algoritmos Indutores de Árvores de

Algoritmos Indutores de Árvores de Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Sistemas Inteligentes Análise e Desenvolvimento de Sistemas Faculdades de Tecnologia Bandeirantes Abril de 2013 Problema: Diagnóstico para uso

Leia mais

ÁRVORE DE DECISÃO / ALGORITMO GENÉTICO PARA TRATAR O PROBLEMA DE PEQUENOS DISJUNTOS EM CLASSIFICAÇÃO DE DADOS. Deborah Ribeiro Carvalho

ÁRVORE DE DECISÃO / ALGORITMO GENÉTICO PARA TRATAR O PROBLEMA DE PEQUENOS DISJUNTOS EM CLASSIFICAÇÃO DE DADOS. Deborah Ribeiro Carvalho ÁRVORE DE DECISÃO / ALGORITMO GENÉTICO PARA TRATAR O PROBLEMA DE PEQUENOS DISJUNTOS EM CLASSIFICAÇÃO DE DADOS Deborah Ribeiro Carvalho Orientador: Nelson Francisco Favilla Ebecken Co-Orientador: Alex Alves

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

Data Warehouse Mineração de Dados

Data Warehouse Mineração de Dados Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 18/12/2014 Data Warehouse Data Mining Big Data A mina de ouro debaixo dos bits 2 Data Warehouse: A Memória da Empresa

Leia mais

Aplicação do algoritmo SimpleKMeans em experimento de milho verde

Aplicação do algoritmo SimpleKMeans em experimento de milho verde Aplicação do algoritmo SimpleKMeans em experimento de milho verde Wesley Viana 1, Prof. MSc. Marcos de Moraes Sousa 1, Prof. MSc. Júnio César de Lima 1 Prof. Dr. Milton Sérgio Dornelles 1 1 Instituto Federal

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

MINERAÇÃO DE DADOS RELACIONADOS AO APRENDIZADO DE LÍNGUA PORTUGUESA UM ESTUDO EXPLORATÓRIO

MINERAÇÃO DE DADOS RELACIONADOS AO APRENDIZADO DE LÍNGUA PORTUGUESA UM ESTUDO EXPLORATÓRIO MINERAÇÃO DE DADOS RELACIONADOS AO APRENDIZADO DE LÍNGUA PORTUGUESA UM ESTUDO EXPLORATÓRIO Anderson Amendoeira Namen aanamen@iprj.uerj.br Universidade do Estado do Rio de Janeiro, Instituto Politécnico

Leia mais

Paralelização do algoritmo SPRINT usando MyGrid

Paralelização do algoritmo SPRINT usando MyGrid Paralelização do algoritmo SPRINT usando MyGrid Juliana Carvalho, Ricardo Rebouças e Vasco Furtado Universidade de Fortaleza UNIFOR juliana@edu.unifor.br ricardo@sspds.ce.gov.br vasco@unifor.br 1. Introdução

Leia mais

Web Data mining com R: aprendizagem de máquina

Web Data mining com R: aprendizagem de máquina Web Data mining com R: aprendizagem de máquina Fabrício Jailson Barth Faculdade BandTec e VAGAS Tecnologia Junho de 2013 Sumário O que é Aprendizagem de Máquina? Hierarquia de aprendizado. Exemplos de

Leia mais

Profs. Luiz Laranjeira, Nilton Silva, e Fabrício Braz

Profs. Luiz Laranjeira, Nilton Silva, e Fabrício Braz Laboratório de Dependabilidade e Segurança Lades Profs. Luiz Laranjeira, Nilton Silva, e Fabrício Braz RENASIC/CD-CIBER CD Ciber CTC - Comitê Técnico Científico RENASIC CD Comitê Diretor ASTECA VIRTUS

Leia mais

Mestrado em Análise de Dados e Sistemas de Apoio à Decisão. Faculdade de Economia. Universidade de Porto. Extracção de Conhecimento de Dados I

Mestrado em Análise de Dados e Sistemas de Apoio à Decisão. Faculdade de Economia. Universidade de Porto. Extracção de Conhecimento de Dados I Mestrado em Análise de Dados e Sistemas de Apoio à Decisão Faculdade de Economia Universidade de Porto Extracção de Conhecimento de Dados I PROBLEMAS DE CLASSIFICAÇÃO Manuel José Ferreira Monteiro Novembro

Leia mais

Qualidade de Dados em Data Warehouse

Qualidade de Dados em Data Warehouse Qualidade de Dados em Data Warehouse Prof. Dr. Jorge Rady de Almeida Jr. Escola Politécnica da USP C/1 Relevância do Tema Principal motivação p/ manter alta QD: impactos nos lucros DW: tomada de decisões

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Aplicando Mineração de Imagens para Auxiliar na Determinação da Idade Gestacional em Recém-Nascidos

Aplicando Mineração de Imagens para Auxiliar na Determinação da Idade Gestacional em Recém-Nascidos Aplicando Mineração de Imagens para Auxiliar na Determinação da Idade Gestacional em Recém-Nascidos Anderson V. Araújo 1, Olga R. P. Bellon 1, Luciano Silva 1, Everton V. Vieira 1, Mônica Cat 2 Grupo Imago

Leia mais

PREPARAÇÃO DE DADOS PARA A MODELAGEM DE OCORRÊNCIAS DA FERRUGEM ASIÁTICA DA SOJA

PREPARAÇÃO DE DADOS PARA A MODELAGEM DE OCORRÊNCIAS DA FERRUGEM ASIÁTICA DA SOJA PREPARAÇÃO DE DADOS PARA A MODELAGEM DE OCORRÊNCIAS DA FERRUGEM ASIÁTICA DA SOJA GUILHERME AUGUSTO SILVA MEGETO 1 CARLOS ALBERTO ALVES MEIRA 2 STANLEY ROBSON DE MEDEIROS OLIVEIRA 3 SILVIA MARIA FONSECA

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

ANÁLISE DE LOGS DA WEB POR MEIO DE TÉCNICAS DE DATA MINING

ANÁLISE DE LOGS DA WEB POR MEIO DE TÉCNICAS DE DATA MINING ANÁLISE DE LOGS DA WEB POR MEIO DE TÉCNICAS DE DATA MINING Mabel Pereira da Silva UNIOESTE Universidade Estadual do Oeste do Paraná Rua Universitária, 2069 Bairro Faculdade Cascavel PR CEP: 85819-110 Fone:

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Descoberta de Conhecimento em uma Base de Dados de Bilhetes de Tarifação: Estudo de Caso em Telefonia Celular

Descoberta de Conhecimento em uma Base de Dados de Bilhetes de Tarifação: Estudo de Caso em Telefonia Celular Descoberta de Conhecimento em uma Base de Dados de Bilhetes de Tarifação: Estudo de Caso em Telefonia Celular Elionai Sobrinho 1,3, Jasmine Araújo 1,3, Luiz A. Guedes 2, Renato Francês 1 1 Departamento

Leia mais

Descoberta de Conhecimento em Bases de Dados. Classificação

Descoberta de Conhecimento em Bases de Dados. Classificação Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Classificação Descoberta

Leia mais

Classificação de Dados Através de Árvores de Perceptrons Geradas por Evolução Diferencial

Classificação de Dados Através de Árvores de Perceptrons Geradas por Evolução Diferencial Classificação de Dados Através de Árvores de Perceptrons Geradas por Evolução Diferencial Alan R. R. Freitas 1, Rodolfo A. Lopes 1, Rodrigo C. P. Silva 1, Frederico G. Guimarães 2 1 Programa de Pós-Graduação

Leia mais

Mineração de Dados - Conceitos, Aplicações e Experimentos com Weka

Mineração de Dados - Conceitos, Aplicações e Experimentos com Weka Mineração de Dados - Conceitos, Aplicações e Experimentos com Weka Marcelino Pereira dos Santos Silva 1,2 1 Universidade do Estado do Rio Grande do Norte (UERN) BR 110, Km 48, 59610-090, Mossoró, RN, Brasil

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

1. Introdução 2. Séries Temporais

1. Introdução 2. Séries Temporais 1. Introdução Predição de valores de ações é uma tarefa desafiadora na área de predição de séries temporais financeiras, devido à grande quantidade de variáveis que envolvem essas predições. No passado,

Leia mais