Benefícios da mineração de dados no auxílio ao diagnóstico de doenças

Tamanho: px
Começar a partir da página:

Download "Benefícios da mineração de dados no auxílio ao diagnóstico de doenças"

Transcrição

1 Benefícios da mineração de dados no auxílio ao diagnóstico de doenças Clayr Madeira de Albuquerque Silva 1, Claudia Galindo Novoa Barsottini 2 1. Bacharel em Sistemas de Informações. Empresa Brasileira de Serviços Hospitalares EBSERH, Brasília (DF), Brasil. 2. Professor Doutor. Universidade Aberta do Brasil, Universidade Federal de São Paulo UNIFESP, São Paulo (SP), Brasil. Resumo Objetivo: Discutir sobre a mineração de dados como uma alternativa eficaz no auxílio ao diagnóstico de doenças, por meio de artigos com experiências relatadas em estudos científicos. Método: Revisão bibliográfica da literatura, por meio de estudo explicativo e revisão narrativa com artigos extraídos nas bases de dados BVS e PubMed, com data de publicação entre Resultados: A mineração de dados em saúde está em visível ascensão em diversos países, com estudos voltados para complemento de diagnóstico e pré-triagem. Assim, foram selecionados seis artigos internacionais que apresentam utilização de tais técnicas para ilustrar a importância desse estudo. Conclusão: Mineração de dados em saúde é um método computacional de baixo custo, capaz de fornecer subsídios suficientes para auxiliar o profissional de saúde no pré-diagnóstico reduzindo exames considerados caros ou invasivos, além de proporcionar tratamento antecipado ao paciente e, inclusive, aumentar as chances de cura. Descritores: Mineração de dados, data mining, diagnóstico por computador. Introdução O mundo vive o momento da era da informação segundo Fayyad (1), caracterizada por uma expansão de dados gerados e armazenados, causando uma sobrecarga de dados. Com a redução do preço dos hardwares e a popularização dos programas de computadores, as organizações conseguem armazenar um número cada vez mais dados (2). Estimasse que grandes centros radiológicos produzem anualmente cerca de 2 terabytes de dados de imagem (Oliveira et al. (3), 2007). O que não necessariamente significa conhecimento. Afinal, deter um grande número de dados, não obrigatoriamente, traduz em conhecimento.

2 Ainda segundo Fayyad (1), o modelo tradicional de transformação de dados em conhecimento, consiste em um processamento manual de todas essas informações, produzindo relatórios que ainda serão analisados por um especialista. O que, em grande parte das situações, torna-se impraticável devido ao grande volume de dados (2). Situações como esta motivou especialistas no final da década de 80 à descoberta de conhecimento em base de dados, denominada KDD (Knowledge Discovery in Database). Fayyad, conceitua KDD como um processo, de várias etapas, não trivial, interativo e iterativo, para identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes conjuntos de dados. Figura 1 Representação do processo de KDD, (Adaptado de Fayyad et al., 1996). A mineração de dados (data mining) surgiu como uma solução para extrair informações previamente desconhecidas através de busca de padrões, com aplicação de algoritmos específicos que melhor se adequam ao problema proposto. Colocando a mineração de dados como uma etapa do processo de descoberta de conhecimento em banco de dados (1), onde sua execução está relacionada ao que se deseja encontrar nos dados, podendo ser regularidades, associações, similaridades, entre outros. As tarefas podem ser dividas em preditivas e descritivas, respectivamente métodos supervisionados e não-supervisionado (4). Durante o processo de mineração de dados, diversas métodos podem ser testados e combinados, com o objetivo de realizar o maior número de comparações e então, a utilização da melhor técnica (ou combinação de técnicas) (2).

3 Processos diversos definem e padronizam as fases e atividades da mineração de dados, salvo algumas particularidades, todos em geral contém a mesma estrutura (2). O modelo a ser considerado padrão de maior aceitação é o CRISP-DM (Cross- Industry Standard Processo of Data Mining), atualmente na versão 2.0 (5). Figura 2 Representação do processo CRISP-DM, (Adaptado de Larose (6), 2005). A técnica de mineração de dados pode ser aplicada com êxito em diversas áreas, destacando decisões que envolvem o julgamento, a triagem de imagem, a previsão de carga, a predição de diagnósticos e outras tarefas de previsão (7). Ao identificar padrões ocultos em um banco de dados por meio da mineração, é possível obter informação que permite uma nova perspectiva sobre certas doenças, possibilitando a realização de pesquisas em diversas áreas da medicina, contribuindo com novas descobertas e melhorando os resultados obtidos com outras metodologias (8). Além disso, possibilita o aumento da eficácia do diagnostico, proporcionando, inclusive, a descoberta antecipada de determinadas doenças. Ferreira D, Oliveira A, Freitas A (8), em sua pesquisa, explica que em comparação com os estudos identificados na literatura, é esperado que técnicas de mineração de dados poderia induzir previsões com maior precisão do que métodos tradicionais conhecidos.

4 Ante o exposto, este trabalho se propõe, pesquisar e discutir sobre a utilização da mineração de dados na saúde como um aliado no diagnóstico de doenças, sendo uma alternativa eficaz, não invasiva e que possibilita a redução dos custos de exames médicos. A pesquisa se baseia em relatos sobre experiências de aplicação da mineração de dados na saúde focada para o diagnóstico, buscando demostrar as possibilidades de sua utilização. O trabalho não se aprofundará em algoritmos utilizados, tendo em vista a sua complexidade e extensão. Método A metodologia adotada na elaboração do projeto será de revisão bibliográfica da literatura, por meio de estudo explicativo e revisão narrativa. Após a busca com os descritores nas bases de dados bibliográficas, foram aplicados filtros com a finalidade de refinar a busca e priorizar os resultados que houveram o uso da técnica de mineração de dados, sendo: 1. Assunto principal: mineração de dados; 2. Disponibilidade do texto completo; 3. Documentos do tipo artigo; 4. Período de publicação do artigo entre 2012 e 2016; Artigos que não disponibilizaram versão completa de leitura foram excluídos do resultado e artigos que não apresentaram claramente a forma de utilização do data mining. As bases de dados bibliográficas utilizadas para busca foram BVS e PubMed, onde teve os seguintes descritores: Mineração de dados, data mining e diagnóstico de doenças. Foram usados sinônimos e traduzido para outros idiomas para ampliar os resultados. Os descritores com os operadores lógicos ficaram da seguinte maneira: (("mineração de dados") OR ("data mining")) AND (diagno*) AND ((doenç*) OR (patologia) OR (enfermedad*) OR (diseases) OR (illness) OR (pathology)) Resultados De acordo com a metodologia adotada e os critérios de busca dos artigos, foram selecionados seis artigos para embasar a revisão bibliográfica. Na seleção,

5 priorizou-se a data de publicação, sua contribuição prática para saúde e técnica utilizada para mineração de dados. Foram utilizadas buscas de mais de uma forma de utilização de mineração de dados em favorecimento ao diagnóstico médico, o que possibilitou uma melhor ilustração sobre o tema proposto, motivando o leitor para uma abordagem mais detalhada no futuro. Tabela 1 Artigos selecionados nas bases de dados BVS e PubMed, sobre data mining como auxilio a diagnostico de doenças. Título do Artigo/Referência Applying data mining techniques to improve diagnosis in neonatal jaundice (8) A data mining approach for diagnosis of coronary artery disease (9) Mining Disease Risk Patterns from Nationwide Clinical Databases for the Assessment of Early Rheumatoid Arthritis Risk (10) Applying under-sampling techniques and costsensitive learning methods on risk assessment of breast cancer (11) Novel data-mining approach identifies biomarkers for diagnosis of Kawasaki disease (12) Objetivo Melhorar o diagnóstico da icterícia neonatal com a aplicação de técnicas de mineração de dados. Mineração de dados para alcançar métodos com alta precisão, menos efeitos colaterais e baixo custo para diagnóstico de doença arterial coronariana. Um quadro novo para a avaliação artrite reumatóide inicial que utiliza o pré-processamento de dados, e mineração de padrões de risco, validação e análise. Propor um modelo computacional, que é baseada apenas na informação pessoal de saúde, para avaliação do risco de câncer de mama. Procurou-se elaborar um painel de biomarcadores que podem distinguir entre os pacientes com doença de Kawasaki e outas doenças febris com precisão suficiente para ser clinicamente útil. Resultados Com a mineração de dados a precisão para a predição de hiperbilirrubinemia foi de 89%, a 24 horas de vida do recémnascido. Usando métodos de mineração de dados e o algoritmo de criação de recurso, 94,08% de precisão é alcançado, que é maior do que as abordagens conhecidas na literatura. O quadro proposto é amplamente aplicável para a mineração de padrões de risco para as principais avaliações da doença. Isso permite a identificação de padrões de risco precoces que estão significativamente associados com uma doença alvo. Modelo tem o potencial para ser servido como uma ferramenta auxiliar no diagnóstico do câncer da mama. Após a validação prospectivo, este painel de 8 biomarcador pode melhorar o reconhecimento da doença de Kawasaki. Multimedia data mining for Seu objetivo é reduzir a carga Capaz de detectar automaticamente

6 automatic diabetic retinopathy screening (13) sobre os oftalmologistas, detectando automaticamente os registros de exame não atribuíveis relacionados com a retinopatia diabética ou qualquer outra patologia da retina. 68% dos registros de exame não atribuíveis ao conseguir a mesma sensibilidade que um segundo oftalmologista. Isto sugere que poderia reduzir com segurança a carga sobre oftalmologistas em 56%. Discussão Atualmente, muitas técnicas de mineração de dados são utilizadas na previsão de doenças e para tratar problemas relacionados. Isso se deve ao aumento recente de registros médicos eletrônicos, entre outros fatores. É esperado que, com a utilização no diagnóstico, os custos e os encargos de saúde pública diminuam consideravelmente, melhorando a precisão do diagnóstico, prevenção, tratamento e qualidade do atendimento (10). Diagnóstico precoce, segunda opinião técnica, redução de exames invasivos e redução de custos médicos são objetivos de diversos estudos envolvendo mineração de dados e saúde. Consequentemente, é possível proporcionar tratamento antecipado ao paciente, reduzindo danos causados pela doença e aumentando as chances de cura (10). Um dos processos da mineração é a aplicação de algoritmos de analises de dados. Dentre os diversos algoritmos que podem ser utilizados neste processo, destaca-se, por sua aplicabilidade, as regras de associação (14). A premissa básica desta regra é identificar quais atributos estão relacionados. Apresentam a forma: SE atributo X ENTÃO atributo Y. É uma tarefa bastante conhecida devido aos resultados positivos obtidos (2). No diagnóstico de doenças, essa regra pode ser utilizada para buscar sintomas/doenças que juntas, podem caracterizar a doença em estudo. Se um paciente tem vários sintomas (atributos), como febre alta, dor de cabeça, dor atrás dos olhos, perda de apetite, vômitos e tonturas, ele tem uma forte chance de ter dengue. Em um estudo com objetivo de facilitar a detecção precoce da artrite reumatoide precoce, realizado por Chin CY, et al. 2015, usou método de classificação por regras de associação com o algoritmo CMAR (Classification based on Multiple Association Rules) para identificar regras de sintomas/doenças com uma elevada correlação com artrite reumatoide. Estas regras são então integradas para

7 avaliar o risco da referida doença no paciente antes de fazer um diagnóstico definitivo, com eficácia média de 80,3%. Chin CY, et al. 2015, conseguiu ir além do apoio ao diagnóstico. Com as técnicas de mineração de dados identificaram os padrões de risco relacionados a artrite reumatoide do tipo II, que raramente ou nunca foram relatados na literatura. Esses padrões recém descobertos são muito valiosos no apoio a novas hipóteses em ensaios clínicos (10). Floresta aleatória (random forest) é uma técnica de classificação e regressão desenvolvida por Breiman (15), que consiste num conjunto de árvores de decisão combinadas para solucionar problemas de classificação (16). Cada uma dessas árvores de decisão dá um voto que indica sua decisão sobre a classe à qual pertencerá um determinado objeto. O objeto então pertencerá à classe que obtiver o maior número de votos (14). Tremoulet (12), usou dessa técnica de mineração para conseguir um diagnóstico precoce da doença de Kawasaki, de forma a diferenciar de outras doenças febris, utilizando biomarcadores (contagem absoluta de neutrófilos, taxa de sedimentação de eritrócitos, contagem de plaquetas e outros) com precisão de 81 a 96%. Tremoulet AH, et al. 2015, buscou classificar as doenças febris para encontrar a maior quantidade de biomarcadores que identifica a doença de Kawasaki. Diferentemente de Chin CY, et al. 2015, que buscava padrões associados a artrite reumatoide e por isso o uso de algoritmos diferentes. De acordo com a estratégia de cada estudo, são necessários um ou mais algoritmos distintos, e por muitas vezes é preciso testar e analisar os resultados para poder chegar no melhor resultado e probabilidade (9) (11). Alizadehsani R, et al. 2013, conseguiu melhorar o diagnóstico de doença arterial coronariana usando mineração de dados, de 92,59% de eficácia no estudo de Polat e Gunes (17) para 94,08% de precisão no seu estudo atual, que é maior do que as abordagens conhecidas na literatura (9). Para chegar nesse feito, Alizadehsani R, et al. 2013, colocou seu conjunto de dados de estudo para serem classificados por diversas técnicas como Naive Bayes, rede neural e técnicas de aprendizado de máquina, como máquinas de vetores de suporte (SVM, do inglês Support Vector Machines) para obter o melhor resultado. Para resolver eficazmente o problema de otimização que surge durante o treinamento de SVMs, usou o algoritmo Sequential Minimal Optimization (SMO). O algoritmo SMO é reconhecido

8 como um dos mais rápidos e o mais fácil para implementar em software para o caso geral de SVM (18). Diagnosticar doenças usando mineração de dados não se limita a dados textuais de resultados de laboratoriais ou biomarcadores. Estudos de predição focado no diagnóstico precoce do câncer de mama usa um questionário que o próprio paciente pode se propor a responder, sem auxilio clínico (11). Algoritmos de mineração de imagens tem auxiliado na análise diagnostico de exames de imagem e podem contribuir para o futuro da telemedicina (13). Várias características da imagem capturada precisam ser consideradas, como qualidade, tamanho ou as condições de iluminação que mudam muito de um exame para outro (13). Em alguns exames de imagem são necessárias informações contextuais, como idade do paciente, gravidez, histórico de diabetes, etc. Além disso, como etapa de pré-processamento, é preciso detectar estruturas que podem ser erroneamente consideradas como: disco óptico, neblinas na fronteira do campo de visão e artefatos brilhantes causados por lentes de câmeras. Esses são alguns dos grandes desafios de mineração de dados em imagem (13). Quellec G, et al propõe uma estratégia para aliviar a carga sobre oftalmologistas no diagnóstico de retinopatia diabética, para promover o desenvolvimento de redes de teleoftalmologia, através de detecção de casos saudáveis. Ele se baseia em metodologias de processamento de imagem e de mineração de dados da retina, classificando como não atribuível ou para ser encaminhado a um especialista (13). Imagens são dividas e então um vetor com as características da imagem é extraído de cada divisão. Um algoritmo de aprendizado de máquina pode ser projetado para reconhecer os vetores que contém um reconhecimento patológico. Depois desse reconhecimento, existe uma classificação e fusão entre os dados contextuais do paciente. Nesse momento, Quellec G, et al. 2013, usou o algoritmo Apriori para mineração de regras de associação, onde pode informar se o paciente analisado deve ou não procurar um oftalmologista, implicando na redução de forma segura de 55,8% o número de pacientes que devem ser vistos por um leitor humano. Conclusões Em diferentes áreas da medicina, a mineração de dados tem provado acrescentar um enorme valor ao contribuir com novas descobertas e melhorar os

9 resultados obtidos com outras metodologias tradicionais, que muitas vezes consomem grande quantidade de recursos e possui efeitos colaterais indesejados. Com base nos artigos que foram descritos nesta pesquisa, podemos concluir que diferentes técnicas de mineração de dados podem ser utilizadas no auxílio ao diagnóstico de doenças. Independente do conjunto de dados de estudo, sendo textual ou imagem, é possível identificar padrões ocultos e relacionamentos dentro dos dados, possibilitando sua classificação e previsão. Um ou mais algoritmos podem ser utilizados na mineração de dados na saúde. Regras de associação e arvore de decisão são comumente aplicados em diagnósticos de doenças por sua facilidade de uso em softwares e alto índice de sucesso conhecido. Com a utilização de técnicas de extração da informação no diagnóstico precoce ou pré-triagem, sendo presencial ou na forma de telessaúde, é esperado uma redução considerável nos custos da saúde pública e ainda melhorar a precisão do diagnóstico, prevenção, tratamento e qualidade do atendimento. Referências 1. Fayyad, U; Piatetsky-Shapiro, G; Smyth, P. From Data Mining to Knowledge Discovery in Databases. American Association for Artificial Intelligence, Acessado em Out Camilo, C O, Silva J C. Mineração de Dados: Conceitos, Tarefas, Métodos e Ferramentas [dissertação]. Goiás: Universidade Federal de Goiás. Instituto de Informática; Acessado em Out Disponível em: INF_ pdf. 3. Oliveira Marcelo Costa, Azevedo-Marques Paulo Mazzoncini de, Cirne Filho Walfredo da Costa. Grades computacionais na recuperação de imagens médicas baseada em conteúdo. Radiol Bras Aug; 40(4): Acessado em Out Disponível em: 4. Faceli, K. et al. Inteligência artificial: uma abordagem de aprendizado de máquina. 1. ed. Rio de Janeiro: LTC, p. 5. Chapman, P; Clinton, J; Kerber, R; Khabaza, T; Reinartz, T; Shearer, C; Wirth, R. CRISP-DM 1.0. CRISP-DM consortium, 2000.

10 6. Larose, D. T. Discovering Knowledge in Data: An Introduction to Data Mining. John Wiley and Sons, Inc, Chimieski, Bruno Fernandes. Solução de auxílio ao diagnóstico e à pesquisa médica baseada em mineração de dados utilizando interface android [dissertação e tese]. Porto Alegre - Rio Grande do Sul: Pontifícia Universidade Católica do Rio Grande do Sul. Faculdade de Engenharia, Programa de Pós-Graduação em Engenharia Elétrica; Acessado em Out Disponível em: 8. Ferreira D, Oliveira A, Freitas A. Applying data mining techniques to improve diagnosis in neonatal jaundice. BMC Med Inform Decis Mak Dez 7;12:143. Acessado em Set DOI: / PubMed PMID: Alizadehsani R, Habibi J, Hosseini MJ, Mashayekhi H, Boghrati R, Ghandeharioun A, et al. A data mining approach for diagnosis of coronary artery disease. Comput Methods Programs Biomed Jul;111(1): Acessado em Set DOI: /j.cmpb PubMed PMID: Chin CY, Weng MY, Lin TC, Cheng SY, Yang YH, Tseng VS. Mining disease risk patterns from nationwide clinical databases for the assessment of early rheumatoid arthritis risk. PLoS One Abril 13;10(4):e Acessado em Set DOI: /journal.pone PubMed PMID: Hsu JL, Hung PC, Lin HY, Hsieh CH. Applying under-sampling techniques and cost-sensitive learning methods on risk assessment of breast cancer. J Med Syst Abril;39(4):210. Acessado em Set DOI: /s x. PubMed PMID: Tremoulet AH, Dutkowski J, Sato Y, Kanegaye JT, Ling XB, Burns JC. Novel data-mining approach identifies biomarkers for diagnosis of Kawasaki disease. Pediatr Res Nov;78(5): Acessado em Set DOI: /pr PubMed PMID: Quellec G, Lamard M, Cochener B, Decencière E, Lay B, Chabouis A, et al. Multimedia data mining for automatic diabetic retinopathy screening. Conf Proc IEEE Eng Med Biol Soc. 2013;2013: Acessado em Out DOI: /EMBC PubMed PMID: Rodrigues, Fabrício Alves; Amaral, Laurence Rodrigues do. Aplicação de métodos computacionais de mineração de dados na classificacão e seleção de oncogenes medidos por microarray. Rev. bras. cancerol;58(2): , abr.-jun tab. Acessado em Out ID: lil Boente, Alfredo Nazareno Pereira; Goldschmidt, Ronaldo R; Estrela, Vania Vieira. Uma Metodologia de Suporte ao Processo de Descoberta de Conhecimento em Bases de Dados. In: V Simpósio de Excelência em Gestão e Tecnologia, 2008, Resende-RJ. V SEGeT, v. 1. p. 4-5.

11 16. Vieira, Fábio D., Oliveira, Stanley R. de M., & Paiva, Samuel R.. (2015). Metodologia baseada em técnicas de mineração de dados para suporte à certificação de raças de ovinos. Engenharia Agrícola, 35(6), L. Machine Learning (2001) 45: 5. Acessado em Out DOI: /A: Platt, J. C. Fast training of support vector machines using sequential minimal optimization. In: SCHÖLKOPF, B.; BURGES, C. J. C.; SMOLA, A. J. Advances in kernel methods: support vector learning. 1st. ed. Cambridge, MA, USA: MIT Press, Chap. 2, pp

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Descoberta de conhecimento em redes sociais e bases de dados públicas

Descoberta de conhecimento em redes sociais e bases de dados públicas Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:

Leia mais

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC Uma Solução para o GISSA: Análise Comparativa entre Algoritmos de Aprendizagem de Máquina Aplicados em um Dataset Relacionado ao Óbito Infantil Joyce Quintino Alves (1) ; Cristiano Lima da Silva (2); Antônio

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

Mineração de Dados. Curso de Especialização em Sistemas de Banco de Dados. Centro de Ciências Exatas e Naturais. Universidade Federal do Pará

Mineração de Dados. Curso de Especialização em Sistemas de Banco de Dados. Centro de Ciências Exatas e Naturais. Universidade Federal do Pará Universidade Federal do Pará Centro de Ciências Exatas e Naturais Departamento de Informática Mineração de Dados Profa. MSc. Miriam Lúcia Domingues Curso de Especialização em Sistemas de Banco de Dados

Leia mais

SBC - Sistemas Baseados em Conhecimento

SBC - Sistemas Baseados em Conhecimento Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS 6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Leia mais

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados 2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas

Leia mais

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos

Leia mais

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios

Leia mais

DATA MINING. Prof. Fulvio Cristofoli. Mineração De Dados.

DATA MINING. Prof. Fulvio Cristofoli. Mineração De Dados. DATA MINING Mineração De Dados fulviocristofoli@uol.com.br www.fulviocristofoli.com.br Conceito As organizações perseguem inteligência. Nessa perseguição, elas processam informação, formulam planos e aspirações,

Leia mais

Oi, Ficou curioso? Então conheça nosso universo.

Oi, Ficou curioso? Então conheça nosso universo. Oi, Somos do curso de Sistemas de Informação da Universidade Franciscana, e esse ebook é um produto exclusivo criado pra você. Nele, você pode ter um gostinho de como é uma das primeiras aulas do seu futuro

Leia mais

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a 1 Introdução 1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a partir de dados. Existem diversas aplicações

Leia mais

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com Coleta de dados em vários

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO 5ª Jornada Científica e Tecnológica e 2º Simpósio de Pós-Graduação do IFSULDEMINAS 06 a 09 de novembro de 2013, Inconfidentes/MG MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO

Leia mais

Mineração de Dados. Eduardo Raul Hruschka. Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio

Mineração de Dados. Eduardo Raul Hruschka. Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio Mineração de Dados Eduardo Raul Hruschka Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio http://www.kdnuggets.com Visão Geral: Introdução: motivação, aplicações, conceitos básicos. Agrupamento

Leia mais

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/20) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Referências

Leia mais

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com

Leia mais

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI

Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Processo de Descoberta de Conhecimento aplicado ao SIGAA UFPI Francisco N. C. de Araújo 1, Vinicius P. Machado 1 1 Departamento de Ciência da Computação Universidade Federal do Piauí (UFPI) Teresina, PI

Leia mais

Data Mining. O Processo de KDD. Mauricio Reis

Data Mining. O Processo de KDD. Mauricio Reis 1 Data Mining O Processo de KDD Mauricio Reis prof_uva@mreis.info http://mreis.info/uva-2016-9-datamining 2 ROTEIRO 1. Definição 2. Aplicação KDD problema recursos resultados 3. Área de origem 4. Histórico

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

ANALYTICS: Dados e Atenção

ANALYTICS: Dados e Atenção ANALYTICS: Dados e Atenção O CONCEITO DE ANALYTICS NA INTERNET DAS COISAS BASEIA-SE NA CONSTANTE GERAÇÃO DE DADOS Por Nazareno Andrade Deyvison Bruno, Icaro Ramires, Joabe Pinheiro 1 Agenda Informações

Leia mais

Mineração de Textos na Web

Mineração de Textos na Web Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na

Leia mais

Classificação Automática de Gêneros Musicais

Classificação Automática de Gêneros Musicais Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução 19 Congresso de Iniciação Científica IMPLEMENTAÇÃO DE GUIAS E ALGORITMOS PARA REGRAS DE ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) HARLEI MIGUEL DE ARRUDA LEITE Orientador(es)

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Descoberta de Conhecimento em Bases de Dados Mineração de Dados Descobertas de regras de associação Descoberta de Conhecimento em Bases de Dados DCBD (Descoberta de Conhecimento

Leia mais

18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) JONAS RAFAEL ONOFRE Orientador(es) MARINA TERESA PIRES VIEIRA

Leia mais

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR

10 FORMAS ESTATÍSTICA MODELAGEM PARA USAR 10 FORMAS PARA USAR MODELAGEM ESTATÍSTICA Introdução Conheça um pouco mais sobre algumas modelagens estatísticas e como você pode implantar dentro da sua organização A análise preditiva é capaz de descobrir

Leia mais

Agenda. Conceitos Iniciais. Modelos de aprendizado. Oportunidades e casos de uso. Ferramentas. Desafios

Agenda. Conceitos Iniciais. Modelos de aprendizado. Oportunidades e casos de uso. Ferramentas. Desafios Machine Learning Agenda Conceitos Iniciais Modelos de aprendizado Oportunidades e casos de uso Ferramentas Desafios Ronald Bertele Bacharelado em Ciências da Computação - UCS MBA em Gestão de Negócios

Leia mais

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS 7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução

Leia mais

PEP: Prontuário Eletrônico do Paciente Aula Final

PEP: Prontuário Eletrônico do Paciente Aula Final PEP: Prontuário Eletrônico do Paciente Aula Final Revisando... O Prontuário Eletrônico é... um repositório onde todas as informações de saúde, clínicas e administrativas, ao longo da vida de um indivíduo

Leia mais

CAPÍTULO 7 CONCLUSÕES E RECOMENDAÇÕES

CAPÍTULO 7 CONCLUSÕES E RECOMENDAÇÕES 103 CAPÍTULO 7 CONCLUSÕES E RECOMENDAÇÕES "A verdadeira dificuldade não está em aceitar idéias novas, mas em escapar das antigas. John Maynard Keynes A pesquisa orientada à visualização cartográfica visa

Leia mais

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA 19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ

Leia mais

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR

Aprendizagem de Máquina. Prof. Júlio Cesar Nievola PPGIA - PUCPR Aprendizagem de Máquina Prof. Júlio Cesar Nievola PPGIA - PUCPR Introdução Justificativa Recente progresso em algoritmos e teoria Disponibilidade crescente de dados online Poder computacional disponível

Leia mais

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada

Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Classificação de Padrões por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Aline Dartora Prof. David Menotti Departamento de Informática Universidade Federal do Paraná (UFPR) 23 de outubro

Leia mais

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos

Leia mais

Métodos de Análise de Dados (AO-802)

Métodos de Análise de Dados (AO-802) Métodos de Análise de Dados (AO-802) DADOS INFORMAÇÃO CONHECIMENTO Rodrigo A. Scarpel rodrigo@ita.br www.ief.ita.br/~rodrigo INTELIGÊNCIA Introdução: Revolução dos Serviços (final anos 80) Dilúvio de dados

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2

Leia mais

Introdução Trabalhos Relacionados Metodologia Resultados Considerações Finais. Aluna: Aline Dartora Orientador: Prof. Dr. Lucas Ferrari de Oliveira

Introdução Trabalhos Relacionados Metodologia Resultados Considerações Finais. Aluna: Aline Dartora Orientador: Prof. Dr. Lucas Ferrari de Oliveira Análise de Extratores de Características para a Classificação de Tecidos Pulmonares e Não-Pulmonares em Imagens de Tomografia Computadorizada de Alta Resolução Aluna: Aline Dartora Orientador: Prof. Dr.

Leia mais

IMAGE MINING: CONCEITOS E TÉCNICAS

IMAGE MINING: CONCEITOS E TÉCNICAS 125 IMAGE MINING: CONCEITOS E TÉCNICAS Diogo Floriano diiogofloriano@gmail.com Resumo A facilidade em armazenar imagens e a grande concentração de imagens em bases de dados impulsionou a geração de aplicações

Leia mais

Metodologia de Desenvolvimento de Sistemas Informação

Metodologia de Desenvolvimento de Sistemas Informação Instituto Superior Politécnico de Ciências e Tecnologia Metodologia de Desenvolvimento de Sistemas Informação Prof Pedro Vunge http://pedrovunge.com I Semestre de 2019 Capítulo 2 TECNOLOGIAS PARA DATA

Leia mais

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Luciana Kayo e Paulo Mei Prof. Dr. Marco Dimas Gubitoso Introdução Inspiração na competição When Bag of Words

Leia mais

Metodologia CRISP-DM. NeuroTech Ltda.

Metodologia CRISP-DM. NeuroTech Ltda. Metodologia CRISP-DM NeuroTech Ltda. www.neurotech.com.br Conteúdo Metodologias para Mineração de Dados A metodologia CRISP-DM Exemplo de um Projeto de Mineração de Dados Exercício Prático Gerência de

Leia mais

A Implantação do Prontuário Eletrônico do Paciente em Unidades do SUS

A Implantação do Prontuário Eletrônico do Paciente em Unidades do SUS 1 A Implantação do Prontuário Eletrônico do Paciente em Unidades do SUS Carlos Alberto dos Reis Júnior 1, Denise Caluta Abranches 2 1. Graduado em Gestão de Ambientes Internet, Universidade Estácio de

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem (Redes Neurais - Complementar) Prof. a Joseana Macêdo

Leia mais

Mineração de dados para a análise e o alerta da ferrugem asiática da soja

Mineração de dados para a análise e o alerta da ferrugem asiática da soja Mineração de dados para a análise e o alerta da ferrugem asiática da soja Guilherme Augusto Silva Megeto 1 Carlos Alberto Alves Meira 2 Stanley Robson de Medeiros Oliveira 2 A ferrugem asiática da soja,

Leia mais

Máquinas de suporte vetorial e sua aplicação na detecção de spam

Máquinas de suporte vetorial e sua aplicação na detecção de spam e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Utilização de Inteligência Artificial em Sistemas de Apoio à Decisão no Diagnóstico Médico

Utilização de Inteligência Artificial em Sistemas de Apoio à Decisão no Diagnóstico Médico Utilização de Inteligência Artificial em Sistemas de Apoio à Decisão no Diagnóstico Médico Renato Alexandre Cintra 1, Henrique Tomaz do Amaral Silva 2 1. Bacharel em Ciência da Computação. Faculdades Metropolitanas

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular Principais tópicos André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Métodos baseados em distância Aprendizado baseado em instâncias Conceitos básicos KNN

Leia mais

POLVO-IIDS: Um Sistema de Detecção de Intrusão Inteligente Baseado em Anomalias p. 1/16

POLVO-IIDS: Um Sistema de Detecção de Intrusão Inteligente Baseado em Anomalias p. 1/16 POLVO-IIDS: Um Sistema de Detecção de Intrusão Inteligente Baseado em Anomalias p. 1/16 POLVO-IIDS: Um Sistema de Detecção de Intrusão Inteligente Baseado em Anomalias Paulo Manoel Mafra 1, Joni da Silva

Leia mais

Classificação de Padrões Radiológicos por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada

Classificação de Padrões Radiológicos por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Visão Robótica Imagem Classificação de Padrões Radiológicos por Blocos em Imagens Não Segmentadas de Tomografia Computadorizada Aluna: Luiza Dri Bagesteiro Orientador: Prof. Dr. Daniel Weingaertner Co-orientador:

Leia mais

Mineração de Dados Aplicada no Contexto Educacional

Mineração de Dados Aplicada no Contexto Educacional Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento

Leia mais

USO DE TÉCNICAS DE SEGMENTAÇÃO NA ANÁLISE DE IMAGENS DE TOMOGRAFIA COMPUTADORIZADA DE PULMÕES COM DPOC

USO DE TÉCNICAS DE SEGMENTAÇÃO NA ANÁLISE DE IMAGENS DE TOMOGRAFIA COMPUTADORIZADA DE PULMÕES COM DPOC USO DE TÉCNICAS DE SEGMENTAÇÃO NA ANÁLISE DE IMAGENS DE TOMOGRAFIA COMPUTADORIZADA DE PULMÕES COM DPOC 1 2 3 Fausta Joaquim Faustino, Álisson Gomes Linhares, John Hebert Da Silva Felix Resumo: O uso das

Leia mais

TESTES DE SOFTWARE 1. Fundamentos sobre testes de software

TESTES DE SOFTWARE 1. Fundamentos sobre testes de software ENG SOFT - TESTES TESTES DE SOFTWARE 1. Fundamentos sobre testes de software A atividade de teste de software sempre foi considerada como um gasto de tempo desnecessário, uma atividade de segunda classe,

Leia mais

Ambiente de Data Warehouse Para Imagens Médicas Baseado Em Similaridade

Ambiente de Data Warehouse Para Imagens Médicas Baseado Em Similaridade Universidade de São Paulo - USP Instituto de Ciências Matemáticas e de Computação - ICMC Programa de Pós-Graduação em Ciências da Computação e Matemática Computacional Ambiente de Data Warehouse Para Imagens

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

PEP: Prontuário Eletrônico do Paciente

PEP: Prontuário Eletrônico do Paciente PEP: Prontuário Eletrônico do Paciente Revisando... O Prontuário Eletrônico é... um repositório onde todas as informações de saúde, clínicas e administrativas, ao longo da vida de um indivíduo estão armazenadas,

Leia mais

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008 21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é

Leia mais

Conclusões e Trabalhos Futuros

Conclusões e Trabalhos Futuros 79 8 Conclusões e Trabalhos Futuros O presente trabalho teve o propósito de desenvolver um algoritmo para segmentação e quantificação de tecidos internos em imagens de úlceras de perna. O trabalho fará

Leia mais

Existem diversas formas de tratar dados e este conjunto de formas chama-se Data

Existem diversas formas de tratar dados e este conjunto de formas chama-se Data INSTITUCIONAL/IFSP PROJETO DE PESQUISA TÍTULO DO PROJETO: Text Mining na classificação de notícias Área do Conhecimento (Tabela do CNPq): 1. 0 3. 0 3. 0 0-6 1. RESUMO O volume de informações disponíveis

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Apresentação da Disciplina Alessandro L. Koerich 2008 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Introdução a Machine Learning: Teoria, Aplicações e IA na Arquitetura Intel Vitor Hugo Ferreira, DSc - UFF Flávio Mello, DSc UFRJ e Ai2Biz

Leia mais

Tecnologia RFID aplicada a agrocomputação: Um estudo de caso utilizando descoberta de conhecimento em base de dados

Tecnologia RFID aplicada a agrocomputação: Um estudo de caso utilizando descoberta de conhecimento em base de dados Tecnologia RFID aplicada a agrocomputação: Um estudo de caso utilizando descoberta de conhecimento em base de dados Nome: Alex Sandro de Paula Rodrigues; Orientadora: Profª. Dra. Regina Barwaldt ORGANIZAÇÃO

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 17 Support Vector Machines (SVM) Formas de Aprendizado Aprendizado Supervisionado Árvores de decisão. K-Nearest Neighbor

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

Face Recognition using RGB-D Images

Face Recognition using RGB-D Images Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular Tópicos André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Mineração de Dados Introdução Mineração de Dados Aprendizado de Máquina Métodos Preditivos Métodos

Leia mais

Classificação supervisionada baseada em árvore geradora mínima

Classificação supervisionada baseada em árvore geradora mínima Classificação supervisionada baseada em árvore geradora mínima Letícia Cavalari Pinheiro 1,3 Renato Martins Assunção 2 1 Introdução Classificação supervisionada é um dos problemas mais estudados na área

Leia mais

SEFAZ INFORMÁTICA Data Mining Prof. Márcio Hunecke

SEFAZ INFORMÁTICA Data Mining Prof. Márcio Hunecke SEFAZ INFORMÁTICA Data Mining Prof. Márcio Hunecke www.acasadoconcurseiro.com.br Informática DATA MINING Data mining (ou mineração de dados) é o processo de extrair informação válida, previamente desconhecida

Leia mais

Métodos para Classificação: - Naïve Bayes.

Métodos para Classificação: - Naïve Bayes. Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina A necessidade de inserir aprendizado nas máquinas surgiu após a construção dos Sistemas Especialistas (SEs). Os primeiros SEs não possuíam mecanismo de aprendizado e tornavam-se

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 5) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Introdução a Sistemas Inteligentes

Introdução a Sistemas Inteligentes Introdução a Sistemas Inteligentes Conceituação Prof. Ricardo J. G. B. Campello ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos originais gentilmente cedidos pelo

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano da Apresentação Aprendizagem de Máquina Alessandro L. Koerich 2007 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Professor & Experiência Acadêmica Horários

Leia mais

Algarve. A2 Aprendizagem Automática ML Machine Learning 7/15/2013

Algarve. A2 Aprendizagem Automática ML Machine Learning 7/15/2013 Preparado para o curso de pós-graduação em Ciências da Computação da Universidade Federal do Ceará, Fortaleza, Brasil A2 Aprendizagem Automática ML Machine Learning Julho e Agosto de 2013 José Valente

Leia mais

Estudo de Técnicas e Utilização de Mineração de Dados em uma Base de Dados da Saúde Pública

Estudo de Técnicas e Utilização de Mineração de Dados em uma Base de Dados da Saúde Pública Estudo de Técnicas e Utilização de Mineração de Dados em uma Base de Dados da Saúde Pública Autor: Gercely da Silva e Silva 1 1 Universidade Luterana do Brasil ULBRA Canoas, RS Brasil Resumo do Trabalho

Leia mais

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar Introdução Comidas podem apresentar deformações e variações em sua forma, além de conter muitos ingredientes, nem todos visíveis; Métodos tradicionais de reconhecimento requerem a detecção de características

Leia mais

Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto

Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto Aplicação da técnica de mineração de dados por meio do algoritmo J48 para definição de limiares de imagens de sensoriamento remoto Rodrigo Rodrigues Antunes e Israel Rodrigues Gonçalves Resumo: O objetivo

Leia mais

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público

Leia mais

Metodologias para a Seleção de Atributos Relevantes

Metodologias para a Seleção de Atributos Relevantes Metodologias para a Seleção de Atributos Relevantes José Augusto Baranauskas e Maria Carolina Monard Departamento de Computação e Estatística Instituto de Ciências Matemáticas e de Computação - Universidade

Leia mais

Classificação. Eduardo Raul Hruschka

Classificação. Eduardo Raul Hruschka Classificação Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada Combinação de Modelos

Leia mais

Banco de Dados Data Mining Data Warehouse Big Data

Banco de Dados Data Mining Data Warehouse Big Data Universidade Estadual de Mato Grosso do Sul Curso de Computação, Licenciatura Banco de Dados Data Mining Data Warehouse Big Data Prof. José Gonçalves Dias Neto profneto_ti@hotmail.com Data Mining: Introdução

Leia mais