Universidade Estadual de Campinas (UNICAMP) Campinas, São Paulo, Brasil CEP

Tamanho: px
Começar a partir da página:

Download "Universidade Estadual de Campinas (UNICAMP) Campinas, São Paulo, Brasil CEP"

Transcrição

1 H.pylori-MINDSys: Um Protótipo de Sistema Baseado em Conhecimento para Auxílio na Predição da Existência da Bactéria Helicobacter pylori em Doenças Pépticas Daniel de Faveri Honorato 1, Huei Diana Lee 1, Renato Bobsin Machado 1, Claudio Saddy Rodrigues Coy 2, João José Fagundes 2, and Feng Chung Wu 1,2 1 Laboratório de Bioinformática (LABI) Universidade Estadual do Oeste do Paraná (UNIOESTE) Parque Tecnológico Itaipu Foz do Iguaçu, Paraná, Brasil CEP Serviço de Coloproctologia da Faculdade de Ciências Médicas Universidade Estadual de Campinas (UNICAMP) Campinas, São Paulo, Brasil CEP {dfaverih,hueidianalee}@gmail.com Abstract. Research related to peptic diseases has raised interest especially because of their high incidence in the population. This work presents a system prototype, named H.pylori-MINDSys, to predict the existence of the Helicobacter pylori bacteria. The Data Mining process was employed to help finding patterns from a real Upper Digestive Endoscopy database. The extracted knowledge was then evaluated and validated by domain specialists and used in the construction of the knowledge base of the developed system. Key words: data mining, knowledge-based system, bioinformatics 1 Introdução Com o avanço tecnológico, conceitos e técnicas de Inteligência Artificial (IA) têm sido cada vez mais aplicados na solução de problemas reais por meio de sistemas de IA, tais como os relacionados aos Sistemas Baseados em Conhecimento. Esses sistemas podem ser construídos para qualquer área do conhecimento e utilizam conhecimento representado explicitamente para resolver problemas. Uma das áreas na qual podem ser utilizadas técnicas de IA para auxiliar na tomada de decisão é a área médica. Nessa área, pesquisas relacionadas a doenças pépticas têm despertado grande interesse, principalmente devido ao seu alto índice de incidência na população [7]. Uma das causas relacionadas a essas doenças é a presença da bactéria Helicobacter pylori (HP). Essa bactéria danifica células da parede gástrica, tornando-a mais suscetível à ação do ácido clorídrico e da pepsina do suco gástrico e causando lesões conhecidas como gastrites e úlceras. Existem várias maneiras de detectar a bactéria HP, tais como teste de urease,

2 2 Daniel de Faveri Honorato et al anatomia patológica (AP), exame de sangue e análise do ar expirado [13]. Os dois primeiros são realizados por meio da biópsia do tecido extraído no exame de Endoscopia Digestiva Alta (EDA). Os dois últimos, embora menos invasivos, apresentam custo maior. Este trabalho faz parte do projeto de Análise Inteligente de Dados desenvolvido conjuntamente por pesquisadores do Laboratório de Bioinformática (LA- BI 3 ) da Universidade Estadual do Oeste do Paraná, do Serviço de Coloproctologia da Faculdade de Ciências Médicas da Universidade Estadual de Campinas, e do Hospital Municipal de Paulínia (HMP), e tem por objetivo desenvolver um protótipo de Sistema Baseado em Conhecimento (SBC), o qual poderá auxiliar médicos na predição da existência ou não da bactéria HP, em doenças pépticas gastroduodenais. O sistema poderá auxiliar também na diminuição do custo da detecção da existência da HP e prover suporte a médicos durante a realização do exame de EDA, alertando-os sobre a probabilidade de existência dessa bactéria e sobre outras características importantes do paciente que está sendo examinado. O conhecimento utilizado no SBC foi adquirido por meio do processo de Mineração de Dados, o qual foi extraído de uma base de dados real de Endoscopia Digestiva Alta e resultados de teste para a detecção da bactéria HP. Esse conhecimento extraído de maneira automática foi avaliado e validado por especialistas do domínio e inserido no SBC. Este trabalho está organizado da seguinte maneira: na Seção 2 são apresentados conceitos relacionados a Sistemas Baseados em Conhecimento. Na Seção 3 são abordados conceitos relacionados ao processo de Mineração de Dados. Na Seção 4 é apresentada a metodologia utilizada e na Seção 5 são apresentados os resultados e discussões. Ao final, na Seção 6 são apresentadas as considerações finais. 2 Sistemas Baseados em Conhecimento Sistemas Baseados em Conhecimento são programas de computador que usam conhecimento, representado explicitamente, para resolver problemas. Esses sistemas, manipulam conhecimento e informação de maneira inteligente e são usados em problemas que requerem uma grande quantidade de conhecimento especializado [10]. Um SBC possui quatro componentes principais: a Interface com o Usuário, a Base de Conhecimento (BC), o Motor de Inferência e a Memória de Trabalho. A interação entre esses componentes é apresentada na Figura 1. A Interface é responsável pela interação entre o usuário e o SBC, a qual pode ser realizada por meio de um interpretador de comando ou por outros mecanismos mais amigáveis, por exemplo, o uso de janelas, menus, gráficos, animações e cores. A Base de Conhecimento contém a descrição do conhecimento necessário para a resolução do problema abordado na aplicação. Desse modo, é necessário que o conhecimento esteja organizado de maneira adequada para que o Motor 3

3 H.pylori-MINDSys: Um Protótipo de Sistema Baseado em Conhecimento 3 Figura 1. Estrutura de um Sistema Baseado em Conhecimento. de Inferência consiga tratá-lo convenientemente. Cada representação na Base de Conhecimento é chamada de sentença, a qual é expressa em linguagem para a Representação de Conhecimento (RC), tais como lógica, regras de decisão, redes semânticas, frames, orientação a objetos e orientação a objetos associada a regras [10]. Dentre as linguagens para RC existentes, uma das mais utilizadas é a de regras de decisão. Esse modo de representação é popular, pois as regras apresentam natureza modular, facilidade de explicação e são similares ao processo cognitivo humano [3]. As regras são estruturadas como SE (condições) ENTÃO (conclusão), nas quais a parte SE é uma lista de condições a serem satisfeitas e a parte ENTÃO é a conclusão. Usualmente, o conhecimento utilizado para a construção da BC dos SBCs pode ser adquirido explicitamente por meio de entrevistas com especialistas da área de domínio, pesquisas bibliográficas da área em questão, entre outros [10]. O Motor de Inferência ou Máquina de Inferência é responsável pelo desenvolvimento do raciocínio baseado nas informações fornecidas pelo usuário e no conhecimento representado na BC. A principal característica do Motor de Inferência diz respeito ao modo de raciocínio a ser utilizado. Existem vários tipos de raciocínio que podem ser aplicados em Sistemas Baseados em Conhecimento. Em um sistema de regras de decisão, são aplicáveis, basicamente, dois modos de raciocínio: encadeamento progressivo (forward chaining) e encadeamento regressivo (backward chaining) [3]. A área de trabalho do SBC, na qual são registradas todas as respostas fornecidas pelo usuário durante as interações realizadas com o sistema, é representada pela Memória de Trabalho. Algumas vantagens da utilização desse componente são: evitar que o usuário responda duas vezes à mesma pergunta, permitir ao usuário ver toda a linha de raciocínio que foi usada para chegar a uma determinada conclusão, e evitar que sejam realizadas repetidas seqüências de raciocínio para obtenção de conclusões intermediárias [10].

4 4 Daniel de Faveri Honorato et al 3 Mineração de Dados Com o avanço tecnológico, a quantidade de informações armazenadas digitalmente está cada vez maior. Para que possam ser realizadas análises mais completas, é necessário que essas informações sejam representadas de maneira apropriada, processadas e que um modelo que represente o conhecimento embutido nesses dados seja construído, uma vez que a análise manual é inviável. Um dos processos utilizados para realizar a análise de dados é a Mineração de Dados (MD) cujo objetivo é identificar padrões válidos, novos, potencialmente úteis e compreensíveis embutidos em dados [4]. O processo de MD é interativo e iterativo. Ele é composto, basicamente, por três etapas: pré-processamento, extração de padrões e pós-processamento. O pré-processamento é, freqüentemente, a etapa mais custosa, consumindo em torno de 80% do tempo usado para realizar o processo [8]. Ele tem como objetivo realizar tarefas como preparação, redução e transformação dos dados. Ainda em pré-processamento, é necessário que os dados estejam representados no formato apropriado para a próxima etapa, sendo um dos formatos mais comumente utilizados o atributo-valor. Um dos principais problemas na etapa de pré-processamento está relacionado à Seleção de Atributos (SA) importantes que serão utilizados na extração de conhecimento. A SA permite selecionar um sub-conjunto de atributos do conjunto de dados original por meio da remoção de atributos irrelevantes ou redundantes. A maioria dos algoritmos de MD não trabalha bem com um número grande de atributos, assim, a SA pode melhorar a precisão dos classificadores gerados. Ainda, com um número menor de atributos, modelos mais compreensíveis podem ser construídos [5]. A etapa de extração de padrões tem como característica a configuração, escolha e execução de um ou mais algoritmos de extração de padrões sobre os dados selecionados na etapa de pré-processamento. Essa etapa é realizada de maneira iterativa, sendo necessário realizar diversos ajustes nos parâmetros dos algoritmos de extração de padrões utilizados, com o objetivo de construir modelos do conhecimento extraído dos dados pré-processados. Após a extração de padrões, inicia-se a etapa de pós-processamento, na qual os modelos construídos são avaliados e validados. Depois de concluído o processo, o conhecimento extraído é disponibilizado ao usuário, o qual pode ser utilizado para auxiliar no processo de tomada de decisões. Neste trabalho, o conhecimento extraído é utilizado na construção da BC do SBC. 4 Metodologia Utilizada para a Construção do Sistema Conforme mencionado, a construção de um SBC implica, geralmente, na aquisição manual (explícita) de conhecimento por meio de interações com um ou mais especialistas da área. Neste trabalho foi utilizada a aquisição automática de conhecimento, a partir de uma base de dados reais, associada a interações com especialistas do domínio. A base de dados utilizada neste trabalho para a construção da BC foi coletada a partir de laudos, em formato texto, de Endoscopia

5 H.pylori-MINDSys: Um Protótipo de Sistema Baseado em Conhecimento 5 Digestiva Alta realizados no período de 01/1999 a 02/2000 no Serviço de Endoscopia Digestiva Alta do Hospital Municipal de Paulínia. Nesse período foram realizados 1271 exames, os quais continham informações relacionadas ao esôfago, estômago, duodeno e anatomia patológica. As informações sobre o esôfago, o estômago e o duodeno dos pacientes são obtidas no ato do exame de endoscopia. As informações relacionadas às características histológicas e a existência ou não da bactéria são obtidas pela análise do tecido extraído do paciente por meio da AP. Para o desenvolvimento deste trabalho, somente exames de pacientes submetidos à biópsia e posterior teste para verificação da existência de HP poderiam ser considerados para a construção do SBC. Assim, do total de 1271 laudos, foram selecionados 276 casos que atendiam a esse requisito. Esses exames foram mapeados para um conjunto de dados inicial digital no formato atributo-valor descritos por 85 atributos. Nesse formato cada coluna representa um atributo e cada linha representa um exame. Informações de identificação dos pacientes foram removidas. A partir dessa base, foram construídos dois conjuntos de dados, apenas variando o número de atributos. O primeiro conjunto de dados (CD1) foi criado utilizando todos os atributos da base de dados, isto é, os 85 atributos iniciais. O segundo conjunto de dados (CD2) foi construído não considerando os atributos de anatomia patológica, resultando, portanto, em um conjunto de dados com 63 atributos. Nesse último conjunto de dados, uma das razões para a exclusão de todos atributos de anatomia patológica está relacionada à tentativa de predizer a exitência da bactéria Helicobacter pylori considerando somente informações de esôfago, estômago e duodeno. Duas ferramentas principais foram empregadas neste trabalho: uma ferramenta de MD para extração de conhecimento dos conjuntos de dados e uma Shell 4 de SBC para a construção do protótipo. O conhecimento extraído, após analisado e validado pelos especialistas da área, foi inserido na Base de Conhecimento do SBC. Dentre as ferramentas de MD existentes, foi selecionada a See5 [12], a qual implementa a versão posterior dos consagrados algoritmos C4.5 e C4.5-rules [9] que permite a indução de árvores de decisão e regras de decisão, respectivamente. Para a construção do SBC, foi utilizada a ferramenta CLIPS [1], a qual provê suporte com Base de Conhecimento e Motor de Inferência. Essa ferramenta foi escolhida por ser gratuita, possuir boa documentação, além de ter como um dos modos de Representação de Conhecimento, as regras de produção, as quais foram utilizadas neste trabalho. A linguagem JAVA 5 foi utilizada para a construção da interface do sistema. Essa linguagem foi selecionada, pois possui um conjunto de APIs (Application Programming Interfaces) que disponibilizam diversas funcionalidades e objetos reutilizáveis. 4 Shells são ferramentas que auxiliam na construção de SBCs, geralmente fornecendo suporte para a Base de Conhecimento, o Motor de Inferência e a Memória de Trabalho. 5

6 6 Daniel de Faveri Honorato et al 5 Resultados e Discussões Conforme mencionado, o conhecimento a ser utilizado no SBC foi extraído utilizando algoritmos de MD. Portanto, a partir dos dois conjuntos de dados CD1 e CD2 construídos foram realizadas duas iterações aplicando o algoritmo de indução de regras. Os resultados dessas iterações são apresentados na Tabela 1, a qual está organizada da seguinte maneira: Conjunto de Dados: nome do conjunto de dados que contém os casos utilizados pelo algoritmo de MD; #Atr: número de atributos de cada conjunto de dados; #Regras: número de regras do modelo completo induzido pelo algoritmo de MD; EV ± EP: estimativa de erro verdadeiro obtido por meio de 10-Fold Cross- Validation (CV 6 ) e erro padrão dessa média. Tabela 1. Resultados da Aplicação do Algoritmo de MD. Conjunto de Dados #Atr #Regras EV ± EP (%) CD ,90 ± 3,40 CD ,10 ± 1,50 CD1Relief ,50 ± 2,10 CD2Relief ,60 ± 1,90 Na primeira iteração foi aplicado o algoritmo de indução de regras nos conjuntos de dados CD1 e CD2. Embora a precisão dos classificadores gerados a partir desses conjuntos de dados seja similar a da Classe Majoritária (CM) (36,59%), é importante ressaltar que esse erro é obtido de acordo com número de casos de cada classe presente no conjunto de dados e desse modo, a resposta fornecida com base na precisão da CM é sempre a classe mais freqüente, não sendo baseada nos valores de atributos específicos de cada caso. Assim, dado um novo caso ao sistema, não seria possível fornecer uma explicação sobre a decisão tomada em relação a esse caso se a predição fosse realizada baseada na CM. Contrariamente, uma classificação baseada em um modelo, como o construído por meio de algoritmos de MD que geram árvores e regras de decisão, poderia fornecer uma explicação da resposta de classificação dado um novo caso. Conforme citado na Seção 3, um dos problemas quando se realiza a extração de conhecimento de uma base de dados está relacionado ao número de atributos 6 Os dados são selecionados aleatoriamente e divididos em k partições mutuamente exclusivas (folds) de exemplos, aproximadamente do mesmo tamanho. O indutor de regras é treinado e testado k vezes. Na primeira vez, o primeiro fold é usado para teste e os k-1 folds restantes, para treinamento. Na segunda vez, o segundo fold é usado para teste e os k-1 folds restantes, para treinamento, e assim sucessivamente até o k-ésimo fold.

7 H.pylori-MINDSys: Um Protótipo de Sistema Baseado em Conhecimento 7 contidos no conjunto de dados. Esse é um dos fatores que influencia no desempenho das predições, pois a maioria dos algoritmos de MD não trabalha bem na presença de um número grande de atributos. Outra questão importante é a compreensibilidade dos modelos construídos, a qual está também relacionada ao número de atributos que são utilizados para construir o modelo. Desse modo, foi realizada a Seleção de Atributos, utilizando o algoritmo ReliefF [11], freqüentemente utilizado para SA, com o objetivo de obter um número menor e relevante de atributos dos conjuntos de dados. A idéia desse algoritmo é estimar a qualidade dos atributos de acordo com quão bem seus valores distinguem entre exemplos da mesma classe e de diferentes classes que estão perto uma da outra. Ao final do processo de SA, o ReliefF fornece uma lista dos atributos classificados de acordo com sua relevância em relação à classe. O algoritmo de Seleção de Atributos foi aplicado para ambos os conjuntos CD1 e CD2. A aplicação do ReliefF nos conjuntos resultou em um novo conjunto de dados (CD1Relief) com 49 atributos para CD1 e em outro conjunto de dados (CD2Relief) com 37 atributos para CD2. O próximo passo após a SA foi realizar a aplicação do algoritmo de indução de regras sobre os conjuntos de dados CD1Relief e CD2Relief. Conforme é possível observar na Tabela 1, os resultados para os conjuntos de dados CD1Relief e CD2Relief foram semelhantes aos alcançados na primeira iteração. Portanto, para verificar se houve diferença significativa entre as médias dos erros dos classificadores, construídos com os conjuntos de dados antes e depois da SA (entre CD1 e CD1Relief e entre CD2 e CD2Relief), foi utilizado um teste t não pareado [2]. O resultado do teste t mostrou que não houve diferença estatisticamente significativa entre as médias dos erros dos classificadores construídos a partir de CD1 e CD1Relief (p = 0,9194) e entre CD2 e CD2Relief (p = 0,3177). Desse modo, utilizando apenas os 49 atributos de CD1Relief dos 85 atributos iniciais de CD1, é possível obter um resultado que apresenta, estatisticamente, a mesma precisão. Do mesmo modo, com apenas 37 atributos de CD2Relief dos 63 atributos iniciais de CD2, é possível também obter precisões semelhantes nos resultados. Os conjuntos de atributos selecionados pelo processo de SA, ou seja, representados pelos atributos dos conjuntos de dados CD1Relief e CD2Relief, foram analisados pelos especialistas do domínio. É interessante notar que 35% do total de atributos considerados relevantes pelo método de SA também foram considerados importantes segundo a análise dos especialistas. As regras geradas a partir dos conjuntos de dados CD1Relief e CD2Relief também foram avaliadas e validadas pelos especialistas, tendo sido consideradas relevantes de acordo com o conhecimento do domínio. Desse modo, para a construção do protótipo do sistema H.pylori-MINDSys, foram consideradas as regras obtidas a partir do conjunto de dados CD1Relief por esse apresentar melhores resultados nos experimentos realizados. Após a extração, avaliação e validação do conhecimento, foi realizado o projeto da interface do H.pylori-MINDSys. Para a construção da interface levou-se em consideração os atributos utilizados nas regras que foram extraídas pelo al-

8 8 Daniel de Faveri Honorato et al goritmo de MD. A interface construída é apresentada na Figura 2. A partir dessa interface, o usuário pode fornecer os valores para os atributos, os quais são utilizados na execução do SBC. O resultado e o grau de confiança da regra ou regras, que permitiram essa conclusão, são apresentados na parte inferior da interface. Também, a interface possibilita ao usuário obter a explicação de como o sistema inferiu uma determinada conclusão. Figura 2. Interface do Sistema H.pylori-MINDSys. Após a validação da interface pelo especialista, o próximo passo foi realizar a codificação da BC do sistema utilizando regras extraídas do conjunto de dados CD1Relief. O conjunto de regras gerado pelo algortimo de indução de regras do See5 foi convertido para o formato de regras utilizado pela BC do CLIPS. Na interface do H.pylori-MINDSys é necessário o usuário inicialmente preencher informações do paciente. O SBC então realiza o processamento dessas informações e o resultado é apresentado. O usuário pode visualizar as regras que foram disparadas pelo sistema e os resultados podem ser armazenados para consultas posteriores. Neste trabalho foi definido que, havendo conflito 7, a resposta do sistema é fornecida considerando a classe com maior número de regras disparadas. Nesse caso, é fornecido o resultado da Equação 1, a qual utiliza os dois maiores fatores de certeza das duas regras da mesma classe que mais aparecem. 7 Dependendo das informações fornecidas ao SBC, mais de uma regra da BC, contendo eventualmente respostas distintas, pode ser disparada.

9 H.pylori-MINDSys: Um Protótipo de Sistema Baseado em Conhecimento 9 Essa equação foi utilizada em um dos primeiros SBCs, o sistema MyCin [6]. Na Figura 3 é ilustrado um exemplo de conflito. CF 3 = (CF 1 + CF 2) (CF 1 CF 2) (1) Figura 3. Resolução de Conflito. Nesse exemplo, duas regras da classe Ausente e uma da classe Presente foram disparadas. Caso ocorra empate no número de regras disparadas para cada classe, é fornecido ao usuário o resultado para as duas classes. 6 Considerações Finais Neste trabalho foram apresentados o projeto e o desenvolvimento de um protótipo de Sistema Baseado em Conhecimento denominado H.pylori-MINDSys para auxílio na predição da existência bactéria Helicobacter pylori. Especialistas do domínio consideraram bons os resultados alcançados, tendo sido o conhecimento extraído classificado como relevante de acordo com o conhecimento de domínio. É importante ressaltar que a extração automática de padrões embutidos nos dados pode auxiliar bastante na redução de tempo de construção de SBCs. Outra vantagem é que podem ser identificados padrões que são importantes para a predição da bactéria HP e que podem não ser adquiridos em um processo de aquisição manual. Por fim, os especialistas podem complementar a BC, inserindo regras que não foram identificadas na aquisição automática. Trabalhos futuros incluem a aplicação do algoritmo de MD sobre outros conjuntos de dados de EDA e com isso, novas regras serem identificadas e avaliadas por especialistas do domínio para que a base de conhecimento do sistema seja aumentada. Outro trabalho inclui a ampliação do sistema para que possa auxiliar o especialista durante a EDA, ou seja, a medida que o exame está sendo realizado e os dados são fornecidos ao sistema, esse, de modo interativo, exibe o

10 10 Daniel de Faveri Honorato et al conhecimento embutido em sua BC relacionado com as características correntes do exame. A metodologia proposta também será aplicada a outros domínios. Agradecimentos. Os autores agradecem Antonio Pietrobom Neto, do Hospital Municipal de Paulínia, por disponibilizar o conjunto de laudos utilizado nos experimentos. Também agradecem ao Professor Juvenal Ricardo Navarro Góes (in memorian) pela sua inestimável contribuição. Este trabalho também teve o auxílio do Conselho Nacional de Desenvolvimento Científico e Tecnológico CNPq. Referências 1. CLIPS Reference Manual: Basic Programming Guide, (2008) 2. Freedman, D., Pisani, R., and Purves, R.: Statistics. Norton, New York, USA (1998) 3. Giarratano, J. and Riley, G.: Expert Systems: Principles and Programming. PWS Publishing Company, Boston, USA (1998) 4. Han J and Kamber M.: Data Mining: Concepts and Techniques. Morgan Kauf-mann Publishers, California, USA (2006) 5. Lee, H. D.: Seleção de atributos importantes para a extração de conhecimento de bases de dados. Tese de Doutorado, ICMC-USP, disponiveis/55/55134/tde / (2005) 6. Mahoney, J. J. and Mooney, R. J.: Comparing Methods for Refining Certainty- Factor Rule-Bases. The 11th International Conference on Machine Learning, Austin, Texas (1994) 7. Pellicano, R., Fagoonee, S., Palestro, G., Rizzetto, M., Figura, N., Ponzetto, A.: The diagnosis of helicobacter pylori infection: guidelines from the maastricht consensus report. Minerva Gastroenterol Dietol, vol. 50(2), pp (2004) 8. Pyle, D.: Data Preparation for Data Mining. Morgan Kaufmann, California, USA (1999) 9. Quinlan, J. R.: C4.5: Programs for Machine Learning. Morgan Kaufmann, California, USA (1993) 10. Rezende, S. O.: Sistemas Inteligentes: Fundamentos e Aplicações. Editora Manole, Barueri, SP, Brasil (2003) 11. Robnik-Sikonja, M. and Kononenko, I.: Theoretical and Empirical Analysis of ReliefF and RReliefF. Machine Learning Journal, vol. 53, pp (2003) 12. Rulequest-Research. See5: An Informal Tutorial, win.html (2008) 13. Versalovic, J.: Helicobacter pylori: Pathology and Diagnostic Strategies. American Journal of Clinical Pathology. vol. 119, pp (2003)

Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas

Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas Luiz Henrique Dutra da Costa (PIBIC/Unioeste), Carlos Andres Ferrero, Cláudio Saddy Rodrigues

Leia mais

Uma Metodologia para Auxiliar no Processo de Construção de Bases de Dados Estruturadas a partir de Laudos Médicos

Uma Metodologia para Auxiliar no Processo de Construção de Bases de Dados Estruturadas a partir de Laudos Médicos Uma Metodologia para Auxiliar no Processo de Construção de Bases de Dados Estruturadas a partir de Laudos Médicos Daniel de Faveri Honorato 1,4, Huei Diana Lee 1,2, Maria Carolina Monard 2, Feng Chung

Leia mais

EnDia Uma Ferramenta para Construção de Repositórios de Dados de Endoscopia Digestiva Alta

EnDia Uma Ferramenta para Construção de Repositórios de Dados de Endoscopia Digestiva Alta EnDia Uma Ferramenta para Construção de Repositórios de Dados de Endoscopia Digestiva Alta Carlos Andres Ferrero 1, André Gustavo Maletzke 2,Huei Diana Lee 3, Wu Feng Chung 4, Antônio Pietrobom Neto 5,

Leia mais

UM SISTEMA DE GERENCIAMENTO DE DADOS PARA EXAMES DE ENDOSCOPIA DIGESTIVA ALTA 1

UM SISTEMA DE GERENCIAMENTO DE DADOS PARA EXAMES DE ENDOSCOPIA DIGESTIVA ALTA 1 UM SISTEMA DE GERENCIAMENTO DE DADOS PARA EXAMES DE ENDOSCOPIA DIGESTIVA ALTA 1 CARLOS ANDRÉS FERRERO 2, HUEI DIANA LEE 3, FENG CHUNG WU 4, RENATO BOBSIN MACHADO 5, DANIEL DE FAVERI HONORATO 6, ANTONIO

Leia mais

EnDia 2.0: Sistema Web para Construção de Bases de Dados a partir de Exames de Endoscopia Digestiva Alta

EnDia 2.0: Sistema Web para Construção de Bases de Dados a partir de Exames de Endoscopia Digestiva Alta EnDia 2.0: Sistema Web para Construção de Bases de Dados a partir de Exames de Endoscopia Digestiva Alta Newton Spolaôr 1, Everton Alvares Cherman 1, Neimar Neitzel 1, Luiz Henrique Dutra da Costa 1, Carlos

Leia mais

Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados

Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados Estudo e Avaliação da Seleção de Atributos para Pré-processamento no Processo de Mineração de Dados Silvani Weber da Silva Borges 1 (PIBIC/CNPq/Unioeste), Renato B. Machado (Orientador), Newton Spolaôr

Leia mais

Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas

Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas Daniel de F. Honorato 1, Huei D. Lee 1, Renato B. Machado 1,4,

Leia mais

Construção de uma Ontologia para Auxiliar no Mapeamento de Laudos Médicos de Endoscopia Digestiva Alta para Bases de Dados Estruturadas

Construção de uma Ontologia para Auxiliar no Mapeamento de Laudos Médicos de Endoscopia Digestiva Alta para Bases de Dados Estruturadas Construção de uma Ontologia para Auxiliar no Mapeamento de Laudos Médicos de Endoscopia Digestiva Alta para Bases de Dados Estruturadas Luiz Henrique Dutra da Costa 1, Carlos Andrés Ferrero 1, Huei Diana

Leia mais

Sistemas Baseados em Conhecimento

Sistemas Baseados em Conhecimento Sistemas Baseados em Conhecimento Profa. Josiane M. P. Ferreira Baseado no capítulo 2 do livro Sistemas Inteligentes Fundamentos de Aplicações, organizadção: Solange Oliveira Rezende, ed. Manole, 2005.

Leia mais

Uma Abordagem de Extração de Terminologia Para a Construção de uma Representação Atributo-valor a Partir de Documentos Não Estruturados

Uma Abordagem de Extração de Terminologia Para a Construção de uma Representação Atributo-valor a Partir de Documentos Não Estruturados Uma Abordagem de Extração de Terminologia Para a Construção de uma Representação Atributo-valor a Partir de Documentos Não Estruturados Daniel de Faveri Honorato 1, Maria Carolina Monard 1, and Huei Diana

Leia mais

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS 7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução

Leia mais

Técnicas de Inteligência Artificial

Técnicas de Inteligência Artificial Universidade do Sul de Santa Catarina Ciência da Computação Técnicas de Inteligência Artificial Aula 05 Sistemas Especialistas Max Pereira Sistemas Especialistas Pesquisadores de IA queriam desenvolver

Leia mais

Mapeamento de Laudos Médicos de Endoscopia Digestiva Alta Apoiados por Ontologias

Mapeamento de Laudos Médicos de Endoscopia Digestiva Alta Apoiados por Ontologias Mapeamento de Laudos Médicos de Endoscopia Digestiva Alta Apoiados por Ontologias Luiz Henrique Dutra da Costa 1, Carlos Andrés Ferrero 1, Huei Diana Lee 1, Cláudio Saddy Rodrigues Coy 2, João José Fagundes

Leia mais

Avaliação de um método de mapeamento de laudos médicos para uma representação estruturada: estudo de caso com laudos de endoscopia digestiva alta

Avaliação de um método de mapeamento de laudos médicos para uma representação estruturada: estudo de caso com laudos de endoscopia digestiva alta Avaliação de um método de mapeamento de laudos médicos para uma representação estruturada: estudo de caso com laudos de endoscopia digestiva alta Daniel de Faveri Honorato 1, Maria Carolina Monard 2, Huei

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Um Estudo do Mapeamento de Laudos Médicos de Endoscopia Digestiva Alta e Colonoscopia para Aquisição de Conhecimento

Um Estudo do Mapeamento de Laudos Médicos de Endoscopia Digestiva Alta e Colonoscopia para Aquisição de Conhecimento Um Estudo do Mapeamento de Laudos Médicos de Endoscopia Digestiva Alta e Colonoscopia para Aquisição de Conhecimento Everton Alvares Cherman 1, Newton Spolaôr 1, Huei Diana Lee 1,2, Daniel de Faveri Honorato

Leia mais

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS 6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Leia mais

Inteligência Artificial. Sistemas Inteligentes. Síntese baseada no cap.2 Sistemas Inteligentes da Solange Rezende

Inteligência Artificial. Sistemas Inteligentes. Síntese baseada no cap.2 Sistemas Inteligentes da Solange Rezende Universidade Estadual do Oeste do Paraná Curso de Bacharelado em Ciência da Computação http://www.inf.unioeste.br/~claudia/ia2017.html Inteligência Artificial Sistemas Inteligentes Síntese baseada no cap.2

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

Seleção de Atributos 1

Seleção de Atributos 1 Seleção de Atributos 1 Tópicos Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Seleção de atributos antes do aprendizado Benefícios Abordagens automáticas

Leia mais

Sistemas Especialistas (SE)

Sistemas Especialistas (SE) Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Sistemas Especialistas (SE) Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Desenvolvimento de uma ontologia para doenças do cólon diagnosticáveis por meio de exames de vídeocolonoscopia

Desenvolvimento de uma ontologia para doenças do cólon diagnosticáveis por meio de exames de vídeocolonoscopia Desenvolvimento de uma ontologia para doenças do cólon diagnosticáveis por meio de exames de vídeocolonoscopia 1 Silvani Weber da Silva Borges (PIBIC/CNPq/Unioeste), 12 Huei Diana Lee (Orientadora), 1

Leia mais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente

Leia mais

Metodologia de Mapeamento de Laudos Médicos para Bases de Dados: Aplicação em Laudos Colonoscópicos

Metodologia de Mapeamento de Laudos Médicos para Bases de Dados: Aplicação em Laudos Colonoscópicos Metodologia de Mapeamento de Laudos Médicos para Bases de Dados: Aplicação em Laudos Colonoscópicos Everton Alvares Cherman 1, Huei Diana Lee 1,2, Daniel de Faveri Honorato 2, João José Fagundes 3, Juvenal

Leia mais

Seleção de Atributos FSS. Relevância de Atributos. Relevância de Atributos. Seleção de Atributos - FSS. FSS como Busca no Espaço de Estados

Seleção de Atributos FSS. Relevância de Atributos. Relevância de Atributos. Seleção de Atributos - FSS. FSS como Busca no Espaço de Estados Seleção FSS Alguns indutores geralmente degradam seu desempenho quando são fornecidos muitos atributos irrelevantes para o conceito a ser aprendido Feature Subset Selection (FSS) é o processo de selecionar

Leia mais

Sistemas Especialistas. Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6)

Sistemas Especialistas. Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Sistemas Especialistas Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Sistemas Baseados em Conhecimento Os Sistemas Especialistas (SE) e os Sistemas

Leia mais

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio

Leia mais

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA 19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ

Leia mais

RELATÓRIOS TÉCNICOS DO LABORATÓRIO DE BIOINFORMÁTICA UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ

RELATÓRIOS TÉCNICOS DO LABORATÓRIO DE BIOINFORMÁTICA UNIVERSIDADE ESTADUAL DO OESTE DO PARANÁ Centro de Engenharias e Ciências Exatas Descrição do Protótipo de Telas (versão 1.0) para o Sistema de Gerenciamento de Protocolo de Cirurgia Coloproctológica Huei Diana Lee Wilson Jung Adrieli Cristina

Leia mais

Classificação Automática de Gêneros Musicais

Classificação Automática de Gêneros Musicais Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação

Leia mais

Sistemas Baseados em Conhecimento e SHELLS. Sistemas Especialistas (SE) Áreas de Aplicação. IA, SBCs e SEs 20/10/2017

Sistemas Baseados em Conhecimento e SHELLS. Sistemas Especialistas (SE) Áreas de Aplicação. IA, SBCs e SEs 20/10/2017 GERENCIAMENTO DE CONHECIMENTO E MINERAÇÃO DE DADOS Sistemas ados em e SHELLS Huei Diana Lee Curso Ciência da Computação / Programa Pós-Graduação em Engenharia Elétrica e Computação (PGEEC) Sistemas ados

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios

Leia mais

DE BASE DE CONHECIMENTO E MOTOR DE INFERÊNCIA PARA O PROCESSO DE MINERAÇÃO DE DADOS DA FERRAMENTA KIRA

DE BASE DE CONHECIMENTO E MOTOR DE INFERÊNCIA PARA O PROCESSO DE MINERAÇÃO DE DADOS DA FERRAMENTA KIRA 18º Congresso de Iniciação Científica IMPLEMENTAÇÃO DE BASE DE CONHECIMENTO E MOTOR DE INFERÊNCIA PARA O PROCESSO DE MINERAÇÃO DE DADOS DA FERRAMENTA KIRA Autor(es) ANDRÉ DE ANDRADE BINDILATTI Orientador(es)

Leia mais

Protótipo de um Sistema Móvel para a Extração de. Características em Fragmentos de Imagem de Tecido. Cólico

Protótipo de um Sistema Móvel para a Extração de. Características em Fragmentos de Imagem de Tecido. Cólico Protótipo de um Sistema Móvel para a Extração de Características em Fragmentos de Imagem de Tecido Cólico Application Prototype for Mobile Devices to Features Extraction in Image Fragments Colic Tissue

Leia mais

SBC - Sistemas Baseados em Conhecimento

SBC - Sistemas Baseados em Conhecimento Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O

Leia mais

Introdução a Sistemas Inteligentes

Introdução a Sistemas Inteligentes Introdução a Sistemas Inteligentes Conceituação Prof. Ricardo J. G. B. Campello ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos originais gentilmente cedidos pelo

Leia mais

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências

Leia mais

Pontifícia Universidade Católica de São Paulo Programa de TIDD

Pontifícia Universidade Católica de São Paulo Programa de TIDD Disciplina: 2854 - Sistemas Inteligentes e Ambientes Virtuais Turma A Área de Concentração: Processos Cognitivos e Ambientes Digitais Linha de Pesquisa: Inteligência Coletiva e Ambientes Interativos Professor:

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Sistemas Especialistas Raciocínio e Mecanismos de Inferência Sistemas Especialistas Um programa de computador inteligente que usa conhecimento e inferência para resolver problemas

Leia mais

Um Estudo Sobre a Efetividade do Método de Imputação Baseado no Algoritmo k-vizinhos Mais Próximos

Um Estudo Sobre a Efetividade do Método de Imputação Baseado no Algoritmo k-vizinhos Mais Próximos Um Estudo Sobre a Efetividade do Método de Imputação Baseado no Algoritmo k-vizinhos Mais Próximos Gustavo Enrique de Almeida Prado Alves Batista Maria Carolina Monard Laboratório de Inteligência Computacional

Leia mais

Sistemas Especialistas

Sistemas Especialistas Agenda Sistemas Especialistas Revisão Conceitos Básicos Entender uma ferramenta para S.E. Sistemas de Informação Inteligentes Prof. Esp. MBA Heuber G. F. Lima Aula2 Page 2 Conceitos I.A. Sistemas Especialistas

Leia mais

Um Estudo sobre Métodos de Classificação Multirrótulo

Um Estudo sobre Métodos de Classificação Multirrótulo Um Estudo sobre Métodos de Classificação Multirrótulo Everton Alvares Cherman 1, Maria Carolina Monard 1 1 Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Laboratório de Inteligência

Leia mais

Inteligência Artificial Escola de Verão Laboratório Associado de Computação e Matemática Aplicada LAC

Inteligência Artificial Escola de Verão Laboratório Associado de Computação e Matemática Aplicada LAC Inteligência Artificial Escola de Verão 2008 Laboratório Associado de Computação e Matemática Aplicada LAC www.lac.inpe.br/~demisio/ia_lac.html Sistemas Especialistas e Representação do Conhecimento Sistema

Leia mais

Lista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís

Lista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís ICMC-USP Lista de Exercícios - Capítulo 8 [1] SCC-630 - Inteligência Artificial 1o. Semestre de 2011 - Prof. João Luís 1. Seja breve na resposta às seguintes questões: (a) o que você entende por Aprendizado

Leia mais

Proposta de Gerenciamento de Exames Médicos Utilizando uma Aplicação DICOM

Proposta de Gerenciamento de Exames Médicos Utilizando uma Aplicação DICOM Proposta de Gerenciamento de Exames Médicos Utilizando uma Aplicação DICOM Neimar Neitzel 1, Renato Bobsin Machado 1, Huei Diana Lee 1, Feng Chung Wu 1,2, Joylan Nunes Maciel 1, João José Fagundes 2, Juvenal

Leia mais

Palavras-chaves: Inteligência artificial. Sistemas especialistas. Base de conhecimento

Palavras-chaves: Inteligência artificial. Sistemas especialistas. Base de conhecimento SISTEMAS ESPECIALISTAS E SUAS DEFINIÇÕES OLIVEIRA, Michel de Andrade Acadêmico em Sistemas de Informações, CTESOP, michelboom5@gmail.com RESUMO: O objetivo deste artigo é trazer uma definição ampla dos

Leia mais

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem e Avaliação de s José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP AM é uma ferramenta poderosa, mas não existe um único algoritmo que apresente o melhor desempenho para todos os

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

TP-DISCOVER: um ambiente computacional para auxílio no pré-processamento de laudos médicos não-estruturados

TP-DISCOVER: um ambiente computacional para auxílio no pré-processamento de laudos médicos não-estruturados TP-DISCOVER: um ambiente computacional para auxílio no pré-processamento de laudos médicos não-estruturados Daniel de Faveri Honorato 1, Maria Carolina Monard 2, Huei Diana Lee 1, Carlos Andres Ferrero

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular WEKA Tópicos Introdução Simuladores de MD Principais módulos André C. P. L. F. de Carvalho Monitor: Váléria Carvalho André Ponce de Leon de Carvalho 2 Usando MD

Leia mais

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução 19 Congresso de Iniciação Científica IMPLEMENTAÇÃO DE GUIAS E ALGORITMOS PARA REGRAS DE ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) HARLEI MIGUEL DE ARRUDA LEITE Orientador(es)

Leia mais

Uma ferramenta para expansão do vocabulário com base em coocorrência

Uma ferramenta para expansão do vocabulário com base em coocorrência Resumos Expandidos: XI Mostra de Estagiários e Bolsistas... 11 Uma ferramenta para expansão do vocabulário com base em coocorrência Exupério Lédo Silva Júnior 1 Roberta Akemi Sinoara 2 Solange Oliveira

Leia mais

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

Sistemas Especialistas e Representação do Conhecimento. Sistemas Especialistas e Representação do Conhecimento. Sistema Especialista

Sistemas Especialistas e Representação do Conhecimento. Sistemas Especialistas e Representação do Conhecimento. Sistema Especialista Sistemas Especialistas e Representação do Conhecimento Sistemas Especialistas e Representação do Conhecimento -programa que comporta-se como um expert em algum domínio restrito de aplicação. -capaz de

Leia mais

Mineração de Textos na Web

Mineração de Textos na Web Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na

Leia mais

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos

Leia mais

CC-226 Introdução à Análise de Padrões

CC-226 Introdução à Análise de Padrões CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 14 Aprendizado de Máquina Avaliação de s Preditivos (Classificação) Hold-out K-fold Leave-one-out Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br Curso: Sistemas de Informação

Leia mais

Processos de software

Processos de software Processos de software 1 Processos de software Conjunto coerente de atividades para especificação, projeto, implementação e teste de sistemas de software. 2 Objetivos Introduzir modelos de processos de

Leia mais

Utilização de Atributos Baseados em Textura para a Caracterização de Tecidos Cólicos em Imagens de Colonoscopia

Utilização de Atributos Baseados em Textura para a Caracterização de Tecidos Cólicos em Imagens de Colonoscopia Utilização de Atributos Baseados em Textura para a Caracterização de Tecidos Cólicos em Imagens de Colonoscopia Carlos Andres Ferrero 1,3, Huei Diana Lee 1, Everton Alvares Cherman 1, Cláudio Sady Rodrigues

Leia mais

Introdução aos Sistemas Especialistas. Professor Celso A A Kaestner, Dr. Eng.

Introdução aos Sistemas Especialistas. Professor Celso A A Kaestner, Dr. Eng. Introdução aos Sistemas Especialistas Professor Celso A A Kaestner, Dr. Eng. 1 Inteligência Artificial O campo da Inteligência Artificial (IA) tenta compreender as entidades inteligentes para construir

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

3M Health Information Systems Metodologia de Agrupamento Diagnóstico aplicável em modelos sustentáveis de pagamento e melhoria da Qualidade na Saúde

3M Health Information Systems Metodologia de Agrupamento Diagnóstico aplicável em modelos sustentáveis de pagamento e melhoria da Qualidade na Saúde 3M Health Information Systems Metodologia de Agrupamento Diagnóstico aplicável em modelos sustentáveis de pagamento e melhoria da Qualidade na Saúde 3M APR DRG Avaliação de alocação de recursos na área

Leia mais

Estudo de Caso. Índice. Descrição da Área. Daniel Gomes Dosualdo Solange Oliveira Rezende

Estudo de Caso. Índice. Descrição da Área. Daniel Gomes Dosualdo Solange Oliveira Rezende Estudo de Caso Daniel Gomes Dosualdo Solange Oliveira Rezende Índice Descrição da Área Identificação do Problema Descrição do Conjunto de Dados Pré-Processamento Extração de Padrões Pós-Processamento Disponibilização

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem (Redes Neurais - Complementar) Prof. a Joseana Macêdo

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

19 Congresso de Iniciação Científica APLICAÇÃO DA LÓGICA NEBULOSA A MODELO DE CONHECIMENTO DO PROCESSO DE MINERAÇÃO DE DADOS

19 Congresso de Iniciação Científica APLICAÇÃO DA LÓGICA NEBULOSA A MODELO DE CONHECIMENTO DO PROCESSO DE MINERAÇÃO DE DADOS 19 Congresso de Iniciação Científica APLICAÇÃO DA LÓGICA NEBULOSA A MODELO DE CONHECIMENTO DO PROCESSO DE MINERAÇÃO DE DADOS Autor(es) ANDRE DE ANDRADE BINDILATTI Orientador(es) ANDERSON BERGAMO, ANA ESTELA

Leia mais

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução 3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução Como já mencionado na seção 1.1, as SVMs geram, da mesma forma que redes neurais (RN), um "modelo caixa preta" de

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina O que é Aprendizado? Memorizar alguma coisa Aprender fatos por meio de observação e exploração Melhorar habilidades motoras/cognitivas por meio de prática Organizar novo conhecimento

Leia mais

SISTEMAS ESPECIALISTAS

SISTEMAS ESPECIALISTAS SISTEMAS ESPECIALISTAS Um produto da Engenharia de Conhecimento, um sistema especialista representa o conhecimento de uma área específica e o utiliza para resolver problemas simulando o raciocínio de um

Leia mais

Sistemas Especialistas. Prof. Msc. Jacson Rodrigues

Sistemas Especialistas. Prof. Msc. Jacson Rodrigues Sistemas Especialistas Prof. Msc. Jacson Rodrigues Sistemas Especialistas Características: Sistema computacional; Destinado a representar o conhecimento de um ou mais especialistas humanos sobre um domínio

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Sistemas Especialistas Raciocínio e Mecanismos de Inferência Arquitetura de um SE típico Interface com o Usuário: Perguntas e respostas; Linguagem natural Editor da Base de Conhecimento

Leia mais

Sistemas Inteligentes e Sistemas Especialistas. Profa. Flávia Cristina Bernardini

Sistemas Inteligentes e Sistemas Especialistas. Profa. Flávia Cristina Bernardini Sistemas Inteligentes e Sistemas Especialistas Profa. Flávia Cristina Bernardini AQUISIÇÃO DE CONHECIMENTO DATA MINING SISTEMAS ESPECIALISTAS SISTEMAS INTELIGENTES PARA APOIO NA TOMADA DE DECISÕES PODEM

Leia mais

PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO

PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos Carla Fernandes da SILVA 1 ; Clayton Silva MENDES 2. RESUMO A evasão escolar é um dos principais desafios a ser superado

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

SISTEMAS ESPECIALISTAS Inteligência Artificial

SISTEMAS ESPECIALISTAS Inteligência Artificial SISTEMAS ESPECIALISTAS Inteligência Artificial Prof: Saulo Popov Zambiasi Equipe: Palmira Luana Henrique Paulo César Fernandes de Oliveira Rogério Degasperi Sidenio Samuel Quarti INTRODUÇÃO INTRODUÇÃO

Leia mais

Determinação de vícios refrativos oculares utilizando Support Vector Machines

Determinação de vícios refrativos oculares utilizando Support Vector Machines Determinação de vícios refrativos oculares utilizando Support Vector Machines Giampaolo Luiz Libralão, André Ponce de Leon F. de Carvalho, Antonio Valerio Netto, Maria Cristina Ferreira de Oliveira Instituto

Leia mais

Descrição do projeto da metodologia de mapeamento de informações semi-estruturadas em uma representação atributo-valor

Descrição do projeto da metodologia de mapeamento de informações semi-estruturadas em uma representação atributo-valor Descrição do projeto da metodologia de mapeamento de informações semi-estruturadas em uma representação atributo-valor Daniel de Faveri Honorato Everton Alvares Cherman Huei Diana Lee Feng Chung Wu Maria

Leia mais

5 Estudo de Caso e Resultados

5 Estudo de Caso e Resultados 5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos

Leia mais

Proposta de uma Função de Previsão de Dados Temporais para o Algoritmo dos Vizinhos mais Próximos

Proposta de uma Função de Previsão de Dados Temporais para o Algoritmo dos Vizinhos mais Próximos Proposta de uma Função de Previsão de Dados rais para o Algoritmo dos Vizinhos mais Próximos Carlos Andres Ferrero 1,2, Maria Carolina Monard 1, Huei Diana Lee 2, and Wu Feng Chung 2 1 Instituto de Ciências

Leia mais

Inteligência Artificial

Inteligência Artificial Aprendizagem por que? lnteligência Artificial Aprendizagem em IA Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com

Leia mais

Padrões, Modelagem e Neurocomputação

Padrões, Modelagem e Neurocomputação Escola Politécnica Universidade de São Paulo Departamento de Engenharia Elétrica Sistemas Eletrônicos PSI2672 Práticas em Reconhecimento de Padrões, Modelagem e Neurocomputação APRESENTAÇÃO FINAL 21/06/2016

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

Estudo Comparativo de Matrizes de Co-ocorrência em Análise de Imagens Médicas: Diferenciação de Tecidos Cólicos

Estudo Comparativo de Matrizes de Co-ocorrência em Análise de Imagens Médicas: Diferenciação de Tecidos Cólicos Estudo Comparativo de Matrizes de Co-ocorrência em Análise de Imagens Médicas: Diferenciação de Tecidos Cólicos Carlos Andres Ferrero 1,3, Newton Spolaôr 1, Huei Diana Lee 1, Cláudio Saddy Rodrigues Coy

Leia mais

lnteligência Artificial Aprendizagem em IA

lnteligência Artificial Aprendizagem em IA lnteligência Artificial Aprendizagem em IA 1 Aprendizagem por que? Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com

Leia mais

8 Conclusão 8.1 Contribuição

8 Conclusão 8.1 Contribuição 8 Conclusão 8.1 Contribuição O crescente volume e a distribuição de dados e processos em Bioinformática torna cada vez mais fácil as descobertas de novas informações biológicas. Entretanto, como são inúmeras

Leia mais

INTRODUÇÃO A ENGENHARIA DE SOFTWARE

INTRODUÇÃO A ENGENHARIA DE SOFTWARE Universidade Estadual Vale do Acaraú AGENDA INTRODUÇÃO A ENGENHARIA DE SOFTWARE Processos Modelos de Desenvolvimento de Software Engenharia de Requisitos Projeto de Interface com o Usuário Projeto Arquitetural

Leia mais

Acadêmico: Mateus Artur Schneiders Prof. Orientador: Dr. Mauro Marcelo Mattos

Acadêmico: Mateus Artur Schneiders Prof. Orientador: Dr. Mauro Marcelo Mattos Adoção de JBoss Drools no desenvolvimento de sistemas Acadêmico: Mateus Artur Schneiders Prof. Orientador: Dr. Mauro Marcelo Mattos Roteiro da apresentação Introdução Objetivos Fundamentação Teórica Trabalhos

Leia mais

Metodologias para a Seleção de Atributos Relevantes

Metodologias para a Seleção de Atributos Relevantes Metodologias para a Seleção de Atributos Relevantes José Augusto Baranauskas e Maria Carolina Monard Departamento de Computação e Estatística Instituto de Ciências Matemáticas e de Computação - Universidade

Leia mais

Descoberta de conhecimento em redes sociais e bases de dados públicas

Descoberta de conhecimento em redes sociais e bases de dados públicas Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:

Leia mais

Seleção de Atributos para Algoritmos de Aprendizado de Máquina Supervisionado Utilizando como Filtro a Dimensão Fractal

Seleção de Atributos para Algoritmos de Aprendizado de Máquina Supervisionado Utilizando como Filtro a Dimensão Fractal Seleção de Atributos para Algoritmos de Aprendizado de Máquina Supervisionado Utilizando como Filtro a Dimensão Fractal Huei Diana Lee 1 2 Maria Carolina Monard 2 1 Universidade Estadual do Oeste do Paraná

Leia mais

4 Construção dos Classificadores

4 Construção dos Classificadores 4 Construção dos Classificadores 4.1. Modelagem O aprendizado supervisionado contém a etapa de modelagem, nessa etapa definimos quais serão as características encaminhadas ao classificador para o treinamento.

Leia mais

Identifique um número! MINERAÇÃO DE DADOS E TEXTOS MOTIVAÇÃO. Observe a imagem... SCC-230 Inteligência Artificial

Identifique um número! MINERAÇÃO DE DADOS E TEXTOS MOTIVAÇÃO. Observe a imagem... SCC-230 Inteligência Artificial MINERAÇÃO DE DADOS E TEXTOS SCC-230 Inteligência Artificial Solange Oliveira Rezende Bruno Magalhães Nogueira Thiago A. S. Pardo MOTIVAÇÃO Observe a imagem... Identifique um número! 2 1 MOTIVAÇÃO 3 MOTIVAÇÃO

Leia mais