19 Congresso de Iniciação Científica APLICAÇÃO DA LÓGICA NEBULOSA A MODELO DE CONHECIMENTO DO PROCESSO DE MINERAÇÃO DE DADOS

Documentos relacionados
DE BASE DE CONHECIMENTO E MOTOR DE INFERÊNCIA PARA O PROCESSO DE MINERAÇÃO DE DADOS DA FERRAMENTA KIRA

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução

Sistemas Especialistas (SE)

lnteligência Artificial Introdução a Lógica Nebulosa (Fuzzy)

INTELIGÊNCIA COMPUTACIONAL

lnteligência Artificial Introdução a Lógica Nebulosa (Fuzzy)

Modelagem para previsão/estimação: uma aplicação Neuro-Fuzzy

Sistemas Especialistas. Prof. Msc. Jacson Rodrigues

18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

Utilização da Inferência Bayesiana e Lógica Fuzzy na Modelagem de um Sistema Inteligente

Redes Neurais e Sistemas Fuzzy

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

Sistemas Especialistas

IF-705 Automação Inteligente Sistemas de Controle - Fundamentos

Lógica Fuzzy. Angelo Batista Neves Júnior Bruno Luan de Sousa Kelly de Paiva Soares

INTELIGÊNCIA ARTIFICIAL

Sistema de Inferência Fuzzy baseado em Redes Adaptativas (ANFIS) Sistema de Inferência Fuzzy

PIPCA - Programa Interdisciplinar de Pós-Graduação Mestrado em Computação Aplicada da UNISINOS. 2003/1-2o. Trimestre - AULA 0 (Introdução) / FSO

Como as aplicações de entretenimento (em especial jogos digitais) têm enfrentado um constante crescimento, tanto em tamanho quanto em complexidade,

Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO

Universidade Estadual do Oeste do Paraná Curso de Bacharelado em Ciência da Computação. Inteligência Artificial. Lógica Fuzzy Aula II

INTELIGÊNCIA ARTIFICIAL

Introdução. A Inteligência Artificial (IA) vem sendo desenvolvida desde o século passado.

SISTEMAS NEURO-FUZZY NEURAL-FUZZY SYSTEMS

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

Introdução aos Sistemas Especialistas. Professor Celso A A Kaestner, Dr. Eng.

Inteligência Artificial Escola de Verão Laboratório Associado de Computação e Matemática Aplicada LAC.

Fabrício Jailson Barth BandTec

INF 1771 Inteligência Artificial

Implementação de um Controlador Fuzzy para um Sistema de Controle de Nível

Joana Simon Orientador: Prof. Oscar Dalfovo, Doutor

SBC - Sistemas Baseados em Conhecimento

Sistemas especialistas Fuzzy

Paradigma Simbólico. Sistemas de Informação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 2)

8.1 Principais Resultados

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias

Introdução a Inteligência Artificial

Inteligência Artificial. Conceitos Gerais

LÓGICA FUZZY (difusa ou nebulosa) Adão de Melo Neto

CLASSIFICAÇÃO DE OVINOS PARA O ABATE COM A UTILIZAÇÃO DE LÓGICA FUZZY RESUMO INTRODUÇÃO

Comparativo de Ferramentas para Sistemas Especialistas Aline Rassweiller de Souza

As principais contribuições do presente trabalho são as seguintes:

Geração Automática de Sistemas Nebulosos por Co-Evolução

CONTEÚDO LÓGICA NEBULOSA INTRODUÇÃO INTRODUÇÃO. Lógica Procura modelar o raciocínio. Lógica. Marley Maria B.R. Vellasco

Sobre o Artigo. Searle, John, R. (1980). Minds, brains and programs. Behavioral and Brain Sciences 3(3):

MODELAGEM DE SISTEMAS. Introdução a Computação e Engenharia de Software. Profa. Cynthia Pinheiro

PROTÓTIPO DE UM CONTROLADOR DE TEMPERATURA BASEADO EM LÓGICA FUZZY UTILIZANDO UM MICRONTROLADOR

Aula 6 TECNOLOGIA EM JOGOS DIGITAIS INTELIGÊNCIA ARTIFICIAL PARA JOGOS. Marcelo Henrique dos Santos

Modelos Evolucionários e Tratamento de Incertezas

Clusterização de uma Base de Dados Médica pelo Algoritmo Gustafson-Kessel

CC-226 Introdução à Análise de Padrões

KDD, Mineração de Dados e Algoritmo Apriori

LAB3 Controle nebuloso (VERSÃO PROVISÓRIA)

Inteligência Artificial. Prof. Ilaim Costa Jr.

2

APLICAÇÃO DE LÓGICA FUZZY PARA AVALIAÇÃO DE CURSOS SUPERIORES COM BASE NOS CONCEITOS CPC E IGC

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini /

Inteligência Artificial

Aula 01 Conceito de Banco de Dados e SGBD

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ DEPARTAMENTO ACADÊMICO DE CIÊNCIA DA COMPUTAÇÃO CURSO DE BACHARELADO EM CIÊNCIA DA COMPUTAÇÃO

Inteligência Artificial. Aula 1 Prof. Nayat Sánchez Pi

Sistemas de Informação e Decisão. Douglas Farias Cordeiro

Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO

Lógica Nebulosa. Lógica Fuzzy

2 Fluxos no Ciclo de Vida do Processo Unificado. O Processo Unificado consiste da repetição de uma série de ciclos durante a vida de um sistema.

SOFTWARE BASEADO EM REGRAS FUZZY PARA AVALIAÇÃO DA VITALIDADE DA ORQUÍDEA CATASETUM FIMBRIATUM

Um Middleware de Inteligência Artificial para Jogos Digitais 105

Lógica dos Conjuntos Difusos (Fuzzy Sets)

Um Algoritmo Genético com Aprendizado por Reforço Simples aplicado ao problema do Mundo de Grid

Teoria dos conjuntos difusos

Desenvolvimento de uma Abordagem Híbrida Difuso-Probabilística para a Modelagem de Incerteza

Rogério Vargas. Pelotas, 29 de Fevereiro de Rogério Vargas PPGInf / Universidade Católica de Pelotas slide 1

ENGENHARIA DE SOFTWARE

Inteligência Artificial

Fuzzy Logic. (Lógica Difusa) Adriano Zanette Eduardo Aquiles Radanovitsck William Wolmann Gonçalves

SISTEMA ESPECIALISTA NEBULOSO (MINICURSO) Luiz Biondi Neto Pedro Henrique Gouvêa Coelho Jorge Luís Machado do Amaral Maria Helena C.

5 Conclusão e trabalhos futuros

DATA MINING. Prof. Fulvio Cristofoli. Mineração De Dados.

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Professor Emiliano S. Monteiro

Incertezas na Computação Científica: Abordagens via Matemática Intervalar e Teoria Fuzzy

Técnicas de Inteligência Artificial

Padrões Semânticos e Adaptação

APLICAÇÃO DE ANALISE DE RISCO DE CLIENTE PARA TOMADA DE CRÉDITO UTILIZANDO LÓGICA FUZZY TOOLBOX DO MATLAB. Diogo Mendes.

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO NORTE CAMPUS JOÃO CÂMARA ENGENHARIA DE SOFTWARE

Sistema inteligente para gerenciamento de elevadores prediais.

Em Direção à Formação Otimizada de Grupos para a Aprendizagem Colaborativa

Descoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes

Inteligência Artificial

Acadêmico: Mateus Artur Schneiders Prof. Orientador: Dr. Mauro Marcelo Mattos

3 Técnicas de Previsão de Séries Temporais 3.1. Introdução

Inteligência Artificial. Aula 2

JADEX: A BDI REASONING ENGINE. Alexander Pokahr, Lars Braubach e Winfried Lamersdorf Springer US - Multi-Agent Programming 2005 pp.

Inteligência Artificial

Os pontos mais fortes do MAS-School são: A técnica orientada a objetivos para a fase de requisitos utiliza o processo recursivo de decomposição de um

LÓGICA FUZZY. Adão de Melo Neto

Transcrição:

19 Congresso de Iniciação Científica APLICAÇÃO DA LÓGICA NEBULOSA A MODELO DE CONHECIMENTO DO PROCESSO DE MINERAÇÃO DE DADOS Autor(es) ANDRE DE ANDRADE BINDILATTI Orientador(es) ANDERSON BERGAMO, ANA ESTELA ANTUNES DA SILVA Apoio Financeiro FAPIC/UNIMEP 1. Introdução Os primeiros esforços realizados em pesquisas sobre inteligência artificial (IA) buscaram por desenvolver modelos computacionais para a resolução de problemas de natureza geral; modelos que fossem capazes de reproduzir o processo de inferência necessário para a busca de soluções para problemas genéricos. O trabalho de Allen Newell e Herbert Simon (1959) com o GPS (General Problem Solver) é um exemplo. A busca por modelos de propósito geral se mostrou um desafio difícil de alcançar. Sistemas Especialistas (SEs) surgiram então, como uma nova abordagem nas pesquisas em IA, na qual o foco consistia na modelagem do conhecimento especifico de um domínio para a resolução de problemas inerentes a este. Ao consultar um paciente, um médico utiliza seus conhecimentos sobre medicina para produzir um diagnóstico. Neste processo, sua competência e experiência no desempenho desta tarefa, são empregadas. Conhecimento pertinente a outros domínios são, normalmente, desnecessários na realização dessa atividade específica. Baseados neste principio, SEs são sistemas de computador cuja estratégia para a resolução de problemas referentes a um dado domínio, consiste na tentativa de modelar o conhecimento e heurísticas pertinentes a este, de modo a emular a competência de um especialista humano da área. A arquitetura de um SE é dividida em três componentes principais: uma interface de usuário, responsável pela interação do usuário com a competência modelada pelo sistema; uma base de conhecimento, que armazena uma representação do conhecimento sobre o domínio de interesse; e um mecanismo de inferência, que possui um algoritmo responsável por simular o processo de raciocínio, de modo a proporcionar as respostas do sistema. Com fundamento na lógica nebulosa, SEs podem ser estendidos permitindo o processamento sobre incerteza, imprecisão e por meio do uso de variáveis linguísticas. SEs baseados em lógica nebulosa possuem uma base de conhecimento expressa no formato de regras de inferência nebulosas (fuzzy inferênce rules); regras do tipo Se (condição) Então (consequência).

Uma variável linguística, assim como seu próprio nome sugere, é uma variável que assume valores linguísticos, isto é, uma variável que pode assumir palavras (rótulos) como valor (SILER; BUCKLEY, 2005). Introduzida em 1965 pelo Dr. Lotfi A. Zadeh (ZADEH, 1965), a teoria dos conjuntos nebulosos (do inglês, fuzzy sets theory) consiste em uma teoria sobre conjuntos que define o conceito de pertinência de um dado elemento a um conjunto, por meio de uma função de pertinência ou função característica. Neste trabalho, a lógica nebulosa foi utilizada para representação de conhecimento em um modelo que tem como finalidade fornecer apoio na decisão de qual das tarefas de mineração empregar sobre um determinado conjunto de dados. Conforme Han e Kamber (2006), a mineração de dados é uma das etapas do processo de descoberta de conhecimento em bases de dados, e envolve a escolha e aplicação de algoritmos para a extração de conhecimento ou padrões, implícitos em tais fontes de dados. Existem diversas tarefas de mineração (BERRY; LINOFF, 2004), contudo, este projeto foca na decisão entre as tarefas de associação, classificação e agrupamento. Tarefas de mineração, como mencionado anteriormente, compreendem um conjunto de técnicas e algoritmos para a análise de padrões e extração de conhecimento de conjuntos de dados. Cada tarefa pressupõe um formato sobre os dados de entrada e em geral, produzem como saída, conhecimento expresso de diferentes formas. 2. Objetivos Este trabalho teve como objetivo específico, realizar a aplicação da lógica nebulosa para a modelagem de uma base de conhecimento. Um projeto anteriormente desenvolvido (BINDILATTI, 2010), realizou a implementação de um mecanismo de inferência e de uma base de conhecimento para a ferramenta Kira (MENDES, 2009). O presente trabalho procurou aprimorar tal base de conhecimento, por meio da aplicação da lógica nebulosa em sua modelagem. Além disso, a implementação prática da base de conhecimento e de um mecanismo de inferência baseados na lógica nebulosa, também foram objetivos deste projeto. Os objetivos genéricos foram: O estudo de sistemas especialistas; O estudo da lógica nebulosa como meio para representação do conhecimento; O estudo das principais tarefas de mineração de dados; O estudo de mecanismos de inferência baseados na lógica nebulosa; 3. Desenvolvimento Para o desenvolvimento deste projeto, um levantamento bibliográfico sobre a lógica nebulosa foi realizado com base na literatura disponível. Com os fundamentos teóricos pesquisados, a lógica nebulosa foi utilizada como ferramenta para fornecer uma nova modelagem para a base de conhecimento desenvolvida em um projeto anterior (BINDILATTI, 2010). Regras linguísticas do tipo Se-Então foram utilizadas para a representação do conhecimento. Logo, as variáveis ou fatos relacionados à base de conhecimento foram definidos como variáveis linguísticas e assim, seus respectivos valores são termos linguísticos cujo significado é atribuído por conjuntos nebulosos. Funções de pertinência triangulares e trapezoidais foram utilizadas para a modelagem dos termos linguísticos. Testes e experimentos foram efetuados a fim de encontrar definições adequadas para as funções de pertinência utilizadas para representação dos termos linguísticos, e das regras da base de conhecimento. O modelo de conhecimento foi validado com base em dois contextos de aplicação fornecidos por especialistas do domínio. As respostas fornecidas pelo sistema estão de acordo com as repostas dos especialistas do domínio. Com isso, constatou-se que o modelo

de conhecimento se adéqua para o comprimento dos objetivos estabelecidos para este trabalho. As entradas de dados são feitas por meio da resposta a um questionário. O usuário que interage com a base de conhecimento deve atribuir valores numéricos no intervalo fechado [0,10], de acordo com o quanto o conceito levantado pela questão, se aplica ao contexto do problema do usuário. Três variáveis linguísticas, cada uma referente a uma das tarefas de mineração de dados, associação, classificação e agrupamento, representam as saídas do sistema. Após o processo de defuzzyficação, realizado com o uso do cálculo do centro de massa, saídas numéricas são produzidas, indicando o quanto favorável é a aplicação de cada uma das tarefas. Um programa foi implementado para permitir testes e a avaliação da base de conhecimento. Um framework de classes foi desenvolvido, fornecendo classes para a representação de termos linguísticos, regras de inferência, conjuntos nebulosos e funções de pertinência, além da implementação de um mecanismo de inferência baseado no método Mamdani. Tal framework de classes foi escrito utilizando a linguagem C# e pode ser reutilizado em futuros projetos, podendo ser facilmente estendido para se adaptar a novas necessidades ou possivelmente, para ser utilizado em outros domínios de conhecimento. 4. Resultado e Discussão A fim de atingir os objetivos deste projeto, um estudo sobre a lógica nebulosa foi realizado com o intuito de aplicá-la na representação de conhecimento de uma área específica. A representação de conhecimento consiste na adoção de uma forma sistemática e estruturada que possibilite que o conhecimento necessário para resolução de determinados problemas, possa ser armazenado e processado em sistemas computacionais. Esforços na modelagem de uma base de conhecimento foram realizados anteriormente em um projeto de iniciação cientifica (BINDILATTI, 2010). A referida base de conhecimento possui como domínio de interesse, o conhecimento sobre tarefa de mineração de dados. A finalidade de tal base de conhecimento é oferecer apoio à decisão entre qual das tarefas de mineração de dados, melhor serve aos propósitos daquele que conduz o processo de mineração. Para tal, o conhecimento foi modelado na forma de regras de produção. A modelagem de conhecimento envolve a representação de heurísticas. O conhecimento de um especialista sobre seu domínio de competência é, na maior parte do tempo, oriundo da combinação de conhecimentos a cerca do problema e conhecimento obtido de experiências anteriores no desempenho de tarefas relacionadas. Ao tentar descrever o conhecimento implícito na mente de um especialista, o uso de termos linguísticos é bastante comum, tal como na seguinte expressão: quando a temperatura for alta, ativar o sistema de arrefecimento. O uso de termos imprecisos é frequentemente constatado. Neste aspecto, a lógica nebulosa fornece uma ferramenta com uma boa fundamentação teórica, que permite uma maneira formal de descrição para termos vagos e expressões que possuem graus parciais de confiança, normalmente inerentes aos domínios de interesse modelados durante o processo de engenharia de conhecimento. Portanto, o uso da lógica nebulosa na representação de conhecimento é justificável. Um conjunto de regras de inferência foi elaborado como parte dos resultados obtidos neste trabalho. Quinze regras foram propostas, uma amostra com três destas regras é fornecida a seguir: Se (transações = muito provável) e (Marketing Basket = provável) e (Decisão imediata = provável) e (frequência entre itens = muito provável) Então Associação = muito alto; Se (atributo alvo = parcialmente provável) e (padrões ocultos = parcialmente provável) Então Classificação = médio; Se (atributo alvo = provável) e (semelhança entre os dados = pouco provável) e (atributos numéricos = pouco provável) Então Agrupamento = Baixo;

Um programa foi então implementado para a realização de testes e experimentos. A Figura 1 ilustra a tela de entrada e saída de dados do programa desenvolvido; e a Figura 2 exibe a tela de visualização dos conjuntos nebulosos utilizados para a definição dos termos linguísticos utilizados. Para tal implementação, um framework de classes para a representação de cojuntos nebulosos, funções de pertinência, regras e mecanismo de inferência, foi projetado. A Figura 3 exibe um diagrama de classes que ilustra as principais classes do framework. Como pode ser observado no diagrama da Figura 3, as classes do framework representam conceitos relacionados a sistemas de inferência baseados na lógica nebulosa. Conceitos como funções de pertinência, métodos de inferência e defuzzificação são representados como classes de interface; regras de inferência e conjuntos nebulosos são representadas como classes abstratas. Essa abordagem no projeto do framework é o que permite sua fácil extensão; no caso de necessidades futuras, para implementar novos métodos de inferência, funções de pertinência e etc., basta criar novas classes concretas que implementem as referidas interfaces e classes abstratas. A validação da base de conhecimento foi realizada comparando as respostas obtidas pela ferramenta implementada, com as opiniões de especialistas do domínio sobre dois contextos de aplicação. Três especialistas, que estão vinculados a projetos cujo tema está relacionado com mineração de dados, foram consultados. Dois contextos de aplicação foram fornecidos pelos especialistas. Sobre perspectiva desses contextos, os especialistas responderam às questões e sugeriram quais tarefas de mineração de dados eram esperadas como resposta. As respostas dos especialistas foram semelhantes às respostas fornecidas pelo programa desenvolvido. Infelizmente, não foi possível encontrar um conjunto de dados grande o suficiente para a elaboração de um processo de validação mais completo, o que caracterizou uma das maiores dificuldades encontradas no desenvolvimento deste projeto. Apenas dois contextos de aplicação puderam ser obtidos por meio da colaboração de especialistas do domínio. 5. Considerações Finais Um sistema de inferência baseado em lógica nebulosa atua de forma semelhante a uma função matemática, mapeando um conjunto de variáveis de entrada em um conjunto de valores de saída. Encontrar modelos matemáticos para prever o comportamento de sistemas complexos se trata de uma tarefa de grande dificuldade. Representar o conhecimento de domínio por meio de regras do tipo Se-Então, por outro lado, consiste em uma tarefa mais simples e intuitiva. Com o uso da lógica nebulosa foi possível modelar uma base de conhecimento para apoio na decisão sobre qual tarefa de mineração de dados aplicar sobre um dado problema. Um framework de classes foi implementado para a realização do processo de inferência e representação das regras, conjuntos nebulosos, funções de pertinência, termos linguísticos e etc. Esse framework foi projetado para ser facilmente estendido, permitindo sua adaptação a futuras necessidades ou aplicação a outros domínios de conhecimento. O objetivo deste modelo de conhecimento é permitir que usuários que não detém conhecimento sobre as várias tarefas de mineração, possam mesmo assim, usufruir das vantagens dessa tecnologia. Outro ponto a salientar, é que com o uso da lógica nebulosa na representação de conhecimento, as entradas de dados se tornam mais flexíveis, fazendo com que as respostas ao questionário sobre o problema sejam mais intuitivas. Assim sendo, a aplicação da lógica nebulosa na modelagem de conhecimento, mostrou-se uma interessante abordagem para a implementação de sistemas para apoio em decisões complexas ou pouco estruturadas. Contudo, a falta de metodologias bem estabelecidas para apoio ao processo de aquisição de conhecimento, e para o processo de validação da base de conhecimento, agregam dificuldades na prática dessa abordagem. Oportunamente, trabalhos futuros poderiam buscar por estender os resultados obtidos neste projeto, por meio da pesquisa de arquiteturas híbridas de sistemas inteligentes. Tais arquiteturas possuem a vantagem de realizar uma combinação sinergética de diversas técnicas utilizadas na implementação de sistemas inteligentes, tais como RNAs, algoritmos genéticos e sistemas baseados em

conhecimento, e assim possibilitando a superaração das limitações conhecidas dessas técnicas individuais. Referências Bibliográficas BINDILATTI, A. A.. Implementação de Base de Conhecimento e Motor de Inferência para o Processo de Mineração de Dados da Ferramenta Kira. Relatório de Iniciação Científica. Universidade Metodista de Piracicaba. São Paulo, 2010. BERRY, Michael J. A.; LINOFF, Gordon F.. Data Mining Techniques. Second ed. Canada: Wiley Publishing, 2004. HAN, J.; KAMBER, M. Data Mining - Concepts and Techniques. Second ed. Nova York: Morgan Kaufmann, 2006. NEWELL, A.; SHAW, J.C.; SIMON, H. A.. Report on a general problem-solving program. In Proceedings of the International Conference on Information Processing. Paris: UNESCO House, 1959, Pp. 256-264. MENDES, Eduardo F. Automatização da Técnica de Mineração de Dados Auxiliado por Guias. Dissertação de Mestrado. Universidade Metodista de Piracicaba. Piracicaba. São Paulo, 2009. SILER, W.; BUCKLEY, J. J.. Fuzzy Expert Systems and Fuzzy Reasoning. New Jersey: John Wiley & Sons Inc., 2005. ZADEH, L. A.. Fuzzy Sets: Information and Control. v. 8, p 338-353, 1965. Anexos