Implementação de Taxonomias para Regras de Associação em um Ambiente de Pós-processamento

Tamanho: px
Começar a partir da página:

Download "Implementação de Taxonomias para Regras de Associação em um Ambiente de Pós-processamento"

Transcrição

1 Implementação de Taxonomias para Regras de Associação em um Ambiente de Pós-processamento Marcos Aurélio Domingues Solange Oliveira Rezende Marcos Ferreira de Paula Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Laboratório de Inteligência Computacional LABIC Av. Trabalhador São-Carlense, 400, Cx. Postal São Carlos, SP, Brasil {mad, solange, mfpaula}@icmc.usp.br Resumo: Um dos objetivos do processo de Mineração de Dados é que seus usuários finais possam analisar, compreender e utilizar o conhecimento extraído como apoio para a tomada de decisões. Entretanto, um problema encontrado no final do processo é que muitos dos algoritmos utilizados geram uma enorme quantidade de padrões, dificultando consideravelmente sua análise. Esse problema recebe uma maior ênfase em Regras de Associação, uma vez que essa técnica de Mineração de Dados procura identificar todos os comportamentos intrínsecos do conjunto de dados. Uma abordagem que pode auxiliar a análise de Regras de Associação é o uso de taxonomias na fase de Pós-processamento das regras. Nesse artigo é descrito como o uso de taxonomias no processo de avaliação de Regras de Associação pode eliminar regras redundantes e generalizar conhecimento. Para a utilização de taxonomias no processo de avaliação das regras foi proposto um algoritmo que está sendo implementado no Ambiente para Exploração de Regras RulEE (Rule Exploration Environment). Palavras Chaves: Mineração de Dados, Pós-processamento, Regras de Associação, Taxonomias. 1 Introdução O desenvolvimento de tecnologias para armazenamento de dados tem proporcionado às organizações a capacidade de armazenar informações detalhadas sobre cada transação que efetuam, gerando grandes Bases de Dados. O uso de técnicas de análise de dados, quando aplicadas a grandes Bases de Dados, normalmente não extrapolam a realização de consultas SQL (Structured Query Language) simples, utilização de ferramentas OLAP (Online Analytical Processing) ou mecanismos de visualização de dados. Essas técnicas não permitem que algumas questões importantes no apoio a um processo de tomada de decisão sejam expressas, como por exemplo, as que dependem de conhecimento. Diante da deficiência de análise e compreensão de grandes volumes de dados, diversos estudos têm sido direcionados ao desenvolvimento de tecnologias de extração automática de conhecimento de Bases de Dados. Esse campo de pesquisa é normalmente referenciado na literatura como Mineração de Dados (MD). O processo de MD tem o objetivo de encontrar conhecimento, a partir de grandes conjuntos de dados, para ser utilizado em um sistema inteligente ou como apoio em processos de tomada de decisão. Assim, um requisito importante é que o conhecimento descoberto seja válido, além de compreensível, útil e interessante [5, 13]. Trabalho realizado com o auxílio financeiro da CAPES e FAPESP, Brasil.

2 Embora tenha se tornado necessária a aplicação do processo de MD para extrair conhecimento de dados, sua aplicação pode gerar uma elevada quantidade de padrões, muitos dos quais podem não ser importantes, relevantes ou interessantes para o usuário. Fornecer ao usuário uma grande quantidade de padrões não é produtivo pois, geralmente, ele procura poucos padrões que sejam interessantes. Buscando resolver esse problema, pesquisas em Pós-processamento de conhecimento, principalmente relacionadas com a avaliação da qualidade, interessabilidade, compreensibilidade e visualização do conhecimento extraído, vem sendo realizadas nos últimos anos [4, 8]. Nesse sentido foi desenvolvido e implementado o Ambiente para Exploração de Regras RulEE (Rule Exploration Environment) [12]. Esse ambiente permite, por exemplo, que o usuário avalie regras de classificação, regressão e associação quanto a precisão, compreensibilidade ou interessabilidade. O problema de se gerar grandes quantidades de padrões recebe uma maior ênfase em Regras de Associação (RA), uma das técnicas de MD que recentemente tem despertado grande interesse na área acadêmica e nas organizações [3]. Embora haja um grande entusiasmo com essa técnica, a mesma possui o inconveniente de gerar grande volume de conhecimento no formato de regras, dificultando a análise do conhecimento pelo usuário final. Essa dificuldade também foi constatada utilizando o Ambiente RulEE para análise de RA. Uma abordagem para minimizar o problema da quantidade de padrões extraídos pela técnica de RA é o uso de taxonomias [14, 10, 1]. As taxonomias refletem uma caracterização coletiva ou individual de como os itens podem ser hierarquicamente classificados [1]. Diante desse contexto, nesse artigo é descrito como o uso de taxonomias no processo de avaliação de RA, pode eliminar regras redundantes e generalizar conhecimento, facilitando, dessa maneira, a análise das regras obtidas com relação à compreensibilidade e tamanho do conjunto de regras. Para a utilização de taxonomias no processo de avaliação de RA foi proposto um algoritmo que está sendo implementado no Ambiente RulEE. O artigo está organizado em 5 seções: na seção 2 é apresentada a definição de RA e alguns métodos de Pós-processamento dessa técnica. Na seção 3 é apresentado o Ambiente RulEE. Na seção 4 é descrito como as taxonomias podem ser empregadas na generalização de RA, sendo também proposto um algoritmo para generalizar as regras. Na seção 5 são apresentadas algumas considerações sobre esse artigo. 2 Pós-processamento de Regras de Associação Uma Regra de Associação caracteriza o quanto a presença de um conjunto de itens nos registros de uma Base de Dados implica na presença de algum outro conjunto distinto de itens nos mesmos registros [2]. Desse modo, o objetivo das RA é encontrar tendências que possam ser usadas para entender e explorar padrões de comportamento dos dados. Por exemplo, observando os dados de vendas de um supermercado sabe-se que 80% dos clientes que compram o produto Q também adquirem, na mesma ocasião, o produto W. Nessa regra 80% corresponde a sua confiabilidade. O formato de uma Regra de Associação pode ser representado como uma implicação LHS RHS, em que LHS e RHS são, respectivamente, o lado esquerdo (Left Hand Side) e o lado direito (Right Hand Side) da regra, definidos por conjuntos disjuntos de itens. As RA podem ser definidas como descrito a seguir [2]: Seja D uma Base de Dados composta por um conjunto de itens A = {a 1,..., a m } ordenados lexicograficamente e por um conjunto de transações T = {t 1,..., t n }, na qual cada transação t i T é composta por um conjunto de itens tal que t i A. A Regra de Associação é uma implicação na forma LHS RHS, em que LHS A, RHS A e LHS RHS =. A regra LHS RHS ocorre no conjunto de transações T com confiança conf se em conf% das transações de T em que ocorre LHS ocorre também RHS. A regra LHS RHS tem suporte sup se em sup% das transações em D ocorre LHS RHS. O valor do suporte mede a força da associação entre LHS e RHS, e não relaciona possíveis dependências de RHS com LHS. Por outro lado, a confiança mede a força da implicação lógica descrita pela regra. Usualmente, valores de suporte e confiança mínimos são definidos pelo usuário antes da mineração das RA: a definição de altos valores gera apenas regras triviais, já a definição de baixos valores gera um grande volume de conhecimento no formato de regras, dificultando a análise do usuário. Uma maneira de superar

3 as dificuldades na análise dessas regras é utilizar-se de métodos de Pós-processamento de RA que auxiliem o usuário a identificar conhecimento interessante e útil no grande conjunto de regras geradas. Em [3] são apresentadas quatro atividades que podem ser utilizadas no Pós-processamento de RA: poda, sumarização, agrupamento e visualização das regras. Na atividade de poda, as regras são removidas porque não são interessantes ou são redundantes em relação a alguma característica da própria regra ou a alguma análise estatística, por exemplo. Embora a poda possa reduzir o número de regras descobertas, esse número pode ser ainda muito grande para ser analisado pelo usuário. Na atividade de sumarização, as regras são sumarizadas em conceitos mais gerais ou abstratos, que proporcionam uma maior compreensão pelo usuário. As regras podem ser sumarizadas em vários níveis de abstração, sendo que, esses níveis podem ser definidos utilizando-se taxonomias. Já na atividade de agrupamento as regras podem ser agrupadas em conjuntos de regras, de acordo com alguma característica. Na atividade de visualização é realizada uma exploração visual das regras potencialmente interessantes. Além das atividades citadas, em [9, 1] são apresentadas diversas medidas objetivas que podem ser utilizadas na avaliação de RA com a finalidade de auxiliar o usuário no entendimento e na utilização do conhecimento adquirido. Medidas objetivas são aquelas que para o seu cálculo, dependem apenas da estrutura dos padrões extraídos (regras no formato LHS RHS) e dos dados utilizados no processo de extração. No Pós-processamento de RA há também a possibilidade de incluir subjetividade no processo de análise das regras. Em [10] são apresentadas as seguintes medidas subjetivas: Identificação de Conformidade, Conseqüente Inesperado, Antecedente Inesperado e, Antecedente e Conseqüente Inesperados. As medidas subjetivas permitem que um usuário forneça o seu conhecimento sobre o domínio para que as RA extraídas possam ser classificadas, filtradas, analisadas ou avaliadas em relação a esse conhecimento fornecido. 3 O Ambiente para Exploração de Regras RulEE O processo de MD é iniciado pela aquisição do conhecimento sobre o domínio no qual o processo é executado e pela definição dos objetivos a serem atingidos. No Pré-processamento os dados disponíveis para análise devem ser identificados, agrupados em uma única fonte de dados e processados, tornando-se adequados a aplicação dos algoritmos de extração de padrões. Na etapa de Extração de Padrões devem ser selecionados e executados os algoritmos para a extração de padrões. Em seguida, os padrões extraídos devem ser analisados na etapa de Pós-processamento [13]. O processo de MD não termina após a descoberta dos padrões existentes nos dados. Análises detalhadas do conhecimento são necessárias para efetivamente apoiar os usuários. Assim, conceitos como interessabilidade, compreensibilidade e utilidade devem ser considerados durante a análise das regras. Muita pesquisa tem sido realizada com o objetivo de especificar boas medidas para avaliação de regras, e muitos protótipos têm sido desenvolvidos. No entanto, percebeu-se que não é possível definir uma melhor medida de avaliação de conhecimento em todos os domínios [7]. Somando-se a isso o fato de que as medidas e metodologias normalmente são desenvolvidas independentemente, é muito difícil o desenvolvimento e a utilização de um único sistema para avaliação de regras no qual diversos tipos de análises possam ser realizadas. O desenvolvimento e a implementação do Ambiente RulEE veio suprir essas necessidades e fornecer uma arquitetura para facilitar o armazenamento de regras e do valor das medidas de avaliação das mesmas, além de facilitar a incorporação de novos métodos para o cálculo de novas medidas. A arquitetura geral do Ambiente pode ser visualizada na Figura 1. O ambiente RulEE suporta análises de regras de classificação, regressão e associação, auxiliando o usuário na identificação do conjunto de regras mais interessante. O ambiente per- Figura 1: Arquitetura geral do Ambiente RulEE

4 mite que durante a visualização o usuário possa interativamente escolher filtros para seleção de regras ou métricas para sua ordenação e, dessa maneira, identificar as regras mais interessantes. A existência de diversos tipos de medidas para avaliação também é um aspecto relevante do ambiente, pois diversos tipos de análises podem ser realizadas. Tanto medidas de avaliação objetiva quanto subjetiva estão disponíveis no Ambiente RulEE para seleção e/ou ordenação das regras. A interface do Ambiente RulEE (Figura 2) permite a visualização e a interação com conjuntos de regras, facilitando a compreensão e a interpretação das regras. Essa interface facilita o acesso ao conhecimento disponibilizado, uma vez que se baseia na World Wide Web (WWW), aproveitando algumas de suas vantagens como: independência de plataforma, facilidade de uso e, especialmente, a acessibilidade, permitindo a visualização do conhecimento pelos usuários do processo independentemente de sua localização física [11]. A utilização de uma interface para disponibilização de conhecimento, baseada na WWW, facilitou também a implementação de um ambiente que permite o trabalho colaborativo entre os usuários do processo Figura 2: Interface do Ambiente RulEE de MD. Dessa maneira, os diversos usuários do processo podem analisar e compreender os conjuntos de regras individualmente, além de fornecerem e compartilharem feedback, relacionado ao conhecimento consultado ao ambiente, na forma de comentários, idéias, dicas ou sugestões [6, 11]. 4 Implementação de Taxonomias no Ambiente RulEE As taxonomias permitem realizar uma classificação hierárquica dos itens por meio de uma caracterização coletiva ou individual [1]. Eventualmente, múltiplas taxonomias podem estar presentes, refletindo a existência de diversos pontos de vista ou a possibilidade de classificações distintas para o mesmo conjunto de itens. Na Figura 3 é apresentado um pequeno exemplo de uma taxonomia. Nesse exemplo pode-se verificar que: Camiseta é uma Roupa Leve, Roupa Leve é um tipo de Roupa, Sandália é um tipo de Calçado etc. Uma das razões que torna interessante a aplicação de taxonomias em RA refere-se à geração de regras que utilizem informações contidas nos diversos níveis da taxonomia e não apenas nos níveis inferiores, como ocorre em RA que não se utilizam de taxonomias [2]. Por exemplo, usando a taxonomia apresentada na Figura 3, pode-se inferir uma regra em que pessoas que compram Roupas Leves também compram Sandálias, do fato de pessoas comprarem Camisetas com Sandálias e Bermudas com Sandálias, podendo não haver a necessidade de utilizar as duas últimas regras. Em [14] são apresentados diversos algoritmos para minerar RA utilizando taxonomias. Entretanto, esses algoritmos geram um volume muito grande de regras, uma vez que são geradas todas as regras possíveis com e sem as taxonomias. Para resolver esse problema, [14] propõe o uso de uma medida de interesse durante o processo de mineração das regras utilizando taxonomias. Essa medida é utilizada como um valor limitador, removendo as regras que não são interessantes em relação a medida. Figura 3: Exemplo de uma taxonomia para vestuário Entretanto, como o valor da medida de interesse é definido pelo usuário do processo, a escolha de baixos valores pode ocasionar a geração de um grande volume de RA.

5 Uma outra maneira de generalizar RA consiste no uso de taxonomias no Pós-processamento das regras geradas. Analisando-se a estrutura das regras geradas pelos algoritmos de mineração de RA sem taxonomias é possível verificar que as regras possuem determinados comportamentos, os quais, permitem que as mesmas possam ser generalizadas utilizando-se taxonomias. Esse fato é ilustrado nas Figuras 4 e 5. Note que, para a generalização das regras, se faz necessário que o número de regras candidatas a uma generalização seja igual ao valor da multiplicação do número de itens terminais presente em cada taxonomia. Figura 4: Generalização usando uma taxonomia Figura 5: Generalização usando duas taxonomias A partir dessa constatação foi desenvolvido um algoritmo que possibilita a generalização de RA. Esse algoritmo tem como entrada: um Conjunto de RA (gerado, por exemplo, pelos algoritmos apresentados em [2]) especificadas na sintaxe padrão usada pelo Ambiente RulEE, um Conjunto de Taxonomias (definido pelo usuário) e a Base de Dados utilizada na mineração do Conjunto de RA. Os principais passos propostos para a generalização de RA são apresentados no Algoritmo 1. Algoritmo 1 Generalização de Regras de Associação Requisito: Conjunto de RA, Conjunto de Taxonomias e Base de Dados. 1: para cada Taxonomia do Conjunto de Taxonomias faça 2: para cada regra do Conjunto de RA, em que apenas um item 1 pode ser generalizado faça 3: Substituir o item da regra por um item mais geral contido na Taxonomia, se houver uma relação ancestral/descendente entre os itens ; 4: fim para 5: Remover as regras repetidas do Conjunto de RA, mantendo apenas uma representação de cada regra ; 6: fim para 7: para cada regra generalizada faça 8: Calcular o seu suporte e a sua confiança ; 9: fim para O cálculo do suporte para um item a j generalizado por uma taxonomia é definido em [1] como sup(a j ) = sup(des(a j )), em que des(a j ) é o conjunto de descendentes mais próximos de a j. Essa definição pode ser expandida e utilizada para calcular o suporte e a confiança de uma RA generalizada. 5 Considerações Finais Nesse artigo foi descrito como o uso de taxonomias no processo de avaliação de RA pode eliminar regras redundantes e generalizar conhecimento, facilitando, dessa maneira, a análise das regras obtidas com relação à compreensibilidade e tamanho do conjunto de regras. A proposta do uso de taxonomias para generalizar RA resultou no desenvolvimento de um algoritmo que está sendo implementado no Ambiente RulEE. Um aspecto 1 Em uma taxonomia os itens são relacionados por disjunções (ou) e em RA os itens são relacionados por conjunções (e). A generalização de 2 ou mais itens por taxonomia resultaria na troca de conjunções por disjunções, induzindo um conhecimento inexistente. Assim, apenas 1 item da regra deve ser generalizado para cada taxonomia.

6 relevante com relação a esse ambiente é a disponibilização de bases de regras e valores de medidas. Pode-se observar pela disponibilização de diversos tipos de medidas e pela utilização de consultas, que o ambiente RulEE se apresenta como uma importante ferramenta para auxiliar seus usuários na análise, compreensão e utilização das regras disponibilizadas em processos de tomada de decisão. Ao término da implementação do algoritmo de generalização de RA pretende-se realizar vários experimentos utilizando-se de Bases de Dados reais e artificiais, buscando comprovar a eficiência do algoritmo proposto com relação a redução de grandes volumes de RA. Referências [1] Jean-Marc Adamo. Data Mining for Association Rules and Sequential Patterns. Springer-Verlag, New York, NY, [2] Rakesh Agrawal and Ramakrishnan Srikant. Fast algorithms for mining association rules. In Jorge B. Bocca, Matthias Jarke, and Carlo Zaniolo, editors, Proc. 20th Int. Conf. Very Large Data Bases, VLDB, pages , [3] Bart Baesens, Stijn Viaene, and Jan Vanthienen. Post-processing of association rules. In Proc. of the Special Workshop on Post-Processing. The Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pages 2 8, [4] Ivan Bruha and A. Famili. Postprocessing in machine learning and data mining. ACM SIGKDD Explorations Newsletter, 2(2): , [5] U. M. Fayyad, G. Piatetsky-Shapiro, and P. Smyth. The KDD process for extracting useful knowledge from volumes of data. Communications of the ACM, 39(11):27 34, [6] M. Foster and A. G. Gee. The data visualization environment. In U. Fayyad, G. G. Grinstein, and A. Wierse, editors, Information Visualization in Data Mining and Knowledge Discovery, pages Morgan Kaufmann Publishers, [7] Alex A. Freitas. A multi-criteria approach for the evaluation of rule interestingness. In Proceedings of the International Conference on Data Mining, pages 7 20, Rio de Janeiro, RJ, [8] Alipio Jorge, João Poças, and Paulo Azevedo. A post processing environment for browsing large sets of association rules. In Proceedings of IDDM 02, workshop on integration aspects of decision support and data mining, Helsinki, [9] N. Lavrač, P. Flach, and R. Zupan. Rule evaluation measures: A unifying view. In S. Dzeroski and P. Flach, editors, Proceedings of the Ninth International Workshop on Inductive Logic Programming (ILP-99), volume 1634, pages Springer-Verlag, LNAI. [10] Bing Liu, Wynne Hsu, Shu Chen, and Yiming Ma. Analyzing the subjective interestingness of association rules. IEEE Intelligent Systems & their Applications, 15(5):47 55, [11] Y. Ma, C. K. Wong, and B. Liu. Effective browsing of the discovered association rules using the web. ACM SIGKDD-2000 workshop on Post-Processing in Machine Learning and Data Mining, [12] Marcos Ferreira Paula. Ambiente para exploração de regras, Dissertação de Mestrado, Instituto de Ciências Matemáticas e de Computação - Universidade de São Paulo, São Carlos, SP - Brasil. [13] S. O. Rezende, J. B. Pugliesi, E. A. Melanda, and M. F. Paula. Mineração de dados. In S. O. Rezende, editor, Sistemas Inteligentes: Fundamentos e Aplicações, volume 1, pages Barueri, SP: Editora Manole, [14] Ramakrishnan Srikant and Rakesh Agrawal. Mining generalized association rules. Future Generation Computer Systems, 13(2 3): , 1997.

UNIVERSIDADE DE SÃO PAULO

UNIVERSIDADE DE SÃO PAULO UNIVERSIDADE DE SÃO PAULO Instituto de Ciências Matemáticas e de Computação ISSN 0103-2569 Descrição de um Algoritmo para Generalização de Regras de Associação Marcos Aurélio Domingues Solange Oliveira

Leia mais

UNIVERSIDADE DE SÃO PAULO

UNIVERSIDADE DE SÃO PAULO UNIVERSIDADE DE SÃO PAULO Instituto de Ciências Matemáticas e de Computação ISSN 0103-2569 AprioriGen: Uma extensão do algoritmo Apriori para obtenção de Regras de Associação Generalizadas André Roberto

Leia mais

Um Ambiente para Exploração de Regras de Associação Generalizadas

Um Ambiente para Exploração de Regras de Associação Generalizadas Um Ambiente para Exploração de Regras de Associação Generalizadas Marcos A. Domingues 1, Matheus G. B. Figueiredo 2, Solange O. Rezende 3 1 Laboratório de Inteligência Artificial e Ciência de Computadores

Leia mais

SBC - Sistemas Baseados em Conhecimento

SBC - Sistemas Baseados em Conhecimento Siglas, Símbolos, Abreviaturas DW - Data Warehouse KDD Knowledge Discovery in Database MD Mineração de Dados OLAP - On-line analytical processing SBC - Sistemas Baseados em Conhecimento 1. INTRODUÇÃO O

Leia mais

18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica TRATAMENTO DE REGRAS DA ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) JONAS RAFAEL ONOFRE Orientador(es) MARINA TERESA PIRES VIEIRA

Leia mais

KDD, Mineração de Dados e Algoritmo Apriori

KDD, Mineração de Dados e Algoritmo Apriori Universidade Federal de São Carlos - UFSCar Departamento de Computação - DC Programa de Pós-Graduação em Ciência da Computação - PPGCC KDD, Mineração de Dados e Algoritmo Apriori Aluno: Rodrigo Moura J.

Leia mais

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017

Tópicos Especiais em Informática Fatec Indaiatuba 13/07/2017 Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas

Leia mais

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS 6ª Jornada Científica e Tecnológica e 3º Simpósio de Pós-Graduação do IFSULDEMINAS 04 e 05 de novembro de 2014, Pouso Alegre/MG Implementação de um Modelo para Previsão de Evasão Escolar no IFSULDEMINAS

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto O processo de descoberta do conhecimento - KDD Roteiro Introdução Definição Etapas Desafios

Leia mais

RELATÓRIOS TÉCNICOS DO ICMC

RELATÓRIOS TÉCNICOS DO ICMC Instituto de Ciências Matemáticas e de Computação ISSN - 0103-2569 DESCRIÇÃO DO MÓDULO DE EXPLORAÇÃO DE REGRAS DE ASSOCIAÇÃO GENERALIZADAS RULEE-RAG MAGALY LIKA FUJIMOTO VERÔNICA OLIVEIRA DE CARVALHO SOLANGE

Leia mais

ANALYTICS: Dados e Atenção

ANALYTICS: Dados e Atenção ANALYTICS: Dados e Atenção O CONCEITO DE ANALYTICS NA INTERNET DAS COISAS BASEIA-SE NA CONSTANTE GERAÇÃO DE DADOS Por Nazareno Andrade Deyvison Bruno, Icaro Ramires, Joabe Pinheiro 1 Agenda Informações

Leia mais

Extração de associações entre itens de um portfólio de tecnologias agrícolas

Extração de associações entre itens de um portfólio de tecnologias agrícolas 78 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Extração de associações entre itens de um portfólio de tecnologias agrícolas Luisa Miyashiro Tápias¹ Maria Fernanda Moura² Stanley Robson

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt CARACTERIZAÇÃO ÁREAS DE ORIGEM

Leia mais

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA

18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA 18º Congresso de Iniciação Científica INCORPORAÇÃO DA TAREFA DE CLASSIFICAÇÃO NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio

Leia mais

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos

Leia mais

Mineração de Textos na Web

Mineração de Textos na Web Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na

Leia mais

O uso da Mineração de Dados na Web aplicado a um Ambiente de Ensino a Distância

O uso da Mineração de Dados na Web aplicado a um Ambiente de Ensino a Distância O uso da Mineração de Dados na Web aplicado a um Ambiente de Ensino a Distância Leticia dos Santos Machado PPGCC-FACIN-PUCRS Av. Ipiranga, 6681 Prédio 16 Porto Alegre - Brasil lmachado@inf.pucrs.br Karin

Leia mais

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução

Autor(es) HARLEI MIGUEL DE ARRUDA LEITE. Orientador(es) MARINA TERESA PIRES VIEIRA. Apoio Financeiro PIBIC/CNPQ. 1. Introdução 19 Congresso de Iniciação Científica IMPLEMENTAÇÃO DE GUIAS E ALGORITMOS PARA REGRAS DE ASSOCIAÇÃO MULTIRELACIONAL NA FERRAMENTA DE MINERAÇÃO DE DADOS KIRA Autor(es) HARLEI MIGUEL DE ARRUDA LEITE Orientador(es)

Leia mais

Pós-processamento de Regras de Associação. Edson Augusto Melanda

Pós-processamento de Regras de Associação. Edson Augusto Melanda Pós-processamento de Regras de Associação Edson Augusto Melanda Draft impresso em 31 de janeiro de 2005 SERVIÇO DE PÓS-GRADUAÇÃO DO ICMC-USP Data de Depósito: //2004 Assinatura: Pós-processamento de Regras

Leia mais

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA

19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA 19 Congresso de Iniciação Científica INCLUSÃO DE UM NOVO ALGORITMO DE CLASSIFICAÇÃO NA FERRAMENTA KIRA Autor(es) MIRELA TEIXEIRA CAZZOLATO Orientador(es) MARINA TERESA PIRES VIEIRA Apoio Financeiro PIBIC/CNPQ

Leia mais

Data Mining. O Processo de KDD. Mauricio Reis

Data Mining. O Processo de KDD. Mauricio Reis 1 Data Mining O Processo de KDD Mauricio Reis prof_uva@mreis.info http://mreis.info/uva-2016-9-datamining 2 ROTEIRO 1. Definição 2. Aplicação KDD problema recursos resultados 3. Área de origem 4. Histórico

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular Análise de associação Principais tópicos Análise de associação Itens frequentes Conjunto de itens frequentes de associação Avaliação de regras de associação Docente:

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas

Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas Ontologias Como Apoio Ao Mapeamento De Laudos Médicos De Endoscopia Digestiva Alta Para Bases De Dados Estruturadas Luiz Henrique Dutra da Costa (PIBIC/Unioeste), Carlos Andres Ferrero, Cláudio Saddy Rodrigues

Leia mais

Alternativas para construção de classificadores de solos brasileiros

Alternativas para construção de classificadores de solos brasileiros 48 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Alternativas para construção de classificadores de solos brasileiros Matheus Agostini Ferraciolli¹ Luiz Manoel Silva Cunha² Resumo: Este

Leia mais

AMBIENTE PARA APLICAÇÃO DAS TÉCNICAS DE MINERAÇÃO DE DADOS - SURVEYS DE GALÁXIAS

AMBIENTE PARA APLICAÇÃO DAS TÉCNICAS DE MINERAÇÃO DE DADOS - SURVEYS DE GALÁXIAS AMBIENTE PARA APLICAÇÃO DAS TÉCNICAS DE MINERAÇÃO DE DADOS - SURVEYS DE GALÁXIAS Thiago Crestani 1 ; Fábio José Rodrigues Pinheiro 2 ; Fábio Rafael Herpich³; Fernando José Braz 4 ; Marcelo Massocco Cendron

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 5) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas

Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas Utilização da Indexação Automática para Auxílio à Construção de uma Base de Dados para a Extração de Conhecimento aplicada à Doenças Pépticas Daniel de F. Honorato 1, Huei D. Lee 1, Renato B. Machado 1,4,

Leia mais

O uso da Inteligência Articial no auxílio à tomada de decisões para alocação dinâmica de recursos. F. C. Xavier

O uso da Inteligência Articial no auxílio à tomada de decisões para alocação dinâmica de recursos. F. C. Xavier O uso da Inteligência Articial no auxílio à tomada de decisões para alocação dinâmica de recursos F. C. Xavier Technical Report - RT-INF_001-11 - Relatório Técnico June - 2011 - Junho The contents of this

Leia mais

Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas

Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas Aplicação de Regras de Associação para Mineração de Dados em uma Empresa do Setor Varejista Visando Auxiliar na Gestão de Vendas Mateus Luiz Gamba 1, Giana da Silva Bernardino 2 1 Universidade Federal

Leia mais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais

Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais Universidade de São Paulo Biblioteca Digital da Produção Intelectual - BDPI Departamento de Ciências de Computação - ICMC/SCC Comunicações em Eventos - ICMC/SCC 2015 Identificação de Pontos Perceptualmente

Leia mais

Mineração de Dados - Contextualização. Fonte: Prof. Fabrício J. Barth -

Mineração de Dados - Contextualização. Fonte: Prof. Fabrício J. Barth - Mineração de Dados - Contextualização Fonte: Prof. Fabrício J. Barth - http://fbarth.net.br/ Mineração de Dados - Contextualização Uso da informação Síntese do conhecimento; Manter, disseminar, organizar,

Leia mais

Identificação em Documentos

Identificação em Documentos Identificação de Contexto Geográfico em Documentos Marcos Henrique Fonseca Ribeiro Bancos de Dados Geográficos Marcos Henrique Fonseca Ribeiro Slide 1 Roteiro Motivação e contexto Cenários a serem explorados

Leia mais

Uma Metodologia para Auxiliar no Processo de Construção de Bases de Dados Estruturadas a partir de Laudos Médicos

Uma Metodologia para Auxiliar no Processo de Construção de Bases de Dados Estruturadas a partir de Laudos Médicos Uma Metodologia para Auxiliar no Processo de Construção de Bases de Dados Estruturadas a partir de Laudos Médicos Daniel de Faveri Honorato 1,4, Huei Diana Lee 1,2, Maria Carolina Monard 2, Feng Chung

Leia mais

Minerando regras de associação

Minerando regras de associação Minerando regras de associação Proposto por Rakesh Agrawal em 1993. É o modelo de mineração de dados mais estudado pela comunidade de banco de dados. Utiliza dados categóricos. Não há bons algoritmos para

Leia mais

Estudo de Caso. Índice. Descrição da Área. Daniel Gomes Dosualdo Solange Oliveira Rezende

Estudo de Caso. Índice. Descrição da Área. Daniel Gomes Dosualdo Solange Oliveira Rezende Estudo de Caso Daniel Gomes Dosualdo Solange Oliveira Rezende Índice Descrição da Área Identificação do Problema Descrição do Conjunto de Dados Pré-Processamento Extração de Padrões Pós-Processamento Disponibilização

Leia mais

Desenvolvimento de Sistemas de Extração de Informações para Ambientes Colaborativos na Web

Desenvolvimento de Sistemas de Extração de Informações para Ambientes Colaborativos na Web Desenvolvimento de Sistemas de Extração de Informações para Ambientes Colaborativos na Web Douglas Nogueira 1, Vladia Pinheiro 2, Vasco Furtado 1, Tarcisio Pequeno 1 1 Mestrado em Informática Aplicada

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Descoberta de Conhecimento em Bases de Dados Mineração de Dados Descobertas de regras de associação Descoberta de Conhecimento em Bases de Dados DCBD (Descoberta de Conhecimento

Leia mais

MiRABIT: Um Novo Algoritmo para Mineração de Regras de Associação

MiRABIT: Um Novo Algoritmo para Mineração de Regras de Associação MiRABIT: Um Novo Algoritmo para Mineração de Regras de Associação Sandro da Silva Camargo Universidade da Região da Campanha (URCAMP) 96.400-101 Bagé RS Brasil scamargo@urcamp.tche.br Paulo Martins Engel

Leia mais

MINERAÇÃO DE DADOS E PÓS-PROCESSAMENTO EM PADRÕES DESCOBERTOS DATA MINING AND POS-PROCESSING IN PATTERNS DISCOVERABLE

MINERAÇÃO DE DADOS E PÓS-PROCESSAMENTO EM PADRÕES DESCOBERTOS DATA MINING AND POS-PROCESSING IN PATTERNS DISCOVERABLE CDD: 005 MINERAÇÃO DE DADOS E PÓS-PROCESSAMENTO EM PADRÕES DESCOBERTOS DATA MINING AND POS-PROCESSING IN PATTERNS DISCOVERABLE Leonardo Aparecido de Almeida Calil 1, Deborah Ribeiro Carvalho 1,2, Celso

Leia mais

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS

7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS 7 Congresso de Pós-Graduação MODELAGEM DE BASE DE CONHECIMENTO PARA TAREFA DE CLASSIFICAÇÃO EM MINERAÇÃO DE DADOS Autor(es) LIDIA MARTINS DA SILVA Orientador(es) ANA ESTELA ANTUNES DA SILVA 1. Introdução

Leia mais

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias

DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2

Leia mais

Caracterização de Imagens via Redes Neurais Artificiais

Caracterização de Imagens via Redes Neurais Artificiais Caracterização de Imagens via Redes Neurais Artificiais Autor: Eduardo Ferreira Ribeiro 1, Orientadora: Celia Zorzo Barcelos 1 1 Programa de Pós-Graduação em Ciência da Computação Universidade Federal

Leia mais

Grupode Inteligência Computacional

Grupode Inteligência Computacional XII Simpósio de Teses e Dissertações Programa de Pós-Graduação em Ciências de Computação e Matemática Computacional Grupode Inteligência Computacional Instituto de Ciências Matemáticas e de Computação

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO 5ª Jornada Científica e Tecnológica e 2º Simpósio de Pós-Graduação do IFSULDEMINAS 06 a 09 de novembro de 2013, Inconfidentes/MG MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO

Leia mais

BCC390 - Monografia I

BCC390 - Monografia I BCC390 - Monografia I DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO Rafael Belini Souza November 9, 2012 Tópicos 1 Introdução 2 Justificativa 3 Objetivo 4 Fontes 5 Pré-processamento

Leia mais

Mineração de Dados Aplicada no Contexto Educacional

Mineração de Dados Aplicada no Contexto Educacional Giana da Silva Bernardino ¹ e Alexandre Leopoldo Gonçalves Universidade Federal de Santa Catarina ¹gianagsb@gmail.com RESUMO Este trabalho faz uso da mineração de dados com o objetivo de encontrar informações

Leia mais

PROCESSAMENTO DE TEXTO

PROCESSAMENTO DE TEXTO PROCESSAMENTO DE TEXTO (TEXT MINING) Jorge Teixeira IART 2014/2015 SAPO LABS ( http://labs.sapo.pt ) AGENDA (Enquadramento na UC de Inteligência Artificial - IART) Parte 1: Introdução à Linguagem Natural

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS O Processo de KDD: Visão Geral Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário

Roteiro. PCC142 / BCC444 - Mineração de Dados. Cenário Roteiro PCC142 / BCC444 - Mineração de Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Tarefas

Leia mais

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro

TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro TCE Informática Pré-Processamento de Dados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática PRÉ-PROCESSAMENTO DE DADOS EM DATA MINING Técnicas de pré-processamento e transformação de dados

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com Coleta de dados em vários

Leia mais

Evandro Deliberal Aula 01

Evandro Deliberal     Aula 01 Evandro Deliberal evandro@deljoe.com.br https://www.linkedin.com/in/evandrodeliberal http://www.deljoe.com.br/professor Aula 01 Agenda DATA MINING. Data mining Motivações Grande disponibilidade de dados

Leia mais

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC Uma Solução para o GISSA: Análise Comparativa entre Algoritmos de Aprendizagem de Máquina Aplicados em um Dataset Relacionado ao Óbito Infantil Joyce Quintino Alves (1) ; Cristiano Lima da Silva (2); Antônio

Leia mais

Mineração de Dados. Eduardo Raul Hruschka. Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio

Mineração de Dados. Eduardo Raul Hruschka. Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio Mineração de Dados Eduardo Raul Hruschka Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio http://www.kdnuggets.com Visão Geral: Introdução: motivação, aplicações, conceitos básicos. Agrupamento

Leia mais

Pesquisa e Extração de Informação de Grupos de Discussão na Web

Pesquisa e Extração de Informação de Grupos de Discussão na Web Pesquisa e Extração de Informação de Grupos de Discussão na Web Apresentação da Dissertação Jorge Miguel Amado Moreira Orientadores: Prof. Doutora Eduarda Mendes Rodrigues, FEUP Eng.º. Cláudio Barradas,

Leia mais

Uma ferramenta para expansão do vocabulário com base em coocorrência

Uma ferramenta para expansão do vocabulário com base em coocorrência Resumos Expandidos: XI Mostra de Estagiários e Bolsistas... 11 Uma ferramenta para expansão do vocabulário com base em coocorrência Exupério Lédo Silva Júnior 1 Roberta Akemi Sinoara 2 Solange Oliveira

Leia mais

Avaliação de atividades de programação submetidas em MOOC com emprego de técnicas de visualização

Avaliação de atividades de programação submetidas em MOOC com emprego de técnicas de visualização III Workshop de Ensino em Pensamento Computacional, Algoritmos e Programação VI Congresso Brasileiro de Informática na Educação Avaliação de atividades de programação submetidas em MOOC com emprego de

Leia mais

Universidade Federal de Pernambuco

Universidade Federal de Pernambuco Universidade Federal de Pernambuco Graduação em Engenharia da Computação Centro de Informática Análise de Comportamento de Sistemas DASH com Teoria de Controle em Redes 3G Aluno: Daniel Bezerra { db@cin.ufpe.br

Leia mais

B A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A

B A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A Mineração de Dados Espaciais B A N C O D E D A D O S G E O G R Á F I C O S M A R C O N I D E A R R U D A P E R E I R A Roteiro 2 Introdução Mineração de Dados Estado da Arte Artigo apresentado Conclusão

Leia mais

MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB

MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB MINERAÇÃO DE DADOS EM ARQUIVOS DE LOG GERADOS POR SERVIDORES DE PÁGINAS WEB Acadêmico: Leonardo José Correia Orientador: Prof. Ricardo Alencar Azambuja Blumenau, Julho/2004 1 Roteiro Introdução Objetivo

Leia mais

Exemplo: vendas casadas Sei que quem compra A também compra B. Mineração de Dados. Técnicas de Associação. prof. Luis Otavio Alvares

Exemplo: vendas casadas Sei que quem compra A também compra B. Mineração de Dados. Técnicas de Associação. prof. Luis Otavio Alvares Mineração de Dados Técnicas de Associação Exemplo: vendas casadas Sei que quem compra A também compra B. Apresentação adaptada do material do livro: Introduction to Data Mining Tan, Steinbach e Kumar PRODUTO

Leia mais

Conceitos Básicos. Fundação Centro de Análise, Pesquisa e Inovação Tecnológica Instituto de Ensino Superior - FUCAPI. Disciplina: Banco de Dados

Conceitos Básicos. Fundação Centro de Análise, Pesquisa e Inovação Tecnológica Instituto de Ensino Superior - FUCAPI. Disciplina: Banco de Dados Fundação Centro de Análise, Pesquisa e Inovação Tecnológica Instituto de Ensino Superior - FUCAPI Conceitos Básicos Disciplina: Banco de Dados Prof: Márcio Palheta, Esp Manaus - AM ROTEIRO Introdução Dados

Leia mais

Webmedia 06 Diego Fiori de Carvalho Júlio Cézar Estrella Renata Pontin de Mattos Fortes Rudinei Goularte

Webmedia 06 Diego Fiori de Carvalho Júlio Cézar Estrella Renata Pontin de Mattos Fortes Rudinei Goularte Interoperabilidade XML com Web Services para modelo de arquitetura em Sistemas de Informação Geográfico Webmedia 06 Diego Fiori de Carvalho Júlio Cézar Estrella Renata Pontin de Mattos Fortes Rudinei Goularte

Leia mais

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados 2 Mineração de Dados 2 Mineração de Dados A mineração de dados, ou data mining, é uma das principais etapas do processo de busca de conhecimento. Este conceito é utilizado para identificar técnicas avançadas

Leia mais

CC-226 Introdução à Análise de Padrões

CC-226 Introdução à Análise de Padrões CC-226 Introdução à Análise de Padrões Apresentação do Curso Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 25 de fevereiro de 2008 C. H. Q. Forster

Leia mais

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO

UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO Sistema de Sumarização Automática de Textos Baseado em Classes de Documentos PROPOSTA DE TRABALHO DE GRADUAÇÃO

Leia mais

UNIVERSIDADE DE SÃO PAULO

UNIVERSIDADE DE SÃO PAULO UNIVERSIDADE DE SÃO PAULO Instituto de Ciências Matemáticas e de Computação ISSN 0103-2569 Matriz de Contingência para Regras de Regressão Jaqueline Brigladori Pugliesi Solange Oliveira Rezende N ō 210

Leia mais

Extração de conhecimento em banco de dados geográficos

Extração de conhecimento em banco de dados geográficos Nara Martini Bigolin* 1. Introdução O processo de descoberta do conhecimento visa extrair modelos e informações implícitas a partir de grandes bancos de dados. Essa tecnologia é importante devido ao crescimento

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Introdução Laboratório de Computação para Ciências Módulo II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Mestrado Profissional

Leia mais

Extração de Portfólio de Tecnologias de Irrigação a partir de Publicações Científicas

Extração de Portfólio de Tecnologias de Irrigação a partir de Publicações Científicas Extração de Portfólio de Tecnologias de Irrigação a partir de Publicações Científicas Stanley Robson de M. Oliveira; Maria Fernanda Moura; Celina Maki Takemura; Luísa Miyashiro Tápias; Carolina Tavares

Leia mais

Kira:Uma Ferramenta Instrucional para Apoiar a Aplicação do Processo de Mineração de Dados

Kira:Uma Ferramenta Instrucional para Apoiar a Aplicação do Processo de Mineração de Dados Kira:Uma Ferramenta Instrucional para Apoiar a Aplicação do Processo de Mineração de Dados Eduardo Fernando Mendes, Marina Teresa Pires Vieira Faculdade de Ciências Exatas e da Natureza Universidade Metodista

Leia mais

partir da navegação de usuários em sites Web

partir da navegação de usuários em sites Web Criação de regras de associação a partir da navegação de usuários em sites Web Fabrício J. Barth Faculdades BandTec e VAGAS Tecnologia Junho de 2013 Processo de mineração de padrões na Web Pré processamento

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

Uma Arquitetura de Tutor Inteligente que Provê Suporte ao Diálogo com o Aluno Iniciante em Linguagem de Programação

Uma Arquitetura de Tutor Inteligente que Provê Suporte ao Diálogo com o Aluno Iniciante em Linguagem de Programação Uma Arquitetura de Tutor Inteligente que Provê Suporte ao Diálogo com o Aluno Iniciante em Linguagem de Programação Renato de M. Santos 1, Crediné Silva de Menezes 1, Davidson Cury 1 1 Programa de Pós-Graduação

Leia mais

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra Padrões e processos em Dinâmica de uso e Cobertura da Terra Introdução 1 2 3 4 Capacidade de Armazenamento X Análise e Interpretação

Leia mais

As Tarefas de Associação e de Classificação na Shell de Data Mining Orion

As Tarefas de Associação e de Classificação na Shell de Data Mining Orion As Tarefas de Associação e de Classificação na Shell de Data Mining Orion Diana Colombo Pelegrin 1, Diego Paz Casagrande 1, Merisandra Côrtes de Mattos 2, Priscyla Waleska Targino de Azevedo Simões 3,

Leia mais

Metodologias para a Seleção de Atributos Relevantes

Metodologias para a Seleção de Atributos Relevantes Metodologias para a Seleção de Atributos Relevantes José Augusto Baranauskas e Maria Carolina Monard Departamento de Computação e Estatística Instituto de Ciências Matemáticas e de Computação - Universidade

Leia mais

Sistema de Avaliação do Docente pelo Discente e Auto-Avaliação do Docente (SIAV)

Sistema de Avaliação do Docente pelo Discente e Auto-Avaliação do Docente (SIAV) Sistema de Avaliação do Docente pelo Discente e Auto-Avaliação do Docente (SIAV) Riane de Oliveira Torres Santos Analista de Tecnologia da Informação Universidade Federal da Bahia riane@ufba.br RESUMO:

Leia mais

Informática. Data Warehouse. Professor Julio Alves.

Informática. Data Warehouse. Professor Julio Alves. Informática Data Warehouse Professor Julio Alves www.acasadoconcurseiro.com.br Informática 1. DATA WAREHOUSE Executivos tomadores de decisão (diretores, gerentes, analistas, etc) necessitam de ferramentas

Leia mais

1.1 Descrição do problema A programação genética (PG) é uma meta-heurística utilizada para gerar programas de computadores, de modo que o computador

1.1 Descrição do problema A programação genética (PG) é uma meta-heurística utilizada para gerar programas de computadores, de modo que o computador 1 Introdução 1.1 Descrição do problema A programação genética (PG) é uma meta-heurística utilizada para gerar programas de computadores, de modo que o computador possa resolver problemas de forma automática

Leia mais

19 Congresso de Iniciação Científica APLICAÇÃO DA LÓGICA NEBULOSA A MODELO DE CONHECIMENTO DO PROCESSO DE MINERAÇÃO DE DADOS

19 Congresso de Iniciação Científica APLICAÇÃO DA LÓGICA NEBULOSA A MODELO DE CONHECIMENTO DO PROCESSO DE MINERAÇÃO DE DADOS 19 Congresso de Iniciação Científica APLICAÇÃO DA LÓGICA NEBULOSA A MODELO DE CONHECIMENTO DO PROCESSO DE MINERAÇÃO DE DADOS Autor(es) ANDRE DE ANDRADE BINDILATTI Orientador(es) ANDERSON BERGAMO, ANA ESTELA

Leia mais

6º Congresso de Pós-Graduação AUTOMATIZAÇÃO DO PROCESSO DE CRIAÇÃO DE VISÕES PARA MODELAGEM DE DW

6º Congresso de Pós-Graduação AUTOMATIZAÇÃO DO PROCESSO DE CRIAÇÃO DE VISÕES PARA MODELAGEM DE DW 6º Congresso de Pós-Graduação AUTOMATIZAÇÃO DO PROCESSO DE CRIAÇÃO DE VISÕES PARA MODELAGEM DE DW Autor(es) RICARDO ALEXANDRE NEVES Orientador(es) MARINA TERESA PIRES VIEIRA 1. Introdução Um data warehouse

Leia mais

PÓS-PROCESSAMENTO EM KDD POST-PROCESSING IN KDD

PÓS-PROCESSAMENTO EM KDD POST-PROCESSING IN KDD PÓS-PROCESSAMENTO EM KDD Cristian Simioni Milani, PUCPR, E-mail: cristiansimionimilani@gmail.com Deborah Ribeiro Carvalho, PUCPR, E-mail: ribeiro.carvalho@pucpr.br Resumo. Apesar dos esforços em utilizar

Leia mais

NEPaLE: Uma ferramenta computacional de suporte à avaliação de paráfrases

NEPaLE: Uma ferramenta computacional de suporte à avaliação de paráfrases NEPaLE: Uma ferramenta computacional de suporte à avaliação de paráfrases Rafael de Oliveira Teixeira 1, Eloize Rossi Marques Seno 1, Helena de Medeiros Caseli 2 1 Instituto Federal de São Paulo câmpus

Leia mais

Universidade Federal Fluminense (UFF) Rua Passo da Pátria, 156, bloco E, sala Niterói, RJ

Universidade Federal Fluminense (UFF) Rua Passo da Pátria, 156, bloco E, sala Niterói, RJ Mineração de Regras de Associação Híbridas Eduardo Corrêa Gonçalves 1, Alexandre Plastino 2 1 ADDLabs - Laboratório de Documentação Ativa e Design Inteligente Universidade Federal Fluminense (UFF) Rua

Leia mais

Um estudo sobre consumo energético na indexação de conteúdo visual com síntese em alto nível usando hardware reconfigurável

Um estudo sobre consumo energético na indexação de conteúdo visual com síntese em alto nível usando hardware reconfigurável 1 de 61 Um estudo sobre consumo energético na indexação de conteúdo visual com síntese em alto nível usando hardware reconfigurável Elmar Uwe Kurt Melcher (Orientador) Universidade Federal de Campina Grande

Leia mais

Sistemas Especialistas (SE)

Sistemas Especialistas (SE) Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Sistemas Especialistas (SE) Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008

Data Mining. Felipe E. Barletta Mendes. 21 de maio de 2008 21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é

Leia mais

Ciência da Computação

Ciência da Computação Ciência da Computação TCC em Re vista 2009 33 CAMPOS, Fernando Antonio Barbeiro; SANTUCI, Leonardo Balduino 5. Estudo de aplicabilidade do padrão MVC. 2009. 111 f. Trabalho de Conclusão de Curso (Graduação

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

Clusterização de uma Base de Dados Médica pelo Algoritmo Gustafson-Kessel

Clusterização de uma Base de Dados Médica pelo Algoritmo Gustafson-Kessel 19 a 21 de mar o de 2010 157 Clusterização de uma Base de Dados Médica pelo Algoritmo Gustafson-Kessel José Márcio Cassettari Junior 1, Merisandra Côrtes de Mattos 1, João Manuel M. De Carlo 1, Priscyla

Leia mais

DESENVOLVIMENTO DE UM SISTEMA DE INFORMAÇÃO GEOGRÁFICA PARA GERAÇÃO DE MAPAS PLUVIOMÉTRICOS

DESENVOLVIMENTO DE UM SISTEMA DE INFORMAÇÃO GEOGRÁFICA PARA GERAÇÃO DE MAPAS PLUVIOMÉTRICOS DESENVOLVIMENTO DE UM SISTEMA DE INFORMAÇÃO GEOGRÁFICA PARA GERAÇÃO DE MAPAS PLUVIOMÉTRICOS Osvaldo Cesar Pinheiro de Almeida 1, Roger Cristhian Gomes 2 1 FATEC, Botucatu, SP, Brasil. E-mail cesar@fatecbt.edu.br

Leia mais

TVM WeB - Uma Interface Visual para o Modelo Temporal de Versões

TVM WeB - Uma Interface Visual para o Modelo Temporal de Versões TVM WeB - Uma Interface Visual para o Modelo Temporal de Versões Vincent Nelson Kellers da Silveira, Nina Edelweiss e Renata de Matos Galante Instituto de Informática - Universidade Federal do Rio Grande

Leia mais

132 6 Conclusão 6.1. Contribuições da Tese

132 6 Conclusão 6.1. Contribuições da Tese 132 6 Conclusão Esta tese teve como objetivo principal o estudo da aplicação de transformações para manter a rastreabilidade de um sistema de software. Esta abordagem permite a captura automática das informações

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

Engenharia de Requisitos

Engenharia de Requisitos Engenharia de Requisitos Criado: mar/2001 Atualizado: set/2005 Tópicos Definição de Requisitos Participantes Processo Documento de Requisitos (SRS) Evolução dos Requisitos 2 Referência I.Sommerville. Sw

Leia mais