CitationFinder: Um Sistema Baseado em Conhecimento para Classificação de Páginas de Publicações na Web

Tamanho: px
Começar a partir da página:

Download "CitationFinder: Um Sistema Baseado em Conhecimento para Classificação de Páginas de Publicações na Web"

Transcrição

1 CitationFinder: Um Sistema Baseado em Conhecimento para Classificação de Páginas de Publicações na Web Mariana Lara Neves, Flávia de Almeida Barros Centro de Informática - Universidade Federal de Pernambuco Caixa Postal Recife - PE - Brazil {mln, ~fab} Abstract. This regularity allows the automatic identification of such pages by computational systems based on domain knowledge. The work presented here describes the CitationFinder, a knowledge-based system for the automatic classification of Web pages which contain citations of technical and scientific publications. The systems counts on a knowledge base of production rules with associated certainty factors, to improve the system's precision. This knowledge base was constructed by analyzing a corpus of pages. The system's performance was very satisfactory: 88,6% precision and 97% recall for a test corpus of 300 pages. Resumo. Este trabalho descreve um sistema baseado em conhecimento para a classificação automática de páginas Web contendo citações de publicações técnicas e científicas, o CitationFinder. O sistema conta com uma base de regras de produção com fatores de certeza associados, a fim de melhorar a precisão dos resultados. Esta base foi construída a partir da análise de um corpus de páginas Web. O desempenho do sistema foi bastante satisfatório: 88,6% de precisão e 97% de cobertura para um corpus de teste de 300 páginas. 1. Introdução O aumento vertiginoso, nas últimas duas décadas, da quantidade de repositórios de documentos digitalizados, tais como bibliotecas digitais, Intranets e a Internet, facilitou imensamente o rápido acesso a informações atualizadas sobre os mais diversos assuntos. Contudo, este crescimento descontrolado e desordenado trouxe problemas inexistentes nos antigos sistemas para armazenamento e recuperação de informação. Uma dificuldade séria a se enfrentar é a localização de documentos relevantes na Internet (em especial, na World Wide Web). Como sabemos, a precisão dos sistemas de busca existentes (e.g., Radix, Altavista ) não é muito boa, levando o usuário, algumas vezes, a perder horas para localizar documentos de seu interesse. Para facilitar as buscas, uma solução seria a adoção de hierarquias de classes, de forma que os documentos indexados pelos engenhos de busca estivessem associados a uma ou mais classes pré-fixadas, como é o caso das bibliotecas digitais. Até o momento, contudo, tal solução não se mostrou viável, devido a [Barros et al. 1998]: imensa quantidade de assuntos presentes nas páginas Web; dificuldade em se identificar

2 automaticamente a(s) classe(s) de cada documento, falta de uma hierarquia geral de consenso. Contudo, é possível a identificação de classes (domínios) de documentos na Web que exibem alguma regularidade no formato e no conteúdo apresentados, possibilitando, ainda que árdua, a tarefa de classificá-los automaticamente. Exemplos desses domínios são: páginas de hotéis, de restaurantes, de universidades, de chamadas de conferências, de produção científica, entre outras. Este trabalho apresenta um sistema para a classificação automática de páginas Web contendo citações de publicações técnicas e científicas, o CitationFinder [Neves 2001]. Páginas recuperadas a partir de consultas a engenhos de busca existentes na Web são classificadas e armazenadas em um banco de dados, ficando disponíveis para acesso via Web. A escolha deste domínio deveu-se, principalmente, a três fatores: (1) existe uma grande quantidade desse tipo de página na Web, o que demonstra o interesse dos usuários pelo tópico; (2) essas páginas exibem alguma regularidade no seu formato de apresentação dos dados, o que possibilita o seu reconhecimento automático. O sistema foi implementado como um plug-in para engenhos de busca, a fim de não duplicar esforços na indexação dos documentos disponíveis na Web. O classificador foi construído com base em técnicas da Inteligência Artificial Simbólica, contando com uma base de regras de produção com fatores de certeza associados, a fim de melhorar a precisão dos resultados. A base de conhecimento foi construída a partir de um corpus de 1000 documentos coletados e etiquetados manualmente. O sistema construído possui diversas vantagens, como a portabilidade, modularidade, extensibilidade (reusabilidade) e facilidade de uso. O protótipo foi implementado em Java e a base de regras é executada pela máquina de inferência JEOPS [Figueira Filho & Ramalho 2000], implementada também em Java. O CitationFinder apresentou resultados muito satisfatórios: 88,6% de precisão e 97% de cobertura. De moda a melhor avaliar os resultados, foram realizados experimentos comparativos com três algoritmos de aprendizagem de máquina (Árvores de Decisão, Regras de Indução e Naive Bayes).Os resultados obtidos com estes algoritmos foram equivalentes ou inferiores às taxas obtidas com o CitationFinder, o que comprova a eficiência da abordagem adotada. A próxima seção descreve alguns trabalhos relacionados, seguida da seção 3 que apresenta, de forma sucinta, o estado da arte em classificação automática de texto. A seção 4 apresenta o sistema CitationFinder, seguida da seção 5, com detalhes de implementação do protótipo. A seção 6 mostra a avaliação do protótipo e descreve os experimentos com aprendizagem de máquina, detalhando os resultados obtidos em cada abordagem. Finalmente, a seção 7 traz conclusões e indicações de trabalhos futuros. 2. Trabalhos Relacionados Apesar da grande demanda, poucos são os sistemas disponíveis na Internet que lidam com publicações científicas. Foram identificados quatro sistemas para este fim: o WebFind [Monge & Elkan 1996], o Cora [McCallum et al. 2000], o CiteSeer [Bollacker et al. 1998] e o CiFi [Loke et al. 1996]. O WebFind é um sistema para localização na Internet de documentos científicos a partir dos nomes dos autores. Ele utiliza duas fontes externas de informação: o

3 MELVYL, um serviço de biblioteca da Universidade de Califórnia e o NetFind, um serviço que oferece o provedor de Internet e o endereço eletrônico do autor. Primeiro, o usuário informa o artigo desejado (por uma combinação dos nomes dos autores, palavras do título, etc.), então o WebFind faz uma consulta ao INSPEC para recuperar a afiliação institucional do(s) autor(es), e finalmente usa o NetFind para localizar o endereço na Internet desta afiliação. Uma vez que o servidor foi identificado, WebFind segue os links até o artigo desejado seja localizado. A principal desvantagem do WebFind é que ele só cobre documentos cujas as afiliações de autores estejam presentes no banco de dados de MELVYL. O Cora é um engenho de busca específico para a localização de produção científica da área de Ciência da Computação. Ele utiliza um robô que percorre a Web a partir das páginas dos departamentos e laboratórios de Ciência da Computação, e coleta todos os documentos no formato Postscript. Estes documentos são analisados para a extração de informação (título, nomes de autores e afiliações, resumo e referências). Cada referência individual é isolada e todas as citações para o mesmo artigos e são associadas ao mesmo. Os documentos coletados são classificados sob uma hierarquia de categorias da Ciência da Computação, e são armazenados em um banco de dados específico, disponível por para busca por palavras-chave. O sistema é limitado à área da Ciência da Computação e aos arquivos dos artigos, ignorando aquelas citações que não contêm um link para o arquivo correspondente. O CiteSeer consiste em três componentes principais: um agente para automaticamente localizar e coletar publicações no formato Postscript ou HTML por meio de consultas aos engenhos de busca tradicionais; um parser para a extração de algumas informações (URL, cabeçalho, resumo, introdução, citações) dos documentos carregados; e uma interface de acesso à base de dados do sistema. Adicionalmente, este sistema agrupa citações para um mesmo artigo e tenta localizar documentos relacionados ao mesmo assunto. Diferentemente do Cora, o CiteSeer permite não só a busca por documentos que possuem seu respectivo arquivo, mas também pelas citações que aparecem nesses documentos, mesmo que o sistema não possua o arquivo desta citação em sua base. O CiFi utiliza um agente inteligente para a busca de citação de publicações na área de Ciência da Computação. O usuário tem que informar o autor e o título do artigo e então o CiFi executa quatro estratégias alternativas: procura a versão em HTML do artigo (por meio de consulta ao Lycos); procura a página pessoal do autor (também através do Lycos); procura a página do departamento de Ciência da Computação do autor; ou procura arquivos de relatório técnicos (o Unified Computer Science Technical Reports e o Networked Computer Science Technical Reports Library ). A principal desvantagem do CiFi é que ele requer o título e o autor do artigo, não permitindo a busca por documentos relacionados a um determinado assunto, sendo ainda limitado à área da Ciência da Computação. 3. Classificação Automática de Documentos Duas são as técnicas existentes para a construção de classificadores: a criação manual de sistemas baseados em conhecimento, ou por aprendizagem automática. Em geral, os sistemas baseados em conhecimento são compostos de dois elementos principais: uma base de conhecimento e um motor de inferência [Russell & Norvig 1995].

4 Vários são os experimentos e sistemas de classificação de documentos baseados em técnicas de aprendizagem, como por exemplo: as árvores de decisão [Lewis & Ringuette 1994], e a aprendizagem de regras [Apté et al. 1994]. A aprendizagem Bayesiana também já foi aplicada à classificação de documentos [McCallum et al. 2000], assim como as Redes Neurais Artificiais [Wiener et al. 1995]. Dentre as abordagens de aprendizagem de máquina, a indução de regras é uma das mais aplicadas à tarefa de classificação de documentos, devido a sua boa precisão. As regras (manual ou automaticamente construídas) possuem vantagens potenciais, como melhor capacidade de explanação, um modelo teórico mais forte e o fato de não serem mutuamente excludentes (como ocorre nas árvores de decisão). 4. CitationFinder Esta seção apresenta detalhes sobre o CitationFinder, um sistema para meta-busca e classificação de páginas Web de citações de publicações. Como já comentado, trata-se de um sistema baseado em conhecimento construído manualmente. A escolha da abordagem baseada em conhecimento deveu-se, principalmente, a dois aspectos: (1) trabalhos anteriores na área de classificação de documentos mostravam que os sistemas baseados em conhecimento [Hayes & Weinstein 1990] conseguiam obter resultados superiores aos de sistemas construídos automaticamente por aprendizagem [Lewis & Ringuette 1994; Wiener et al. 1995; Apté et al. 1994]; e (2) a consideração de relações estruturais (ordem de palavras, localização de termos em tags específicas) é mais facilmente implementada por meio de regras escritas manualmente, uma vez que a aprendizagem automática dessas características só é possível por meio da lógica de primeira ordem, que demanda o uso de algoritmos de ordem exponencial [Zucker & Ganascia 1998]. O CitationFinder objetiva a busca de páginas Web de publicação, isto é, páginas HTML que contenham citações de publicações, independente da presença ou não de seus respectivos arquivos (Postscript ou PDF) e da área de pesquisa relacionada. Todo o processamentos dos documentos é feito off-line, de modo que o único processo on-line é a busca na sua base de índices. A fim de evitar o trabalho e o custo de indexar a Web diretamente, o CitationFinder realiza "meta buscas" através de engenhos de busca disponíveis (e.g., Yahoo, Radix). Assim sendo, o classificador executa consultas baseadas em palavras-chave do domínio, e classifica as páginas eletrônicas (em HTML) retornadas (cf. Figura 1), armazenando-as em uma base de índices específica, e, portanto, devolvendo ao usuário apenas as páginas que contêm citações de publicações (cf. Figura 2). Web Engenhos de Busca tradicionais Busca por palavras-chave do domínio Consulta Base de Índices Específica URLs reconhecidas positivamente CitationFinder

5 Como todo sistema baseado em conhecimento, a construção do CitationFinder seguiu quatro etapas de desenvolvimento [Turban 1992]: aquisição de conhecimento, formalização da base de conhecimento, implementação e testes (validação). Veremos a seguir detalhes sobre as três primeiras etapas de desenvolvimento. 4.1 Aquisição do Conhecimento A aquisição do conhecimento necessária para a construção das bases de conhecimento foi realizada com base em um corpus de 1000 páginas eletrônicas, sendo 700 positivas (páginas de publicação) e 300 negativas. Este corpus foi manualmente coletado através da análise de páginas retornadas por meta-buscas a engenhos de busca disponíveis na Web. Em seguida, foi feita uma análise das páginas selecionadas, a fim de identificarem-se suas regularidades (que permitiriam a identificação automática de tais páginas). A principal característica identificada foi a presença de blocos de citação, geralmente dispostos como uma lista numerada ou não (cf. Figura 2). Casos onde os blocos de citações estão separados apenas por parágrafos também são bastante encontrados, e, menos freqüentemente, encontram-se blocos inseridos em uma tabela, onde cada linha corresponde a um bloco. 4.2 Formalização e Implementação das Bases de Conhecimento O processamento das páginas no CitationFinder pode ser feito em duas etapas, sendo a primeira obrigatória e a segunda opcional (ver seção 4). As bases de conhecimento do sistema foram formalizadas e implementadas como um conjunto de regras de produção. Este conhecimento adquirido norteou a construção de três bases de conhecimento: 1. uma base de fatos composta por um dicionário de termos do domínio e padrões sintáticos; 2. uma base de regras para o reconhecimento dos blocos de citação (primeira etapa de processamento); 3. uma base de regras (com fatores de certeza associados) para a verificação de termos específicos em grupos de palavras (segunda etapa de processamento).

6 Dicionário do Domínio O dicionário de termos do domínio é utilizado nas duas etapas de reconhecimento das páginas, e constitui peça essencial de conhecimento do domínio. Através da observação dos exemplos coletados, foram definidas 11 classes de palavras indicativas de termos usualmente encontrados em páginas de publicações [Neves 2001]: Geral, Trabalho Impresso, Iniciais, Arquivo, Editora, Data, Volume da Edição, Número da Edição, Intervalo de Páginas, Localidade e Tipo de Evento. O dicionário do domínio foi escrito apenas para as línguas portuguesa e inglesa, com exceção dos nomes de localidades, que foram escritos também na língua de origem da localidade. Além dessas 11 classes, 6 padrões de termos são verificados, isto é, cadeias geralmente formadas por uma composição de caracteres específicos e algarismos: Arquivo (e.g., 1.5MB), Data (e.g., 11-fev-98), Número da Edição (e.g., no60), Páginas da Publicação (e.g., pp ), Tipo de Evento (e.g., AAAI'90) e Volume da Edição (e.g., vol60, v22). Estes padrões são tão importantes para o reconhecimento das páginas quanto as palavras listadas no dicionário do domínio, e por isso, também podem ser considerados como parte da base de fatos. Bases de Regras Como já comentado, duas são as etapas de processamento do sistema, cada uma com sua base de regras construída para fins específicos. A primeira etapa é responsável pelo reconhecimento das páginas de publicações através da identificação de cada bloco de citação isoladamente. Esses blocos podem ser reconhecidos por regras que utilizam combinações das possíveis cadeias que compõem uma citação (cf. Figura 3). SE houver uma cadeia de Tipo de Evento E houver uma cadeia de Intervalo de Páginas E houver uma cadeia de Data ENTÃO o texto é uma citação A segunda etapa de classificação é responsável pela identificação de termos do dicionário em grupos de textos, definidos a partir das tags do documento [Neves 2001]. A verificação desses termos é realizada por meio de um conjunto de regras específicas (cf. Figura 4) que contabilizam quantas palavras de uma mesma classe do dicionário do domínio estão presentes em cada grupo de texto considerado. Diferentemente das regras da primeira etapa, essas regras têm fatores de certeza (positivos ou negativos) associados, que indicam a chance da página ser classificada como positiva. O valor final obtido pela combinação dos fatores em cada regra disparada é comparado a um limiar, de modo a efetuar uma decisão binária de classificação. SE a freqüência da classe Geral no grupo Especial for de 1 a 20 ENTÃO o documento é positivo (0.83) 5. Protótipo Implementado Como comentado, o reconhecimento das páginas no sistema CitationFinder é realizado em duas etapas, cuja arquitetura é apresentada na Figura 5. A primeira etapa classifica a

7 página pelo reconhecimento da presença de blocos de citação. As páginas classificadas como negativas nesta etapa são passadas para a etapa 2. Aqui temos páginas que não contêm qualquer citação, sendo de fato negativas, e páginas onde as citações não estão organizadas em blocos característicos do domínio. Esta etapa tenta, portanto, identificar as páginas que possuem citações em formatos diversos. JEOPS documento HTML Base de Regras 1 Dicionário do domínio - Base de Regras 2 Dicionário do domínio + limiar Base de Índices Isolamento dos blocos de citações Classificador Separação dos grupos de texto Classificador + Primeiramente, um parser é responsável pela identificação e pelo isolamento dos trechos de texto relevantes contidos no documento. Uma estrutura em forma de árvore é construída a partir da página HTML de acordo com as tags identificadas. A partir daí, o sistema tenta isolar os blocos de citações, observando as tags identificadores de listas (numeradas ou não), tabelas, e em último caso, parágrafos. Em seguida, é efetuada uma verificação dos termos do dicionário do domínio e dos padrões sintáticos, não havendo a necessidade de uma separação de cada cadeia que compõe o bloco de citação. Tampouco há a necessidade de se diferenciar termos pertencentes a uma mesma classe do dicionário do domínio ou a um mesmo padrão. O reconhecimento final da página é realizado por meio de regras que verificam algumas combinações de cadeias de uma citação (cf. seção 4.2), e se classificada positivamente, sua URL é enviada a uma base de índices. Se classificada negativamente, a páginas será processada pela segunda etapa do sistema. Embora a maioria das páginas de publicações seja satisfatoriamente reconhecida na primeira etapa de processamento (91% dos exemplos positivos na fase de construção), algumas páginas contêm citações compostas de poucas cadeias que necessitariam de regras muito gerais. A segunda fase do sistema CitationFinder visa aumentar a cobertura do sistema, por meio da identificação de termos do dicionário do domínio em alguns grupos de texto do documento. Esses seis grupos de textos (Título, Comum, Especial, Lista, Tabela e Link) são criados pelo parser da segunda fase do sistema, a partir da natureza das tags em que o texto se encontra [Neves 2001]. Em seguida, é realizada uma verificação da presença dos termos do dicionário nos grupos considerados por meio de um conjunto de regras específicas (cf. seção 4.2). Analogamente ao que ocorre na primeira etapa, se classificada positivamente, a página será armazenada na base de índices, senão será classificada como negativa e descartada pelo sistema.

8 Todo o conhecimento utilizado para a classificação dos documentos está contido no dicionário do domínio, e nas bases de regras. Implementadas como regras JEOPS (Java Embedded Object Production System) [Figueira Filho & Ramalho 2000], as regras de produção estão agrupadas em diferentes módulos, portanto, são de fácil compreensão, manutenção e extensão. O JEOPS é um motor de inferência para sistemas baseados em regras de produção de primeira ordem, facilitando a criação de aplicativos Java voltados à área de Inteligência Artificial. 6. Avaliação do Sistema O CitationFinder foi avaliado com um corpus de teste composto por 300 páginas, sendo 200 positivas e 100 negativas. Vale frisar que este corpus é diferente do usado na construção do sistema, a fim de permitir uma avaliação mais realista do sistema construído. O desempenho foi medido através do cálculo dos parâmetros de precisão, cobertura e F-Measure [van Rijsbergen 1979]. Para o corpus usado na construção do CitationFinder (cf. Figura 6a), foram obtidos os valores de 91,1%, 96,7% e 93,8% para os parâmetros de precisão, cobertura e F-Measure, respectivamente. Para o corpus de teste (cf. Figura 6b), foram obtidos os valores de 88,6%, 97,0% e 92,6% para os mesmos parâmetros anteriores. Classificada positivamente Classificada negativamente Página Positiva (a) Página Negativa Classificada positivamente Classificada negativamente Página Positiva (b) Página Negativa corpora Experimentos adicionais com algoritmos de aprendizagem foram realizados visando uma comparação entre o desempenho do sistema CitationFinder e de classificadores construídos automaticamente. Foram testadas três abordagens: árvore de decisão, indutor de regras, e a técnica Naive Bayes. Esses classificadores foram construídos com o uso da ferramenta Weka (Waikato Environment for Knowledge Analysis), desenvolvida pela University of Waikato da Nova Zelândia. Os experimentos foram realizados com os mesmos corpora utilizados na construção e teste do CitationFinder. Um pré-processamento dos documentos foi realizado pela exclusão de palavras irrelevantes [Neves 2001] e eliminação de símbolos e sinais de pontuação. A seleção dos termos a serem considerados nesses experimentos foi realizada de acordo com três diferentes técnicas: pela medida da entropia [Maron 1961], pelo coeficiente de correlação [Ng et al. 1997] e pela técnica do χ2 [Ng et al. 1997]. O número de características adotado foram de 50, 100, 150 e 200, visando a obtenção da melhor configuração para cada um dos três classificadores considerados. Os valores obtidos (cf. Figura 7) mostram que o CitationFinder e os experimentos com Indução de Regras e Naive Bayes obtiveram resultados muito próximos, de acordo com o parâmetro do F-Measure. O bom resultado obtido pelo CitationFinder se deve à qualidade do conhecimento obtido durante a fase de aquisição, representado por meio de um dicionário do domínio e de bases de regras específicas para o reconhecimento de páginas de citação. Suas maiores vantagens em relação ao

9 experimento de melhor desempenho (Indução de Regras) são modularidade, extensibilidade e facilidade de uso. Precisão Cobertura F-Measure Indução de Regras 95% 92% 93,5% Árvores de Decisão 87% 90% 88,5% Naive Bayes 93% 91% 92% CitationFinder 88,6% 97% 92,6% 7. Considerações Finais Este trabalho apresentou o sistema CitationFinder, construído para a classificação de páginas de citações de publicação na Web. Trata-se de um sistema baseado em conhecimento que dispõe de um dicionário de termos do domínio e de duas bases de regras de produção para auxiliar a tarefa de classificação. As bases de conhecimento foram manualmente construídas através da análise detalhada de um corpus de 1000 documentos. As maiores contribuições deste trabalho foram: (1) a coleta de um corpus de 900 páginas de citações de publicações e 400 páginas negativas; (2) a criação de um dicionário do domínio e regras de produção para a classificação das páginas; (3) a criação de um sistema original, sem equivalente na literatura disponível; e (4) a realização de experimentos comparativos com aprendizagem. Algumas extensões a este trabalho poderiam ser efetuadas de modo a torná-lo ainda mais eficiente: (1) o reconhecimento de nomes próprios; (2) a coleta de novas páginas e extensão das bases de regras e do dicionário do domínio; (3) a busca automática de nomes próprios e de localidades (em sites geográficos); e (4) a integração do CitationFinder com o sistema ProdExt [Nunes 2000], cujo objetivo é o preenchimento automático de banco de dados específicos de produção científica. Referências Bibliográficas Apté, C.; Damerau, F. & Weiss, S. (1994) Automated Learning of Decision Rules for Text Categorization. ACM Transactions on Information Systems, Vol. 12(3), pp Barros, F. A. Gonçalves, P. F. & Santos, T. L. V. L. (1998) Providing Context to Web Searches: the Use of Ontologies to Enhance Web Search Engines' Accuracy. In Journal of the Brazilian Computer Society. Vol. 5(2), pp Bollacker, K. D.; Lawrence, S. & Giles, L. (1998) CiteSeer: An Autonomous Web Agent for Automatic Retrieval and Identification of Interesting Publications. Proc. of the 2nd International Conference on Autonomous Agents. ACM Press, New York, pp Figueira Filho, C. S. & Ramalho, G. L. (2000) JEOPS - The Java Embedded Object Production System. Lecture Notes in Artificial Intelligence, n.1952, Advances in Artificial Intelligence, pp

10 Hayes, P. J. & Weinstein, S. P. (1990) Construe-TIS: A System for Content-Based Indexing of a Database of News Stories. Second Annual Conference on Innovative Applications of Artificial Intelligence, pp Lewis, D. D. & Ringuette, M. (1994) A Comparison of Two Learning Algorithms for Text Categorization. In Third Annual Symposium on Document Analysis and Information Retrieval, pp Loke, S. W.; Davison, A. & Sterling, L. (1996) CiFi: An Intelligent Agent for Citation Finding on the World-Wide Web. In: Foo N, Goebel R (eds) Lecture Notes on Artificial Intelligence Series, no Springer-Verlag, London, pp Maron, M. E. (1961) Automatic Indexing: An Experimental Inquiry. Journal of ACM, Vol. 8, pp McCallum, A. K.; Nigam, K.; Rennie, J. & Seymore, K. (2000) Automating the Construction of Internet Portals with Machine Learning. Information Retrieval Journal, Vol. 3, pp Monge, A. E. & Elkan, C. P. (1996) The WebFind Tool for Finding Scientific Papers over the World Wide Web. Proceedings of the Third International Congress on Computer Science Research, Tijuana, Mexico. Neves, M. L. (2001) CitationFinder: Um Sistema de Meta-busca e Classificação de Páginas de Publicações na Web. Dissertação de Mestrado, Centro de Informática, UFPE. (http://www.cin.ufpe.br/~mln/) Ng, H. T.; Goh, W. B. & Low, K. L. (1997) Feature Selection, Perceptron learning and a Usability Case Study for Text Categorization. Proceedings of SIGIR-97, 20th ACM International Conference on Research and Development in Information Retrieval, pp , Philadelphia, PA, USA. Nunes, C. C. R. (2000) ProdExt: Um Wrapper para Extração de Produção Técnica e Científica de Páginas Eletrônicas. Dissertação de Mestrado, Centro de Informática, UFPE. Russell, S. & Norvig, P. (1995) Artificial Intelligence: A Modern Approach. Prentice Hall. van Rijsbergen, C. J. (1979) Information Retrieval. Department of Computer Science, University of Glasgow. Turban, E. (1992) Expert Systems and Applied Artificial Intelligence. Macmillan Pub. Co. Wiener, E.; Pedersen, J. O. & Weigend, A. S. (1995) A Neural Network Approach to Topic Spotting. In Proceedings of the 4th Symposium on Document Analysis and Information Retrieval, pp , Las Vegas, NV, USA, April Zucker, J. -D, & Ganascia, J. -G. (1996) Changes of Representation for Efficient Learning in Structural Domains. In International Conference in Machine Learning, Bary, Italie: Morgan Kauffman.

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA Daniel Mandelli Martins Faculdade de Engenharia de Computação CEATEC danielmartins@puc-campinas.edu.br Juan Manuel Adán Coello

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD RESUMO Thereza P. P. Padilha Fabiano Fagundes Conceição Previero Laboratório de Solos

Leia mais

MARACATU. A component search tool. Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes

MARACATU. A component search tool. Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes MARACATU A component search tool Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes Vinicius Cardoso Garcia July 29, 2005 Agenda Introdução Especificação

Leia mais

Recuperação de Imagens na Web Baseada em Informações Textuais

Recuperação de Imagens na Web Baseada em Informações Textuais Recuperação de Imagens na Web Baseada em Informações Textuais André Ribeiro da Silva Mário Celso Candian Lobato Universidade Federal de Minas Gerais Departamento de Ciência da Computação {arsilva,mlobato}@dcc.ufmg.br

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Theo Silva Lins, Luiz Henrique de Campos Merschmann PPGCC - Programa de Pós-Graduação

Leia mais

Modelagem de Conhecimento integrando Regras de Produção e Ontologias

Modelagem de Conhecimento integrando Regras de Produção e Ontologias Modelagem de Conhecimento integrando Regras de Produção e Ontologias 1. Introdução Tiago Cordeiro, Vládia Pinheiro e Vasco Furtado UNIFOR Universidade de Fortaleza O conhecimento das organizações precisa

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA

UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA ANÁLISE DE AGENTES CLASSIFICADORES PARA CATEGORIZAÇÃO AUTOMÁTICA DE DOCUMENTOS DIGITAIS PROPOSTA DE TRABALHO

Leia mais

Ontologias detalhadas e classificação de texto: uma união promissora

Ontologias detalhadas e classificação de texto: uma união promissora Ontologias detalhadas e classificação de texto: uma união promissora Eunice Palmeira 1,2, Fred Freitas 3 1 Coordenadoria de Tecnologia e Informática Centro Federal de Educação Tecnológica de Alagoas UNED/PIn

Leia mais

Gerenciamento de Workflows Científicos em Bioinformática

Gerenciamento de Workflows Científicos em Bioinformática Gerenciamento de Workflows Científicos em Bioinformática Agosto de 2007 Estudante: Orientador: Co-orientadora: Luciano Antonio Digiampietri João Carlos Setubal Claudia Bauzer Medeiros Roteiro Introdução

Leia mais

UNIVERSIDADE PRESBITERIANA MACKENZIE Faculdade de Computação e Informática MATRIZ CURRICULAR ELETIVAS

UNIVERSIDADE PRESBITERIANA MACKENZIE Faculdade de Computação e Informática MATRIZ CURRICULAR ELETIVAS MATRIZ CURRICULAR S LIVRE ESCOLHA Núcleo Temático: HUMANAS Disciplina: LÍNGUA BRASILEIRA DE SINAIS 34 h/a (.34 ) Teóricas Etapa: 4ª Compreensão de aspectos composicionais da Língua Brasileira de Sinais

Leia mais

Palavras-chave: Sistema neuro-fuzzy, Sistemas de avaliação, Sistemas Adaptativos.

Palavras-chave: Sistema neuro-fuzzy, Sistemas de avaliação, Sistemas Adaptativos. ANÁLISE DO CURSO DE ENGENHARIA ELÉTRICA NA UERJ A PARTIR DE INDICADORES CONSTRUÍDOS BASEADOS NO EXAME NACIONAL DE CURSOS: UM SISTEMA NEBULOSO DE AVALIAÇÃO Maria Luiza F. Velloso mlfv@centroin.com.br Universidade

Leia mais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais UNIVERSIDADE ESTADUAL DE PONTA GROSSA PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO APLICADA CRISTIAN COSMOSKI RANGEL DE ABREU TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR

Leia mais

Desenvolvimento de um sistema de pergunta e resposta baseado em corpus

Desenvolvimento de um sistema de pergunta e resposta baseado em corpus Desenvolvimento de um sistema de pergunta e resposta baseado em corpus Adriano Jorge Soares Arrigo e-mail: arrigo.adriano@gmail.com Elvio Gilberto Silva e-mail: elvio.silva@usc.br Henrique Pachioni Martins

Leia mais

RBC no Auxílio de Avaliações Imobiliárias

RBC no Auxílio de Avaliações Imobiliárias RBC no Auxílio de Avaliações Imobiliárias Adauto Trigueiro, Alcione da Costa Pinheiro, Clerton Filho, Kátia Silva Unidade Acadêmica de Sistemas e Computação Universidade Federal de Campina Grande (UFCG)

Leia mais

Interpretador AIML alimentado com tags HTML5

Interpretador AIML alimentado com tags HTML5 2º Congresso de Pesquisa Científica : Inovação, Ética e Sustentabilidade Interpretador AIML alimentado com tags HTML5 Rafael Luiz de Macedo (Ciência da Computação - UNIVEM - Marília/SP) Email: rafaelldemacedo@gmail.com

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala [quinta-feira, 7:30 12:00] Atendimento Segunda

Leia mais

Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual

Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual Shênia Salvador de Pinho, Kleber J. F. Souza Instituto de Ciências Exatas e Informática PUC Minas Guanhães,

Leia mais

WEB OF KNOWLEDGE NOTAS DA VERSÃO v5.11

WEB OF KNOWLEDGE NOTAS DA VERSÃO v5.11 WEB OF KNOWLEDGE NOTAS DA VERSÃO v5.11 Os recursos a seguir são planejados para a Web of Knowledge em 28 de julho de 2013. Este documento fornece informações sobre cada um dos recursos incluídos nessa

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

UNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO

UNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO UNIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2010.2 ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno!

Leia mais

2 Conceitos Gerais de Classificação de Documentos na Web

2 Conceitos Gerais de Classificação de Documentos na Web Conceitos Gerais de Classificação de Documentos na Web 13 2 Conceitos Gerais de Classificação de Documentos na Web 2.1. Páginas, Sites e Outras Terminologias É importante distinguir uma página de um site.

Leia mais

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Universidade Federal de Pernambuco Graduação em Ciência da Computação 2012.2 Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Proposta de Trabalho de Graduação Aluno:

Leia mais

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES Kelton Costa; Patricia Ribeiro; Atair Camargo; Victor Rossi; Henrique Martins; Miguel Neves; Ricardo Fontes. kelton.costa@gmail.com; patriciabellin@yahoo.com.br;

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback Relevance Feedback Expansão de Consulta Relevance Feedback 1 Relevance Feedback Baeza-Yates; Ribeiro-Neto, (2011, cap 5) distinguem dois métodos: Explicit Relevance Feedback a informação para a reformulação

Leia mais

Web Semântica e Matching de Ontologias: Uma Visão Geral

Web Semântica e Matching de Ontologias: Uma Visão Geral Web Semântica e Matching de Ontologias: Uma Visão Geral Hélio Rodrigues de Oliveira Departamento de Computação Universidade Federal do Ceará heliorodrigues@lia.ufc.br Bernadette Farias Lóscio Departamento

Leia mais

Opala: uma biblioteca de indexação e busca de textos e imagens por conteúdo

Opala: uma biblioteca de indexação e busca de textos e imagens por conteúdo Opala: uma biblioteca de indexação e busca de textos e imagens por conteúdo Lidijanne de Miranda Santos (1); Aécio Solano Rodrigues Santos (2); Ricardo Martins Ramos (3); Valéria Oliveira Costa (4) Instituto

Leia mais

Sistema de Reputação e Ranqueamento para Redes Sociais Aplicado ao Participatório

Sistema de Reputação e Ranqueamento para Redes Sociais Aplicado ao Participatório Sistema de Reputação e Ranqueamento para Redes Sociais Aplicado ao Participatório Daniel Gomes 1, Diego Pasqualin 1, Fabiano Silva 1, Luis C. E. de Bona 1, Mateus Strey 1 1 Departamento de Informática

Leia mais

Seleção Baseada em Preço dos Melhores e Piores Provedores de Serviço em Rede de Sobreposição de Serviços Par-a-Par

Seleção Baseada em Preço dos Melhores e Piores Provedores de Serviço em Rede de Sobreposição de Serviços Par-a-Par Seleção Baseada em Preço dos Melhores e Piores Provedores de Serviço em Rede de Sobreposição de Serviços Par-a-Par Renato Balestrin Júnior 1, Adriano Fiorese 1 1 Departamento de Ciência da Computação (DCC)

Leia mais

Verificação de Impressões Digitais usando Algoritmos Genéticos

Verificação de Impressões Digitais usando Algoritmos Genéticos 1. Introdução Verificação de Impressões Digitais usando Algoritmos Genéticos Matheus Giovanni Pires, Fernando Vieira Duarte, Adilson Gonzaga Escola de Engenharia de São Carlos Universidade de São Paulo

Leia mais

Uma Análise da História do VEM, WBVS e WMSWM

Uma Análise da História do VEM, WBVS e WMSWM VEM Uma Análise da História do VEM, WBVS e WMSWM Renato Novais, Thiago S. Mendes, Fernando Teles Instituto Federal da Bahia (IFBA) Salvador Bahia Brasil {renato,thiagosouto,fernandoteles}@ifba.edu.br Abstract.

Leia mais

Fabrício J. Barth. Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com

Fabrício J. Barth. Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com Uma Introdução à Mineração de Informações Fabrício J. Barth Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com Outubro de 2010 Objetivo Apresentar

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

8 Bibliografia. ACEAUME, E. et al. On The Formal Specification of Group Membership Services. INRIA, 1995, 15 p. Relatório Técnico TR95-1534.

8 Bibliografia. ACEAUME, E. et al. On The Formal Specification of Group Membership Services. INRIA, 1995, 15 p. Relatório Técnico TR95-1534. Bibliografia 88 8 Bibliografia ACEAUME, E. et al. On The Formal Specification of Group Membership Services. INRIA, 1995, 15 p. Relatório Técnico TR95-1534. AMBRIOLA, V.; TORTORA, G. Advances in Software

Leia mais

Table 1. Dados do trabalho

Table 1. Dados do trabalho Título: Desenvolvimento de geradores de aplicação configuráveis por linguagens de padrões Aluno: Edison Kicho Shimabukuro Junior Orientador: Prof. Dr. Paulo Cesar Masiero Co-Orientadora: Prof a. Dr. Rosana

Leia mais

Paralelização de Tarefas de Mineração de Dados Utilizando Workflows Científicos 1

Paralelização de Tarefas de Mineração de Dados Utilizando Workflows Científicos 1 Paralelização de Tarefas de Mineração de Dados Utilizando Workflows Científicos 1 Carlos Eduardo Barbosa, Eduardo Ogasawara, Daniel de Oliveira, Marta Mattoso PESC COPPE Universidade Federal do Rio de

Leia mais

Antonio Gomes de Araujo Laboratório de Eletrônica Industrial, Escola SENAI Anchieta São Paulo

Antonio Gomes de Araujo Laboratório de Eletrônica Industrial, Escola SENAI Anchieta São Paulo Antonio Gomes de Araujo Laboratório de Eletrônica Industrial, Escola SENAI Anchieta São Paulo Toshi-ichi Tachibana Departamento de Engenharia Naval e Oceânica, Escola Politécnica da Universidade São Paulo

Leia mais

USO DOS CONCEITOS DE INTERAÇÃO HUMANO-COMPUTADOR NO DESENVOLVIMENTO WEB PARA EDUCAÇÃO A DISTÂNCIA

USO DOS CONCEITOS DE INTERAÇÃO HUMANO-COMPUTADOR NO DESENVOLVIMENTO WEB PARA EDUCAÇÃO A DISTÂNCIA Discutindo a visibilidade da EaD Pública no Brasil USO DOS CONCEITOS DE INTERAÇÃO HUMANO-COMPUTADOR NO DESENVOLVIMENTO WEB PARA EDUCAÇÃO A DISTÂNCIA Priscilla Márcia Scarpelli Bastos 1, Diogo Marcos de

Leia mais

PROCESSAMENTO TEXTUAL EM PÁGINAS DA WEB

PROCESSAMENTO TEXTUAL EM PÁGINAS DA WEB PROCESSAMENTO TEXTUAL EM PÁGINAS DA WEB Aluno: Pedro Lazéra Cardoso Orientador: Eduardo Sany Laber Antecedentes Na primeira fase da Iniciação Científica, o aluno deu continuidade ao projeto que estava

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

PgSimilar: Uma ferramenta open source para suporte a consultas por similaridade no PostgreSQL

PgSimilar: Uma ferramenta open source para suporte a consultas por similaridade no PostgreSQL PgSimilar: Uma ferramenta open source para suporte a consultas por similaridade no PostgreSQL Eduardo N. Borges *1, Carina F. Dorneles 2 1 Instituto de Informática Universidade Federal do Rio Grande do

Leia mais

SISTEMA DE APOIO À DECISÃO DE INFORMAÇÕES ESPACIAIS VIA WEB PARA TRANSPORTE PÚBLICO URBANO

SISTEMA DE APOIO À DECISÃO DE INFORMAÇÕES ESPACIAIS VIA WEB PARA TRANSPORTE PÚBLICO URBANO SISTEMA DE APOIO À DECISÃO DE INFORMAÇÕES ESPACIAIS VIA WEB PARA TRANSPORTE PÚBLICO URBANO Rony Marcelo Arteaga Velasquez Pastor Willy Gonzales-Taco SISTEMA DE APOIO À DECISÃO DE INFORMAÇÕES ESPACIAIS

Leia mais

Autor(es) TIAGO CINTO. Orientador(es) CECÍLIA SOSA ARIAS PEIXOTO. Apoio Financeiro FAPIC/UNIMEP. 1. Introdução

Autor(es) TIAGO CINTO. Orientador(es) CECÍLIA SOSA ARIAS PEIXOTO. Apoio Financeiro FAPIC/UNIMEP. 1. Introdução 19 Congresso de Iniciação Científica MODULO DE GERÊNCIA DE INTERFACES COM O USUÁRIO: ESTUDO, DEFINIÇÃO E ELABORAÇÃO DE INTERFACES INTELIGENTES PARA A FERRAMENTA KIRA Autor(es) TIAGO CINTO Orientador(es)

Leia mais

A experiência do TECPAR

A experiência do TECPAR Inteligência Artificial em aplicações industriais A experiência do TECPAR Dr. Eng. Milton Pires Ramos Centro de Engenharia de Sistemas Inteligentes Empresa pública vinculada à Secretaria de Estado da Ciência,

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Em Busca de uma Arquitetura de Referência para Frameworks de Aplicação Dirigidos por Modelos para Sistemas de Informação

Em Busca de uma Arquitetura de Referência para Frameworks de Aplicação Dirigidos por Modelos para Sistemas de Informação Em Busca de uma Arquitetura de Referência para Frameworks de Aplicação Dirigidos por Modelos para Sistemas de Informação Valdemar Vicente GRACIANO NETO 1 ; Juliano Lopes DE OLIVEIRA 1 1 Instituto de Informática

Leia mais

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA Daniel Gonzaga dos Santos 1 Faculdade Cidade de João Pinheiro Resumo: Este artigo aborda as etapas para

Leia mais

PESQUISA DE INFORMAÇÕES TÉCNICAS E CIENTÍFICAS NA INTERNET. OLIVEIRA, Simone Lucas Gonçalves de

PESQUISA DE INFORMAÇÕES TÉCNICAS E CIENTÍFICAS NA INTERNET. OLIVEIRA, Simone Lucas Gonçalves de PESQUISA DE INFORMAÇÕES TÉCNICAS E CIENTÍFICAS NA INTERNET OLIVEIRA, Simone Lucas Gonçalves de SUMÁRIO ÍNDICE DE ILUSTRAÇÕES... 3 1. INTRODUÇÃO... 4 2. CONCEITOS SOBRE A INTERNET... 4 3. ESTRATÉGIAS DE

Leia mais

Construindo Axiomas e Avaliando Ontologias em ODEd

Construindo Axiomas e Avaliando Ontologias em ODEd Construindo Axiomas e Avaliando Ontologias em ODEd Vítor Estêvão Silva Souza, Ricardo de Almeida Falbo Departamento de Informática da Universidade Federal do Espírito Santo Av. Fernando Ferrari, CEP 29060-900,

Leia mais

Classes Funcionais 21

Classes Funcionais 21 Classes Funcionais 21 3 Classes Funcionais Em todo trabalho de classificação funcional é necessário determinar quais serão as classes funcionais utilizadas. Esta divisão não se propõe a ser extensiva,

Leia mais

Um processo para construção de software mais transparente

Um processo para construção de software mais transparente Um processo para construção de software mais transparente Eduardo Almentero 1, and Julio Cesar Sampaio do Prado Leite 1 1 Pontifícia Universidade Católica do Rio de Janeiro, PUC - Rio, Brasil {ealmentero,

Leia mais

Test-Module: uma ferramenta para gerenciamento de testes de software integrada ao FireScrum

Test-Module: uma ferramenta para gerenciamento de testes de software integrada ao FireScrum Test-Module: uma ferramenta para gerenciamento de testes de software integrada ao FireScrum Audrey B. Vasconcelos, Iuri Santos Souza, Ivonei F. da Silva, Keldjan Alves Centro de Informática Universidade

Leia mais

Aplicação de um Metamodelo de Contexto a uma Tarefa de Investigação Policial

Aplicação de um Metamodelo de Contexto a uma Tarefa de Investigação Policial Aplicação de um Metamodelo de Contexto a uma Tarefa de Investigação Policial Lucas A. de Oliveira, Rui A. R. B. Figueira, Expedito C. Lopes Mestrado em Sistemas e Computação Universidade de Salvador (UNIFACS)

Leia mais

Agentes de Mineração de Imagens de Satélite

Agentes de Mineração de Imagens de Satélite Agentes de Mineração de Imagens de Satélite Ciro D. G. Moura 1, Nicksson C. A. Freitas 2, Marcelino P. S. Silva 1 ¹Programa de Pós-Graduação em Ciência da Computação, Universidade do Estado do Rio Grande

Leia mais

Extração de Atributos e Inferência Gramatical para Reconhecimento de Comportamentos em Animais

Extração de Atributos e Inferência Gramatical para Reconhecimento de Comportamentos em Animais Extração de Atributos e Inferência Gramatical para Reconhecimento de Comportamentos em Animais Bruno Brandoli Machado 1 1. Antecedentes e Justificativa O estudo do comportamento animal é extremamente importante

Leia mais

Pagerank para Ordenação de Resultados em Ferramenta de Busca na Web

Pagerank para Ordenação de Resultados em Ferramenta de Busca na Web Pagerank para Ordenação de Resultados em Ferramenta de Busca na Web Leandro Zulian Gallina 1, Roberto Rosa Júnior 1 1 Instituto de Informática Universidade Federal do Rio Grande do Sul (UFRGS) Porto Alegre

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Tópicos de Ambiente Web Conceitos Fundamentais Redes de Dados

Tópicos de Ambiente Web Conceitos Fundamentais Redes de Dados Tópicos de Ambiente Web Conceitos Fundamentais Redes de Dados Professora: Sheila Cáceres Computador Dispositivo eletrônico usado para processar guardar e tornar acessível informação. Tópicos de Ambiente

Leia mais

MANUAL DO MOODLE VISÃO DO ALUNO

MANUAL DO MOODLE VISÃO DO ALUNO MANUAL DO MOODLE VISÃO DO ALUNO Desenvolvido por: Patricia Mariotto Mozzaquatro SUMÁRIO 1 INTRODUÇÃO....03 2 O AMBIENTE MOODLE......03 2.1 Quais as caixas de utilidade que posso adicionar?...04 2.1.1 Caixa

Leia mais

Dublin Core e MARC 21 : um estudo de correspondência de elementos de metadados

Dublin Core e MARC 21 : um estudo de correspondência de elementos de metadados Dublin Core e MARC 21 : um estudo de correspondência de elementos de metadados Maria das Dores Rosa Alves¹, Marcia Izabel Fugisawa Souza¹ ¹Embrapa Informática Agropecuária Caixa postal 6014 Campinas, SP

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Se observarmos nos diferentes livros. Planejamento de Testes a partir de Casos de Uso

Se observarmos nos diferentes livros. Planejamento de Testes a partir de Casos de Uso Planejamento de Testes a partir de Casos de Uso Arilo Cláudio Dias Neto ariloclaudio@gmail.com É Bacharel em Ciência da Computação formado na Universidade Federal do Amazonas, Mestre em Engenharia de Sistemas

Leia mais

Modelagem do Aprendizado de Grupos de Alunos em Ambientes Colaborativos Utilizando Data Mining

Modelagem do Aprendizado de Grupos de Alunos em Ambientes Colaborativos Utilizando Data Mining Modelagem do Aprendizado de Grupos de Alunos em Ambientes Colaborativos Utilizando Data Mining Thereza Patrícia Pereira Padilha 1,2, Leandro Maciel Almeida 1, João Bosco da Mota Alves 2 1 Centro Universitário

Leia mais

Análise de rede de termos em Sistemas Embarcados através de análise da rede de termos em títulos de trabalhos científicos

Análise de rede de termos em Sistemas Embarcados através de análise da rede de termos em títulos de trabalhos científicos Análise de rede de termos em Sistemas Embarcados através de análise da rede de termos em títulos de trabalhos científicos Jansen Souza, Moacir L. Mendonça Júnior, Alisson V. Brito e Alexandre N. Duarte

Leia mais

ENSINET/NAV: UMA FERRAMENTA PARA ESTRUTURAÇÃO DE CURSOS BASEADOS EM OBJETOS DE APRENDIZAGEM *

ENSINET/NAV: UMA FERRAMENTA PARA ESTRUTURAÇÃO DE CURSOS BASEADOS EM OBJETOS DE APRENDIZAGEM * ENSINET/NAV: UMA FERRAMENTA PARA ESTRUTURAÇÃO DE CURSOS BASEADOS EM OBJETOS DE APRENDIZAGEM * Diego Lemos de Souza ** Graçaliz Pereira Dimuro *** Antônio Carlos da Rocha Costa **** Raquel Mello de Miranda

Leia mais

Como os Mecanismos de Busca da Web Indexam Páginas HTML

Como os Mecanismos de Busca da Web Indexam Páginas HTML Como os Mecanismos de Busca da Web Indexam Páginas HTML Fernando Campos campos@dcc.ufmg.br Departamento de Ciência da Computação Universidade Federal de Minas Gerais Marcello Peixoto Bax bax@eb.ufmg.br

Leia mais

Recuperação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília

Recuperação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Recuperação Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília 1 2 Contexto Grande quantidade de informações são produzidas e disponibilizadas diariamente Com a elevada

Leia mais

SISTEMA COMPUTACIONAL PARA ANÁLISES DE DADOS EM AGRICULTURA DE PRECISÃO

SISTEMA COMPUTACIONAL PARA ANÁLISES DE DADOS EM AGRICULTURA DE PRECISÃO UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO INSTITUTO DE TECNOLOGIA DEPARTAMENTO DE ENGENHARIA PROJETO SISTEMA COMPUTACIONAL PARA ANÁLISES DE DADOS EM AGRICULTURA DE PRECISÃO ALUNO RICARDO CARDOSO TERZELLA

Leia mais

Um Simulador para Avaliação da Antecipação de Tarefas em Sistemas Gerenciadores de Workflow

Um Simulador para Avaliação da Antecipação de Tarefas em Sistemas Gerenciadores de Workflow Um Simulador para Avaliação da Antecipação de Tarefas em Sistemas Gerenciadores de Workflow Resumo. A fim de flexibilizar o fluxo de controle e o fluxo de dados em Sistemas Gerenciadores de Workflow (SGWf),

Leia mais

TPref-SQL: uma linguagem de consultas para bancos de dados com suporte a preferências temporais

TPref-SQL: uma linguagem de consultas para bancos de dados com suporte a preferências temporais TPref-SQL: uma linguagem de consultas para bancos de dados com suporte a preferências temporais Autor: Marcos Roberto Ribeiro 1, Orientadora: Sandra Aparecida de Amo 1 1 Programa de Pós-Graduação em Ciência

Leia mais

Representando Características Autonômicas nos Processos de Negócio

Representando Características Autonômicas nos Processos de Negócio Representando Características Autonômicas nos Processos de Negócio Karolyne Oliveira, Tarcísio Pereira, Emanuel Santos, Jaelson Castro Universidade Federal de Pernambuco UFPE, Recife, PE 50 740-560, Brazil

Leia mais

ADAPTANDO UMA APLICAÇÃO PARA CLOUD: UMA ANÁLISE ENTRE OS ESFORÇOS UTILIZADOS

ADAPTANDO UMA APLICAÇÃO PARA CLOUD: UMA ANÁLISE ENTRE OS ESFORÇOS UTILIZADOS ADAPTANDO UMA APLICAÇÃO PARA CLOUD: UMA ANÁLISE ENTRE OS ESFORÇOS UTILIZADOS Cleverson Nascimento de Mello¹, Claudete Werner¹, Gabriel Costa Silva² ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil

Leia mais

Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente

Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente Carla Gomes de Faria1, Ismênia Ribeiro de Oliveira1, Rosario Girardi1 1Universidade Federal do Maranhão (UFMA)

Leia mais

FERRAMENTA PARA CRIAÇÃO DE BASES DE CONHECIMENTO NA FORMA DE ONTOLOGIA OWL A PARTIR DE DADOS NÃO ESTRUTURADOS

FERRAMENTA PARA CRIAÇÃO DE BASES DE CONHECIMENTO NA FORMA DE ONTOLOGIA OWL A PARTIR DE DADOS NÃO ESTRUTURADOS FERRAMENTA PARA CRIAÇÃO DE BASES DE CONHECIMENTO NA FORMA DE ONTOLOGIA OWL A PARTIR DE DADOS NÃO ESTRUTURADOS Aluno: Allan Renato Sabino Orientador: Roberto Heinzle Roteiro Introdução; Objetivos; Fundamentação

Leia mais

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron. 1024 UMA ABORDAGEM BASEADA EM REDES PERCEPTRON MULTICAMADAS PARA A CLASSIFICAÇÃO DE MASSAS NODULARES EM IMAGENS MAMOGRÁFICAS Luan de Oliveira Moreira¹; Matheus Giovanni Pires² 1. Bolsista PROBIC, Graduando

Leia mais

Uso de sumários humanos nos idiomas português e inglês no modelo Cassiopeia

Uso de sumários humanos nos idiomas português e inglês no modelo Cassiopeia Uso de sumários humanos nos idiomas português e inglês no modelo Cassiopeia Jésyka Milleny Az. Gonçalves, Marcus Vinicius C. Guelpeli Departamento de Sistemas e Computação Universidade Universidade Federal

Leia mais

Guia de referência rápida

Guia de referência rápida Guia de referência rápida www.sciencedirect.com O ScienceDirect é a base de dados de texto completo e revisado por pares da Elsevier com aproximadamente.000 livros e mais de.00 periódicos. Além de buscas

Leia mais

BIBLIOTECA UNIVATES. Área física e serviços prestados pela Biblioteca

BIBLIOTECA UNIVATES. Área física e serviços prestados pela Biblioteca BIBLIOTECA UNIVATES Área física e serviços prestados pela Biblioteca O prédio da Biblioteca tem área total de 2.696,91m². Abriga em seus três pavimentos, além do acervo, espaço para estudos (individual

Leia mais

PROPAGAÇÃO DE INFLUÊNCIA EM REDES SOCIAIS

PROPAGAÇÃO DE INFLUÊNCIA EM REDES SOCIAIS PROPAGAÇÃO DE INFLUÊNCIA EM REDES SOCIAIS Júlia Coelho Furlani Faculdade de Engenharia de Computação / CEATEC juliacfurlani@gmail.com Juan Manuel Adán Coello Grupo de Pesquisa em Sistemas Inteligentes

Leia mais

Uso do ambiente SIMULA para Simulação do Domínio de Resgate RoboCup

Uso do ambiente SIMULA para Simulação do Domínio de Resgate RoboCup Uso do ambiente SIMULA para Simulação do Domínio de Resgate RoboCup Reinaldo Bianchi e Anna Helena Reali-Costa Laboratório de Técnicas Inteligentes Departamento de Engenharia da Computação Universidade

Leia mais

3 Ferramentas de busca

3 Ferramentas de busca 3 Ferramentas de busca A Internet se transformou em um vasto repositório de informações. Podemos encontrar sites sobre qualquer assunto, de futebol a religião. O difícil, porém é conseguir encontrar a

Leia mais

Uma Proposta para o Uso de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank*

Uma Proposta para o Uso de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank* Uma Proposta para o Uso de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank* Glauber Rodrigues da Silva, Renata de Matos Galante, Deise de Brum Saccol Instituto de

Leia mais

XX Seminário Nacional de Distribuição de Energia Elétrica SENDI 2012-22 a 26 de outubro Rio de Janeiro - RJ - Brasil

XX Seminário Nacional de Distribuição de Energia Elétrica SENDI 2012-22 a 26 de outubro Rio de Janeiro - RJ - Brasil XX Seminário Nacional de Distribuição de Energia Elétrica SENDI 2012-22 a 26 de outubro Rio de Janeiro - RJ - Brasil Rosimeri Xavier de Oliveira Light Serviços de Eletricidade S/A rosimeri.oliveira@light.com.br

Leia mais

Frameworks. Pasteur Ottoni de Miranda Junior

Frameworks. Pasteur Ottoni de Miranda Junior Frameworks Pasteur Ottoni de Miranda Junior 1-Definição Apesar do avanço das técnicas de desenvolvimento de software, a construção de software ainda é um processo extremamente complexo.a reutilização tem

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

PROJETO: PRODUTO 4 RELATÓRIO FINAL DO DESENVOLVIMENTO E IMPLANTAÇÃO DO SISTEMA DE INFORMAÇÕES

PROJETO: PRODUTO 4 RELATÓRIO FINAL DO DESENVOLVIMENTO E IMPLANTAÇÃO DO SISTEMA DE INFORMAÇÕES Nome da Empresa: DEPARTAMENTO INTERSINDICAL DE ESTATÍSTICA E ESTUDOS SÓCIO-ECONÔMICOS (DIEESE) PROJETO: PROJETO DE COOPERAÇÃO TÉCNICA BRA/IICA/03/005 PARTICIPAÇÃO SOCIAL NÚMERO DO CONTRATO: 205037 TEMA:

Leia mais

PARANÁ GOVERNO DO ESTADO

PARANÁ GOVERNO DO ESTADO PARANÁ GOVERNO DO ESTADO COLÉGIO ESTADUAL DE PARANAVAÍ ENSINO FUNDAMENTAL, MÉDIO, NORMAL E PROFISSIONAL CURSO TÉCNICO EM INFORMÁTICA DISCIPLINA: INTERNET E PROGRAMAÇÃO WEB 1º MÓDULO SUBSEQUENTE MECANISMOS

Leia mais

Introdução. Nesta guia você aprenderá:

Introdução. Nesta guia você aprenderá: 1 Introdução A criação de uma lista é a primeira coisa que devemos saber no emailmanager. Portanto, esta guia tem por objetivo disponibilizar as principais informações sobre o gerenciamento de contatos.

Leia mais

Um estudo sobre o uso de agentes de internet em buscas (Junho 2010)

Um estudo sobre o uso de agentes de internet em buscas (Junho 2010) IA009 INTRODUÇÃO À TEORIA DE AGENTES 1 Um estudo sobre o uso de agentes de internet em buscas (Junho 2010) Alexandre Fatayer Canova, RA 107214, UNICAMP Agentes de internet são parte integrante da web na

Leia mais

5 th Brazilian Conference of In form ation Design

5 th Brazilian Conference of In form ation Design CIDI 2013 6TH CIDI 5TH InfoDesign 6TH CONGIC 6 th Inform ation Design International Conference 5 th Brazilian Conference of In form ation Design 6 th Inform ation Design Student Conference Catálogo de

Leia mais

2. Sistemas Multi-Agentes (Multi-Agent System - MAS)

2. Sistemas Multi-Agentes (Multi-Agent System - MAS) AORML uma linguagem para modelagem de uma aplicação Multiagentes: Uma Aplicação no Sistema Expertcop. Hebert de Aquino Nery, Daniel Gonçalves de Oliveira e Vasco Furtado. Universidade de Fortaleza UNIFOR

Leia mais

INTERNET -- NAVEGAÇÃO

INTERNET -- NAVEGAÇÃO Página 1 INTRODUÇÃO Parte 1 O que é a Internet? A Internet é uma rede mundial de computadores, englobando redes menores distribuídas por vários países, estados e cidades. Ao contrário do que muitos pensam,

Leia mais