CitationFinder: Um Sistema Baseado em Conhecimento para Classificação de Páginas de Publicações na Web

Tamanho: px
Começar a partir da página:

Download "CitationFinder: Um Sistema Baseado em Conhecimento para Classificação de Páginas de Publicações na Web"

Transcrição

1 CitationFinder: Um Sistema Baseado em Conhecimento para Classificação de Páginas de Publicações na Web Mariana Lara Neves, Flávia de Almeida Barros Centro de Informática - Universidade Federal de Pernambuco Caixa Postal Recife - PE - Brazil {mln, ~fab} Abstract. This regularity allows the automatic identification of such pages by computational systems based on domain knowledge. The work presented here describes the CitationFinder, a knowledge-based system for the automatic classification of Web pages which contain citations of technical and scientific publications. The systems counts on a knowledge base of production rules with associated certainty factors, to improve the system's precision. This knowledge base was constructed by analyzing a corpus of pages. The system's performance was very satisfactory: 88,6% precision and 97% recall for a test corpus of 300 pages. Resumo. Este trabalho descreve um sistema baseado em conhecimento para a classificação automática de páginas Web contendo citações de publicações técnicas e científicas, o CitationFinder. O sistema conta com uma base de regras de produção com fatores de certeza associados, a fim de melhorar a precisão dos resultados. Esta base foi construída a partir da análise de um corpus de páginas Web. O desempenho do sistema foi bastante satisfatório: 88,6% de precisão e 97% de cobertura para um corpus de teste de 300 páginas. 1. Introdução O aumento vertiginoso, nas últimas duas décadas, da quantidade de repositórios de documentos digitalizados, tais como bibliotecas digitais, Intranets e a Internet, facilitou imensamente o rápido acesso a informações atualizadas sobre os mais diversos assuntos. Contudo, este crescimento descontrolado e desordenado trouxe problemas inexistentes nos antigos sistemas para armazenamento e recuperação de informação. Uma dificuldade séria a se enfrentar é a localização de documentos relevantes na Internet (em especial, na World Wide Web). Como sabemos, a precisão dos sistemas de busca existentes (e.g., Radix, Altavista ) não é muito boa, levando o usuário, algumas vezes, a perder horas para localizar documentos de seu interesse. Para facilitar as buscas, uma solução seria a adoção de hierarquias de classes, de forma que os documentos indexados pelos engenhos de busca estivessem associados a uma ou mais classes pré-fixadas, como é o caso das bibliotecas digitais. Até o momento, contudo, tal solução não se mostrou viável, devido a [Barros et al. 1998]: imensa quantidade de assuntos presentes nas páginas Web; dificuldade em se identificar

2 automaticamente a(s) classe(s) de cada documento, falta de uma hierarquia geral de consenso. Contudo, é possível a identificação de classes (domínios) de documentos na Web que exibem alguma regularidade no formato e no conteúdo apresentados, possibilitando, ainda que árdua, a tarefa de classificá-los automaticamente. Exemplos desses domínios são: páginas de hotéis, de restaurantes, de universidades, de chamadas de conferências, de produção científica, entre outras. Este trabalho apresenta um sistema para a classificação automática de páginas Web contendo citações de publicações técnicas e científicas, o CitationFinder [Neves 2001]. Páginas recuperadas a partir de consultas a engenhos de busca existentes na Web são classificadas e armazenadas em um banco de dados, ficando disponíveis para acesso via Web. A escolha deste domínio deveu-se, principalmente, a três fatores: (1) existe uma grande quantidade desse tipo de página na Web, o que demonstra o interesse dos usuários pelo tópico; (2) essas páginas exibem alguma regularidade no seu formato de apresentação dos dados, o que possibilita o seu reconhecimento automático. O sistema foi implementado como um plug-in para engenhos de busca, a fim de não duplicar esforços na indexação dos documentos disponíveis na Web. O classificador foi construído com base em técnicas da Inteligência Artificial Simbólica, contando com uma base de regras de produção com fatores de certeza associados, a fim de melhorar a precisão dos resultados. A base de conhecimento foi construída a partir de um corpus de 1000 documentos coletados e etiquetados manualmente. O sistema construído possui diversas vantagens, como a portabilidade, modularidade, extensibilidade (reusabilidade) e facilidade de uso. O protótipo foi implementado em Java e a base de regras é executada pela máquina de inferência JEOPS [Figueira Filho & Ramalho 2000], implementada também em Java. O CitationFinder apresentou resultados muito satisfatórios: 88,6% de precisão e 97% de cobertura. De moda a melhor avaliar os resultados, foram realizados experimentos comparativos com três algoritmos de aprendizagem de máquina (Árvores de Decisão, Regras de Indução e Naive Bayes).Os resultados obtidos com estes algoritmos foram equivalentes ou inferiores às taxas obtidas com o CitationFinder, o que comprova a eficiência da abordagem adotada. A próxima seção descreve alguns trabalhos relacionados, seguida da seção 3 que apresenta, de forma sucinta, o estado da arte em classificação automática de texto. A seção 4 apresenta o sistema CitationFinder, seguida da seção 5, com detalhes de implementação do protótipo. A seção 6 mostra a avaliação do protótipo e descreve os experimentos com aprendizagem de máquina, detalhando os resultados obtidos em cada abordagem. Finalmente, a seção 7 traz conclusões e indicações de trabalhos futuros. 2. Trabalhos Relacionados Apesar da grande demanda, poucos são os sistemas disponíveis na Internet que lidam com publicações científicas. Foram identificados quatro sistemas para este fim: o WebFind [Monge & Elkan 1996], o Cora [McCallum et al. 2000], o CiteSeer [Bollacker et al. 1998] e o CiFi [Loke et al. 1996]. O WebFind é um sistema para localização na Internet de documentos científicos a partir dos nomes dos autores. Ele utiliza duas fontes externas de informação: o

3 MELVYL, um serviço de biblioteca da Universidade de Califórnia e o NetFind, um serviço que oferece o provedor de Internet e o endereço eletrônico do autor. Primeiro, o usuário informa o artigo desejado (por uma combinação dos nomes dos autores, palavras do título, etc.), então o WebFind faz uma consulta ao INSPEC para recuperar a afiliação institucional do(s) autor(es), e finalmente usa o NetFind para localizar o endereço na Internet desta afiliação. Uma vez que o servidor foi identificado, WebFind segue os links até o artigo desejado seja localizado. A principal desvantagem do WebFind é que ele só cobre documentos cujas as afiliações de autores estejam presentes no banco de dados de MELVYL. O Cora é um engenho de busca específico para a localização de produção científica da área de Ciência da Computação. Ele utiliza um robô que percorre a Web a partir das páginas dos departamentos e laboratórios de Ciência da Computação, e coleta todos os documentos no formato Postscript. Estes documentos são analisados para a extração de informação (título, nomes de autores e afiliações, resumo e referências). Cada referência individual é isolada e todas as citações para o mesmo artigos e são associadas ao mesmo. Os documentos coletados são classificados sob uma hierarquia de categorias da Ciência da Computação, e são armazenados em um banco de dados específico, disponível por para busca por palavras-chave. O sistema é limitado à área da Ciência da Computação e aos arquivos dos artigos, ignorando aquelas citações que não contêm um link para o arquivo correspondente. O CiteSeer consiste em três componentes principais: um agente para automaticamente localizar e coletar publicações no formato Postscript ou HTML por meio de consultas aos engenhos de busca tradicionais; um parser para a extração de algumas informações (URL, cabeçalho, resumo, introdução, citações) dos documentos carregados; e uma interface de acesso à base de dados do sistema. Adicionalmente, este sistema agrupa citações para um mesmo artigo e tenta localizar documentos relacionados ao mesmo assunto. Diferentemente do Cora, o CiteSeer permite não só a busca por documentos que possuem seu respectivo arquivo, mas também pelas citações que aparecem nesses documentos, mesmo que o sistema não possua o arquivo desta citação em sua base. O CiFi utiliza um agente inteligente para a busca de citação de publicações na área de Ciência da Computação. O usuário tem que informar o autor e o título do artigo e então o CiFi executa quatro estratégias alternativas: procura a versão em HTML do artigo (por meio de consulta ao Lycos); procura a página pessoal do autor (também através do Lycos); procura a página do departamento de Ciência da Computação do autor; ou procura arquivos de relatório técnicos (o Unified Computer Science Technical Reports e o Networked Computer Science Technical Reports Library ). A principal desvantagem do CiFi é que ele requer o título e o autor do artigo, não permitindo a busca por documentos relacionados a um determinado assunto, sendo ainda limitado à área da Ciência da Computação. 3. Classificação Automática de Documentos Duas são as técnicas existentes para a construção de classificadores: a criação manual de sistemas baseados em conhecimento, ou por aprendizagem automática. Em geral, os sistemas baseados em conhecimento são compostos de dois elementos principais: uma base de conhecimento e um motor de inferência [Russell & Norvig 1995].

4 Vários são os experimentos e sistemas de classificação de documentos baseados em técnicas de aprendizagem, como por exemplo: as árvores de decisão [Lewis & Ringuette 1994], e a aprendizagem de regras [Apté et al. 1994]. A aprendizagem Bayesiana também já foi aplicada à classificação de documentos [McCallum et al. 2000], assim como as Redes Neurais Artificiais [Wiener et al. 1995]. Dentre as abordagens de aprendizagem de máquina, a indução de regras é uma das mais aplicadas à tarefa de classificação de documentos, devido a sua boa precisão. As regras (manual ou automaticamente construídas) possuem vantagens potenciais, como melhor capacidade de explanação, um modelo teórico mais forte e o fato de não serem mutuamente excludentes (como ocorre nas árvores de decisão). 4. CitationFinder Esta seção apresenta detalhes sobre o CitationFinder, um sistema para meta-busca e classificação de páginas Web de citações de publicações. Como já comentado, trata-se de um sistema baseado em conhecimento construído manualmente. A escolha da abordagem baseada em conhecimento deveu-se, principalmente, a dois aspectos: (1) trabalhos anteriores na área de classificação de documentos mostravam que os sistemas baseados em conhecimento [Hayes & Weinstein 1990] conseguiam obter resultados superiores aos de sistemas construídos automaticamente por aprendizagem [Lewis & Ringuette 1994; Wiener et al. 1995; Apté et al. 1994]; e (2) a consideração de relações estruturais (ordem de palavras, localização de termos em tags específicas) é mais facilmente implementada por meio de regras escritas manualmente, uma vez que a aprendizagem automática dessas características só é possível por meio da lógica de primeira ordem, que demanda o uso de algoritmos de ordem exponencial [Zucker & Ganascia 1998]. O CitationFinder objetiva a busca de páginas Web de publicação, isto é, páginas HTML que contenham citações de publicações, independente da presença ou não de seus respectivos arquivos (Postscript ou PDF) e da área de pesquisa relacionada. Todo o processamentos dos documentos é feito off-line, de modo que o único processo on-line é a busca na sua base de índices. A fim de evitar o trabalho e o custo de indexar a Web diretamente, o CitationFinder realiza "meta buscas" através de engenhos de busca disponíveis (e.g., Yahoo, Radix). Assim sendo, o classificador executa consultas baseadas em palavras-chave do domínio, e classifica as páginas eletrônicas (em HTML) retornadas (cf. Figura 1), armazenando-as em uma base de índices específica, e, portanto, devolvendo ao usuário apenas as páginas que contêm citações de publicações (cf. Figura 2). Web Engenhos de Busca tradicionais Busca por palavras-chave do domínio Consulta Base de Índices Específica URLs reconhecidas positivamente CitationFinder

5 Como todo sistema baseado em conhecimento, a construção do CitationFinder seguiu quatro etapas de desenvolvimento [Turban 1992]: aquisição de conhecimento, formalização da base de conhecimento, implementação e testes (validação). Veremos a seguir detalhes sobre as três primeiras etapas de desenvolvimento. 4.1 Aquisição do Conhecimento A aquisição do conhecimento necessária para a construção das bases de conhecimento foi realizada com base em um corpus de 1000 páginas eletrônicas, sendo 700 positivas (páginas de publicação) e 300 negativas. Este corpus foi manualmente coletado através da análise de páginas retornadas por meta-buscas a engenhos de busca disponíveis na Web. Em seguida, foi feita uma análise das páginas selecionadas, a fim de identificarem-se suas regularidades (que permitiriam a identificação automática de tais páginas). A principal característica identificada foi a presença de blocos de citação, geralmente dispostos como uma lista numerada ou não (cf. Figura 2). Casos onde os blocos de citações estão separados apenas por parágrafos também são bastante encontrados, e, menos freqüentemente, encontram-se blocos inseridos em uma tabela, onde cada linha corresponde a um bloco. 4.2 Formalização e Implementação das Bases de Conhecimento O processamento das páginas no CitationFinder pode ser feito em duas etapas, sendo a primeira obrigatória e a segunda opcional (ver seção 4). As bases de conhecimento do sistema foram formalizadas e implementadas como um conjunto de regras de produção. Este conhecimento adquirido norteou a construção de três bases de conhecimento: 1. uma base de fatos composta por um dicionário de termos do domínio e padrões sintáticos; 2. uma base de regras para o reconhecimento dos blocos de citação (primeira etapa de processamento); 3. uma base de regras (com fatores de certeza associados) para a verificação de termos específicos em grupos de palavras (segunda etapa de processamento).

6 Dicionário do Domínio O dicionário de termos do domínio é utilizado nas duas etapas de reconhecimento das páginas, e constitui peça essencial de conhecimento do domínio. Através da observação dos exemplos coletados, foram definidas 11 classes de palavras indicativas de termos usualmente encontrados em páginas de publicações [Neves 2001]: Geral, Trabalho Impresso, Iniciais, Arquivo, Editora, Data, Volume da Edição, Número da Edição, Intervalo de Páginas, Localidade e Tipo de Evento. O dicionário do domínio foi escrito apenas para as línguas portuguesa e inglesa, com exceção dos nomes de localidades, que foram escritos também na língua de origem da localidade. Além dessas 11 classes, 6 padrões de termos são verificados, isto é, cadeias geralmente formadas por uma composição de caracteres específicos e algarismos: Arquivo (e.g., 1.5MB), Data (e.g., 11-fev-98), Número da Edição (e.g., no60), Páginas da Publicação (e.g., pp ), Tipo de Evento (e.g., AAAI'90) e Volume da Edição (e.g., vol60, v22). Estes padrões são tão importantes para o reconhecimento das páginas quanto as palavras listadas no dicionário do domínio, e por isso, também podem ser considerados como parte da base de fatos. Bases de Regras Como já comentado, duas são as etapas de processamento do sistema, cada uma com sua base de regras construída para fins específicos. A primeira etapa é responsável pelo reconhecimento das páginas de publicações através da identificação de cada bloco de citação isoladamente. Esses blocos podem ser reconhecidos por regras que utilizam combinações das possíveis cadeias que compõem uma citação (cf. Figura 3). SE houver uma cadeia de Tipo de Evento E houver uma cadeia de Intervalo de Páginas E houver uma cadeia de Data ENTÃO o texto é uma citação A segunda etapa de classificação é responsável pela identificação de termos do dicionário em grupos de textos, definidos a partir das tags do documento [Neves 2001]. A verificação desses termos é realizada por meio de um conjunto de regras específicas (cf. Figura 4) que contabilizam quantas palavras de uma mesma classe do dicionário do domínio estão presentes em cada grupo de texto considerado. Diferentemente das regras da primeira etapa, essas regras têm fatores de certeza (positivos ou negativos) associados, que indicam a chance da página ser classificada como positiva. O valor final obtido pela combinação dos fatores em cada regra disparada é comparado a um limiar, de modo a efetuar uma decisão binária de classificação. SE a freqüência da classe Geral no grupo Especial for de 1 a 20 ENTÃO o documento é positivo (0.83) 5. Protótipo Implementado Como comentado, o reconhecimento das páginas no sistema CitationFinder é realizado em duas etapas, cuja arquitetura é apresentada na Figura 5. A primeira etapa classifica a

7 página pelo reconhecimento da presença de blocos de citação. As páginas classificadas como negativas nesta etapa são passadas para a etapa 2. Aqui temos páginas que não contêm qualquer citação, sendo de fato negativas, e páginas onde as citações não estão organizadas em blocos característicos do domínio. Esta etapa tenta, portanto, identificar as páginas que possuem citações em formatos diversos. JEOPS documento HTML Base de Regras 1 Dicionário do domínio - Base de Regras 2 Dicionário do domínio + limiar Base de Índices Isolamento dos blocos de citações Classificador Separação dos grupos de texto Classificador + Primeiramente, um parser é responsável pela identificação e pelo isolamento dos trechos de texto relevantes contidos no documento. Uma estrutura em forma de árvore é construída a partir da página HTML de acordo com as tags identificadas. A partir daí, o sistema tenta isolar os blocos de citações, observando as tags identificadores de listas (numeradas ou não), tabelas, e em último caso, parágrafos. Em seguida, é efetuada uma verificação dos termos do dicionário do domínio e dos padrões sintáticos, não havendo a necessidade de uma separação de cada cadeia que compõe o bloco de citação. Tampouco há a necessidade de se diferenciar termos pertencentes a uma mesma classe do dicionário do domínio ou a um mesmo padrão. O reconhecimento final da página é realizado por meio de regras que verificam algumas combinações de cadeias de uma citação (cf. seção 4.2), e se classificada positivamente, sua URL é enviada a uma base de índices. Se classificada negativamente, a páginas será processada pela segunda etapa do sistema. Embora a maioria das páginas de publicações seja satisfatoriamente reconhecida na primeira etapa de processamento (91% dos exemplos positivos na fase de construção), algumas páginas contêm citações compostas de poucas cadeias que necessitariam de regras muito gerais. A segunda fase do sistema CitationFinder visa aumentar a cobertura do sistema, por meio da identificação de termos do dicionário do domínio em alguns grupos de texto do documento. Esses seis grupos de textos (Título, Comum, Especial, Lista, Tabela e Link) são criados pelo parser da segunda fase do sistema, a partir da natureza das tags em que o texto se encontra [Neves 2001]. Em seguida, é realizada uma verificação da presença dos termos do dicionário nos grupos considerados por meio de um conjunto de regras específicas (cf. seção 4.2). Analogamente ao que ocorre na primeira etapa, se classificada positivamente, a página será armazenada na base de índices, senão será classificada como negativa e descartada pelo sistema.

8 Todo o conhecimento utilizado para a classificação dos documentos está contido no dicionário do domínio, e nas bases de regras. Implementadas como regras JEOPS (Java Embedded Object Production System) [Figueira Filho & Ramalho 2000], as regras de produção estão agrupadas em diferentes módulos, portanto, são de fácil compreensão, manutenção e extensão. O JEOPS é um motor de inferência para sistemas baseados em regras de produção de primeira ordem, facilitando a criação de aplicativos Java voltados à área de Inteligência Artificial. 6. Avaliação do Sistema O CitationFinder foi avaliado com um corpus de teste composto por 300 páginas, sendo 200 positivas e 100 negativas. Vale frisar que este corpus é diferente do usado na construção do sistema, a fim de permitir uma avaliação mais realista do sistema construído. O desempenho foi medido através do cálculo dos parâmetros de precisão, cobertura e F-Measure [van Rijsbergen 1979]. Para o corpus usado na construção do CitationFinder (cf. Figura 6a), foram obtidos os valores de 91,1%, 96,7% e 93,8% para os parâmetros de precisão, cobertura e F-Measure, respectivamente. Para o corpus de teste (cf. Figura 6b), foram obtidos os valores de 88,6%, 97,0% e 92,6% para os mesmos parâmetros anteriores. Classificada positivamente Classificada negativamente Página Positiva (a) Página Negativa Classificada positivamente Classificada negativamente Página Positiva (b) Página Negativa corpora Experimentos adicionais com algoritmos de aprendizagem foram realizados visando uma comparação entre o desempenho do sistema CitationFinder e de classificadores construídos automaticamente. Foram testadas três abordagens: árvore de decisão, indutor de regras, e a técnica Naive Bayes. Esses classificadores foram construídos com o uso da ferramenta Weka (Waikato Environment for Knowledge Analysis), desenvolvida pela University of Waikato da Nova Zelândia. Os experimentos foram realizados com os mesmos corpora utilizados na construção e teste do CitationFinder. Um pré-processamento dos documentos foi realizado pela exclusão de palavras irrelevantes [Neves 2001] e eliminação de símbolos e sinais de pontuação. A seleção dos termos a serem considerados nesses experimentos foi realizada de acordo com três diferentes técnicas: pela medida da entropia [Maron 1961], pelo coeficiente de correlação [Ng et al. 1997] e pela técnica do χ2 [Ng et al. 1997]. O número de características adotado foram de 50, 100, 150 e 200, visando a obtenção da melhor configuração para cada um dos três classificadores considerados. Os valores obtidos (cf. Figura 7) mostram que o CitationFinder e os experimentos com Indução de Regras e Naive Bayes obtiveram resultados muito próximos, de acordo com o parâmetro do F-Measure. O bom resultado obtido pelo CitationFinder se deve à qualidade do conhecimento obtido durante a fase de aquisição, representado por meio de um dicionário do domínio e de bases de regras específicas para o reconhecimento de páginas de citação. Suas maiores vantagens em relação ao

9 experimento de melhor desempenho (Indução de Regras) são modularidade, extensibilidade e facilidade de uso. Precisão Cobertura F-Measure Indução de Regras 95% 92% 93,5% Árvores de Decisão 87% 90% 88,5% Naive Bayes 93% 91% 92% CitationFinder 88,6% 97% 92,6% 7. Considerações Finais Este trabalho apresentou o sistema CitationFinder, construído para a classificação de páginas de citações de publicação na Web. Trata-se de um sistema baseado em conhecimento que dispõe de um dicionário de termos do domínio e de duas bases de regras de produção para auxiliar a tarefa de classificação. As bases de conhecimento foram manualmente construídas através da análise detalhada de um corpus de 1000 documentos. As maiores contribuições deste trabalho foram: (1) a coleta de um corpus de 900 páginas de citações de publicações e 400 páginas negativas; (2) a criação de um dicionário do domínio e regras de produção para a classificação das páginas; (3) a criação de um sistema original, sem equivalente na literatura disponível; e (4) a realização de experimentos comparativos com aprendizagem. Algumas extensões a este trabalho poderiam ser efetuadas de modo a torná-lo ainda mais eficiente: (1) o reconhecimento de nomes próprios; (2) a coleta de novas páginas e extensão das bases de regras e do dicionário do domínio; (3) a busca automática de nomes próprios e de localidades (em sites geográficos); e (4) a integração do CitationFinder com o sistema ProdExt [Nunes 2000], cujo objetivo é o preenchimento automático de banco de dados específicos de produção científica. Referências Bibliográficas Apté, C.; Damerau, F. & Weiss, S. (1994) Automated Learning of Decision Rules for Text Categorization. ACM Transactions on Information Systems, Vol. 12(3), pp Barros, F. A. Gonçalves, P. F. & Santos, T. L. V. L. (1998) Providing Context to Web Searches: the Use of Ontologies to Enhance Web Search Engines' Accuracy. In Journal of the Brazilian Computer Society. Vol. 5(2), pp Bollacker, K. D.; Lawrence, S. & Giles, L. (1998) CiteSeer: An Autonomous Web Agent for Automatic Retrieval and Identification of Interesting Publications. Proc. of the 2nd International Conference on Autonomous Agents. ACM Press, New York, pp Figueira Filho, C. S. & Ramalho, G. L. (2000) JEOPS - The Java Embedded Object Production System. Lecture Notes in Artificial Intelligence, n.1952, Advances in Artificial Intelligence, pp

10 Hayes, P. J. & Weinstein, S. P. (1990) Construe-TIS: A System for Content-Based Indexing of a Database of News Stories. Second Annual Conference on Innovative Applications of Artificial Intelligence, pp Lewis, D. D. & Ringuette, M. (1994) A Comparison of Two Learning Algorithms for Text Categorization. In Third Annual Symposium on Document Analysis and Information Retrieval, pp Loke, S. W.; Davison, A. & Sterling, L. (1996) CiFi: An Intelligent Agent for Citation Finding on the World-Wide Web. In: Foo N, Goebel R (eds) Lecture Notes on Artificial Intelligence Series, no Springer-Verlag, London, pp Maron, M. E. (1961) Automatic Indexing: An Experimental Inquiry. Journal of ACM, Vol. 8, pp McCallum, A. K.; Nigam, K.; Rennie, J. & Seymore, K. (2000) Automating the Construction of Internet Portals with Machine Learning. Information Retrieval Journal, Vol. 3, pp Monge, A. E. & Elkan, C. P. (1996) The WebFind Tool for Finding Scientific Papers over the World Wide Web. Proceedings of the Third International Congress on Computer Science Research, Tijuana, Mexico. Neves, M. L. (2001) CitationFinder: Um Sistema de Meta-busca e Classificação de Páginas de Publicações na Web. Dissertação de Mestrado, Centro de Informática, UFPE. (http://www.cin.ufpe.br/~mln/) Ng, H. T.; Goh, W. B. & Low, K. L. (1997) Feature Selection, Perceptron learning and a Usability Case Study for Text Categorization. Proceedings of SIGIR-97, 20th ACM International Conference on Research and Development in Information Retrieval, pp , Philadelphia, PA, USA. Nunes, C. C. R. (2000) ProdExt: Um Wrapper para Extração de Produção Técnica e Científica de Páginas Eletrônicas. Dissertação de Mestrado, Centro de Informática, UFPE. Russell, S. & Norvig, P. (1995) Artificial Intelligence: A Modern Approach. Prentice Hall. van Rijsbergen, C. J. (1979) Information Retrieval. Department of Computer Science, University of Glasgow. Turban, E. (1992) Expert Systems and Applied Artificial Intelligence. Macmillan Pub. Co. Wiener, E.; Pedersen, J. O. & Weigend, A. S. (1995) A Neural Network Approach to Topic Spotting. In Proceedings of the 4th Symposium on Document Analysis and Information Retrieval, pp , Las Vegas, NV, USA, April Zucker, J. -D, & Ganascia, J. -G. (1996) Changes of Representation for Efficient Learning in Structural Domains. In International Conference in Machine Learning, Bary, Italie: Morgan Kauffman.

Recuperação de Imagens na Web Baseada em Informações Textuais

Recuperação de Imagens na Web Baseada em Informações Textuais Recuperação de Imagens na Web Baseada em Informações Textuais André Ribeiro da Silva Mário Celso Candian Lobato Universidade Federal de Minas Gerais Departamento de Ciência da Computação {arsilva,mlobato}@dcc.ufmg.br

Leia mais

MARACATU. A component search tool. Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes

MARACATU. A component search tool. Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes MARACATU A component search tool Especificação, Projeto e Implementação de uma Arquitetura para um Engenho de Busca de Componentes Vinicius Cardoso Garcia July 29, 2005 Agenda Introdução Especificação

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA

FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA FILTRAGEM DE INFORMAÇÃO NA WEB USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIA Daniel Mandelli Martins Faculdade de Engenharia de Computação CEATEC danielmartins@puc-campinas.edu.br Juan Manuel Adán Coello

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD RESUMO Thereza P. P. Padilha Fabiano Fagundes Conceição Previero Laboratório de Solos

Leia mais

UNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO

UNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO UNIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2010.2 ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno!

Leia mais

Desenvolvimento de um sistema de pergunta e resposta baseado em corpus

Desenvolvimento de um sistema de pergunta e resposta baseado em corpus Desenvolvimento de um sistema de pergunta e resposta baseado em corpus Adriano Jorge Soares Arrigo e-mail: arrigo.adriano@gmail.com Elvio Gilberto Silva e-mail: elvio.silva@usc.br Henrique Pachioni Martins

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

Critérios para certificação de Sites SciELO: critérios, política e procedimentos para a classificação e certificação dos sites da Rede SciELO

Critérios para certificação de Sites SciELO: critérios, política e procedimentos para a classificação e certificação dos sites da Rede SciELO Critérios para certificação de Sites SciELO: critérios, política e procedimentos para a classificação e certificação dos sites da Rede SciELO Versão Março 2008 1 Introdução Este documento tem por objetivo

Leia mais

UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA

UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA UNIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA ANÁLISE DE AGENTES CLASSIFICADORES PARA CATEGORIZAÇÃO AUTOMÁTICA DE DOCUMENTOS DIGITAIS PROPOSTA DE TRABALHO

Leia mais

Guia de referência rápida

Guia de referência rápida Guia de referência rápida www.sciencedirect.com O ScienceDirect é a base de dados de texto completo e revisado por pares da Elsevier com aproximadamente.000 livros e mais de.00 periódicos. Além de buscas

Leia mais

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos

Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Técnicas de Seleção de Atributos utilizando Paradigmas de Algoritmos Disciplina de Projeto e Análise de Algoritmos Theo Silva Lins, Luiz Henrique de Campos Merschmann PPGCC - Programa de Pós-Graduação

Leia mais

APRENDENDO LÓGICA DE PROGRAMAÇÃO VIA WEB

APRENDENDO LÓGICA DE PROGRAMAÇÃO VIA WEB APRENDENDO LÓGICA DE PROGRAMAÇÃO VIA WEB Romero Tori Universidade de São Paulo Escola Politécnica INTERLAB Laboratório de Tecnologias Interativas-USP Instituto Sumaré de Educação Superior rometori@usp.br

Leia mais

CURSO SOBRE ACESSO ÀS BIBLIOTECAS ON-LINE DA MEDLINE/PubMed

CURSO SOBRE ACESSO ÀS BIBLIOTECAS ON-LINE DA MEDLINE/PubMed TUTORIAL PARA ACESSO BIBLIOTECA ON-LINE da MEDLINE/PUBMED CURSO SOBRE ACESSO ÀS BIBLIOTECAS ON-LINE DA MEDLINE/PubMed Este tutorial faz parte do curso de extensão da UNIFESP sobre acesso on-line às publicações

Leia mais

2 Conceitos Gerais de Classificação de Documentos na Web

2 Conceitos Gerais de Classificação de Documentos na Web Conceitos Gerais de Classificação de Documentos na Web 13 2 Conceitos Gerais de Classificação de Documentos na Web 2.1. Páginas, Sites e Outras Terminologias É importante distinguir uma página de um site.

Leia mais

Documentação SEO EXPERT

Documentação SEO EXPERT Documentação SEO EXPERT O módulo SEO Expert ajuda você a rapidamente: Criar e personalizar URLs amigáveis Inserir metatags para páginas de produtos, posts do Facebook e cartões de Twitter em sua loja Este

Leia mais

RECUPERANDO INFORMAÇÃO SOBRE TEXTOS PUBLICADOS NO TWITTER

RECUPERANDO INFORMAÇÃO SOBRE TEXTOS PUBLICADOS NO TWITTER RECUPERANDO INFORMAÇÃO SOBRE TEXTOS PUBLICADOS NO TWITTER Autores: Miguel Airton FRANTZ 1 ;; Angelo Augusto FROZZA 2, Reginaldo Rubens da SILVA 2. Identificação autores: 1 Bolsista de Iniciação Científica

Leia mais

Introdução. Nesta guia você aprenderá:

Introdução. Nesta guia você aprenderá: 1 Introdução A criação de uma lista é a primeira coisa que devemos saber no emailmanager. Portanto, esta guia tem por objetivo disponibilizar as principais informações sobre o gerenciamento de contatos.

Leia mais

Base de Patentes: abrangente, valiosa e única

Base de Patentes: abrangente, valiosa e única Patentes... Define o contrato entre o governo e um inventor pelo qual o inventor recebe proteção legal para a sua invenção Requer descrição completa de todos os detalhes da invenção (descrição, desenhos,

Leia mais

WEB OF KNOWLEDGE NOTAS DA VERSÃO v5.11

WEB OF KNOWLEDGE NOTAS DA VERSÃO v5.11 WEB OF KNOWLEDGE NOTAS DA VERSÃO v5.11 Os recursos a seguir são planejados para a Web of Knowledge em 28 de julho de 2013. Este documento fornece informações sobre cada um dos recursos incluídos nessa

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

Estratégias de Pesquisa

Estratégias de Pesquisa Estratégias de Pesquisa Ricardo de Almeida Falbo Metodologia de Pesquisa Departamento de Informática Universidade Federal do Espírito Santo Agenda Survey Design e Criação Estudo de Caso Pesquisa Ação Experimento

Leia mais

Um estudo sobre o uso de agentes de internet em buscas (Junho 2010)

Um estudo sobre o uso de agentes de internet em buscas (Junho 2010) IA009 INTRODUÇÃO À TEORIA DE AGENTES 1 Um estudo sobre o uso de agentes de internet em buscas (Junho 2010) Alexandre Fatayer Canova, RA 107214, UNICAMP Agentes de internet são parte integrante da web na

Leia mais

Derwent Innovations Index

Derwent Innovations Index Derwent Innovations Index DERWENT INNOVATIONS INDEX Cartão de referência rápida ISI Web of Knowledge SM O Derwent Innovations Index é uma ferramenta poderosa de pesquisa de patentes, que combina Derwent

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Scopus Acrescente valor a sua pesquisa. @ElsevierLAS www.scopus.com www.americalatina.elsevier.com/brasil

Scopus Acrescente valor a sua pesquisa. @ElsevierLAS www.scopus.com www.americalatina.elsevier.com/brasil Scopus Acrescente valor a sua pesquisa @ElsevierLAS www.scopus.com www.americalatina.elsevier.com/brasil Conteúdo do Scopus Todas as fontes relevantes + 19.500 títulos + 5.000 editoras + 720 títulos latino-

Leia mais

SIMARPE Sistema de Arquivo Permanente

SIMARPE Sistema de Arquivo Permanente SIMARPE Sistema de Arquivo Permanente Documentos formam a grande massa de conhecimentos de uma organização seja ela privada ou pública, esses documentos em sua maioria são parte do seu patrimônio. A Gestão

Leia mais

Frameworks. Pasteur Ottoni de Miranda Junior

Frameworks. Pasteur Ottoni de Miranda Junior Frameworks Pasteur Ottoni de Miranda Junior 1-Definição Apesar do avanço das técnicas de desenvolvimento de software, a construção de software ainda é um processo extremamente complexo.a reutilização tem

Leia mais

RBC no Auxílio de Avaliações Imobiliárias

RBC no Auxílio de Avaliações Imobiliárias RBC no Auxílio de Avaliações Imobiliárias Adauto Trigueiro, Alcione da Costa Pinheiro, Clerton Filho, Kátia Silva Unidade Acadêmica de Sistemas e Computação Universidade Federal de Campina Grande (UFCG)

Leia mais

PESQUISA DE INFORMAÇÕES TÉCNICAS E CIENTÍFICAS NA INTERNET. OLIVEIRA, Simone Lucas Gonçalves de

PESQUISA DE INFORMAÇÕES TÉCNICAS E CIENTÍFICAS NA INTERNET. OLIVEIRA, Simone Lucas Gonçalves de PESQUISA DE INFORMAÇÕES TÉCNICAS E CIENTÍFICAS NA INTERNET OLIVEIRA, Simone Lucas Gonçalves de SUMÁRIO ÍNDICE DE ILUSTRAÇÕES... 3 1. INTRODUÇÃO... 4 2. CONCEITOS SOBRE A INTERNET... 4 3. ESTRATÉGIAS DE

Leia mais

Recuperação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília

Recuperação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília Recuperação Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília 1 2 Contexto Grande quantidade de informações são produzidas e disponibilizadas diariamente Com a elevada

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Se observarmos nos diferentes livros. Planejamento de Testes a partir de Casos de Uso

Se observarmos nos diferentes livros. Planejamento de Testes a partir de Casos de Uso Planejamento de Testes a partir de Casos de Uso Arilo Cláudio Dias Neto ariloclaudio@gmail.com É Bacharel em Ciência da Computação formado na Universidade Federal do Amazonas, Mestre em Engenharia de Sistemas

Leia mais

Modelagem de Conhecimento integrando Regras de Produção e Ontologias

Modelagem de Conhecimento integrando Regras de Produção e Ontologias Modelagem de Conhecimento integrando Regras de Produção e Ontologias 1. Introdução Tiago Cordeiro, Vládia Pinheiro e Vasco Furtado UNIFOR Universidade de Fortaleza O conhecimento das organizações precisa

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

PARANÁ GOVERNO DO ESTADO

PARANÁ GOVERNO DO ESTADO PARANÁ GOVERNO DO ESTADO COLÉGIO ESTADUAL DE PARANAVAÍ ENSINO FUNDAMENTAL, MÉDIO, NORMAL E PROFISSIONAL CURSO TÉCNICO EM INFORMÁTICA DISCIPLINA: INTERNET E PROGRAMAÇÃO WEB 1º MÓDULO SUBSEQUENTE MECANISMOS

Leia mais

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron. 1024 UMA ABORDAGEM BASEADA EM REDES PERCEPTRON MULTICAMADAS PARA A CLASSIFICAÇÃO DE MASSAS NODULARES EM IMAGENS MAMOGRÁFICAS Luan de Oliveira Moreira¹; Matheus Giovanni Pires² 1. Bolsista PROBIC, Graduando

Leia mais

UNIVERSIDADE PRESBITERIANA MACKENZIE Faculdade de Computação e Informática MATRIZ CURRICULAR ELETIVAS

UNIVERSIDADE PRESBITERIANA MACKENZIE Faculdade de Computação e Informática MATRIZ CURRICULAR ELETIVAS MATRIZ CURRICULAR S LIVRE ESCOLHA Núcleo Temático: HUMANAS Disciplina: LÍNGUA BRASILEIRA DE SINAIS 34 h/a (.34 ) Teóricas Etapa: 4ª Compreensão de aspectos composicionais da Língua Brasileira de Sinais

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

SAPENS - Sistema Automático de Páginas de Ensino

SAPENS - Sistema Automático de Páginas de Ensino SAPENS - Sistema Automático de Páginas de Ensino Eduardo Kokubo kokubo@inf.univali.br Fabiane Barreto Vavassori, MSc fabiane@inf.univali.br Universidade do Vale do Itajaí - UNIVALI Centro de Ensino Superior

Leia mais

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 Rational Quality Manager Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 1 Informações Gerais Informações Gerais sobre o RQM http://www-01.ibm.com/software/awdtools/rqm/ Link para o RQM https://rqmtreina.mvrec.local:9443/jazz/web/console

Leia mais

Um processo para construção de software mais transparente

Um processo para construção de software mais transparente Um processo para construção de software mais transparente Eduardo Almentero 1, and Julio Cesar Sampaio do Prado Leite 1 1 Pontifícia Universidade Católica do Rio de Janeiro, PUC - Rio, Brasil {ealmentero,

Leia mais

Interpretador AIML alimentado com tags HTML5

Interpretador AIML alimentado com tags HTML5 2º Congresso de Pesquisa Científica : Inovação, Ética e Sustentabilidade Interpretador AIML alimentado com tags HTML5 Rafael Luiz de Macedo (Ciência da Computação - UNIVEM - Marília/SP) Email: rafaelldemacedo@gmail.com

Leia mais

EndNote Web. Quick Reference Card THOMSON SCIENTIFIC

EndNote Web. Quick Reference Card THOMSON SCIENTIFIC THOMSON SCIENTIFIC EndNote Web Quick Reference Card Web é um serviço através da Web projetado para auxiliar estudantes e pesquisadores no processo de elaboração de artigos de pesquisa. ISI Web of Knowledge,

Leia mais

PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO

PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO Fabiana Pacheco Lopes 1 1 Universidade Presidente Antônio Carlos (UNIPAC) fabipl_21@yahoo.com.br Resumo.Este

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

5. Links de bibliotecas (off-line) Localiza bibliotecas que tenham uma cópia imp 6. Como entender um resultado de pesquisa. Sobre o Google Acadêmico

5. Links de bibliotecas (off-line) Localiza bibliotecas que tenham uma cópia imp 6. Como entender um resultado de pesquisa. Sobre o Google Acadêmico Sobre o Google Acadêmico Ajuda do Google Acadêmico Dicas de pesquisa avançada Suporte para bibliotecas Suporte para editoras Coloque o Google Acadêmico no seu site Como entender um resultado de pesquisa

Leia mais

CAPÍTULO 2. Este capítulo tratará :

CAPÍTULO 2. Este capítulo tratará : 1ª PARTE CAPÍTULO 2 Este capítulo tratará : 1. O que é necessário para se criar páginas para a Web. 2. A diferença entre páginas Web, Home Page e apresentação Web 3. Navegadores 4. O que é site, Host,

Leia mais

UM PROTÓTIPO DO SISTEMA PARA CONTROLE DE BIBLIOTECAS POR MEIO DE PÁGINAS WEB DINÂMICAS 1

UM PROTÓTIPO DO SISTEMA PARA CONTROLE DE BIBLIOTECAS POR MEIO DE PÁGINAS WEB DINÂMICAS 1 UM PROTÓTIPO DO SISTEMA PARA CONTROLE DE BIBLIOTECAS POR MEIO DE PÁGINAS WEB DINÂMICAS 1 Daniel de Faveri HONORATO 2, Renato Bobsin MACHADO 3, Huei Diana LEE 4, Feng Chung WU 5 Escrito para apresentação

Leia mais

Derwent Innovations Index

Derwent Innovations Index Derwent Innovations Index ISI WEB OF KNOWLEDGE SM Quick Reference Card Derwent Innovations Index é uma poderosa ferramenta de pesquisa de patentes que combina Derwent World Patents Index, Patents Citation

Leia mais

Manual de utilização do Moodle

Manual de utilização do Moodle Manual de utilização do Moodle Docentes Universidade Atlântica 1 Introdução O conceito do Moodle (Modular Object Oriented Dynamic Learning Environment) foi criado em 2001 por Martin Dougiamas, o conceito

Leia mais

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback Relevance Feedback Expansão de Consulta Relevance Feedback 1 Relevance Feedback Baeza-Yates; Ribeiro-Neto, (2011, cap 5) distinguem dois métodos: Explicit Relevance Feedback a informação para a reformulação

Leia mais

FONTES OU RECURSOS DE INFORMAÇÃO: CATEGORIAS E EVOLUÇÃO CONCEITUAL * 1. TENTANDO CLARIFICAR QUESTÕES CONCEITUAIS E DE TRADUÇÃO

FONTES OU RECURSOS DE INFORMAÇÃO: CATEGORIAS E EVOLUÇÃO CONCEITUAL * 1. TENTANDO CLARIFICAR QUESTÕES CONCEITUAIS E DE TRADUÇÃO 1 FONTES OU RECURSOS DE INFORMAÇÃO: CATEGORIAS E EVOLUÇÃO CONCEITUAL * Lena Vania Ribeiro Pinheiro, IBICT 1. TENTANDO CLARIFICAR QUESTÕES CONCEITUAIS E DE TRADUÇÃO Alguns termos técnicos de Ciência da

Leia mais

Arquivo Digital de Trabalhos Práticos de Alunos

Arquivo Digital de Trabalhos Práticos de Alunos Arquivo Digital de Trabalhos Práticos de Alunos Projecto Integrado Engenharia de Linguagens Eduardo Ribeiro Miguel Nunes Objectivos Criação de uma interface Web para incorporação de Objectos Digitais;

Leia mais

UM ESTUDO DE CASO SOBRE A INDEXAÇÃO AUTOMÁTICA DE DOCUMENTOS OFICIAIS DA UENP BASEADO EM LAYOUTS

UM ESTUDO DE CASO SOBRE A INDEXAÇÃO AUTOMÁTICA DE DOCUMENTOS OFICIAIS DA UENP BASEADO EM LAYOUTS UM ESTUDO DE CASO SOBRE A INDEXAÇÃO AUTOMÁTICA DE DOCUMENTOS OFICIAIS DA UENP BASEADO EM LAYOUTS Alexia Guilherme Bianque (PIBIC/CNPq), Ederson Marco Sgarbi (Orientador), a.g.bianque10@gmail.com.br Universidade

Leia mais

Gerenciador de Referências. EndNote. Nonato Ribeiro Biblioteca de Ciências e Tecnologia (UFC)

Gerenciador de Referências. EndNote. Nonato Ribeiro Biblioteca de Ciências e Tecnologia (UFC) Gerenciador de Referências EndNote Nonato Ribeiro Biblioteca de Ciências e Tecnologia (UFC) Pesquisa na Web of Science O que é o EndNote? Funcionalidades da ferramenta Como incluir citações no Word usando

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala [quinta-feira, 7:30 12:00] Atendimento Segunda

Leia mais

Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual

Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual Avaliação de técnicas de seleção de quadros-chave na recuperação de informação por conteúdo visual Shênia Salvador de Pinho, Kleber J. F. Souza Instituto de Ciências Exatas e Informática PUC Minas Guanhães,

Leia mais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais UNIVERSIDADE ESTADUAL DE PONTA GROSSA PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO APLICADA CRISTIAN COSMOSKI RANGEL DE ABREU TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR

Leia mais

Sugestão de palavras chave para campanhas em motores de busca em arranque

Sugestão de palavras chave para campanhas em motores de busca em arranque Relatório Técnico FEUP Sugestão de palavras chave para campanhas em motores de busca em arranque João Albuquerque AdClick Ricardo Morla INESC TEC e FEUP Gabriel David INESC TEC e FEUP Rui Campos AdClick

Leia mais

SCIENCEDIRECT ACRESCENTE VALOR A SUA PESQUISA. www.sciencedirect.com

SCIENCEDIRECT ACRESCENTE VALOR A SUA PESQUISA. www.sciencedirect.com SCIENCEDIRECT ACRESCENTE VALOR A SUA PESQUISA www.sciencedirect.com O que é ScienceDirect? ScienceDirect é a base de dados de textos completos revisados por pares da Elsevier que contém mais de 12.000

Leia mais

Cadastramento de Computadores. Manual do Usuário

Cadastramento de Computadores. Manual do Usuário Cadastramento de Computadores Manual do Usuário Setembro 2008 ÍNDICE 1. APRESENTAÇÃO 1.1 Conhecendo a solução...03 Segurança pela identificação da máquina...03 2. ADERINDO À SOLUÇÃO e CADASTRANDO COMPUTADORES

Leia mais

MANUAL DO USUÁRIO. AssetView FDT. AssetView FDT

MANUAL DO USUÁRIO. AssetView FDT. AssetView FDT MANUAL DO USUÁRIO AssetView FDT AssetView FDT A S T V W F D T M P www.smar.com.br Especificações e informações estão sujeitas a modificações sem prévia consulta. Informações atualizadas dos endereços estão

Leia mais

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags

Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Universidade Federal de Pernambuco Graduação em Ciência da Computação 2012.2 Análise de Sentimentos e Mineração de Links em uma Rede de Co-ocorrência de Hashtags Proposta de Trabalho de Graduação Aluno:

Leia mais

T U T O R I A I S SCOPUS TUTORIAL. Biblioteca da Escola de Engenharia da UFRGS. SCOPUS - Tutorial

T U T O R I A I S SCOPUS TUTORIAL. Biblioteca da Escola de Engenharia da UFRGS. SCOPUS - Tutorial T U T O R I A I S SCOPUS TUTORIAL O que é? O Scopus é uma base de dados que disponibiliza acesso a mais de 16.000 títulos de periódicos, mais de 1.200 revistas de livre acesso, mais de 500 anais de conferências

Leia mais

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES Kelton Costa; Patricia Ribeiro; Atair Camargo; Victor Rossi; Henrique Martins; Miguel Neves; Ricardo Fontes. kelton.costa@gmail.com; patriciabellin@yahoo.com.br;

Leia mais

Seu manual do usuário BLACKBERRY INTERNET SERVICE http://pt.yourpdfguides.com/dref/1117388

Seu manual do usuário BLACKBERRY INTERNET SERVICE http://pt.yourpdfguides.com/dref/1117388 Você pode ler as recomendações contidas no guia do usuário, no guia de técnico ou no guia de instalação para BLACKBERRY INTERNET SERVICE. Você vai encontrar as respostas a todas suas perguntas sobre a

Leia mais

2º CONGRESSO INTERDISCIPLINAR EM SAÚDE E EDUCAÇÃO: MEIO AMBIENTE, CIÊNCIA E QUALIDADE DE VIDA

2º CONGRESSO INTERDISCIPLINAR EM SAÚDE E EDUCAÇÃO: MEIO AMBIENTE, CIÊNCIA E QUALIDADE DE VIDA 2º CONGRESSO INTERDISCIPLINAR EM SAÚDE E EDUCAÇÃO: MEIO AMBIENTE, CIÊNCIA E QUALIDADE DE VIDA ISSN 2358-2995 Normas para submissão de trabalhos Cronograma: 31/03/15 início das inscrições dos trabalhos

Leia mais

Projeto de Arquitetura

Projeto de Arquitetura Introdução Projeto de Arquitetura (Cap 11 - Sommerville) UNIVERSIDADE FEDERAL DE ALAGOAS Curso de Ciência da Computação Engenharia de Software I Prof. Rômulo Nunes de Oliveira Até agora, estudamos: Os

Leia mais

Um Assistente Virtual Inteligente Dirigido por Várias Metodologias Educacionais no Ensino em Informática

Um Assistente Virtual Inteligente Dirigido por Várias Metodologias Educacionais no Ensino em Informática Um Assistente Virtual Inteligente Dirigido por Várias Metodologias Educacionais no Ensino em Informática Abstract. This work shows the evolution of Intelligent Teaching Assistant SAE that include and provide

Leia mais

Geração do Portal CPCX - UFMS pelo UNION: Um Estudo de Caso

Geração do Portal CPCX - UFMS pelo UNION: Um Estudo de Caso Geração do Portal CPCX - UFMS pelo UNION: Um Estudo de Caso Lourival dos Santos Pires Júnior, Tony Carlos Bignardi dos Santos, Amaury Antônio de Castro Junior, Carlos Alberto da Silva, Leila Lisiane Rossi

Leia mais

T U T O R I A I S WEB OF SCIENCE TUTORIAL. Biblioteca da Escola de Engenharia da UFRGS. WEB OF SCIENCE - Tutorial

T U T O R I A I S WEB OF SCIENCE TUTORIAL. Biblioteca da Escola de Engenharia da UFRGS. WEB OF SCIENCE - Tutorial T U T O R I A I S WEB OF SCIENCE TUTORIAL Biblioteca da Escola de Engenharia da UFRGS WEB OF SCIENCE - Tutorial O que é? O Web of Science é uma base de dados que disponibiliza acesso a mais de 9.200 títulos

Leia mais

Data, Text and Web Mining

Data, Text and Web Mining Data, Text and Web Mining Fabrício J. Barth TerraForum Consultores Junho de 2010 Objetivo Apresentar a importância do tema, os conceitos relacionados e alguns exemplos de aplicações. Data, Text and Web

Leia mais

Novell. Novell Teaming 1.0. novdocx (pt-br) 6 April 2007 EXPLORAR O PORTLET BEM-VINDO DESCUBRA SEU CAMINHO USANDO O NOVELL TEAMING NAVIGATOR

Novell. Novell Teaming 1.0. novdocx (pt-br) 6 April 2007 EXPLORAR O PORTLET BEM-VINDO DESCUBRA SEU CAMINHO USANDO O NOVELL TEAMING NAVIGATOR Novell Teaming - Guia de início rápido Novell Teaming 1.0 Julho de 2007 INTRODUÇÃO RÁPIDA www.novell.com Novell Teaming O termo Novell Teaming neste documento se aplica a todas as versões do Novell Teaming,

Leia mais

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP) Hardware (Nível 0) Organização O AS/400 isola os usuários das características do hardware através de uma arquitetura de camadas. Vários modelos da família AS/400 de computadores de médio porte estão disponíveis,

Leia mais

Introdução ao EBSCOhost 2.0

Introdução ao EBSCOhost 2.0 Introdução ao EBSCOhost 2.0 Tutorial support.ebsco.com O que é? O EBSCO Host é um poderoso sistema de referência on-line acessível através da Internet, e oferece uma variedade de bases de dados de texto

Leia mais

BVS Site. Aplicativo para geração de portais BVS. Cláudia Guzzo Patrícia Gaião

BVS Site. Aplicativo para geração de portais BVS. Cláudia Guzzo Patrícia Gaião BVS Site Aplicativo para geração de portais BVS Cláudia Guzzo Patrícia Gaião Gerência de Produção de Fontes de Informação / Projetos e Instâncias da BVS BIREME/OPAS/OMS Biblioteca Virtual em Saúde (BVS)

Leia mais

IBM Enterprise Marketing Management. Opções de Nome de Domínio para Email

IBM Enterprise Marketing Management. Opções de Nome de Domínio para Email IBM Enterprise Marketing Management Opções de Nome de Domínio para Email Nota Antes de utilizar estas informações e o produto que elas suportam, leia as informações em Avisos na página 5. Este documento

Leia mais

Configuração de Digitalizar para E-mail

Configuração de Digitalizar para E-mail Guia de Configuração de Funções de Digitalização de Rede Rápida XE3024PT0-2 Este guia inclui instruções para: Configuração de Digitalizar para E-mail na página 1 Configuração de Digitalizar para caixa

Leia mais

PROJETO DA REVISTA CIENTÍFICA BIBLIOTECÁRIOS OLINE.

PROJETO DA REVISTA CIENTÍFICA BIBLIOTECÁRIOS OLINE. Universidade Federal De Santa Catarina Centro de Ciências da Educação Curso De Biblioteconomia Disciplina: CIN5034 Editoração Cientifica Profa. Ursula Blattmann Acadêmica: Eliane de Fátima Fernandes PROJETO

Leia mais

Segmentação de imagens tridimensionais utilizando o sensor Microsoft Kinect

Segmentação de imagens tridimensionais utilizando o sensor Microsoft Kinect Segmentação de imagens tridimensionais utilizando o sensor Microsoft Kinect Lucas Viana Barbosa 1 ; Wanderson Rigo 2 ; Manassés Ribeiro 3 INTRODUÇÃO Os sistemas de visão artificial vêm auxiliando o ser

Leia mais

Uma solução de desempenho para a distribuição de documentos: Habilitando a distribuição de documentos em tempo real para corporações globais

Uma solução de desempenho para a distribuição de documentos: Habilitando a distribuição de documentos em tempo real para corporações globais Uma solução de desempenho para a distribuição de documentos: Habilitando a distribuição de documentos em tempo real para corporações globais Visão Geral Desafio Hoje, os aplicativos da web são um tremendo

Leia mais

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA Daniel Gonzaga dos Santos 1 Faculdade Cidade de João Pinheiro Resumo: Este artigo aborda as etapas para

Leia mais

PROJETO: PRODUTO 3 RELATÓRIO PARCIAL DO DESENVOLVIMENTO E IMPLANTAÇÃO DO SISTEMA DE INFORMAÇÕES

PROJETO: PRODUTO 3 RELATÓRIO PARCIAL DO DESENVOLVIMENTO E IMPLANTAÇÃO DO SISTEMA DE INFORMAÇÕES Nome da Empresa: DEPARTAMENTO INTERSINDICAL DE ESTATÍSTICA E ESTUDOS SÓCIO-ECONÔMICOS (DIEESE) PROJETO: PROJETO DE COOPERAÇÃO TÉCNICA BRA/IICA/03/005 PARTICIPAÇÃO SOCIAL NÚMERO DO CONTRATO: 205037 TEMA:

Leia mais

Fabrício J. Barth. Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com

Fabrício J. Barth. Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com Uma Introdução à Mineração de Informações Fabrício J. Barth Apontador http://www.apontador.com.br http://www.apontador.com.br/institucional/ fabricio.barth@lbslocal.com Outubro de 2010 Objetivo Apresentar

Leia mais

Aplicação Prática de Lua para Web

Aplicação Prática de Lua para Web Aplicação Prática de Lua para Web Aluno: Diego Malone Orientador: Sérgio Lifschitz Introdução A linguagem Lua vem sendo desenvolvida desde 1993 por pesquisadores do Departamento de Informática da PUC-Rio

Leia mais

ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL. PALAVRAS-CHAVE: banco de dados espaciais, busca spatio-textual. aplicativo.

ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL. PALAVRAS-CHAVE: banco de dados espaciais, busca spatio-textual. aplicativo. ARQUITETURA DE UM SISTEMA SPATIO-TEXTUAL Fellipe de Lima Fonseca 1 ; João Batista Rocha-Junior 2 1. Bolsista CNPq, Graduando em Engenharia de Computação, Universidade Estadual de Feira de Santana, e-mail:

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Inicialização Rápida do Novell Vibe Mobile

Inicialização Rápida do Novell Vibe Mobile Inicialização Rápida do Novell Vibe Mobile Março de 2015 Introdução O acesso móvel ao site do Novell Vibe pode ser desativado por seu administrador do Vibe. Se não conseguir acessar a interface móvel do

Leia mais

LISTA DE EXERCÍCIOS. Mede a capacidade de comunicação de computadores e dispositivos. Operam em diferentes plataformas de hardware

LISTA DE EXERCÍCIOS. Mede a capacidade de comunicação de computadores e dispositivos. Operam em diferentes plataformas de hardware 1. A nova infra-estrutura de tecnologia de informação Conectividade Mede a capacidade de comunicação de computadores e dispositivos Sistemas abertos Sistemas de software Operam em diferentes plataformas

Leia mais

Arquitetura de Informação - 6

Arquitetura de Informação - 6 Arquitetura de Informação - 6 Ferramentas para Web Design Prof. Ricardo Ferramentas para Web Design 1 Objetivo do Sistema de Rotulação O sistema de rotulação é o componente da Arquitetura de Informação

Leia mais

STATGEN Plataforma web para análise de dados genéticos.

STATGEN Plataforma web para análise de dados genéticos. STATGEN Plataforma web para análise de dados genéticos. Diogo Gonçalves Neder 1 1 Introdução O melhoramento de plantas visa principalmente identificar combinações genotípicas com performance superior quando

Leia mais

A evolução dos periódicos brasileiros e o acesso aberto

A evolução dos periódicos brasileiros e o acesso aberto XVII Seminário Nacional de Bibliotecas Universitárias Gramado, 16-18 de Setembro de 2012 A evolução dos periódicos brasileiros e o acesso aberto Lewis Joel Greene Editor, Brazilian Journal of Medical and

Leia mais

Satélite. Manual de instalação e configuração. CENPECT Informática www.cenpect.com.br cenpect@cenpect.com.br

Satélite. Manual de instalação e configuração. CENPECT Informática www.cenpect.com.br cenpect@cenpect.com.br Satélite Manual de instalação e configuração CENPECT Informática www.cenpect.com.br cenpect@cenpect.com.br Índice Índice 1.Informações gerais 1.1.Sobre este manual 1.2.Visão geral do sistema 1.3.História

Leia mais

XDR. Solução para Big Data.

XDR. Solução para Big Data. XDR Solução para Big Data. ObJetivo Principal O volume de informações com os quais as empresas de telecomunicações/internet têm que lidar é muito grande, e está em constante crescimento devido à franca

Leia mais