Estrutura Multitesauro para Recuperação de Informações

Tamanho: px
Começar a partir da página:

Download "Estrutura Multitesauro para Recuperação de Informações"

Transcrição

1 Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Pós-Graduação em Ciência da Computação Estrutura Multitesauro para Recuperação de Informações Luiz Augusto Sangoi Pizzato Dissertação apresentada como requisito parcial à obtenção do grau de mestre em Ciência da Computação Orientadora: Vera Lúcia Strube de Lima Porto Alegre, janeiro de 2003

2

3 Anyone who has lost track of time when using a computer knows the propensity to dream, the urge to make dreams come true and the tendency to miss lunch. - Tim Berners-Lee

4 ii

5 Agradecimentos Agradeço à Deus pela existência de todas as pessoas maravilhosas que estão presentes em minha vida. Aos meus pais, Modesto e Carmen: muito obrigado, pelos seus esforços em minha formação acadêmica e pessoal, pelo constante amor e suporte recebidos. À minha querida Fernanda, por sempre estar ao meu lado, por compreender minhas aições e pela conança que sempre teve em mim. Aos meus irmãos, cunhados e sobrinhos, pela descontração de nossos encontros. Um agradecimento especial, à Profa. Vera Lúcia, pela dedicação em minha orientação neste mestrado. Seus conselhos e ensinamentos ultrapassam o contexto deste trabalho e serão levados por toda a vida. Ao Prof. João Batista S. de Oliveira, pela importante ajuda na formalização da heurística, e ao Prof. José Carlos Bins Filho pelas correções e boas avaliações de meus trabalhos individuais, plano de estudo e pesquisa, e seminário de andamento. À Tania pelo carinho, amizade e respeito que sempre tivemos. Aos meus amigos de Bento Gonçalves - Luciano, Magro, Mattia e Tigre - que sempre estiveram ao meu lado. Aos colegas de mestrado, em especial aos participantes dos churrascos e das diversas Casa dos mestrandos, pelos alegres dois anos de convivência. Aos colegas Caroline Gasperin e Marco Gonzalez, pela grande ajuda prestada em todas as fases do curso de mestrado. À Cássia Marques Serpa, pelo bom trabalho desempenhado em sua bolsa de Iniciação Cientíca. Ao convênio Dell/PUCRS, pelo apoio nanceiro, que possibilitou minha dedicação exclusiva aos estudos que envolvem esta dissertação de mestrado. Ao PPGCC, pelos recursos disponibilizados e pelo apoio nanceiro na participação de eventos. Ao CNPq pelo apoio nanceiro ao projeto SEMA, que disponibilizou o trabalho de uma bolsista de Iniciação Cientíca. À Subsecretaria de Biblioteca do Senado Federal, ao departamento técnico do Sistema Integrado de Bibliotecas da USP (SIBi/USP), ao departamento técnico da Biblioteca Central Ir. José Otão da PUCRS por fornecer seus tesauros, que foram de grande valia para este trabalho. Ao Núcleo Interinstitucional de Lingüística Computacional (NILC) pelo corpus utilizado.

6 iv

7 v Abstract This work presents the proposition and the development of a multithesaurus structure oriented to information retrieval applications. The focused multithesaurus structure was initially based on ISO 2788 standards but it gradually assumed its own shape. The nal format of the multithesaurus structure was built considering aspects of dierent thesauri, and important features certain information retrieval task required. In order to validate the usefulness of the thesaurus structure in information retrieval, it was created a method of query expansion that uses dierent weights for dierent types of relations. Those relations are dened at the multithesaurus structure. This work presents the structure creation process, its validation, its use for information retrieval, and the result obtained in information retrieval evaluation.

8 vi

9 vii Resumo Este trabalho apresenta a proposta e discute o desenvolvimento de uma estrutura multitesauro para uso em aplicações de recuperação de informações. A estrutura multitesauro em questão foi inicialmente baseada no padrão ISO 2788, mas foi gradualmente assumindo sua própria forma, uma vez que esta representa características de diferentes tesauros e deve ser utilizada em tarefas de recuperação de informações. De modo a validar a utilidade desta estrutura na recuperação de informações, foi criado um método de expansão de consultas. O método proposto para expansão de consultas tem como principal característica utilizar diferentes pesos para as relações semânticas denidas na estrutura multitesauro. Este trabalho apresenta a criação da estrutura tesaural proposta, sua validação, aplicação na expansão de consultas e resultados obtidos para a recuperação de informações.

10 viii

11 Sumário ABSTRACT RESUMO LISTA DE TABELAS LISTA DE FIGURAS LISTA DE SÍMBOLOS E ABREVIATURAS v vii xiii xv xvii Capítulo 1: Introdução Recuperação de Informações Linguagens Naturais Tesauro e Vocabulário Controlado Expansão de Consulta extensible Markup Language Este trabalho Capítulo 2: Normas para a organização de tesauros Classes de palavras Estruturação de Tesauros Normas ISO ANSI/NISO Z Manual de Elaboração de Tesauros Monolíngües Organização de tesauros TML: A Thesaural Markup Language Zthes RDF Thesaurus Specication CERES/BRD Thesaurus ix

12 x SUMÁRIO 2.5 Considerações sobre o capítulo Capítulo 3: Relações semânticas e RI Relações semânticas nas normas e na RI Relações de equivalência Relações de hierarquia Relações associativas Utilização de relações extraídas de forma automática Considerações sobre o capítulo Capítulo 4: Estrutura Multitesauro Tesauros utilizados Estrutura inicial Desenvolvimento da Estrutura Multitesauro Considerações sobre o capítulo Capítulo 5: Estrutura na Expansão de Consulta Heurística de Expansão de Consultas Formalização da Heurística Modos alternativos para cálculo de δ Algoritmo de Expansão de Consulta Um exemplo detalhado de funcionamento A ferramenta QET Considerações sobre o capítulo Capítulo 6: Validação Processo de validação em corpus estático Testes em corpus estático Denição dos parâmetros Pesos para as relações da ISO Valor λ Considerações sobre a denição de parâmetros Utilização conjunta de tesauros Processo de validação na Internet Resultados obtidos: uma apreciação Considerações sobre o capítulo

13 SUMÁRIO Capítulo 7: Trabalhos correlatos O trabalho de Sintichakis & Constantopoulos O trabalho de Mandala et al O trabalho de Robin & Ramalho O trabalho de Alani et al Considerações sobre o capítulo Capítulo 8: Conclusão Trabalhos Futuros Considerações Finais REFERÊNCIAS BIBLIOGRÁFICAS 81 Apêndice A: Resultados das consultas em corpus estático 87 Apêndice B: Resultados das consultas na Internet 89 xi

14 xii SUMÁRIO

15 Lista de Tabelas 3.1 Expansão através de relações RT Valores dos parâmetros do exemplo Desambigüação Semântica Valores dos parâmetros Resultados parciais Denição dos melhores pesos para os tipos de relações Resultados obtidos com diferentes combinações do valor λ Resultados obtidos através de diferentes combinações de tesauros Resultados na Média da precisão obtida para a expansão de consultas A.1 Resultados em corpus estático para a consulta na forma original 87 A.2 Resultados em corpus estático para a consulta na forma expandida B.1 Resultados DRRI para a consulta na forma original B.2 Resultados DRRI para a consulta na forma expandida B.3 Resultados DRWWW para a consulta na forma original B.4 Resultados DRWWW para a consulta na forma expandida.. 92 xiii

16 xiv LISTA DE TABELAS

17 Lista de Figuras 1.1 Ambigüidade sintática Exemplo de consulta expandida Resolução do contexto de uma consulta Supremo de consulta Ínmos de consulta Relações semântica do AAT Exemplo do funcionamento da expansão de consulta Expansão de consulta com a ferramenta QET Medida de precisão das consultas originais e expandidas Medida de abrangência nas consultas originais e expandidas Medida-F nas consultas originais e expandidas Medida de abrangência para DRRI Medida de abrangência para DRWWW Medida de precisão para DRRI Medida de precisão para DRWWW Medida-F para DRRI Medida-F para DRWWW xv

18 xvi LISTA DE FIGURAS

19 Lista de Símbolos e Abreviaturas WWW World Wide Web 1 RI Recuperação de Informações 1 PLN Processamento da Linguagem Natural 3 XML extensible Markup Language 7 RDF Resource Description Framework 7 W3C World Wide Web Consortium 7 XHTML Extensible Hypertext Markup Language 7 WML Wireless Markup Language 7 TP Termo Preferencial 14 TNP Termo Não-Preferencial 14 SN Scope Note 15 UF Used For 15 BT Broader Term 16 NT Narrower Term 16 BTP Broader Term Partitive 16 NTP Narrower Term Partitive 16 RT Related Term 16 TT Top Term 16 BTG Broader Term Generic 18 NTG Narrower Term Generic 18 BTI Broader Term Instance 18 NTI Narrower Term Instance 18 xvii

20 xviii LISTA DE SÍMBOLOS E ABREVIATURAS METM Manual de Elaboração de Tesauros Monolíngües 19 Df Denições 19 UP Usado Por 20 VD Visto De 21 TG Termo Genérico 21 TGP Termo Genérico Partitivo 21 TE Termo Especíco 21 TEP Termo Especíco Partitivo 21 TA Termo Associado 21 GTO Generic Thesaural Ontology 22 TML Thesaural Markup Language 22 LE Linguistic Equivalent 23 DTD Document Type Denition 23 BC Broader Concept 23 NC Narrower Concept 23 URI Universal Resource Identier 23 AAT Art and Architecture Thesaurus 30 ET Equivalent Term 40 DRRI Documentos Relevantes na RI 64 DRWWW Documentos Relevantes na WWW 64

21 Capítulo 1 Introdução A Internet está se tornando um meio de comunicação tão popular quanto o jornal, o rádio e a televisão. Muitos serviços que anteriormente utilizavam estes meios estão sendo exclusivamente oferecidos via Internet. O usuário dessa mídia tende a procurar por uma informação na Internet, antes de partir para outros meios. Devido à arquitetura da Internet, a busca por informações tem sido um tópico importante desde seu princípio. A arquitetura da Internet apresenta computadores interligados em rede oferecendo serviços. Os diferentes serviços oferecidos, a variedade no tipo e formação topológica das redes interconectadas na Internet, e a falta de um controle organizador central, dicultam a busca por uma informação. Dentre os serviços oferecidos através da Internet, o mais conhecido é a World Wide Web (WWW), que apresenta-se como arquivos hipertextos ligados uns aos outros, independente de localização. Devido à facilidade de publicação de documentos na WWW e à falta de uma organização central, as ferramentas de busca têm sido uma das únicas maneiras de chegar até uma informação. Assim, atualmente os sites de busca contêm as ferramentas de recuperação de informações (RI) mais conhecidas e utilizadas. 1.1 Recuperação de Informações Recuperação de Informações, segundo Voorhees em [VOO99], foca na resolução do problema de encontrar, em uma grande base de documentos, aqueles documentos cujos conteúdos estejam de acordo com uma necessidade do usuário. Denições para Recuperação de Dados, conforme [LEW96], não se aplicam a RI, pois a informação representada em um documento em linguagem 1

22 2 CAPÍTULO 1. INTRODUÇÃO natural apresenta-se sobre idéias abstratas sujeitas a ambigüidade, característica esta que não deve estar presente quando se deseja recuperar dados. Da mesma forma, segundo Baeza-Yates & Ribeiro-Neto em [BAE99], a recuperação de dados não aceita resultados imprecisos, enquanto que a RI tem uma tolerância maior, uma vez que as consultas podem ser feitas em linguagem natural, sendo assim altamente propensas a interpretações diferentes. Extração de informação também difere de RI pois, na primeira, o motivo de uma consulta é extrair um conhecimento especíco, enquanto na RI pretende-se recuperar documentos que podem conter as informações de interesse. Para que os documentos possam ser encontrados em uma base de dados, eles necessitam ser indexados. A utilização de índices que representam, de forma correta, o conteúdo do documento, é importante para que este possa ser encontrado em uma pesquisa futura. Contudo, a escolha de índices abrangentes e relevantes ao conteúdo do documento não garante que ele seja encontrado sempre que for procurado. Normalmente, os casos onde um sistema de RI falha (i.e. documentos relevantes não são encontrados e documentos irrelevantes o são) ocorrem devido a características inerentes às linguagens naturais, características estas que serão apresentadas na seguinte seção. 1.2 Linguagens Naturais Normalmente, os documentos indexados e recuperados com uso de uma ferramenta de RI apresentam-se em alguma linguagem natural. Isto ocorre pois a linguagem natural, como o inglês e o português, representa o modo mais habitual de comunicação humana. Desta forma, as consultas feitas a um sistema de RI normalmente são formuladas em linguagem natural, que representa a maneira mais simples e normal de o usuário utilizar uma ferramenta de busca. A seguir temos dois exemplos de uma mesma consulta: 1. Pousadas e Hotéis de Porto de Galinhas; 2. (Pousadas OU Hotéis) E Porto de Galinhas. Ambas as consultas apresentadas procuram pelos mesmos documentos, mas a primeira consulta, em linguagem natural, é muito mais fácil de formular e também de compreender. Porém, a ferramenta que busca as respostas a esta consulta deve traduzi-la, da linguagem natural para uma representação interna. Tal representação interna não deve conter ambigüidade, e esta é uma das grandes diculdades nestas abordagens, uma vez que a linguagem natural está sujeita a diferentes tipos de ambigüidades.

23 1.2. LINGUAGENS NATURAIS 3 Falei com a moça do celular Falei com a moça do celular Figura 1.1: Ambigüidade sintática A tradução de textos em linguagem natural para uma representação interna é objeto de estudo da área de processamento da linguagem natural (PLN). As grandes diculdades existentes nestas traduções dizem respeito às diferentes interpretações a que a linguagem natural está sujeita. Seguem algumas destas diculdades: palavras sinônimas: diversas palavras diferentes podem exprimir signicados idênticos ou quase iguais. Por exemplo, as palavras cão e cachorro, na língua portuguesa empregada no Brasil, têm o mesmo signicado. ambigüidade lexical: uma mesma palavra pode ter diferentes signi- cados, ou apresentar idéias diferentes. Por exemplo, a palavra cachorro pode tanto signicar um cão, quanto uma pessoa indigna ou canalha. ambigüidade sintática: uma sentença pode ter mais de uma estrutura sintática, o que implica diferentes leituras do conteúdo da sentença. Por exemplo, como mostrado na Figura 1.1, a sentença Falei com a moça do celular pode ser representada por duas árvores sintáticas diferentes. A sentença pode ser lida como Falei com a moça a qual estava com o celular ou Falei com a moça por intermédio do celular. ambigüidade semântica: as diculdades apresentadas como ambigüidades lexicais e sintáticas podem também conter ambigüidade semântica, ao apresentarem signicados diferentes para uma mesma palavra ou sentença. Em determinadas situações, a ambigüidade semântica permanece, mesmo após a resolução das ambigüidades lexical e sintática. Estas e outras características fazem com que uma consulta em linguagem natural seja difícil de ser interpretada, podendo, em muitos casos, gerar uma interpretação diferente da idéia original do usuário. Para amenizar este

24 4 CAPÍTULO 1. INTRODUÇÃO problema, uma ferramenta de busca pode utilizar um dicionário de relações semânticas 1 (como um tesauro) para encontrar o conceito correto apresentado na consulta do usuário. 1.3 Tesauro e Vocabulário Controlado Uri Miller em [MIL97] dene tesauro como: Um modelo léxico-semântico de realidades conceituais ou suas constituintes, expressas na forma de um sistema de termos e suas relações, que oferece acesso via diferentes aspectos e é usado como ferramenta de processamento e busca de uma unidade de recuperação de informação. O termo tesauro, de origem latina, tem sido utilizado para designar um tesouro de palavras, pois este tipo de dicionário deve fornecer riqueza em conceitos e suas relações semânticas, de forma a ter uma grande abrangência em um determinado domínio de conhecimento. Um tesauro pode contemplar um domínio de conhecimento especíco (por exemplo, os encontrados em [SEN01] e [SEN01a]) ou mesmo ser genérico (por exemplo, os encontrados em [SAN50] e [ROG58]). Segundo Gonzalez, em [GON01a], os tesauros genéricos são normalmente criados manualmente, enquanto que a criação automática de tesauros envolve o desenvolvimento de modelos de tesauros sobre um domínio especíco. A técnica denominada Vocabulário controlado, utilizada em sistemas de RI, procura minimizar estas características da linguagem natural utilizando tesauros para restringir o vocabulário de indexação e de consulta, de forma que uma idéia possa ser expressa somente de uma única maneira. A utilização de técnicas de vocabulário controlado está ligada à utilização de tesauros. Estas técnicas buscam indexar documentos com o uso de índices que representem conceitos únicos. Desta forma a indexação de um documento nesta base de dados, normalmente feita de modo manual, ocorre similarmente ao descrito por Will em [WIL92] e Soergel em [SOE98], como será exemplicado a seguir: Ao indexar um documento contendo informações sobre condutores de caminhão, o sistema irá sugerir a substituição do termo condutores pelo termo motoristas, pois o termo motoristas é mais usual. Tem-se então motoristas de caminhão. Neste momento o sistema irá sugerir a substituição por caminhoneiros pois este, além de mais usual, é mais sintético. 1Usaremos o termo relações semânticas, a partir deste ponto do trabalho, para indicar relações semântico-conceituais, ou relações semântico-lexicais (sinonímia e antonímia).

25 1.4. EXPANSÃO DE CONSULTA 5 Neste momento, então, o documento será indexado através do termo caminhoneiros. O que pode ser daí deduzido é que, sempre que um documento referir-se a caminhoneiros, mesmo que utilizando outros tipos de expressões, o sistema fará a indexação sobre um único termo. Conseqüentemente, a pesquisa nesta base de dados deve ocorrer de forma similar. Ao ser consultado sobre um determinado assunto, o sistema de RI tentará buscar um termo preferencial do tesauro sobre o qual os documentos estejam indexados. O processo de busca ocorre como descrito no exemplo a seguir, onde a consulta Motoristas de cegonhas de Florianópolis ocasionaria um dos dois processamentos seguintes: 1. O termo cegonha pode ser entendido como uma ave ou como um tipo de caminhão. Neste momento, dependendo de como o sistema foi projetado - i.e. se existe ou não alguma ontologia 2 que permita ao sistema compreender que um motorista nunca poderia conduzir uma ave, ou mesmo, que é mais provável um motorista conduzir um caminhão - poderá ser feita a pergunta ao usuário: O que você quis dizer com cegonha? Ave ou tipo de caminhão. Conhecendo o signicado de cegonha, o sistema encontraria motoristas de caminhão como sendo caminhoneiros e, assim, efetuaria a consulta através de um termo comum, de acordo com o qual os documentos foram indexados. 2. O sistema pode também conhecer a expressão Motoristas de cegonha como sendo cegonheiros, e irá saber que o termo cegonheiros representa um termo mais especíco de caminhoneiros. Neste momento a busca poderá ser feita através do termo comum caminhoneiros de Florianópolis ou mesmo cegonheiros de Florianópolis. Segundo Baeza-Yates & Ribeiro-Neto em [BAE99], tesauros são importantes na recuperação de informações, pois eles podem ser utilizados para obter melhor compreensão de alguns termos de uma consulta, através de técnicas de expansão de consultas. 1.4 Expansão de Consulta Segundo Strzalkowski et al. em [STR98], a função da expansão de consulta é fazer a consulta do usuário relembrar, mais elmente, os documentos 2Entende-se por ontologia um conjunto de conceitos organizados por uma taxonomia e um conjunto de regras de como devem ser utilizados estes conceitos.

26 6 CAPÍTULO 1. INTRODUÇÃO que se espera recuperar. Desta forma, se uma consulta é feita para lembrar um documento típico sobre determinado assunto, então tudo o que for pertencente ao texto desta consulta é relevante. Infelizmente, uma consulta comum especica somente os critérios semânticos mais relevantes, o que normalmente não abrange todos os termos e expressões que são utilizados nos documentos. Basicamente, segundo Baeza-Yates & Ribeiro-Neto em [BAE99], expansão de consulta é um processo que adiciona novos termos a uma consulta, em uma tentativa de inseri-la melhor no contexto da pesquisa do usuário. Este processo de adicionar termos e adequar uma pesquisa a um determinado contexto é facilitado com a utilização de um tesauro, pois as relações semânticas nele existentes ajudam a encontrar as palavras que melhor representam um determinado conceito. Um sistema de consulta pode, por exemplo, incluir em uma pesquisa os sinônimos e os termos mais especícos das palavras pesquisadas. O exemplo a seguir ilustra uma consulta e sua respectiva expansão conforme o método apresentado em [SOE98]. A consulta Motoristas de cegonha de Florianópolis pode ser representada pela seguinte consulta booleana: Motoristas E cegonha E Florianópolis. Ao analisar os termos da consulta em um tesauro, os termos desta busca são expandidos da seguinte forma: Motoristas: Condutores, Pilotos; Cegonha: Caminhão (obs.: a palavra cegonha, como ave, não tem sinônimo nem termo mais especíco); Florianópolis: Floripa; Motoristas de cegonha: cegonheiros, caminhoneiros; Neste momento os termos da consulta foram expandidos, o que torna possível a realização da seguinte consulta (melhor expressa na Figura 1.2): [(motoristas OU condutores OU pilotos) E (cegonha OU caminhão)] OU (cegonheiros OU caminhoneiros) E (Florianópolis OU Floripa) A expansão da consulta do exemplo anterior possibilita encontrar uma quantidade muito grande de documentos sobre o mesmo assunto, independentemente da utilização dos melhores termos na indexação. Juntamente com a expansão de consulta, ou mesmo com outros métodos de RI, um tesauro pode ser útil para medir a relevância dos documentos encontrados. Assim os documentos mais relevantes serão exibidos como melhores opções para o usuário. Estas medidas de relevância podem ser obtidas através de cálculo de distância semântica, como apresentado em [ALA00].

27 1.5. EXTENSIBLE MARKUP LANGUAGE 7 E OU E OU OU OU OU motoristas condutores pilotos cegonha caminhão cegonheiros caminhoneiros Florianópolis Floripa Figura 1.2: Exemplo de consulta expandida As áreas de biblioteconomia e ciência da informação utilizam tesauros para a escolha correta de índices para os documentos. Para orientar o desenvolvimento de tesauros foram criadas diversas recomendações, pelos comitês de normas e padrões (ANSI/NISO Z39.19 em [NIS93], ISO 2788 em [ISO86], entre outros). Estas normas são importantes, pois a criação de tesauros que seguem os mesmos padrões para conteúdo, aparência na exibição, métodos de construção e manutenção (como descrito no escopo da norma Z39.19 em [NIS93]), facilita a utilização de um mesmo tesauro por diferentes sistemas e pessoas. Outra característica que facilita a portabilidade de um tesauro é sua estruturação através de formatos universais como, hoje em dia, o XML (extensible Markup Language) e o RDF (Resource Description Framework). 1.5 extensible Markup Language De acordo com [BRA98], o padrão XML foi adotado, em 1998, pelo World Wide Web Consortium (W3C) 3 como formato universal para troca de dados e documentos estruturados na Internet. Desde então, estão sendo criados diversos formatos de acordo com os padrões XML como, por exemplo, RDF, XHTML e WML, entre outros. A facilidade de denição de novas linguagens, e a grande variedade de aplicações que suportam XML, fazem com que esta metalinguagem seja vastamente utilizada e seja bastante portável entre aplicações na Internet. Atualmente, utilizar XML para a denição de um tesauro é uma escolha normal, uma vez que a Internet é o cenário mais propício a ferramentas de 3O W3C foi criado com o propósito de desenvolver protocolos para aumentar a integração e promover a evolução da World Wide Web. É uma parceria de diversas indústrias administradas pelo Laboratório de Ciência da Computação do MIT (LCS) nos Estados Unidos, pelo Instituto Nacional de Pesquisa em Informática Aplicada(INRIA) na França e pela Universidade de Keio no Japão.

28 8 CAPÍTULO 1. INTRODUÇÃO recuperação de informação, e o XML, como anteriormente dito, é o padrão estabelecido para trocas de informação. Em muitos trabalhos encontrados na bibliograa, o uso da estruturação XML baseia-se em arquivos RDF (exemplo: [AMA99], [CER01] e [CRO01]). O modelo de dados RDF/XML foi desenvolvido pelo W3C como recomendação para a representação de dados estruturados na Internet. RDF é utilizado para descrever semanticamente documentos na Internet, utilizando a estratégia de gerenciar informação como uma coleção de links entre entidades únicas. Tal característica, comum à Internet e aos tesauros, faz com que a escolha deste modelo de dados seja válida para a representação tanto de documentos na Internet quanto de termos em um tesauro. 1.6 Este trabalho Neste trabalho é proposta, validada e avaliada uma estrutura tesaural útil para a recuperação de informações. Denominamos a estrutura como multitesauro por oferecer características que englobam diferentes tesauros, possibilitando a representação destes na estrutura global. A estrutura proposta será importante em uma etapa futura do projeto SEMA 4, em desenvolvimento na PUCRS, como parte de um sistema de RI. Ao desenvolver a estrutura multitesauro, nos preocupamos com o fato de que esta pudesse ser empregada em diferentes ambientes e, também, seus arquivos pudessem ser facilmente transmitidos pela Internet. A preocupação com que a estrutura (e os tesauros denidos com a mesma) seja utilizada na Internet é clara quando sua nalidade é a RI pois, atualmente, os sites de busca na Internet são os ambientes de RI mais usados e conhecidos. O formato XML é facilmente transmitido pela Internet através de servidores HTTP, tornando-se a escolha normal quando se tem a preocupação de uso pela rede. Optou-se pela expansão de consulta, para mostrar a utilidade da estrutura na RI, pela grande quantidade de trabalhos que envolvem este tópico aliado ao uso de tesauros (por exemplo: [CAR01], [IMA99], [JIN94], [KIM90], [ROB01] e [STR99]). A presente dissertação tem por objetivo apresentar uma estrutura tesaural que represente as características de diferentes tesauros que possam ser úteis à RI. A utilidade da estrutura multitesauro é validada através de uma técnica de expansão de consultas, onde diferentes tesauros são utilizados, ao mesmo tempo, como um único tesauro. A heurística de expansão de consultas foi 4Mais informações em linatural/sema/

29 1.6. ESTE TRABALHO 9 desenvolvida para utilizar as relações denidas na estrutura e ponderar a importância das mesmas, tendo como principal característica a atribuição de pesos para cada tipo de relação denida. Desta forma, é possível quanticar a importância de cada tipo de relação dado o peso que lhe é atribuído. Neste trabalho, a estratégia de validação da estrutura tesaural deve armar sua característica multitesaural e fornecer meios para julgar a importância individual dos tipos de relações semânticas. O texto da dissertação está dividido em 8 capítulos, sendo o primeiro esta introdução. O capítulo 2 apresenta normas internacionais existentes para organização de tesauros. O capítulo 3 apresenta o modo como as relações semânticas existentes em um tesauro podem ser utilizadas em tarefas de RI. O capítulo 4 apresenta a estrutura multitesauro proposta por este trabalho. O capítulo 5 demonstra um método de expansão de consultas que tem por objetivo oferecer um meio de validar a utilidade da estrutura proposta na RI. Esta validação é apresentada no capítulo 6. No capítulo 7 são apresentados trabalhos correlatos a esta dissertação. No último capítulo são apresentadas as conclusões desta dissertação.

30 10 CAPÍTULO 1. INTRODUÇÃO

31 Capítulo 2 Normas para a organização de tesauros Na introdução desta dissertação, foram apresentados o PLN como um tópico importante na recuperação de informação, e os tesauros como um recurso bastante útil a esta tarefa. A RI apresenta-se como a área responsável pela busca de documentos relevantes a uma necessidade de informação, expressa através da consulta de um usuário. Os tesauros, como descrito no capítulo anterior, surgem como ferramenta de apoio aos sistemas de RI na resolução da consulta em linguagem natural. Ao empregarmos o termo tesauro neste trabalho, devemos entender uma base de dados lexical onde os lexemas são inter-relacionados por algum tipo de relação semântica. Desta forma, temos a organização de tal base, e sua utilização na RI, como foco principal. O presente capítulo se concentra na organização e estruturação deste tipo de léxico. Inicialmente, abordaremos a organização de um tesauro em classes de palavras e facetas; logo após, apresentaremos normas existentes para o desenvolvimento de tesauros monolíngües e sua estruturação. Também serão apresentados neste capítulo alguns trabalhos que utilizam as normas de denição de tesauros existentes, junto a uma estruturação XML. 2.1 Classes de palavras Um tesauro pode ser organizado, simplesmente, por ordem alfabética de seus termos. Contudo, apesar de a ordem alfabética ser uma organização já assimilada e simples de consultar, é possível organizar um tesauro conforme um sistema de categorias. Desta forma, a compreensão das relações entre as palavras será facilitada, pois todas elas estarão inclusas em alguma categoria que, por si própria, já exprime um signicado. 11

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Núcleo de Pós Graduação Pitágoras

Núcleo de Pós Graduação Pitágoras Núcleo de Pós Graduação Pitágoras Professor: Fernando Zaidan Disciplina: Arquitetura da Informática e Automação MBA Gestão em Tecnologia 1 da Informaçao 2 Figura: Tela do IBM Mainframe Fonte: Arquivo próprio

Leia mais

Web Semântica e Matching de Ontologias: Uma Visão Geral

Web Semântica e Matching de Ontologias: Uma Visão Geral Web Semântica e Matching de Ontologias: Uma Visão Geral Hélio Rodrigues de Oliveira Departamento de Computação Universidade Federal do Ceará heliorodrigues@lia.ufc.br Bernadette Farias Lóscio Departamento

Leia mais

Tesauro. Profa. Lillian Alvares, Faculdade de Ciência da Informação, Universidade de Brasília

Tesauro. Profa. Lillian Alvares, Faculdade de Ciência da Informação, Universidade de Brasília Tesauro Profa. Lillian Alvares, Faculdade de Ciência da Informação, Universidade de Brasília ANSI/NISO Z39.19 Tesauro é um vocabulário controlado organizado em uma ordem preestabelecida e estruturado de

Leia mais

4 Conversor EDTV Raw. 4.1 Arquitetura

4 Conversor EDTV Raw. 4.1 Arquitetura 4 Conversor EDTV Raw O conversor EDTV Raw é o programa que lê um documento escrito no perfil NCL EDTV e gera um documento Raw equivalente, i.e. que define a mesma apresentação. Este capítulo, apresenta

Leia mais

XML. 1. XML: Conceitos Básicos. 2. Aplicação XML: XHTML 3. Folhas de Estilo em Cascata XML

XML. 1. XML: Conceitos Básicos. 2. Aplicação XML: XHTML 3. Folhas de Estilo em Cascata XML 1 1. : Conceitos Básicos 2. Aplicação : XHTML 3. Folhas de Estilo em Cascata 2 é um acrônimo para EXtensible Markup Language é uma linguagem de marcação muito parecida com HTML foi designada para descrever

Leia mais

Guia de Consulta Rápida HTTP. Décio Jr. Novatec Editora. www.novateceditora.com.br

Guia de Consulta Rápida HTTP. Décio Jr. Novatec Editora. www.novateceditora.com.br Guia de Consulta Rápida HTTP Décio Jr. Novatec Editora www.novateceditora.com.br Guia de Consulta Rápida HTTP de Décio Jr. Copyright 2001 da Novatec Editora Ltda. Todos os direitos reservados. É proibida

Leia mais

Desenvolvimento Web. Saymon Yury C. Silva Analista de Sistemas. http://www.saymonyury.com.br

Desenvolvimento Web. Saymon Yury C. Silva Analista de Sistemas. http://www.saymonyury.com.br Desenvolvimento Web Saymon Yury C. Silva Analista de Sistemas http://www.saymonyury.com.br Vantagens Informação em qualquer hora e lugar; Rápidos resultados; Portabilidade absoluta; Manutenção facilitada

Leia mais

INSTITUTO FEDERAL DO RIO GRANDE DO NORTE CAMPUS CENTRAL NATAL DIRETORIA DE ENSINO E TECNOLOGIA EM CONSTRUÇÃO CIVIL

INSTITUTO FEDERAL DO RIO GRANDE DO NORTE CAMPUS CENTRAL NATAL DIRETORIA DE ENSINO E TECNOLOGIA EM CONSTRUÇÃO CIVIL INSTITUTO FEDERAL DO RIO GRANDE DO NORTE CAMPUS CENTRAL NATAL DIRETORIA DE ENSINO E TECNOLOGIA EM CONSTRUÇÃO CIVIL NORMAS PARA ELABORAÇÃO DE UM RELATÓRIO TÉCNICO Eurípedes de Medeiros Junior 1 Mara Matos

Leia mais

Autoria Web Apresentação e Visão Geral sobre a Web

Autoria Web Apresentação e Visão Geral sobre a Web Apresentação e Visão Geral sobre a Web Apresentação Thiago Miranda Email: mirandathiago@gmail.com Site: www.thiagomiranda.net Objetivos da Disciplina Conhecer os limites de atuação profissional em Web

Leia mais

INTRODUÇÃO AO DESENVOLVIMENTO WEB. PROFª. M.Sc. JULIANA H Q BENACCHIO

INTRODUÇÃO AO DESENVOLVIMENTO WEB. PROFª. M.Sc. JULIANA H Q BENACCHIO INTRODUÇÃO AO DESENVOLVIMENTO WEB PROFª. M.Sc. JULIANA H Q BENACCHIO Internet Internet é o conjunto de diversas redes de computadores que se comunicam entre si Internet não é sinônimo de WWW (World Wide

Leia mais

UFG - Instituto de Informática

UFG - Instituto de Informática UFG - Instituto de Informática Especialização em Desenvolvimento de Aplicações Web com Interfaces Ricas EJB 3.0 Prof.: Fabrízzio A A M N Soares professor.fabrizzio@gmail.com Aula 13 Web Services Web Services

Leia mais

5 Exemplos. 5.1. Produção bibliográfica da PUC-Rio

5 Exemplos. 5.1. Produção bibliográfica da PUC-Rio 5 Exemplos Foram desenvolvidas duas aplicações que exemplificam o uso e a utilidade das mudanças feitas no método SHDM e do ambiente de desenvolvimento Synth, apresentadas nas seções a seguir. 5.1. Produção

Leia mais

XML e Banco de Dados. Prof. Daniela Barreiro Claro DCC/IM/UFBA

XML e Banco de Dados. Prof. Daniela Barreiro Claro DCC/IM/UFBA XML e Banco de Dados DCC/IM/UFBA Banco de Dados na Web Armazenamento de dados na Web HTML muito utilizada para formatar e estruturar documentos na Web Não é adequada para especificar dados estruturados

Leia mais

Desenvolvimento e Avaliação de uma Estrutura Multitesauro para

Desenvolvimento e Avaliação de uma Estrutura Multitesauro para Desenvolvimento e Avaliação de uma Estrutura Multitesauro para Recuperação de Informações Luiz Augusto Sangoi Pizzato e Vera Lúcia Strube de Lima Pontifícia Universidade Católica do Rio Grande do Sul Faculdade

Leia mais

Além da correção ortográfica nos editores de textos livres

Além da correção ortográfica nos editores de textos livres Além da correção ortográfica nos editores de textos livres William D. Colen M. Silva (colen@users.sourceforge.net) Eng. Computação pela Escola Politécnica da USP (2006) Mestrando Ciência da Computação

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento

Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento 1 Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento Referência do texto para discussão: BRASCHER, Marisa;

Leia mais

1 Introdução. 1.1 Apresentação do tema

1 Introdução. 1.1 Apresentação do tema 1 Introdução 1.1 Apresentação do tema Segundo Basílio (1987), as principais funções do léxico são a representação conceitual e o fornecimento de unidades básicas para a construção dos enunciados. Para

Leia mais

WXDC: Uma Ferramenta para Imposição e Validação de Restrições de Integridade baseadas na Linguagem XDCL

WXDC: Uma Ferramenta para Imposição e Validação de Restrições de Integridade baseadas na Linguagem XDCL 232 - Encontro Anual de Tecnologia da Informação WXDC: Uma Ferramenta para Imposição e Validação de Restrições de Integridade baseadas na Linguagem XDCL Stevan D. Costa1, Alexandre T. Lazzaretti1, Anubis

Leia mais

UNIVERSIDADE DA BEIRA INTERIOR Faculdade de Engenharia Departamento de Informática

UNIVERSIDADE DA BEIRA INTERIOR Faculdade de Engenharia Departamento de Informática 1 Este é o seu teste de avaliação de frequência. Leia as perguntas com atenção antes de responder. Escreva as suas respostas nesta folha de teste, marcando um círculo em volta da opção ou opções que considere

Leia mais

ONTOLOGIA PARA PUBLICAÇÃO CIENTÍFICA 1 ONTOLOGY FOR SCIENTIFIC PUBLICATION

ONTOLOGIA PARA PUBLICAÇÃO CIENTÍFICA 1 ONTOLOGY FOR SCIENTIFIC PUBLICATION ONTOLOGIA PARA PUBLICAÇÃO CIENTÍFICA 1 ONTOLOGY FOR SCIENTIFIC PUBLICATION Andrenizia Aquino Eluan Mestranda do Programa de Pós-Graduação em Ciência da Informação Universidade Federal de Santa Catarina

Leia mais

1 http://www.google.com

1 http://www.google.com 1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou

Leia mais

XML e Banco de Dados de Internet. Tópicos Especiais em Tecnologia da Informação Profa. Késsia R. C. Marchi

XML e Banco de Dados de Internet. Tópicos Especiais em Tecnologia da Informação Profa. Késsia R. C. Marchi XML e Banco de Dados de Internet Tópicos Especiais em Tecnologia da Informação Profa. Késsia R. C. Marchi Motivação Diversas aplicações Web utilizam Fontes de Dados (BD); Arquitetura Cliente-Servidor (2

Leia mais

Guia para Apresentação de Trabalho Acadêmico: de acordo com NBR 14724/2011. São Carlos

Guia para Apresentação de Trabalho Acadêmico: de acordo com NBR 14724/2011. São Carlos Guia para Apresentação de Trabalho Acadêmico: de acordo com NBR 14724/2011 São Carlos Guia para Apresentação de Trabalho Acadêmico As orientações abaixo estão de acordo com NBR 14724/2011 da Associação

Leia mais

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback

25/05/2015. Relevance Feedback. Expansão de Consulta. Relevance Feedback Relevance Feedback Expansão de Consulta Relevance Feedback 1 Relevance Feedback Baeza-Yates; Ribeiro-Neto, (2011, cap 5) distinguem dois métodos: Explicit Relevance Feedback a informação para a reformulação

Leia mais

Capítulo 1. Introdução. 1.1 Linguagens. OBJETIVOS DO CAPÍTULO Ao final deste capítulo você deverá ser capaz de:

Capítulo 1. Introdução. 1.1 Linguagens. OBJETIVOS DO CAPÍTULO Ao final deste capítulo você deverá ser capaz de: i Sumário 1 Introdução 1 1.1 Linguagens....................................... 1 1.2 O que é um Compilador?................................ 2 1.3 Processadores de Programas: Compiladores, Interpretadores

Leia mais

Web Design Aula 01: Conceitos Básicos

Web Design Aula 01: Conceitos Básicos Web Design Aula 01: Conceitos Básicos Professora: Priscilla Suene priscilla.silverio@ifrn.edu.br Motivação Motivação Motivação Motivação Roteiro Introdução Papéis e Responsabilidades Construindo um site

Leia mais

Administração de Banco de Dados

Administração de Banco de Dados Administração de Banco de Dados Professora conteudista: Cida Atum Sumário Administração de Banco de Dados Unidade I 1 INTRODUÇÃO A BANCO DE DADOS...1 1.1 Histórico...1 1.2 Definições...2 1.3 Importância

Leia mais

ESTUDO TÉCNICO N.º 14/2012

ESTUDO TÉCNICO N.º 14/2012 ESTUDO TÉCNICO N.º 14/2012 MANUAL DE INSTRUÇÕES PARA UTILIZAÇÃO DO ARQUIVO EM FORMATO XML PARA IMPORTAÇÃO DOS DADOS DO REGISTRO MENSAL DE ATENDIMENTOS DOS CRAS MINISTÉRIO DO DESENVOLVIMENTO SOCIAL E COMBATE

Leia mais

Introdução ao Desenvolvimento e Design de Websites

Introdução ao Desenvolvimento e Design de Websites Introdução ao Desenvolvimento e Design de Websites Prof.: Salustiano Rodrigues de Oliveira Email: saluorodrigues@gmail.com Site: www.profsalu.wordpress.com Introdução ao Desenvolvimento e Design de Websites

Leia mais

PRnet/2013. Linguagem de Programação Web

PRnet/2013. Linguagem de Programação Web Linguagem de Programação Web Linguagem de Programação Web Prnet/2013 Linguagem de Programação Web» Programas navegadores» Tipos de URL» Protocolos: HTTP, TCP/IP» Hipertextos (páginas WEB)» HTML, XHTML»

Leia mais

Suporte à Engenharia Reversa para o ambiente SEA

Suporte à Engenharia Reversa para o ambiente SEA Otavio Pereira Suporte à Engenharia Reversa para o ambiente SEA Orientador: Ricardo Pereira e Silva Universidade Federal de Santa Catarina - UFSC Departamento de Informática e Estatística - INE Florianópolis

Leia mais

Roteiro para Transmissão Ambiente de Testes da Guias Online

Roteiro para Transmissão Ambiente de Testes da Guias Online Roteiro para Transmissão Ambiente de Testes da Guias Online (GRH) Acessar o sistema pelo site: http://www.sdas.org.br/ Acessar o sistema com o Usuário: 9999 e Senha: PMG52 Será disponibilizado o ambiente

Leia mais

UMA ABORDAGEM SOBRE OS PADRÕES DE QUALIDADE DE SOFTWARE COM ÊNFASE EM SISTEMAS PARA WEB

UMA ABORDAGEM SOBRE OS PADRÕES DE QUALIDADE DE SOFTWARE COM ÊNFASE EM SISTEMAS PARA WEB UMA ABORDAGEM SOBRE OS PADRÕES DE QUALIDADE DE SOFTWARE COM ÊNFASE EM SISTEMAS PARA WEB Alan Francisco de Souza¹, Claudete Werner¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil alanfsouza.afs@gmail.com,

Leia mais

Desenvolvimento de aplicações web utilizando separação de preocupações

Desenvolvimento de aplicações web utilizando separação de preocupações Daniel Delatorre Vanzin Desenvolvimento de aplicações web utilizando separação de preocupações Monograa apresentada ao programa de Bacharelado em Ciências da Computação da Universidade Federal de Santa

Leia mais

2 Conceitos relativos a Web services e sua composição

2 Conceitos relativos a Web services e sua composição 15 2 Conceitos relativos a Web services e sua composição A necessidade de flexibilidade na arquitetura das aplicações levou ao modelo orientado a objetos, onde os processos de negócios podem ser representados

Leia mais

HTML5 E WEB SEMÂNTICA, A WEB COM SIGNIFICADO

HTML5 E WEB SEMÂNTICA, A WEB COM SIGNIFICADO HTML5 E WEB SEMÂNTICA, A WEB COM SIGNIFICADO Djalma Gonçalves Costa Junior¹, Willian Barbosa Magalhães¹ ¹Universidade Paranaense (Unipar) Paranavaí - PR - Brasil djalma.g.costajr@gmail.com wmagalhaes@unipar.br

Leia mais

Tecnologia para Sistemas Inteligentes Apontamentos para as aulas sobre. Introdução à Representação e Processamento de Ontologias: Framework O3f

Tecnologia para Sistemas Inteligentes Apontamentos para as aulas sobre. Introdução à Representação e Processamento de Ontologias: Framework O3f Tecnologia para Sistemas Inteligentes Apontamentos para as aulas sobre Introdução à Representação e Processamento de Ontologias: Framework O3f Luís Miguel Botelho Departamento de Ciências e Tecnologias

Leia mais

Conheça o Projeto. Apresentação. Finalidade. Objetivo

Conheça o Projeto. Apresentação. Finalidade. Objetivo Manual do Usuário Índice Conheça o Projeto...3 Apresentação...3 Finalidade...3 Objetivo...3 Histórico...4 Usando o Portal...5 Efetuando o cadastro na biblioteca digital...5 Logando na Biblioteca Digital...6

Leia mais

Introdução 17. 1 Introdução

Introdução 17. 1 Introdução Introdução 17 1 Introdução O volume de informações que gerenciamos tem crescido a cada dia. Realizamos milhões de pesquisas na Web, postamos mensagens em blogs, enviamos mensagens de correio eletrônico,

Leia mais

Desenvolvimento Web Introdução a XHTML. Prof. Bruno Gomes

Desenvolvimento Web Introdução a XHTML. Prof. Bruno Gomes Desenvolvimento Web Introdução a XHTML Prof. Bruno Gomes 2014 Introdução HTML e XHTML Estrutura básica do documento DTDs Validação do documento Exercícios HTML e XHTML HTML (Hipertext Markup Language)

Leia mais

WWW - World Wide Web

WWW - World Wide Web WWW World Wide Web WWW Cap. 9.1 WWW - World Wide Web Idéia básica do WWW: Estratégia de acesso a uma teia (WEB) de documentos referenciados (linked) em computadores na Internet (ou Rede TCP/IP privada)

Leia mais

Roteiro para se fazer uma boa pesquisa e elaborar um trabalho acadêmico

Roteiro para se fazer uma boa pesquisa e elaborar um trabalho acadêmico Roteiro para se fazer uma boa pesquisa e elaborar um trabalho acadêmico Para realizar uma pesquisa que não se torne um grande sacrifício pelas dificuldades em encontrar as informações, antes é preciso

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

O padrão RDF na descrição de imagens

O padrão RDF na descrição de imagens O padrão RDF na descrição de imagens Edeilson Milhomem da Silva 1, Parcilene Fernandes de Brito 1 1 Sistemas de Informação Centro Universitário Luterano de Palmas (CEULP/ULBRA) Cx. Postal 160 77054-970

Leia mais

WEBDESIGN. Professor: Paulo Trentin paulo@paulotrentin.com.br http://www.paulotrentin.com.br Escola CDI de Videira

WEBDESIGN. Professor: Paulo Trentin paulo@paulotrentin.com.br http://www.paulotrentin.com.br Escola CDI de Videira WEBDESIGN Professor: Paulo Trentin paulo@paulotrentin.com.br http://www.paulotrentin.com.br Escola CDI de Videira 1 CDI - Curso de Webdesign - Prof. Paulo Trentin Objetivos para esta aula Debater sobre

Leia mais

AGRUPAMENTO DE ESCOLAS DE CANAS DE SENHORIM WWW. Como pesquisar na Internet e como avaliar páginas Web

AGRUPAMENTO DE ESCOLAS DE CANAS DE SENHORIM WWW. Como pesquisar na Internet e como avaliar páginas Web AGRUPAMENTO DE ESCOLAS DE CANAS DE SENHORIM E S C O L A E B 2, 3 / S E N G º D I O N Í S I O A U G U S T O C U N H A B I B L I O T E C A E S C O L A R C E N T R O D E R E C U R S O S E D U C A T I V O

Leia mais

3 Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica

3 Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica 3 Modelo de Controle de Acesso no Projeto de Aplicações na Web Semântica Este trabalho tem o objetivo de integrar o controle de acesso no projeto de aplicações na web semântica. Uma arquitetura de software

Leia mais

BCValidador VALIDAÇÃO DE ARQUIVOS XML RECEBIDOS PELO BANCO CENTRAL DO BRASIL

BCValidador VALIDAÇÃO DE ARQUIVOS XML RECEBIDOS PELO BANCO CENTRAL DO BRASIL BCValidador VALIDAÇÃO DE ARQUIVOS XML RECEBIDOS PELO BANCO CENTRAL DO BRASIL Deinf/Dine4 Versão 1.3 20/05/2013 Histórico de Revisão Data Versão Descrição Autor 06/11/2007 1.0 Elaboração da primeira versão

Leia mais

GERÊNCIA DE DADOS SEMIESTRUTURADOS -XML. Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza

GERÊNCIA DE DADOS SEMIESTRUTURADOS -XML. Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza GERÊNCIA DE DADOS SEMIESTRUTURADOS -XML Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza O QUE É XML? Tecnologia desenvolvida pelo W3C http://www.w3c.org W3C: World Wide Web Consortium consórcio

Leia mais

PROJETO: PRODUTO 3 RELATÓRIO PARCIAL DO DESENVOLVIMENTO E IMPLANTAÇÃO DO SISTEMA DE INFORMAÇÕES

PROJETO: PRODUTO 3 RELATÓRIO PARCIAL DO DESENVOLVIMENTO E IMPLANTAÇÃO DO SISTEMA DE INFORMAÇÕES Nome da Empresa: DEPARTAMENTO INTERSINDICAL DE ESTATÍSTICA E ESTUDOS SÓCIO-ECONÔMICOS (DIEESE) PROJETO: PROJETO DE COOPERAÇÃO TÉCNICA BRA/IICA/03/005 PARTICIPAÇÃO SOCIAL NÚMERO DO CONTRATO: 205037 TEMA:

Leia mais

INSTITUIÇÃO DE ENSINO SUPERIOR SANT ANA LUCIO MAURO BRAGA MACHADO MANUAL PARA A ELABORAÇÃO DE TRABALHOS ACADÊMICOS

INSTITUIÇÃO DE ENSINO SUPERIOR SANT ANA LUCIO MAURO BRAGA MACHADO MANUAL PARA A ELABORAÇÃO DE TRABALHOS ACADÊMICOS INSTITUIÇÃO DE ENSINO SUPERIOR SANT ANA LUCIO MAURO BRAGA MACHADO MANUAL PARA A ELABORAÇÃO DE TRABALHOS ACADÊMICOS PONTA GROSSA 2011 LUCIO MAURO BRAGA MACHADO MANUAL PARA A ELABORAÇÃO DE TRABALHOS ACADÊMICOS

Leia mais

A) NO CASO DE NÃO-INCLUSÃO DE ARTIGO(S) PUBLICADO(S) E/OU MANUSCRITO(S) SUBMETIDO(S) OU ACEITOS PARA PUBLICAÇÃO APRESENTAÇÃO DA MANEIRA FORMAL);

A) NO CASO DE NÃO-INCLUSÃO DE ARTIGO(S) PUBLICADO(S) E/OU MANUSCRITO(S) SUBMETIDO(S) OU ACEITOS PARA PUBLICAÇÃO APRESENTAÇÃO DA MANEIRA FORMAL); SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DO PARÁ NÚCLEO DE PESQUISAS EM ONCOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM ONCOLOGIA E CIÊNCIAS MÉDICAS NORMAS PARA A APRESENTAÇÃO DE DISSERTAÇÕES DE MESTRADO, TESES

Leia mais

UNIVERSIDADE. Sistemas Distribuídos

UNIVERSIDADE. Sistemas Distribuídos UNIVERSIDADE Sistemas Distribuídos Ciência da Computação Prof. Jesus José de Oliveira Neto Web Services Web Services Existem diferentes tipos de comunicação em um sistema distribuído: Sockets Invocação

Leia mais

Normas para Apresentação de Monografias

Normas para Apresentação de Monografias UNIVERSIDADE FEDERAL DE CAMPINA GRANDE DEPARTAMENTO DE SISTEMAS E COMPUTAÇÃO COORDENAÇÃO DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO Normas para Apresentação de Monografias Campina Grande, dezembro 2010

Leia mais

Tecnologias da Internet (T) Avaliação de Frequência (v1) 60 minutos * 09.05.2012

Tecnologias da Internet (T) Avaliação de Frequência (v1) 60 minutos * 09.05.2012 1 Este é o seu teste de avaliação de frequência. Leia as perguntas com atenção antes de responder e tenha atenção que algumas perguntas podem ter alíneas de resposta em páginas diferentes. Escreva as suas

Leia mais

NORMALIZAÇÃO DE TRABALHOS ACADÊMICOS ABNT TRABALHOS ACADÊMICOS:

NORMALIZAÇÃO DE TRABALHOS ACADÊMICOS ABNT TRABALHOS ACADÊMICOS: MANUAL PARA TCC www.etecmonteaprazivel.com.br Estrada do Bacuri s/n Caixa Postal 145 Monte Aprazível SP CEP 15150-000 Tel.: (17) 3275.1522 Fax: (17) 3275.1841 NORMALIZAÇÃO DE TRABALHOS ACADÊMICOS ABNT

Leia mais

Projeto Final de Engenharia de Computação

Projeto Final de Engenharia de Computação Orientações para Desenvolvimento do Projeto Final de Engenharia de Computação compilado por: Noemi Rodriguez texto baseado em: Orientações para o Planejamento e Realização do Projeto Final, de Simone Barbosa

Leia mais

JONATHAN SCHNEIDER DESENVOLVIMENTO DE FORNECEDORES E CONSUMIDORES DE CONTEÚDO WEB SEMÂNTICO

JONATHAN SCHNEIDER DESENVOLVIMENTO DE FORNECEDORES E CONSUMIDORES DE CONTEÚDO WEB SEMÂNTICO FUNDAÇÃO DE ENSINO EURÍPIDES SOARES DA ROCHA CENTRO UNIVERSITÁRIO EURÍPIDES DE MARÍLIA UNIVEM CURSO DE CIÊNCIA DA COMPUTAÇÃO JONATHAN SCHNEIDER DESENVOLVIMENTO DE FORNECEDORES E CONSUMIDORES DE CONTEÚDO

Leia mais

Poder Judiciário do Estado do Rio de Janeiro VOCABULÁRIO CONTROLADO DA. de Atos Oficiais BIBLIOTECA DO TRIBUNAL DE DO ESTADO DO RIO DE JANEIRO

Poder Judiciário do Estado do Rio de Janeiro VOCABULÁRIO CONTROLADO DA. de Atos Oficiais BIBLIOTECA DO TRIBUNAL DE DO ESTADO DO RIO DE JANEIRO Poder Judiciário do Estado do Rio de Janeiro Manual MANUAL PARA de ELABORAÇÃO Seleção DO VOCABULÁRIO CONTROLADO DA de Atos Oficiais BIBLIOTECA DO TRIBUNAL DE para JUSTIÇA Indexação DO ESTADO DO RIO DE

Leia mais

CSS. Oficina de CSS Aula 10. Cascading Style Sheets. Cascading Style Sheets Roteiro. Cascading Style Sheets. Cascading Style Sheets W3C

CSS. Oficina de CSS Aula 10. Cascading Style Sheets. Cascading Style Sheets Roteiro. Cascading Style Sheets. Cascading Style Sheets W3C Roteiro Oficina de Aula 10 s Selos de conformidade Prof. Vinícius Costa de Souza www.inf inf.unisinos..unisinos.br/~vinicius outubro de 2006 W3C São um conjunto de normas, diretrizes, recomendações, notas

Leia mais

Web Design. Prof. Felippe

Web Design. Prof. Felippe Web Design Prof. Felippe 2015 Sobre a disciplina Fornecer ao aluno subsídios para o projeto e desenvolvimento de interfaces de sistemas Web eficientes, amigáveis e intuitivas. Conceitos fundamentais sobre

Leia mais

_áääáçíéå~= `Éåíêç=ÇÉ=fåÑçêã~ ç=é=oéñéêæååá~

_áääáçíéå~= `Éåíêç=ÇÉ=fåÑçêã~ ç=é=oéñéêæååá~ _áääáçíéå~ `ÉåíêçÇÉfåÑçêã~ çéoéñéêæååá~ DIRETRIZES PARA A SELEÇÃO E AQUISIÇÃO DE LIVROS, MONOGRAFIAS E SIMILARES PARA A BIBLIOTECA DA FACULDADE DE SAÚDE PÚBLICA/ USP 1. INTRODUÇÃO O fluxo crescente de

Leia mais

BREVE INTRODUÇÃO À LINGUAGEM XML

BREVE INTRODUÇÃO À LINGUAGEM XML BREVE INTRODUÇÃO À LINGUAGEM XML Por Carlos H. Marcondes marcon@vm.uff.br Rio de Janeiro Abril 2008 PROGRAMA 1.Problema, motivações e conceitos 2.Estrutura de um documento XML 1.DTDs, Schemas 2.Folhas

Leia mais

Ministério da Educação Universidade Federal do Amapá Pró-Reitoria de Pesquisa e Pós-Graduação Programa de Pós-graduação em Ciências Farmacêuticas

Ministério da Educação Universidade Federal do Amapá Pró-Reitoria de Pesquisa e Pós-Graduação Programa de Pós-graduação em Ciências Farmacêuticas Ministério da Educação Universidade Federal do Amapá Pró-Reitoria de Pesquisa e Pós-Graduação Programa de Pós-graduação em Ciências Farmacêuticas MANUAL PARA ELABORAÇÃO DO TRABALHO DE DISSERTAÇÃO (FORMATO

Leia mais

3 OOHDM e SHDM 3.1. OOHDM

3 OOHDM e SHDM 3.1. OOHDM 32 3 OOHDM e SHDM Com a disseminação em massa, desde a década de 80, de ambientes hipertexto e hipermídia, principalmente a Web, foi identificada a necessidade de elaborar métodos que estruturassem de

Leia mais

Conhecimento. Sistemas de Organização do. Classificação. Taxonomia. Tesauro. Cléria Elvina Costa Moreira Lais Pereira de Oliveira

Conhecimento. Sistemas de Organização do. Classificação. Taxonomia. Tesauro. Cléria Elvina Costa Moreira Lais Pereira de Oliveira Sistemas de Organização do Conhecimento FACULDADE DE CIÊNCIA DA INFORMAÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO Classificação Taxonomia Tesauro Disciplina: Fundamentos em Organização da Informação

Leia mais

universia.com.br/materia/img/tutoriais/ /01.jsp 1/1

universia.com.br/materia/img/tutoriais/ /01.jsp 1/1 5/12/2008 Monografias - Apresentação Fazer um trabalho acadêmico exige muito de qualquer pesquisador ou estudante. Além de todo esforço em torno do tema do trabalho, é fundamental ainda, adequá-lo às normas

Leia mais

Interpretador AIML alimentado com tags HTML5

Interpretador AIML alimentado com tags HTML5 2º Congresso de Pesquisa Científica : Inovação, Ética e Sustentabilidade Interpretador AIML alimentado com tags HTML5 Rafael Luiz de Macedo (Ciência da Computação - UNIVEM - Marília/SP) Email: rafaelldemacedo@gmail.com

Leia mais

Engenharia de Software I

Engenharia de Software I Engenharia de Software I Rogério Eduardo Garcia (rogerio@fct.unesp.br) Bacharelado em Ciência da Computação Aula 05 Material preparado por Fernanda Madeiral Delfim Tópicos Aula 5 Contextualização UML Astah

Leia mais

Desenvolvimento em Ambiente Web. Prof. André Y. Kusumoto andrekusumoto.unip@gmail.com

Desenvolvimento em Ambiente Web. Prof. André Y. Kusumoto andrekusumoto.unip@gmail.com Desenvolvimento em Ambiente Web Prof. André Y. Kusumoto andrekusumoto.unip@gmail.com No início A Web é criada em 1989, para ser um padrão de publicação e distribuição de textos científicos e acadêmicos.

Leia mais

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA

PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA PROPOSTA PARA CONSTRUÇÃO DE UMA BIBLIOTECA DIGITAL COMO FERRAMENTA DE AUXÍLIO NO ENSINO À DISTÂNCIA Daniel Gonzaga dos Santos 1 Faculdade Cidade de João Pinheiro Resumo: Este artigo aborda as etapas para

Leia mais

METADADOS PARA A PRESERVAÇÃO DA INFORMAÇÃO DIGITAL

METADADOS PARA A PRESERVAÇÃO DA INFORMAÇÃO DIGITAL 354 METADADOS PARA A PRESERVAÇÃO DA INFORMAÇÃO DIGITAL José Carlos Abbud Grácio (UNESP) Bárbara Fadel (UNESP) 1. Introdução Com os avanços das tecnologias de informação e comunicação (TIC) as instituições

Leia mais

2 Geração Dinâmica de Conteúdo e Templates de Composição

2 Geração Dinâmica de Conteúdo e Templates de Composição 2 Geração Dinâmica de Conteúdo e Templates de Composição Alguns dos aspectos mais importantes na arquitetura proposta nesta dissertação são: a geração dinâmica de conteúdo e a utilização de templates de

Leia mais

português língua não materna (a2) Dezembro de 2013

português língua não materna (a2) Dezembro de 2013 Informação prova final / Exame Final Nacional português língua não materna (a2) Dezembro de 2013 Prova 63/93/739 2014 6.º Ano, 9.º Ano ou 12.º Ano de Escolaridade O presente documento divulga as características

Leia mais

Arquitetura de Informação - 6

Arquitetura de Informação - 6 Arquitetura de Informação - 6 Ferramentas para Web Design Prof. Ricardo Ferramentas para Web Design 1 Objetivo do Sistema de Rotulação O sistema de rotulação é o componente da Arquitetura de Informação

Leia mais

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Aula 2 Computação em Nuvem Desafios e Oportunidades A Computação em Nuvem

Leia mais

RSS no desenvolvimento de uma Central de Notícias

RSS no desenvolvimento de uma Central de Notícias RSS no desenvolvimento de uma Central de Notícias Darley Passarin 1, Parcilene Fernandes de Brito 1 1 Sistemas de Informação Centro Universitário Luterano de Palmas (CEULP/ULBRA) Palmas TO Brasil darley@centralrss.com.br,

Leia mais

MANUAL PARA ELABORAÇÃO DE MONOGRAFIAS DO CET/UnB

MANUAL PARA ELABORAÇÃO DE MONOGRAFIAS DO CET/UnB UNIVERSIDADE DE BRASÍLIA Centro de Excelência em Turismo MANUAL PARA ELABORAÇÃO DE MONOGRAFIAS DO CET/UnB Por: Jakeline V. de Pádua APRESENTAÇÃO As páginas que se seguem especificam os princípios gerais

Leia mais

Criação e publicação de um dataset de dados interligados das edições passadas do Simpósio Brasileiro de Banco de Dados

Criação e publicação de um dataset de dados interligados das edições passadas do Simpósio Brasileiro de Banco de Dados U NIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2 0 1 2. 2 Criação e publicação de um dataset de dados interligados das edições passadas do Simpósio Brasileiro

Leia mais

Implementar servidores de Web/FTP e DFS. Disciplina: Serviços de Redes Microsoft Professor: Fernando Santorsula fernando.santorsula@esamc.

Implementar servidores de Web/FTP e DFS. Disciplina: Serviços de Redes Microsoft Professor: Fernando Santorsula fernando.santorsula@esamc. Implementar servidores de Web/FTP e DFS Disciplina: Serviços de Redes Microsoft Professor: Fernando Santorsula fernando.santorsula@esamc.br Conteúdo programático Introdução ao protocolo HTTP Serviço web

Leia mais

Programação WEB Introdução

Programação WEB Introdução Programação WEB Introdução Rafael Vieira Coelho IFRS Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul Campus Farroupilha rafael.coelho@farroupilha.ifrs.edu.br Roteiro 1) Conceitos

Leia mais

Web Semântica e PLN. Paulo Gomes DEI FCTUC

Web Semântica e PLN. Paulo Gomes DEI FCTUC Web Semântica e PLN Paulo Gomes DEI FCTUC 1 Sumário Motivação da Web Semântica Conceitos base da WS WS vs. PLN Sinergias entre WS e PLN Conclusão 2 Motivação Limitações da Web actualmente: Overflow de

Leia mais

XHTML 1.0 DTDs e Validação

XHTML 1.0 DTDs e Validação XHTML 1.0 DTDs e Validação PRnet/2012 Ferramentas para Web Design 1 HTML 4.0 X XHTML 1.0 Quais são os três principais componentes ou instrumentos mais utilizados na internet? PRnet/2012 Ferramentas para

Leia mais

Dublin Core e MARC 21 : um estudo de correspondência de elementos de metadados

Dublin Core e MARC 21 : um estudo de correspondência de elementos de metadados Dublin Core e MARC 21 : um estudo de correspondência de elementos de metadados Maria das Dores Rosa Alves¹, Marcia Izabel Fugisawa Souza¹ ¹Embrapa Informática Agropecuária Caixa postal 6014 Campinas, SP

Leia mais

Edital EAD UFRGS 17. Cartão UFRGS: 9173. Maria José Bocorny Finatto.Instituto de Letras. Ramal: 6711 mfinatto@terra.com.br

Edital EAD UFRGS 17. Cartão UFRGS: 9173. Maria José Bocorny Finatto.Instituto de Letras. Ramal: 6711 mfinatto@terra.com.br Portal de Serviços - SEAD - UFRGS - Edital EAD UFRGS 17 1º Coordenador Cartão UFRGS: 9173 Nome: Maria José Bocorny Finatto Unidade:.Instituto de Letras Vínculo: Professor Ramal: 6711 E-Mail: mfinatto@terra.com.br

Leia mais

Introdução à Tecnologia Web. Tipos de Sites. Profª MSc. Elizabete Munzlinger www.elizabete.com.br

Introdução à Tecnologia Web. Tipos de Sites. Profª MSc. Elizabete Munzlinger www.elizabete.com.br IntroduçãoàTecnologiaWeb TiposdeSites ProfªMSc.ElizabeteMunzlinger www.elizabete.com.br ProfªMSc.ElizabeteMunzlinger www.elizabete.com.br TiposdeSites Índice 1 Sites... 2 2 Tipos de Sites... 2 a) Site

Leia mais

Excel 2010 Modulo II

Excel 2010 Modulo II Excel 2010 Modulo II Sumário Nomeando intervalos de células... 1 Classificação e filtro de dados... 3 Subtotais... 6 Validação e auditoria de dados... 8 Validação e auditoria de dados... 9 Cenários...

Leia mais

UNIVERSIDADE PAULISTA INSTITUTO DE CIÊNCIAS SOCIAIS E COMUNICAÇÃO CURSOS DE GESTÃO TECNOLÓGICA PIM - III

UNIVERSIDADE PAULISTA INSTITUTO DE CIÊNCIAS SOCIAIS E COMUNICAÇÃO CURSOS DE GESTÃO TECNOLÓGICA PIM - III UNIVERSIDADE PAULISTA INSTITUTO DE CIÊNCIAS SOCIAIS E COMUNICAÇÃO CURSOS DE GESTÃO TECNOLÓGICA PIM - III Projeto Integrado Multidisciplinar Cursos Superiores Tecnológicos G. SISTEMAS DE INFORMAÇÃO Trabalho

Leia mais

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Diretoria de Sistema - DS Superintendência de Arquitetura de Sistemas - SAS Gerência de Arquitetura de Informação - GAAS

Leia mais

Web Semântica. Web Semântica. uma introdução @yaso

Web Semântica. Web Semântica. uma introdução @yaso Web Semântica uma introdução @yaso O que é SEMÂNTICA Semântica é o estudo do signifcado. Incide sobre a relação entre signifcantes, tais como palavras, frases, sinais e símbolos, e o que eles representam,

Leia mais

XML (extensible Markup Language)

XML (extensible Markup Language) Sumário 1. Introdução a Aplicações Não-Convencionais 2. Revisão de Modelagem Conceitual 3. BD Orientado a Objetos (BDOO) 4. BD Objeto-Relacional (BDOR) 5. BD Temporal (BDT) 6. BD Geográfico (BDG) 7. BD

Leia mais

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE RESUMO Fazer um bom levantamento e especificação de requisitos é algo primordial para quem trabalha com desenvolvimento de sistemas. Esse levantamento

Leia mais

Projeto de Arquitetura

Projeto de Arquitetura Projeto de Arquitetura Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 11 Slide 1 Objetivos Apresentar projeto de arquitetura e discutir sua importância Explicar as decisões de projeto

Leia mais

Anexo VI Edital nº 03361/2008. Projeto de Integração das informações de Identificação Civil. 1. Definições de interoperabilidade adotadas pela SENASP

Anexo VI Edital nº 03361/2008. Projeto de Integração das informações de Identificação Civil. 1. Definições de interoperabilidade adotadas pela SENASP Anexo VI Edital nº 03361/2008 Projeto de Integração das informações de Identificação Civil 1. Definições de interoperabilidade adotadas pela SENASP A Senasp procura adotar os padrões de interoperabilidade

Leia mais

M a n u a l d o R e c u r s o Q m o n i t o r

M a n u a l d o R e c u r s o Q m o n i t o r M a n u a l d o R e c u r s o Q m o n i t o r i t i l advanced Todos os direitos reservados à Constat. Uso autorizado mediante licenciamento Qualitor Porto Alegre RS Av. Ceará, 1652 São João 90240-512

Leia mais

Afinal o que é HTML?

Afinal o que é HTML? Aluno : Jakson Nunes Tavares Gestão e tecnologia da informacão Afinal o que é HTML? HTML é a sigla de HyperText Markup Language, expressão inglesa que significa "Linguagem de Marcação de Hipertexto". Consiste

Leia mais