Gestão de Conteúdo web através de ontologias: conceitos e aplicações Fernando Silva Parreiras
Contextualização O que? Uso de taxonomias na gestão de conteúdo de portais corporativos. Quem? Gerentes, consultores e analistas; Envolvidos em projetos de implantação de sistemas de gestão de conteúdo.
Contextualização Por que? Os instrumentos de recuperação atuais são incompletos; O uso de ontologias pode separar o conhecimento da implementação; Tratando o conhecimento separadamente, pode-se utilizar geradores automáticos de portais. Para que? Ferramentas de recuperação mais eficientes; Recuperação semântica da informação; Prototipação de portais; Como?
Agenda Problema Conceitos Situação Atual Propostas Aplicações
Problema #1 As tecnologias empregadas atualmente na implementação de portais corporativos ainda não exploram todos os aspectos da busca efetiva de informações pelo usuário. Como usufruir do progresso feito na gestão semântica de informações em sistemas de informação na web?
Problema #2 Os portais são criados baseados em modelagens realizadas junto ao código da aplicação ou ao banco de dados. Qualquer alteração no domínio de conhecimento implica em uma alteração na aplicação em si. Como separar a representação do domínio de conhecimento da implementação do portal?
Conceitos Ontologia Taxonomia Modelos Gestão de conteúdo Portais
Ontologia Especificações das relações entre as entidades mais um conjunto de regras automáticas de inferência e ações associadas. É uma descrição formal dos conceitos e relacionamentos que existem dentro de um domínio. Isso significa que uma ontologia se relaciona com um vocabulário específico, uma linguagem específica e a conceitualização de determinado domínio. NETIC, 2003
Taxonomia É um vocabulário controlado de uma determinada área do conhecimento, e acima de tudo um instrumento ou elemento de estrutura que permite alocar, recuperar e comunicar informações dentro de um sistema, de maneira lógica. Terra, 2004
Modelos uma representação de um recorte da realidade, que, de acordo com a sua função utilitária e por meio do seu modo de expressão, sua estrutura e suas igualdades e desigualdades em relação ao seu original, tenta comunicar algo sobre o real Sayão, 2003
Gestão de conteúdo Processo de apoio à todo o ciclo de vida de um documento. criar conteúdo; criar diferentes versões de documentos (com possibilidade de recuperar versões antigas); definir um fluxo de trabalho através do qual os documentos circulam (automaticamente, se tivermos o suporte de uma aplicação tecnológica); Pesquisar conteúdo / documentos criados.
Portais Espaço centralizado que serve de rota de acesso para as aplicações, serviços e conteúdo das organizações.
Situação Atual Taxonomias x processos Recuperação da Informação em portais Projeto de portais
Taxonomias X Processos Orientada ao conceito Modelagem de classes Representação: grafos Implementada por meio de ferramentas de criação de ontologias ou taxonomias. Orientada ao tempo Modelagem de processos de negócio Representação: fluxograma Implementada por meio de ferramentas de workflow e integração de sistemas
Recuperação da Informação em portais Representação em hierarquia de pastas; Representação em formato de fluxo de trabalho; Busca textual; Associações de metadados; Uso de referências; Uso de vocabulário controlado;
Projeto de portais As aplicações são, atualmente, modeladas junto das classes e esquemas da aplicação; O conhecimento fica junto ao código fonte do portal; Não existe uma separação formal entre o domínio de conhecimento do portal e o próprio portal.
Propostas Navegação por meio de taxonomias Uso de taxonomias para geração automática de portais
Navegação por meio de taxonomias Criação Representação Navegação Associação vertical Associação horizontal Recuperação
Criação sempre que possível, deve ser utilizada uma ontologia já existente para um determinado domínio. Existem, na web, repositórios especializados em armazenar ontologias definidas por um grupo formado por especialistas no assunto. Uma vez que já exista uma ontologia semelhante, o trabalho a ser realizado é estender esta ontologia, acrescentando os conceitos e relações pertinentes ao domínio em questão
Representação Existem, hoje, duas formas de representar as ontologias por meio de linguagem de marcas. RDF OWL
Navegação A interface do sistema utilizada deve adotar recursos de navegação em grafos, onde, facilmente, o usuário tem condições de navegar para qualquer nodo, e situar-se facilmente sobre sua posição na teia
Associação vertical Utilizado para associar a instância do conteúdo (ou documento) ao nodo equivalente na taxonomia. Exemplo: Um documento de especificação de requisitos de software pode ser associado à um nodo da taxonomia denominado ERSw
Associação horizontal Consiste em associar a instância do conteúdo (ou documento) à outra instância, de modo a criar um relacionamento entre as instâncias. Exemplo: O documento de especificação de requisitos de software associado anteriormente pode ser associado à um outro documento de proposta de especificação de software.
Uso de taxonomias para geração automática de portais Representação do conhecimento do portal em um editor de ontologias. (rdf, owl) Transformação do código gerado pelo editor de ontologias em código em linguagem de programação (python, java) Utilização de uma ferramenta geradora para conversão do código fonte em código de aplicação Soluções livres: Servidor de aplicação: Zope Servidor CMS: Plone Gerador de CMS: CMSGen
Aplicações Portal para gestão de projetos (caso NETIC) Portal para gestão do processo de desenvolvimento de software (Caso paradigma)
Portal para gestão de projetos (caso NETIC) Problema: Consultores trabalhando de forma remota; ausência de um repositório unificado; falta de padrão na comunicação Solução Criação e implementação de associação de conteúdo à taxonomias, utilizando o TaXor. Impactos Linguagem unificada para comunicação entre as equipes. Desafios Necessidade de formalização dos processos; Dificuldades na criação da taxonomia.
Portal para desenvolvimento de software (Paradigma) Problema Ausência de um repositório. Necessidade de criação rápida de um protótipo. Solução Geração automática de um protótipo para gerir o conteúdo, utilizando o CMSGen. Impactos Utilização de um repositório para armazenar os artefatos de um processo de desenvolvimento de software. Desafios Adaptação dos pontos de integração da ferramenta; construção de trechos não gerados; adaptação de trechos gerados; criação da taxonomia.
Resumo As taxonomias podem contribuir de duas formas distintas para a gestão de conteúdo: 1. Na organização da informação, durante a navegação. Ex. TaXor. 2. Servindo como base para a geração automática de portais, representando o domínio do conhecimento em questão. Ex. CMSGen. Muitos são os desafios a serem enfrentados na tentativa de implementação de quaisquer destas abordagens. A constituição de uma equipe experiente é fator determinante de sucesso.
Perguntas
Obrigado www.fernando.parreiras.nom.br