XIII Encontro Nacional de Pesquisa em Ciência da Informação - XIII ENANCIB 2012. GT 2 Organização e Representação do Conhecimento



Documentos relacionados
Modelagem de relações conceituais para a área nuclear

Universidade Estadual Paulista Faculdade de Filosofia e Ciências Campus de Marília Grupo de Estudos sobre Organização e Representação do Conhecimento

OBSERVATÓRIO DE GESTÃO DA INFORMAÇÃO. Palavras-chave: Gestão da Informação. Gestão do conhecimento. OGI. Google alertas. Biblioteconomia.

PRÓ-MATATEMÁTICA NA FORMAÇÃO DE PROFESSORES

05/05/2015. Recuperação de Informação

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

1 Introdução A motivação e o problema da pesquisa

Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática

SISTEMA DE GERENCIAMENTO DE PROJETOS - REDMINE MANUAL DE USO

Um espaço colaborativo de formação continuada de professores de Matemática: Reflexões acerca de atividades com o GeoGebra

Governança de TI. ITIL v.2&3. parte 1

O propósito deste trabalho foi o de apresentar os programas de. catalogação cooperativa, centralizada e catalogação-na-publicação, os quais,

Estratégia de TI. Posicionamento Estratégico da TI: como atingir o alinhamento com o negócio. Conhecimento em Tecnologia da Informação

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

Prof. Dr. Guanis de Barros Vilela Junior

Extensão do Sistema de Metadados para Recursos Naturais

Marketing Turístico e Hoteleiro

ENGENHARIA DE SOFTWARE I

Sistemas de Informação I

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

PESQUISA SOBRE O PERFIL DE ALUNOS NA UTILIZAÇÃO DE UM SITE DOCENTE DO ENSINO SUPERIOR

A construção de um manual sobre a utilização dos modelos também poderá alavancar o uso das representações. Este conteria a explicação detalhada da

PUBLICAÇÃO CIENTÍFICA RESULTANTE DAS DISSERTAÇÕES E TESES EM EDUCAÇÃO FÍSICA NO BRASIL

O olhar do professor das séries iniciais sobre o trabalho com situações problemas em sala de aula

MAPAS CONCEITUAIS NAS PESQUISAS DO NÚCLEO DE ETNOGRAFIA EM EDUCAÇÃO

Núcleo de Informática Aplicada à Educação Universidade Estadual de Campinas

Uma Ontologia para Gestão de Segurança da Informação

Ontologias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília

Marco Antônio Moreira Instituto de Física UFRGS Porto Alegre RS Paulo Rosa Escola Estadual de Ensino Médio do Bairro Rio Branco Canoas RS

Importância da normalização para as Micro e Pequenas Empresas 1. Normas só são importantes para as grandes empresas...

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

CENTRO UNIVERSITÁRIO ESTÁCIO RADIAL DE SÃO PAULO SÍNTESE DO PROJETO PEDAGÓGICO DE CURSO 1

Projeto de Graduação 1 Prof. Fabiano Dorça. Metodologia Científica

Grupo de Estudos sobre Organização e Representação do Conhecimento. UNESP de Marília.

Referências internas são os artefatos usados para ajudar na elaboração do PT tais como:

SISTEMAS DE INFORMAÇÃO PARA GESTÃO

SUGESTÕES PARA ARTICULAÇÃO ENTRE O MESTRADO EM DIREITO E A GRADUAÇÃO

Ajuda ao SciEn-Produção O Artigo Científico da Pesquisa Experimental

Módulo 15 Resumo. Módulo I Cultura da Informação

A IMPORTÂNCIA DAS DISCIPLINAS DE MATEMÁTICA E FÍSICA NO ENEM: PERCEPÇÃO DOS ALUNOS DO CURSO PRÉ- UNIVERSITÁRIO DA UFPB LITORAL NORTE

Recomendada. A coleção apresenta eficiência e adequação. Ciências adequados a cada faixa etária, além de

Gerenciamento de Riscos do Projeto Eventos Adversos

REVEL NA ESCOLA: LINGUÍSTICA APLICADA A CONTEXTOS EMPRESARIAIS

ARTIGO CIENTÍFICO. O artigo científico pode ser entendido como um trabalho completo em si mesmo, mas possui dimensão reduzida.

Diretrizes visando a melhoria de projetos e soluções construtivas na expansão de habitações de interesse social 1

A Linguagem de Modelagem Unificada (UML)

Reflexões sobre as dificuldades na aprendizagem de Cálculo Diferencial e Integral

CES-32 e CE-230 Qualidade, Confiabilidade e Segurança de Software. Conceitos de Qualidade. CURSO DE GRADUAÇÃO e DE PÓS-GRADUAÇÃO DO ITA

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

AULA 04 - TABELA DE TEMPORALIDADE

Projeto de Sistemas I

Desenvolvimento de um CMS 1 para a criação e publicação de web sites acessíveis por deficientes visuais.

11 de maio de Análise do uso dos Resultados _ Proposta Técnica

Rafael Vargas Presidente da SBEP.RO Gestor de Projetos Sociais do Instituto Ágora Secretário do Terceiro Setor da UGT.RO

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

3.1 Definições Uma classe é a descrição de um tipo de objeto.

CAPÍTULO 5 CONCLUSÕES, RECOMENDAÇÕES E LIMITAÇÕES. 1. Conclusões e Recomendações

OS CONHECIMENTOS DE ACADÊMICOS DE EDUCAÇÃO FÍSICA E SUA IMPLICAÇÃO PARA A PRÁTICA DOCENTE

PIBID: DESCOBRINDO METODOLOGIAS DE ENSINO E RECURSOS DIDÁTICOS QUE PODEM FACILITAR O ENSINO DA MATEMÁTICA

WALDILÉIA DO SOCORRO CARDOSO PEREIRA

FACULDADE DE ADMINISTRAÇÃO E NEGÓCIOS - FAN CEUNSP SALTO /SP CURSO DE TECNOLOGIA EM MARKETING TRABALHO INTERDISCIPLINAR

GARANTIA DA QUALIDADE DE SOFTWARE

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO)

Oficina Cebes POLÍTICA, PARTICIPAÇÃO E CONTROLE SOCIAL

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Uso de taxonomias na gestão de conteúdo de portais corporativos.

Pedagogia Estácio FAMAP

Guia de Especificação de Caso de Uso Metodologia CELEPAR

NOME COMPLETO DA SUA INSTITUIÇÃO. Nome completo do integrante A Nome completo do integrante B Nome completo do integrante C

ESCOLA SUPERIOR ABERTA DO BRASIL - ESAB CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM ENGENHARIA DE SISTEMAS JACK SUSLIK POGORELSKY JUNIOR

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

Persistência e Banco de Dados em Jogos Digitais

Gerenciamento de Projetos no Marketing Desenvolvimento de Novos Produtos

GESTÃO DA DIRETORIA DE MARKETING ATRAVÉS DE UMA DIVISÃO ESTRATÉGICA: OTIMIZANDO PROCESSOS E CAPACITANDO PESSOAS PRÁTICA INTERNA. Temática: Marketing

A ORGANIZAÇÃO DA RELAÇÃO ENSINO E SERVIÇO EM UMA POLICLÍNICA DE FORTALEZA

SISTEMA DE SERVIÇOS DE INFRA-ESTRUTURA DA UFRGS

UM PRODUTO EDUCATIVO PARA FAZER EDUCAÇÃO AMBIENTAL

ADM041 / EPR806 Sistemas de Informação

Resumo. Leonel Fonseca Ivo. 17 de novembro de 2009

Orientação a Objetos

Sugestão de Roteiro para Elaboração de Monografia de TCC

3 Metodologia 3.1. Tipo de pesquisa

Uma Ontologia Genérica para a Análise de Domínio e Usuário na Engenharia de Domínio Multiagente

Plano de Marketing. Introdução (breve) ao Marketing Análise de Mercado Estratégias de Marketing

ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA

O DESAFIO DA EDUCAÇÃO AMBIENTAL EM PATOS, PARAÍBA: A PROFICIÊNCIA DOS ALUNOS DE ESCOLAS PÚBLICAS DE PATOS

Aprendizagem da Análise Combinatória nas séries iniciais do Ensino Fundamental

REDE SOCIAL DE MAPEAMENTO COLABORATIVO DE PROBLEMAS AMBIENTAIS E URBANOS NAS CIDADES Resultados preliminares

2. TRABALHOS ACADÊMICOS, DISSERTAÇÕES E TESES

XXX Congresso da SBC II Workshop de Computação Aplicada em Governo Eletrônico

Roteiro SENAC. Análise de Riscos. Planejamento do Gerenciamento de Riscos. Planejamento do Gerenciamento de Riscos

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

cada fator e seus componentes.

Aula 2 Revisão 1. Ciclo de Vida. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW

Duração: 8 meses Carga Horária: 360 horas. Os cursos de Pós-Graduação estão estruturados de acordo com as exigências da Resolução CNE/CES nº 01/2007.

Transcrição:

XIII Encontro Nacional de Pesquisa em Ciência da Informação - XIII ENANCIB 2012 GT 2 Organização e Representação do Conhecimento MODELO TRIÁDICO DE RELAÇÕES: UM PROTÓTIPO DE MODELAGEM CONCEITUAL PARA A ÁREA NUCLEAR Comunicação Oral Luana Farias Sales - CNEN-IEN Luís Fernando Sayão - CNEN-CIN luanafsales@gmail.com Resumo: Este trabalho se coloca diante da necessidade de modelar as relações conceituais da área Nuclear. Esta área, apesar de toda sua tradição em tratamento e disseminação da informação, manteve-se estática nas últimas décadas no que diz respeito à elaboração de instrumentos de padronização terminológica e, consequentemente, também não evoluiu no que diz respeito à ampliação de arcabouço teórico-metodológico para modelagem conceitual. Devido a isto, o presente trabalho vem apresentar, a partir de uma abordagem teórica da Ciência da Informação e da Ciência da Computação, um novo caminho para modelagem, a partir da sistematização das relações conceituais existentes em um dado domínio. Através de um método relacional-categorial, essa modelagem visa combinar relações categoriais e relações formais chegando ao modelo triádico de relações. PALAVRAS-CHAVE: MODELAGEM CONCEITUAL; RELAÇÕES CONCEITUAIS; MODELO TRIÁDICO DE RELAÇÕES; ENERGIA NUCLEAR Abstract: This work is justified against the need to model the conceptual relationships from the nuclear area. This area, despite all its tradition in processing and dissemination of information, has remained static in recent decades with regard to developing of standardization terminology tools and, therefore, has not evolved in relation to the expansion of theoretical and methodological foundations for conceptual modeling. Because of this, the paper presents, from a theoretical approach of the Information Science, a new way for modeling, based on the systematization of conceptual relationships that exist in a given domain. The relational-category method aims to combine relationships categories and formal relationships to coming toward to the model of triadic relations. 1

KEY-WORDS: CONCEPTUAL MODELING; CONCEPTUAL RELATIONSHIPS; MODEL OF TRIADIC RELATIONS; NUCLEAR ENERGY 1 Considerações Iniciais O presente trabalho é fruto de estudos que caminham em direção à busca dos fundamentos de modelagem. O assunto em questão é abordado aqui como um ponto de interseção entre Ciência da Informação e Ciência da Computação, mas possivelmente poderá também despertar o interesse de outras áreas, já que a elaboração de modelos pode ser útil a diversos propósitos. A necessidade de elaborar modelos deriva inicialmente da dificuldade do homem entender a complexidade da realidade do universo que o envolve. Assim, em uma primeira instância, o ser humano elabora modelos para: compreender o mundo ou simplesmente uma questão no mundo; estabelecer padrões de comunicação entre ele e outros seres e representar de forma simplificada um objeto ou uma situação no mundo. Neste sentido, um modelo pode ser compreendido como uma abstração ou uma simplificação da realidade (CAMPOS, 2012). Esta abstração ou simplificação é feita através de representações de fatias da realidade com a finalidade de descrever formalmente alguns aspectos físicos e sociais do mundo que nos rodeia para fins de compreensão e comunicação. (MYLOUPOULOS, 1992, tradução nossa) No domínio da Ciência da Informação, um modelo é definido como uma criação destinada a representar uma realidade e alguns de seus aspectos, a fim de tornálos descritíveis e algumas vezes observáveis (SAYÃO, 2001, p.83). O autor também afirma que estes modelos podem ser construídos por meio de formalismos matemáticos, fenomenológicos ou conceituais e permitem testar hipóteses, tirar conclusões, caminhar no sentido da generalização e da particularização, através de processos de indução e têm sempre vida provisória. No domínio da Ciência da Computação, a modelagem conceitual é um estágio anterior ao desenvolvimento do sistema. Nesta área, a elaboração de modelos conceituais fornece subsídios para construção de sistemas eficazes aos seus propósitos. Já na Ciência da Informação, os modelos são construídos para servirem de instrumentos padronizadores de informações, tornando a recuperação e comunicação mais precisas. 2

De acordo com Haggett e Chorley (apud Sayão, 2001) um modelo apresenta supostamente características ou relações de forma generalizada. Os modelos conceituais e/ou semânticos, que são os que interessam ao escopo deste trabalho, são construídos a partir de abstrações que especificam relacionamentos entre conceitos trabalhando semelhanças, diferenças e outras associações de significado. Burt e Kinnucan(1990) apresentam quatro tipos de abstrações como as mais usadas nos modelos semânticos, a saber: generalização, agregação, classificação e associação. O modelo semântico de generalização é elaborado através do agrupamento hierárquico de entidades, no qual os objetos de mais baixo nível são ligados como subtipos dos objetos de mais alto nível. Na Ciência da Informação, esse tipo de agrupamento é especificado através das relações de gênero-espécie, que também são chamadas de lógicas ou hierárquicas. Na Ciência da Computação, esse tipo de agregação é conhecido como relação IS-A, ou É_UM. O modelo semântico de agregação é criado através do agrupamento de partes de um objeto que revela a composição do mesmo, assim cada entidade contribui para a visualização específica do conceito maior ao qual está ligado. Na Ciência da Informação, esse tipo de agrupamento é especificado através das relações partitivas, que ora são consideradas lógicas e/ou hierárquicas, ora são consideradas ontológicas e nãohierárquicas. Na Ciência da Computação, esta relação é conhecida como PART_OF ou PARTE_DE, mas também vem sendo chamada - por influência de outras áreas, como a Linguistica, a Filosofia e a Psicologia - de relações meronímicas. O modelo semântico de classificação é construído através do agrupamento de exemplos particulares de um conceito mais geral, ou em outras palavras, através da categorização das entidades. Na Ciência da Informação, este modelo é de grande importância e possui um consistente arcabouço-teórico para a sua elaboração. A Teoria da Classificação Facetada de Ranganathan (1967), por exemplo, sugere 5(cinco) facetas para a categorização de assuntos conhecidas como PMEST (Personalidade, Matéria, Energia, Espaço e Tempo). Na Ciência da Computação, esse modelo começa a aparecer com mais frequência a partir do estudo das Taxonomias e das Ontologias. A UFO (Unified Fundamental Ontology)- que é uma Ontologia de topo, mas também uma 3

teoria que vem orientando aspectos de modelagem conceitual - utiliza outros tipos de categorias, como por exemplo, Kind, subkind, role, phase, etc.(guizzardi, 2005) O modelo semântico de associação é construído através do agrupamento de objetos segundo quaisquer outros critérios que não sejam hierarquização, sempre visando uma determinada funcionalidade. Este modelo pode ser considerado o mais complexo e mais problemático, pois existe uma infinidade de possibilidades de relacionar conceitos no mundo. Na Ciência da Informação, essas relações são chamadas de ônticas e se referem à relação do objeto com o mundo. Elas também aparecem na Ciência da Informação chamadas de relações associativas, principalmente no ambiente da elaboração de tesauros, e, apesar da literatura da área apresentar uma variedade de possibilidades de um termo se relacionar associativamente, nestes instrumentos elas aparecem sem princípios estabelecidos, sendo classificadas de uma só forma, através da representação TA (termo associado) ou TR (termo relacionado). Mas é na Ciência da Computação que essas relações são mais requeridas, principalmente no âmbito das Ontologias e da Web Semântica, onde elas são fundamentais para permitir inferências e respostas mais precisas às questões de busca. Este trabalho insere-se no escopo da modelagem semântica de associação, buscando apresentar e aplicar um modelo - o Modelo Triádico de Relações - utilizando um novo método para modelagem das relações associativas. 2 A importância das relações conceituais e o modelo triádico de relações A importância do estudo das relações conceituais vem sendo evidenciada em diversas esferas. No ambiente dos instrumentos de padronização terminológica, as relações conceituais são úteis para a determinação de sinônimos, atualização do sistema, inclusão de termos em uma só categoria e mapeamento de áreas de assunto (MOTTA, 1987, p. 39). No contexto das Ontologias, sua importância é revelada nas etapas de conversão da linguagem natural para a linguagem artificial, garantindo consistência na estrutura terminológica e no estabelecimento de inferências, garantindo a adoção de algoritmos consistentes para a interpretação pela máquina. (KIETZ; MAEDACHE; VOLZ, 2000; USCHOLD; KING, 1995; FERNANDEZ; GOMEZ- PÉREZ; JURISTO, 1997; GUARINO, 1995). No âmbito da web semântica, de acordo 4

com Sheth, Arpinar e Kashyap (2003), as relações conceituais associam os significados às palavras, aos termos e às entidades, são a chave para novas percepções e idéias e propiciam a descoberta de conhecimento através da descoberta de novos relacionamentos. Na esfera da modelagem conceitual, identificar os tipos de relações presentes em um domínio pode ser considerada uma etapa da modelagem conceitual deste domínio, pois são as relações que ligam os conceitos a outros conceitos, permitindo evidenciar a abstração de uma dada realidade. Como já mencionado, as relações podem ser de vários tipos, mas este trabalho pretende discutir especificamente as relações associativas, pois estas, juntamente com as partitivas (referentes ao modelo de agregação) são as que apresentam maiores problemas. Diversos esforços já foram feitos no sentido de sistematizar os tipos de relações associativas existentes (NEELAMEGHAN, 1975; RAJAN,1975; MOTTA, 1987; SALES, 2006; entre outros), no entanto, percebe-se claramente que o problema vai além de fazer essas relações convergirem em uma listagem única. A grande questão que envolve as relações associativas é que elas se manifestam diferentemente em cada área, variando de acordo com o objetivo e com a questão que se visa modelar. Devido a isto, acredita-se que a solução para o problema, mais uma vez, esteja na modelagem conceitual do domínio a ser representado. É nesta direção que este trabalho se encaminha, tentando estabelecer um método para a identificação de relações conceituais associativas com base em modelagem conceitual feita a partir da base teórica da Ciência da Informação para construção de linguagens ou modelos (CAMPOS, 2001b) A escolha da área de Ciência da Informação se justifica pelo fato de esta área já ter abordagens teórico-metodológicas consolidadas para construção de instrumentos de representação da informação e do conhecimento. Conforme abordagem de Campos(2001a), a união da tríade teórica formada pela Teoria da Classificação Facetada(RANGANATHAN, 1967), Teoria Geral da Terminologia (WÜSTER, 1981) e Teoria do Conceito (DAHLBERG, 1978) vem atendendo não apenas a elaboração de linguagens, mas também toda e qualquer necessidade de classificação, sistematização e mapeamento de domínio que aparece na área. 5

A Teoria da Classificação facetada contribui para esses estudos, entre outras coisas, com princípios normativos para classificação, através de regras e cânones para estabelecimento de hierarquias consistentes. A Teoria Geral da Terminologia contribui no que diz respeito ao estudo das relações, pois as coloca como centro de suas reflexões. Nesta teoria, os termos se definem uns em relação aos outros, formando assim um sistema de conceitos. A Teoria do Conceito contribui explicitando uma forma de se compreender o conceito. Enquanto para a Teoria Geral da Terminologia, o conceito é definido como uma unidade de pensamento, sendo bastante vago e subjetivo - posto que o que está no pensamento de alguém não pode ser lido ou compreendido por outro - para a Teoria do Conceito, o conceito é uma unidade do conhecimento formada por referente, características e um termo que o designa. A combinação dessas três teorias vem servindo como método de estudo e de compreensão para diversos trabalhos no âmbito da construção de instrumentos de representação da informação e do conhecimento, bem como para a modelagem conceitual. (CAMPOS, 2001b; SALES, 2006; NOVO, 2007). O objetivo da modelagem realizada é chegar a um conjunto mínimo de relações conceituais para representação de um dado domínio. Esse conjunto deve apresentar as relações de acordo com um modelo de relações conceituais que contemple as relações conceituais conforme a Ciência da Informação e a Ciência da Computação, o qual foi chamado em trabalho anterior de Modelo Triádico de Relações (SALES, 2007). Este Modelo foi pensado para uso em Ontologias e sua criação se justifica pela necessidade desse tipo de instrumento necessitar dos dois modelos de relações encontrados na literatura: o modelo da Ciência da Informação, em que as relações associativas se manifestam através de pares de categorias (ex: coisa-processo) e o modelo da Ciência da Computação, em que as relações explicitam como uma categoria de elemento se relaciona com a outra (ex: has_material). Desta forma, o modelo triádico de relações pode ser definido como modelo mínimo composto por uma tríade formada por um par de relações categoriais e uma relação formal (relator) cujo objetivo é explicitar a forma como os conceitos se relacionam, auxiliando na elaboração de assertivas e de definições lógico-formais. Temse então: o modelo: RC1-RF-RC2, onde RC1 e RC2 são as relações categoriais e RF é a 6

relação formal que deve relacionar formalmente o par de relações categoriais. Veja quadro 1. Quadro 1 - Modelo triádico de relações CATEGORIA ANTECESSORA RELAÇÃO FORMAL CATEGORIA SUCESSORA RC1 RF RC2 Medida Is a measure of Personalidade Material Is a product of Produto Fonte: elaborado por Sales (2007) Para verificar a adequabilidade do método foi escolhida a área de Energia Nuclear, por ser uma área com terminologia consolidada, rica em produção de conhecimento, mas, que apesar de toda a sua tradição em tratamento e disseminação da informação, manteve-se estática nas últimas décadas no que diz respeito à elaboração de instrumentos de padronização terminológica. Consequentemente, a área também não evoluiu no que diz respeito à ampliação de arcabouço teórico-metodológico para modelagem conceitual, apesar de esta atividade estar sendo considerada importante em muitas das pesquisas desenvolvidas na área. Acreditando na necessidade de um método para modelagem de relações conceituais para a área nuclear, o trabalho foi desenvolvido para aplicação neste domínio. 3 A área Nuclear: o problema da ausência de instrumentos de padronização terminológica Uma análise superficial das primeiras listagens de cabeçalho de assunto - oriundas da Biblioteconomia - até as Ontologias formais - nascidas no seio da Inteligência Artificial e hoje estudadas no contexto da Web Semântica, revela um número de detalhes que justifica a necessidade de manter esses instrumentos atualizados, não apenas no que diz respeito à quantidade de termos, mas também quanto à linha metodológica na qual são construídos. O crescimento do nível de complexidade desses instrumentos pode ser verificado claramente no que tange as relações conceituais. Observa-se então que as primeiras listagens de vocabulários controlados tinham apenas relações de sinonímia. 7

Os cabeçalhos de assunto, além das relações de sinonímia representadas por ver agregavam às suas relações algumas associações representadas por ver também. Os primeiros tesauros, por sua vez, além das relações de sinonímias e associativas, apresentavam em sua estrutura, relações de gênero-espécie. Com o passar do tempo, os tesauros de linha conceitual passaram a explicitar as relações partitivas, além de criarem formas para especificar e padronizar as associativas (coisa-processo, causa-efeito, material produto, etc). Em um contexto mais recente, as ontologias necessitaram de relações ainda mais explícitas, já que estas, ao serem descritas em linguagem lógicoformal, propiciam inferências pela máquina. Por outro lado, as tabelas de classificação também foram evoluindo, saindo da perspectiva de arranjo de documentos nas estantes, via agregação de assuntos em grandes classes decimais, para uma perspectiva mais navegacional, via distribuição de conceitos em categorias e facetas. A área Nuclear tem uma longa tradição na organização, tratamento e na disseminação da informação, que remonta a antigos sistemas de informação, como o construído em torno da base de dados ENDS (European Nuclear Documentation System) ainda na década de 1960. O International Nuclear Information System (INIS), criado sob os auspícios da Agência Internacional de Energia Atômica, órgão das Nações Unidas, deu prosseguimento à política de valorização da informação nuclear, como insumo estratégico para o desenvolvimento das aplicações pacíficas da energia nuclear. O principio operacional do INIS estava baseado no controle da literatura técnico - cientifica da área nuclear dentro das fronteiras de cada país pelos centros nacionais (no Brasil, por exemplo, o CIN/CNEN). O tratamento descentralizado exigiu o desenvolvimento de uma infraestrutura que incluía regras, softwares, padrões, treinamento e fóruns internacionais para o estabelecimento de diretrizes e políticas de coleta e tratamento técnico catalogação e indexação e intercâmbio. No que tangia à elaboração de regras e padrões, o INIS criou um conjunto de ferramentas terminológicas, incluindo classificação e tesauro. O desenvolvimento do tesauro, foi derivado de um modelo gráfico chamado INIS Terminology Charts, que exibia representações gráficas dos conceitos envolvidos e as suas relações, incluindo a intensidade de cada relação e o seu tipo. (INIS, 1970). 8

Completando esse arcabouço, foi desenvolvida uma classificação bastante aprofundada, que, no entanto, sofreu ao longo do tempo profundas mudanças que refletiam a dinâmica vertiginosa de desenvolvimento da área nuclear, somada à sua intensa multidisciplinaridade. As iniciativas de construtos teminológicos do INIS foram muito interessantes e consideradas avançadas para os padrões existentes na época. No entanto, baseado no argumento de que a classificação não era usada na recuperação pelos usuários e que o assinalamento de códigos muitos específicos oneravam a indexação, o INIS optou pela simplificação desses construtos. Apesar dos indícios da necessidade desses instrumentos acompanharem evolutivamente a produção do conhecimento e as mudanças temporais, a área Nuclear, nos últimos anos, se manteve estática em relação à atualização metodológica de seus instrumentos. Enquanto na tabela de classificação houve uma diminuição considerável do número de áreas abrangidas, o tesauro, por ser mantido por um sistema centralizado e muito rígido, vem se mantendo inerte em relação à inserção de novos termos e novas relações. A realidade mostra, no entanto, que apesar da tecnologia existente, os instrumentos de representação e organização do conhecimento continuam cada vez mais necessários e vêm requerendo evolução em grau de complexidade para que possam propiciar buscas mais sofisticadas. A alegação de que, com o advento da tecnologia, o usuário não utiliza mais esses sistemas para recuperar a informação, não pode ser considerada válida já que, atualmente, esses instrumentos possuem também outras utilidades, por exemplo: permitir ao usuário navegar na estrutura taxonômica para localizar o documento, ser suporte para o fornecimento de repostas inteligentes pelos sistemas, ou ainda, servir de mapa conceitual para conhecimento da área. No que envolve a modelagem conceitual, a área Nuclear sempre utilizou, para compreensão de seus fenômenos, modelos e generalizações como uma ponte entre os níveis de observação e o teórico. Assim, os modelos sempre auxiliaram na simplificação, redução, concretização, experimentação, ação, extensão, globalização, explicação e formação da teoria (APOSTEL, 1991). Nas últimas décadas, o uso massivo de técnicas de simulação em computadores para realização de experimentos 9

nesta área, mais uma vez, coloca em voga a necessidade dos modelos. Por fim, a intensa geração de dados, fruto do uso de softwares, leva à necessidade de curadoria desses dados para fins de recuperação e reuso e, neste caso, são os modelos que dão estrutura e significado aos dados. Ainda em relação à modelagem conceitual é importante lembrar que elas se caracterizam por conterem em sua estrutura conceitos e relações entre esses conceitos. A modelagem pode ser vista como um processo produtor de mecanismos de representação em que seus elementos estão relacionados uns com os outros. Desta forma, não se pode falar em modelagem, sem falar em relações e, sendo assim, justificase a importância da pesquisa sobre relações conceituais para a área Nuclear. 4 A modelagem da área Nuclear e o modelo triádico de relações Em um primeiro trabalho, foi realizada uma tentativa de mapear todas as possibilidades de relações associativas, com o intuito de obter-se um conjunto mínimo aplicável em todas as áreas (SALES, 2006). No entanto, devido à complexidade do mundo real e à característica cada vez mais interdisciplinar das ciências, verificou-se a impossibilidade de uma listagem que pudesse ser generalizável a qualquer área, já que cada área se comporta de uma forma e, principalmente, porque cada sistema de organização e representação do conhecimento é construído para um determinado propósito, para determinado público e dentro de um determinado contexto. Para solucionar o problema da impossibilidade de uma lista única de relações associativas existentes no mundo, este trabalho foi proposto no sentido de apresentar um método para identificação das relações associativas em qualquer domínio. Semelhante a este trabalho, outro foi proposto anteriormente e apresentado no Primeiro Seminário de Ontologias no Brasil, cujo objetivo era evidenciar um novo modelo de relações que reuniria as relações conforme apareciam na Ciência da Informação (duplas de categorias, ex: coisa-material) e também como apareciam na Ciência da Computação (formais, ex: has_material). (SALES, 2008). Este modelo foi chamado de Modelo triádico de relações, pois sua estrutura reúne as duplas de categorias de relações conforme a Ciência da Informação e, pelo menos, um 10

relator/relação formal, conforme a Ciência da Computação. Assim, o modelo é composto da seguinte forma: Relação categorial 1 relação formal Relação categorial2 = (rc1-rf- rc2) Para se chegar ao modelo triádico de relações foi utilizado no processo de modelagem um método que reuniu aspectos classificatórios, lógicos, conceituais e matemáticos. Este método está sendo chamado à priori de Método relacionalcategorial, pois visa estabelecer relações a partir da combinação das categorias existentes no domínio mapeado. O método abrangeu as seguintes etapas: 1) Levantamento das definições; 2) Categorização dos termos; 3) Análise combinatória das categorias; 4) Retirada de assertivas das definições no modelo rc1-rf-rc2; 5) Categorização das assertivas e identificação das relações formais; 6)Sistematização das possibilidades de relações formais possíveis para cada par de relações categoriais. O trabalho partiria de uma realidade existente. A ideia inicial era utilizar como corpus terminológico os descritores utilizados para indexar a produção acadêmica dos alunos do Programa de Pós-Graduação do Instituto de Engenharia Nuclear (PPGIEN). No entanto, a amostragem era grande, complexa e representava um escopo muito específico da área nuclear. Muito dos descritores ainda não eram cunhados em glossários, o que dificultaria o levantamento das definições. Por estes motivos, o corpus utilizado foi retirado do Glossário Nuclear da Comissão Nacional de Energia Nuclear (CNEN). A escolha desse glossário facilitou a realização da primeira etapa do trabalho, isto é, o levantamento das definições dos termos, que, por estarem bem construídas, evitou o trabalho de reconstrução das mesmas. O glossário Nuclear contém um total de 107 termos. As definições bem construídas auxiliaram na categorização dos termos e, consequentemente, no estabelecimento das relações entre os termos. Como pode ser observado no exemplo a seguir, nos destaques (sublinhado) feitos nas definições: Acelerador - Aparelho para aumentar a velocidade e a energia de partículas elementares carregadas (por exemplo, elétrons e prótons), utilizando-se campos elétricos e/ou magnéticos. Exemplos: ciclotrons, aceleradores lineares, síncrotrons e geradores. (CNEN, 2011, p.1 grifo nosso) 11

Nesta definição, observa-se que a primeira palavra aparelho revela a faceta a qual o termo pertence, isto é, equipamento. Além disso, também pode se identificar uma relação formal, expressa através do verbo aumentar que revela a função do equipamento no domínio nuclear. Na segunda etapa do método - baseada na teoria da classificação facetada de Ranganathan que sugere 5(cinco) categorias fundamentais 1 representadas pela sigla PMEST, que significam: Personalidade, Matéria, Energia, Espaço e Tempo 2 - os termos foram separados em categorias próprias para a área em análise. Chegou-se então a 7 (sete) categorias: ENTIDADE, EQUIPAMENTO, PROPRIEDADE, MATÉRIA, PROCESSO, ESPAÇO, TEMPO. Assim considerou-se na categoria Entidade todos os objetos, indivíduos, agentes, produtos. Na categoria Equipamento considerou-se os instrumentos, as ferramentas, as máquinas ou outros artefatos, aparelhos ou utensílios que servem para executar um processo e/ou gerar um produto. Na categoria Propriedade inclui-se os termos referentes às características, atributos, medidas, dimensões e outras qualidades, dos objetos, das entidades, dos processos, do tempo, do espaço etc. Na categoria Matéria agrupou-se os conceitos referentes aos materiais constituintes e substanciais dos conceitos das outras categorias. Na categoria Processo incluiu-se ações, operações e fenômenos em geral. Na categoria Espaço agrupou-se os conceitos referentes às áreas, locais ou regiões. Na categoria Tempo incluiu-se os conceitos referentes ao tempo. Veja o quadro 2. Quadro 2 - Exemplo de categorização dos conceitos constantes nos glossários 1 Ranganathan define "categorias fundamentais" como categorias mais genéricas possíveis e passíveis de se manifestarem de diversas formas, capazes de hospedar todos os objetos da natureza até então conhecidos pelo Homem, e de classificá-los de acordo com sua natureza conceitual, cada um numa e somente numa categoria. 2 Para Ranganathan, o PMEST pode ser explicado da seguinte forma: Na categoria Tempo estão as ideias isoladas de tempo, na categoria Espaço estão as ideias referentes ao local de pertencimento de um determinado objeto, seja ele indivíduo, coisa, fenômeno, entre outras entidades. Na categoria Energia estão as ideias de processo, ação ou fenômeno. Na categoria Matéria - suas manifestações são de duas espécies - Material e Propriedade, que são partes intrínsecas de um objeto ou processo. Na categoria Personalidade, Ranganathan considera através de um método residual, tudo aquilo que não cabe nas outras categorias. 12

ENTIDADE EQUIPAMENTO PROPRIEDADE MATÉRIA PROCESSO ESPAÇO TEMPO Átomo Acelerador Atividade Elemento Radioterapia Área Meia combustível control vida ada Fonte: Elaborado pelo autor Interessante foi observar que as categorias propriedade e matéria podiam perfeitamente ser consideradas como partes e terem seus conceitos inclusos em qualquer outra categoria, já que todos os conceitos possuem partes. No entanto, considerando as partitivas como hierárquicas, a decisão de agrupar propriedade e matéria como parte de cada categoria, poderia gerar cadeias mais complexas e/ou acarretar na perda da riqueza de relações entre categorias diferentes. A terceira etapa constou da análise combinatória das categorias identificadas anteriormente. Como na Ciência da Informação as relações se manifestam entre duplas de categorias, combinar as categorias que mapeiam uma área é uma forma de identificar, no nível mais genérico possível, as possibilidades de relações a serem encontradas em um domínio. A partir da análise combinatória chegou-se a 49 pares de relações categoriais. Para citar algumas: ENTIDADE - ENTIDADE, ENTIDADE PROPRIEDADE, ENTIDADE MATÉRIA, ENTIDADE EQUIPAMENTO, ENTIDADE PROCESSO, ENTIDADE TEMPO, ENTIDADE ESPAÇO, entre outras. Para encontrar as relações formais ou relators, partiu-se então para a quarta etapa do método que constou da retirada de assertivas no modelo relação categorial1- relação formal-relação categorial2 (rc1-rf-rc2), a partir da análise das definições. Com base na Lei de Pareto, que consiste em fenômeno, inicialmente observado no comércio e na indústria, segundo o qual em sistemas de informação 80% da demanda de informação se satisfaz com 20% do conjunto de fontes de informação (TRUESWELL, 1969 apud GUEDES; BORSCHIVER, 2005), foi separada uma amostra aleatória do corpus levantado para análise das definições constando de 20% dos termos, correspondendo a 24 termos, conforme primeira coluna do quadro 3: Quadro 3 - Identificação e categorização das assertivas ASSERTIVA IDENTIFICADA CATEGORIZAÇÃO DAS ASSERTIVAS Área controlada- controla -exposições à radiação Espaço - controla - processo 13

Área controlada previne - disseminação e contaminação radioativa Fonte: Elaborado pelo autor Espaço previne- processo Na quinta etapa foi realizada a categorização das assertivas, reescrevendo-as de acordo com as categorias identificadas na etapa 3. O objetivo foi generalizar, no grau máximo, as relações categoriais, deixando num nível mais específico apenas as relações formais, já que a idéia era identificar todas as possibilidades de relações formais do domínio escolhido. Esta etapa pode ser observada na segunda coluna do quadro 3. A sexta etapa constou da sistematização das possibilidades de relações formais possíveis para cada par de relações categoriais. Assim, chegou-se a 19 pares de categorias, 39 relações formais e 40 tríades, conforme pode ser visto no quadro 4. É importante mencionar que, como o método foi aplicado em uma pequena amostra, possivelmente por isso nem todos os pares de categorias foram manifestados. Quadro 4 - Sistematização das relações RELAÇÃO CATEGORIAL RELAÇÃO MODELO TRIÁDICO FORMAL ENTIDADE - PROCESSO emite entidade - emite- processo ENTIDADE-ENTIDADE parte_de contém transforma entidade - parte_de - entidade entidade-contem-entidade entidade-parte de-entidade entidade transforma - entidade ENTIDADE - PROCESSO recebe sofre entidade - recebe - processo entidade-sofre-processo ENTIDADE - PROPRIEDADE representa entidade representa - propriedade EQUIPAMENTO - ENTIDADE acelera produz aumenta equipamento acelera - entidade equipamento produz entidade equipamento aumenta - entidade EQUIPAMENTO -MATÉRIA contém reutiliza utiliza equipamento contém - matéria equipamento reutiliza - matéria equipamento utiliza matéria EQUIPAMENTO - PROCESSO detecta mede equipamento - detecta processo equipamento mede processo 14

EQUIPAMENTO - introduzido equipamento - introduzido -equipamento EQUIPAMENTO ESPAÇO - PROCESSO previne recebe controla espaço previne - processo espaço recebe-processo espaço - controla - processo ESPAÇO - ENTIDADE sujeita espaço - sujeita - entidade ESPAÇO -MATÉRIA armazena espaço- armazena- matéria MATÉRIA - ESPAÇO Armazenado em matéria armazenado em - espaço MATÉRIA- EQUIPAMENTO introduzida no usada por é removida de matéria - introduzida no- equipamento matéria - usado por - equipamento matéria - é removida de-equipamento MATÉRIA - PROCESSO produz matéria produz - processo PROCESSO -MATÉRIA prepara recupera atravessa processo prepara - matéria processo - recupera - matéria processo - atravessa - matéria PROCESSO - ESPAÇO avalia processo avalia - espaço PROCESSO - PROCESSO depositado utiliza reduz remove resulta é utilizado em processo depositado - processo processo-utiliza-material processo-reduz-processo processo remove - processo processo resulta - processo processo- é utilizado em - processo PROCESSO -ENTIDADE transforma usa processo - transforma - entidade processo-usa-entidade MATÉRIA - ENTIDADE entreposto material-entreposto-entidade Fonte: Elaborado pelo autor 5 Considerações finais Por trabalhar com uma amostragem, este trabalho não esgotou todas as possibilidades de relações do domínio nuclear, mas contribuiu para a construção de um método para encontrar as relações ônticas relevantes para o domínio estudado. Futuramente, pretende-se ampliar a amostragem e mapear todas as possibilidades de relações no domínio nuclear. Este trabalho é parte de um projeto maior que está em andamento. Este projeto envolve curadoria digital de dados de pesquisas nucleares, o que pressupõe a necessidade de modelo conceitual e consequentemente uma modelagem das relações. 15

Entende-se que a modelagem das relações conceituais será de fundamental importância para ligar os dados de pesquisa aos documentos que os geraram. Sendo assim, pretende-se também em momento oportuno realizar um experimento utilizando o modelo de relações identificadas para, em uma publicação ampliada 3, ter os dados científicos ligados às publicações de forma consistente. Uma observação importante ainda, é que das 39 relações formais, 3 eram nitidamente relações partitivas (parte de, contém, armazena). Pode-se deduzir então que o método também pode ser aplicável para identificação e sistematização das relações partitivas de uma área. Em trabalho futuro pretende-se também agregar ao método de modelagem das relações as categorias propostas pela Unified Foundational Ontology (UFO). Esta ontologia se caracteriza por ser um conjunto de teorias axiomáticas que versam sobre as principais categorias de conceitos usados em modelagem conceitual e possivelmente pode ser aplicável também ao método de modelagem de relações. 6 Referências APOSTEL, L. Toward the formal study of models in the non-formalsciences. In: FREUDENTHAL, H. The concept and the role of the model in mathematics and natural and socials sciences. Amsterdam : Dordtreccht,1991. p.1-37. BURT, Patricia; KINNUCAN, Mark. Information models and modeling techniques for information systems. In: Annual Review of Information Science and Technology, p.175-208, 1990. CAMPOS, Maria Luiza de Almeida. Linguagem documentária: teorias que fundamentam sua elaboração. Niterói: EdUFF, 2001a. CAMPOS, Maria Luiza de Almeida. A organização de unidades do conhecimento em hiperdocumentos: um modelo conceitual como um espaço comunicacional para a realização de autoria. Rio de Janeiro: IBICT/UFRJ, 2001b. Tese de Doutorado. CAMPOS, Maria Luiza Machado. Modelagem conceitual: o caminho percorrido. Rio de Janeiro: 2012. Aula ministrada no Programa de Pós-graduação em Informática. CNEN. Glossário de termos usados em Energia Nuclear. 2011 Disponível em: < http://www.cnen.gov.br/noticias/documentos/glossario_tecnico.pdf>. Acesso em 26 jun. 2012. 3 Publicação ampliada pode ser definida como um modelo de informação que apóia a integração dos e- prints ao conjunto de dados a pesquisa, por exemplo, uma tese e os dados que foram gerados a partir dela. 16

DAHLBERG, I. Ontical structures and universal classification. Bangalore: Sarada Ranganathan Endowment, 1978. FERNANDEZ, M., GOMEZ-PÉREZ, A. JURISTO, N. From ontological art towards ontological engineering. AAAI Technical Report, p.33-40, jun.1997. GUEDES, V; BORSCHIVER, S. Bibliometria: uma ferramenta estatística para a gestão da informação e do conhecimento, em sistemas de informação, de comunicação e de avaliação científica e tecnológica, 2005. Disponível em: <http://dici.ibict.br/archive/00000508/01/vanialsguedes.pdf>. Acesso em: 12 jul 2012. GUARINO, N. Formal Ontology, Conceptual Analysis and Knowledge Representation. International Journal of Human and Computer Studies, v. 43, n. 5/6, p. 625-640, 1995. GUIZZARDI, G., Ontological Foundations for Structural Conceptual Models. Netherland: TelematicsInstitute, 2005. Disponível em: <http://doc.utwente.nl/50826/1/thesis_guizzardi.pdf>. Acesso em: 26 jun 2012 INIS: Terminology charts. Viena: IAEA, 1970. KIETZ,J-U; MAEDCHE,A VOLZ,R. A method for Semi-automatic ontology acquisition from a corporate intranet. In: EKAW'00: Workshop on Ontologies and Text, Juan-Les-Pins, 2000, França. Proceedings [ France: s.n], 2000. MOTTA, D. F. Método relacional como nova abordagem para a construção de tesauros. Rio de Janeiro: SENAI/ DN, 1987. 89 p. MYLOUPOULOS, J. Conceptual Modelling and Telos1. 1992. NOVO, Hildenise Ferreira. A elaboração de taxonomia: princípios classificatórios para domínios interdisciplinares. Orientador: Maria Luiza de Almeida Campos. Niterói, 19 mar 2007. 172 p. Dissertação (Mest. Ciência da Informação) -IBICT/UFF. NEELAMAGHAN, M.L. Non-hieraquical associative relationships: their types and computer generation of RT links. In: Seminar on Thesaurus in InformationsSystens, Bangalore, Dec. 1-5, 1975. Bangalore, Documentaion research and Trainning Center, 1975. RAJAN, T.N. Related terms in thesauri. In: SEMINAR ON THESAURUS INFORMATION SYSTEM, Bangalore, de 1-5, 1975. Anais Bangalore, Documentation Research and Training Center, 1975. RANGANATHAN, S.R. Prolegomena to library classification. Bombay: Asia Publishing House, 1967. SALES, Luana Farias. Modelo triádico de relações para aplicação em ontologias. Seminário de pesquisa em ontologia no Brasil. In: SEMINÁRIO BRASILEIRO DE ONTOLOGIAS, 1., 11 e 12 de Julho 2008, Niterói, Rio de Janeiro. Anais... Niterói: UFF, 2008. Disponível em: <http://www.uff.br/ontologia/artigos/13.pdf> Acesso em: 26 jun 2012. SALES, Luana Farias. Ontologias de domínio: estudo das relações conceituais e sua aplicação. Orientador: Maria Luiza de Almeida Campos; Co-orientadora: Hagar 17

Espanha Gomes. Niterói, 14 set. 2006. 139 f. Dissertação (Mest. Ciência da Informação)-IBICT/UFF. SALES, Luana Farias. Relações conceituais para instrumentos de padronização terminológica: um novo modelo para o uso em ontologias. In: ENANCIB, 8. Salvador, Bahia 28 a 31 de outubro de 2007 Anais... Salvador: UFBA, 2007. SAYÃO, Luis Fernando. Modelos teóricos em Ciência da Informação: abstração e método científico. Ciência da Informação, Brasília: IBICT, v. 30, n. 1, p. 82-91, jan./abr. 2001. SHETH, A. ARPINAR, I. B AND KASHYAP V. Relationships at the Heart of Semantic Web: Modeling, Discovering, and Exploiting Complex Semantic Relationships. In: Nikravesh, M. Azvin, B. Yager R. and Zadeh L. Enhanceing the Power of the Internet Studies in Fuzziness and Soft Computing. Springer. 2003. USCHOLD, M; KING, M. Towards a methodology for building ontologies. IJCAI-95: Workshop on Basic Ontological Issues in Knowledge Sharing, Montreal, Canada, [s.n.] 1995. Proceedings Disponível em: <http://citeseer.ist.psu.edu/uschold95toward.html> Acesso em: 15 out 2005. WÜSTER, E. L étudescientifiqueqénérale de laterminologie, zone frontalière entre lalinguistique, la logique, l ontologie, L informatique et lessciencesdeschose. In: RONDEAU, G. ; FELBER, E. (Org.). Textes choisis de terminologie. Québec: GIRSERM, 1981. V.I : fondéments théoriques de la terminologie, p. 57-114. 18