SEMINÁRIO DE PESQUISA EM ONTOLOGIA NO BRASIL 11 E 12 de Julho Universidade Federal Fluminense Departamento de Ciência da Informação Niterói Rio de Janeiro Brasil Esta comunicação está sendo submetida sob o Tema 2 Técnicas e Ferramentas em ontologias Um modelo baseado em ontologias para representação da memória organizacional An ontology-based model for organizational memory representation Maurício Barcellos Almeida (PPGCI/ECI-UFMG, mba@eci.ufmg.br) Resumo: O presente trabalho consiste de pesquisa realizada durante a concepção de um sistema de memória organizacional, em uma organização de grande porte. Desenvolveu-se um modelo baseado em ontologias para representar a memória organizacional e, em seguida, verificou-se a sua validade. Para tal, construiu-se uma ontologia, alimentada no ambiente de trabalho da organização, na qual o conhecimento apreendido foi formalizado e armazenado. Além disso, desenvolveu-se um protótipo de um aplicativo para a avaliação da ontologia, e em última instância, do modelo. Espera-se contribuir para a pesquisa em ontologias ao: i) obter uma ontologia organizacional, a qual será utilizada como base para pesquisas futuras; ii) elaborar uma proposta para avaliação de ontologias, composta pelo protótipo e por questionários, os quais foram concebidos a partir de contribuições interdisciplinares. Palavras-chaves: ontologia, modelos organizacionais, avaliação de ontologias, memória organizacional. Abstract: The present study is part of a research project conducted during the building of an organizational memory system, in a large Brazilian utility company. We developed an ontology-based model to represent the organizational memory and then we verified its validity. To this end, we built an ontology nurtured by the working environment of a real organization in which the learned knowledge is formalized and stored. Moreover, we developed a prototype system to evaluate the ontology and the model. We believe that this study may contribute towards improvements in ontology research by: i) obtaining an organizational ontology, which will be used as a basis for future research; ii) undertaking a proposal for ontology evaluation, comprised of the prototype and the questionnaires, which are based on a multidisciplinary approach. Keywords: ontology, organizational model, ontology evaluation, organizational memory.
1 Um modelo baseado em ontologias para representação da memória organizacional Resumo: o presente trabalho consiste de pesquisa realizada durante a concepção de sistema de memória organizacional, em uma organização de grande porte. Desenvolveu-se um modelo baseado em ontologias para representar a memória organizacional e, em seguida, verificou-se a sua validade. Para tal, construiu-se uma ontologia, alimentada no ambiente de trabalho da organização, na qual o conhecimento apreendido foi formalizado e armazenado. Além disso, desenvolveu-se um protótipo de um aplicativo para a avaliação da ontologia, e em última instância, do modelo. Espera-se contribuir para a pesquisa em ontologias ao: i) obter uma ontologia organizacional, a qual será utilizada como base para pesquisas futuras; ii) elaborar uma proposta para avaliação de ontologias, composta pelo protótipo e por questionários, os quais foram concebidos a partir de contribuições interdisciplinares. Palavras-chaves: ontologia, modelos organizacionais, avaliação de ontologias. Abstract: The present study is part of a research project conducted during the development of an organizational memory system, in a large Brazilian utility company. We developed an ontology-based model to represent the organizational memory and then we verified its validity. To this end, we built an ontology nurtured by the working environment of a real organization in which the learned knowledge is formalized and stored. Moreover, we developed a prototype system to evaluate the ontology and the model. We believe that this study may contribute towards improvements in ontology research by: i) obtaining an organizational ontology, which will be used as a basis for future research; ii) undertaking a proposal for ontology evaluation, comprised of the prototype and the questionnaires, which are based on a multidisciplinary approach. Keywords: ontology, organizational model, ontology evaluation. 1) Introdução As organizações atuais estão inseridas em um ambiente turbulento, caracterizado pela alta competitividade, pela integração dos mercados e pela redução do ciclo de vida de produtos. Nesse ambiente, a informação e o conhecimento se tornaram essenciais para ao desempenho das empresas. Têm surgido, assim, discussões sobre como as organizações podem preservar o conhecimento que detém para utilização futura. A noção de memória tem sido utilizada por diversos autores (WALSH e UNGSON,1991; STEIN, 1995; LEHNER e MAIER, 2000), que usam o termo memória organizacional como uma metáfora para explicar fenômenos verificados no ciclo de vida das organizações. O presente estudo foi realizado durante a construção de um SMO-Sistema de Memória Organizacional na CEMIG-Cia Energética de Minas Gerais, uma empresa do ramo de energia, a qual possui 11.000 funcionários, atende a 16 milhões de consumidores e opera a maior rede de distribuição de energia elétrica da América Latina. O objetivo do SMO é integrar as práticas de qualidade representadas por um conjunto de políticas e de diretrizes, denominado de SG-Sistema de Gestão, facilitando assim sua disseminação e controle. Para a pesquisa, desenvolveu-se um modelo baseado em ontologias correspondente ao componente de representação do conhecimento do SMO. Além disso, desenvolveu-se um protótipo de um aplicativo e questionários auxiliares para avaliação da ontologia, e em última instância, do modelo gerado. O restante desse estudo está organizado da seguinte forma: a seção 2 descreve a condução da pesquisa; a seção 3 apresenta resultados da construção da ontologia e da avaliação; a Seção 4 apresenta uma breve discussão, conclusões e sugestões para trabalhos futuros. 2) Material e Métodos
2 A presente seção apresenta os procedimentos adotados na pesquisa: instrumentos de pesquisa (Seção 2.1), coleta de dados (Seção 2.2) e construção da ontologia (Seção 2.3). 2.1) Instrumentos de pesquisa Os instrumentos de pesquisa utilizados foram: i) os métodos para coleta de dados e ii) os formulários para registro de dados coletados e para construção da ontologia; iii) questionários para avaliação da ontologia; iii) protótipo de sistema e questionários, para avaliação. A seleção dos métodos para coleta de dados se baseou procedimentos provenientes de: i) JAD- Joint Application Design; ii) projeto e análise de cenários (BENNER et al, 1993); análise de assunto (LANCASTER, ELLIKER e CONNEL, 1989). De forma a registrar a coleta de dados foram adotados formulários, utilizados para i) coleta de dados: Tabela de Conceitos Raiz, Relatórios de Cenários, Síntese de Entrevista, Análise de Documentos; ii) construção da ontologia: Escopo da Ontologia, Tabela de Terminologia Semi- Informal, Tabela Individual de Intensões e de Extensões, Tabela Consensual de Intensões e de Extensões, Tabela Semi-formal de Conceitos e Relações. Os questionários para avaliação da ontologia foram elaborados a partir de abordagens provenientes de diferentes áreas de pesquisa: i) qualidade da informação (KAHN, STRONG e WANG, 1997; LEE et al 2002; PRICE e SHANKS, 2003; PARASURAMAN, BERRY e ZEITHAM, 1988), utilizada na Ciência da Informação para estudar necessidades de usuários e de uso da informação; ii) questões de competência (FOX, 1992; KIM, FOX e GRUNINGER, 1999), utilizadas para definir o escopo de ontologias; e iii) objetivos educacionais de aprendizado (BLOOM, 1983), utilizada na área de educação para verificar se o aprendizado foi adequado. A utilização dos instrumentos de pesquisa apresentados é descrita nas seções seguintes (2.2 e 2.3), à medida que são utilizados na coleta de dados e na construção da ontologia. 2.2) Coleta de dados A coleta de dados foi realizada nas seguintes etapas i) entrevistas; ii) técnicas para análise de documentos; iii) análise de outras ontologias para a concepção das camadas superiores. O objetivo geral das entrevistas era obter termos candidatos para a ontologia, porém existiam objetivos específicos distintos. Assim, as entrevistas foram classificadas em quatro tipos e nomeadas em entrevistas 1, 2, 3 e 4. Cada entrevista foi gravada e transcrita para um editor de textos. As entrevistas 1 objetivavam compreender a atuação dos funcionários e foram registradas nas Sínteses de Entrevistas. As entrevistas 2 objetivavam obter narrativas nas quais os usuários descreveram suas atividades, o uso de documentos e de sistemas e foram registradas nos Relatórios de Cenários. As entrevistas 3 e 4, relativas à construção da ontologia, são apresentadas na seção 2.3. A análise dos documentos enfatizou aqueles que forneciam as diretrizes para o SG, consistindo de cerca de quarenta tipos de documentos e relatórios provenientes de quatro sistemas informatizados. As entrevistas 1 forneceram informações sobre os documentos e sobre sua utilização. Em seguida,
3 foram observados os processos realizados sobre os documentos. Todas as informações foram registradas no formulário de Analise de Documentos. Finalmente, procedeu-se a análise de assunto. As camadas superiores da ontologia foram construídas a partir de termos obtidos na análise de outras ontologias, de alto nível (SOWA, 2000; CYC PROJECT, 2005) e organizacionais (GRUNINGER e FOX, 1995; USCHOLD et al, 1998; GANDON, 2002). Finalmente, termos candidatos a conceitos da nova ontologia foram marcados e extraídos, a partir das sínteses, relatórios e outros formulários utilizados. A seção 2.3 descreve a utilização dos termos extraídos e sua aplicação na ontologia. 2.3) Construção da ontologia A metodologia para a construção da ontologia foi baseada nos trabalhos de Fernandez, Gomes- Perez e Juristo (1999) e de Gandon (2002). Abrangeu as seguintes etapas: i) concepção das camadas superiores; ii) estágios informal e semi-informal; iii) estágios semi-formal e formal. A ontologia consistiu de três camadas, de forma que duas delas (camadas superiores) pudessem ser reutilizadas. Os termos dessas camadas foram adaptados de ontologias de alto nível selecionadas, conforme descrito na Seção 2.2. Para a terceira camada, denominada camada específica, consideraramse os termos obtidos ao longo da coleta de dados. Em uma primeira iniciativa de organização do vocabulário, esses termos foram transpostos para Tabelas de Terminologia Semi-Informal. Em seguida foram obtidas as noções intensionais e extensionais para cada termo. Para tal foram realizadas as entrevistas 3, solicitando aos participantes que fornecessem definições para os termos. O resultado foi registrado na Tabela Individual de Intensões. Foram também obtidas as noções extensionais e o resultados registrados na Tabela Individual de Extensões. Realizaram-se então as entrevistas 4, em grupo, nas quais se buscou consenso sobre as noções intensionais e extensionais propostas. As noções consensuais obtidas foram registradas nas Tabela Consensual de Intensões e de Extensões. O conteúdos dessas tabelas foi reorganizado, gerando um novo nível de ordenação, denominado estágio semi-formal. Para registrar a organização de termos nesse nível foi utilizada a Tabela Semi-formal de Conceitos e Relações. No estágio denominado formal, o conteúdo das Tabelas Semi-Formais de Conceitos, Relações e Instâncias foi inserido no Protegé (NOY et al, 2001). Aos termos do estágio semi-formal adicionaram-se aqueles das camadas superiores e em seguida os resultados foram exportados para RDFS-Resource Description Framework. A avaliação da ontologia é apresentada na Seção 3. 3) Resultados A versão final da ontologia resultante continha 251 classes e 409 relações. Após o termino da construção da ontologia procedeu-se a avaliação de seu conteúdo. A avaliação foi realizada pelos mesmos especialistas envolvidos nas fases anteriores, de forma a comprovar que a ontologia era representativa do conhecimento naquele domínio. No processo de avaliação, os participantes utilizaram um protótipo e responderam a questionários.
4 O protótipo consistia de um mecanismo de busca simples, implementado em XSLT-Extended StyleSheet Language Transformation. Seu objetivo era possibilitar buscas dentre os conceitos e as relações armazenados na ontologia e relacionados ao SG. Os resultados das buscas eram gerados a partir da marcação label do RDFS. O protótipo consistia de: i) tela de navegação e pesquisa, a qual permitia a busca por conceitos, por relações, relações para um conceito e conceitos para uma relação; ii) hierarquia de conceitos, que permitia acesso aos conceitos dispostos em uma taxonomia; iii) interface de gerenciamento, que permitia a carga de diferentes bases de conhecimento. Após o uso do protótipo pelo prazo de uma semana, os especialistas responderam aos questionários. Os questionários foram preparados a partir de três orientações (citadas na seção 2.1) e denominados questionários 1, 2 e 3. Os resultados foram então organizados em tabelas, a partir dos critérios considerados em uma escala de 1 (o conhecimento obtido com o uso do protótipo não atende minhas necessidades) a 5 (o conhecimento obtido com o uso do protótipo atende minhas necessidades). Foram consideradas também médias aritméticas das respostas e médias ponderadas, por exemplo, no caso de diferentes dimensões de avaliação utilizadas nos questionários 2 (por exemplo, volume apropriado, credibilidade, etc) e 3 (por exemplo, compreensão, análise, etc). No questionário 1, obteve-se uma média ponderada de 4,16 relativa aos valores atribuídos pelos respondentes de acordo com a escala (1 a 5). A média aritmética calculada para as afirmações do questionário foi de 4,10. Tais valores indicam que o resultado obtido foi positivo do ponto de vista das questões de competência. No questionário 2, obteve-se média ponderada de 4,26 relativa aos valores atribuídos pelos respondentes de acordo com a escala de 1 a 5. A média aritmética calculada para as afirmações foi de 4,26. Os valores obtidos indicam que o resultado foi positivo do ponto de vista da qualidade da informação. No questionário 3, obteve-se uma média ponderada de 4,09 relativa aos valores atribuídos pelos respondentes de acordo com a escala de 1 a 5. A média aritmética calculada para as afirmativas foi de 4,13. Os valores obtidos indicam que o resultado foi positivo do ponto de vista dos objetivos educacionais. 4) Discussão e Conclusão A partir dos resultados satisfatórios obtidos, acredita-se ser viável a continuidade da pesquisa. Destaca-se que os resultados positivos são provenientes de um estudo de caso, em uma empresa. Fazse necessária a aplicação da proposta em outras companhias para consolidar os resultados obtidos com a construção e com a avaliação da ontologia organizacional. Cabe ainda formular algumas questões remanescentes, enumerar contribuições práticas da pesquisa e recomendar possibilidades para trabalhos futuros. Algumas contribuições da pesquisa são: i) a metodologia de construção do modelo, que pode ser generalizada para utilização em outras empresas (padronização de formulários, método de aquisição de conhecimento, etc); ii) considerações práticas sobre as peculiaridades no desenvolvimento de ontologias organizacionais, registradas ao longo da pesquisa; iii) um protótipo para avaliação de
5 ontologias, o qual pode ser executado em um navegador da Internet em qualquer intranet corporativa; cabe ainda citar que as metodologias para construção de ontologias não prevêem mecanismos para avaliação do conteúdo; iv) criação de uma lista de mais de cem termos (camadas superiores da ontologia) obtidos em iniciativas internacionais, a qual pode ser reaproveitada em qualquer empresa. Em relação a trabalhos futuros, além da aplicação da proposta em outras empresas, conforme já citado, destaca-se: i) refinamento do protótipo, de forma que o aplicativo possa ser mais efetivo em situações diversas, e possa ser utilizado por usuários finais; ii) estudo das limitações da ferramenta e da linguagem utilizadas, de forma a verificar sua adequação ao domínio organizacional. Referências bibliográficas. BENNER, K.M. et al. Utilizings scenarios in the software development process (1993). Available from Internet: <http://citeseer.ist.psu.edu/benner93utilizing.html>. Access: 20 July 2005. BLOOM, B.S. Taxonomia de objetivos educacionais. 8º ed. Porto Alegre: Globo, 1983. 179 p. CYC Project (2005). What's in Cyc? Available from Internet: <http://www.cyc.com/cyc/technology/whatiscyc_dir/>. Access: 20 March 2005. FERNANDEZ, M.; GOMEZ-PEREZ, A.; JURISTO, H. Methontology; from ontological art towards ontological engineering (1997). Available from Internet: <http://citeseer.ist.psu.edu/context/544607/0/>. Access: 20 July 2005. FOX, M.S. The TOVE Project; towards a common-sense model of the enterprise (1992). Available from Internet: <http://www.eil.utoronto.ca/enterprise-modelling/papers/index.html>. Access: 20 July 2005. GANDON, F. Distributed artificial intelligence and knowledge mangement; ontologies and multi-agent systems for a corporate semantic web. 2002. 483f. Tese (Scientific Philosopher Doctorate Thesis in Informatics) - Doctoral School of Sciences and Technologies of Information and Communication, INRIA and University of Nice, Nice, 2002. GRUNINGER, M.; FOX, M.S. Methodology for the design and evaluation of ontologies. (1995). Available from Internet: <http://citeseer.ist.psu.edu/grninger95methodology.html>. Access> 10 April 2001. KAHN, B. R.; STRONG, D. M; WANG, R. Y. A model for delivering quality information as product and service. In: CONFERENCE ON INFORMATION QUALITY, 1997. Proceedings... Cambridge, MA, [ s. n.], 1997. p. 80-94. KIM, H.M.; FOX, M.S.; GRUNINGER, M. An ontology for quality management; enabling quality problem identification and tracing (1999). Available from Internet: <http://citeseer.ist.psu.edu/context/1728409/0>. Access: 21 Dec.2003. LANCASTER, F. W.; ELLIKER, C.; CONNEL, T. H. Subject analysis. Annual Review of Information Science and Technology. v. 24, p. 35-84. 1989. LEE, Y.W. et al. AIMQ; a methodology for information quality assessment. Available from Internet: <http://citeseer.ist.psu.edu/lee01aimq.html>. Access: 21 March 2006 LEHNER, F; MAIER, R.K. How can organizational memory theories contribute to organizational memory systems? Information Systems Frontiers. [online]. v. 2, n. 3/4, p. 277-298, 2000. Available from Internet: <http://www.springerlink.com/app/home/ >. Access: 18 Dec. 2004. NOY, N. et al. Creating Semantic Web Contents with Protegé-2000 (2001). Available from Internet: <http://citeseer.ist.psu.edu/noy01creating.html>. Access: 1 Aug. 2005. PARASURAMAN, A.; BERRY, L. L.; ZEITHAM, V. A. SERVQUAL; a multiple-item scale for measuring consumer perceptions of service quality (1988). Available from Internet: <http://www.cema.edu.ar/>. Access: 20 March 2006. PRICE, J.R.; SHANKS, G. A Semiotic Information Quality Framework. (2004). Available from Internet: <http://s-cahvishnu.infotech.monash.edu.au/dss2004/proceedings/pdf/65_price_shanks.pdf>. Access: 10 Feb. 2006. SOWA, J. F. Ontoloy. (2000). Available from Internet: <http://www.jfsowa.com/ontology/>. Access: 20 March 2006. STEIN, E.W. Organizational Memory: review of concepts and recommendations for management. International Journal of Information Management. [online]. v. 15, n. 1, p. 17-32, 1995. Available from Internet: <http://www.sciencedirect.com/science>. Access: 10 Mar. 2004. USCHOLD, M. et al. Enterprise ontology (1998). Available from Internet: <http://www.aiai.ed.ac.uk/project/enterprise/enterprise/ontology.html>. Access: 20 July 2005. WALSH, J.P.; UNGSON, G.R. Organizational memory. The Academy of Management Review.[online].vol. 16, n. 1, p. 57-91, 1991. Available from Internet: <http://proquest.umi.com/pqdlink?>. Access: 12 Mar. 2005.