Pedro Luiz Pizzigatti Corrêa 1 Antonio Mauro Saraiva 2 Carlos Eduardo Cugnasca 3 André Riyuiti Hirakawa 4



Documentos relacionados
UFG - Instituto de Informática

Sistema de Informações do Centro Nacional de Conservação da Flora: Uma visão conceitual

INTEGRAÇÃO DE APLICAÇÕES UTILIZANDO WEB SERVICE 1. Kellen Kristine Perazzoli 2 ; Manassés Ribeiro 3

Web Services. (Introdução)

UNIVERSIDADE. Sistemas Distribuídos

Sistemas Distribuídos

3 Serviços na Web (Web services)

2 Conceitos relativos a Web services e sua composição

Service Oriented Architecture (SOA)

Fase 1: Engenharia de Produto

1

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

Introdução a Web Services

Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS)

SISTEMA COMPUTACIONAL PARA ANÁLISES DE DADOS EM AGRICULTURA DE PRECISÃO

Documento de Análise e Projeto VideoSystem

Um Processo para Desenvolvimento de Aplicações Web Baseado em Serviços. Autores: Fábio Zaupa, Itana Gimenes, Don Cowan, Paulo Alencar e Carlos Lucena

Segurança e Escalabilidade em WebLab no Domínio de Redes de Computadores

ISO/IEC 12207: Gerência de Configuração

Carta para a Preservação do Patrimônio Arquivístico Digital Preservar para garantir o acesso

Anexo VI Edital nº 03361/2008. Projeto de Integração das informações de Identificação Civil. 1. Definições de interoperabilidade adotadas pela SENASP

Serviços Web: Introdução

Extensão do Sistema de Metadados para Recursos Naturais

SOA - Service Oriented Architecture. Marcelo Canevello Ferreira

SISTEMA GERENCIADOR DE BANCO DE DADOS

PROGRAMA DE MBA em Gestão e Engenharia do Produto. O Produto Internet e suas Aplicações

Arquitetura de Banco de Dados

Introdução ao Modelos de Duas Camadas Cliente Servidor

Universidade Paulista

Engenharia de Requisitos Estudo de Caso

DIMENSIONANDO PROJETOS DE WEB-ENABLING. Uma aplicação da Análise de Pontos de Função. Dimensionando projetos de Web- Enabling

Arquiteturas, Padrões e Serviços para Geoprocessamento. Lúbia Vinhas 13/05/2008

Semântica para Sharepoint. Busca semântica utilizando ontologias

EXPERIÊNCIA DE USO DE ARQUITETURA CORPORATIVA NO PROJETO DE RES

Cooperação científica e técnica e o mecanismo de intermediação de informações

Dúvidas e Esclarecimentos sobre a Proposta de Criação da RDS do Mato Verdinho/MT

SISTEMAS DISTRIBUÍDOS

Documento de Arquitetura

Critérios para certificação de Sites SciELO: critérios, política e procedimentos para a classificação e certificação dos sites da Rede SciELO

3 SCS: Sistema de Componentes de Software

MINISTÉRIO DA CIÊNCIA E TECNOLOGIA MCT MUSEU PARAENSE EMÍLIO GOELDI MPEG

Definição de Padrões. Padrões Arquiteturais. Padrões Arquiteturais. Arquiteturas de Referência. Da arquitetura a implementação. Elementos de um Padrão

1 INTRODUÇÃO. 1.1 Motivação e Justificativa

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Fábrica de Software 29/04/2015

TRIBUNAL REGIONAL FEDERAL DA 2ª REGIÃO Secretaria de Tecnologia da Informação

CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE

Noções de. Microsoft SQL Server. Microsoft SQL Server

Sistema de Informação Integrado

3 a Lista de Exercícios

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Cláudia Araújo Coordenadora Diego Macêdo Programador Marcelo Rodrigues Suporte

Glossário Apresenta a definição dos termos, siglas e abreviações utilizadas no contexto do projeto Citsmart.

Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto

Serviços Web: Arquitetura

Disciplina de Banco de Dados Introdução

Web Services. Integração de aplicações na Web. Sistemas Distribuídos

Orientação a Objetos

CENTRO UNIVERSITÁRIO ESTÁCIO RADIAL DE SÃO PAULO SÍNTESE DO PROJETO PEDAGÓGICO DE CURSO 1

CONCEITOS INICIAIS. Agenda A diferença entre páginas Web, Home Page e apresentação Web;

COMPATIBILIZANDO CADASTROS

Projeto Demoiselle. Para perguntas e respostas, utilizem a lista de discussões de usuários da comunidade: demoiselle-users@lists.sourceforge.

Sistemas de Informação I

Sistemas Operacionais II. Prof. Gleison Batista de Sousa

ü Curso - Bacharelado em Sistemas de Informação

Sistemas de Informação

Arquitetura Orientada a Serviço

APOO Análise e Projeto Orientado a Objetos. Requisitos

Conceitos de Banco de Dados

15/09/2015. Gestão e Governança de TI. Modelo de Governança em TI. A entrega de valor. A entrega de valor. A entrega de valor. A entrega de valor

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

INTRODUÇÃO A PORTAIS CORPORATIVOS

CONTRA CONTROLE DE ACESSOS E MODULARIZADOR DE SISTEMAS

3 Um Framework Orientado a Aspectos para Monitoramento e Análise de Processos de Negócio

APLICATIVO MOBILE CATÁLOGO DE PÁSSAROS - PLATAFORMA ANDROID/MYSQL/WEBSERVICE

Sistemas Distribuídos

O que é Grid Computing

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

SISTEMA DE GESTÃO DE PESSOAS SEBRAE/TO UNIDADE: GESTÃO ESTRATÉGICA PROCESSO: TECNOLOGIA DA INFORMAÇÃO

Governança AMIGA. Para baixar o modelo de como fazer PDTI:

Módulo 4: Gerenciamento de Dados

Web Services. Autor: Rômulo Rosa Furtado

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V

DESENVOLVIMENTO DE APLICATIVO MÓVEL PARA AUXÍLIO NA PREVENÇÃO DE TRAGÉDIAS EM DECORRÊNCIA DE ENCHENTES

CHECK - LIST - ISO 9001:2000

TERMO DE REFERÊNCIA (TR) GAUD VAGA

Daniela Campioto Cyrilo Lima*, Emanuela Matos Granja*, Fabio Giordano **

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

Aplicação Prática de Lua para Web

Chamada de Participação V Competição de Avaliação - IHC 2012

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web

CONCURSO PÚBLICO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI ANALISTA DE GESTÃO RESPOSTAS ESPERADAS PRELIMINARES

IMPLEMENTAÇÃO DAS CAMADAS Inference Machine e Message Service Element PARA UM SERVIDOR DE SISTEMA DE GERENCIAMENTO DE Workflow HOSPITALAR

APLICATIVO WEB PARA O SETOR DE EXTENSÃO IFC VIDEIRA

SISTEMA DE MONITORAMENTO DE CONDIÇÕES CLIMÁTICAS

Transcrição:

UMA ARQUITETURA DE SISTEMAS VOLTADA PARA A INTEGRAÇÃO DE BASES DE DADOS DISTRIBUÍDAS DE BIODIVERSIDADE Pedro Luiz Pizzigatti Corrêa 1 Antonio Mauro Saraiva 2 Carlos Eduardo Cugnasca 3 André Riyuiti Hirakawa 4 RESUMO - Diversos Sistemas de Informação de Biodiversidade atuais consideram uma arquitetura centralizada de banco de dados, que dificulta o controle tanto da autoria da fonte como também do acesso a dados que tenham restrição de acesso. Essas dificuldades muitas vezes provocam na comunidade científica dessa área uma forte rejeição à idéia da digitalização e, em especial, do compartilhamento dos dados. Este artigo apresenta uma proposta de Arquitetura Distribuída de Sistemas Orientada a Serviços para a Integração de Bancos de Dados de Biodiversidade. Para isso, é utilizado um estudo de caso de sistema que gerencia uma base de dados distribuída de bromélias. A arquitetura considera requisitos de segurança no acesso a diferentes bases de dados de bromélias, que são gerenciadas por diferentes instituições, e também padrões internacionais para sistemas distribuídos e sistemas de biodiversidade, tais como: Web Services, que fornecem a infra-estrutura de serviços; Distributed Generic Information Retrieval (DiGIR), que permite compartilhar banco de dados de biodiversidade; e Access to Biological Collection Data (ABCD), que fornece o padrão de informação utilizado para catalogar dados de biodiversidade. Palavras-chave: sistemas de informação de biodiversidade, computação orientada a serviços, sistemas distribuídos A SYSTEM ARCHITECTURE FOR BIODIVERSITY DISTRIBUTED DATABASE INTEGRATION ABSTRACT - Many current Biodiversity Information Systems consider a centralized data base architecture, which makes it difficult to control both the authorship of the source and the 1 Bacharel em Ciência da Computação, Doutor em Engenharia. pedro.correa@poli.usp.br 2 Engenheiro Eletricista e Engenheiro Agrônomo, Doutor e Livre Docente. Professor Associado. antonio.saraiva@poli.usp.br 3 Engenheiro Eletricista, Doutor e Livre Docente. Professor Associado. carlos.cugnasca@poli.usp.br 4 Engenheiro Eletricista, Doutor em Engenharia. andre.hirakawa@poli.usp.br 1,2,3,4 Professores da Escola Politécnica da Universidade de São Paulo.

48 Corrêa et al. access to data that have some kind of restriction. In the scientific community, these difficulties many times cause a strong rejection to the ideas of data digitalization and specially data sharing. This article presents a proposal for a Distributed Services-Oriented Systems Architecture for Biodiversity Databases Integration. As a case study a system that manages a distributed database of bromeliads is presented. The architecture considers safety requirements in the access to different bromeliad databases, managed by different institutions, and also international standards for distributed and biodiversity systems such as: Web Services, that provide service infrastructure; Distributed Generic Information Retrieval (DiGIR), which allows sharing biodiversity databases; and Access to Biological Collection Data (ABCD), which provides the information standards used to catalogue biodiversity data. Keywords: biodiversity information system, service oriented architecture, distributed systems 1 INTRODUÇÃO O problema do acesso à informação sobre biodiversidade é um dos focos de uma nova área de pesquisa que tem sido denominada Informática da Biodiversidade (Biodiversity Informatics) e que pode ser enquadrada como uma das vertentes da bioinformática. De fato, o escopo dessa nova área é bastante amplo e compreende aspectos clássicos da tecnologia da informação aplicada à coleta de dados de biodiversidade e ao processamento e análise desses dados, visando o seu compartilhamento e a tomada de decisão (SARAIVA, 2003). Um aspecto particularmente importante dessa área refere-se à digitalização dos enormes legados de dados de coleções biológicas em museus, herbários, zoológicos, jardins botânicos, etc., que contabilizam cerca de 3 bilhões de espécimes (itens de coleções) catalogados no mundo, dos quais talvez 5 a 10% estejam digitalizados (SOBERON, 1999). Após essa digitalização, o desafio seguinte é o da integração desses dados em escala global, a qual é um prérequisito para quantificar e qualificar a biodiversidade do planeta, fundamental para a definição de ações de preservação. Como preservar o que não se conhece? Como estimular e investir em levantamentos de campo para a identificação de novas espécies se não se tem um quadro de referência das áreas e espécies que já são bem conhecidas? O nível de desconhecimento é tal que as estimativas sobre o número de espécies existentes na Terra oscila entre os extremos improváveis de 3,6 milhões (estimativa inferior) e 100 milhões (estimativa superior). O número mais aceito para a ordem de grandeza é da casa da dezena de milhões de espécies de seres vivos. Destes, já foram catalogados e receberam nomes entre 1,5 e 1,8 milhão de espécies, como afirma Edward O. Wilson (2003), que cunhou o termo biodiversidade, sendo por muitos considerado o pai dessa área. Desta forma, tornam-se necessárias soluções de Tecnologia da Informação que apóiem a digitalização dos dados disponíveis, gerando as bases de dados de biodiver-

Uma arquitetura de sistemas voltada para a integração de bases de dados distribuídas de biodiversidade 49 sidade e, posteriormente, sua integração para permitir a visão e análises globais da situação, que apoiarão assim, a proposição de ações de preservação e uso sustentado. Uma questão que permeia toda essa discussão é o caráter fortemente distribuído dessas fontes de dados. Os repositórios desses dados e informações são instituições como museus e assemelhados, ou grupos de pesquisa, os quais estão distribuídos geograficamente. Cada um desses repositórios poderia dispor de um sistema local de informação, o que, inclusive, resolve um aspecto delicado desse problema que é o da propriedade intelectual sobre os dados e o controle e as restrições sobre o acesso a eles. Esse controle sobre acesso aos dados e a preservação da autoria da fonte são aspectos que muitas vezes provocam na comunidade científica dessa área uma forte rejeição à idéia da digitalização e, em especial, do compartilhamento dos dados. Embora existam iniciativas com o objetivo de promover soluções de Sistemas de Informação de Biodiversidade, essas soluções consideram uma arquitetura centralizada, onde os geradores de informação muitas vezes pertencem a diferentes instituições, e manipulam informações em uma mesma base de dados centralizada. Outras soluções consideram a necessidade de integração de bases de dados de diferentes instituições, porém com recursos limitados, permitindo consultas distribuídas entre as diferentes bases de dados, mas não estimulam a colaboração efetiva entre os seus participantes. Desta forma, este trabalho tem por objetivo propor uma Arquitetura de Sistemas de Informação de Biodiversidade que promova a autonomia de gestão e a colaboração entre vários geradores de informação (pesquisadores, produtores, formuladores de políticas públicas). A arquitetura a ser considerada nesta pesquisa tem a característica de ser aberta e distribuída, baseada nos seguintes requisitos gerais: - promover o compartilhamento da informação gerenciada através de diferentes bases de dados distribuídas e autônomas (CORRÊA, 2002), que se relacionam através de um domínio comum de informação, tais como o domínio de espécies de abelhas (SARAIVA; IM- PERATRIZ-FONSECA, 2002), ou o domínio de espécies de Bromélias (CORRÊA et al., 2005); - permitir o estabelecimento de comunidades virtuais entre os diferentes geradores de informação, estimulando a contribuição e a confiança mútua, potencializando a geração de informação e conhecimento da comunidade. Nas próximas seções são discutidos os principais conceitos utilizados neste estudo, o modelo de integração proposto para as bases de dados distribuídas de biodiversidade e a arquitetura que representa esse modelo. No final deste artigo é apresentado um estudo de caso dessa arquitetura, através da implementação de um protótipo desse sistema para uma Base de Dados Distribuída de Bromélias. 2 REVISÃO DE LITERATURA A especificação da arquitetura do sistema, apresentada a seguir, é baseada nos conceitos da Computação Orientada a

50 Corrêa et al. Serviços (COS) ou Service Oriented Computing (SOC) (PAPAZOGLOU; GEORGAKOPOULOS, 2003). COS é um paradigma computacional que utiliza serviços como elementos principais para modelagem de aplicações. Os Serviços são oferecidos por provedores, ou seja, organizações que possuem a implementação e a descrição dos serviços. A COS envolve: camadas, funcionalidades e regras que definem uma Arquitetura Orientada a Serviços (AOS) ou Service Oriented Architecture (SOA) (PAPAZO- GLOU; GEORGAKOPOULOS, 2003), de acordo com a Figura 1. A camada dos Serviços Básicos define a descrição e as operações básicas dos serviços especificados, que constituem a base do SOA. As camadas mais altas fornecem suporte adicional para a composição e o gerenciamento dos serviços. Figura 1. Camadas da Arquitetura Orientada a Serviços (Baseado em PAPAZOGLOU; GE- ORGAKOPOULOS, 2003). A camada de Serviços Compostos contém as regras e as funcionalidades para a consolidação de múltiplos serviços em um único serviço composto, gerado pelo Agregador de Serviços. Tais serviços podem ser utilizados como aplicações por clientes. Os Agregadores de Serviços então se transformam em Provedores de Serviços que,

Uma arquitetura de sistemas voltada para a integração de bases de dados distribuídas de biodiversidade 51 desta forma, publicam seus serviços. Os Agregadores de Serviços desenvolvem especificações que permitem à camada Serviços Compostos ter as seguintes funções: - Coordenação: controla a execução dos serviços e do gerenciamento de transações; - Monitoramento: monitora os eventos e as informações produzidas pelos serviços; - Conformidade: assegura a integridade do serviço através do gerenciamento dos tipos de parâmetros manipulados, além de promover a fusão de informações; - Qualidade de Serviço: inclui ao serviço o custo, desempenho, segurança, autenticação, privacidade, integridade, escalabilidade e a disponibilidade. A camada de Gerenciamento de Serviços do SOA (STAL, 2002) estabelece a plataforma de gerenciamento de serviços das organizações. A organização responsável pela operação de gerenciamento é conhecida como Operador de Serviço, que pode ser um cliente ou um Agregador de Serviço, dependendo da aplicação. Através do SOA é possível definir um conjunto de funcionalidades e camadas de serviços para o Modelo de Integração de Bases de Dados de Biodiversidade proposto. Para definir a arquitetura que representa o Modelo, este trabalho apóia-se em Web Services (W3C, 2002), que aplica os conceitos de computação orientada a serviços na Web, utilizando protocolos padrões da Internet para a descrição e transmissão dos serviços. Os padrões básicos que definem Web Services são: - Simple Object Access Protocol (SOAP) (W3C, 2003), que é um mecanismo que permite definir mensagens de requisições e respostas (request/response), utilizando, principalmente, o protocolo HTTP para transmitir mensagens; - Web Services Description Language (WSDL) (W3C, 2001), uma linguagem baseada em XML, utilizada para descrever os serviços, parâmetros e a localização na Web, utilizando um modelo de descrição neutro em relação a uma linguagem específica de implementação de um provedor do serviço ou de um cliente; - Universal Discovery, Description and Integration (UDDI) (IBM, 2005) é um padrão de broker para a Internet, que vem sendo especificado por um consórcio de aproximadamente 300 empresas, lideradas pela IBM, Microsoft e HP. Os registros são acessados pelos clientes através de SOAP e obtém uma descrição dos serviços em WSDL, gerando um proxy do lado do cliente que invoca o serviço Web. Assim, a arquitetura de Web Services permite o desenvolvimento de sistemas distribuídos que agregam serviços e informações disponíveis em outros provedores, sendo particularmente interessante para a integração de bases de dados de biodiversidade. Deve-se acrescentar que, além de utilizar um padrão de serviços para integrar bases de dados, é necessário um esquema de dados neutro, que seja independente das bases de dados locais e que possa representar o conteúdo de dados de biodiversidade de interesse. No item a seguir, são apresentados

52 dois padrões de metadados reconhecidos internacionalmente: ABCD e DarwinCore. 2.1 PADRÕES DE ACESSO A DADOS DE COLEÇÕES BIOLÓGICAS O padrão Access to Biological Collection Data (ABCD, 2005) ou ABCD é um padrão internacional para catalogação de dados de espécies biológicas, desenvolvido por taxonomistas da International Working Group on Taxinomic Databases (TDWG) (TDWG, 2005), uma organização internacional que tem por objetivo a padronização e a integração de base de dados taxonômicos de biodiversidade. A representação adotada pelo ABCD utiliza um esquema na linguagem XML. Este esquema permite uma maior integração entre sistemas diferentes, já que o XML é suportado por diferentes plataformas, tornando assim o ABCD portável e de fácil entendimento. O DarwinCore é um padrão baseado no conjunto das informações comumente encontradas na maioria das coleções iológicas existentes, representado também em XML (DARWINCORE, 2005). Esse padrão pressupõe que apenas as informações mais importantes de cada espécie sejam catalogadas. Logo, o DarwinCore apresenta e especifica essas informações de forma a criar um conjunto mínimo de informações que os bancos de dados e os sistemas de consulta devem tratar. Dessa forma, todos os itens de dados do padrão DarwinCore possuem um outro equivalente no padrão ABCD. Porém, nem todos os itens de dados do ABCD têm representação em DarwinCore, que foi Corrêa et al. definido com o objetivo de compartilhar os dados mais relevantes de biodiversidade entre diferentes sistemas de informação. Porém, considerando que este trabalho tem por objetivo focar um domínio específico de biodiversidade, é necessário utilizar um esquema mais abrangente, que permita representar todos os detalhes de dados de uma ou mais espécies que fazem parte do domínio de biodiversidade considerado. 2.2 DiGIR O projeto Distributed Generic Information Retrieval - DiGIR (2005) surgiu com o principal intuito de evitar múltiplos desenvolvimentos de sistemas inconsistentes entre si, permitindo assim a integração de sistemas de bancos de dados distribuídos de biodiversidade. A arquitetura DiGIR tem quatro elementos importantes, a saber (Figura 2): a interface com o usuário, o protocolo, o Portal Engine e o Provider. De um modo geral, os serviços de um Provider são cadastrados no Provedor de Registros, que gerencia informação de localização dos Providers. O Portal Engine é o responsável por acessar o Provedor de Registros e descobrir os Providers disponíveis. O usuário, através da uma interface para entrada de dados, pode fazer sua consulta ao Provider através do Portal Engine, que consulta o Provider relativo à consulta efetuada pelo usuário. O Provider, mediante requisição, entrega as informações pedidas ao Portal Engine que por sua vez, as repassa para a interface do usuário.

Uma arquitetura de sistemas voltada para a integração de bases de dados distribuídas de biodiversidade 53 Provedor de Registros Figura 2. Arquitetura utilizada pelo DiGIR (DIGIR, 2005). Deve-se acrescentar que o DiGIR foi especificado exclusivamente para permitir consultas distribuídas e padronizadas a bases de dados de biodiversidade, não contemplando mecanismos de segurança e gerenciamento de transações distribuídas. 3 ARQUITETURA PROPOSTA Neste item é apresentada uma arquitetura de sistemas de informação aberta e distribuída para gerenciamento de informação voltada para um domínio específico de biodiversidade. Por domínio específico en-

54 tende-se um conjunto de espécies biológicas de interesse de um sistema de informação. Para discutir os requisitos e a arquitetura proposta neste artigo, é utilizado um sistema voltado para gerenciamento de informação de biodiversidade de bromélias. Inicialmente, são discutidos os requisitos funcionais desse sistema, para em seguida apresentar os elementos de sua arquitetura. As bromélias são encontradas na costa leste brasileira dentro da Mata Atlântica, que é considerada o centro de diversidade de várias famílias botânicas: com cerca de 2.500 espécies e 42 gêneros, Bromeliaceae é uma das maiores famílias entre as angiospermas. Estima-se que 40% de espécies e 73% de gêneros ocorram no Brasil (COFFANI-NUNES, 2002). Não há dados oficiais sobre o extrativismo de bromélias na Mata Atlântica, mas sabe-se que sua prática se dá em diferentes regiões ameaçando espécies como a Alcantara Imperialis na região da Serra dos Órgãos (RJ). De maneira geral, existem vários fatores que contribuem para o extrativismo ilegal e a biopirataria; entre eles estão as rodovias, que são importantes vias de acesso e pontos de comercialização para extrativistas, e a pequena produção dos horticultores, que não consegue suprir a demanda crescente dos paisagistas (COFFANI-NUNES, 2002). A reversão deste panorama depende de vários fatores como a existência de políticas de conservação e o uso de seus recursos, a eficiência do sistema de fiscalização e a geração, difusão e aplicação do conhecimento técnico científico existente. Corrêa et al. Assim, um Sistema de Informação de Bromélias pode apoiar a geração e difusão de informação envolvendo a comunidade científica e leiga, formada de colecionadores, pesquisadores, comerciantes e produtores. Há a necessidade de criar uma articulação entre estes elos através de ações que estimulem a troca de informações técnicocientíficas e a elaboração de uma análise mais ampla e real da questão. Um sistema de informação voltado para este domínio de espécies permite estabelecer um canal para o compartilhamento das informações, bem como para a discussão dos diversos aspectos envolvidos na conservação e no uso das bromélias, um produto florestal não madeireiro de rara beleza e que é, ao mesmo tempo, um agente e um indicador da diversidade de espécies e de nichos ecológicos que compõem a Mata Atlântica brasileira. A Figura 3 apresenta uma visão inicial da arquitetura de um sistema de informação distribuído que integra provedores de serviços e informação de bromélias. Os Portais estabelecem uma visão global do domínio, disponibilizando acesso aos serviços à comunidade de usuários que participam desse sistema de informação, permitindo assim compor informações locais, gerando informações mais complexas e inter-relacionadas. Para que essa comunidade possa compartilhar dados e serviços com outros domínios de sistemas de biodiversidade nacionais e internacionais, tais como Global Biodiversity Facility - GBIF (2005) e SpeciesLink (SL, 2005), o portal é responsável por serviços de Gateway, que implementam serviços DiGIR para acesso ao Domínio de Bromélias, de acordo com a Figura 3.

Uma arquitetura de sistemas voltada para a integração de bases de dados distribuídas de biodiversidade 55 Provedor Bromélia3 Provedor Bromélia2 Domínio Distribuído de Bromélia Provedor Bromélia N Administração Local do Provedor: - Inclusão de novas Informações locais; Provedor - Gerenciamento de usuários (locais Bromélia1 e remotos)....... Portal do Domínio Bromélias Administração do Portal: - Gerenciamento de Transações; - Gerenciamento de Catálogos entre domínios Domínio GBIF Domínio Specieslink Figura 3. Domínio de Informação de Bromélias. Deve-se ressaltar que cada provedor manipula serviços específicos locais, porém esses serviços não são parte do Domínio Distribuído de Bromélias. Somente os serviços comuns a todos os provedores são aqueles que definem e caracterizam esse Domínio. Os serviços de segurança, juntamente com os serviços de consulta, estabelecem um padrão de componentes e serviços distribuídos que permitem a execução de consultas distribuídas entre os diferentes provedores, os quais basicamente definem o Domínio Distribuído do Sistema de Informação de Bromélias. 3.1 DESCRIÇÃO DOS COMPONENTES E SERVIÇOS Dentre os serviços da arquitetura SOA, descritos no item 2 deste trabalho, foram considerados na arquitetura aqueles que são necessários para estabelecer o Domínio Distribuído de Bromélias. Esses serviços estão representados na Figura 4. O Portal de Bromélias é responsável por gerar as interfaces que interagem com os usuários. Os Provedores (Provider) de Bromélias permitem acesso às bases de dados de bromélias das instituições. O Provedor (Provider) de Mapas e Imagens manipula acessos a Base de Dados de Mapas e Imagens, necessários para serviços de visualização georreferenciada de localização de bromélias. Em cada um dos provedores, são considerados serviços de segurança, que permitem realizar autenticação e autorização para acesso aos serviços e informações de cada instituição.

56 Corrêa et al. Figura 4. Serviços definidos para o Domínio Distribuído de Bromélias. A Tabela 1 mapeia as camadas e serviços da arquitetura SOA em relação aos serviços considerados no sistema de informação de bromélias. Tabela 1 - Funcionalidades e Serviços SOA aplicáveis ao Sistema de Bromélias. Camada Funcionalidade Representação na arquitetura Composição de Serviços Serviços Básicos Coordenação, Adaptação e Monitoramento Interface, Comportamento e Publicação Gerenciador de Serviços Autenticação, Autorização, Informação de Bromélias, Informação de Mapas e Imagens, e Portal de Bromélias

Uma arquitetura de sistemas voltada para a integração de bases de dados distribuídas de biodiversidade 57 De acordo com a Figura 4, o processo se inicia com o Portal fazendo uma requisição ao Provedor de Bromélias (etapa 1). Antes de o provedor recuperar as informações requisitadas, é necessário verificar a identidade e a origem da requisição do serviço, através da autenticação e autorização (etapa 2). Somente após o Provedor de Bromélias permitir a execução do serviço a informação da base de dados de bromélias pode ser acessada. Entretanto, se o serviço requisitado é sobre mapas e imagens, é gerada uma requisição de serviço ao Provedor (etapa M.1). Os serviços de autenticação e autorização (etapas M.2 e M.3) são executados em um módulo independente, gerenciado por uma instituição de pesquisa que participa do domínio. Um processo análogo ocorre se o Provedor de Bromélias necessita de informação gerenciada por outros Provedores (passos A1.1 e An.1) para compor um serviço que o portal requisitou ao Provedor (passos A1.2, A1.3 e A1.4). Considerando que os serviços são definidos de acordo com a arquitetura SOA, o próximo passo é representar uma visão de componentes e serviços da arquitetura, o que significa agregar serviços em componentes bem definidos (representados na Figura 5). Os serviços que manipulam a comunicação entre os Provedores e o Portal são agrupados no componente denominado Componente Coordenador. Os serviços de autenticação e autorização são agrupados no Componente de Segurança. De acordo com a Figura 5, os serviços que manipulam o acesso à base de dados são agrupados nos Componentes de Mapas e Imagens e de Dados de Bromélias (A0, A1,...). Finalmente, o Componente de Portal é responsável por agrupar os serviços de gerenciamento das interfaces com os usuários. A arquitetura de componentes e serviços separa as bases de dados das instituições. Cada instituição possui um portal próprio, no qual são realizadas não só as consultas aos serviços de sua base de dados, como também aos de outras instituições. Cada instituição registra seus usuários locais, bem como autoriza outros usuários do domínio no acesso aos seus serviços. Todo o compartilhamento de serviços e informação é controlado por perfis de acesso, no qual o usuário é autenticado, obtendo assim um perfil associado a sua autenticação. Dessa forma, baseado em seu perfil de acesso, cada instituição pode autorizar o usuário a acessar determinados serviços disponibilizados pelo seu Provider. Isso permite uma arquitetura distribuída, na qual pesquisadores colecionadores e formuladores de políticas de conservação possam gerenciar suas bases de dados e compartilhar essas informações através de um padrão de metadados (ABCD). Os Providers disponibilizam, através de serviços definidos localmente, todas as operações disponíveis sobre a base de dados local. Dessa maneira, os Providers têm a função de interface entre o banco de dados e os Portais, realizando as operações (consulta, inserção, alteração e remoção) na base de dados, além de disponibilizar serviços aos Portais para a geração das ações requisitadas pelos usuários dos Portais.

58 Corrêa et al. A0 Dados de Bromélias Figura 5. Componentes da arquitetura proposta. 4 IMPLEMENTAÇÃO DE UM ESTUDO DE CASO Um protótipo do Sistema de Informação de Bromélias foi desenvolvido na linguagem Java, utilizando o SDK Java 2 Enterprise Edition versão 1.4.2 (J2EE, 2005). As interfaces foram implementadas em Java Servlet Pages - JSP (2005) e a base de dados utiliza o Sistema PostgreSQL (POSTGRESQL, 2005). A Figura 6 apresenta as tecnologias utilizadas na implementação dos componentes Portal e Provedor. A informação de autenticação do usuário e a instituição a qual pertencem encontram-se armazenadas em estruturas de diretórios, utilizando o protocolo LDAP (LDAP, 2005), que permite realizar as consultas às bases de dados distribuídas de autenticação. Identificado o usuário, seu perfil e a sua instituição de origem, o sistema verifica a autorização de acesso ao serviço, através do acesso a uma base de dados relacional. A interface de autenticação é apresentada na Figura 7.

Uma arquitetura de sistemas voltada para a integração de bases de dados distribuídas de biodiversidade 59 Figura 6. Tecnologias utilizadas na implementação dos componentes da arquitetura proposta. Figura 7. Exemplos das interfaces do Sistema de Informações de Bromélias.

60 Os serviços voltados para aspectos funcionais do sistema, representados na Figura 6 como Operação de Serviços, implementam as operações de gerenciamento de informação das bromélias. No estudo de caso considerado, implementaram-se serviços que atendem às necessidades do perfil de usuários que são pesquisadores da área, não considerando serviços voltados para outros perfis desse domínio tais como: produtores, formuladores de políticas públicas, entre outros. Assim, os serviços considerados permitem gerenciar dados de coletas de dados de bromélias realizadas em campo, além de serviços voltados para a visualização de mapas e imagens de satélite da localização georreferenciada dessas coletas. Alguns aspectos funcionais e de usabilidade do sistema, puderam ser avaliados através da utilização do protótipo para a inclusão de dados de experimentos sobre bromélias, coletados na Mata Atlântica, na região do Vale do Ribeira SP. Esses dados permitiram gerar um Provedor de Dados de Bromélias, acessível através do Portal de Bromélias. Porém, uma avaliação mais abrangente deverá ser conduzida a partir da inclusão de outros provedores vinculados a outras instituições, o que poderá avaliar as funcionalidades de compartilhamento de dados entre os usuários de diferentes instituições, considerados na arquitetura proposta. 5 CONCLUSÕES Esse trabalho abordou a arquitetura de sistemas de informação de biodiversidade com o objetivo de se contrapor ao enfoque adotado tradicionalmente por esses sistemas, Corrêa et al. os quais se caracterizam principalmente por serem centralizados. Neles, mesmo pesquisadores pertencentes a diferentes instituições, utilizam um único banco de dados centralizado para gerenciar todas as informações. Esse enfoque produz uma desigualdade da capacidade de gerenciamento dos dados entre as instituições, outorgando à instituição centralizadora dos dados uma responsabilidade operacional e analítica diferenciada das demais, dificultando assim o processo colaborativo de pesquisa entre as instituições parceiras envolvidas em um domínio específico de pesquisa em biodiversidade. A arquitetura de sistemas de informação de biodiversidade proposta é distribuída e aberta, e cada instituição participante é responsável por administrar seus dados, podendo também receber colaboração de pesquisadores de outras instituições parceiras, bem como ter um amplo acesso a bases de dados das demais instituições que fazem parte de um mesmo domínio de pesquisa em biodiversidade. A arquitetura apresentada utiliza os conceitos de Arquiteturas Orientadas a Serviços, utilizando o padrão de metadados de biodiversidade ABCD. Esses mecanismos constituem uma infra-estrutura básica de interoperabilidade; porém, ainda é necessário estabelecer serviços e componentes funcionais padronizados que atendam os interesses de um particular sistema de informação de biodiversidade. Baseados nos componentes e serviços definidos por essa arquitetura, esse trabalho pode evoluir visando contribuir com o desenvolvimento de um middleware orientado a objetos, voltado para sistemas de informação de biodiversidade.

Uma arquitetura de sistemas voltada para a integração de bases de dados distribuídas de biodiversidade 61 Um primeiro protótipo de um Sistema de Informação de Biodiversidade para o domínio de espécies de bromélias, foi desenvolvido como estudo de caso desses padrões e dessa proposta de arquitetura. Os serviços e componentes funcionais implementados foram aqueles voltados para atender as necessidades de usuários com perfis de pesquisadores. Esse perfil permitiu representar um amplo conjunto de serviços e informações a respeito de bromélias, gerenciados por diferentes instituições de pesquisa. Considerando a interação colaborativa entre pesquisadores, o serviço de segurança passa a ser fundamental. O serviço de segurança distribuído e descentralizado desse sistema foi implementado através da utilização do protocolo LDAP, que se mostrou funcionalmente adequado às necessidades de gerenciamento de usuários, pertencentes a diferentes instituições, que acessam um sistema de informação distribuído de biodiversidade. Uma possível continuidade desse projeto envolve a implementação de componentes de gateway DIGIR, que permitam serviços de acesso a dados de bromélias por outros domínios de sistemas de informação de biodiversidade, tais como GBIF e SpeciesLink. AGRADECIMENTOS Os autores agradecem aos alunos do curso de Engenharia de Computação da Escola Politécnica da USP, T. Nagamine, V. Suzuki e R. Guimarães, que participaram no desenvolvimento desse sistema; à pesquisadora da Escola Superior de Agricultura Luiz de Queiroz da USP, M. Carvalhaes, pelo apoio na especificação funcional do Sistema de Bromélias; ao pesquisador da EMBRAPA/CNPTIA C. F. Paniago, pelo apoio na especificação e implementação do acesso a imagens de satélite georreferenciadas; e à Fundação de Amparo à Pesquisa do Estado de São Paulo, que concedeu duas bolsas de iniciação científica. REFERÊNCIAS ABCD. ACCESS TO BIOLOGICAL COL- LECTION DATA. CODATA Working Group on Biological Collection Data Access. [Informações sobre ABCD]. 2005. Disponível em: <http://www.bgbm.org/tdwg/codata/ Schema/>. Acesso em 03 de março 2005. COFFANI-NUNES, J. V. Bromélias. In: SIMÕES, L.L; LINO, C.F.(org.). Sustentável mata atlântica - a exploração de seus recursos florestais. São Paulo: SENAC, 2002. CORRÊA, P. L. P. Diretrizes e procedimentos para o projeto de bases de dados distribuídas. 2002. 198 f. Tese (Doutorado). Escola Politécnica da Universidade de São Paulo. CORRÊA, P. L. P.; NAGAMINE, T. T.; SUZUKI, V. GUIMARÃES, R. G.; CARVALHAES, M. A Service Oriented Information System to manage Bromelia Distributed Database. In: EFITA WCCA 2005 JOINT CONFERENCE. CON- FERECENCE OF THE EUROPEAN FEDERATION FOR INFORMATION TECHNOLOGY IN AGRICULTURE, FOOD AND ENVIRONMENT, 5.; WORLD CONGRESS ON COMPUTERS

62 IN AGRICULTURE AND NATURAL RESOURCES, 3., Vila Real, Portugal, 2005. Proceedings. Vila Real: EFITA, 2005. p. 504-511. DARWINCORE. Species Analyst Darwin Core V2. Disponível em: <http://tsadev.speciesanalyst.net/ documentation/ow.asp?darwincorev2>. Acesso em 03 de março de 2005. DIGIR. DiGIR Open Source Project. Disponível em: <http://digir.sourceforge.net/>, Acesso em 03 de março 2005. GBIF. Global Biodiversity Information Facility. Disponível em: <http://www.gbif.org>, Acesso em 03 de março 2005. IBM. UDDI. Universal Discovery, Description, and Integration. Disponível em: <http://www.ibm.com/service/uddi/ standards.html>. Acesso em 03 de março 2005. J2EE. Java 2 Platform, Enterprise Edition (J2EE) Overview. Disponível em: <http://java.sun.com/j2ee/overview.html>. Acesso em 03 de março 2005. JSP 2005. Java Server Pages Technology. Disponível em: <http://java.sun.com/products/jsp/>. Acesso em 03 de março 2005. LDAP. IETF - The Internet Engineering Task Force. Reference for Comments LDAP. Disponível em: <http://www.ietf.org/rfc/rfc2251.txt>. Acesso em 03 de março de 2005. Corrêa et al. PAPAZOGLOU, M.P.; GEORGAKOPOU- LOS, D. Service oriented computing. Communication of the ACM, v. 46, n. 10, 35-43, October 2003. POSTGRESQL. PostgrSQL. 2005. Disponível em: <http://www.postgresql.org/>. Acesso em 03 de março 2005. SARAIVA, A. M. Tecnologia da informação na agricultura de precisão e biodiversidade. 2003. 157f. Tese (Livre Docência). Escola Politécnica da Universidade de São Paulo. SARAIVA, A. M.; IMPERATRIZ- FONSECA, V. L. WebBee: Uma rede de informações sobre biodiversidade brasileira em abelhas nativas. In: ENCONTRO SO- BRE ABELHAS, 5, Ribeirão Preto, 2002. Anais. Ribeirão Preto: FFCLRP/FMRP/ USP, 2002. p.108-113. SL. SpeciesLink. [Sistema que acessa banco de dados de coleções do estado de São Paulo e de outros países]. 2005. Disponível em: <http://splink.cria.org.br>. Acesso em 03 de março 2005. SOBERON, J. Linking biodiversity information sources. Tree Elsevier Science. v.14, n.7, p.291, 7 July 1999. STAL, M. Web services: beyond component-based computing. Communications of ACM, v. 45 n.10, p.71-76, October 2002. TDWG. TAXONOMIC DATABASE WORKING GROUP. DWG. Disponível em: <http://www.tdwg.org/>. Acesso em 03 de março 2005.

Uma arquitetura de sistemas voltada para a integração de bases de dados distribuídas de biodiversidade 63 W3C. WORLD WIDE WEB CONSOR- TIUM. WEB Services. 2002. Disponível em: <http://www.w3.org/2002/ws/>. Acesso em 03 de março 2005.. SOAP Version 1.2. 2003. Disponível em: <http://www.w3.org/tr/soap>. Acesso em 03 de março 2005.. WSDL. 2001. Disponível em: <http://www.w3.org/tr/wsdl.html>. Acesso em 03 de março 2005. WILSON, E. O. The encyclopedia of life. Trends in Ecology and Evolution. v.18, n.2, Feb. 2003, p.77-80.