TRATAMENTO DE INFORMAÇÕES GERADAS A PARTIR DE FONTES DE COLABORAÇÃO HETEROGÊNEAS PARA APOIO À RESPOSTA EM EMERGÊNCIAS

Tamanho: px
Começar a partir da página:

Download "TRATAMENTO DE INFORMAÇÕES GERADAS A PARTIR DE FONTES DE COLABORAÇÃO HETEROGÊNEAS PARA APOIO À RESPOSTA EM EMERGÊNCIAS"

Transcrição

1 Tiago Badre Marino TRATAMENTO DE INFORMAÇÕES GERADAS A PARTIR DE FONTES DE COLABORAÇÃO HETEROGÊNEAS PARA APOIO À RESPOSTA EM EMERGÊNCIAS TESE DE DOUTORADO Rio de Janeiro 2015

2 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO INSTITUTO DE MATEMÁTICA INSTITUTO TÉRCIO PACITTI DE APLICAÇÕES E PESQUISAS COMPUTACIONAIS PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA TIAGO BADRE MARINO TRATAMENTO DE INFORMAÇÕES GERADAS A PARTIR DE FONTES DE COLABORAÇÃO HETEROGÊNEAS PARA APOIO À RESPOSTA EM EMERGÊNCIAS Tese de Doutorado apresentada ao Programa de Pós-Graduação em Informática, Instituto de Matemática, Instituto Tércio Pacitti de Aplicações e Pesquisas Computacionais, Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do grau de Doutor em Informática. Orientadores: Prof. Marcos Roberto da Silva Borges, Ph.D. Prof a. Maria Luiza Machado Campos, Ph.D. Rio de Janeiro 2015

3 Marino, Tiago Badre TRATAMENTO DE INFORMAÇÕES GERADAS A PARTIR DE FONTES DE COLABORAÇÃO HETEROGÊNEAS PARA APOIO À RESPOSTA EM EMERGÊNCIAS / TIAGO BADRE MARINO. Rio de Janeiro: UFRJ, f.: il. Tese de Doutorado em Informática Universidade Federal do Rio de Janeiro, Instituto de Matemática, Instituto Tércio Pacitti de Aplicações e Pesquisas Computacionais, Programa de Pós-Graduação em Informática, Orientadores: Marcos Roberto da Silva Borges, Maria Luiza Machado Campos 1. Fontes de Informações Heterogêneas. 2. Sistemas Complexos. 3. Colaboração. 4. Integração de Informação. 5. Apoio à Decisão. 6. Gestão de Emergências. I. Marcos Roberto da Silva Borges (Orient.). II. Maria Luiza Machado Campos (Coorient.). III. Universidade Federal do Rio de Janeiro. Instituto de Matemática. Instituto Tércio Pacitti. IV. Título. CDD.

4 TRATAMENTO DE INFORMAÇÕES GERADAS A PARTIR DE FONTES DE COLABORAÇÃO HETEROGÊNEAS PARA APOIO À RESPOSTA EM EMERGÊNCIAS Tiago Badre Marino Aprovado em 26/06/2015 Tese de Doutorado apresentada ao Programa de Pós-Graduação em Informática, Instituto de Matemática, Instituto Tércio Pacitti de Aplicações e Pesquisas Computacionais, Universidade Federal do Rio de Janeiro, como requisito parcial à obtenção do título de Doutor em Informática. Prof. Marcos Roberto da Silva Borges, Ph.D., UFRJ (Presidente) Prof a. Maria Luiza Machado Campos, Ph.D., UFRJ Prof a. Jonice de Oliveira Sampaio, D.Sc., UFRJ Prof a. Adriana Santarosa Vivacqua, D.Sc., UFRJ Prof. Jorge Xavier da Silva, Ph.D., UFRJ Prof a. Flávia Maria Santoro, Ph.D., UNIRIO Prof. Jugurta Lisboa Filho, D.Sc., UFV

5 Aos meus amados pais. Saudade imensa. Sigo em frente, com vocês nas minhas melhores lembranças...

6 AGRADECIMENTOS Aos Professores e orientadores científicos desta tese, Marcos Roberto da Silva Borges e Maria Luiza Machado Campos, pelo apoio e conhecimentos transmitidos durante o desenvolvimento, e também pelo compromisso assumido e empenho que dedicaram a este trabalho. Agradeço ainda, pela análise de cada capítulo, as sugestões, os esclarecimentos e comentários, sempre oportunos, que espero ter sabido aproveitar, e claro, por acreditarem em mim desde o início desta longa, porém velocíssima jornada. À Universidade Federal Rural do Rio de Janeiro (UFRRJ) e meus companheiros de departamento, por acreditarem em meu projeto e permitirem que eu pudesse estabelecer e dedicar-me parcialmente às minhas pesquisas de doutorado. Aos incansáveis Professores Jorge Xavier da Silva e Maria Hilde de Barros Goes, meus gurus, amigos, grandes incentivadores, maiores responsáveis por hoje eu trilhar a vida acadêmica, com muita satisfação e motivação em converter o conhecimento adquirido em benefícios para nossa sociedade. Serei eternamente grato aos conhecimentos transmitidos, de inestimável valor. Aos professores John Breslin e Maciej Dabrowiski, do Digital Enterprise Research Institute/National University of Ireland (DERI/NUIG), na cidade de Galway, República da Irlanda, que abraçaram minha pesquisa e pelos ensinamentos e orientações de grande valia, das quais pude absorver novas e valiosas contribuições para este trabalho. Por toda simpatia, atenção e colaboração na disponibilização de dados fundamentais aos experimentos realizados no trabalho, quando lhes foram solicitados e também pelas críticas construtivas durante nossas sessões de acompanhamento da pesquisa. Ainda em Galway - simpática cidade que me acolheu durante quase um ano - meus cumprimentos são extensivos aos colegas do grupo Social Software, contribuindo sempre com boas dicas e referências. Não esquecendo também dos companheiros estrangeiros e brasileiros que lá estiveram e partilharam comigo alguns momentos descontraídos: meus companheiros da equipe de vôlei da NUIG, Nicholas Ciuferri e Petre Stefanov; e meus companheiros de pesquisa no DERI, João Carlos Pereira, André Freitas e Bianca Pereira. Estendo meus agradecimentos à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), que me apoiou financeiramente durante o estágio de doutorado sanduíche no exterior e tornou este projeto possível.

7 Agradeço também à valiosa contribuição e cordialidade dos coordenadores das Organizações Não Governamentais Mission 4636 e Sahana Eden em partilhar as suas bases de dados comigo, para fins de experimentação nesta pesquisa de tese. Estas Organizações desempenharam um papel essencial e notório em atividades de coleta, organização e divulgação de informações relacionadas à ajuda humanitária durante a resposta ao terremoto ocorrido em Porto Príncipe (Haiti), em janeiro de As bases de dados cedidas foram fundamentais para a elaboração de um cenário de experimentação que retratasse fidedignamente as circunstâncias reais de uma emergência. Aos meus colegas do Laboratório de Emergências, Fabrício Firmino, Cristiano Expedito, Inês Bosca, Augusto Escobar por participarem e colaborarem ativamente em minhas pesquisas. Também aos meus colegas de doutorado do PPGI, em especial Bruno Nascimento e Kelli Cordeiro, grandes colaboradores nesta pesquisa, fomentada por boas discussões e alguns trabalhos em parceria. À Secretaria do Programa de Pós-Graduação em Informática, em especial ao funcionário Anibal Ferreira, pelo constante e eficiente apoio na solução de questões burocráticas junto à Universidade. Seu apoio foi também fundamental para a viabilização do meu estágio no exterior. Por último, porém não menos importante, minha família. Meu pai Mario Marino (in memoriam), maior incentivador e entusiasta deste projeto, meu herói, lutador na ficção e na vida real. Minha mamãe, Lourdes Helena (in memoriam), minha grande companheira, sem dúvidas o maior amor da minha vida. Hoje cuidam de mim de lá de cima. Minha incansável valente e durona síndica, vovó dona Hellé-Nice. Meus irmãos, grandes parceiros e verdadeiros amigos Tedinho e Fernando Marino. Aos melhores padrinhos do mundo, queridos Fonseca e Janete. Não posso deixar tampouco de agradecer à minha família de coração, em especial aos meus irmãos Bruno, Fernanda, Marcinho, Vavá e meus pais adotivos Jorge Tubagi e José Luiz Schmidt. E finalmente, minha amável companheira e parceira de caminhada e aventuras pelo mundo, Maria Augusta e sua linda família, que me abraçaram e deram forças para seguir em frente, e pela paciência...

8 RESUMO MARINO, Tiago Badre. Tratamento de Informações Geradas a Partir de Fontes de Colaboração Heterogêneas para Apoio à Resposta em Emergências f. Tese (Doutorado em Informática). Instituto de Matemática, Instituto Tércio Pacitti, Universidade Federal do Rio de Janeiro, Rio de Janeiro, O envolvimento de cidadãos no enfrentamento de crises não é mais novidade. O advento de novas tecnologias de informação e comunicação aliado à popularização de dispositivos móveis criam oportunidades para o aumento da geração de informação contextual originada através da participação social. No passado a escassez de dados constituía uma das principais barreiras impostas aos gestores públicos no processo de tomada de decisão. Hoje a situação se inverte, quando o desafio está em gerenciar um excesso de dados, totalmente dinâmicos e provenientes de distintas fontes: sensores remotos ambientais, redes sociais, equipes de campo, imagens de satélite, mídia. Em um ambiente de emergência, a preocupação não mais se dá em coletar dados para exercer uma melhor leitura do ambiente afetado, mas sim em saber organizar, integrar, classificar e separar o que é de fato útil ao gestor da emergência para cada fase de resposta. Entretanto, para organizar e integrar é necessário promover um diagnóstico inicial sobre o conjunto de dados disponibilizados por cada fonte de informações. É necessário, por exemplo, identificar em cada fonte considerada, quem, onde, quando, em que situação a informação foi originada. Deve-se também compatibilizar o formato de dados das fontes de modo a possibilitar comparações, agrupamentos e o estabelecimento de associações de informações correlatas. Em suma, é preciso estruturar e organizar a informação processada de modo que, quem venha a consumi-la disponha de boas condições para determinar se tal informação é ou não útil para a tomada de decisão. Portanto, este estudo tem por objetivo a concepção e experimentação de uma arquitetura de tratamento da informação colaborativa que considera os aspectos da complexidade do ambiente no contexto de emergências e, a partir da coleta e integração de informações originadas de fontes heterogêneas, busca promover o enriquecimento do conhecimento contextual atual e, desta forma, apoiar a decisão dos gestores da resposta a emergências. Palavras-chave: Fontes de Informações Heterogêneas, Sistemas Complexos, Colaboração, Integração de Informação, Apoio à Decisão, Gestão de Emergências.

9 ABSTRACT MARINO, Tiago Badre. Processing Information Generated from Heterogeneous Collaborative Sources to Support Emergencies Response p. Thesis (Doctor in Computer Science). Instituto de Matemática e do Núcleo de Computação Eletrônica da Universidade Federal do Rio de Janeiro, Rio de Janeiro, The involvement of citizens supporting crisis situations is not new. The advent of new information and communication technologies coupled with the popularization of mobile devices raises opportunities for increasing generation of contextual information originated through social participation. Formerly, lack of data was one of the main barriers to public managers in the decision-making process. Nowadays the situation is reversed as the challenge is to manage data in excess, dynamic and originated from different sources: remote sensors, social networks, response field teams, satellite images, media. During an emergency response situation, a main concern is no longer to collect data for a better understanding of the affected environment, but in knowing how to organize, aggregate and separate what is actually useful to the manager on each emergency response phase. However, for this to happen, it is necessary to identify data structure and meaning (metadata) associated to each information resource (SMS, , social networks, environmental sensors, information originated from field agents, etc.). For each source, it is necessary to identify who, where, when, and under which circumstances the information has been originated. It also contemplates matching of data format of information sources, in order to allow comparisons, clustering procedures and associations among correlated information. In summary, it is necessary to structure and organize the acquired information so that consumers are able to determine whether or not such information is useful for decision making. Therefore, this research aims to design and experiment an architecture for treatment of collaborative information that considers environmental complexity aspects in the context of emergencies and, by collecting and integrating information derived from heterogeneous sources, aims to enrich current contextual knowledge and thus support decision makers during emergency responses. Keywords: Heterogeneous Information Sources, Complex Systems, Crisis and Disaster Management, Collaboration, Information Integration, Decision Support, Emergency Management.

10 Lista de Figuras Figura 1.1. Sequência das diferentes fases de um evento emergencial e a divisão setorial dos grupos de trabalho da equipe UNDAC durante respostas a desastres. Adaptado de OCHA (2012) Figura 1.2. Mapa conceitual dos tipos de conhecimentos que apoiam a fase de resposta de uma emergência. Adaptado de Diniz et al. (2005) Figura 1.3. Cenário clássico de resposta a emergências: dificuldades de acesso, comunicação e aquisição de informação Figura 1.4. Agentes de aquisição de dados ambientais e meios de comunicação hoje disponíveis no apoio a construção do conhecimento contextual atual Figura 2.1. Porcentagem da população usuária de smartphones por país. Fonte: OurMobilePlanet.com Figura 2.2. Mashup de colaboração social através das redes sociais para o apoio a desastres (ESRI, 2013) Figura 2.3. As redes sociais propagam informações com rapidez: pouso de emergência do avião da empresa US Airways no Rio Hudson, em janeiro de Informação publicada apenas 10 minutos após o pouso de emergência da aeronave. Fonte: Publicação no microblog Twitter do usuário Janis Krums Figura 2.4. a) Portal VC NO G1 : aproveitamento da colaboração comunitária para a divulgação de matérias jornalísticas. Fonte: Globo.com; b) Portal Digital Journal : utilização de informações obtidas a partir da colaboração social para a publicação de notícias Figura 2.5. Mapa de crise do projeto Ushahidi/Haiti: mapeamento categorizado sobre incidentes relevantes submetidos pela população haitiana após o terremoto do Haiti (2010). Adaptado de Ushahidi Figura 3.1. Identificação de elementos e interações de um sistema complexo adaptativo: o meio ambiente Figura 3.2. Organização da gestão da emergência em diferentes escalas... 57

11 Figura 3.3. Evolução da base de conhecimento contextual através de ciclos de feedbacks de reforço Figura 3.4. Distintos aspectos da heterogeneidade no contexto de informações colaborativas em situações de emergência: a) tipos de agentes geradores de informação colaborativa; b) meios de comunicação; c) idioma de comunicação Figura 4.1. (a) Avaliações de deslizamentos por equipes de campo em Teresópolis RJ; (b) Plataforma de coleta e envio remoto de dados estruturados em formulários eletrônicos através dispositivos móveis (MARINO et al., 2012) Figura 4.2. Atributos de uma publicação da rede social Twitter: destaque da informação das coordenadas geográficas do local corrente do emissor no momento da publicação Figura 4.3. Diferença entre a localização geográfica corrente do informante e o evento ao qual ele se refere em uma informação colaborativa publicada através de uma rede social Figura 4.4. Inserção da informação da localidade do evento relatado em uma publicação na rede social Facebook Figura 4.5. Teste de localização do emissor do a partir do IP do cabeçalho da mensagem na ferramenta WolframAlpha Figura 5.1. Plataforma Vicon/SAGA: módulo autônomo de entrada de dados por meio de dispositivos móveis (MARINO et al., 2012) Figura 5.2. Linha do tempo referente ao período de coleta de mensagens e ocorrência dos eventos monitorados por Hugues e Palen. Adaptado de Hugues e Palen (2009) Figura 5.3. Workflow da plataforma Ushahidi. Adaptado de Heinzelman e Waters (2010).. 94 Figura 5.4. (a) Arquitetura da plataforma EMERSE; (b) Módulo de entrada de dados para iphone. Adaptado de Caragea et al. (2011) Figura 5.5. Cenário exemplo para coordenação das ofertas e necessidades através das mídias sociais. Adaptado de Purohit et al. (2013) Figura 5.6. Plataforma MicroMappers: interface colaborativa para análise e classificação das mensagens e imagens capturadas do microblog Twitter Figura 5.7. Estratégia da equipe vencedora do desafio Red Ballon Challenge : política de recompensa baseada em marketing multinível para recrutar participantes

12 Figura 6.1. Arquitetura para coleta e tratamento de informações colaborativas no apoio à decisão em ambientes de emergência Figura 6.2. Workflow: agentes, processos e interações envolvidas no ciclo operacional de geração, coleta e tratamento da informação colaborativa no contexto de emergências Figura 6.3. Vocabulário de referência para associação de atributos equivalentes e anotação semântica de publicações coletadas Figura 6.4. Processo [AAV] Associar Atributos ao Vocabulário : os atributos das informações coletadas a partir de diferentes fontes são mapeados e associados com base no vocabulário de referência Figura 6.5. Índice de Correlação: comparação pareada entre publicações armazenadas no repositório de coleta e processamento e a publicação ingressante no processo [EPC] Encontrar Publicações Correlatas Figura 6.6. Representação ilustrativa dos distintos períodos de validade temporal para informações relativas a eventos e entidades Figura 6.7. Anotação semântica da publicação tratada segundo o padrão RDF: informação sobre os atributos temporal, espacial e taxonômico e suas correlações com outras publicações armazenadas no repositório de coleta e processamento Figura 6.8. Exemplo de atributos conflitantes entre publicações que constituem uma história Figura 6.9. Analista de informações analisa o conflito e decide pelo encaminhamento da situação Figura O Conhecimento Combinado que apoia as Equipes de Decisão é uma propriedade emergente da conjugação dos Conhecimentos Pessoal Anterior, Formal Anterior e Contextual Atual. Adaptado de Diniz et al. (2005) Figura Feedbacks propiciam o enriquecimento e a evolução da base de conhecimento a cada novo ciclo de maturação da informação Figura Organicidade Funcional: conjunto de subsistemas com processamentos internos singulares, conectados entre si, formando uma unidade coletiva

13 Figura Multiescalaridade: coleta e tratamento de informação colaborativa para a construção da base de conhecimento contextual atual. Numa escala mais ampla, combinação de diferentes tipos de conhecimentos para a formação do conhecimento combinado Figura 7.1. Interface de gerenciamento de fontes de informações da plataforma experimental SocialCol. Fonte: Plataforma SocialCol Figura 7.2. Parâmetros de configuração de uma fonte de informação e resultado do diagnóstico executado sobre o script de coleta e publicação carregado na plataforma experimental SocialCol. Fonte: Plataforma SocialCol Figura 7.3. Interface da plataforma experimental SocialCol para associação dos atributos de uma fonte de informação com termos do vocabulário de referência. Fonte: Plataforma SocialCol Figura 7.4. Interface para o gerenciamento de classes para o evento experimental Terremoto em Porto Príncipe (Haiti) na plataforma SocialCol. Fonte: Plataforma SocialCol Figura 7.5. Classes atribuídas a uma publicação após o processamento de [CLA] Classificar na plataforma experimental SocialCol. Fonte: Plataforma SocialCol Figura 7.6. Possibilidade de personalizar parâmetros e a equação para o cálculo do Índice de Correlação entre publicações na plataforma experimental SocialCol. Fonte: Plataforma SocialCol Figura 7.7. Exemplo de publicações extraídas da base de dados experimental para o cálculo do Índice de Correlação e decisão quanto ao agrupamento em história na plataforma SocialCol. Fonte: Plataforma SocialCol Figura 7.8. Disposição cronológica das publicações de uma história em forma de Linha do Tempo na plataforma experimental SocialCol. Fonte: Plataforma SocialCol Figura 7.9. Interface para identificação de atributos quantitativos em publicações na plataforma experimental SocialCol. Fonte: Plataforma SocialCol Figura Identificação de conflitos de informações em uma história na plataforma SocialCol. Fonte: Plataforma SocialCol. Fonte: Plataforma SocialCol Figura Interface para a resolução de conflitos supervisionada na plataforma experimental SocialCol. Fonte: Plataforma SocialCol

14 Figura Bases de dados carregadas na plataforma para a experimentação. Fonte: Plataforma SocialCol Figura Amostra da base de informações Ushahidi referente ao terremoto em Porto Príncipe, Haiti (2010) Figura Base de informações cedida pela iniciativa Sahana Foundation referente às solicitações de ajuda enviadas pela população após o terremoto em Porto Príncipe, Haiti (2010) Figura A imagem publicada através da rede social Flickr retrata o resgate de um cidadão debaixo de escombros após terremoto em Porto Príncipe, em janeiro de Fonte: Flickr Figura Registros dos sensores da USGS referente aos sismos ocorridos na região do Haiti entre janeiro e fevereiro de Fonte: USGS Figura Amostra da base de informações recebidas e tratadas pela iniciativa Mission 4636 durante a fase de resposta ao terremoto do Haiti (2010) Figura Relatório de registro de informação coletada a parit de vistorias de campo pela equipe CENACID/UFPR durante atividades de resposta ao terremoto do Haiti (2010) Figura Hospitais do Haiti catalogados pela organização PAHO Figura 8.1. A similaridade entre duas publicações agrupadas numa mesma história pode ser notada a partir da inspeção visual. O resultado atesta a efetividade da heurística elaborada para a arquitetura Figura 8.2. A detecção duplicidade similar evidencia um caso típico ocorrido na rede social Flickr: submissões sucessivas de um único emissor retratam um mesmo evento

15 Lista de Quadros Quadro 1.1. Benefícios e desvantagens de monitoramento voluntário. Adaptado de Gouveia e Fonseca (2008) Quadro 3.1. Quadro quantitativo de referências sobre atributos da qualidade de dados. Adaptado de Amaral (2003) Quadro 4.1. Caracterização de distintas fontes de informação colaborativa segundo aspectos de disponibilidade e estrutura de dados, formatação, frequência de publicação e confiabilidade do emissor Quadro 5.1. Fontes de informação e aspectos relacionados ao tratamento da informação colaborativa abordados pelas principais referências de apoio consultadas Quadro 5.2. Exemplo de mensagens apresentadas em seu texto original (não estruturado) e sua representação estruturada, gerada automaticamente. Adaptado de Purohit et al. (2013) Quadro 6.1. Fontes de informações e suas respectivas referências à documentação API Quadro 6.2. Exemplo de entradas e resultados do processamento de publicações no processo [CFD] Compatibilizar Formato de Data Quadro 6.3. Definições das propriedades dos Sistemas Complexos e suas respectivas associações com os elementos da arquitetura de solução e o ambiente de emergência

16 Lista de Gráficos Gráfico 6.1. Comportamento da distribuição do Índice de Correlação Espacial (C esp ) segundo diferentes formulações Gráfico 7.1. Distribuição da quantidade de publicações associadas às classes do evento após o processamento de [CLA] Classificar na experimentação. Fonte: Plataforma SocialCol Gráfico 7.2. Distribuição da quantidade de pares de publicações correlacionadas agrupadas por intervalos de valores do Índice de Correlação, após o processamento de [EPC] Encontrar Publicações Correlatas na experimentação. Fonte: Plataforma SocialCol Gráfico 7.3. Resultado processamento de [AGR] Agrupar em Histórias na experimentação: quantidade de histórias formadas e sua distribuição em função da média do Índice de Correlação entre as publicações que compõem cada história. Fonte: Plataforma SocialCol Gráfico 7.4. Participação das fontes de informações em histórias. Fonte: Plataforma SocialCol Gráfico 7.5. Tempo de processamento de uma publicação para cada etapa de tratamento estabelecida na arquitetura de solução. Fonte: Plataforma SocialCol Gráfico 7.6. Tempo total, em minutos, para o processamento da base de dados experimental segmentado pelos processos da arquitetura. Fonte: Plataforma SocialCol

17 Lista de Siglas 3G 4G API CAS CENACID CSCW CSCWD DARPA DCMI DDD ETL GPS GPRS HTML IP LAGEOP LBS LOD LOV MOAC NLP ONG ONU OCHA Terceira Geração Quarta Geração Application Programming Interface Complex Adaptive System Centro de Apoio Científico em Desastres Computer Supported Cooperative Work Conference on Computer Supported Cooperative Work in Design Defense Advanced Research Projects Agency Dublin Core Metadata Initiative Discagem Direta a Distância Extract, Transform, Load Global Position System General Packet Radio Service HyperText Markup Language Internet Protocol Laboratório de Geoprocessamento Location Based Services Linked Open Data Linked Open Vocabularies Management of a Crisis Natural Language Processing Organização Não Governamental Organização das Nações Unidas Office for the Coordination of Humanitarian Affair

18 PHP REST RDF SIG SIM SIOC SMS SMOB UFRJ UFPR UNDAC URL USGS VICON W3C XML Personal Home Page Representational State Transfer Resource Description Framework Sistema de Informação Geográfica Subscriber Identity Module Semantically-Interlinked Online Communities Short Message Service Semantic MicroBlogging Universidade Federal do Rio de Janeiro Universidade Federal do Paraná United Nations Disaster Assessment & Coordination Uniform Resource Locator United States Geological Survey Vigilância e Controle World Wide Web Consortium extensible Markup Language Siglas dos Componentes da Arquitetura de Solução [COMU] [COL] [FED] [PREP] [AAV] [VTF] [CFD] [CFC] Fase de Comunicação Coletar Publicações Requisitar Feedback Fase de Pré-Processamento Associar Atributos ao Vocabulário Verificar e Tratar Feedback Compatibilizar Formato de Data Compatibilizar Formato de Coordenadas

19 [VID] [CLA] [HIST] [EPC] [AGR] [CONF] [ICO] [RCO] [RCOL] [MIAQ] [MTRA] [MGEO] [MCFD] Verificar Idioma Classificar Fase de Histórias Encontrar Publicações Correlatas Agrupar em Histórias Fase de Conflitos Identificar Conflitos em História Resolver Conflito Fase de Revisão Colaborativa Identificar Atributos Quantitativos (Colaboradores) Traduzir (Colaboradores) Geolocalizar (Colaboradores) Compatibilizar Formato de Data (Colaboradores)

20 20 Sumário 1 Introdução As Fases de um Evento Emergencial Tipos de Conhecimentos que Apoiam a Fase de Resposta de uma Emergência Conhecimento Pessoal Anterior Conhecimento Formal Anterior Conhecimento Contextual Atual Motivação Apresentação do Problema Hipótese Objetivos Geral Específicos Metodologia Contribuições da Tese Organização do Trabalho A Computação Móvel e Ubíqua Promovendo a Colaboração Social Colaboração nas Redes Sociais Colaboração nas Mídias Oficiais Colaboração Social na Resposta a Desastres Naturais Considerações Complementares Sistemas Complexos Propriedades dos Sistemas Complexos e a Colaboração Social no Ambiente de Emergências Unidade Coletiva Propriedades Emergentes Adaptabilidade Multi-escalas Feedback Imprevisibilidade... 58

21 Heterogeneidade Complexidade e a Qualidade da Informação em Situações de Emergência Relato Pessoal de uma Lição na Primeira Missão de Resposta a Emergência A Complexidade na Avaliação da Qualidade da Informação Considerações Complementares Fontes de Informações no Apoio à Emergência: Capacidades e Limitações Disponibilidade de Dados Nível de Estruturação dos Dados Extração da Localização e Georreferenciamento Limite de Caracteres e Apresentação do Conteúdo Informação Complementar (Arquivos e Conteúdo Multimídia) Frequência de Colaboração Comunicação Confiabilidade da Fonte Considerações Complementares Trabalhos Relacionados Quadro Síntese da Pesquisa ao Estado da Arte Escopo, Desafios, Resultados e Conclusões das Obras Pesquisadas Descrição da Arquitetura de Solução Ambiente Externo Agentes Colaboradores Fontes de Informação Colaborativa Ambiente Interno [COMU] Fase de Comunicação [COL] Coletar Publicações [FED] Requisitar Feedback [PREP] Fase de Pré-Processamento [AAV] Associar Atributos ao Vocabulário [VTF] Verificar e Tratar Feedback [CFD] Compatibilizar Formato de Data

22 [CFC] Compatibilizar Formato de Coordenadas [VID] Verificar Idioma [CLA] Classificar [HIST] Histórias [EPC] Encontrar Publicações Correlatas [AGR] Agrupar em Histórias [CONF] Conflitos [ICO] Identificar Conflitos em História [RCO] Resolver Conflito [RCOL] Revisão Colaborativa Estrutura de Armazenamento e Recuperação Aspectos da Complexidade Relacionados à Arquitetura Propriedades Emergentes e Feedbacks Organicidade Funcional e Multiescalaridade Adaptabilidade e Heterogeneidade Multi-escalas Aplicação Experimental Protótipo Experimental da Arquitetura Interface para o Gerenciamento de Fontes de Informações Associação de Atributos das Fontes de Informações com o Vocabulário de Referência Gerenciamento dos Grupos Classificatórios para o Processo [CLA] Classificar Configuração do Índice de Correlação para o Agrupamento no Processo [HIST] Histórias Valoração de Atributos Quantitativos em Publicações Identificação Histórias e Tratamento de Conflitos Bases de Dados Adquiridas para a Experimentação Ushahidi SMS Sahana SMS e Rede Social Twitter

23 Flickr Redes Sociais United States Geological Survey (USGS) Sensores Sismógrafos Mission SMS CENACID/UFPR - Vistorias de Equipes de Campo PAHO Catálogo Oficial das Unidades de Saúde no Haiti Resultados da Experimentação Resultados do Processamento [CFD] Compatibilizar Formato de Data Resultados do Processamento [CFC] Compatibilizar Formato de Coordenadas Resultados do Processamento [CLA] Classificar Resultados do Processamento [EPC] Encontrar Publicações Correlatas Resultados do Processamento [AGR] Agrupar em Histórias Tempo de Processamento e Escalabilidade da Plataforma Experimental Propostas de Encaminhamento e Conclusões Conclusões Propostas de Encaminhamento Referências Bibliográficas Apêndices Apêndice A Requisitos básicos para a elaboração de bibliotecas de comunicação para as fontes de informações colaborativas Apêndice B Exemplo de código PHP do script para coleta de publicações da rede social Facebook através do processo [COL] Coletar Publicações Apêndice C Vocabulário de referência organizado para a associação de atributos comuns e anotação das publicações tratadas Apêndice D Especificação da Ontologia SocialCol para Anotação de Publicações Correlatas 190 Apêndice E Histórico de contatos por para a solicitação das bases de dados. 191 Apêndice F Diagrama Entidade-Relacionamento (DER) do repositório de coleta e processamento da plataforma experimental SocialCol

24 24 1 Introdução 1.1 As Fases de um Evento Emergencial De acordo com Diniz et al. (2005), um evento emergencial pode ser cronologicamente dividido em três fases: prevenção, resposta e investigação. Durante a primeira fase são elaboradas as medidas preventivas e os planos de mitigação. A fase de resposta se inicia quando um incidente anormal é comunicado. Esta fase compreende ações voltadas para reduzir os efeitos negativos da situação de emergência, nomeadamente a perda de vidas e propriedades. Finalmente, a investigação tem início no primeiro momento da emergência, mas dura até que as causas da emergência e seus efeitos sejam identificados. Outras classificações (LINDEL et al., 2006; OCHA, 2012; DRANSCH et al., 2013) incluem mais duas fases: preparação e recuperação. Na primeira, um plano de ação é projetado tendo em vista uma situação de emergência estar prevista para acontecer em um futuro próximo. Este é o caso, por exemplo, de furacões que se deslocam em direção a uma região. A recuperação é a fase durante a qual as medidas são adotadas para trazer a situação de volta ao normal, quando a emergência não mais existe. A Figura 1.1 ilustra a ordem sequencial das diferentes fases de um evento emergencial e a divisão setorial adotada pela UNDAC 1 (em inglês, United Nations Disaster Assessment and Coordination), a equipe de campo do escritório OCHA (Office for the Coordination of Humanitarian Affair), formada por um corpo multidisciplinar de especialistas voluntários treinados para atuar em missões internacionais de resposta rápida a desastres. 1 UNDAC -

25 25 Figura 1.1. Sequência das diferentes fases de um evento emergencial e a divisão setorial dos grupos de trabalho da equipe UNDAC durante respostas a desastres. Adaptado de OCHA (2012) 1.2 Tipos de Conhecimentos que Apoiam a Fase de Resposta de uma Emergência Uma atividade de resposta à emergência envolve equipes de diferentes estruturas organizacionais (ONGs, agências de governo, grupos de voluntários, etc.) e níveis de atuação (local, estadual, nacional, internacional) que buscam trabalhar de forma cooperativa e integrada, com o objetivo de salvar vidas e propriedades. Estas equipes devem ser coordenadas por indivíduos experientes, munidos de informações relevantes e de boa qualidade (atual, proveniente de fontes confiáveis, completa, sem incongruências), capazes de gerenciar seus recursos disponíveis (pessoal, equipamentos, verbas), e responsáveis por tomar um elevado número de decisões premidas por um constante clima de tensão e urgência. Em ambientes de emergência a informação exerce um papel fundamental na coordenação e na tomada de decisão sobre como os recursos nacionais e internacionais serão mobilizados durante a fase de resposta. Sobretudo, a informação é essencial para a prestação de assistência rápida e eficaz aos cidadãos envolvidos na crise, capacitando organizações a ganhar (ou perder) visibilidade e credibilidade. É também essencial para a pós-ação, análise, avaliação e reflexão acerca das lições aprendidas com o evento. Segundo Cordeiro et al. (2011), algumas informações seguem um perfil mais estático, porém um alto fluxo de informações pode também dinamicamente surgir e, se

26 26 transformar ao longo da evolução da situação. A necessidade de um uso combinado de informações provenientes de fontes heterogêneas torna sua gerência uma tarefa complexa, particularmente durante a fase de resposta, quando a pressão do tempo e a sobrecarga de dados ocorrem constantemente. Diniz et al. (2005) introduziram o mapa conceitual ilustrado na Figura 1.2, que organiza três tipos de conhecimento que a equipe de comando, designada para gerenciar uma emergência, aplica para a tomada de decisões e o direcionamento das operações das equipes de campo: o conhecimento prévio (pessoal e formal) e o conhecimento contextual atual. Figura 1.2. Mapa conceitual dos tipos de conhecimentos que apoiam a fase de resposta de uma emergência. Adaptado de Diniz et al. (2005) Conhecimento Pessoal Anterior O conhecimento pessoal anterior é o conhecimento que um indivíduo desenvolve ao longo do tempo, por meio da experiência adquirida em suas atividades anteriores, agregado à sua formação profissional. Também é denominado de conhecimento tácito (NONAKA; TAKEUCHI, 2007), isto é, aquele apreendido ao longo da vida e, encontra-se somente na mente do indivíduo, geralmente difícil de ser formalizado ou explicitado, difícil de ser expresso por palavras, pois é subjetivo e inerente às habilidades e experiência de cada um. Por exemplo, no contexto de situações de emergência, as equipes de comando são constituídas por profissionais experientes, detentores de um extenso histórico de participações em respostas a emergências e treinamentos em simulações do gênero, o que ajudou a formar e enriquecer seu conhecimento tácito relativo ao tema. Estes agentes detêm o conhecimento e o controle do processo de emergência por inteiro.

27 Conhecimento Formal Anterior O conhecimento formal anterior é constituído por informações originadas de órgãos oficiais e fontes de alta credibilidade, não necessariamente projetadas para uso de emergência. Geralmente se refere a informações específicas sobre localidades, pessoas ou recursos, consideradas úteis para o comando de tomada de decisão. Dados como mapas rodoviários, localização de equipamentos públicos, capacidade e especialidades de hospitais, plantas de construção e fornecimento de água podem ser relevantes para avaliar a situação de emergência. Entretanto, um aspecto crítico para a manutenção da base de conhecimento formal anterior é a típica falta de padronização das distintas fontes de origem que a alimentam. Segundo (CORDEIRO, 2015), a heterogeneidade de formatos e padrões de representação de dados criam dificuldades na interpretação, na integração, no partilhar da informação, bem como em sua atualização Conhecimento Contextual Atual O conhecimento contextual atual se refere à informação gerada durante o processo de evolução da resposta à emergência, proveniente de avaliações da situação corrente, realizadas geralmente por agentes de campo. Quando esta informação é combinada com o conhecimento prévio, constrói o que é chamado de conhecimento combinado (Figura 1.2), o que auxilia o comando no processo de tomada de decisão. Grande parte das decisões dos coordenadores é apoiada pelo ganho de conhecimento contextual, ou seja, aquele que se obtém ao longo da evolução da resposta, a partir das novas informações adquiridas pelas equipes diretamente envolvidas na ação de emergência. Informações sobre vítimas, perdas, danos e as ordens emitidas pelo comando e seus efeitos são exemplos do conhecimento contextual atual. Ao contrário dos demais tipos de conhecimentos apresentados, o conhecimento contextual atual caracteriza-se por um elevado grau de dinamismo. As ações de resposta tomadas em prol do reestabelecimento da normalidade promovem contínuas alterações sobre ambiente e, consequentemente, sobre o dado ambiental, tornando-o desatualizado rapidamente (como é o caso do número de leitos disponíveis em um hospital). Mesmo quando coligido por agentes confiáveis munidos de equipamentos precisos, é importante considerar que em poucos instantes, este dado pode já não ser mais ser válido para consumo.

28 28 Desta forma, torna-se fundamental elaborar mecanismos que viabilizem o monitoramento e o controle temporal de um dado, levando em consideração a sua natureza e as características da fonte de informação que o originou. A composição da base de conhecimento contextual atual pode ainda ser enriquecida com informações fornecidas por cidadãos envolvidos na emergência, ou seja, a partir da colaboração social. Entretanto, a agregação de colaborações provenientes de fontes não oficiais (cidadãos) requer a aplicação de mecanismos sinalizadores e verificadores da procedência e confiabilidade da informação recebida. Tais medidas são essenciais de modo a evitar que possíveis interesses sociais possam distorcer o cenário real, e induzir o comando a tomar decisões parciais e tendenciosas na condução da resposta. 1.3 Motivação No passado a escassez de dados e a limitação da acessibilidade e comunicação representavam algumas das principais barreiras enfrentadas por gestores públicos no processo de tomada de decisão. Em um estado de emergência a situação se agrava ainda mais, quando a infraestrutura que viabiliza o acesso e trânsito de informação (redes elétrica e de telecomunicações) e pessoas (caminhos, rodovias, pontes) é comumente interrompida por eventos decorrentes dos fenômenos desastrosos. A Figura 1.3 ilustra um cenário clássico de resposta a uma situação de emergência, destacando a presença de agentes, infraestrutura e os tipos de conhecimentos (introduzidos na seção 1.2) que apoiam a fase de resposta. Figura 1.3. Cenário clássico de resposta a emergências: dificuldades de acesso, comunicação e aquisição de informação A equipe de decisão assume o papel de coordenação da resposta, de onde partem as demandas para as atividades das equipes de campo, baseadas:

29 29 na conjugação de planos de ação e dados prévios (mapeamentos, relatórios, etc.), que constituem o conhecimento formal anterior ; no conhecimento tácito, isto é, o conhecimento pessoal anterior de cada membro da equipe, adquirido ao longo do tempo, através de participações em atividades dentro de circunstâncias semelhantes; nas atividades das equipes de campo, que enriquecem a base do conhecimento contextual atual gerando informações dinâmicas acerca das transformações causadas pela situação de emergência e também da evolução da resposta. Contudo, diante deste cenário, alguns obstáculos podem impedir o fluxo eficiente da informação como, por exemplo, uma interrupção da infraestrutura de comunicação e circulação de pessoas. Consequentemente, o enriquecimento da base de conhecimento contextual atual é quantitativa e qualitativamente prejudicado, uma vez que o tempo de ação da resposta é completamente dependente desta infraestrutura, tanto para acesso da equipe quanto para o tráfego da informação gerada. Hoje a situação se inverte, quando o desafio está em gerenciar um excesso de dados altamente dinâmicos e provenientes de fontes cada vez mais diversificadas: sensores remotos ambientais, redes sociais, equipes de resposta, imagens de satélite, mídia, etc.. Apesar da coleta de dados representar uma etapa indispensável para a compreensão do ambiente de emergência, as abordagens científicas, que outrora focavam sobre esta etapa, hoje experimentam melhores métodos para processar os dados coletados, e distinguir o que pode ser útil ao gestor da emergência em cada momento da fase de resposta. Segundo Xavier-da-Silva (2009), o desafio está em transformar um grande volume de dados 2, que representam registros de ocorrências, ora desorganizados, não estruturados e incompletos, em informações úteis à decisão, o que representa o ganho de conhecimento. 2 Segundo Miranda (1999, p.285), os dados representam um conjunto de registros qualitativos ou quantitativos conhecidos que, organizado, agrupado, categorizado e padronizado adequadamente, transforma-se em informação, isto é, um conjunto de dados organizados de modo significativo, sendo subsídio útil à tomada de decisão.

30 30 Figura 1.4. Agentes de aquisição de dados ambientais e meios de comunicação hoje disponíveis no apoio a construção do conhecimento contextual atual A Figura 1.4 ilustra novamente um cenário de resposta a situações de emergência, desta vez considerando alguns exemplos dos novos meios de comunicação hoje disponíveis e também destacando a presença de novos agentes de aquisição de dados ambientais: Humanos: representados pelas equipes de campo, devidamente treinadas para atuarem oficialmente na resposta da emergência. Além disso, os próprios cidadãos tendem a colaborar no enfrentamento de situações adversas à normalidade de sua comunidade. Hoje sua colaboração é facilitada pelos inúmeros recursos de comunicação, cada vez mais sofisticados, práticos, onipresentes e, que requerem baixo custo de aquisição e operação; Automatizados: representados por equipamentos eletrônicos que auxiliam o monitoramento e aquisição de dados ambientais, como sirenes de alertas, câmeras, sensores remotos, satélites, hoje com custos de aquisição, implantação e operacionalização cada vez mais reduzidos. O monitoramento automatizado também reduz a margem de erro das aferições, dispensa gastos com treinamento, mobilização de pessoal e políticas de incentivo e recompensa ao trabalho realizado, além da capacidade de monitorar locais inabitáveis, como áreas de altitudes ou temperaturas extremas e alta radioatividade. Apesar dos benefícios obtidos pela adoção dos agentes automatizados, como a capacidade de gerar e processar grandes volumes de dados de forma ágil, os computadores operam de forma restrita somente ao que foram programados, ideais para tarefas repetitivas e ininterruptas.

31 31 O recurso humano, por sua vez, apesar de sua limitação física, dispõe da capacidade de interagir com o ambiente devido a sua habilidade de raciocínio lógico. Sendo assim, o recurso humano é capaz, especialmente em ambientes de alto dinamismo e imprevisibilidade (como o caracterizado pelas emergências), de perceber uma determinada situação, avaliar, elaborar alternativas de ação, decidir, agir e analisar os efeitos de sua ação. De forma recursiva, pode iniciar uma nova iteração, levando em conta a evolução da situação provocada pelos efeitos de suas ações anteriores. Desta maneira, considerando as vantagens e limitações relativas a cada tipo de agente, conclui-se que ambos podem produzir resultados mais efetivos quando operam de forma combinada e complementar. Com relação aos novos meios de comunicação representados na Figura 1.4, as oportunidades de colaborar são ampliadas pela Computação Móvel e Ubíqua 3. Equipamentos portáteis, telefonia celular, redes sem fio e objetos inteligentes expandem os limites dos locais e dos momentos nos quais um indivíduo pode exercer colaboração, pois possibilitam o uso de informações de sua localização e tornam os ambientes cada vez mais interativos, modificando sua relação com o espaço urbano e abrindo espaço para a oferta de serviços colaborativos inovadores (FILIPPO et al., 2011). No segmento das redes sociais, a tecnologia aliada à popularização cada vez maior de dispositivos móveis e pesados investimentos em infraestrutura e middleware 4, abrem as portas para um enorme volume de informações, agora, submetidas a partir de qualquer localidade geográfica. As redes sociais, dentre outros inúmeros meios de comunicação, podem então ser aproveitadas como verdadeiros instrumentos de colaboração entre cidadãos de uma comunidade afetada por eventos emergenciais (DAVID; MACIEL, 2011). Gouveia e Fonseca (2008) descrevem alguns benefícios e desvantagens decorrentes do monitoramento ambiental baseado no apoio voluntário, conforme o Quadro Segundo Weiser (1991), a Computação Ubíqua é a terceira era da computação: após a era da computação de grande porte (vários usuários compartilham um computador) e a era dos computadores pessoais (cada usuário usa seu próprio computador), a era da Computação Ubíqua é a dos dispositivos de tamanho reduzido (cada usuário usa vários dispositivos). 4 No contexto de desenvolvimento e execução de sistemas colaborativos, middleware é um software para facilitar o desenvolvimento e execução de sistemas distribuídos. Consiste numa infraestrutura para dar suporte a diversas características desejáveis para a implementação dos sistemas colaborativos: interoperabilidade, integração, portabilidade, escalabilidade e suporte a diferentes modos de colaboração.

32 32 Quadro 1.1. Benefícios e desvantagens de monitoramento voluntário. Adaptado de Gouveia e Fonseca (2008) Aspecto Benefícios Desvantagens Dado Enriquecimento da base de informações contextual. Logística A participação de voluntários pode reduzir significativamente os custos operacionais para a geração de dados ambientais. Impactos Sociais Aumento da abrangência geográfica e o período de tempo de monitoramento. Público mais informado e educado sobre problemas ambientais e métodos científicos. Monitoramento voluntário promove a cooperação e integração comunitária ao invés de sua partição. Carência de credibilidade dos dados. Metadados são escassos. Baixo grau de estruturação. Devido à falta de conhecimento específico e treinamento a informação geográfica não é sempre compatível aos dados recolhidos por outros. A participação pública pode exigir formação anterior e também demanda alocação de pessoal para a supervisão do trabalho voluntário (organização, validação, distribuição de demandas). Requer a organização de materiais de treinamento. Nível imprevisível de comprometimento voluntário. O princípio NIMBY 5 (em português, não em meu quintal ) pode afetar a participação do cidadão, distorcendo, em alguns casos, as metas da iniciativa voluntária. 1.4 Apresentação do Problema É evidente que o aumento das possibilidades e circunstâncias de geração de informações ambientais pode trazer muitos ganhos, como a economia de recursos, ampliação da capacidade de monitoramento e, consequentemente, o enriquecimento da base de conhecimento. Entretanto, é necessário controlar e organizar este novo vasto e heterogêneo volume de dados. Deve-se, por exemplo, avaliar o conjunto de dados disponíveis em cada uma das 5 NIMBY é um acrônimo inglês (de Not In My Back Yard, que significa "não em meu quintal", em português) é uma expressão usada por urbanistas e profissionais da área norte-americanos, para descrever a oposição a certos projetos polêmicos ou que possam ser prejudiciais ao entorno (como construção ou expansão de estruturas ou zonas tais como aeroportos, uma estrada movimentada, um grande centro comercial ou um aterro sanitário).

33 33 fontes de dados utilizadas, ou seja, compreender seus metadados 6. É preciso identificar, por exemplo, para cada fonte, quem, onde, quando, em que situação o dado foi originado e, principalmente, apresentar na forma mais clara e organizada possível para que quem o consuma disponha de melhores condições para determinar se este é ou não útil, e a colaboração seja de fato efetiva para sua tomada de decisão. Por exemplo, a identificação da procedência da informação colaborativa 7 (tipo de fonte de comunicação, identificação e meios de contato com o responsável pela informação) é imprescindível. Ainda que não se julgue sua qualidade ou sua utilidade, é preciso sinalizar e diferenciar o que é uma informação oficial (originados por agentes oficialmente envolvidos na resposta) do que não é. Muitas vezes, por mais que se preste a colaborar com a resposta à emergência por boa fé, um cidadão pode envolver seus sentimentos e interesses pessoais a fim de ser prioritariamente atendido, mesmo que seu apelo não seja a prioridade dentre muitas outras que possam existir. Este indivíduo está limitado apenas ao conhecimento de seus problemas, enquanto a equipe de comando possui uma visão holística do cenário de emergência, além de agir com imparcialidade e dispor de uma gama maior de informações, sendo, portanto, capaz decidir melhor a reais prioridades de atendimento. Esta imprevisibilidade devido à atuação de cidadãos como colaboradores pode comprometer a eficácia do apoio à resposta. Trata-se de uma típica característica de um sistema complexo (MITCHELL, 2009) e que deve ser considerada e modelada em uma solução que se propõe a apoiar a tomada de decisão baseada em informações colaborativas. Sob o ponto de vista tecnológico, distintas fontes de informações implicam em um elevado grau de heterogeneidade envolvendo distintos conjuntos de dados e protocolos de transmissão (BENBYA; MCKELVEY, 2006). É necessário compreender a forma de operação de cada uma dessas fontes e criar um protocolo comum de captura e organização dos dados, além de ser capaz de se adaptar (outra propriedade dos sistemas complexos) ao provável futuro surgimento de novas tecnologias. É preciso analisar em cada informação coletada, por exemplo, se a gama de dados disponível é suficientemente completa e clara para seu processamento e também para o 6 Metadado - dados que descrevem os dados, ou seja, são informações úteis para identificar, localizar, compreender e gerenciar os dados. Quando documentamos os metadados e os disponibilizamos, estamos enriquecendo a semântica do dado produzido, agregando seu significado real, e dando suporte à atividade de administração de dados executada pelo produtor desse dado. 7 A informação colaborativa é aquela gerada a partir da colaboração social.

34 34 consumo. No caso de insuficiência de dados, é necessário promover mecanismos para requisitá-los de modo a viabilizar o prosseguimento da triagem na cadeia de tratamento e evitar seu descarte de forma prematura. Os exemplos a seguir ilustram situações críticas e requisitos classicamente encontrados no cenário estabelecido, e devem ser abordados e devidamente encaminhados na proposição da solução: Como quantificar um dado qualitativo? Exemplo: muitos feridos equivale a quanto numericamente? Como lidar com a incompatibilidade de formatos de dados semanticamente equivalentes, gerados por duas fontes distintas? Exemplo 1: Facebook.created_time = T16:49: X Flickr.datetaken = :49:11 Exemplo 2: Twitter.coords.latitude = X USGS.lat = -23º 30 23,234 Como será identificada e tratada a incompletude de dados? Como identificar e tratar dados conflitantes? Exemplo: 10 pessoas feridas vs poucos feridos vs 20 feridos Trata-se de dados conflitantes ou apenas uma evolução do cenário? Como identificar e agrupar informações correlacionadas? Questões deste gênero precisam ser levantadas e investigadas. Suas soluções devem ser propostas ou encaminhadas, sendo flexíveis e adaptáveis à agregação de novas fontes de informações que poderão surgir e se popularizar futuramente. 1.5 Hipótese Mecanismos de coleta e tratamento de informações devem ser capazes de lidar com a imprevisibilidade e o dinamismo característicos da complexidade que envolve a colaboração em situações de emergência. Além disso, tais mecanismos devem ser flexíveis de modo a atender aos requisitos decorrentes da heterogeneidade quanto aos tipos de fontes e seus distintos conjuntos e

35 35 formatos de representação dos dados. Devem ainda ser capazes de se adaptar à eventual agregação de novas fontes de informações ao sistema. O estabelecimento de associações entre informações correlatas pode corroborar e expandir o conhecimento sobre determinadas investigações. Entretanto, tais associações podem também evidenciar conflitos, sendo necessário criar mecanismos para detectá-los e resolvê-los. As situações problemáticas ilustradas através dos exemplos no final da seção anterior estão diretamente relacionadas com atributos da qualidade da informação, como a completude, atualidade, compatibilidade e clareza, conforme enumerados por Amaral (2003) na seção 3.2. Desta forma, presume-se que a construção de uma abordagem de solução que atue na resolução destes problemas, consequentemente implicará na melhoria da qualidade da informação coletada. 1.6 Objetivos Geral Este trabalho tem por objetivo desenvolver uma arquitetura de coleta e tratamento de informações colaborativas, originadas a partir de fontes heterogêneas. A arquitetura considera os aspectos da complexidade do ambiente de emergência e busca o enriquecimento da base de conhecimento contextual atual dos gestores da resposta à crise Específicos Fase de Concepção Identificação dos aspectos da complexidade associados à geração e consumo de informações para apoio à decisão em ambientes de emergência; Diagnóstico das características e limitações inerentes a distintas fontes de informações, considerando o nível de estruturação, a disponibilidade de dados, formatos de apresentação do conteúdo, a frequência da geração de conteúdo e o nível de confiabilidade; Organização de um vocabulário de referência para estabelecer a associação entre atributos semanticamente equivalentes, entre os diferentes conjuntos e terminologias de metadados disponibilizados por cada fonte de informação incorporada ao sistema;

36 36 Concepção de uma arquitetura que opera sobre a captura e tratamento de informações, considerando os aspectos da complexidade que atuam sobre os agentes e processos envolvidos. Fase de Prototipação Elaboração de um protótipo experimental desenvolvido a partir do modelo conceitual da arquitetura, atendendo aos seguintes requisitos: o Elaborar um mecanismo de coleta de dados flexível à heterogeneidade das fontes de informações colaborativas e adaptável à agregação de novas fontes; o Mapear atributos semanticamente equivalentes e uniformizar os formatos de representação das distintas estruturas de dados agregadas ao sistema; o Estabelecer associações entre informações correlacionadas; o Detectar e sinalizar informações incompletas e inconsistentes; o Prover mecanismos de retroalimentação do sistema por meio de requisições de feedbacks em busca de complementariedade, confirmação ou desambiguações de informações inconsistentes. Fase de Experimentação Pesquisa e aquisição de bases reais de informações relativas a eventos de emergência ocorridos anteriormente; Processamento da base de dados experimental sobre o protótipo elaborado; Apresentação dos resultados da experimentação, verificação da efetividade dos processos intermediários, dos agrupamentos finais estabelecidos e da detecção e sinalização de eventuais conflitos; Conclusões e encaminhamento de propostas futuras. 1.7 Metodologia A pesquisa se deflagra pela percepção de um potencial enriquecimento do conhecimento contextual atual das equipes de comando a partir de uma vasta gama de informações relevantes ao contexto, hoje existentes, porém dispersas e não estruturadas, especialmente diante de um cenário caótico, em constante transformação, onde a grande demanda por decisões é pressionada por um curto espaço de tempo.

37 37 O primeiro passo é a elaboração de uma hipótese quando, a partir da identificação de uma oportunidade de melhoria, torna-se necessário elevar o grau de abstração do problema a fim de compreender holisticamente os fenômenos e identificar os elementos da complexidade e requisitos envolvidos no ambiente da investigação. Esta base inicial é suficiente para compreender a problemática como um todo e iniciar um processo de generalização e abstração do problema e do ambiente no qual ele se insere. A partir daí são elencados os principais elementos e suas interações, apontando cada aspecto da complexidade identificado (adaptação, imprevisibilidade, dinamismo, heterogeneidade, tecido em conjunto, feedback, imprecisão). Ao se debruçar nas teorias dos sistemas complexos, investigam-se meios para lidar com estes aspectos, uma vez que diversas correntes filosóficas e sociais que abordam os aspectos da complexidade (MORIN, 2007; MITCHELL, 2009; BARRÁT et al., 2009; MARIOTTI, 2010) afirmam não ser possível eliminá-las ou controlá-las, mas sim compreendê-las. Uma pesquisa referente ao estado da arte em busca de métodos e abordagens correlatas já consolidadas na literatura buscará abordagens que possam apoiar a resolução dos requisitos levantados na proposta de solução. Como etapa conclusiva, a abordagem de solução será experimentada por meio da elaboração de um protótipo que processará um conjunto de bases de informações heterogêneas, originadas durante uma situação real de emergência. Finalmente, conclusões serão tecidas acerca da concepção da solução, sua implementação e dos resultados da experimentação prática. Como parte de um processo evolutivo do trabalho, sugestões de melhorias e dificuldades ora não superadas serão documentados para fins de prosseguimento da pesquisa e aprimoramento dos resultados. 1.8 Contribuições da Tese A tese busca contribuir com a concepção de uma arquitetura que considera os aspectos da complexidade em ambientes de emergência, e apoiará o enriquecimento do conhecimento contextual atual através do tratamento integrado de informações colaborativas originadas a partir de fontes heterogêneas. Independentemente de sua procedência, para cada informação coletada, a proposta de solução criará uma heurística que quantifique o seu grau de correlação em relação a todas as

38 38 demais informações anteriormente capturadas. Desta forma será possível evidenciar histórias dentro do evento emergencial monitorado, ou seja, congregar subconjuntos de informações que se referem a um evento comum. Como ganho, tais agrupamentos elevam a gama de informações (e informantes) relativas àquela história, aumentam a possibilidade de compreender e resolver eventuais problemas de incompletude ou incongruência identificados dentro de um mesmo agrupamento, além de ampliar a compreensão do comportamento evolutivo daquela história ao longo do tempo. A solução será flexível à adaptação de novas fontes de informações que porventura poderão ser agregadas ao sistema. Além disso, deverá propor mecanismos de retroalimentação do sistema, com o objetivo de buscar complementações a eventuais informações incompletas, conflitantes e/ou passíveis de verificação. 1.9 Organização do Trabalho Este trabalho está organizado da seguinte forma: O Capítulo 2 aponta os principais fatores contribuintes para o aumento massivo do volume de informações disponíveis para o consumo. O capítulo também apresenta exemplos reais de cenários onde a geração da informação por meio da colaboração social pode trazer benefícios para ambas as partes envolvidas, principalmente em situações de emergências. O Capítulo 3 dedica-se exclusivamente à apresentação de conceitos e propriedades dos sistemas complexos, bem como as suas respectivas associações com a colaboração social, especialmente em ambientes perturbados por eventos de caráter emergencial. O capítulo ainda promove uma discussão relacionada aos aspectos da complexidade e os atributos da qualidade da informação quando inseridos ao contexto de emergências. O Capítulo 4 promove um diagnóstico comparativo entre diferentes tipos de fontes de informações colaborativas, elencando as capacidades e limitações relativas às suas distintas formas de estruturação, apresentação, disponibilidade e confiabilidade dos dados. O Capítulo 5 descreve o levantamento dos principais trabalhos consultados durante a etapa de pesquisa do estado da arte. O capítulo relata esforços correntes, metas alcançadas e desafios ainda abertos em propostas com objetivos semelhantes ao desta pesquisa. A consulta também busca levantar conceitos, métodos e técnicas abordados segundo distintos

39 39 autores, e que poderão ser aproveitados na etapa de elaboração dos procedimentos envolvidos na construção da arquitetura proposta por este trabalho. O Capítulo 6 apresenta a concepção da arquitetura proposta para a abordagem solução do problema, descrevendo detalhadamente o papel de cada um de seus elementos constituintes. O capítulo também tece associações entre os elementos da arquitetura e propriedades dos sistemas complexos. O Capítulo 7 documenta a experimentação da arquitetura de solução proposta. A primeira seção do capítulo apresenta a plataforma experimental codificada com base na concepção da arquitetura especificada no capítulo anterior. A segunda seção descreve a origem e a estrutura de composição das bases de dados adquiridas para a experimentação. Na sequência, o capítulo apresenta os resultados da experimentação das bases de dados adquiridas, sobre a plataforma experimental codificada. Finalmente, as conclusões, as dificuldades enfrentadas, os requisitos não solucionados e as propostas de melhorias da arquitetura são apresentados no Capítulo 8. A penúltima seção deste documento reserva-se ao material de referência bibliográfica, consultado durante as fases de desenvolvimento desta pesquisa. A última seção apresenta os apêndices contendo informações complementares relativas ao desenvolvimento da pesquisa, e o detalhamento sobre métodos e algoritmos aplicados na elaboração da experimentação.

40 40 2 A Computação Móvel e Ubíqua Promovendo a Colaboração Social O advento de novas tecnologias de informação e comunicação, aliado à popularização de dispositivos móveis criam oportunidades para o aumento da geração de informação contextual originada através da participação social, especialmente quando indivíduos testemunham problemas em sua comunidade. As redes sociais cada vez mais se multiplicam e se reinventam. As interconexões estabelecidas entre seus usuários proporcionam um alto poder de disseminação da informação que circula por estas redes. Do ponto de vista tecnológico e comercial, dois fatores contribuem fundamentalmente para este crescimento: 1) A evolução das telecomunicações a partir da ampliação da capacidade de tráfego de dados de alta velocidade em redes de telecomunicações sem fio (3G e 4G). Empresas de telecomunicações investem cada vez mais em infraestrutura de tráfego de dados sem fio, por oferecer maior custo-benefício em relação à rede cabeada. Diferentemente da rede móvel (sem fio), a rede cabeada demanda um alto custo de manutenção, devido à necessidade frequente de reposição de fios, postes e equipamentos nas centrais telefônicas. Muitos desses circuitos são ainda analógicos e por isso, cada vez mais difíceis de serem encontrados no mercado. Além do mais, a tecnologia sem fio oferece portabilidade ao usuário; 2) A popularização dos dispositivos móveis e o crescimento do desenvolvimento de aplicações para esta tecnologia caminham paralelamente ao investimento das empresas de telecomunicações. Os fabricantes de dispositivos móveis concorrem acirradamente beneficiando usuários com a oferta de uma vasta gama de aparelhos com distintos tamanhos, formatos, munidos de tecnologia multimídia (áudio, vídeo, imagens, sons), acesso à Internet banda larga, além de instrumentos de navegação por receptores GPS (Global Position System). Toda esta concorrência pelo mercado reflete na oferta de preços cada vez mais acessíveis à população, além de promover uma rápida evolução neste segmento. Segundo pesquisa realizada pela Google (GOOGLE, 2015), a difusão dos smartphones atinge 26% da população brasileira (aumento de 100% em relação ao ano de 2011), e esses proprietários dependem cada vez mais de seus dispositivos. Quarenta e seis

41 41 por cento dos proprietários acessam a Internet todos os dias através do dispositivo e setenta e três por cento nunca saem de casa sem ele. A pesquisa também aponta que noventa e dois por cento dos usuários de smartphones acessam as redes sociais, sendo cinquenta e oito por cento ao menos uma vez ao dia. Em escala mundial, a adesão é ainda maior, passando da faixa de cinquenta por cento da população de países de primeiro mundo (vide Figura 2.1). A média mundial da população com acesso a smartphones é de quarenta e cinco por cento. Figura 2.1. Porcentagem da população usuária de smartphones por país. Fonte: OurMobilePlanet.com 8 Segundo Filippo et al. (2011), a computação móvel e ubíqua 9 expandiu a gama de serviços colaborativos da Internet, trouxe novas dimensões às aplicações tradicionais e introduziu serviços inovadores e até curiosos. Enquanto a computação móvel tem foco na mobilidade, a computação ubíqua tem foco na contínua disponibilização de serviços que são 8 Our Mobile Planet Segundo Weiser (1991), a Computação Ubíqua é a terceira era da computação: após a era da computação de grande porte (vários usuários compartilham um computador) e a era dos computadores pessoais (cada usuário usa seu próprio computador), a era da Computação Ubíqua é a dos dispositivos de tamanho reduzido (cada usuário usa vários dispositivos).

42 42 oferecidos por meio de inúmeros objetos com software embarcado em equipamentos portáteis. Na computação ubíqua, estes inúmeros dispositivos têm baixo custo, conectam-se entre si por meio de redes sem fio, e estão dispersos no ambiente para prover apoio às nossas atividades. Os dispositivos ubíquos não são necessariamente móveis: a ideia é que eles tenham inteligência e estejam disponíveis em qualquer lugar e a qualquer momento que se deseje, isto é, que sejam onipresentes. Capturar dados por meio de dispositivos móveis, transmitir, trocar informações e se comunicar com a equipe a distância tornaram-se procedimentos corriqueiros e confiáveis. Dispor de mais momentos para usar a tecnologia implica em usufruir de um serviço de forma mais continuada e até mesmo continuamente. As subseções a seguir apresentam alguns exemplos reais de cenários onde a geração de informação a partir da colaboração social pode beneficiar ambas as partes envolvidas. 2.1 Colaboração nas Redes Sociais Segundo Kamel Boulos et al. (2011) um sensor não necessariamente opera sobre a leitura de hardwares, mas também através da leitura humana, fenômeno cunhado pelo autor como sensoriamento social (em inglês, citizen sensing ). Sheth (2009) afirma que as plataformas de microblogging, ambientes onde usuários podem publicar e compartilhar mensagens textuais curtas, URLs e anexar conteúdo multimídia são fundamentais para o provimento do sensoriamento social. Graças às suas aplicações munidas de interfaces simples e objetivas, usuários de mídias sociais como o Twitter 10 e Facebook 11 podem publicar conteúdo textual e multimídia com rapidez e mínimo esforço através de seus dispositivos móveis, a partir de qualquer localidade. Os microblogs permitem atualizações instantâneas e a geração de informações relacionadas a eventos ocorridos em qualquer lugar do mundo. Através das interligações e relacionamentos entre usuários, as publicações são rapidamente compartilhadas e propagadas pela Internet. 10 Twitter Facebook

43 43 Em entrevista concedida à revista National Geographic em novembro de 2013 (HOWARD, 2013), Patrick Meier 12 - pesquisador internacionalmente reconhecido e premiado por suas contribuições relevantes no campo do mapeamento de crises - compara dois casos reais de cooperação que demonstram como a penetrabilidade da tecnologia e as redes sociais influenciam na eficácia do apoio através da colaboração social. Segundo Meier, durante a resposta ao terremoto no Paquistão, em setembro de 2013, em função da baixa penetrabilidade tecnológica naquela sociedade, não foi registrado o recebimento de praticamente nenhuma colaboração proveniente da cidade de Baluquistão (capital do Paquistão) através das redes sociais. A baixa disponibilidade de informações publicadas através das redes sociais pela população local dificultou a coleta e o mapeamento de informações úteis para a resposta à crise naquela ocasião. Por outro lado, os filipinos são usuários ávidos de novas tecnologias e meios de comunicação para a interação social. Como resultado, o volume de informações coletadas através das redes sociais durante e após o Tufão Haiyan, que atingiu as Filipinas em novembro de 2013, foi consideravelmente grande e bastante útil para a resposta à crise. Beaumont (2008) relata o caso dos ataques de terroristas em Mumbai (Índia) ocorridos em novembro de 2008, em que cidadãos locais publicavam seus testemunhos em tempo real, através das redes sociais Twitter e Flickr 13. Estes relatos compartilhados foram essenciais para o comando de crise e os meios de comunicação pudessem compreender e monitorar a sensibilização e mobilização da população local no enfrentamento da crise. A Figura 2.2 representa um exemplo prático de como cidadãos, aproveitando os recursos hoje oferecidos pelos dispositivos móveis e suas aplicações, podem colaborar em situações de emergência. As redes sociais, através de suas interfaces amigáveis e práticas à sua comunidade usuária, podem servir como interface de colaboração entre cidadãos e equipes de operação e coordenação Flickr -

44 44 Figura 2.2. Mashup de colaboração social através das redes sociais para o apoio a desastres (ESRI, 2013) Atualmente muitas informações chegam ao conhecimento de um indivíduo por meio das redes sociais antes mesmo de serem divulgadas nos veículos oficiais de informação. Agências de informação já vêm se adaptando a este novo paradigma de geração de conteúdo informativo, como será mostrado na subseção 2.2. A Figura 2.3 apresenta o caso real de um cidadão que, através das redes sociais, retratou e divulgou ao mundo um evento de caráter emergencial apenas dez minutos após sua deflagração, simplesmente aproveitando os recursos integrados em seu dispositivo móvel (câmera, receptor GPS e 3G).

45 45 Figura 2.3. As redes sociais propagam informações com rapidez: pouso de emergência do avião da empresa US Airways no Rio Hudson, em janeiro de Informação publicada apenas 10 minutos após o pouso de emergência da aeronave. Fonte: Publicação no microblog Twitter do usuário Janis Krums 14 Tal como ocorrido no caso apresentado acima, as redes sociais, munidas de interfaces amigáveis e práticas ao usuário, podem intermediar a colaboração entre cidadãos e equipes envolvidas na resposta aos eventos emergenciais, e trazer ao comando da resposta uma visão diferenciada, sob a ótica do próprio cidadão. 2.2 Colaboração nas Mídias Oficiais Agências de comunicação vêm também se adaptando e adotando novos procedimentos para aquisição de conteúdo e se beneficiando com a geração de informação através da colaboração social. Hoje, equipados com dispositivos móveis, jornalistas são capazes de redigir e submeter notícias, enriquecidas por conteúdo multimídia (vídeos, fotos), diretamente do local do evento para a redação, em tempo consideravelmente reduzido. A tecnologia agora acessível a qualquer cidadão por um baixo custo torna-se uma importante aliada para garantir o ineditismo de sua matéria jornalística. Outra tendência a respeito da geração de informação por agências de comunicação é o incentivo à submissão de transmissões e documentações de fatos importantes, praticamente em tempo real, produzidos pelos próprios leitores colaboradores (HERAVI; MCGINNIS; HERAVI et al., 2012). Neste caso, a colaboração ocorre com elevada frequência, pois ambas as partes envolvidas são beneficiadas: 14

46 46 Agência de comunicação: beneficiada pelo surgimento de novas pautas, economia de tempo e recursos humanos na cobertura preliminar de matérias. A difusão de colaboradores também expande a área de cobertura da agência. As submissões originadas por colaborações podem ser filtradas pelo corpo editorial do meio de comunicação que, nos casos de maior interesse e da constatação da veracidade da informação, pode encaminhar equipes de reportagens para uma investigação mais detalhada acerca do fato; Cidadão: sente-se útil com a prestação da informação de utilidade pública que, em muitos casos, busca a melhoria de sua própria comunidade (rua, bairro) quando denuncia irregularidades ou divulga manifestações culturais locais. Em alguns casos, dependendo da qualidade e importância, pode ser até recompensado financeiramente pela informação prestada. Figura 2.4. a) Portal VC NO G1 : aproveitamento da colaboração comunitária para a divulgação de matérias jornalísticas. Fonte: Globo.com 15 ; b) Portal Digital Journal : utilização de informações obtidas a partir da colaboração social para a publicação de notícias Colaboração Social na Resposta a Desastres Naturais Heinzelman e Waters (2010) relatam o caso de sucesso do Ushahidi 17, um projeto open-source (de código fonte aberto), baseado em mapeamento colaborativo. Sua origem ocorreu no Quênia, em 2007, quando um grupo de desenvolvedores locais criou um site 18 com objetivo de recolher e mapear relatos da população sobre atos de violência decorrentes da contestação do processo eleitoral do país naquele ano. 15 Portal VC no G Digital Journal Ushahidi Ushahidi Haiti -

47 47 Em 2010, já consagrada e contando com o apoio de dezenas de colaboradores, a ferramenta foi aplicada na resposta ao terremoto de magnitude 7.0 que atingiu o Haiti, em janeiro daquele ano. O desastre resultou no colapso de 90% das edificações na capital Porto Príncipe (FITZGERALD, 2010), causou mortes e feriu mais cidadãos (GRONEWOLD, 2010). Grande parte das informações úteis às decisões da equipe de resposta ao desastre se originou a partir da população local, enviadas por e mensagens de texto (Short Message Service - SMS) livre de custos, graças a convênios firmados com as operadoras de telefonia local. Na ocasião o projeto também já incorporava submissões provenientes das redes sociais. À medida que a população submetia informações e apelos por ajuda, analistas de informação voluntários, situados em distintas localidades remotas (Porto Príncipe, Boston, Quebec, África), trabalhavam na triagem dos dados, aplicando procedimentos de coleta, tradução, verificação da relevância, veracidade, classificação, mapeamento e publicação. Cabe observar que na ocasião a triagem de tratamento e organização da informação ainda não contava com o apoio de métodos mais sofisticados de processamento automatizado, devendo ser tratados e analisados um a um, o que demandava tempo e consumo de recursos humanos. Em alguns casos, por exemplo, era necessária também a colaboração de tradutores, exercida em parte pela própria comunidade local. No caso específico do Haiti, cujas línguas nativas são o creole e o francês, cidadãos colaboradores se juntaram à equipe Ushahidi para apoiar a tarefa de tradução das mensagens originadas pela população para o inglês. As equipes de resposta das Nações Unidas (UNDAC - United Nations Disaster Assessment & Coordination), principais consumidores da informação na ocasião, adotam o inglês como idioma padrão de comunicação durante as missões. Parceiros colaboradores da iniciativa Ushahidi vêm concentrando esforços na elaboração de mecanismos automatizados para o processamento das mensagens colaborativas recebidas. A meta principal é a redução da dependência de recursos pessoais, do tempo de triagem alcançando, consequentemente, uma maior eficiência na disponibilização da informação para consumo durante situações emergência (USHAHIDI, 2013). Segundo Thomas McKenzie, membro da equipe de mapeamento de crise do projeto Ushahidi/Haiti, ao final da fase de resposta ao desastre cidadãos colaboraram com um

48 48 total de (alcançando o pico de mensagens em um dia) mensagens SMS, s e comunicações através de redes sociais, resultando em registros considerados suficientemente relevantes para serem mapeados na plataforma (HEINZELMAN, J.; WATERS, 2010). Notificações sobre pessoas debaixo de escombros, emergências médicas e necessidades específicas, tais como alimentos, água e abrigo foram recebidos, tratados e mapeados quase que em tempo real por um grupo internacional de voluntários. Segundo Rob Munro, membro da equipe Ushahidi/Haiti, o tempo médio de triagem de uma mensagem até seu tratamento e disponibilização para as equipes de campo era de cerca de 10 minutos (HEINZELMAN, J.; WATERS, 2010). Relatórios com informações georreferenciadas foram disponibilizados a qualquer pessoa com acesso à Internet (Figura 2.5). Quatro dias após o terremoto, equipes de resposta que atuavam no país começaram a consumir estas informações influenciando na determinação de como, quando e para onde direcionar seus recursos materiais e humanos. No dia 21 de janeiro de 2010, onze dias após o terremoto, a Secretária de Estado dos Estados Unidos, Hillary Clinton proferiu um pronunciamento intitulado Internet Freedom 19, resumindo o impacto positivo do mapeamento produzido pela iniciativa Ushahidi, conforme trecho traduzido e transcrito a seguir: Na segunda-feira, uma menina de sete anos de idade e duas mulheres foram resgatadas dos escombros de um supermercado por uma equipe de busca e salvamento americano, após enviarem uma mensagem de texto pedindo ajuda. 19

49 49 Figura 2.5. Mapa de crise do projeto Ushahidi/Haiti: mapeamento categorizado sobre incidentes relevantes submetidos pela população haitiana após o terremoto do Haiti (2010). Adaptado de Ushahidi Considerações Complementares Os exemplos concretos apresentados neste capítulo evidenciam o quanto a colaboração social pode contribuir para o enriquecimento da base de conhecimento contextual atual. Especialmente durante situações de emergência, a colaboração pode resultar na economia de tempo, recursos materiais e humanos, além de ampliar a área de abrangência de cobertura em atividades de aquisição de dados ambientais. Adicionalmente, a participação popular na construção e manutenção da base de conhecimento considera a percepção da evolução da emergência e sua resposta, segundo uma nova perspectiva, isto é, sob a ótica da própria comunidade diretamente envolvida neste cenário. Os mecanismos que viabilizam a geração de dados a partir da colaboração social são conhecidos como crowdsourcing 21 ou aplicações de sensoriamento participativo, uma vez que aproveitam o poder das massas (ou multidões ) e contam com a participação do cidadão para atingir seus objetivos. Estas aplicações tornam-se cada vez mais populares nos Crowdsourcing De acordo com o dicionário Merriam-Webster o termo designa a prática de obter os serviços necessários, ideias ou conteúdo solicitando contribuições de um grande grupo de pessoas e, especialmente, da comunidade on-line ao invés de empregados ou fornecedores tradicionais.

50 50 dias de hoje, impulsionadas pela crescente acessibilidade, disponibilidade e adesão da população aos dispositivos móveis com acesso à Internet, como os tablets e smartphones (conforme as evidências apresentadas no início deste capítulo). Segundo Boulos et al. (2011), na medida em que se insere na vida diária e se torna mais presente em todos os locais e objetos, a computação tem o potencial de viabilizar novas formas de colaboração. Cabe a nós criarmos os novos sistemas de apoio à colaboração que se valham destas tecnologias.

51 51 3 Sistemas Complexos O termo complexidade vem do latim, complexus, que significa entrelaçado ou torcido junto. Isto pode ser interpretado da seguinte maneira: para se ter um sistema complexo é necessário: 1) duas ou mais diferentes partes ou componentes e; 2) estes componentes devem estar de algum modo interligados, formando uma estrutura estável (HEYLIGHEN, 1988). A partir destas proposições identifica-se uma dualidade básica entre partes que são ao mesmo tempo distintas e interconectadas. Um sistema complexo não pode então ser analisado ou separado em um conjunto de elementos independentes sem ser destruído. Em consequência não é possível empregar métodos reducionistas para a sua interpretação ou entendimento. Se um determinado domínio é complexo ele será, por definição, resistente à análise (FILHO, 2003a). Como praxe, a metodologia normalmente adotada no estudo de um fenômeno natural consiste em analisá-lo por etapas, dividindo-o em partes menores e investigando-se cada uma delas isoladamente. No caso específico de sistemas lineares, em que o desempenho do todo é a superposição dos efeitos de cada uma de suas partes formadoras, o estudo em separado é suficiente para uma avaliação global do sistema. Entretanto, a estratégia anterior torna-se inoperante nos casos em que o comportamento global do sistema é marcadamente distinto daquele obtido considerando-se unicamente a soma de suas partes, ou ignorando a influência recíproca de seus elementos constituintes. Assim, em razão de seu comportamento acentuadamente sistêmico, as propriedades destes sistemas só podem ser identificadas durante o seu comportamento coletivo. Tais sistemas são, por conseguinte, denominados complexos (FILHO, 2003b). A consciência da existência de fenômenos que não podem ser reduzidos às suas partes em separado conduziu ao holismo, que pode ser visto como uma corrente de pensamento oposta ao reducionismo. O holismo (do grego holos que significa inteiro ou todo) é a ideia de que as propriedades de um sistema não podem ser explicadas apenas pela soma dos seus componentes, seja se tratando de seres humanos ou outros organismos. O sistema como um todo determina como se comportam as partes. Segundo Ferreira (2013), o holismo expressa a teoria segundo a qual o homem é um todo indivisível, e que não pode ser explicado pelos seus distintos componentes (físico,

52 52 psicológico ou psíquico), considerados separadamente. A expressão holismo foi criada por Jan Smuts, primeiro-ministro da África do Sul, no seu livro de 1926, Holism and Evolution, que a definiu como a tendência da natureza, através de evolução criativa, é a de formar qualquer todo como sendo maior do que a soma de suas partes (SMUTS, 1996). Neste contexto, o adjetivo complexo não implica em ser complicado. Tais sistemas constituem-se por unidades de comportamento simples, influenciando-se mutuamente numa rede de conexões e gerando, deste modo, o comportamento complexo global. Para Leite, Reinisch e Bornia (2003) um sistema complexo adaptativo é considerado um sistema composto de um grande número de diferentes agentes, que captam informações do meio ambiente e das suas próprias interações entre os agentes. Ele cria regras a partir de esquemas individuais e conjuntos. As regras são desenvolvidas pela identificação de regularidades na captação das informações. Estes esquemas são atualizados pela aprendizagem e evoluem para estágios mais avançados. Ainda segundo Vieira (2005) pode-se dizer que um sistema é tão mais complexo quanto maior for a quantidade de informação necessária para descrevê-lo. Porém, essa é uma entre muitas definições. No entanto, a complexidade não necessariamente emerge em sistemas com muitos constituintes. Por exemplo, um gás, com bilhões de constituintes, é um sistema simples, uma vez que basta estudar uma pequena parte dele para entender o todo, o que é impossível em sistemas complexos. Complicado não significa ser complexo. Uma máquina sofisticada, com grande número de partes, é complicada, mas não complexa, pois terá comportamento previsível. De um avião, por exemplo, não emergirá nada semelhante ao sofisticado movimento que faz uma ave alçar voo. A reunião de elementos complexos pode gerar um comportamento simples e previsível como, por exemplo, a Terra girando em torno do Sol. Sistemas caóticos e complexos têm um aspecto em comum: são não lineares. Mas, no caótico, a imprevisibilidade é selvagem ; no complexo, civilizada (VIEIRA, 2005). Além disso, as propriedades enumeradas a seguir podem estar presentes em sistemas complexos tão diversos quanto um ser vivo, um ecossistema ou a economia de um país: partes que se relacionam entre si; interação com o meio; adaptação ao meio; tratamento da informação em vários níveis; ordem emergente (criação espontânea de ordem a partir de estados desordenados); propriedades coletivas emergentes (novos comportamentos causados

53 53 pela interação entre partes); criticalidade auto-organizada (estado crítico, na fronteira entre a ordem e o caos, em que a mais leve perturbação pode causar uma reação em cadeia; por exemplo, um simples floco de neve desencadeando uma avalanche); estrutura fractal (formatos que não se tornam mais simples quando observados em escalas cada vez menores). A Figura 3.1 ilustra a dinâmica das transformações ocorrentes em um sistema complexo adaptativo - o meio ambiente: cidadãos são entidades constituintes do meio ambiente que exercem interações interpessoais e também com as demais entidades presentes em seu meio, de modo a deflagrar eventos modificadores e causar contínuas transformações (evoluções) no ambiente no qual estão inseridos. Figura 3.1. Identificação de elementos e interações de um sistema complexo adaptativo: o meio ambiente Segundo Xavier-da-Silva e Marino (2011), todo fenômeno transformador do ambiente pode ser representado por duas primitivas básicas: entidade ou evento. As entidades são fenômenos percebidos principalmente no espaço, como, por exemplo, uma edificação ou uma pessoa. Os eventos são fenômenos percebidos principalmente no tempo, segundo a escala cronológica humana. São caracterizados por um elevado grau de dinamismo, além de causar transformações no ambiente onde ocorrem. Acontecimentos

54 54 catastróficos e sociais representam exemplos de instâncias de eventos, conforme exemplificados na Figura 3.1. Mesmo quando em aparente equilíbrio, isto é, isento de perturbações de grande escala (por exemplo, desastres), não se pode afirmar que o ambiente em que vivemos encontra-se em equilíbrio, o que caracteriza um paradoxo, o operador dialógico 22 sistemas complexos (MARIOTTI, 2010). A complexidade deste ambiente é conjugada por distintos elementos (entidades e eventos) que interagem continuamente, adaptando-se a um sistema de elevada taxa de mudança (dinamismo) causada pelas transformações ocorridas ao longo de cada fração ínfima de tempo, por consequência do alto grau de imprecisão e imprevisão de seus elementos constituintes. Eventos desastrosos impactam ainda mais sobre a diversidade, intensidade e a complexidade das interações no ambiente, afetando diretamente o ser humano. dos Neste contexto, percebe-se um elevado grau associativo entre os elementos deste meio e as propriedades de um sistema complexo (PALAZZO, 1999). Ao decompor o sistema e estudar cada subparte isoladamente não é possível o entendimento de todo o sistema e sua dinâmica, visto que os princípios da auto-organização residem principalmente na dinâmica coletiva e não supervisionada de muitos elementos (BARRÁT, BARTHÉLEMY e VESPIGNANI, 2009). 3.1 Propriedades dos Sistemas Complexos e a Colaboração Social no Ambiente de Emergências As subseções a seguir destacam algumas propriedades dos sistemas complexos e suas respectivas associações com o ambiente de colaboração social em situações de emergências Unidade Coletiva Um sistema complexo é composto por um conjunto de partes conectadas por alguma forma de inter-relação entre as mesmas. Assim, para caracterizar um sistema é necessário não somente conhecer as partes, mas também os modos de relação entre elas. Isto gera um fluxo de informações não trivial de se investigar, acompanhado de uma série de consequências e propriedades emergentes. 22 Operador dialógico - Há contradições que não podem ser resolvidas. Isso significa que existem opostos que são ao mesmo tempo antagônicos e complementares. (MARIOTTI, 2010, p. 150).

55 55 As partes, conectadas por uma rede de relações, geram conjuntamente uma unidade coletiva comumente chamada sistema. Molécula, célula, ecossistema, cidade, colônia de formigas, cérebro, computador, ser humano, cidade podem ser considerados como um sistema ou unidade coletiva. Cada sistema possui suas regras internas. Ao inserir um novo elemento, este passa a estar sujeito às leis próprias desse sistema (PRADO, 2011). Um estrangeiro, ao entrar em um país, fica sujeito às leis da jurisdição deste país. Uma proteína, ao ser absorvida por uma célula fica sujeita à dinâmica da célula e assim por diante. Em sistemas colaborativos que apoiam a resposta a emergências, as entidades geradoras de informações (equipes de campo, cidadãos, mídia, agências de governo) são partes conectadas com a comunidade consumidora (equipes de comando e controle, gestores políticos). Todo diálogo (interação) conecta sempre um emissor com um ou mais receptores por meio da comunicação. Não há sentido em gerar informação quando não existem indivíduos interessados no seu consumo. Não é possível compreender todo o processo analisando apenas um componente deste conjunto, uma vez que cada elemento constituinte possui diferentes papéis, conhecimentos tácitos, seguem diferentes regras e operam segundo específicos planos de ação para que o sistema todo possa fluir normalmente. Caso um elemento seja removido do sistema, o fluxo da informação será interrompido e a colaboração será inviabilizada Propriedades Emergentes Um sistema é dito ser um Sistema Complexo quando suas propriedades não são uma consequência natural de seus elementos constituintes vistos isoladamente. As propriedades emergentes de um sistema complexo decorrem em grande parte da relação nãolinear entre as partes. Segundo Simon (1962), Sistemas Complexos são compostos de várias partes interagindo entre si de uma forma não simples. Nesses sistemas, o todo é mais do que a soma das partes, dado as propriedades das partes, as leis das suas interações, não é trivial inferir as propriedades do todo.

56 56 Um fenômeno é emergente quando surge como resultado da interação entre seus componentes. A dinâmica das partes em uma escala de relação produz uma propriedade emergente em um nível mais alto de escala. De forma análoga, do relacionamento entre o dado e a informação, conclui-se que a informação é uma propriedade emergente de um dado, uma vez que representa o ganho de conhecimento obtido pela inserção de um dado em seu contexto de referência. Por exemplo, o valor 31º C representa apenas um registro de ocorrência de uma temperatura em centígrados. Entretanto, uma vez inserido em contexto pela sua identificação como temperatura média de uma sala de aula durante o verão, este dado agora ganha teor informativo. Esta inserção revela a capacidade da informação no apoio à decisão, por exemplo, aumentar o resfriamento do ar-condicionado Adaptabilidade Segundo Mitchell (1992), um sistema complexo adaptativo (em inglês, abreviado por CAS - Complex Adaptive System) é uma rede dinâmica de muitos agentes (o que pode representar células, espécies, indivíduos, empresas, nações) que atuam em paralelo, constantemente agindo e reagindo ao que os outros agentes estão fazendo. O controle de um sistema complexo adaptativo tende a ser altamente disperso e descentralizado. Caso ocorra qualquer comportamento coerente no sistema, este tem de surgir a partir da competição e cooperação entre os próprios agentes. O comportamento global do sistema é o resultado de um grande número de decisões tomadas, a cada momento, por muitos agentes individuais (WALDROP, 1992). De acordo com Holland (1986), um sistema complexo adaptativo pode funcionar (ou continuar a existir) somente se realiza uma adaptação contínua a um ambiente que apresenta alterações contínuas. A capacidade de modificar o próprio comportamento de acordo com mudanças no ambiente é uma característica comum em sistemas que se propõem a modelar o ambiente e seus fenômenos decorrentes. Durante situações de crise, comandantes das frentes de resposta precisam tomar decisões em meio a um ambiente de incertezas, instabilidade e altamente mutável. Tais circunstâncias lhes obrigam a reavaliar continuamente o cenário momentâneo e se adaptarem às inúmeras imprevisíveis transformações ambientais, ora potencializadas pelo evento emergencial e também pelos resultados das ações decorrentes de suas próprias decisões.

57 57 A grande quantidade de agentes de comando em cada segmento de gestão da crise (saúde, transporte, segurança, resgate, etc.) constrói um cenário indutor de interações e contínuas alterações de estado nos elementos do ambiente. Os comandantes dependem dos sistemas de informação que precisam lidar com a complexidade da tecnologia, dos eventos, das interações, da cultura local e da tomada de decisão (COSKUN; OZCEYLAN, 2011) Multi-escalas Sistemas interagem com outros sistemas, de modo a formar sistemas mais amplos em escalas e com propriedades emergentes. Esta sinergia ocorre em escalas progressivamente mais amplas ou mais restritas, ou seja, como expressões de sistemas em multi-escalas. Cada escala possui as suas próprias leis (MILLER; PAGE, 2007). Segundo Lindel et al. (2006), a gestão da emergência é distribuída em cinco fases: prevenção, mitigação, preparação, resposta e recuperação. As ações podem ser de natureza estratégica, tática ou operacional. A jurisdição das atividades pode abranger diferentes níveis hierárquicos, como o federal, estadual ou local. Os sistemas de informação apoiam as atividades dessas fases e níveis enfrentando vários desafios, em especial os que apoiam a fase de resposta no nível estratégico. Um grande volume de informações em diferentes níveis de detalhes é coletado e avaliado para que ações sejam definidas a partir delas. Portanto, a gestão de informações é crítica para o sucesso da resposta à emergência. A Figura 3.2 ilustra o inter-relacionamento em diferentes escalas. Os retângulos superiores (localizados sobre a base da pirâmide invertida) representam a sequência das fases da emergência; os retângulos com cantos arredondados representam os níveis de gestão, e o triângulo invertido representa a abrangência da jurisdição. Figura 3.2. Organização da gestão da emergência em diferentes escalas

58 Feedback Uma estrutura de feedback é um laço causal, uma cadeia de causas e efeitos que forma um anel. Dentre essas estruturas, a mais simples é o feedback de reforço, também conhecido como efeito bola-de-neve ou ciclo vicioso. A principal característica do feedback de reforço é ser auto-amplificador. Quanto mais complexo um sistema (seres vivos, por exemplo) maior o número de estruturas de feedback que apresenta. Tem sido observado que sistemas que apresentam feedback tendem a desenvolver propriedades completamente novas. Este fenômeno denomina-se emergência e as novas propriedades do sistema são ditas propriedades emergentes (PALAZZO, 1999). No contexto de informação colaborativa para apoio a emergências, os feedbacks de reforço são mecanismos úteis ao analista de informações para requisitar aos cidadãos colaboradores e agentes de campo a complementação de eventuais informações incompletas, atualizadas e/ou passíveis de confirmação, promovendo, consequentemente, a evolução e o enriquecimento da base de conhecimento contextual (Figura 3.3). Figura 3.3. Evolução da base de conhecimento contextual através de ciclos de feedbacks de reforço Imprevisibilidade Segundo Mitchell (2009), é possível identificar que um ambiente complexo é formado por diversos tipos de agentes os quais interagem entre si de uma maneira não previsível. Há um controle central moderado usando regras simples de operação que dão origem a um comportamento complexo. As informações são trocadas de diferentes formas e se adaptam à evolução da situação. Conforme já observado na subseção 3.1.3, em situações de crise, comandantes das frentes de resposta precisam tomar decisões em meio a um ambiente de tensão, incertezas e

59 59 altamente mutável. Como reflexo de suas próprias decisões, encontram-se continuamente obrigados a reavaliar o cenário momentâneo e se adaptar às inúmeras imprevisíveis transformações ambientais decorrentes da evolução da resposta à emergência. A presença de agentes humanos eleva ainda mais o grau de imprevisibilidade de um sistema baseado em colaboração. Por exemplo, o momento e a frequência de recebimento de informações a partir da colaboração social dependem da conjugação de fatores não determinísticos, como a disponibilidade do colaborador, sua motivação em contribuir, e até mesmo a sua aptidão momentânea para se comunicar. É preciso, portanto, propor mecanismos alternativos capazes de melhorar a frequência e reduzir o tempo de espera por colaborações em circunstâncias de carência e que demandem urgência por novas informações Heterogeneidade Muitas vezes se diz que ninguém é perfeito, mas uma equipe pode ser. Também se diz que o todo é maior que a soma das partes, ou ao menos diferente, pois o grupo é uma entidade com padrões de comportamento próprios, que se desenvolve e evolui ao longo do tempo. Uma equipe que trabalha de maneira sinérgica e coesa atinge resultados melhores do que uma pessoa trabalhando individualmente. Para lidar com a grande quantidade de informação e a multiplicidade de domínios, as pessoas se tornam cada vez mais especializadas, com habilidades e conhecimentos distintos. Resolver um problema complexo muitas vezes requer uma combinação de habilidades que só é obtida em grupo, pois o grupo apresenta mais habilidades do que uma única pessoa (VIVACQUA e GARCIA, 2011). No contexto de emergências, a diversidade de opiniões emanadas de um grupo heterogêneo possibilita a análise de demandas a partir de diferentes pontos de vista, o que potencialmente resulta numa avaliação melhor e mais completa. Adicionalmente, a colaboração de um cidadão local no processo de tomada de decisão poderá enriquecer ainda mais a base de conhecimento dos gestores da crise. Suas percepções e constatações in loco permitem a avaliação da situação sob uma perspectiva distinta àquela do ambiente interno do escritório de comando. Além disso, seu olhar expressa os anseios e as expectativas da comunidade local com relação à evolução da resposta à crise.

60 60 Por outro lado, sob o ponto de vista técnico de processamento, a informação originada por distintos perfis de colaboradores (cidadãos, agentes de campo, imprensa, sensores ambientais - Figura 3.4a) pode trazer algumas complicações. No que diz respeito à geração de conteúdo, os agentes de campo e as mídias oficiais buscam manter um maior nível de formalidade e estruturação em suas publicações. Já no domínio das redes sociais (principalmente nos microblogs) e mensagens SMS, os cidadãos, descomprometidos com a formalidade, tendem a publicar conteúdos com alto grau de coloquialismo (concisão, gírias, abreviações). Tal estilo de escrita pode comprometer a qualidade da informação quanto ao nível de estruturação e, dificultar ou até inviabilizar a efetividade da aplicação de processos automatizados de interpretação do conteúdo. Com relação aos recursos para o provimento da colaboração, os distintos meios de comunicação (Figura 3.4b) implicam no aumento da complexidade do sistema. A arquitetura de uma solução integradora precisa lidar com a heterogeneidade das fontes, identificando e propondo soluções específicas a cada uma de suas particularidades, como: a escassez de informação, anonimato do informante, além dos diferentes conjuntos, estruturas e protocolos de acesso aos dados relativos a cada meio de informação. Além disso, a heterogeneidade também se faz presente na forma da apresentação do conteúdo informativo como, por exemplo, em casos da presença de multilinguismo (Figura 3.4c). Desastres de grandes proporções podem demandar a ajuda internacional. Nestes casos, o idioma nativo local pode ser diferente do idioma de comunicação adotado pelas equipes de resposta internacional (geralmente o inglês). Heizelman e Waters (2010) relatam desafios de multilinguismo enfrentados no tratamento da informação colaborativa durante o apoio humanitário ao terremoto ocorrido no Haiti, em Figura 3.4. Distintos aspectos da heterogeneidade no contexto de informações colaborativas em situações de emergência: a) tipos de agentes geradores de informação colaborativa; b) meios de comunicação; c) idioma de comunicação

61 61 As questões levantadas neste capítulo abordam alguns dos requisitos que devem ser identificados e abordados no processamento de informações provenientes de fontes heterogêneas. Tais requisitos serão enumerados através de um diagnóstico preliminar sobre diferentes tipos de fontes de informações, e suas respectivas soluções serão propostas e experimentadas no prosseguimento deste trabalho. 3.2 Complexidade e a Qualidade da Informação em Situações de Emergência Diversos autores buscam meios de quantificar a qualidade da informação através de diferentes conjuntos de atributos. Amaral (2003) apresenta um levantamento das dimensões da qualidade de um dado segundo diferentes autores e os organiza num quadro que enumera a frequência e a coincidência de cada atributo (por alguns autores, também denominada como dimensão ) de acordo com as fontes consultadas. O Quadro 3.1 apresenta um recorte da porção superior (maiores frequências) do quadro organizado por Amaral no levantamento de quarenta e seis diferentes atributos da qualidade das informações e suas respectivas frequências de ocorrência dentre as dezoito literaturas pesquisadas. Quadro 3.1. Quadro quantitativo de referências sobre atributos da qualidade de dados. Adaptado de Amaral (2003) Critério Referência Total Acurácia X X X X X X X X X X X X X X X X X 17 Completeza X X X X X X X X X X X X X X 14 Temporalidade X X X X X X X X X X X X X X 14 Consistência X X X X X X X X X X 10 Confiabilidade X X X X X X X X X 9 Facilidade de entendimento X X X X X X X X X 9 Relevância X X X X X X X X 8 Acessibilidade X X X X X X X X 8 Atualidade X X X X X X X 7 Existência de Metadados X X X X X X 6 Quantidade apropriada X X X X X X 6 Precisão X X X X X 5 Importância X X X X X 5 Representação consistente X X X X X 5 Usabilidade X X X X X 5 Detalhamento adequado X X X X 4 Unicidade X X X X 4 Segurança X X X X 4 Concisão X X X X 4 Singh, Park e Lee (2009) apresentam um levantamento da frequência de ocorrência dos atributos temporalidade, segurança, acessibilidade, completude, acurácia, coerência, relevância, validade e formato, através de uma análise semântica sobre matérias jornalísticas

62 62 relacionadas a quatro diferentes situações de desastres: furacão Katrina, tsunami no Oceano Índico, ataques de onze de setembro de 2001 e ataques químicos com a substância Anthrax. Medir a qualidade de uma informação em situações de emergência não é uma tarefa trivial. Sua determinação está condicionada ao cenário ambiental corrente e suas constantes variações causadas por distintos fatores como, por exemplo, o estágio da resposta à crise, o perfil do consumidor e o nível de urgência. A subseção a seguir relata a passagem de um caso real de emergência, em que as circunstâncias e o caráter de urgência influenciaram diretamente na qualidade da informação disposta na ocasião Relato Pessoal de uma Lição na Primeira Missão de Resposta a Emergência Ao longo de mais de uma década integrando a equipe de resposta do Centro de Apoio Científico em Desastres da Universidade Federal do Paraná 23 (CENACID/UFPR), uma lição aprendida durante uma atividade de campo merece menção, como forma de motivação sobre a discussão promovida nesta seção do capítulo. A ocasião marcou minha primeira missão de campo oficial como integrante do Centro, no ano de A missão atuou na fase de resposta a danos causados por uma grande enchente, decorrente de um longo e intenso período de chuvas no município de Morretes, localizado no litoral do Paraná 24. Como membro da equipe de desenvolvimento de Sistemas de Informações Geográficas do Laboratório de Geoprocessamento da Universidade Federal do Rio de Janeiro 25 e recém-integrado ao Centro, fui designado a elaborar o mapeamento temático da região afetada, constituído pelo registro georreferenciado de quaisquer informações coletadas pela equipe durante suas atividades de campo: avaliações de danos, necessidades da população afetada, determinação de áreas para desocupação, áreas de risco, aferições de nível do rio, registro histórico de pluviosidade, nível de erosão do terreno, registros de reuniões com autoridades locais e a comunidade envolvida, etc.. 23 CENACID/UFPR Relatório da missão disponível em 25 LAGEOP/UFRJ -

63 63 Durante uma incursão de campo, o coordenador da missão, professor Renato Eugenio de Lima 26 - experiente geólogo, coordenador do Centro e integrante da equipe UNDAC para resposta a desastres naturais - requisitou um mapa que abrangesse a área em que o grupo se encontrava naquele momento. Baseado no mapeamento das informações registradas através das atividades de campo, da geologia e topografia do terreno, o grupo deveria decidir sobre a interdição do local. Em meio a condições bastante precárias proporcionadas pela localidade em que nos encontrávamos, notifiquei ao coordenador que o mapa que dispúnhamos naquele momento era impreciso e que, para prover um material de melhor qualidade, precisava ainda ser processado após retornamos à base de operações, o que consumiria cerca de meio dia de trabalho. Naquele momento, com todo seu conhecimento tácito, adquirido ao longo de inúmeras experiências pretéritas, através de missões de resposta a desastres, o coordenador fez sua colocação: Eu prefiro receber uma informação 70% correta agora do que 90% amanhã ou 100% daqui a dois dias. Se eu esperar este tempo, decisões deverão esperar e vidas poderão ser perdidas. Prof. Renato Eugênio de Lima Coordenador do CENACID/UFPR Na passagem citada, não se tratava diretamente de vidas em risco. Em outras ocasiões já vivenciadas pelo coordenador da equipe ao longo de anos de experiência na atuação em respostas a grandes desastres, sua fala se aplicava integralmente. Contudo, mesmo que em magnitude menor, as circunstâncias também demandavam uma decisão urgente a partir da interpretação dos dados de apoio que a equipe dispunha naquele instante. Portanto, mesmo que ainda deficiente sob alguns aspectos da qualidade da informação (como a acurácia e completude) e considerando o caráter de urgência, aquela era a melhor informação momentânea para apoiar a decisão A Complexidade na Avaliação da Qualidade da Informação Ao qualificar uma informação nas circunstâncias da experiência relatada acima, ou seja, considerando o contexto de emergência, é possível perceber o comportamento típico de 26 Curriculum Lattes do Prof. Renato Eugenio de Lima -

64 64 um sistema complexo, bem como algumas de suas propriedades. A Unidade Coletiva, por exemplo, exprime a necessidade de analisar a qualidade da informação de maneira que suas dimensões (ou atributos) estejam sempre correlacionadas. Ao analisar isoladamente as dimensões da qualidade da informação acurácia e completude, o conjunto de informações disponíveis no momento de necessidade de consumo era ainda incompleto e deficiente. Além disso, a melhoria da precisão do mapeamento demandaria um processamento complementar que custaria tempo e, consequentemente, postergaria a decisão da equipe. Entretanto, ao considerar a dimensão atualidade, a informação (o mapa) era a única e a mais recente que se dispunha no momento. Mesmo que ainda deficiente de completude e acurácia e premido por uma decisão urgente, sob o aspecto da atualidade a informação era de boa qualidade. Portanto, diante das condições de momento, aquela se tornara a melhor informação momentânea para a tomada de decisão. Não apenas sensível às circunstâncias momentâneas, o julgamento da qualidade de uma informação é também influenciado por quem irá consumi-la. Segundo Stvilia et al. (2008), Qualidade da Informação é o grau em que a informação atende às necessidades de seus usuários. Uma vez que pessoas diferentes usam informações para diferentes fins, consequentemente as informações tidas como de alta qualidade para um determinado usuário, pode ser determinada como de baixa qualidade para outro. A avaliação qualitativa da qualidade depende do ponto de vista do observador e do dado que está sendo medido (PINHO, 2001). Por exemplo, num cenário de um incêndio de grande escala, informações sobre as condições meteorológicas são mais relevantes para a equipe de bombeiros e equipes de evacuação do que para a polícia e o serviço médico de emergência. Isso porque a equipe de bombeiros pode ter que usar plano de contingência diferente para lutar contra a propagação de fogo, enquanto a equipe de evacuação também necessita desta informação para determinar o melhor caminho de evacuação em função da mudança de direção e força do vento. De forma análoga, as informações relativas ao impacto do acidente - por exemplo, o número de feridos e desabrigados - podem ser mais importantes para os serviços médicos de emergência, que precisam despachar recursos médicos suficientes para o local do desastre.

65 65 Ao analista de informações cabe munir a equipe de comando com informações já processadas e qualificadas para que o mesmo possa avaliar sua relevância e optar por considera-la ou não em sua decisão. Em algumas ocasiões, informações incompletas e/ou provenientes de fontes tendenciosas, podem distorcer a realidade do cenário, conduzir a uma má decisão e gerar consequências danosas. Portanto, dispondo de ferramentas analíticas adequadas, somadas ao seu conhecimento tácito e sua visão holística sobre a situação corrente, cabe ao comando analisar o conjunto de informações disponível e optar por utilizá-las ou não em suas decisões. 3.3 Considerações Complementares Este capítulo se dedicou a uma compilação sobre a conceituação dos sistemas complexos segundo diferentes pensadores consultados durante a pesquisa referente ao tema. Além disso, estabeleceu associações entre algumas de suas propriedades e a colaboração social no contexto de emergências. O capítulo também promoveu uma reflexão acerca da complexidade de avaliar a qualidade de uma informação em meio a situações de emergência. O tema será retomado no Capítulo 5, quando os elementos da arquitetura de solução proposta serão detalhadamente apresentados, suas associações com as propriedades dos sistemas complexos estabelecidas, e os impactos esperados da solução sobre os atributos da qualidade da informação serão também enumerados.

66 66 4 Fontes de Informações no Apoio à Emergência: Capacidades e Limitações Este capítulo tem por objetivo caracterizar propriedades e limitações de fontes de informações atualmente disponíveis para o apoio na resposta em emergências, segundo aspectos essenciais para a viabilização do seu consumo. Este diagnóstico norteará a pesquisa pelo estado da arte, em busca de abordagens que proponham encaminhamentos para a solução das limitações e requisitos essenciais para apoiar a construção da solução proposta. O Quadro 4.1 sintetiza o levantamento realizado sobre as fontes consideradas (colunas), segundo os seguintes aspectos (linhas): Disponibilidade de dados: qual o conjunto de atributos disponibilizado pela fonte de informação? Nível de estruturação dos dados: a informação pode ser destrinchada sob uma estrutura padronizada? Extração da localização e georreferenciamento: disponibiliza em seu conjunto de atributos a informação precisa de localização de onde a informação se originou? Caso não a disponibilize em seu conjunto de dados original, existem meios alternativos de obter a geolocalização? Limite de caracteres e apresentação do conteúdo: Quais os recursos disponíveis para apresentar a informação de forma mais clara ao consumidor? Há limitação da quantidade de caracteres para apresentar a informação? Informação complementar: É possível agregar conteúdo além do textual à informação para melhor descrevê-la (vídeos, áudios, fotos, outras arquivos digitais)? Frequência de colaboração: A informação é disponibilizada em intervalos de tempo determinísticos? Comunicação: Qual o tipo de infraestrutura de comunicação necessário para transmitir a informação? Quais os riscos da comunicação ser interrompida? Quais as alternativas para normalizar o serviço no caso de uma eventual interrupção? Confiabilidade da fonte: Qual o nível de confiabilidade do provedor da informação originada a partir da fonte? É possível identificar ou determinar a sua confiabilidade através de modelos de reputação?

67 67 A graduação de cores aplicada às células do quadro classifica as condições de favorabilidade para a fonte de informação apoiar a decisão em situações de emergências, em função de cada aspecto analisado. A cor verde representa as condições mais favoráveis. O amarelo e o vermelho representam condições razoáveis e desfavoráveis respectivamente. Em outras palavras, quanto mais condições favoráveis (colorações verdes) uma fonte de informação (coluna) apresentar, mais propícia ela é para apoiar a decisão em situações de emergências.

68 68 Quadro 4.1. Caracterização de distintas fontes de informação colaborativa segundo aspectos de disponibilidade e estrutura de dados, formatação, frequência de publicação e confiabilidade do emissor FONTE ASPECTO Chamada Telefônica SMS Sensor Ambiental Redes Sociais Agente de Campo Data/Hora Data/Hora aferição contato Data/Hora envio Data/Hora envio Data/Hora Localização Telefone emissor emissor Localização* Nome agente Disponibilidade Data/Hora envio Parâmetro(s) Nome emissor* Nome emissor Apelido emissor Mensagem de Telefone emissor monitorado(s) Local Evento Assunto Mensagem Formulário Dados Mensagem Valor(es) do(s) Formulário Mensagem Multimídia* estruturado prédefinido parâmetro(s) estruturado prédefinido Arquivos anexos URL* * opcional monitorado(s) Alto Alto Alto Nível de Estruturação dos Dados Extração da Localização e Georreferenciamento Cidade/região DDD Nome da localidade pode ser informado pelo emissor durante a chamada Baixo Texto livre identificação de atributos dificultada Cidade/região DDD Pode ser informado no corpo da mensagem Erros de digitação ou abreviações dificulta extração automatizada Baixo Texto livre identificação de atributos dificultada Cidade, poucos casos, pelo IP Pode ser informado no corpo da mensagem Erros de digitação ou abreviações dificulta extração automatizada Para cada parâmetro monitorado(s) há especificação técnica e protocolos para leitura dos dados Sensores estáticos: localização precisa e fixa Sensores móveis: podem informar posição corrente em cada leitura Baixo Texto livre identificação de atributos dificultada Localização precisa Usuário habilita Posição usuário pode diferir do local do evento Extração por Proc. Ling. Natural do texto apresenta baixa eficiência em pré- Organizado formulários estruturados segundo vocabulários domínio Atendente pode cadastrar informação em formulários estruturados prédefinidos de Localização precisa quando munidos de dispositivos GPS integrados a seus dispositivos de cadastro de informações (hoje comum)

69 69 FONTE ASPECTO Chamada Telefônica SMS Sensor Ambiental Redes Sociais Agente de Campo Limite de Caracteres e Apresentação do Conteúdo Informação Complementar (arquivos, multimídia) Frequência de Colaboração Não há limite de caracteres Receptor pode filtrar apenas o que é relevante da conversa com o emissor Necessita atuação humana (atendente) para cadastrar o relato Não há Imprevisível Mais frequente próximo à data de ocorrência do evento Espaço limitado (160 caracteres) por mensagem Pode segmentar a informação em várias mensagens Dificuldade de digitação pode inibir a escrita e comprometer qualidade da informação (abreviações) SMS - Indisponível MMS - Fotos, Vídeos e Áudios Imprevisível Mais frequente próximo à data de ocorrência do evento Não há limite de caracteres por mensagem Apresentação em formato HTML permite uso de recursos gráficos avançados para melhor apresentação URLs, Qualquer arquivo digital Imprevisível Mais frequente próximo à data de ocorrência do evento Informação estruturada Apenas valores de parâmetros prédefinidos Estrutura da mensagem prédefinida (protocolo para leitura) Multimídia (quando sensores audiovisuais) Definida pelo usuário Não requer esforço humano Twitter - Limite de caracteres (140 chars) concisão versus qualidade da descrição Abreviações: kd, vc, tc dificultam Demais redes não têm limite de caracteres Tags auxiliam a classificação e a identificação do tema abordado URLs, Multimídia (fotos, áudios e vídeos) Imprevisível Mais frequente próximo à data de ocorrência do evento Informação precisa, objetiva, já filtrada pelo agente de campo Geralmente estruturada segundo formulários objetivos à proposta da missão de campo Qualquer arquivo digital Por demanda (custos e alocação de pessoal) Incursões definidas de acordo com a necessidade do Comando

70 70 FONTE ASPECTO Chamada Telefônica SMS Sensor Ambiental Redes Sociais Agente de Campo Comunicação Confiabilidade da Fonte Dependente de rede telefônica fixa ou móvel operante Média Possível requisitar durante a chamada Anônima em alguns casos. Ex.: denúncias Dependente de rede telefônica móvel operante Média Expõe a informação do número telefônico do emissor Pode retornar o contato telefônico para buscar mais detalhes Dependente de disponibilidade de Internet Geralmente opera sobre rede telefônica fixa ou móvel Possibilidade de operar sobre outras tecnologias (satélite, rádio) Baixa Não se conhece nenhum detalhe pessoal acerca do contato A partir do é possível buscar o perfil em outras fontes da Internet Conta pode ser falsa/recente Dependente de disponibilidade de Internet Geralmente opera sobre rede telefônica fixa ou móvel Possibilidade de operar sobre outras tecnologias (satélite, rádio) Alta Equipamento calibrado Seus representam leituras instantâneas precisas ambiente dados e do Dependente de disponibilidade de Internet Geralmente opera sobre rede telefônica fixa ou móvel Possibilidade de operar sobre outras tecnologias (satélite, rádio) Baixa Perfil pode ajudar a verificar sua reputação: tempo na rede, posts, rede de relacionamento, localidade, etc. Perfil pode ser falso/recente Independe de infraestrutura de rede de telefonia/internet Comunicação por rádio/pessoal (alcance limitado) Alta Agentes oficiais Pressupõe-se alto grau de confiabilidade Sujeitos a erros humanos: escrita, leitura, inexperiência, fadiga Condição para Apoiar a Decisão em Emergências Desfavorável Razoável Favorável

71 Disponibilidade de Dados Informações originadas a partir de chamadas telefônicas podem ser extraídas através de um diálogo estabelecido entre o atendente (quem recebe e cadastra a informação) e o colaborador e instantaneamente cadastradas através de formulários previamente estruturados. Informações como a localidade e detalhes acerca da ocorrência do evento, nome e contato de retorno do informante (caso deseje divulgar) e quaisquer outros dados relevantes também podem ser registrados, de acordo com o interesse do receptor (atendente) e a disponibilidade de informações por parte do colaborador. Basicamente data e hora do contato, número de telefone do emissor e a mensagem compõem um conjunto reduzido de dados disponibilizados por mensagens SMS. Apesar da limitação quanto à disponibilidade de dados, o caráter de anonimato e a ubiquidade de serviço tornam o SMS um meio de comunicação bastante popular e confiável para o provimento de informação colaborativa em eventos de crise (HEINZELMAN, J.; WATERS, 2010; CARAGEA et al., 2011; MUNRO, 2013). s e redes sociais oferecem uma gama maior de dados estruturados. Por exemplo, assunto, palavras-chave, URLs, arquivos digitais anexados, conteúdo multimídia e, no caso das redes sociais, até mesmo o posicionamento preciso do local de origem da informação. Com relação a informações de contato do emissor, enquanto o disponibiliza seu endereço de correio eletrônico, as redes sociais disponibilizam seu nome de usuário (username) e número de registro na plataforma, além de links que permitem a navegação e a busca por outros detalhes eventualmente disponíveis em seu perfil de usuário (cidade natal, idade, formação acadêmica, frequência de atividade na rede, interesses, publicações recentes, círculos de amizade). Todavia, geralmente nas redes sociais, o compartilhamento de informações pessoais mais específicas acerca de um usuário necessita de sua autorização prévia ou do cumprimento de pré-requisitos, como, por exemplo, fazer parte de seu círculo de amizade.

72 72 Ainda com relação ao conjunto de dados disponibilizados por mensagens através das redes sociais, as tags 27, eventualmente inseridas pelo autor da publicação, representam palavras-chave que podem auxiliar na classificação com relação ao assunto tratado no corpo da mensagem e/ou conteúdo multimídia. Nos s, a interpretação do campo assunto - preenchido pelo emissor com a finalidade de representar um indicativo sobre o tema tratado na mensagem - pode apontar mais facilmente a classificação temática da mensagem recebida. Os dispositivos de sensoriamento remoto basicamente disponibilizam a data, hora e o valor do(s) parâmetro(s) monitorado(s), informação suficiente para o propósito de sua atividade. Em se tratando de sensores estáticos, a informação da localização espacial pode ser registrada no momento de sua instalação no ambiente monitorado. Para sensores de posicionamento dinâmico, sua posição corrente poderá ser obtida em tempo real, a cada nova leitura de dados. Agentes de campo podem disponibilizar dados de acordo com a necessidade da aquisição. Com relação aos colaboradores oficialmente envolvidos na resposta à emergência (equipes de campo), suas atividades de coleta de dados são demandadas de acordo com as necessidades da equipe de comando. Sendo assim, além das informações pessoais do agente, data e hora da coleta, o conjunto de dados disponíveis varia em função do setor de sua atividade de resposta (saúde, segurança, infraestrutura, logística, etc.). Podem ser considerados suficientemente completos, uma vez que são organizados através de formulários estruturados, pré-estabelecidos pelas partes interessadas no consumo da informação. 4.2 Nível de Estruturação dos Dados Os SMSs, s e redes sociais constituem fontes de informação com baixo nível de estruturação de dados. Nestes canais de comunicação, a informação é publicada em campos de mensagens de texto livre. As tags adicionadas às mensagens de redes sociais podem apoiar o processo de classificação temática nestas fontes de informação. Mesmo assim, as tags também 27 Tags corresponde a um conjunto de palavras-chave atribuídas por usuários, a conteúdos publicados na web (textos, imagens, vídeos, etc.). A atribuição de tags cria estruturas classificatórias que aumentam o desempenho dos mecanismos automatizados de busca e recuperação (VOSS, 2007).

73 73 representam campos livres, não estruturados e podem apresentar qualquer tipo de conteúdo, sem um padrão de escrita definido e até mesmo com erros de ortografia. Existem hoje propostas de estruturação de conteúdo em microblogs através da anotação semântica, como o Semantic MicroBlogging (SMOB) 28 (PASSANT et al., 2010). Entretanto, para viabilizar a ideia é necessário que usuários publiquem através de uma interface personalizada, que possibilite a anotação semântica do conteúdo à medida que vão digitando o texto de sua publicação. Além disso, requer o domínio e a promoção de uma campanha pela adesão de uma nova ferramenta, esbarrando na resistência diante da praticidade e agilidade oferecida pelas aplicações originais das redes sociais mais populares. Sensores ambientais apresentam alto nível de estruturação de dados. Os dados registrados por estes dispositivos representam leituras do ambiente segundo parâmetros previamente definidos por seus proprietários. Uma vez calibrados, os valores registrados estarão sempre dentro de um intervalo conhecido pelo consumidor do dado. Por exemplo, para sensores de temperatura de um ambiente externo, o sensor registrará sempre valores referentes à temperatura corrente do ambiente monitorado, segundo a escala definida durante a calibração (graus Celsius, Farenheit, Kelvin ou uma escala arbitrária). Agentes de campo também podem trabalhar com alto nível de estruturação de dados, através do preenchimento de formulários contendo campos previamente estruturados pelo consumidor da informação (MARINO et al., 2012). Desta maneira todos os agentes oficiais espalhados em atividades de campos trabalham de forma estruturada e padronizada (Figura 4.1), facilitando a triagem dos dados capturados, atendendo objetivamente às necessidades das equipes de gestão da informação e, consequentemente, aumentando a efetividade da colaboração. 28 Semantic MicroBlogging (SMOB) -

74 74 Figura 4.1. (a) Avaliações de deslizamentos por equipes de campo em Teresópolis RJ; (b) Plataforma de coleta e envio remoto de dados estruturados em formulários eletrônicos através dispositivos móveis (MARINO et al., 2012) 4.3 Extração da Localização e Georreferenciamento A extração da localidade geográfica de forma automatizada conta hoje com artifícios que permitem a identificação de coordenadas geográficas a partir de endereços, nomes de localidades e até mesmo através do endereço IP (Internet Protocol) 29 da estação de trabalho do usuário. Além disso, dispositivos móveis comumente já integram receptores GPS capazes de determinar a localização corrente do usuário com exatidão métrica. Outro ponto positivo é que o sistema GPS é autônomo, ou seja, independe da disponibilidade de sinal de telefonia móvel para operar normalmente. No caso de contatos telefônicos, a extração automatizada da localização da origem da chamada, apesar de tecnicamente possível, não pode ser publicada por motivos óbvios de preservação da privacidade do informante. Uma consulta na base de clientes das operadoras telefônicas possibilita a identificação do endereço de instalação de cada terminal fixo. Por meio da aplicação de ferramentas de geocodificação 30 é possível converter o endereço de porta do assinante em suas respectivas coordenadas geográficas, com razoável precisão. No caso das chamadas provenientes de dispositivos celulares, a operadora pode determinar o posicionamento corrente do assinante através de técnicas de triangulação da Geocodificação é o processo de conversão de endereços (como "1600 Amphitheatre Parkway, Mountain View, CA") em coordenadas geográficas (como latitude e longitude Fonte: Google Maps API -

75 75 intensidade do sinal emitido pelo dispositivo móvel e recebido pelas estações rádio-base (ENEH JOY NNENNA, 2012). Todavia, apesar da determinação da localidade de origem de um contato telefônico ser tecnicamente possível, existem questões de privacidade que devem ser respeitadas. A privacidade do informante deve ser preservada de acordo com seu desejo e, sendo assim, sua localização pode ser divulgada apenas sob seu consentimento. No entanto, desde que utilizada apenas internamente, isto é, somente para fins de processamento da validação e verificação da confiabilidade da origem da informação, a privacidade do informante poderá ainda ser mantida. Cabe observar que muitas vezes a localidade da origem da ligação pode não ser a mesma localidade da informação a qual o colaborador se refere, principalmente nos casos em que o contato é originado a partir de um terminal telefônico fixo. Um indivíduo que presta uma informação colaborativa a partir de um terminal telefônico pode, por exemplo, estar realizando a chamada em sua residência e comunicando sobre um evento ocorrido a quilômetros de distância daquele local (situação ilustrada na Figura 4.3). Por outro lado, novamente sob a perspectiva da preservação da confidencialidade do emissor, neste caso a divulgação da localidade do evento objeto da informação não comprometerá a privacidade do informante. A localidade objeto da informação pode ser obtida através da aplicação de ferramentas de geocodificação de endereços (disponibilizadas através de serviços como o Google Geocoding API 31, Microsoft Bing 32 e Yahoo! BOSS Geo 33 ) sobre o nome da localidade de ocorrência do evento informado durante o contato telefônico. No caso das redes sociais, considerando que em grande parte dos casos, seu acesso ocorra por meio dos dispositivos móveis (que comumente dispõem de receptores GPS integrados), coordenadas geográficas de posicionamento corrente do emissor também podem ser instantaneamente aferidas e registradas no conjunto de atributos da informação, conforme ilustrado na Figura Google Geocoding API Microsoft Bing Yahoo! BOSS Geo -

76 76 Figura 4.2. Atributos de uma publicação da rede social Twitter: destaque da informação das coordenadas geográficas do local corrente do emissor no momento da publicação No entanto, por medidas de respeito à privacidade do usuário, o posicionamento geográfico do emissor é publicado somente quando habilitado pelo mesmo. Por outro lado, no caso de informações colaborativas no contexto de emergências, o cidadão, consciente da importância da informação da localização geográfica, tende naturalmente a habilitar o registro de seu posicionamento corrente ao publicar uma informação de caráter colaborativo, diretamente do local o qual sua informação se refere. Assim como nos contatos provenientes de chamadas telefônicas, é importante também alertar para os casos em que o emissor possa estar publicando informações acerca de um fato ocorrido em localidade distinta daquela em que ele se encontra no momento da publicação. Ao receber uma informação através dos canais de colaboração social, é importante perceber que duas posições geográficas distintas podem estar associadas a esta mensagem: 1) a localidade do usuário no momento da publicação da mensagem; 2) e a localidade do evento ao qual o emissor se refere em sua publicação. Em condições ideais estas duas posições se equivalem, ou seja, quando o emissor publica a informação diretamente da localidade do evento ao qual o mesmo se refere. Porém, há ocasiões em que a localidade de origem da publicação não coincide com a localidade a qual a informação se refere. Neste segundo caso, assumir o valor das coordenadas de localização contidas no conjunto de dados da mensagem resultará num equívoco de georreferenciamento. De acordo com Rogstadius et al. (2013), embora hoje a publicação das coordenadas de posicionamento corrente do usuário (ação denominada geotagging ) esteja disponível nas

77 77 redes sociais mais populares, no microblog Twitter apenas 1% das publicações disponibilizam a informação da geolocalização do usuário. Além disso, para esta pequena parcela, esta informação sempre se refere à posição do usuário no momento de sua publicação, muitas vezes diferente da localidade a qual a mensagem se refere (aquela que de fato importa para a emergência). Os casos exemplificados a seguir ilustram circunstâncias que ocasionam tal fato: O informante pode estar se referindo a um evento já ocorrido e de fato testemunhado por ele em determinado momento passado. Sendo assim, provavelmente ele pode já haver se deslocado e afastado da localidade da ocorrência do evento e publicado seu relato, até mesmo ilustrado com fotos do local, alguns minutos ou horas após seu testemunho ocular (situação ilustrada na Figura 4.3). Neste caso, mesmo que a publicação da geolocalização do usuário esteja habilitada e, portanto, presente no conjunto de dados da informação capturada pelo sistema de coleta, este dado não se refere à localidade real da ocorrência relatada; São também bastante comuns os casos em que cidadãos publicam informações com um caráter mais crítico ou simplesmente para compartilhar uma informação de grande impacto, recebidas através de outras fontes como noticiários ou até testemunhos de pessoas diretamente do local. Contudo, estes cidadãos podem estar localizados em outras cidades e até outros países, bem distantes do local real do evento referido. Figura 4.3. Diferença entre a localização geográfica corrente do informante e o evento ao qual ele se refere em uma informação colaborativa publicada através de uma rede social

78 78 A rede social Facebook oferece uma interface simples e objetiva para que o usuário atribua uma localidade geográfica a sua publicação. Neste caso, diferentemente do microblog Twitter, a informação da localidade adquirida no conjunto de dados da publicação se refere exatamente ao objeto do assunto, conforme pode ser verificado no exemplo ilustrado pela Figura 4.4. Figura 4.4. Inserção da informação da localidade do evento relatado em uma publicação na rede social Facebook 34 Especificamente no caso do microblog Twitter, os 140 caracteres e o alto grau de coloquialismo característico deste meio de comunicação impactam na redução da efetividade de técnicas automatizadas de extração de entidades nomeadas através dos algoritmos baseados em processamento de linguagem natural como uma alternativa para a determinação da localidade geográfica referente à publicação (SPRING et al., 2013). A determinação da posição corrente de agentes de campo também é trivial quando estes trabalham munidos de receptores GPS. Neste caso, diferentemente do problema colocado com relação às redes sociais, o equívoco gerado pela diferença entre a localidade da publicação e a localidade do evento descrito não deverá ocorrer, uma vez que os agentes devem ser instruídos a coletar as coordenadas no momento em que estão analisando e coletando informação no local de interesse. Para contatos originados por , ferramentas gratuitas disponíveis na web viabilizam a identificação da localização do emissor a partir do IP registrado no cabeçalho da mensagem. Contudo, sua determinação, na maioria dos casos, pode ser equivocada, 34

79 79 conforme o exemplo a seguir. Uma mensagem enviada por um usuário localizado no Brasil, através do navegador web, a partir de uma conta do provedor Gmail 35, agrega no cabeçalho da mensagem o IP dos servidores da empresa Google, em San José Califórnia EUA. A Figura 4.5 apresenta o resultado do exemplo citado. Neste caso, portanto, somente a aplicação de métodos de processamento de linguagem natural para a extração de entidades nomeadas sobre o conteúdo da mensagem resta como alternativa para a obtenção da localidade geográfica de forma automatizada. Figura 4.5. Teste de localização do emissor do a partir do IP do cabeçalho da mensagem na ferramenta WolframAlpha 36 No caso dos sensores a determinação da geolocalização é trivial. Para sensores estáticos, a informação origina-se sempre de uma localidade fixa, cuja posição é conhecida no momento da instalação do dispositivo no ambiente. Para sensores de operação móvel (monitoramento de viaturas em tempo real, por exemplo), receptores GPS podem ser integrados e sua posição enviada em tempo real, juntamente com os demais dados de monitoramento. 35 Serviço de Google Gmail WolframAlpha -

80 Limite de Caracteres e Apresentação do Conteúdo Informações provenientes de contatos telefônicos não apresentam restrições com relação à limitação de conteúdo. Através do diálogo estabelecido na chamada, o atendente pode filtrar e cadastrar na base de informações apenas o que é relevante da conversa com o colaborador, estruturada através de formulários de cadastro pré-estabelecidos pela coordenação da operação. A rede social Twitter é conhecida como um microblog. Esta denominação se dá pelo fato de seus usuários postarem mensagens com o limite máximo de 140 caracteres, o que pode prejudicar a qualidade da informação prestada. Usuários buscam superar esta limitação imposta pelo microblog criando abreviações de grafias (por exemplo, vc, kd, tc, pq ), utilizando forma de comunicação paralinguísticas (como por exemplo o uso de emoticons, letras maiúsculas ou repetição de caracteres para expressar suas emoções) e sendo concisos em suas publicações. Tal fato pode induzi-los a suprimir detalhes talvez importantes e que poderiam ser acrescentados em sua colaboração, porém inibidos pela limitação imposta pela plataforma. Criado antes da popularização dos smartphones, o Twitter já visionava a ubiquidade, num mundo em que seus usuários pudessem publicar o que estavam pensando ou testemunhando, de qualquer lugar, a qualquer hora. Na época, utilizou então o recurso do SMS - ora disponível em qualquer aparelho de telefonia celular - como meio de transmissão das publicações de seus usuários. Isto explica sua limitação inicial quanto à quantidade de caracteres naquela época. Hoje, mesmo com a popularização dos smartphones e das redes de dados, e não mais sujeito à limitação tecnológica característica do serviço SMS, a restrição de 140 caracteres por publicação permanece imposta aos seus usuários. Tal limitação se justifica apenas como uma estratégia dos reguladores da plataforma: caracterizá-la como um canal de publicações curtas e, consequentemente, de rápida leitura e livre de poluições visuais causadas por conteúdos muito extensos. A estratégia tem dado certo. O Twitter hoje é uma das maiores redes sociais do mundo, além de não competir diretamente com diversas outras redes, como o Facebook, justamente devido a esta característica, o que lhe provê originalidade. Alguns usuários costumam complementar suas publicações com a indicação de URLs para textos complementares, como um artifício de prover uma informação mais completa, principalmente em microblogs, como o Twitter, em que estão limitados pela quantidade de

81 81 caracteres. A partir de análises sobre o comportamento dos usuários da rede social Twitter durante distintos eventos emergenciais ocorridos nos Estados Unidos, Hughes e Palen (2009) verificaram em suas amostras que 50% das mensagens verificadas continham URLs com a função de complementar a informação. Diante desta constatação as pesquisadoras concluem que as emergências apresentam altas demandas por informações que não podem ser expressas por apenas 140 caracteres. Mesmo quando não limitados à quantidade de caracteres nas inúmeras demais redes sociais, seus usuários são envolvidos por um ambiente de concisão e informalidade. Por isso tendem naturalmente a escrever de modo coloquial e sem riqueza de detalhes, o que acaba empobrecendo e comprometendo a qualidade informação. Por um lado, existe um ganho em termos de rapidez e atualização da informação. Por outro, a informação é deficiente no que diz respeito a sua clareza, estruturação e completude. A mesma atenção deve ser tomada com relação às mensagens oriundas do serviço SMS, que limita ao usuário apenas em 160 caracteres. Alguns dispositivos buscam contornar esta limitação disponibilizando ao usuário um espaço para digitação da mensagem com tamanho livre. Apesar da limitação por mensagem ainda existir (isto é uma definição de protocolo da tecnologia), o que o aparelho faz é segmentar a mensagem em conjuntos de 160 caracteres, e enviá-las sequencialmente ao destinatário. Portanto, para estas fontes de informação e todas as demais caracterizadas pelo baixo nível de estruturação da informação, a exemplo do , campanhas e apelos à população através das próprias fontes de informações colaborativas devem ser promovidas pelo comando, com o objetivo de incentivar a publicação da informação colaborativa pelo cidadão de forma mais clara, completa, objetiva, evitando coloquialismos e abreviações, como uma tentativa de obter um conteúdo de melhor qualidade para o processamento e possivelmente mais útil para a decisão. No caso das colaborações originadas por mensagens de , além de não existir limite de caracteres para a composição da mensagem, a possibilidade da formatação do conteúdo em HTML (HyperText Markup Language) oferece ao emissor recursos gráficos de formatação avançados (tabelas, gráficos, imagens, formatação de texto, construção de formulários), possibilitando a apresentação da informação de maneira mais clara, detalhada e estruturada ao receptor.

82 82 No que tange os meios de comunicação caracterizados pelo baixo nível de estruturação, elevado grau de coloquialismo e alta frequência de paralinguismos (como o e- mail, SMS e as redes sociais), a aplicação de métodos de análise de sentimentos pode apoiar a compreensão do humor e emoção do emissor em sua publicação. No cenário de emergência, a compreensão da emoção pode apontar níveis de urgência de um apelo por ajuda, além de medir o grau de satisfação ou insatisfação de uma comunidade. Atualmente, diversas linhas de pesquisa atuam na análise de sentimentos sobre distintas formas de apresentação do conteúdo (GO et al., 2009; PASSONNEAU, 2011; MAZUMDAR et al., 2013). Com relação aos sensores ambientais e agentes de campo, a limitação de conteúdo não se aplica. Em ambos os casos, conforme descrito na seção 4.2, os dados são plenamente estruturados, apresentados em formatos previamente definidos e intervalos de valores esperados pelo consumidor. 4.5 Informação Complementar (Arquivos e Conteúdo Multimídia) Com exceção da telefonia fixa, todas as demais fontes de informações levantadas nesta pesquisa dispõem de recursos para o envio de informações complementares, como arquivos digitais, fotos, gravações sonoras e vídeos, recursos estes que poderão enriquecer a qualidade e atestar a validade da informação prestada. Como alternativa ao SMS, mensagens MMS (Multimedia Messaging Service) permitem a inclusão de imagens às mensagens, promovendo o enriquecimento da qualidade da informação prestada. 4.6 Frequência de Colaboração Segundo Gouveia, Cristina e Fonseca (2008), o nível de comprometimento voluntário é imprevisível. De acordo com a publicação, o princípio NIMBY (em português, não em meu quintal ) representa uma das barreiras comprometedoras da participação do cidadão. Os autores concluem que o comprometimento da sociedade com a colaboração é maior quanto maior for o grau de perturbação da normalidade de sua comunidade e/ou seus entes mais próximos. A análise de dados oriundos de atividades de colaboração em situações de crises pretéritas levou Heinzelman e Waters (2010) a concluírem que a quantidade de informação

83 83 colaborativa é proporcional à data da deflagração da crise, sendo mais efetiva especialmente nas duas primeiras semanas. No caso dos sensores ambientais, a frequência de atualização pode ser configurada remotamente pelo consumidor da informação. Outra vantagem é que o monitoramento dispensa a ação humana, e consequentemente, reduzindo a margem de erro das aferições, dispensando gastos com treinamento, mobilização pessoal e políticas de incentivo e recompensa ao trabalho realizado, além de estender sua capacidade a monitorar locais inabitáveis, como áreas de altitudes ou temperaturas extremas e alta radioatividade. Com relação aos agentes oficiais de campo, a frequência de colaboração é regulada de acordo com a necessidade da equipe de comando. Porém, neste caso, diferentemente dos sensores ambientais, demanda esforços humanos, dispêndio de tempo e dinheiro em treinamentos e deslocamento de equipe, além da atuação ser restringida à sua capacidade de acessibilidade. Por outro lado, o raciocínio humano provê ao agente a capacidade de realizar tarefas mais complexas do que os sensores, sendo estes últimos, ideais para monitoramentos repetitivos, de longa duração e em locais de difícil acesso. 4.7 Comunicação Conforme abordado na motivação de trabalho (subseção 1.3), diante de cenários de emergências de grande magnitude, vias de acesso, redes de abastecimento de água e luz e meios de comunicação são comumente interrompidos em decorrência de efeitos dos eventos danosos, como a queda de árvores, ocorrência de explosões, enchentes, desmoronamentos, etc. Justamente quando a disponibilidade desta infraestrutura é vital para a efetividade da resposta à situação de emergência, comumente encontra-se limitada ou interrompida. O rápido reestabelecimento destes serviços primordiais para a sociedade deve ser priorizado, de modo que a comunidade não sofra ainda mais com as consequências de sua interrupção e as atividades de resposta não sejam prejudicadas. Para os grandes desastres naturais em que a equipe UNDAC (United Nations Disaster Assessment & Coordination) atua, o escritório das Nações Unidas divide sua equipe em onze subgrupos denominados clusters 37 (dispostos na Figura 1.1), responsáveis pela 37 What are UN clusters? -

84 84 reestruturação e manutenção emergencial dos serviços primordiais à sociedade: logística, nutrição, abrigos de emergência, gerenciamento e coordenação de campo, saúde, proteção, agricultura, telecomunicação, recuperação rápida, educação e água e saneamento (OCHA, 2012). Especificamente no grupo das telecomunicações, a UNDAC conta com parceiros como a Organização Não Governamental francesa Telecoms sans Frontières (TSF) 38. A Organização mobiliza recursos materiais e humanos para o estabelecimento e a manutenção de uma rede comunicação provisória no local, até que a normalidade seja reestabelecida. Em um caso real, durante a fase de recuperação aos deslizamentos na região serrana do Rio de Janeiro, em 2011, a companhia concessionária de telefonia fixa e móvel local distribuiu cartões SIM (Subscriber Identity Module) para aparelhos celulares e habilitou todos os terminais de utilização pública da região (populares orelhões ) a realizarem chamadas gratuitas para terminais fixos e celulares daquela mesma companhia, enquanto a condição de normalidade não fosse reestabelecida. A iniciativa facilitou a comunicação entre a população envolvida no desastre, que buscava notícias sobre a localização e as condições de seus entes próximos. Logicamente que uma solução embasada na colaboração através de meios de comunicação necessita do pleno funcionamento destes serviços para que o tráfego dos dados seja possível. Mesmo assim, verifica-se que, dada à importância das comunicações para a sociedade e as equipes de reposta à crise, mesmo quando os danos causados sobre a rede são de grande magnitude, muitos esforços são dedicados ao ágil reestabelecimento e sua manutenção durante a fase de resposta. 4.8 Confiabilidade da Fonte Quando a colaboração se origina a partir de um contato telefônico, o caráter de anonimato reservado ao emissor pode comprometer a fidedignidade da informação prestada. O mesmo ocorre com relação à confiabilidade de informações oriundas de mensagens SMS. Visando respeitar sua privacidade e considerando a impossibilidade de consulta à base de clientes da operadora telefônica, não é possível identificar detalhes acerca do emissor da informação. 38 Télécoms Sans Frontières (TSF) -

85 85 Contudo, exemplos de casos como o Disque-Denúncia (2014) e Munro (2013) demonstram que iniciativas de prestação de informações a partir de contatos telefônicos (considerando também as mensagens SMS) evidenciam um alto grau de confiabilidade. A iniciativa de um cidadão expor seu número de telefone, algo pessoal, indica uma atitude deliberada de cooperação através da prestação de uma informação verdadeira. Portanto, mesmo isento de uma investigação mais minuciosa sobre a origem e reputação do informante, pode-se sugerir um razoável grau de confiabilidade pela informação prestada quando originada a partir de um destes dois meios de comunicação. Com relação às redes sociais, o perfil descritivo do usuário pode ser útil para a análise de sua reputação, como dados sobre a sua localidade de origem, data de cadastro na plataforma, quantidade de publicações, rede de relacionamentos, histórico de atividades e interações com outros usuários da rede. Assumindo que os procedimentos de instalação e calibragem de sensores ambientais ocorram de forma adequada, sua confiabilidade é considerada alta, por tratar-se de dispositivos automatizados que realizam leituras do ambiente com elevado grau de precisão e margem de erro controlada. Agentes de campo são colaboradores oficialmente treinados e exclusivamente dedicados. Para estes profissionais pressupõe-se elevado grau de confiabilidade com relação à credibilidade dos dados por estes coletados. Contudo, tais indivíduos ainda estão sujeitos a eventuais erros de interpretação inerentes ao envolvimento do fator humano, como a fadiga, inexperiência, erros de escrita ou leitura, além de imprecisões resultantes da subjetividade de suas análises qualitativas. 4.9 Considerações Complementares Este capítulo apresentou um diagnóstico sobre as características e limitações inerentes às distintas fontes de informações analisadas, segundo aspectos relevantes para a coleta e tratamento de informações que podem apoiar a resposta durante situações de emergência. O capítulo a seguir documentará a pesquisa do Estado da Arte realizada com o objetivo de buscar encaminhamentos aos requisitos levantados neste capítulo, de modo a apoiar a concepção da arquitetura de solução.

86 86 5 Trabalhos Relacionados Cada vez mais grupos e fóruns vêm trabalhando e promovendo discussões sistemáticas acerca da importância dos sistemas colaborativos para apoio a emergências e como a evolução tecnológica pode contribuir para a interação e a exploração da participação social nas políticas públicas. Alguns exemplos destas iniciativas são: CSCWD 39 - Conference on Computer Supported Cooperative Work in Design, CRIWG 40 - Conference on Collaboration and Technology, CSCW 41 - Computer-Supported Cooperative Work, SMILE 42 - Workshop on Social Media and Linked Data for Emergency Response, ISCRAM 43 - International Conference on Information Systems for Crisis Response and Management. Com base nestas iniciativas, este capítulo relata os produtos da pesquisa na literatura sobre o estado da arte, em busca de abordagens que promovam a investigação e soluções relativas às demandas e os desafios envolvidos na captura e no tratamento de informações para o apoio à decisão no contexto de emergências. 5.1 Quadro Síntese da Pesquisa ao Estado da Arte O Quadro 5.1 apresenta o conjunto de referências bibliográficas mais relevantes, levantado através da pesquisa relativa ao estado da arte, relacionando-as com os tipos de fontes de informações examinados. O quadro também aponta quais aspectos relacionados ao tratamento da informação gerada em situações de emergência (apresentados no Capítulo 4) foram abordados por cada autor. 39 CSCWD CRIWG CSCW SMILE ISCRAM -

87 87 Referência Quadro 5.1. Fontes de informação e aspectos relacionados ao tratamento da informação colaborativa abordados pelas principais referências de apoio consultadas Contato Telefone Fontes de Informação SMS Redes Sociais Sensor Agente Campo Estruturação de Dados Aspectos Relacionados ao Tratamento de Informação Colaborativa Geolocalização Tradução Classificação Frequência Colaboração SOS (2008) X X X X X DISQUE-DENÚNCIA (2014) X X X X MARINO, NASCIMENTO e BORGES (2012) X X HUGHES e PALEN (2009) X X X HEINZELMAN e WATERS (2010) X X X X X X X BOULOS et al. (2011) X X X X X X X BOMAN et al. (2014) X X X CARAGEA et al. (2011) X X X X X CAMERON et al. (2012) X X X X ROGSTADIUS et al. (2013) X X X X PUROHIT et al. (2013) X X X X TSUR, LITTMAN e RAPPOPORT (2013) X X X CHARIKAR (2002) X AGGARWAL e ZHAI (2012) X X HOWARD (2013) X X X X FININ et al. (2010) X X X X TANG et al. (2011) X X X CORDEIRO et al. (2011) X X X Agrupamento Confiabilidade Interoperabi lidade

88 88 O Quadro 5.1 evidencia um maior volume de abordagens que atuam sobre as redes sociais frente às demais fontes de informações. Este desequilíbrio é justificado por tendências atuais e outros fatores já abordados no Capítulo 2. Do outro lado, os meios de comunicação mais tradicionais como o contato telefônico, e SMS vêm perdendo espaço nas abordagens mais recentes. Mesmo assim não podemos deixar de considerá-las. A propósito, o que este desequilíbrio justamente evidencia é a ausência de propostas flexíveis e integradoras no estado da arte. As soluções verificadas são restritas e especializadas em operar apenas sobre fontes de informações específicas. A proposta de contribuição deste trabalho é promover a captura e o tratamento de maneira integrada entre fontes heterogêneas, independentemente de seus protocolos de comunicação e estruturação de dados. Ao combinar suas especificidades e buscar soluções aos requisitos conjuntamente levantados, é possível criar uma solução mais robusta, flexível, completa e adaptável a futuras novas agregações. 5.2 Escopo, Desafios, Resultados e Conclusões das Obras Pesquisadas Os parágrafos a seguir descrevem o escopo, os principais desafios, os resultados e as contribuições relevantes alcançadas em cada obra consultada, apresentadas de acordo com a ordenação da relação disposta no Quadro 5.1. O relatório do serviço sueco de atendimento a emergências SOS (2008) documenta o caso bem sucedido da agência no pronto atendimento de emergências à população do país. Seu atendimento se dá predominantemente através de chamadas telefônicas e mensagens SMS, alternativa criada especialmente para servir aos cidadãos com deficiência auditiva e/ou de fala. O centro de atendimento é distribuído em agências de atendimento regionais, além de dispor de conexão direta com os serviços de atendimento local de bombeiros, polícia, resgate, ambulâncias. O relatório menciona o fato positivo da tendência migratória dos contatos telefônicos partirem cada vez menos de terminais fixos, dando lugar às chamadas originadas por dispositivos celulares, o que trouxe maior agilidade e rapidez nos acionamentos de chamadas de emergência, e, consequentemente, ocasionou uma redução significativa no tempo de resposta. Por outro lado, tal fato implicou no considerável aumento do número de alarmes falsos.

89 89 A agência aponta alguns fatos que contribuíram positivamente para a redução do tempo de resposta a um chamado: 1) Desenvolvimento da capacidade de localizar a origem de cada chamada móvel. No ano de 2007, uma parceria com operadoras de telecomunicações possibilitou a determinação da posição geográfica de qualquer chamada móvel dentro do país. Quando uma chamada telefônica celular é atendida pela central (o que representa 70% das origens dos contatos), um serviço automático imediatamente solicita uma requisição a todas as operadoras locais, informando o número do terminal móvel como parâmetro. Em seguida, a operadora do número chamado responde à requisição, informando seu par de coordenadas de localização corrente e a margem de erro da aferição. 2) Investimento em um sistema de comunicação autônomo (via rádio) entre a agência e os serviços de atendimento emergenciais locais, para onde são despachadas as ordens de atendimentos. 3) Redução do número de chamadas falsas em 50% (desde o ano 2000), principalmente devido à promoção de campanhas publicitárias de informação dirigidas a crianças e jovens. Mesmo assim o número de chamadas falsas ainda é muito elevado, o que resulta em desperdício de tempo e recursos humanos. A publicação também relata a dificuldade de identificar a localização geográfica de chamadas via satélite e provenientes de telefonia IP, cada vez mais comuns, o que impossibilita o encaminhamento da chamada à central regional de atendimento mais próxima. Nestes casos, as chamadas são encaminhadas à agência central do serviço, especializada neste tipo de atendimento. Outro aspecto crítico enfrentado pela agência é com relação à grande quantidade de ligações recebidas durante eventos críticos, como grandes tempestades, enchentes, queimadas, dentre outros fenômenos desastrosos de grande magnitude. O número de ligações costuma exceder à capacidade operacional de atendimento, o que reflete diretamente no aumento do tempo de resposta (filas de espera em chamadas). Para isso, a agência atua junto à administração pública e companhias de seguro em campanhas de conscientização do público para realizar chamadas apenas em situações de real emergência, além do incentivo à criação de programas de planos de contingência e orientação ao cidadão

90 90 em situações de emergências. Internamente a agência introduziu um número nacional de informação para filtrar e aliviar a pressão sobre chamadas não emergenciais ao serviço 112. Uma iniciativa bem sucedida de colaboração vigente no Brasil é o Disque- Denúncia 44, um serviço voltado para denúncia através de contatos telefônicos, a partir da informação prestada pelo cidadão. Com respeito à premiação por colaborações efetivas, a eficiência do Disque Denúncia é impulsionada por políticas de recompensas a informações que comprovadamente resultem no sucesso do objeto de investigação. Ao longo de 17 anos de existência foram 1,8 milhões de denúncias através do canal. O recorde diário registrado pelo serviço desde sua criação foi de denúncias em apenas um dia, em 26 de novembro de 2011, quando as forças policiais ocupavam a comunidade do Complexo do Alemão, na cidade do Rio de Janeiro (DISQUE-DENÚNCIA, 2014). Marino, Nascimento e Borges (2012) apresentam um estudo de caso aplicado a avaliações de riscos iminentes e danos causados por deslizamentos de terra, decorrentes de um longo e intenso período de chuvas ocorridas na região serrana do estado do Rio de Janeiro, em janeiro de O trabalho apresenta a plataforma computacional Vigilância e Controle - Vicon/SAGA 45, um Sistema de Informação Geográfica (SIG) que apoia a coleta e o gerenciamento de informações em respostas a emergências. A plataforma viabiliza o registro de dados gerados durante vistorias de campo através do preenchimento de formulários estruturados, personalizados para diferentes classes de informação (exemplo: avaliação de deslizamento de terra, pessoa resgatada, estrada bloqueada). Para cada registro é possível também anexar imagens, vídeos e qualquer outro arquivo digital, conforme ilustrado na Figura Disque Denúncia Vicon/SAGA -

91 91 Figura 5.1. Plataforma Vicon/SAGA: módulo autônomo de entrada de dados por meio de dispositivos móveis (MARINO et al., 2012) Os dados são armazenados na memória interna do dispositivo móvel e, quando disponível a conexão com a Internet, podem ser submetidos e armazenados no banco de dados na web. Desta forma, os dados estarão disponíveis em tempo real para a avaliação dos coordenadores remotos, onde quer que estejam. Com esta proposta, o tempo entre a coleta do dado in loco, a análise e a decisão do gestor da situação é consideravelmente reduzido. O módulo analítico da plataforma Vicon/SAGA opera através de navegadores e provê ferramentas para a entrada e visualização dos dados coligidos pelas equipes de campo. Possibilita também a criação de consultas seletivas, geração de relatórios, exportação de mapas e análises espaciais. Hughes e Palen (2009) examinam o comportamento de usuários da rede social Twitter durante quatro eventos distintos, conforme indicados na Figura 5.2.

92 92 Figura 5.2. Linha do tempo referente ao período de coleta de mensagens e ocorrência dos eventos monitorados por Hugues e Palen. Adaptado de Hugues e Palen (2009) A pesquisa busca comparar o comportamento da atividade do microblog entre os dias normais e dias em que os eventos monitorados ocorreram, segmentando os usuários mais ativos através do número de publicações diárias e analisando o comportamento de novos usuários, isto é, aqueles cuja inscrição na rede social tenha ocorrido durante o período de ocorrência dos eventos monitorados. Dentre suas principais metas, a pesquisa também analisa a distribuição geográfica dos usuários em torno do foco do problema, seus comportamentos segmentados por grupos (indivíduo, organização, jornalista, militante, etc.), além de promover uma análise sobre a caracterização do conteúdo existente nas publicações, como a presença de arquivos multimídia, URLs, quantidade de respostas e compartilhamentos realizados. Como resultado, a investigação verifica que, especialmente em situações de caráter emergencial, alguns usuários atuam como intermediadores de informações, ou seja, aqueles que coletam informações válidas a partir de várias fontes e repassam para ajudar as vítimas e os gestores da crise. No que tange o conteúdo das publicações analisadas, constatou-se que durante eventos de emergência, em média 50% das publicações contêm links URL, enquanto durante as convenções (eventos não emergenciais), os links URL ocorreram em 40% das publicações, o que levou a concluir que as emergências demandam um nível de detalhamento de informação que não pode simplesmente ser expressa por 140 caracteres. Com relação ao volume de informação gerado, os autores concluem que o número de publicações coletadas para cada evento corresponde ao seu tamanho e impacto sobre a

93 93 sociedade. A quantidade de tweets coletados para os eventos dos furacões foi consideravelmente maior do que as publicações relativas às convenções. A espacialização das publicações coletadas aponta um significativo aumento do volume de publicações dentro das regiões diretamente atingidas pelos furacões, enquanto as convenções proporcionaram um impacto mais focalizado no entorno das cidades que sediaram tais eventos. Heinzelman e Waters (2010) relatam alguns benefícios e desafios resultantes do uso da plataforma Ushahidi (introduzida na subseção 2.3) na fase de resposta ao terremoto ocorrido no Haiti, em janeiro de A iniciativa propiciou a cooperação entre haitianos e as organizações envolvidas na resposta da emergência, culminando no envolvimento dos cidadãos locais no processo de decisão. Segundo o relatório, os desafios mais significativos ocorreram na verificação e triagem do grande volume de mensagens colaborativas e solicitações de ajuda recebidas pelos canais de colaboração estabelecidos com a população afetada pelo desastre. A tradução do idioma local para o inglês, o georreferenciamento, classificação e verificação da autenticidade constituíam as etapas da cadeia de processamento da informação (Figura 5.3). Na ocasião, tais procedimentos eram realizados manualmente pela equipe de colaboradores. O tempo médio entre o recebimento, o processamento e a entrega de um relatório processado para as equipes de campo era de dez minutos.

94 94 Figura 5.3. Workflow da plataforma Ushahidi. Adaptado de Heinzelman e Waters (2010) O autor afirma que, diante de situações catastróficas, a recuperação dos meios de telecomunicações é tomada como prioridade. Segundo o relatório, apesar de setenta por cento das torres de telefonia celular terem sofrido danos decorrentes do desastre em Porto Príncipe (capital do Haiti, epicentro do terremoto), as mesmas foram rapidamente reparadas e a comunicação móvel normalizada imediatamente. Os telefones móveis foram os meios mais diretos de comunicação para os haitianos durante a crise e representaram um salvavidas para muitos sobreviventes. As mensagens SMS propiciam a discrição a informantes que desejam colaborar e preservar a confidencialidade de sua identidade. Isto explica o fato deste ter sido o canal mais frequente de recebimento de relatos sobre violência naquela ocasião. Além disso, o canal é uma alternativa de comunicação para aqueles que não possuem smartphones e pacotes de dados contratados, bastante comum no caso do Haiti, devido ao predomínio da sua população de baixa renda. Outro benefício proporcionado pela utilização deste meio de comunicação é que, ao receber uma mensagem incompleta, a equipe de processamento dispunha de um canal de

95 95 retorno para solicitar diretamente ao informante uma eventual complementação ou confirmação da informação, simplesmente respondendo ao SMS recebido. Durante a resposta ao desastre, graças a acordos firmados com as empresas de telefonia móvel local, mensagens SMS enviadas ao número de atendimento Ushahidi eram gratuitas. Como identificar rapidamente informações imprecisas, tendenciosas ou incompletas? Estes são alguns desafios perseguidos pela equipe Ushahidi em busca de um processamento mais rápido e eficiente. A partir da experiência adquirida e motivados pela melhoria da eficiência da colaboração social durante respostas a emergências, sua equipe de colaboradores propõe algumas medidas como: 1) Criação de redes de informantes de confiança: relatórios podem ser automaticamente processados, quando recebidos a partir de uma fonte confiável (como o caso das equipes de campo). Informações provenientes da colaboração social podem ser comparadas com informações confiáveis (fontes oficiais e relatórios já validados). 2) Treinamento de voluntários: treinamento de grupos de voluntários comunitários para a geração de informações completas e acuradas durante situações de crises, além de atuarem como verificadores, demandando pelas equipes de comando. A exemplo dos agentes das equipes de campo, esses cidadãos podem atuar como validadores de informações, aumentando desta maneira a rede de informantes confiáveis. Os desafios relatados e as medidas propostas pelos autores são pertinentes ao conjunto de requisitos envolvidos na problemática desta pesquisa. Reforçam ainda mais a necessidade da criação de mecanismos de feedbacks que viabilizem a comunicação de retorno para fins de distribuição de demandas e confirmações aos colaboradores (oficiais e não oficiais). Os mecanismos de identificação e agrupamento por similaridade também são fundamentais para o aumento da completude, uma vez que pode congregar diferentes pedaços de informação sobre uma mesma história. Os agrupamentos podem também apoiar a validação de cada nova informação colaborativa, ao compará-la com informações correlatas já validadas e/ou provenientes das redes de informantes de confiança. Além disso, é necessário sinalizar a proveniência e o estágio de validação de cada informação durante seu processamento, de maneira que o sistema disponha das melhores

96 96 condições para comparar e determinar autonomamente seu grau de confiabilidade. Um sistema de reputação também pode ser estabelecido e atualizado a cada nova colaboração recebida a fim de identificar os informantes e as fontes mais confiáveis e ativas, como os intermediadores de informações caracterizados por Hughes e Palen (2009). Tais indivíduos poderão ser eventualmente recompensados por informações valiosas (conforme sugerido na seção 4.6) e até recrutados futuramente como voluntários para o treinamento em respostas futuras. Boulos et al. (2011) denominam A Wikificação dos Sistemas de Informações Geográficos o fenômeno no qual usuários publicam, partilham e disseminam seus conhecimentos, muitas vezes enriquecidos por conteúdos multimídia, notas e modelos 3D. Os autores também apontam benefícios do crowdsourcing para a sociedade e cunham expressões cidadãos como sensores, sensoriamento participativo, ilustradas através de exemplos como: A utilização de dispositivos de navegação por GPS, conectados à Internet, que partilham as condições de tráfego em cada trecho coberto pelo motorista; Como amostras de áudio gravadas e enviadas através de smartphones de pedestres fomentam a criação de um mapa instantâneo de poluição sonora do ambiente; O monitoramento em tempo real da qualidade do ar de cidades através de uma rede de sensores ambientais embarcados nas bicicletas de cidadãos. Com relação à colaboração através das redes sociais, os autores alertam sobre a alta quantidade de ruídos existentes no conteúdo publicado, causados pela desinformação e preconceito de seus usuários, que podem ser ainda mais amplificados pela natureza viral das mídias sociais. Como medida atenuadora, a obra cita a plataforma de código aberto SwiftRiver 46 como uma proposta eficaz para a filtragem do conteúdo útil nestes meios. A reputação e confiança da fonte também são temas abordados pelos autores. Em situações emergenciais de grande magnitude, um evento pode ser tão grande e tão remoto de modo que a avaliação por agentes oficiais seja inviável dentro de um tempo hábil. Nesses casos, a avaliação executada por colaboradores pode ser satisfatoriamente útil. Entretanto, é igualmente importante conhecer o perfil destes colaboradores. Trata-se de uma fonte 46 SwiftRiver -

97 97 confiável? Existe algum conhecimento prévio capaz de apontar o quão útil e confiável seja a informação proveniente deste colaborador? Sob o aspecto da confiabilidade do emissor, o estudo sugere um esquema de formação de reputação dinâmica em função da evolução do evento e das colaborações recebidas. A cada tipo de classe de colaborador é atribuída uma pontuação de reputação inicial, que evolui e se transforma ao longo do tempo, com base em suas interações e nos novos conteúdos recebidos e avaliados pelos gestores de informações. Enquanto agentes oficiais podem inicialmente receber a mais alta pontuação de reputação, os cidadãos colaboradores devem construir e aumentar seus índices de reputação à medida que geram novas contribuições (informações ou execução de tarefas de apoio) relevantes ao comando da resposta. Sob os aspectos positivos do aproveitamento da colaboração social, os autores defendem que a informação compartilhada demonstra ser: Mais oportuna, pois as circunstâncias envolvem uma pressão ao cidadão por ajudar seus iguais, principalmente quando seus entes mais próximos são diretamente afetados pela crise; Mais completa, porque há transparência na comunicação, principalmente quando meios de preservação da confidencialidade são proporcionados e garantidos ao cidadão; De maior qualidade, em termos de sensibilidade, pelo fato da população local conhecer bem e partilhar o espaço, problemas e costumes de sua própria comunidade; De maior qualidade, em termos de especificidade. Uma vez no local, o cidadão pode validar rapidamente, verificar a informação e descartar falso-positivos anteriores. A obra caracteriza elementos essenciais para a construção de tecnologias que utilizam o apoio dos cidadãos no sensoriamento do ambiente. São eles: Horizontal: permitindo aos cidadãos compartilhar informações uns com os outros;

98 98 Vertical: permitindo aos cidadãos compartilhar informações com salas de situação e centros de controle da operação; Semiestruturado: flexível de maneira que um cidadão possa livre e facilmente relatar o que julgue relevante, isto é, não restrito a modelos excessivamente estruturados; Aberto: de modo que a comunidade se dê conta que pode agregar informações e promover discussões valiosas, criando uma política de meritocracia para recompensá-los. Além disso, é importante fomentar seu crescimento através da divulgação de campanhas de apelo e incentivo à população; Geolocalizada: uma vez que cidadãos locais possuem alta autoridade de conhecimentos sobre o que está próximo a eles. A criação de meios de identificálos e alcançá-los é essencial para a contextualização, interpretação e verificação da confiabilidade das informações referentes ao local; Acessível: o que significa que o processo também pode trabalhar com até mesmo o tipo mais simples de telefone celular, por exemplo, com o uso de mensagens de texto SMS (GEOSMS, 2013). Por um lado, a popularização dos dispositivos de sensoriamento ambiental, cada vez mais portáteis, facilmente configuráveis, e menos custosos, expande as potencialidades e oportunidades de aplicações. Por outro, surge o desafio em gerir e consumir seus dados de forma eficaz, devido à heterogeneidade dos componentes e protocolos embarcados nos hardwares de diferentes marcas e modelos dos dispositivos de sensoriamento. Neste cenário, Boman et al. (2014) investigam iniciativas que buscam elevar o grau de integração entre os mundos físico e virtual. Dentre alguns exemplos de iniciativas elencadas pelos autores, a plataforma Xively 47 disponibiliza uma API (Application Programming Interface) de funções padronizadas que viabiliza o acesso em tempo real a dados originados por milhões de sensores remotos espalhados pelo mundo. Estas plataformas podem ser aproveitadas na arquitetura proposta neste trabalho como meios práticos para a coleta de dados originados a partir de sensores ambientais. 47 Xively -

99 99 Caragea et al. (2011) avaliam distintos métodos de classificação automática sobre um conjunto de dados constituído por mensagens SMS e publicações através da rede social Twitter, obtido a partir da plataforma Ushahidi durante o apoio ao terremoto do Haiti, em O experimento teste é parte da construção de mecanismos automatizados para o acoplamento na plataforma desenvolvida pelo grupo de pesquisa, denominada EMERSE 48 - Enhanced Messaging for the Emergency Response Sector (arquitetura apresentada na Figura 5.4-a). Figura 5.4. (a) Arquitetura da plataforma EMERSE; (b) Módulo de entrada de dados para iphone. Adaptado de Caragea et al. (2011) Complementarmente, um aplicativo disponível para dispositivos móveis foi projetado para apoiar os profissionais humanitários na coleta de informações durante uma crise (Figura 5.4-b). Em caso de impossibilidade de acesso à Internet, o aplicativo armazena os dados registrados no próprio dispositivo até que o acesso esteja disponível para o envio. A aplicação aproveita ainda o recurso do receptor GPS integrado aos dispositivos para georreferenciar automaticamente cada novo registro gravado. No segmento de coleta de dados da plataforma, um processo extrator captura publicações na rede social Twitter segundo palavras-chave específicas, pré-estabelecidas pelo gerente de informações, bem como as publicações originadas de usuários específicos. Além disso, a plataforma conta com processos de tradução automática através do uso da API (Application Programming Interface) disponibilizada pelo serviço de tradução Google Translate 49. A capacidade de classificar automaticamente tais mensagens, somada ao direcionamento ágil das informações relevantes diretamente ao pessoal adequado são essenciais para aumentar a eficiência no atendimento às necessidades mais urgentes e 48 EMERSE Google Translate -

100 100 compreender melhor a situação de emergência. No entanto, a classificação automática ainda constitui o aspecto mais desafiador à plataforma EMERSE. Apesar da classificação de mensagens de texto poder ser realizada com pouco esforço por um ser humano, ainda constitui uma difícil tarefa para computadores. Frente a este desafio motivador, a equipe fez uso da base de dados Ushahidi/Haiti, que inclui cerca de relatos, dos quais metade foi originada através de mensagens SMS. Na ocasião da resposta ao desastre, em 2010, cada um desses relatos foi manualmente classificado pela equipe de colaboradores de acordo com sua demanda específica, por exemplo, emergência médica, edificação colapsada, requisição de abrigo, etc.. Para fins de avaliação de desempenho da classificação, quatro diferentes métodos classificatórios automáticos foram experimentados: Bag of Words (MCCALLUM; NIGAM, 1998), Feature Abstraction (SILVESCU et al., 2009), Feature Selection (KIRA; RENDELL, 1992) e Latent Dirichlet Allocation (LDA) (BLEI et al., 2003). Os resultados demonstram que o método Feature Abstraction superou significativamente outros métodos enquanto a eficácia de classificadores baseados em Support Vector Machine (SVM) variou significativamente dependendo da categoria a ser codificada. Cameron et al. (2012) descrevem esforços correntes em parceira com o governo australiano para detectar, avaliar, organizar e compartilhar mensagens coletadas a partir do microblog Twitter que possam ser de interesse para a coordenação de crise. A plataforma, denominada ESA-AWTM (acrônimo para Emergency Situation Awareness Automated Web Text Mining), permite que mensagens relevantes publicadas pela população através das redes sociais possam ser identificadas e aproveitadas para agregar conhecimento a partir de diferentes visões da transcorrência de um incidente de caráter emergencial. Os principais objetivos da plataforma ESA-AWTM são: o fornecimento de evidências de atividades indicadoras da ocorrência de incidentes; a notificação quase em tempo real de incidentes ocorridos; relatos em primeira mão acerca dos impactos causados por estes incidentes; e o monitoramento do grau de envolvimento e da evolução do comportamento da comunidade a um aviso de emergência. A plataforma vem sendo experimentada pelo escritório de coordenação de crises australiano durante casos reais de emergência, a fim de verificar e aperfeiçoar sua efetividade no apoio à decisão. Alguns aspectos da plataforma apresentada pelos autores se

101 101 assemelham a elementos constituintes da arquitetura proposta neste trabalho, merecendo, portanto uma análise mais detalhada acerca dos mesmos. São eles: Classificação: um módulo classificador automático identifica publicações relacionadas à classe danos em infraestrutura. O algoritmo Support Vector Machines (SCHÖLKOPF et al., 2000) obteve o melhor resultado dentre os métodos classificadores automatizados experimentados. Os testes foram aplicados sobre tweets coletados durante um terremoto ocorrido no país, em fevereiro Os esforços correntes dos autores se dão em adaptar o método para classificar outros tipos de desastres naturais, tais como incêndios florestais, ciclones e inundações. Georreferenciamento: para os casos em que os tweets não contenham a informação das coordenadas de geolocalização, uma tentativa de georreferenciamento é procedida com base na localização do perfil do usuário. Entretanto, a exemplo das demais abordagens anteriores, verifica-se novamente um equívoco sobre a medida adotada para o georreferenciamento das informações recebidas. Como já discutido na seção 4.3, a localização da informação não necessariamente deve ser a mesma de emissor no momento da publicação. Procedimentos comparativos e corretivos foram previstos e propostos na arquitetura deste trabalho, conforme detalhados na subseção Agrupamento de mensagens: através de observações sobre a dinâmica do ciclo de vida das informações relativas a eventos emergenciais, verifica-se que, durante um incidente em curso, novas demandas podem emergir, se fundir com outras já existentes, depois se dissociar de seu grupo e, finalmente se extinguir, quando não mais úteis no estágio corrente. A partir desta abordagem, os autores propõem o desenvolvimento de um novo algoritmo de agrupamento incremental e dinâmico, capaz de condensar ou mesclar grupos de mensagens com conteúdo semelhante, dividir grupos com conteúdos distintos e desfazer um agrupamento, uma vez que tenha se tornado desinteressante. Contudo, o detalhamento sobre as técnicas aplicadas não é apresentado na obra. Os autores apenas registram que a construção e avaliação deste algoritmo é tema de um trabalho ainda em curso.

102 102 Rogstadius et al. (2013) apresentam a plataforma CrisisTracker 50, um sistema online que captura e agrupa relatos coletados do microblog Twitter durante eventos de grande escala. A plataforma rastreia automaticamente mensagens através de conjuntos de palavraschave e constrói histórias através do agrupamento dos tweets relacionados com base na sua semelhança lexical com as demais publicações do grupo. A publicação também apresenta resultados da implantação de um experimento piloto acerca do monitoramento da guerra civil síria, ao longo de oito dias, durante o mês de setembro de Na ocasião, o experimento processou, em média, tweets por dia, agrupando-os em histórias através da combinação de processadores automatizados com revisão colaborativa (humana) através de crowdsourcing. Conforme os problemas de extração da geolocalização já abordados na seção 4.3, o experimento piloto apresenta uma notável dificuldade em extrair a geolocalização de mensagens originadas pelo Twitter. Uma análise sobre o conjunto de dados experimental constata que apenas 1% das publicações apresenta a informação da localidade geográfica. Além disso, dado ao fato da informação da geolocalização estar relacionada à posição corrente do usuário no momento da publicação, mesmo quando disponível tal informação deverá ser investigada. Caso seja detectada sua distinção em relação à localidade a qual a informação se refere, esta deverá, portanto, ser descartada. Apesar dos graduais avanços no desenvolvimento de técnicas de classificação e estruturação automatizada de conteúdo textual, os resultados de experimentações sobre textos de pequeno comprimento (típicos das redes sociais) mostram ser significativamente inferiores e deficientes do que quando aplicados sobre artigos de notícias e publicações melhor formadas e com maior extensão. Segundo Rogstadius e Kostakos (2011), a computação humana baseada na colaboração (em inglês, crowd-sourced human computation ) é uma técnica na qual um processo computacional desempenha a sua função por externalização de determinadas etapas para os seres humanos. Tais tarefas são realizadas muitas vezes a partir da colaboração das multidões, onde o processamento pode ser distribuído entre um grupo de pessoas. A técnica é prática para lidar com problemas computacionais que são facilmente resolvidos por seres humanos, mas ainda de alto custo e baixo desempenho para os 50 CrisisTracker -

103 103 computadores, como a classificação de imagens (AHN, VON; DABBISH, 2004), a gestão do conhecimento (KUZNETSOV, 2006), e resolução de problemas de negócios (VUKOVIC, 2009). O desempenho das multidões depende em grande parte de incentivos (ROGSTADIUS et al., 2000), tais como financeiros (KAUFMANN; VEIT, 2011), jogos e entretenimentos (AHN, VON; DABBISH, 2004; COOPER et al., 2010) e apelos pelo bemestar social (KUZNETSOV, 2006). Voluntários motivados têm se mostrado mais propensos do que as multidões pagas para produzir resultados de alta qualidade (ROGSTADIUS et al., 2000). A plataforma Micromappers (HOWARD, 2013) é um recente exemplo concreto desta bem sucedida solução híbrida, baseada na combinação homem-máquina. Purohit et al. (2013) propõem métodos de aprendizagem de máquina 51 para automaticamente identificar e associar as necessidades (demandas) e ofertas (material) de recursos de emergência publicados através das mídias sociais, de modo a acelerar e aperfeiçoar sua distribuição durante os esforços de recuperação. Os métodos ainda levam em conta a priorização das necessidades em função da localização geográfica das partes envolvidas, disponibilidade de recursos, premência das necessidades e da credibilidade da informação. Um cenário motivacional para a solução é ilustrado através da Figura Aprendizado de máquina é um subcampo da inteligência artificial dedicado ao desenvolvimento de algoritmos e técnicas que permitam ao computador aprender, isto é, aperfeiçoar seu desempenho em alguma tarefa. Por exemplo, um sistema de aprendizagem de máquina poderia ser treinado em mensagens de para aprender a distinguir entre mensagens spam e não-spam. Depois de aprender, então ele pode ser usado para classificar novas mensagens (BARANAUSKAS e MONARD, 2003).

104 104 Figura 5.5. Cenário exemplo para coordenação das ofertas e necessidades através das mídias sociais. Adaptado de Purohit et al. (2013) Desta forma, por exemplo, uma solicitação expressa através da mensagem estamos coordenando uma unidade de roupas e alimentos para as famílias afetadas pelo tornado em Oklahoma. Se você quiser fazer uma doação, entre em contato conosco pode ser associada com uma oferta manifestada através mensagem tenho diversas roupas que gostaria de doar para as vítimas do tornado em Oklahoma. Alguém sabe onde/como posso proceder?. No entanto, conforme já abordado na seção 4.4, o conteúdo publicado através das redes sociais, s e mensagens SMS apresenta baixo nível de estruturação de dados, o que dificulta ainda mais a determinação da relevância e confiabilidade da informação. Tratase um ambiente caracterizado por informalidades e repleto de informações incompletas, ambíguas e ainda envolvido por tons de sarcasmos, opiniões, anedotas e boatos. No caso do microblog Twitter, por exemplo, seu limite de 140 caracteres pode ser visto como um fator positivo, uma vez que incentiva a concisão. Por outro lado, pode também prejudicar a qualidade da informação, pois reduz o contexto que pode ser explorado por algoritmos baseados no processamento de linguagem natural. Além disso, o volume de mensagens durante uma crise é bastante elevado, o que implica numa sobrecarga de processamento e no aumento da complexidade em tarefas de identificação e extração de conteúdo útil sobre mensagens irrelevantes e fora de contexto.

105 105 A abordagem se baseia na estratégia de converter automaticamente textos simples em registros semi-estruturados 52, conforme o exemplo apresentado no Quadro 5.2. A estrutura é flexível de modo a permitir a anotação de outros metadados relevantes eventualmente presentes nas mensagens processadas, como hora, local e autor. Quadro 5.2. Exemplo de mensagens apresentadas em seu texto original (não estruturado) e sua representação estruturada, gerada automaticamente. Adaptado de Purohit et al. (2013) Solicitação/ Oferta Solicitação Tipo Recurso Dinheiro Texto Original (não estruturado) {Digite REDCROSS para para doar U$ 10 para ajudar pessoas furacão Sandy. #SandyHelp} Representação Estruturada {RESOURCE-TYPE={class=Money, confidence=0.9}, IS-REQUEST={class=Yes, confidence=0.95}, IS-OFFER={class=No, confidence=0.9}, TEXT= Digite...#SandyHelp } Oferta Voluntário {Alguém sabe sobre como se voluntariar para oportunidade para trabalho voluntário para o furacão Sandy?} {RESOURCE-TYPE={class=Volunteer, confidence=0.99}, IS-REQUEST={class=No, confidence=0.98}, IS-OFFER={class=Yes, confidence=1}, TEXT= Alguém...Sandy? } O processo de conversão primeiramente analisa cada mensagem através do processamento de linguagem natural. Em seguida aplica classificadores supervisionados a fim de identificar as solicitações das ofertas de recursos. Observa-se na abordagem adotada, que as classes não são mutuamente exclusivas, o que significa que uma mesma mensagem pode, por exemplo, apresentar uma solicitação e também uma oferta de recursos. Após a classificação, o passo final é o estabelecimento de associações entre solicitações e ofertas, através de métodos de matchmaking desenvolvidos e aplicados em sites de namoro e adaptados a partir da abordagem de Diaz, Metzler e Amer-Yahia (2010). 52 Um registro semi-estruturado é um item de dados que não segue um modelo de dados formal (estrutura), como o utilizado por um banco de dados relacional, mas inclui marcadores para separar distintos elementos semânticos (PUROHIT et al., 2013).

106 106 Experimentações avaliativas apontam uma eficiência de correspondência de 72% em relação a outros métodos de pesquisa tradicionais comparados. Tsur, Littman e Rapporort (2013) apresentam um algoritmo preciso e eficiente para o agrupamento de publicações do microblog Twitter. O método de agrupamento é dividido em duas etapas distintas: 1) agrupamento sequencial de dados anotados por usuários através das hashtags; 2) agrupamento online de um fluxo de tweets. A partir dos agrupamentos mais estáveis alcançados graças à semi-classificação através das hashtags, os conjuntos alcançados na primeira etapa se prestam para o agrupamento online de um fluxo de mensagens, contendo ou não hashtags. Os resultados da experimentação e análise comparativa com outras abordagens de classificação demonstram que o algoritmo apresentado é preciso e eficiente e pode ser facilmente utilizado para o agrupamento em mensagens de larga escala. Charikar (2002) propõe um algoritmo de agrupamento de mensagens utilizando a distância de Hamming 53. A distância de Hamming entre duas sequências de caracteres de mesmo comprimento é o número de posições nas quais elas diferem entre si. Vista de outra forma, ela corresponde ao menor número de substituições necessárias para transformar uma sequência na outra, ou o número de erros que transformaram uma na outra. Por exemplo, a distância de Hamming entre os termos elabore e melhore é quatro. No caso das mensagens colaborativas, logicamente que a comparação envolve sequências de tamanhos distintos. Portanto, para que a comparação seja possível, o autor propõe uma adaptação do método através da quebra das sequências em conjuntos de palavras, além de convertê-las em números binários através da aplicação de funções de hashing. O algoritmo adaptado é conhecido como Simhash 54 e tem sido aplicado e experimentado por Science (2013) em seus esforços mais recentes na elaboração de processos automatizados para o tratamento das informações colaborativas obtidas através da plataforma Ushahidi. Aggarwal e Zhai (2012) promovem uma discussão acerca de avanços recentes no contexto das redes sociais e dos dados ligados, além de apresentarem alguns dos principais métodos e suas respectivas vantagens para o agrupamento de documentos. Os autores 53 Distância de Hamming Algoritmo Simhash -

107 107 também destacam que o agrupamento de mensagens por similaridade pode alcançar melhores resultados quando palavras irrelevantes ao contexto são previamente identificadas e suprimidas. Por exemplo, termos comuns tais como a, não podem ser muito úteis para melhorar a qualidade de agrupamento. Além disso, a ponderação de palavras-chave como nomes de pessoas e locais também podem refletir positivamente sobre os resultados do agrupamento. Métodos como Feature Selection Methods operam sobre a seleção de um subconjunto de elementos mais relevantes da informação. O pressuposto central é que algumas informações contêm muitos elementos redundantes ou irrelevantes que não fornecem conteúdo útil, acarretando apenas em ruído e aumento do custo de processamento. Portanto, é essencial selecionar tais características de forma eficaz de modo que estas palavras ruidosas sejam identificadas e removidas antes da aplicação dos métodos de comparação e agrupamento. Howard (2013) relata os esforços do grupo chefiado por Patrick Meier - pesquisador renomado no campo de Mapeamento de Crises (em inglês, Crisis Mapping ) no desenvolvimento e experimentação de ferramentas voltadas ao apoio do trabalho humanitário após o desastre causado pelo Tufão Haiyan, em novembro de 2013 nas Filipinas. Meier e sua equipe aproveitam o poder de geração de informações das mídias sociais para melhorar a velocidade e a eficácia dos esforços de socorro. A plataforma Micromappers 55, ilustrada na Figura 5.6, conta com a colaboração social através da Internet para rapidamente classificar publicações e fotos coletadas através do monitoramento do microblog Twitter. Voluntários de todo o mundo podem classificar os tweets capturados, segundo uma das seguintes classes (definidas por solicitação da UNDAC para apoiar sua missão de resposta): não relevante, pedidos de ajuda, danos de infraestrutura, pessoas desalojadas, texto não em inglês, relevante, outros. 55 Micromappers -

108 108 Figura 5.6. Plataforma MicroMappers: interface colaborativa para análise e classificação das mensagens e imagens capturadas do microblog Twitter O processo é totalmente online, e qualquer indivíduo conectado à Internet pode colaborar, sem nenhum treinamento ou experiência prévia requerida. Após a etapa de classificação, o conjunto refinado de mensagens mais relevantes segue para o estágio de mapeamento, também executado por usuários colaboradores. Na sequência, a revisão da colaboração é verificada e atestada pela equipe de analistas de informação da plataforma e, finalmente, o conjunto de informações relevantes triadas é encaminhado diretamente às equipes oficiais de reposta à emergência. As etapas de tratamento da informação da plataforma se assemelham ao workflow da plataforma Ushahidi (Figura 5.3), também construída com grande parcela de contribuição de Meier. Agências de ajuda humanitária podem visualizar os registros através de mapas, atualizados em tempo real, de acordo com a chegada de novos conteúdos triados pelos colaboradores, e utilizar as informações para apoiar o planejamento de seus esforços de socorro. Segundo Meier, estes mapas dinâmicos são como ter seu próprio helicóptero, uma vez que fornecem uma visão panorâmica como se desenrolam os acontecimentos no tempo e no espaço. O ganho deste tipo de conhecimento, proveniente diretamente das zonas de crise é um divisor de águas. Essas tecnologias não existiam há apenas alguns anos atrás. (HOWARD, 2013). Ainda com relação à validação quanto à relevância do conteúdo capturado, a plataforma dispõe de mecanismos internos de controle de qualidade, o que significa que cada tweet e imagem devem ser classificados por pelo menos três voluntários diferentes. Assim,

109 109 somente quando três voluntários distintos classificarem a mensagem analisada da mesma forma é que esses dados seguirão para a próxima etapa de tratamento. Em segundo lugar, uma força-tarefa de voluntários da Rede Humanitária Digital (em inglês, Digital Humanitarian Network 56 ) analisa os resultados em um segundo nível de controle de qualidade para garantir a precisão e relevância das mensagens. Adicionalmente, para iniciar a colaboração é necessário criar um breve cadastro na plataforma. Desta forma é possível calcular a reputação de cada usuário, além de estabelecer um ranking de apontamento dos maiores e mais efetivos colaboradores. Finin et al. (2010) descrevem a experiência com o uso das plataformas MTurk 57 (Amazon Mechanical Turk) e CrowdFlower 58 no auxílio à anotação de entidades nomeadas extraídas de publicações do microblog Twitter. Trata-se de serviços de crowdsourcing, especializados na distribuição de tarefas pequenas e repetitivas, a serem executadas remotamente por colaboradores espalhados pelo mundo. A plataforma CrowdFlower, por exemplo, permite aos usuários cadastrar tarefas e distribuí-las aos colaboradores espalhados pelo mundo, preservando a qualidade do resultado do trabalho executado a partir de mecanismos de verificação de assertividade e estratégias de premiação por produtividade e efetividade. Colaboradores cadastrados na plataforma podem consultar a base de trabalhos disponíveis e ingressar nas atividades de colaboração que mais lhes interessarem. Para cada trabalho disponível, o sistema aloca automaticamente um conjunto de tarefas para os colaboradores. Durante as atividades, o colaborador é submetido aleatoriamente e despercebidamente a testes periódicos que comparam o resultado de uma tarefa-teste com o resultado correto (esperado), previamente processado. Tal medida busca a manutenção atualizada da reputação e confiabilidade de cada colaborador envolvido no trabalho. Enquanto o colaborador mantiver seu grau de assertividade e reputação compatível com os limites estabelecidos pelos gestores da atividade, o mesmo permanece habilitado a prosseguir suas tarefas. Caso um colaborador apresente resultados de baixa qualidade, todo 56 Digital Humanitarian Network MTurk CrowdFlower -

110 110 o produto de suas atividades executadas poderá ser descartado e, ele ainda poderá ser removido do trabalho. A plataforma também permite que colaboradores com histórico de reputação continuamente positiva possam atuar como moderadores, isto é, supervisores das atividades desempenhadas por outros colaboradores no trabalho. Tang et al. (2011) defendem que a colaboração pode ser mais efetiva quando envolve políticas de premiações. Esta foi a estratégia adotada pela equipe do Massachusetts Institute of Technology (MIT), da Universidade de Stanford, nos Estados Unidos, vencedora do concurso, Red Balloon Challenge 59. A competição organizada pela DARPA buscou examinar o papel da Internet e das redes sociais como meios de propagação da informação e colaboração em massa diante de cenários que envolvam extensas áreas geográficas. Além disso, a competição procurou explorar a criatividade da montagem de ações práticas para solucionar problemas de ampla escala em reduzido espaço de tempo (cenário este que nos remete às situações de emergências). Dez equipes participaram do desafio, com a meta de localizar dez balões vermelhos espalhados em diferentes localidades do território norte-americano (sempre próximos a locais habitados e rodovias) e notificar à DARPA no menor tempo possível. As redes sociais foram usadas como ferramentas de intercomunicação e também para recrutar pessoas que pudessem prover informações úteis para a busca dos balões. A equipe vencedora adotou uma técnica semelhante ao marketing em multinível 60 para recrutar participantes. O dinheiro do prêmio foi distribuído de forma proporcional, contemplando desde o colaborador que avistou o balão (que receberia a maior porção do prêmio), reduzindo à metade para cada nível superior de informante que propagava a informação, até chegar à equipe MIT, conforme ilustrado na Figura 5.7. Como o valor do prêmio para a equipe vencedora seria de quarenta mil dólares, foi estipulado o orçamento de quatro mil dólares de recompensa por balão. Sendo assim, o informante seria recompensado com dois mil dólares e, para cada informante subsequente, a metade do valor da recompensa recebido pelo informante anterior, desta maneira, garantindo que o orçamento por balão não fosse excedido. 59 Red Balloon Challenge Marketing Multinível -

111 111 Figura 5.7. Estratégia da equipe vencedora do desafio Red Ballon Challenge : política de recompensa baseada em marketing multinível para recrutar participantes A estratégia de propagar a premiação trouxe dois grandes benefícios: 1) Participantes eram incentivados a recrutar novos colaboradores. Novos participantes não foram encarados como competidores dos demais, mas sim parceiros cooperadores. 2) Até mesmo pessoas localizadas fora do território norte-americano motivaram-se a participar da busca, simplesmente passando adiante informações referentes à possível localização do balão. Mesmo não tendo condições de localizá-los pessoalmente, estas pessoas compreendiam que se fizessem parte da rede de propagação de uma informação que culminasse na descoberta de um balão, seriam recompensadas. A estratégia adotada pela equipe vencedora resultou no crescimento da equipe em cinco mil colaboradores. Como resultado apreendeu-se que os times precisaram lidar com informações falsas e boatos intencionais criados pela equipe concorrentes. Parte do propósito do desafio proposto pela promotora do evento era forçar seus participantes a desenvolver a capacidade de discernir informações verdadeiramente úteis de ruídos potenciais através da elaboração de estratégias de validação, como: Múltiplos envios (originados a partir de diferentes pessoas) relatando a presença do balão na mesma localidade aumentam a probabilidade daquela informação ser de fato verdadeira. Envio de fotos com a pessoa e o balão para comprovar a veracidade. Na ocasião da competição, fotos verdadeiras retratavam um funcionário segurando uma faixa da DARPA. O detalhe não foi avisado aos colaboradores para facilitar a eliminação de fotos montagens.

112 112 Com relação ao compartilhamento da informação, a iniciativa de dados abertos interligados (LOD - Linked Open Data) permite a interconexão de dados, utilizando padrões no contexto da abordagem de web semântica. Em condições ideais, as agências governamentais compartilham seus dados públicos, permitindo assim o consumo através de mecanismos automatizados pelos interessados, sejam outras agências do governo ou próprios cidadãos. Esforços destinados a vincular dados do governo estão crescendo em vários países ao redor do mundo Neste sentido, Cordeiro et al. (2011) propõem um esquema de coleta de dados disponíveis a partir de órgãos do governo, tais como departamentos de transporte, saúde, obras, que podem suprir as necessidades de informação durante uma operação de resposta de emergência. Além de informações públicas de órgãos do governo, o esquema também inclui o tratamento e integração de dados de colaboração voluntária, ou seja, dados provenientes de cidadãos e meios de comunicação públicos, envolvidos nas situações de emergência. 61 UK Government Data Open Election Data Project -

113 113 6 Descrição da Arquitetura de Solução O diagrama da Figura 6.1 apresenta a arquitetura de solução proposta e identifica seus elementos constituintes, agrupados nas camadas de usuário, aplicação e armazenamento, e também segmentados quanto ao ambiente no qual se inserem: interno ou externo à arquitetura. Figura 6.1. Arquitetura para coleta e tratamento de informações colaborativas no apoio à decisão em ambientes de emergência A camada de usuário é constituída, no ambiente externo, pelos agentes colaboradores, representados pelos cidadãos, que submetem informações relacionadas ao evento emergencial. Os agentes de campo apoiam oficialmente o comando da crise na avaliação e recuperação dos danos para a retomada ao estado de normalidade. O ambiente interno da camada de usuário da arquitetura é constituído pelos cidadãos voluntários, que atuam como revisores na fase [RCOL] Revisão Colaborativa, em atividades de processamento colaborativo das informações capturadas e tratadas no sistema. Ainda no ambiente interno, a equipe de comando e controle é formada pelo analista da informação, cuja responsabilidade é monitorar as atividades dos revisores, além de avaliar e selecionar as informações processadas que já apresentem condições satisfatórias para serem encaminhadas ao apoio do comando da crise.

114 114 O ambiente externo da camada de aplicação é composto pelos meios de comunicação que atuam como canais de comunicação para a colaboração social, como as redes sociais, mensagens de SMS, s, contatos telefônicos, dentre outros que eventualmente poderão ser integrados ao sistema. Nesta mesma camada, representando as fontes oficiais de informação colaborativa, encontram-se as aplicações destinadas ao cadastro e submissão de informações coletadas pelas equipes de campo durante suas incursões, além dos sensores de monitoramento ambiental, disponibilizados e gerenciados pelas equipes de resposta. No ambiente interno da camada de aplicação encontram-se os componentes das fases de coleta e processamento da informação colaborativa: [COMU] Comunicação, [PREP] Pré- Processamento, [HIST] Histórias e [CONF] Conflitos. Seus papéis desempenhados dentro da arquitetura serão detalhados nas seções seguintes deste capítulo. A camada de armazenamento é constituída, no ambiente externo, por repositórios de dados externos, como os bancos de dados das redes sociais e outras bases das quais a arquitetura poderá extrair informações, estruturadas de acordo com suas respectivas fontes de origem. O ambiente interno da camada de armazenamento é composto por dois repositórios: o repositório de coleta e processamento armazena as publicações coletadas pela plataforma, além de registrar os resultados dos processos de tratamento da informação, ocorridos na camada de aplicação; o vocabulário de referência congrega termos selecionados a partir de vocabulários populares, úteis para a identificação e associação dos atributos semanticamente comuns, entre as distintas fontes de informações do sistema. Cada termo do vocabulário de referência também está associado a um termo correspondente extraído de vocabulários de ontologias de domínio em Linked Open Data. Este mapeamento viabilizará o processo de anotação semântica para fins de compartilhamento da informação tratada. A Figura 6.2 apresenta um workflow que ilustra a sequência de um ciclo de processamento da informação colaborativa dentro da arquitetura proposta, representando as interações entre os agentes e os processos envolvidos na geração, coleta e tratamento da informação em um cenário de emergências.

115 115 As setas em formato de curva no sentido horário que sobrepõem os diagramas na Figura 6.1 e na Figura 6.2 orientam o ciclo de processamento da informação no sistema. Um ciclo de processamento representa o percurso total da informação, desde o momento em que ela foi gerada, passando pelas fases de [COL] Coleta, [PREP] Pré-processamento, [HIST] Agrupamento de Histórias, [CONF] Detecção de Conflitos, até a decisão final do analista de informações por descartá-la, encaminhar ao comando superior ou buscar complementações através da requisição de feedback [FED].

116 116 Figura 6.2. Workflow: agentes, processos e interações envolvidas no ciclo operacional de geração, coleta e tratamento da informação colaborativa no contexto de emergências As subseções a seguir descrevem detalhadamente os elementos da arquitetura e suas interações sistêmicas representadas no workflow acima. O ciclo se inicia quando um agente

117 117 colaborador publica uma informação por meio de uma das fontes de informações disponíveis para coleta. Em seguida, a informação é submetida a uma sequência de processos especializados, ordenados e agrupados em fases 63. No estágio final do ciclo de processamento, a avaliação do analista de informação julgará se a informação processada encontra-se suficientemente consistente e completa para finalmente ser disponibilizada ao consumo pelo comando da resposta. Caso contrário, aproveitando os mesmos recursos de geração de informação colaborativa, a informação conflitante ou incompleta poderá ser submetida a um processo de retroalimentação do sistema (feedback) em busca de complementações e/ou soluções de conflitos detectados. 6.1 Ambiente Externo As subseções a seguir caracterizam os agentes e os meios de comunicação disponíveis para o provimento de informação a partir da colaboração Agentes Colaboradores Como se pode observar no workflow da Figura 6.2, a informação colaborativa pode ser gerada a partir das seguintes situações: Por iniciativa do cidadão, ao testemunhar um fato relevante (de acordo com o seu ponto de vista) relacionado ao evento emergencial, o cidadão decide relatar seu testemunho através de um canal de comunicação. Por demanda do comando da resposta, requisitando o cumprimento de tarefas específicas a sua equipe de agentes de campo. As tarefas possuem distintas finalidades, como a busca de novas informações através de avaliações por especialistas, ou a requisição de confirmações ou complementações sobre um determinado evento ou localidade de interesse. Tarefas que não demandem conhecimento ou treinamento específico podem eventualmente contar com o apoio voluntário do próprio cidadão. Os exemplos abaixo apresentam cenários nos quais o comando pode explorar o conhecimento popular local para fins de obtenção de informações básicas. 63 Segundo Santos e Schwabe (2004, p.7), fase é um agrupamento de processos de software fortemente relacionados conduzidos em algum tipo de ordem.

118 118 o O escritório de comando solicita aos voluntários que confirmem o número de casas destruídas na Avenida Presidente Vargas. o Qual o nome e telefone de contato do líder comunitário do bairro Caleme? o Necessitamos de imagens do deslizamento ocorrido na Rua Joaquim Cruz, Campo Grande. o Necessitamos de voluntários para verificar o nível do Rio Itajaí. Instruções do procedimento seguem em anexo a esta mensagem. Assim, quando requisitado pelo comando, o despacho deve ser encaminhado diretamente a sua equipe de agentes de campo. Eventualmente cidadãos também podem ser requisitados a colaborar através dos meios de contato disponíveis ao comando (redes sociais, , telefone, etc.). No segundo caso, cidadãos colaboradores mais próximos ao local do evento em questão poderão contribuir publicando suas constatações in loco e até mesmo enriquecê-las com conteúdo multimídia. Qualquer conteúdo gerado a partir da resposta a esta requisição será então submetido a um novo ciclo de processamento no sistema. Cada nova entrada incrementará a base de conhecimento, poderá ajudar a solucionar eventuais conflitos detectados e, por fim apoiar a decisão do comando da resposta à crise Fontes de Informação Colaborativa Para as contribuições recebidas através de chamadas telefônicas, uma central de atendimento deverá dispor atendentes treinados para filtrar e cadastrar toda informação relevante adquirida através do diálogo estabelecido com o colaborador, a exemplo do que já é praticado nas centrais de atendimento de emergência espalhadas pelo mundo, como é o caso do SOS Alarm (2008). As informações organizadas segundo formulários previamente estruturados pelo comando podem ser extraídas diretamente de suas bases dados, exclusivamente acessíveis ao comando. Para as colaborações recebidas através de mensagens SMS, um número telefônico exclusivo do escritório de comando da resposta receberá as mensagens relacionadas ao evento emergencial, a exemplo da estratégia adotada pela iniciativa Mission 4636, durante as atividades de resposta ao terremoto do Haiti (MUNRO, 2013).

119 119 As redes sociais disponibilizam interfaces amigáveis, objetivas e são altamente eficientes quanto à disseminação da informação, devido aos seus mecanismos práticos de compartilhamento e as interligações existentes entre seus usuários. Tais características propiciam as condições favoráveis para o provimento ágil da informação colaborativa durante situações de emergência (REUTER et al., 2011; R. SABRA JAFARZADEH, 2011; CHOWDHURY et al., 2013; SPRING et al., 2013; PUROHIT et al., 2013; OLTEANU et al., 2014). Outro aspecto positivo é o fato dos provedores destes serviços comumente disponibilizarem mecanismos práticos para a extração automatizada dos dados armazenados em seus repositórios (a ser detalhado na subseção ). Equipes de campo alimentam bases de dados por meio de aplicações que operam em seus dispositivos móveis. O preenchimento de formulários exclusivamente modelados para o domínio de emergência estabelece a padronização de formatos e estrutura de dados entre os profissionais de campo e o escritório de comando. Marino et al. (2012) apresentam uma plataforma que opera com este propósito. O comando da resposta à crise poderá aproveitar sensores de monitoramento ambiental disponibilizados por terceiros (desde que habilitados ao acesso público) ou providenciar a instalação de dispositivos de sensoriamento, de acordo com seus interesses específicos de monitoramento. Assim, leituras instantâneas e contínuas do ambiente poderão ser realizadas como, por exemplo, o acompanhamento do nível de um rio, volume de chuva em determinados períodos e imagens ao vivo de locais de risco. Através de módulos GPRS integrados, as leituras realizadas pelos sensores ambientais podem ser transmitidas em tempo real a repositórios de dados na web e, assim, imediatamente consultados através de serviços web (em inglês, web services), conforme abordado por Boman et al. (2014). 6.2 Ambiente Interno As subseções a seguir descrevem as fases operacionais e seus processos constituintes, no ambiente interno da arquitetura de solução [COMU] Fase de Comunicação A fase de comunicação intermedia a entrada e saída das informações entre os dois ambientes do sistema. As subseções seguintes descrevem o papel dos dois processos que viabilizam o fluxo da informação do ambiente externo para o ambiente interno, e vice-versa.

120 [COL] Coletar Publicações Como etapa inicial do ciclo de processamento, agentes colaboradores geram informações relativas ao evento, armazenadas dispersamente em distintos tipos de repositórios na Internet. Por exemplo, toda informação publicada nas redes sociais é armazenada em seus servidores próprios que, apesar de dispersos geograficamente, comumente encontram-se acessíveis para consulta por meio de serviços web. Hoje, as mais populares redes sociais já disponibilizam APIs (vide o Quadro 6.1) que possibilitam a qualquer desenvolvedor elaborar métodos de consultas automatizadas aos seus repositórios de dados. Por uma medida de padronização e simplificação à comunidade desenvolvedora, as redes sociais mais populares vêm adotando o mesmo protocolo de acesso às suas bases de dados, através de requisições baseadas na simplicidade da arquitetura REST proposta por Fielding (2000). Fonte Informação Quadro 6.1. Fontes de informações e suas respectivas referências à documentação API Referência da Documentação API Facebook YouTube Flickr Instagram Twitter Xively Vicon A uniformidade no padrão de protocolos de acesso e extração de informação reduz a complexidade da agregação de novas fontes de informações ao sistema. Basta apenas consultar a documentação de acesso à base de dados, desenvolver o método de extração da nova fonte e integrá-lo ao sistema. Para que a captura dos dados seja praticamente em tempo real, o processo [COL] Coletar Publicações é executado com frequência programada, a ser definida pelo

121 121 administrador do sistema, com base na dinâmica de atualização específica de cada fonte de informação. A cada nova interação de coleta, o processo consulta o repositório de dados da fonte de informação e extrai somente as publicações mais recentes, ou seja, aquelas que possuam data de criação posterior à data da última coleta realizada. Filtragens por meio de palavras-chave relacionadas ao evento emergencial podem ser aplicadas às consultas com a finalidade de reduzir e tornar o conjunto retornado mais refinado e livre de conteúdo inútil. Tal medida também implica na redução do tempo de resposta às consultas das bases de dados externas e do processamento interno da arquitetura. Todo conteúdo extraído das fontes de informações colaborativas é condensado e encaminhado para a próxima etapa, dando início à fase de pré-processamento da publicação [FED] Requisitar Feedback Ainda na fase de comunicação, o processo [FED] Requisitar Feedback é constituído por procedimentos que viabilizam a comunicação com o ambiente externo, a partir do ambiente interno. Cada fonte de informação colaborativa pode disponibilizar um procedimento de publicação. Para requisitar um feedback, são necessários apenas o identificador único do contato naquela fonte e o texto da mensagem a ser publicada na requisição. Convém observar que determinadas fontes de informações podem não disponibilizar mecanismos para o estabelecimento do contato de retorno. O atributo identificador do contato é a chave que identifica exclusivamente o emissor em cada uma das fontes de informação. Este identificador está presente no conjunto de dados de cada informação extraída no processo [COL] Coletar Publicações. Por exemplo, nas redes sociais cada usuário está associado a um identificador único, geralmente representado por uma sequência numérica extensa 64. Para chamadas telefônicas e mensagens SMS este identificador equivale ao próprio número do terminal telefônico. No vocabulário de referência organizado para estabelecer associações entre atributos provenientes das diferentes fontes informações (processo detalhado na subseção ), o atributo de identificação única do emissor será associado ao termo Post.Who.From.strID. Desta maneira o comando da reposta pode estabelecer um contato de retorno com os 64 Onde encontrar o meu Facebook User ID -

122 122 cidadãos colaboradores e seus agentes de campo a fim de demandar tarefas e requisitar informações de feedbacks. Os mecanismos de feedbacks fecham um ciclo no sistema, denominado ciclo de maturação da informação (ilustrado na Figura 6.11), onde cada nova interação pode promover a evolução da base de conhecimento através da própria colaboração social. Uma requisição de feedback apresenta os seguintes parâmetros: 1. O quê? 1.1. Nulo: quando uma informação nova é requisitada. Trata-se apenas uma campanha em busca de uma nova informação acerca de um local, uma pessoa ou um evento específico. Neste caso, seu retorno entrará no sistema como uma nova publicação e percorrerá normalmente as etapas o ciclo de processamento; 1.2. Publicação: quando a requisição está relacionada a uma publicação específica do repositório de coleta e processamento, em busca de complementariedade ou da resolução de conflitos. 2. Para quem? 2.1. Nulo: para todos (broadcast); 2.2. {Usuários}: para um determinado grupo de informantes, em função da proximidade geográfica, grau de confiabilidade da fonte, frequência de colaboração. Um encaminhamento seletivo pode aumentar as chances de requisitar a quem de fato possa rapidamente retornar à requisição, preservando a atualidade da informação. 3. Por quanto tempo? Um temporizador de validade para a requisição pode ser definido, bem como ações a serem tomadas após o esgotamento do prazo: 3.1. Notificar o analista de informações; 3.2. Requisitar um novo feedback a outro grupo de destinatários; 3.3. Descartar a publicação geradora da requisição. Publicações relativas a retornos de feedback possuem alta prioridade de tratamento no sistema. Seu escalonamento pode ocorrer em função da urgência e/ou do tempo no sistema, a fim de preservar ao máximo o grau de atualidade da informação.

123 123 Os retornos buscam respostas quantitativas e objetivas para que o processamento automatizado do resultado obtenha o melhor desempenho possível e dispense a necessidade do encaminhamento para o processamento supervisionado (manual), o que elevará o tempo de tratamento da mensagem e, consequentemente, depreciará seu grau de atualidade. Os casos a seguir ilustram exemplos de requisições objetivas de feedback: [Requisição 1234] Informe NUMERICAMENTE quantas pessoas estão desalojadas no seu bairro? Para N pessoas, responda conforme o seguinte exemplo: [1234] N [Requisição 5678] - Está chovendo no Caleme? Para SIM, responda conforme o seguinte exemplo: [5678] SIM [PREP] Fase de Pré-Processamento Cada publicação coletada é submetida a uma sequência semi-automatizada de processos de associações, conversões, seleção de atributos quantitativos e classificação. As subseções a seguir descrevem o papel de cada processo envolvido nesta fase operacional da arquitetura [AAV] Associar Atributos ao Vocabulário Cada fonte de informação dispõe de uma estruturação de dados específica, bem como terminologia própria para descrever seu conteúdo. Desta forma, foi elaborado um vocabulário de referência (apresentado na Figura 6.3 e detalhado no Apêndice C) que congrega o conjunto básico de atributos necessários para o tratamento da informação pela arquitetura.

124 124 Figura 6.3. Vocabulário de referência para associação de atributos equivalentes e anotação semântica de publicações coletadas O termo Post.strPrimaryKey, por exemplo, identifica o atributo referente ao identificador único (conhecido como chave-primária na terminologia de banco de dados) da mensagem em cada fonte de informação. Na fonte de informação ilustrada na Figura 7.3, este atributo é representado pelo campo key, que assume valores como A chave-primária permite a identificação inequívoca da publicação em sua fonte de origem, além de evitar que o processo [COL] Coletar Publicações capture conteúdo duplicadamente. O vocabulário de referência congregará termos responsáveis por identificar e associar atributos semanticamente equivalentes, provenientes das distintas fontes de informações presentes no sistema. Além disso, o vocabulário serve como referência no processo de anotação semântica para fins de compartilhamento segundo o modelo aberto e interoperável

125 125 Linked Open Data, aproveitando termos selecionados de vocabulários de domínio populares, como o SIOC 65, MOAC 66, DBpedia 67, WGS84 68, DCMI 69. Uma vez definidas (de forma manual, no momento da inclusão da nova fonte na arquitetura) as associações entre o vocabulário de referência e o conjunto de atributos da fonte de informações, o processo [AAV] Associar Atributos ao Vocabulário mapeará automaticamente cada atributo da informação coletada com o seu respectivo termo equivalente do vocabulário de referência. Estas associações permitirão a interligação das distintas fontes agregadas ao sistema, através dos atributos semanticamente equivalentes, conforme ilustrado na Figura 6.4. Além disso, o mapeamento proporciona a organização dos dados sob uma estrutura uniforme, facilitando sua identificação nas etapas subsequentes do tratamento. Figura 6.4. Processo [AAV] Associar Atributos ao Vocabulário : os atributos das informações coletadas a partir de diferentes fontes são mapeados e associados com base no vocabulário de referência [VTF] Verificar e Tratar Feedback Um retorno de feedback deve conter um identificador específico de modo que, após a coleta, possa ser identificado, associado a sua respectiva requisição originadora e,

126 126 encaminhado ao devido tratamento. Desta forma, ao retornar um feedback, o colaborador deverá ser instruído a inserir o identificador no corpo da mensagem. O exemplo a seguir ilustra uma situação de requisição e retorno de feedback devidamente identificados: REQUSIÇÃO: Requisição Prezado Colaborador, o comando precisa saber a quantidade atualizada de desabrigados no bairro Caleme. Para N desabrigados, responda conforme o seguinte exemplo: [1234] N. RETORNO: [1234] 10 Conforme representado no workflow da Figura 6.2, caso se trate de um feedback de complementação ou de inconsistência, o valor retornado será extraído e, então considerado em uma nova rodada de verificação na fase de processamento [CONF] Conflitos (encaminhamento representado pelo conector (1) no workflow). As requisições de feedbacks buscam retornar respostas quantitativas e objetivas para que o processamento automatizado do resultado obtenha o melhor desempenho possível. Porém, considerando as ocasiões em que as respostas são geradas por seres humanos, em alguns casos o processamento poderá extrair um valor inválido ou inesperado. Diante de um eventual insucesso na tentativa de extração automatizada, a resposta poderá ser encaminhada à fase de [RCOL] Revisão Colaborativa (encaminhamento representado pelo conector (2) no workflow), para o processamento supervisionado por colaboradores, a exemplo de abordagens apresentadas no Capítulo 5 (FININ et al., 2010; HEINZELMAN, J.; WATERS, 2010; ROGSTADIUS; KOSTAKOS, 2011; HOWARD, 2013). De forma alternativa ou complementar, uma nova requisição de feedback também pode ser enviada a um novo grupo de usuários, em função da proximidade e/ou nível de confiabilidade da fonte de informação. Por exemplo, uma nova requisição para os agentes de campo mais próximos da localidade de interesse [CFD] Compatibilizar Formato de Data A incompatibilidade de formatos representa um obstáculo típico de integração de dados. Hoje, diversas abordagens e ferramentas do tipo ETL (Extract, Transform, Load) já se especializam no tratamento de problemas desta natureza (CORDEIRO, 2015).

127 127 Todavia, ao propor uma arquitetura de solução flexível ao elevado grau de heterogeneidade característico do ambiente de emergências, a compatibilização de dados é indispensável para a construção de procedimentos de tratamento generalistas, isto é, não comprometidos com as especificidades dos distintos meios de geração de informação. Para resolver este requisito de integração, após o processo [AAV] Associar Atributos ao Vocabulário identificar o atributo correspondente à data de geração da informação (associado ao termo Post.When.dtPosted do vocabulário de referência), o processo [CFD] Compatibilizar Formato de Data interpreta a data de publicação, convertendo-a segundo o padrão adotado pelo sistema. A especificação prévia do administrador sobre o formato padrão de data apresentado pela fonte de informação originadora auxilia o autômato na tarefa de interpretação da ordem sequencial dos valores dia, mês, ano, hora, minuto e segundo, dentro do atributo temporal processado. Os exemplos retratados no Quadro 6.2 ilustram valores de entradas e resultados deste processamento: Fonte Info Quadro 6.2. Exemplo de entradas e resultados do processamento de publicações no processo [CFD] Compatibilizar Formato de Data Atributo Data P.When.dtPosted Valor Original do Atributo Resultado de [CFD] YYYY-MM-DD HH:MM:SS time T07:16:17.510Z :16:30 created_time T16:49: :49:11 date_received 1/16/10 20: :46:00 datetaken :03: :03:01 created_on 22/01/ : :35:00 No caso do insucesso da tentativa de compatibilização automática do formato de data, a publicação será sinalizada e encaminhada para o processamento colaborativo supervisionado [MCFD] Compatibilizar Formato de Data Manualmente, na fase [RCOL] Revisão Colaborativa (representado no workflow pelo conector (3)) [CFC] Compatibilizar Formato de Coordenadas De forma análoga ao tratamento executado pelo processo [CFD] Compatibilizar Formato de Data, este processo buscará, em primeiro nível, compatibilizar automaticamente

128 128 o formato dos atributos referentes às coordenadas de localização da publicação, associados aos termos Post.Where.dblLatitude e Post.Where.dblLongitude do vocabulário de referência. Em caso de insucesso na compatibilização de formatos ou mesmo da inexistência de valores associados aos atributos (como é o caso das mensagens SMS), o processamento será encaminhado para um segundo nível de tratamento, onde métodos de linguagem natural buscam extrair o nome da localidade geográfica dentro do corpo do texto da publicação (associado ao termo Post.What.strMessage) e geocodificá-lo 70 a fim de obter as coordenadas geográficas relativas ao local objeto da informação processada. No caso de novo insucesso após o tratamento em segundo nível, a falha será sinalizada e a mensagem encaminhada para o georreferenciamento por meio do processamento colaborativo supervisionado [MGEO] Geolocalização Manual (encaminhamento representado pelo conector (4) no workflow) [VID] Verificar Idioma Como pré-requisito para a execução do processo [CLA] Classificar (descrito na subseção a seguir), é necessário que o conteúdo informativo esteja disponível no idioma previamente definido para o evento (inglês, por exemplo). A propósito, segundo o levantamento realizado por Amaral (2003), a clareza é um atributo fundamental para o julgamento da qualidade de uma informação. Deste modo, a adoção de um idioma padrão é também essencial para que os consumidores das informações possam compreendê-las claramente. Algumas fontes (ex.: redes sociais, mensagens de ) podem informar o idioma da publicação em seu conjunto original de atributos. Neste caso, o atributo indicador do idioma da mensagem deverá ser associado ao termo Post.What.strLanguage do vocabulário de referência. Para os demais casos (ex.: SMS) é necessário submeter o conteúdo textual a métodos automáticos para identificação do idioma da publicação. Técnicas de processamento de linguagem natural apresentam resultados satisfatórios para a detecção de idiomas nativos em textos. Algumas ferramentas populares são Google Translate 71, Microsoft Translator 72, AlchemyAPI 73. Todavia, os serviços automatizados hoje 70 Geocodificação é o processo de converter endereços (por exemplo, Av. Presidente Vargas, 20, Centro, Rio de Janeiro ) em coordenadas geográficas (por exemplo, latitude 21, e longitude -43,083739). 71 Google Translate API -

129 129 disponíveis ainda não apresentam boa efetividade na tradução completa de conteúdos que apresentam elevado grau de coloquialismo (abreviações, elementos de paralinguagem, erros de gramática), como é o caso característico da colaboração popular em situações de emergências, conforme abordado na seção 4.4. No workflow projetado para a arquitetura, após detectar automaticamente o idioma da publicação, basta compará-lo com o idioma oficial adotado pela equipe de resposta. Em caso de compatibilidade do idioma, a publicação poderá seguir para a próxima etapa de tratamento. Caso contrário, para evitar o descarte prematuro de informações potencialmente úteis, seguirá as abordagens propostas por Heinzelman, e Waters (2010) e Munro (2013). Os autores sugerem o encaminhamento de publicações em outros idiomas para a tradução por colaboradores especializados, como voluntários locais ou quaisquer outros indivíduos conhecedores do idioma local. Assim, a publicação seguirá para o processo [MTRA] Tradução Manual da fase de revisão colaborativa (representado no workflow pelo conector (5)) [CLA] Classificar A exemplo das dimensões tempo (quando) e espaço (onde), a dimensão taxonômica (o quê) também é essencial para a identificação de similaridades entre publicações, segundo a heurística elaborada e aplicada na fase de agrupamento em histórias [HIST]. Assim, para a composição da dimensão taxonômica de uma publicação, o processo classificatório [CLA] varrerá todo o seu conteúdo textual em busca de correspondências de palavras-chave cadastradas para categorias pré-definidas pelo administrador da plataforma. Por exemplo, saúde, segurança, logística, nutrição, etc.. Para aumentar o desempenho do processo, o classificador também analisa expressões regulares construídas a partir de combinações de palavras-chave com operadores lógicos. Por exemplo, a partir da expressão road&(block collapse), definida para a classe Collapsed Structures, o classificador atribuirá tal classe para todas as ocorrências conjuntas dos termos road e block ou road e collapse dentro do conteúdo textual analisado. Convém observar que a ordem de ocorrência dos termos não influencia no 72 Microsoft Translator API AlchemyAPI -

130 130 resultado da varredura sobre a publicação. Desta forma, basta que ambos os termos ocorram conjuntamente, em qualquer posição no texto analisado para que seja associado à classe. O classificador também verifica a ocorrência das palavras-chave em subpartes dos termos constituintes do conteúdo textual varrido. Desta forma, a utilização de radicais de palavras (procedimento conhecido como stemming 74 ) como palavras-chave pode produzir um resultado classificatório mais efetivo. Por exemplo, ao se deparar com a ocorrência do termo roads durante a varredura do conteúdo textual da publicação, o classificador atribuirá a classe Collapsed Structures, uma vez que o termo roads contém a palavrachave cadastrada road [HIST] Histórias Os procedimentos aplicados até este estágio assumem um papel fundamental na adequação dos dados requeridos para o processamento das etapas subsequentes. Por esta razão foram congregados em uma fase operacional denominada pré-processamento. Deste ponto em diante, as estratégias adotadas para o estabelecimento de correlações, identificação e tratamento de conflitos dentro de grupos de informações correlatas, constituem o cerne da contribuição deste trabalho [EPC] Encontrar Publicações Correlatas Este processo busca estabelecer associações entre a publicação corrente e as demais já tratadas e armazenadas no repositório de coleta e processamento. Evidentemente que a automatização desta etapa é indispensável, uma vez que seria inviável calcular e comparar milhares de mensagens entre si, manualmente. A heurística adotada realiza comparações em pares (vide ilustração da Figura 6.5) entre publicações de um conjunto caracterizado pelo elevado grau de heterogeneidade estrutural. Para isso, cria um índice comparativo que conjuga três atributos básicos de uma informação: espaço (onde), tempo (quando) e taxonomia (o quê) (HART, 1996). A este índice será atribuído o nome de Índice de Correlação (C m,n ). 74 Stemming -

131 131 Figura 6.5. Índice de Correlação: comparação pareada entre publicações armazenadas no repositório de coleta e processamento e a publicação ingressante no processo [EPC] Encontrar Publicações Correlatas A sequência desta subseção apresenta a composição elaborada para a determinação do Índice de Correlação. Cesp m,n - Índice de Correlação Espacial (Onde): presume-se que quanto menor for a distância geográfica entre duas publicações, maior a probabilidade de ambas se referirem a uma mesma história. Esta proposição pode ser expressa através da seguinte equação: { Onde: distância euclidiana, em metros, entre as publicações m e n. distância máxima (pré-estabelecida a critério do analista), em metros, para correlacionar duas publicações. [ ] Pode-se verificar através do Gráfico 6.1 que, ao expressar o Índice de Correlação Espacial simplesmente em função da razão inversa da distância euclidiana entre as publicações comparadas, sua distribuição assume um comportamento não-linear (representada no gráfico pela linha amarela). Neste caso, o índice decresce rapidamente para distâncias euclidianas pequenas, enquanto que, para distâncias maiores, o índice se aproxima lentamente do valor zero. Por outro lado, a formulação expressa através da equação acima apresenta uma distribuição inversamente proporcional à distância (representada no gráfico pela linha de verde), com comportamento linear e, portanto, em conformidade com a proposição que a define ( o grau de correlação entre duas publicações é inversamente proporcional à distância entre elas ).

132 132 Gráfico 6.1. Comportamento da distribuição do Índice de Correlação Espacial (C esp ) segundo diferentes formulações O parâmetro d MAX estipula o limite máximo da distância euclidiana entre duas publicações para que o cálculo do índice seja executado. Caso a distância entre as publicações exceda o valor d MAX, será assumido que ambas encontram-se demasiadamente distantes e, portanto, o Índice de Correlação Espacial será igual a zero. Além de atuar como um balizador de proporcionalidade para solucionar o problema representado no Gráfico 6.1, o parâmetro d MAX também cumpre função de aumentar a eficiência do sistema, uma vez que evita processar e correlacionar publicações demasiadamente distantes. Ctemp m,n - Índice de Correlação Temporal (Quando): de forma análoga ao Índice de Correlação Espacial, presume-se que quanto menor for o intervalo de tempo entre duas publicações, maior a probabilidade de ambas se referirem a uma mesma história. Esta proposição pode ser expressa através da seguinte equação: { Onde: intervalo de tempo, em segundos, entre as publicações m e n. intervalo de tempo máximo (pré-estabelecido a critério do analista), em segundos, para correlacionar duas publicações.

133 133 [ ] Ctax m,n Índice de Correlação Taxonômica (O Quê): presume-se que quanto maior a quantidade de classes comuns entre duas publicações, maior a probabilidade de ambas se referirem a uma mesma história. Esta proposição pode ser expressa através da seguinte equação: { ( ) ( ) ( ) ( ) Onde: conjunto de classes atribuídas à publicação m. [ ] C m,n - Índice de Correlação: Determinado em função da conjugação entre espaço, tempo e taxonomia, conforme a equação a seguir: [ ] [ ] Onde: [ ] valor binário (0 ou 1) que especifica se ambas as publicações m e n retratam um evento. [ ] O parâmetro [EVENT m,n ] condiciona a contribuição da dimensão temporal para o cálculo da correlação em função da natureza dos fenômenos retratados nas publicações. De acordo com Xavier-da-Silva e Marino (2011), as entidades diferenciam-se dos eventos essencialmente em virtude de seus distintos intervalos de ocorrência no tempo, segundo a escala cronológica humana. Enquanto os eventos descrevem as transformações do ambiente ocorridas em intervalos de tempo relativamente curtos, as entidades registram os fenômenos ambientais que se transformam lentamente e, de forma imperceptível à observação momentânea de um indivíduo. Por exemplo, conforme representado na Figura 6.6, a validade da informação acerca da existência de um hospital (entidade) perdura enquanto o mesmo realizar atendimentos.

134 134 Desta maneira, não é correto atribuir apenas um momento específico e pontual no tempo para representar existência do hospital no ambiente. Por outro lado, a temporalidade da informação referente a uma solicitação de ajuda para um cidadão ferido (evento) perdura apenas durante o intervalo de tempo (alguns minutos ou horas) entre a data do evento causador de seu ferimento e o momento em que ele fora socorrido. Figura 6.6. Representação ilustrativa dos distintos períodos de validade temporal para informações relativas a eventos e entidades Portanto, para os casos em que ao menos uma das publicações comparadas represente a instância de uma entidade (condição para que o parâmetro [EVENT m,n ] seja igual a zero), a dimensão temporal será desconsidera e, a equação será balanceada de modo a quantificar o correlação equitativamente, apenas em função das componentes espacial e taxonômica das informações comparadas (50% de contribuição para cada dimensão). De acordo com a formulação proposta, mesmo para os casos em que a informação apresente deficiência em alguma das três dimensões, o Índice de Correlação não será integralmente anulado. A carência de um atributo (dimensão) apenas penalizará parcialmente o resultado final do cálculo. Neste caso, a carência de qualquer um dos atributos penaliza igualmente o Índice de Correlação em 33,33%. Por exemplo, para uma publicação que não apresente a informação de localização espacial (atributo espaço ), o cálculo da Correlação Espacial (C esp ) entre tal publicação e quaisquer outras será igual a zero. Contudo, esta publicação ainda poderá ser agrupada com outras publicações, caso os cálculos parciais para os demais atributos (temporal e taxonômico) obtenham valores suficientes para elevar o Índice Correlação ao limite mínimo ( in) estipulado para a agregação, no processo [AGR] Agrupar em Histórias.

135 [AGR] Agrupar em Histórias Para cada publicação P m ingressante no sistema, será formada a sua respectiva história 75 H m. Para a história H m, a publicação P m é denominada Publicação Raiz, uma vez que o processo compara o cálculo do Índice de Correlação, um a um, entre esta publicação e todas as demais já armazenadas no sistema. Um Índice de Correlação Mínimo ( in), previamente estipulado, regula se cada publicação P n avaliada será ou não incluída na história H m. A relação de equivalência C m,n = C n,m determina uma relação binária simétrica 76 entre as histórias H m e H n. Isto significa que, caso P m seja agregada à história H n, consequentemente a publicação P n também será agregada à historia H m. Matematicamente, esta relação pode ser expressa da seguinte forma: Este processo evidenciará novas associações entre publicações (ora desconhecidas), além de quantificar a intensidade destes relacionamentos. Para o compartilhamento da informação tratada, um vocabulário especializado (apresentado no Apêndice D) foi elaborado para anotar e quantificar estas relações através do padrão RDF, conforme exemplificado na Figura Por convenção terminológica neste trabalho, será assumido que uma História corresponde ao agrupamento de publicações com elevado grau de correlação entre si. 76 Uma relação binária é simétrica se a relação de a com b implica na relação de b com a (REISSWITZ, 2009).

136 136 Figura 6.7. Anotação semântica da publicação tratada segundo o padrão RDF: informação sobre os atributos temporal, espacial e taxonômico e suas correlações com outras publicações armazenadas no repositório de coleta e processamento [CONF] Conflitos [ICO] Identificar Conflitos em História O processo sinaliza conflitos ocorrentes entre atributos comuns, dentro de um conjunto de publicações que constituem uma história. Desta maneira, como requisito de processamento, é necessário identificar preliminarmente a ocorrência dos atributos quantitativos em cada publicação coletada. A identificação dos atributos quantitativos é realizada por colaboradores na etapa representada pelo processo [MIAQ] Identificar Atributos Quantitativos, na fase [RCOL] Revisão Colaborativa do workflow. Logicamente que procedimentos mais sofisticados, baseados no processamento de linguagem natural poderão substituir este processo, para fins de elevação da autonomia do sistema.

137 137 A Figura 6.8 ilustra um cenário exemplo da ocorrência de conflitos de incongruência de valores entre atributos comuns dentro de uma história. Figura 6.8. Exemplo de atributos conflitantes entre publicações que constituem uma história [RCO] Resolver Conflito Apesar da possibilidade de elaborar mecanismos automatizados para a decisão de conflitos de forma autônoma, optou-se por uma abordagem de tomada de decisão semiautomatizada, ou seja, supervisionada por humanos. A decisão por adotar uma abordagem simplista para a solução de conflitos deu-se fundamentalmente por motivos de priorização em concentrar o tempo disponível nesta pesquisa para dedicar-se mais cuidadosamente nos métodos de grupamento (descritos na subseção 6.2.3), que constituem o cerne da contribuição e inovação da arquitetura de solução proposta. Contudo, alternativas de resolução automática de conflitos serão sugeridas no capítulo de conclusões, como propostas de continuidade e aprimoramento desta pesquisa. Ao identificar um conflito de atributos, o analista de informações será acionado. Conforme a situação ilustrada na Figura 6.10, uma interface objetiva lhe proverá recursos visuais e indicadores relacionados às publicações, fontes e colaboradores envolvidos no conflito, de modo a apoiar o encaminhamento do problema sinalizado.

138 138 Figura 6.9. Analista de informações analisa o conflito e decide pelo encaminhamento da situação [RCOL] Revisão Colaborativa Todos os processos constituintes desta fase operacional buscam complementar e apoiar a fase de pré-processamento nos casos em que a adoção de métodos automatizados seja inviável e/ou demande alto custo de processamento. Apresentam-se também como uma alternativa de encaminhamento para as ocasiões onde os mecanismos automatizados da arquitetura não foram capazes de gerar o resultado esperado. Conforme levantado na pesquisa do estado da arte no Capítulo 5, diversas iniciativas e estudos de caso abordam a distribuição de atividades a colabores (FININ et al., 2010; MUNRO, 2013), formas de incentivo à colaboração (TANG et al., 2011), medidas verificadoras e reguladoras da qualidade das atividades colaborativas, como técnicas de múltiplos encaminhamentos (HOWARD, 2013; SPRING et al., 2013) e a formação e análise da reputação de colaboradores (HEINZELMAN, J.; WATERS, 2010). Portanto, esta fase operacional representa para a arquitetura conceitual, um encaminhamento alternativo que apela para a colaboração social, e aproveita a capacidade do raciocínio humano para apoiar a resolução dos casos de insucesso e/ou inviabilidade de aplicação do processamento automatizado Estrutura de Armazenamento e Recuperação Diante de uma proposta do enriquecimento da base de conhecimento contextual atual, a maior parcela de informações absorvidas pelo sistema ocorre durante a fase de resposta da emergência, ou seja, dentro de aproximadamente até quatro semanas após sua deflagração (ANNUNZIATA; OCKWELL, 2008). Com base nos casos de apoio a emergências através da colaboração social, o projeto Ushahidi aponta que a ordem de grandeza do volume de informações gerado nessas ocasiões de fato não demanda estruturas de armazenamento de grande porte (HEINZELMAN, J.; WATERS, 2010).

139 139 Portanto, em termos de volume de dados e escalabilidade, acredita-se que a adoção de uma estrutura de bancos de dados relacional seja suficientemente capaz de armazenar e recuperar os dados coletados e tratados nesta arquitetura. 6.3 Aspectos da Complexidade Relacionados à Arquitetura Esta seção estabelece associações entre propriedades dos sistemas complexos e elementos da arquitetura. O final da seção apresenta um quadro sinótico que organiza definições de propriedades da complexidade, segundo pensadores desta área de conhecimento, e suas respectivas associações com os elementos da arquitetura e o cenário de emergências Propriedades Emergentes e Feedbacks Num ambiente colaborativo para o apoio da resposta à emergência, a informação tratada pela arquitetura para apoiar a decisão da equipe de comando é uma propriedade emergente resultante da conjugação dos conhecimentos pessoal anterior (experiência dos profissionais diretamente envolvidos na resposta), formal anterior (dados de agências e secretarias de governo) e contextual atual (originado pelos cidadãos, equipes de campo e sensores de monitoramento ambiental). Neste caso o todo, isto é, o ganho de conhecimento para a tomada de decisão, é maior que a soma das informações que a geraram, conforme ilustrado na Figura Figura O Conhecimento Combinado que apoia as Equipes de Decisão é uma propriedade emergente da conjugação dos Conhecimentos Pessoal Anterior, Formal Anterior e Contextual Atual. Adaptado de Diniz et al. (2005) É possível também identificar propriedades emergentes resultantes de cada nova iteração do ciclo de maturação da informação (Figura 6.11). Os mecanismos de feedbacks geram novas requisições às fontes de informação em busca da complementação ou resolução

140 140 de inconsistências na informação anteriormente capturada. Em resposta às requisições, novas colaborações são prestadas, processadas e avaliadas, promovendo o enriquecimento da base de conhecimento contextual. Figura Feedbacks propiciam o enriquecimento e a evolução da base de conhecimento a cada novo ciclo de maturação da informação Organicidade Funcional e Multiescalaridade Segundo Prado (2011), em um sistema complexo cada subsistema possui um processamento interno de informações (ou processamento algorítmico), de modo a ocorrer uma relação funcional entre os subsistemas. Pode-se então considerar que um sistema complexo é um conjunto de partes ou subsistemas com processamentos internos singulares, conectadas entre si, formando uma unidade coletiva com uma dinâmica própria e propriedades emergentes. Na arquitetura proposta, os diferentes estágios de tratamento submetem a informação a procedimentos de associações, agrupamentos, estabelece mecanismos para identificar e solucionar casos de escassez e conflitos de informação, dentre outros. O papel desempenhado por cada processo no sistema é resultado da agregação de um conjunto de subprocessos. De forma análoga, numa escala inferior, cada subprocesso pode ser decomposto em um conjunto de subprocessos e/ou operações atômicas, e assim recursivamente, até que o sistema seja indecomponível. Entretanto, apesar de modulares, estes processos são inter-relacionados e funcionalmente dependentes. Determinados processos podem interagir e depender do resultado de um ou mais outros processos componentes do sistema. Desta forma, somente após a conclusão dos processos predecessores é que ele poderá completar sua operação. Estas características de interrelação e multiescalaridade caracterizam o comportamento de organicidade funcional, típico de uma unidade sistêmica complexa (Figura 6.12).

141 141 Figura Organicidade Funcional: conjunto de subsistemas com processamentos internos singulares, conectados entre si, formando uma unidade coletiva Adaptabilidade e Heterogeneidade A modelagem da arquitetura deve ser suficientemente adaptável de modo a sustentar a capacidade de integrar fontes de informações heterogêneas: SMS, , redes sociais, sensores ambientais, agentes de campo, entre outras que futuramente poderão vir a surgir e se popularizar. Além disso, é preciso adaptar os diferentes formatos de representação de dados para a integração de atributos correlatos entre as diferentes fontes de informações, conforme os exemplos ilustrados no Quadro Multi-escalas Na arquitetura apresentada na Figura 6.1, em menor escala, os processos envolvidos na coleta e tratamento da informação colaborativa provocam interações sistemáticas entre geradores (os colaboradores) e analistas (gestores de informação) de conteúdo, para formar a base de conhecimento contextual atual. Por sua vez, em maior escala, o conhecimento contextual atual se combina com os demais tipos de conhecimentos para gerar o conhecimento combinado, conforme ilustrado na Figura 6.13.

142 Figura Multiescalaridade: coleta e tratamento de informação colaborativa para a construção da base de conhecimento contextual atual. Numa escala mais ampla, combinação de diferentes tipos de conhecimentos para a formação do conhecimento combinado 142

143 143 Quadro 6.3. Definições das propriedades dos Sistemas Complexos e suas respectivas associações com os elementos da arquitetura de solução e o ambiente de emergência Propriedade Definição Contextualização com a Arquitetura e o Ambiente de Emergência Propriedades emergentes Organicidade Funcional Adaptabilidade Sistemas Complexos são compostos de várias partes interagindo entre si de uma forma não simples. Nesses sistemas, o todo é mais do que a soma das partes, dado as propriedades das partes, as leis das suas interações, não é trivial inferir as propriedades do todo. Um fenômeno é emergente quando surge como resultado da interação entre seus componentes (SIMON, 1962). Cada subsistema possui um processamento interno de informações (ou processamento algorítmico), de modo a ocorrer uma relação funcional entre os subsistemas. Um Sistema Complexo é um conjunto de partes ou subsistemas com processamentos internos singulares, conectadas entre si, formando uma unidade coletiva com uma dinâmica própria e propriedades emergentes (MARIOTTI, 2010). Um sistema complexo adaptativo pode funcionar (ou continuar a existir) somente se realiza uma adaptação contínua a um ambiente que apresenta alterações contínuas (HOLLAND, 1999). A informação utilizada pelas equipes de comando para tomada de decisão é uma propriedade emergente da conjugação dos conhecimentos pessoal anterior (experiência dos profissionais diretamente envolvidos na resposta), formal anterior (dados de agências e secretarias de governo) e contextual corrente (originado pelos cidadãos e equipes de campo). Neste caso o todo, isto é, o ganho de conhecimento que apoia a decisão, é maior que a soma das informações que a geraram (Figura 6.10). Os diferentes estágios de tratamento submetem a informação a procedimentos de associações, agrupamentos, identificação da proveniência, mecanismos de lidar com a escassez e conflitos de informação, dentre outros. Cada processo opera com um foco diferente, executando diferentes algoritmos. Apesar de modulares, os processos são inter-relacionados e dependentes funcionalmente. Determinados processos podem interagir e depender do resultado de um ou mais outros processos componentes do sistema. Desta forma, somente após a conclusão dos processos predecessores é que ele poderá completar sua operação. Diante de situações emergenciais os comandantes das agências de emergência precisam tomar decisões em um ambiente complexo e incerto, obrigando-os a se adaptar continuamente às transformações ambientais imprevisíveis, além dos efeitos resultantes de suas decisões. A modelagem da arquitetura deve ser adaptável suficientemente de modo a sustentar a capacidade de incorporar distintas formas de entrada de informações: SMS, , redes sociais, sensores ambientais, agentes de campo, entre outras que futuramente poderão ser agregadas ao sistema.

144 144 Heterogeneidade Multi-escalas A complexidade é um tecido de constituintes heterogêneos inseparavelmente associados: ela coloca o paradoxo do uno e do múltiplo (MORIN, 2007). Sistemas interagindo com outros sistemas, de modo a formar sistemas mais amplos em escalas e com propriedades emergentes. Tal processo ocorre em escalas progressivamente mais amplas ou mais restritas, ou seja, ocorrem expressões de sistemas em multi-escalas. Cada escala possui as suas próprias É preciso adaptar os diferentes formatos de representação de dados para a integração de atributos correlatos entre as diferentes fontes de informações. Exemplo: Facebook.created_time = T16:49: versus Flickr.datetaken = :49:11. Diversidade de fontes de informações envolvidas no processo de captura: sensores, agentes de campo, redes sociais, SMS, , etc. As fontes de informações apresentam distintos formatos de apresentação de um mesmo dado. A diversidade de opiniões num grupo heterogêneo possibilita a análise de questões sob distintos pontos de vista, o que potencialmente resulta numa avaliação melhor e mais completa. Diferentes padrões de escritas e formalidade: agentes de campo e as mídias oficiais buscam manter um maior nível de formalidade e estruturação em suas publicações. No âmbito das redes sociais (principalmente nos microblogs) e mensagens SMS, cidadãos tendem a publicar com alto grau de coloquialismo (concisão, gírias, abreviações), o pode comprometer a qualidade da informação, além de reduzir a efetividade da aplicação de processos automatizados de extração de conteúdo. Multilinguismo: desastres de grandes proporções podem demandar a ajuda internacional. Nestes casos, o idioma nativo local pode ser diferente do idioma de comunicação adotado pelas equipes de resposta internacional (HEINZELMAN, J.; WATERS, 2010). Gestão da emergência organizada em diferentes escalas (Figura 3.2) Em menor escala, os processos envolvidos na coleta e tratamento da informação colaborativa provocam interações sistemáticas entre geradores (os colaboradores) e analistas (gestores de informação) de conteúdo, para formar a base de conhecimento contextual atual. Em maior escala, o conhecimento contextual atual se combina com os

145 145 Feedback Imprevisibilidade Unidade Coletiva leis (MILLER, 2007). Uma estrutura de feedback é um laço causal, uma cadeia de causas e efeitos que forma um anel. Dentre essas estruturas, a mais simples é o feedback de reforço, também conhecido como efeito bola-de-neve ou ciclo vicioso. A principal característica do feedback de reforço é ser auto-amplificador (PALAZZO, 1999). O ambiente complexo é formado por diversos tipos de agentes os quais interagem entre si de uma maneira não previsível. Há um controle central moderado usando regras simples de operação que dão origem a um comportamento complexo (MITCHELL, 2009). Um Sistema Complexo é composto por um conjunto de partes conectadas por alguma forma de interrelação entre as mesmas. É necessário não somente conhecer as partes, mas também os modos de relação entre elas. As partes, conectadas por uma rede de relações, geram conjuntamente uma Unidade Coletiva comumente chamada Sistema (PRADO, 2011). demais tipos de conhecimentos para gerar o Conhecimento Combinado (Figura 6.13). A fase de tratamento dos dados depende do feedback da comunidade colaboradora e equipes de campo para proporcionar o amadurecimento da informação quando constatadas por avaliadores como incompletas ou incongruentes. Quando julgado necessário, a informação será submetida a uma nova iteração, passando por um processo de retroalimentação (feedback) e, possivelmente promoverá a evolução da base de conhecimento. É necessário o uso de fontes externas de informação igualmente dinâmicas, com estruturas adaptáveis e mecanismos para lidar com a imprevisibilidade, imprecisão e facilitar a integração com as bases do ambiente interno. O fator humano, neste caso, aumenta ainda mais o grau de imprevisibilidade do sistema. Suas decisões e ações, em algumas situações, podem ser guiadas por pontos de vistas pessoais e até mesmo influenciadas por fatores emocionais. Agentes geradores (equipes de campo, cidadãos, mídia, sensores, agências de governo) são partes conectadas com a comunidade consumidora (equipes de comando e controle, gestores políticos) por meio da informação. Não é possível compreender todo o processo analisando apenas um componente deste conjunto, uma vez que cada elemento constituinte possui diferentes papéis (prestação da informação, atuação na resposta, análise da situação, decisão), seguem diferentes regras e operam segundo específicos planos de ação. A interação entre estes elementos é essencial ao fluxo do sistema.

146 146 7 Aplicação Experimental Este capítulo documenta as etapas de desenvolvimento e experimentação do protótipo construído com base na arquitetura de solução proposta no Capítulo 6. A primeira seção do capítulo descreve os recursos utilizados para a codificação, e apresenta produtos do desenvolvimento através de interfaces e suas respectivas funções no protótipo. A segunda seção do capítulo caracteriza a origem e o tipo de conteúdo que constitui cada uma das bases adquiridas para a experimentação. Na sequência, o capítulo apresenta os resultados da experimentação conduzida sobre as bases de dados adquiridas. 7.1 Protótipo Experimental da Arquitetura A plataforma SocialCol 77 (acrônimo para Social Collaboration) é um protótipo desenvolvido para fins de experimentação da arquitetura de solução proposta nesta pesquisa. A etapa de codificação utilizou os recursos da linguagem de programação PHP 78 (Personal Home Page) e sua estrutura nativa de gerenciamento de banco de dados MySQL 79. Além de tratar-se de uma ferramenta livre (freewares) e bastante popular atualmente, verificou-se previamente que o recurso seria suficientemente capaz de atender aos requisitos demandados pelos processos da arquitetura. A plataforma SocialCol, já carregada com as bases de dados utilizadas na experimentação desta pesquisa, está disponível para consulta através do endereço As subseções a seguir apresentam algumas interfaces e funcionalidades extraídas da plataforma Interface para o Gerenciamento de Fontes de Informações A Figura 7.1 apresenta a interface de gerenciamento de fontes de informações elaborada para o protótipo experimental da arquitetura. 77 Plataforma Experimental SocialCol 78 PHP é uma linguagem de programação de ampla utilização, interpretada, que é especialmente interessante para desenvolvimento para a Web e pode ser mesclada dentro do código HTML. A sintaxe da linguagem lembra C, Java e Perl, e é fácil de aprender. O objetivo principal da linguagem é permitir a desenvolvedores escreverem páginas que serão geradas dinamicamente rapidamente. Fonte: 79 MySQL -

147 147 Figura 7.1. Interface de gerenciamento de fontes de informações da plataforma experimental SocialCol. Fonte: Plataforma SocialCol. A agregação de uma fonte de informação no sistema requer o carregamento de sua respectiva biblioteca de funções (script) que deverá codificar os seguintes procedimentos de comunicação: [COL] Coletar Publicações: coleta a partir da consulta ao repositório de dados da fonte de informação colaborativa. A função getmessages($strkeywords, $strfromdatetime, $strtodatetime, $dbllatitude, $dbllongitude, $dblradiuskm) {return <results>} deve ser codificada na biblioteca para habilitar a coleta. O parâmetro strkeywords restringe os resultados da busca a palavras-chave específicas. O parâmetro strfromdatetime (opcional) restringe o conjunto de publicações, retornado somente a registros criados a partir da data estabelecida em tal parâmetro. Os parâmetros dbllatitude, dbllongitude, dblradiuskm (opcionais) limitam os resultados da busca um raio de proximidade de uma determinada localidade. A restrição espacial poderá eliminar publicações originadas fora dos domínios geográficos da região de ocorrência do evento analisado; [FED] Requisitar Feedback: estabelece o contato de retorno com o usuário de uma fonte de informação colaborativa. Dado ao fato de algumas fontes de informações

148 148 não disponibilizarem mecanismos para o estabelecimento do contato de retorno com o emissor, a implementação da função postmessage($iduser, $strmessage) {} não é obrigatória na biblioteca. Contudo, as requisições de feedback serão somente possíveis para aquelas fontes que viabilizarem a comunicação de retorno através desta função na biblioteca. As especificações detalhadas para a elaboração de bibliotecas de comunicação das fontes de informações colaborativas estão descritas no Apêndice A deste documento. O Apêndice B apresenta o código na linguagem de programação PHP referente ao script elaborado para a coleta de conteúdo obtido a partir da rede social Facebook. O script também codifica procedimentos para o envio de mensagens (necessárias às requisições de feedback no processo [FED]) a um determinado usuário da rede social. Ao submeter o script, um diagnóstico é automaticamente executado com a finalidade de verificar se os procedimentos de coleta e publicação encontram-se ou não presentes e operantes. A coluna Get Post na Figura 7.1 indica a disponibilidade (ou não) destes procedimentos para cada fonte de informação cadastrada na plataforma. A Figura 7.2 apresenta a interface para a configuração dos parâmetros de uma fonte de informação na plataforma experimental SocialCol. Figura 7.2. Parâmetros de configuração de uma fonte de informação e resultado do diagnóstico executado sobre o script de coleta e publicação carregado na plataforma experimental SocialCol. Fonte: Plataforma SocialCol.

149 149 Os parâmetros de configuração definidos pelo administrador através do gerenciamento das fontes de informações cadastradas na plataforma são: Fenômeno Retratado: especifica o tipo de fenômeno ( evento ou entidade ) retratado nas informações originadas pela fonte, segundo a classificação definida por Xavier-da-Silva e Marino (2011), introduzida no Capítulo 3. Conforme abordado na subseção , a validade temporal de uma informação está condicionada ao tipo de fenômeno que ela se refere e, consequentemente, a correlação temporal no processo [EPC] Encontrar Publicações Correlatas será determinada em função deste atributo classificatório. Nível de Confiança: valor inteiro que representa o nível de confiabilidade da fonte. Para fontes oficiais, por exemplo, pode ser atribuído o valor máximo do nível de confiança. Conforme a situação ilustrada na Figura 6.9, esta hierarquização permite que o analista da informação, no processo [RCO] Resolver Conflito : o Tome decisões ponderadas pelo nível de confiabilidade da fonte; o Priorize a requisição de feedbacks em função do nível de confiabilidade da fonte de informação. Formato Data de Entrada: formato no qual a fonte de informação representa os atributos temporais. Uma vez que cada fonte adota um padrão particular para a representação de data e hora, o processo de pré-processamento [CFD] Compatibilizar Formato de Data tomará por base este padrão sequencial, de modo a interpretar corretamente os atributos descritores de data e, desta forma, efetuar a conversão para um formato único no sistema (conforme ilustrado no Quadro 6.2). Frequência de Coleta: As distintas limitações e finalidades das fontes de informações produzem conteúdos em diferentes formatos, volumes e intervalos de tempo. Por exemplo, as redes sociais geram um volume intenso de conteúdo através de seus milhões de usuários ao redor do mundo continuamente conectados. O conteúdo gerado por um simples usuário é imprevisível, uma vez que pode ocorrer a qualquer momento. Além disso, pode ser influenciado por fatores pessoais ou circunstanciais, como seu humor, ocasiões especiais, disponibilidade de conexão, etc. Por outro lado, o volume de dados e a frequência de geração de um sensor remoto são controláveis e determinísticos. Já para os agentes de campo, a geração de

150 150 informação ocorre de acordo com a demanda do comando. Desta forma, o parâmetro Frequência de Coleta possibilita que o sistema consulte e colete informações nas fontes geradoras, respeitando suas especificidades quanto à disponibilização de conteúdo Associação de Atributos das Fontes de Informações com o Vocabulário de Referência A interface representada na Figura 7.3 foi desenvolvida para viabilizar a associação dos atributos de uma fonte de informação a termos do vocabulário de referência. Figura 7.3. Interface da plataforma experimental SocialCol para associação dos atributos de uma fonte de informação com termos do vocabulário de referência. Fonte: Plataforma SocialCol. Para cada fonte de informação agregada ao sistema, a plataforma efetuará uma leitura preliminar e listará todos os atributos da informação proveniente daquela fonte. Em seguida, o administrador do sistema deverá associar os atributos da informação correspondentes a cada termo do vocabulário de referência.

151 Gerenciamento dos Grupos Classificatórios para o Processo [CLA] Classificar Buscando criar uma categorização abrangente para informações relacionadas a emergências, decidiu-se utilizar a classificação adotada pela divisão setorial das equipes de resposta a emergências das Organizações das Nações Unidas (introduzidas na Figura 1.1): logística, nutrição, abrigos de emergência, gerenciamento e coordenação de campo, saúde, proteção, agricultura, telecomunicação, recuperação rápida, educação, água e saneamento (OCHA, 2012). A Figura 7.4 apresenta a interface da plataforma experimental SocialCol para o cadastro das classes de um evento e seus respectivos conjuntos de palavras-chave, aplicados para o processamento de [CLA] Classificação. Figura 7.4. Interface para o gerenciamento de classes para o evento experimental Terremoto em Porto Príncipe (Haiti) na plataforma SocialCol. Fonte: Plataforma SocialCol. A Figura 7.5 ilustra o resultado do processamento do classificador sobre o conteúdo textual de uma publicação na plataforma experimental SocialCol.

152 152 Figura 7.5. Classes atribuídas a uma publicação após o processamento de [CLA] Classificar na plataforma experimental SocialCol. Fonte: Plataforma SocialCol. Para a publicação analisada no exemplo ilustrado acima, o classificador atribuiu quatro classes: Necessidade.Water, Necessidade.Food, Necessidade.Sanitation e Necessidade.Shelter. Os números entre parêntesis que acompanham os nomes das classes atribuídas identificam a quantidade de ocorrências de palavras-chave referente àquela classe, encontradas no conteúdo textual analisado Configuração do Índice de Correlação para o Agrupamento no Processo [HIST] Histórias avaliador. A formulação do Índice de Correlação pode variar de acordo com os critérios de cada Assim, para proporcionar maior flexibilidade à abordagem, a plataforma experimental desenvolvida permite ao usuário personalizar a formulação e reprocessar os cálculos e agrupamentos a qualquer momento, conforme destacado na Figura 7.6.

153 153 Figura 7.6. Possibilidade de personalizar parâmetros e a equação para o cálculo do Índice de Correlação entre publicações na plataforma experimental SocialCol. Fonte: Plataforma SocialCol. A Figura 7.7 apresenta duas publicações extraídas da base de dados experimental, utilizadas para ilustrar os cálculos determinantes do Índice de Correlação segundo a heurística definida na subseção 6.2.3, e seu posterior julgamento quanto à agregação ou não na história. Figura 7.7. Exemplo de publicações extraídas da base de dados experimental para o cálculo do Índice de Correlação e decisão quanto ao agrupamento em história na plataforma SocialCol. Fonte: Plataforma SocialCol.

154 154 História H : Publicação Raiz: P ; Publicação Verificada: P ; C min : 0,5 Cálculos: d , = ( : ), ( : ) = 0 metros t , = 31/01/ :52:00 31/01/ :04:00 = 12min x 60seg = 720 segundos #{ class , } = 1, #{Uclass , } = 2 C , = [(1-0/500) + (1 720/3600) + 1/2]/3 C , = 0,76 Resultado: C , > C min Agregar P a H e P a H O agrupamento também permite que o analista monitore a evolução temporal e o ciclo de vida de uma história. Apesar de cada publicação estar vinculada à sua data de criação, quando agrupada em uma história, adquire-se uma visão holística quanto ao contexto e as circunstâncias que envolveram a sua geração. Conforme ilustrado na Figura 7.8, a dimensão temporal da informação deixa de ser pontual (unidimensional) e distribui-se num período contínuo (bidimensional). O agrupamento também poderá evidenciar e quantificar o quão defasado uma determinada informação se encontra em relação ao início da história (data de publicação da colaboração mais remota), construindo uma visualização que apoia a determinação do grau de atualidade da referida informação. Figura 7.8. Disposição cronológica das publicações de uma história em forma de Linha do Tempo na plataforma experimental SocialCol. Fonte: Plataforma SocialCol Valoração de Atributos Quantitativos em Publicações A Figura 7.9 apresenta a interface desenvolvida na plataforma experimental SocialCol, onde revisores colaboradores podem identificar e valorar os atributos

155 155 quantitativos presentes nas publicações coletadas. Este estágio de tratamento está representado no workflow da arquitetura (Figura 6.2) pelo processo [MIAQ] Identificar Atributos Quantitativos, na fase [RCOL] Revisão Colaborativa. Figura 7.9. Interface para identificação de atributos quantitativos em publicações na plataforma experimental SocialCol. Fonte: Plataforma SocialCol. Além de identificar a ocorrência de atributos com valores conflitantes dentro de uma mesma história, o produto desta etapa possibilitará a sinalização dos casos de incompletude, isto é, aqueles caracterizados por atributos associados a valores qualitativos como, por exemplo: muitos mortos, poucos alimentos, alguns medicamentos, etc.. Para estes casos, as requisições de feedback podem ser acionadas para apoiar a obtenção do valor preciso para o atributo Identificação Histórias e Tratamento de Conflitos A Figura 7.10 apresenta o painel de histórias do evento. Cada linha da tabela representa uma história do evento emergencial. Figura Identificação de conflitos de informações em uma história na plataforma SocialCol. Fonte: Plataforma SocialCol. Fonte: Plataforma SocialCol. A coluna Raiz identifica o número da publicação que originou a formação da história. A coluna Período descreve as datas da publicação mais remota e mais recente

156 156 dentro do grupo de publicações da história. A coluna Posts Relacionados apresenta os identificadores das demais publicações que compõem a história. Para uma publicação fazer parte daquele conjunto, significa que o Índice de Correlação entre ela e a publicação raiz superou o valor mínimo (C min ) previamente estipulado para o agrupamento. Conforme apresentado na Figura 7.6, para este experimento o valor mínimo de corte foi definido em 0,4, para um Índice de Correlação que pode variar entre 0,0 (sem correlação) e 1,0 (correlação total). Conforme o exemplo apresentado e detalhadamente calculado na Figura 7.7, para ser agregado a uma história, o Índice de Correlação entre duas publicações deve sempre ser igual ou superior a 0,4 (C raiz,n 0,4). A coluna [CONF].[ICO] Identificação de Conflitos apresenta os conflitos sinalizados em cada história. Na ilustração acima, a história H apresenta três conflitos de atributos. O destaque em cor vermelha significa que o conflito ainda não se encontra solucionado pelo analista de informações. A cor verde significa que o analista já verificou e solucionou o conflito. A coluna Média C m,n representa a média aritmética entre os Índices de Correlação das publicações que compõem a história. Quanto maior este valor, maior o grau de correlação entre todas as publicações pertencentes à história. Conforme ilustrado na Figura 7.11, a disposição cronológica das publicações pode apoiar a análise para a resolução do conflito. Ao ordenar a sequência dos fatos, o analista dispõe de uma melhor visualização para verificar se o referido conflito realmente se trata de uma inconsistência de versões do fato, ou apenas retrata de uma evolução da situação. Figura Interface para a resolução de conflitos supervisionada na plataforma experimental SocialCol. Fonte: Plataforma SocialCol. Supondo, por exemplo, que uma determinada história descreva acontecimentos de um desabamento, a ocorrência de um conflito de valores para o atributo pessoas falecidas não necessariamente deverá assumir um único valor como correto. Neste cenário é

157 157 possível que parte, ou até mesmo todos os valores discrepantes sejam verdadeiros, uma vez que eles podem apenas registrar atualizações da evolução do cenário no decorrer do tempo. Para fins de julgamento, ponderações em função do grau de confiabilidade da fonte, distância geográfica, reputação dos emissores, nível de atualidade da informação (maior peso atribuído a publicações mais recentes) podem representar métricas úteis para apoiar a decisão final na resolução do conflito. 7.2 Bases de Dados Adquiridas para a Experimentação A experimentação conduzida analisou os resultados do processamento do protótipo sobre um conjunto de bases de dados reais. O acervo de informações adquirido se refere ao desastre decorrente do terremoto de magnitude 7.0 que atingiu a cidade de Porto Príncipe, capital do Haiti, na tarde de 12 de janeiro de O desastre causou efeitos devastadores sobre o país, culminando na morte pessoas e ferindo mais (GRONEWOLD, 2010). Apelos de ajuda solicitados pela população local, relatórios de avaliações de equipes de campo e dados de sensores gerados durante a fase de resposta ao desastre compõem o conjunto das bases de informações adquiridas através de pesquisas na Internet, contatos diretos por e, também pela participação pessoal do autor no apoio à resposta do Haiti (BEM-PARANÁ, 2010). Ao todo foram utilizadas bases provenientes de sete origens distintas, conforme elencadas na Figura 7.12, e detalhadas a seguir. Figura Bases de dados carregadas na plataforma para a experimentação. Fonte: Plataforma SocialCol.

158 158 A primeira coluna descreve o nome da base de dados (fonte de informação) e as respectivas datas da publicação mais remota e da mais recente na base. A coluna Pubs. apresenta o número de publicações em cada base de dados. A coluna Confiança expressa a hierarquização do nível de confiança definida pelo administrador do sistema para cada fonte agregada ao sistema. Conforme detalhado na subseção 7.1.1, a hierarquização da confiabilidade apoia as decisões do analista da informação na resolução de incongruências e na priorização de encaminhamentos de feedbacks de complementação, para casos de informações conflitantes. Estas informações constituem um conjunto satisfatório para a aplicação experimental uma vez que busca observar o comportamento sistêmico da arquitetura, considerando as complexidades proporcionadas por situações reais de emergência. Outro fator positivo do conjunto utilizado é o elevado grau de heterogeneidade existente entre as fontes, quanto aos distintos níveis de confiabilidade, estruturação e frequência de geração de conteúdo. As subseções a seguir documentam o papel desempenhado pelas organizações, a contribuição de suas respectivas bases de informações durante a fase de resposta ao desastre e os caminhos percorridos para adquiri-las Ushahidi SMS Conforme já apresentado na subseção 2.3, a organização Ushahidi 80 vem desempenhando um papel fundamental no apoio à captura e tratamento de informações colaborativas durante a fase de recuperação de desastres naturais. Sua contribuição mais notória e expressiva ocorreu justamente no apoio à resposta ao terremoto de magnitude 7.0 ocorrido no Haiti. Como resultado, a equipe de voluntários Ushahidi validou e disponibilizou mais de quatro mil registros de informações e pedidos de ajuda que partiram da população e provaram ser úteis às equipes de apoio e resgate. Este repositório de informações foi adquirido através de pesquisas na internet 81 e compõe a base experimental de informações colaborativas geradas a partir de apelos da população local, através de mensagens SMS. 80 Ushahidi Dataset Haiti Crisis Map -

159 159 A tabela de dados representada na Figura 7.13 estrutura instâncias de apelos por ajuda e informações sobre desabrigados e necessidades básicas enviadas pela população local através de mensagens SMS, submetidas a uma triagem de procedimentos (workflow da triagem apresentado na Figura 5.3) para fins de tradução, geolocalização e validação da autenticidade da informação. Figura Amostra da base de informações Ushahidi referente ao terremoto em Porto Príncipe, Haiti (2010) Sahana SMS e Rede Social Twitter A iniciativa Sahana Foundation 82 oferece soluções de gerenciamento de informações que permitem às organizações e comunidades uma melhor preparação durante a resposta aos desastres. A organização atua no desenvolvimento de softwares livres e de código aberto, além da prestação de serviços que ajudam a resolver problemas concretos e trazer ganhos de eficiência para a coordenação de resposta a desastres entre governos, organizações de ajuda, a sociedade civil e os próprios sobreviventes. Durante a fase de resposta ao terremoto ocorrido em Porto Príncipe, a equipe Sahana recebeu um grande número de requisições de ajuda originadas pela população local. As solicitações recebidas originaram-se a partir de mensagens SMS e do microblog Twitter. Procedimentos colaborativos de tradução e validação foram aplicados ao conteúdo recebido, de modo a possibilitar uma compreensão mais clara acerca das necessidades da comunidade local, por parte das organizações internacionais de apoio envolvidas na resposta. Para a condução da experimentação neste trabalho, a base de informações Sahana foi obtida a partir de contato direto com o coordenador da organização, senhor Michael Howden (histórico da conversa por disponível no Apêndice E). O coordenador gentilmente forneceu os dados exclusivamente para fins de experimentação, em prol do desenvolvimento de soluções para o apoio humanitário. 82 Sahana Foundation

160 160 Apesar das informações terem sido originadas basicamente a partir de mensagens SMS e do microblog Twitter, a base de informações cedida pela organização não disponibiliza os atributos originais destes meios de comunicação. Após o tratamento colaborativo das informações recebidas, os atributos foram simplificados e condensados para uma estrutura uniforme e enxuta, conforme ilustrado na Figura Figura Base de informações cedida pela iniciativa Sahana Foundation referente às solicitações de ajuda enviadas pela população após o terremoto em Porto Príncipe, Haiti (2010) Flickr Redes Sociais usuários. A rede social Flickr é especializada no compartilhamento de fotos entre seus Ao contrário das limitações impostas por outras redes sociais populares (Facebook, Twitter e Instagram), seus recursos de API permitem recuperar publicações criadas em qualquer data anterior. Desta maneira foi possível recuperar qualquer conteúdo gerado por seus usuários durante a fase de recuperação do desastre, restringindo a consulta ao período entre 12 de janeiro e 29 de março de Além disso, a consulta foi restrita somente às publicações que apresentavam coordenadas geográficas localizadas no interior do retângulo que circunscreve o território do Haiti. A Figura 7.15 ilustra uma publicação através da rede social Flickr, que retrata o resgate de um cidadão debaixo de escombros, cinco dias após a ocorrência do terremoto em Porto Príncipe.

161 161 Figura A imagem publicada através da rede social Flickr retrata o resgate de um cidadão debaixo de escombros após terremoto em Porto Príncipe, em janeiro de Fonte: Flickr 83 Para a experimentação, a base de dados Flickr representa a colaboração social através das redes sociais. Trata-se de uma valiosa fonte de informações multimídia, além dos comentários, marcadores (tags) e legendas descritivas que as acompanham United States Geological Survey (USGS) Sensores Sismógrafos A USGS 84 (United States Geological Survey) é uma organização científica norteamericana que avalia e monitora os perigos naturais que ameaçam a vida humana e os recursos naturais essenciais à humanidade. No campo sismológico, a instituição conta com uma vasta rede de sensores espalhados pelo mundo para fins de monitoramento e a manutenção de serviços de alertas contra terremotos (sismos de grandes proporções). Sua base de informações de monitoramento sísmico tem cobertura mundial e é atualizada em tempo real. Esta base de dados é de domínio público, e está disponível a qualquer usuário conectado à internet 85. A interface de consulta possibilita ainda a filtragem restrita a áreas geográficas, intervalos de magnitude, profundidade do hipocentro, dentre outros parâmetros relacionados a atividades sísmicas. Os resultados da consulta podem ser visualizados diretamente no USGS

162 162 navegador, dispostos sobre um mapa (conforme ilustrado na Figura 7.16) ou, descarregados no computador do usuário sob o formato tabular. Para a obtenção dos dados sísmicos referentes ao terremoto do Haiti foi realizada uma consulta restrita somente à região do Caribe, compreendida entre os meses de janeiro e fevereiro de A Figura 7.16 apresenta a visualização dos 105 resultados desta consulta. Os registros foram descarregados sob o formato tabular CSV (Comma-separated Values) e importados na plataforma SocialCol. Figura Registros dos sensores da USGS referente aos sismos ocorridos na região do Haiti entre janeiro e fevereiro de Fonte: USGS 86. Esta base histórica de sismos ocorridos na região do Haiti entre janeiro e fevereiro de 2010 representa a carga experimental de dados proveniente dos sensores de monitoramento ambiental Mission SMS A Organização Não Governamental Mission é uma iniciativa voluntária internacional que ofereceu apoio fundamental à comunidade local através da coleta, 86 USGS -

163 163 tradução e processamento on-line de informações que ligava o povo haitiano uns com os outros e com os esforços de ajuda internacional. A iniciativa disponibilizou um canal de comunicação prático e livre de custos à população local. Através de mensagens de texto SMS enviadas gratuitamente ao número 4636 (amplamente divulgado pelas estações de rádio locais), a população pôde manifestar suas necessidades aos agentes envolvidos na resposta ao desastre. O trabalho voluntário resultou no processamento ágil de um volume expressivo de mensagens originárias da população local. Ao todo a base de informações processou mais de quarenta e três mil mensagens. Através de contatos estabelecidos por (histórico do contato apresentado no Apêndice E) esta base de informações foi gentilmente cedida pela organização Mission A Figura 7.17 apresenta uma amostra da base de informações recebidas e tratadas pela iniciativa Mission 4636 durante a resposta ao terremoto do Haiti, a exemplo da base de dados da iniciativa Ushahidi, esta base é composta por instâncias de apelos e prestação de informação da população local, traduzidas, categorizadas e estruturadas pela equipe da voluntários da organização Mission Figura Amostra da base de informações recebidas e tratadas pela iniciativa Mission 4636 durante a fase de resposta ao terremoto do Haiti (2010). 87 Mission

164 CENACID/UFPR - Vistorias de Equipes de Campo O Centro Nacional de Apoio Científico em Desastres 88 (CENACID/UFRJ) tem por objetivo proporcionar apoio científico e técnico a comunidades afetadas por desastres naturais. Visa também gerar propostas de ações a serem empreendidas no seguimento da emergência, bem como promover cursos de treinamento para a prevenção e a investigação das causas e efeitos de desastres ambientais. Por solicitação da expressiva atuação do governo brasileiro no Haiti, o Centro prestou apoio fundamental na fase de resposta ao desastre, operando no diagnóstico dos impactos estruturais, políticos e sociais do desastre sobre a população daquele país (ITAIPU, 2010). Incursões a campo possibilitaram à equipe avaliar os danos e o comportamento da destruição causada na capital Porto Príncipe. Quantificação de perdas e danos, levantamento de recursos disponíveis, avaliações de riscos iminentes e visitas a comunidades atingidas foram registrados na plataforma VICON/SAGA, consolidando a base de informações da equipe CENACID. A Figura 7.18 ilustra um exemplo de informação recuperada através da plataforma VICON/SAGA, utilizada nesta experimentação assumindo o papel da informação obtida por agentes de campo, ou seja, daqueles que representam as fontes com alto nível de confiabilidade. 88 CENACID/UFPR -

165 165 Figura Relatório de registro de informação coletada a parit de vistorias de campo pela equipe CENACID/UFPR durante atividades de resposta ao terremoto do Haiti (2010) PAHO Catálogo Oficial das Unidades de Saúde no Haiti A PAHO (Panamerican Health Organization) mobilizou esforços para ajudar o governo haitiano a atender às necessidades básicas de saúde de seu povo durante a fase de resposta ao terremoto. A organização coordenou e facilitou a mobilização de especialistas em saúde e equipes de resgate provenientes de seus Estados-Membros e de outras regiões para prestar socorro e recuperação. Durante a fase de resposta ao terremoto do Haiti, a organização PAHO disponibilizou a lista atualizada dos hospitais localizados no país. Toda a informação levantada foi georreferenciada e serviu de apoio para que as iniciativas de saúde envolvidas na resposta encaminhassem seus atendimentos às unidades de saúde mais próximas.

166 166 A organização PAHO contou com o apoio da plataforma da fundação Sahana para armazenar e compartilhar suas informações. Toda a documentação referente ao acervo levantado, descrição de seus metadados e meios de acesso aos dados foi disponibilizada através de uma página web 89. A Figura 7.19 apresenta um extrato da listagem das unidades de saúde catalogadas pela organização, também utilizadas na experimentação deste trabalho. Figura Hospitais do Haiti catalogados pela organização PAHO. Diferentemente das demais bases experimentais, a base de dados PAHO é constituída pelo levantamento de hospitais localizados no território do Haiti, ou seja, representa instâncias de entidades (conceito apresentado no Capítulo 3). Seu atributo temporal representa apenas a data em que a instância foi agregada ao catálogo. Entretanto, a entidade Hospital existia muito antes da data de publicação do catálogo, isto é, desde o início de suas operações de atendimento (vide exemplo ilustrado através da Figura 6.6). Neste caso, a dimensão temporal, representada na base de dados pelo atributo Date_Creation, é imprópria para o estabelecimento de correlações através do processo [EPC] Encontrar Publicações Correlatas. Portanto, sua dimensão temporal deve ser desconsiderada nos cálculos de correlação (condição atendida pelo parâmetro EVENT m,n igual a zero) e, conforme o encaminhamento apresentado e justificado na subseção , a formulação do Índice de Correlação será balanceada de modo a não penalizar os resultados para tais casos. 89

167 Resultados da Experimentação As bases de dados foram carregadas na plataforma experimental SocialCol, totalizando publicações originadas por 7 fontes de informações distintas, conforme detalhado na seção anterior. A experimentação teve por finalidade analisar a efetividade dos procedimentos de tratamento implementados a partir do modelo conceitual da arquitetura, proposto no Capítulo Resultados do Processamento [CFD] Compatibilizar Formato de Data A Tabela 7.1 apresenta o desempenho do processo [CFD] Compatibilizar Formato de Data na experimentação. Mesmo adotando uma abordagem simplista para a uniformização do formato de datas, os resultados apontam a compatibilização com sucesso de todas as publicações processadas. Tabela 7.1. Desempenho do processamento [CFD] Compatibilizar Formato de Data na experimentação. Fonte: Plataforma SocialCol. Este resultado positivo pode ser justificado pela abordagem de compatibilização elaborada para a arquitetura (descrito na subseção ). A data e hora da criação de instâncias de informações são automaticamente registradas pelas fontes de informações, caracterizando um atributo da informação completamente padronizado. Ao agregar uma nova fonte de informações na plataforma experimental da arquitetura, a interface de gerenciamento requisita que o administrador especifique o seu padrão de formatação de data. Assim, uma vez conhecido o padrão de formatação deste atributo, o processo de conversão não falhará. Independentemente do número de registros processados, basta identificar a posição (fixa) de cada componente da data (dia, mês, ano, hora, minuto,

168 168 segundo), e reposicioná-los segundo o novo formato de saída determinado para o prosseguimento do tratamento Resultados do Processamento [CFC] Compatibilizar Formato de Coordenadas A Tabela 7.2 apresenta o desempenho do processo [CFC] Compatibilizar Formato de Coordenadas após a experimentação. Tabela 7.2. Desempenho do processamento [CFC] Compatibilizar Formato de Coordenadas na experimentação. Fonte: Plataforma SocialCol. A taxa de publicações processadas, equivalente a 0% para a fonte de informação Sahana, justifica-se devido ao fato da base não apresentar o atributo espacial referente às suas publicações, conforme pode ser verificado em sua amostra apresentada na Figura Quanto à fonte Mission 4636, dada à disponibilidade dos campos latitude e longitude (vide Figura 7.17), o atributo espacial fora associado no momento da inclusão desta base à plataforma e, portanto, processado por [CFC] Compatibilizar Formato de Coordenadas. Entretanto, o alto índice de falhas de processamento (84,79%) também ocorreu devido à ausência da informação das coordenadas em grande parte das publicações, como pode ser observado na amostra ilustrada na Figura Para as demais fontes, a alta taxa de assertividade se justifica da mesma forma que a alta taxa obtida pelo processo [CFD] Compatibilizar Formato de Data. Ambos os processos adotaram abordagens análogas para a conversão dos atributos temporal e espacial Resultados do Processamento [CLA] Classificar De acordo com o Gráfico 7.1, o processo [CLA] Classificar realizou associações, distribuídas entre as 14 distintas classes cadastradas para o evento Terremoto

169 169 em Porto Príncipe (Haiti). A requisição por alimentos e água, representadas respectivamente pelas classes need.food e need.water apresentaram a maior frequência de associações, totalizando juntas 56% das associações estabelecidas. Vale lembrar que para cada publicação, o processo classificador pode não realizar nenhuma associação, bem como atribuir uma ou mais classes cadastradas para o evento. Este último caso encontra-se ilustrado na Figura 7.5. Gráfico 7.1. Distribuição da quantidade de publicações associadas às classes do evento após o processamento de [CLA] Classificar na experimentação. Fonte: Plataforma SocialCol Resultados do Processamento [EPC] Encontrar Publicações Correlatas O Gráfico 7.2 apresenta o resultado do processamento experimental de [EPC] Encontrar Publicações Correlatas, considerando os parâmetros limitadores d MAX igual a 500 metros e t MAX igual a segundos (2 horas). O gráfico expressa a quantidade de pares de publicações correlacionados, distribuídas pelos intervalos de valores do Índice de Correlação. A distribuição aponta que apenas 1% das correlações superou o índice de 0,6, e que 0,49% do total de pares comparados alcançaram o intervalo de máxima correlação, isto é, de 0,9 a 1,0.

170 170 Gráfico 7.2. Distribuição da quantidade de pares de publicações correlacionadas agrupadas por intervalos de valores do Índice de Correlação, após o processamento de [EPC] Encontrar Publicações Correlatas na experimentação. Fonte: Plataforma SocialCol Resultados do Processamento [AGR] Agrupar em Histórias O Gráfico 7.3 quantifica a distribuição de histórias formadas, em função da média aritmética interna dos Índices de Correlação das publicações que compõem cada história. Gráfico 7.3. Resultado processamento de [AGR] Agrupar em Histórias na experimentação: quantidade de histórias formadas e sua distribuição em função da média do Índice de Correlação entre as publicações que compõem cada história. Fonte: Plataforma SocialCol. O Gráfico 7.4 apresenta a distribuição em valores absolutos e percentuais da participação das bases de dados na formação de histórias.

171 171 Gráfico 7.4. Participação das fontes de informações em histórias. Fonte: Plataforma SocialCol. A base de dados Sahana destaca-se por evidenciar que, mesmo que nenhuma de suas publicações tenha sido processada na etapa [CFC] Compatibilizar Formato de Coordenadas, ou seja, todas se apresentam deficientes da componente espacial, 33% de suas publicações foram posteriormente correlacionadas com outras publicações e, obtendo índices no mínimo maior ou igual que 0,4. Segundo a formulação proposta para [EPC] Encontrar Publicações Correlatas, cada dimensão contribui de forma igualitária em 33,3% para o cálculo. Consequentemente, o Índice de Correlação entre pares que envolvam publicações da base Sahana atingirá, no máximo, o valor de 0,66. Ainda que deficiente da dimensão espacial, mais da metade das publicações (53,05%) agrupadas em histórias são originadas da base de dados Sahana, o que pode justificar o alto índice de correlações dentro do intervalo de 0,5, conforme indicado no Gráfico Tempo de Processamento e Escalabilidade da Plataforma Experimental O Gráfico 7.5 apresenta o tempo médio consumido para o processamento de uma publicação em cada etapa do ciclo de processamento. O tempo total dispendido para a triagem completa, desde a entrada no sistema até sua agregação dentro de uma história é estimado em 0,14 segundos.

172 172 Gráfico 7.5. Tempo de processamento de uma publicação para cada etapa de tratamento estabelecida na arquitetura de solução. Fonte: Plataforma SocialCol. Para fins de análise da escalabilidade do sistema, o Gráfico 7.6 apresenta o comportamento estimado da distribuição dos tempos totais para processar diretamente distintos volumes de publicações. A experimentação conduzida neste trabalho processou por completo a base experimental composta por publicações em aproximadamente 1 hora e 21 minutos. Gráfico 7.6. Tempo total, em minutos, para o processamento da base de dados experimental segmentado pelos processos da arquitetura. Fonte: Plataforma SocialCol. A introdução dos parâmetros limitadores d MAX, t MAX e C min (apresentados na subseção 6.2.3) otimiza o desempenho do processamento e reduz consideravelmente o tempo de execução dos processos [EPC] Encontrar Publicações Correlatas e [AGR] Agrupar em Histórias, ao descartar comparações irrelevantes (distantes geográfica e temporalmente) entre a publicação ingressante e cada uma das demais já tratadas e armazenadas. Esta análise não considera o tempo de processamento dos procedimentos para detecção de conflitos ( [ICO] Identificar Conflitos em História ), uma vez que a plataforma experimental executa o referido processo diretamente na aplicação (on-the-fly), no momento em que as histórias são carregadas pelo analista da informação. Trata-se de um procedimento de varredura rápido e, da maneira como foi implementado, não interfere no desempenho do ciclo de processamento.

173 173 Por fim, convém observar que este gráfico apresenta estimativas baseadas no tempo total contabilizado durante a experimentação conduzida. Porém, na prática, o tempo médio real dispendido para o processamento de cada publicação ingressante varia em função de fatores como a quantidade de publicações já armazenadas e as características de cada uma das fontes de informações agregadas ao sistema.

174 174 8 Propostas de Encaminhamento e Conclusões 8.1 Conclusões A pesquisa exploratória pelo estado da arte revelou que as iniciativas e abordagens de solução vigentes operam apenas sobre conjuntos homogêneos de fontes de informações. Contudo, nenhuma abordagem verificada propôs soluções flexíveis e adaptáveis para fins de integração, estabelecimento de associações e detecção de eventuais conflitos entre informações similares, independentemente de suas proveniências e estruturas de dados. Motivado pela contínua proliferação dos meios de aquisição de dados ambientais, que por sua vez abrem caminhos para o provimento de informações úteis através da colaboração social, o objeto principal da contribuição deste trabalho buscou comprovar que, mesmo apresentando distintas estruturas de dados, proveniências e circunstâncias de geração, as informações podem se relacionar, aumentar a compreensão do contexto emergencial em que elas foram geradas e, consequentemente, apoiar a decisão dos gestores da emergência. A Figura 8.1 apresenta duas publicações agrupadas em uma mesma história, após o processamento experimental. Ao observá-las percebe-se que, mesmo provenientes de distintas fontes de informações e apresentando distintos conjuntos de atributos, ambas as publicações de fato se referem exatamente a um mesmo evento. O Índice de Correlação entre estas publicações alcançou seu valor máximo (1,0), o que atesta a efetividade da heurística elaborada para associar publicações similares. Figura 8.1. A similaridade entre duas publicações agrupadas numa mesma história pode ser notada a partir da inspeção visual. O resultado atesta a efetividade da heurística elaborada para a arquitetura

175 175 Publicações provenientes da fonte de informação Flickr também evidenciaram um comportamento particular que contribuíram para atestar a eficácia dos procedimentos de correlação. Trata-se de ocorrências denominadas duplicidade similar, ou seja, casos onde um mesmo indivíduo submete publicações contendo descrição e localização idênticas, dentro de um curto intervalo de tempo. Este comportamento é comum na plataforma e se deve ao simples fato de que cada publicação submetida pode anexar apenas uma imagem. Assim, caso o usuário queira publicar mais de uma foto referente a um mesmo evento, precisará criar uma publicação para cada imagem a ser submetida. A Figura 8.2 retrata um registro de detecção desta situação, na qual um mesmo usuário, dentro de um intervalo de aproximadamente um minuto publicou cinco imagens relativas a um mesmo evento. Após a experimentação, estas publicações foram coletadas, identificadas, correlacionadas e agrupadas em uma mesma história. A correlação deste agrupamento atingiu o grau máximo uma vez que a localidade de todas as publicações é exatamente a mesma, o intervalo de tempo entre as publicações é muito pequeno e, o conteúdo textual da publicação (considerado na classificação e cálculo da dimensão taxonômica) é também exatamente o mesmo para todas as publicações. Figura 8.2. A detecção duplicidade similar evidencia um caso típico ocorrido na rede social Flickr: submissões sucessivas de um único emissor retratam um mesmo evento A ausência das coordenadas em parte das publicações processadas na experimentação possibilitou outra constatação positiva. Esta deficiência de dados ocorrida nas bases Sahana e Mission 4636 tornou-se útil para a verificação da efetividade dos procedimentos agregadores em condições não ideais. A ocorrência de publicações que não apresentam a componente espacial em agrupamentos de histórias corrobora com a proposição da independência e não obrigatoriedade da presença de todos os três atributos da informação para o estabelecimento de relacionamentos.

176 176 Ainda acerca dos resultados da experimentação, caso os tratamentos em segundo nível para a busca das coordenadas propostos no processo [CFC] Compatibilizar Formato de Coordenadas fossem implementados no protótipo, certamente a taxa de processamentos bem sucedidos poderia ser consideravelmente elevada em relação ao resultado atual e, consequentemente, mais correlações poderiam ser estabelecidas a partir dos procedimentos agregadores. Por medidas de prioridades e também por não se tratar do foco deste trabalho, tal encaminhamento fora apenas previsto, porém, não desenvolvido no protótipo experimental. Com relação à estrutura de armazenamento e recuperação da arquitetura, a construção do protótipo experimental demonstrou que a adoção da estrutura de banco de dados relacional foi suficientemente capaz de atender as demandas de armazenamento e recuperação do fluxo de dados circulantes na arquitetura proposta. O Apêndice F apresenta o diagrama entidade-relacionamento do repositório de coleta e processamento modelado para o protótipo experimental da arquitetura. Em vias conclusivas e apoiado pelos resultados da experimentação pode-se afirmar comprovadamente que a abordagem de solução proposta nesta Tese alcançou de forma satisfatória suas metas inicialmente estipuladas. 8.2 Propostas de Encaminhamento Alternativas e medidas para fins de elevação da frequência de colaboração, aumento da confiabilidade e validade da informação, e a elevação do grau de autonomia do sistema podem aprimorar e incrementar a modelagem atual da arquitetura, conforme as propostas a seguir. Como alternativa para aumentar a aderência das colaborações de retorno às requisições de feedback, é possível direcioná-las levando-se em conta a reputação do informante, seu tempo médio de atividade diária, local e data de sua última publicação, dentre outros indicadores que poderão ajudar a identificar colaboradores possivelmente mais eficientes. O estabelecimento de um ranking de colaboração também pode apoiar o analista da informação no processo de seleção dos colaboradores mais ativos e confiáveis para as tarefas. Muitas abordagens neste sentido foram levantadas na pesquisa do estado da arte e podem servir de base para tais melhorias.

177 177 Ainda no que tange a efetividade das requisições de feedbacks, políticas de recompensas também podem ser estabelecidas em função do ranking da efetividade e participação do cidadão quanto ao provimento da informação durante a resposta. A iniciativa adotada pela equipe vencedora do desafio Red Ballon Challenge (TANG et al., 2011), por exemplo, garante uma política de premiação justa e proporcional ao grau de colaboração do indivíduo, além de garantir que o orçamento estipulado não seja extrapolado. Para a resolução de conflitos, regras de resolução previamente definidas combinadas a algoritmos de aprendizado de máquina poderão ser aplicados para que decisões sejam tomadas sem a necessidade de intervenção humana. Métodos automáticos para identificação e extração de valores de atributos quantitativos em publicações, tradução, geolocalização também podem ser aplicados com a finalidade de reduzir ainda mais a dependência do processamento humano, aumentar a autonomia do sistema e a eficiência de seus respectivos processos. Para fins de simplificação e generalização, a formulação elaborada para o estabelecimento da correlação temporal introduziu o parâmetro binário [EVENT m,n ] (detalhado na subseção ) para condicionar seus cômputos em função dos distintos períodos de validade temporal existentes entre eventos e entidades. Entretanto, a validade temporal de uma informação pode ser modelada de maneira mais realista ao substituir a representação generalista do parâmetro binário por outro, mais preciso, que quantifique o intervalo de tempo de validade da referida informação. Tal medida contribuirá para a determinação da correlação entre duas instâncias de informações de forma mais precisa e realista. Também como prosseguimento do trabalho, em termos analíticos acerca da eficiência dos processos constituintes da arquitetura e suas vantagens em relação às demais iniciativas de coleta e tratamento de informações, sugere-se a elaboração de novas rodadas de experimentações que apliquem indicadores e métricas de desempenho comparativas a estas iniciativas afins. Desta maneira, será possível avaliar e medir de maneira mais efetiva e objetiva, o ganho e a contribuição destes novos métodos propostos em relação ao que já existe no estado da arte.

178 178 Referências Bibliográficas AGGARWAL, C. C.; ZHAI, C. A Survey of Text Clustering Algorithms. In: C. C. Aggarwal; C. Zhai (Orgs.); Mining Text Data. p , AHN, L. VON; DABBISH, L. Labeling images with a computer game. ACM Conference on Human Factors in Computing Systems. v. 6, p , AQUAWARE: Um Ambiente de Suporte à Qualidade de Dados em Data Warehouse, Dissertação de Mestrado, Universidade Federal do Rio de Janeiro, 165p, ANNUNZIATA, G.; OCKWELL, R. (ORGS.). Managing WHO Humanitarian Response in the Field. Geneva, Switzerland: World Health Organization Press, BARANAUSKAS, J. A.; MONARD;, M. C. Conceitos sobre Aprendizado de Máquina. In: S. O. Rezende (Org.); Sistemas Inteligentes - Fundamentos e Aplicações. 1 o ed., p , BARRÁT, A.; BARTHÉLEMY, M.; VESPIGNANI, A. Dynamical Processes on Complex Networks. Journal of Statistical Physics, v. 135, n. 4, p , BEAUMONT, C. Mumbai attacks: Twitter and Flickr used to break news. The Telegraph, 27. nov BEM-PARANÁ. Equipe da UFPR embarca para o Haiti no domingo. Disponível em: < Acesso em: 6/6/2014. BENBYA, H.; MCKELVEY, B. Toward a complexity theory of information systems development. Information Technology & People, v. 19, n. 1, p , BLEI, D. M.; NG, A. Y.; JORDAN, M. I. Latent Dirichlet Allocation. Journal of Machine Learning Research, v. 3, p , BOMAN, J.; TAYLOR, J.; NGU, A. Flexible IoT Middleware for Integration of Things and Applications. Proceedings of the 10th IEEE International Conference on Collaborative Computing: Networking, Applications and Worksharing. p , BOULOS, M. N. K.; WHEELER, S.; TAVARES, C.; JONES, R. How smartphones are changing the face of mobile and participatory healthcare: an overview, with example from ecaalyx. Biomedical engineering online, v. 10, p. 24, CAMERON, M. A.; POWER, R.; ROBINSON, B.; YIN, J. Emergency situation awareness from twitter for crisis management. Proceedings of the 21st international conference companion on World Wide Web - WWW 12 Companion. p.695, CARAGEA, C.; MCNEESE, N.; JAISWAL, A.; TRAYLOR, G.; KIM, H.; MITRA, P.; WU, D.; TAPIA, A. H.; GILES, L.; JANSEN, B. J.; YEN, J. Classifying Text Messages for

179 179 the Haiti Earthquake. Proceedings of the 8th International Conference on Information Systems for Crisis Response and Management, CHARIKAR, M. S. Similarity estimation techniques from rounding algorithms. Proceedings of the thiry-fourth annual ACM symposium on Theory of computing - STOC 02. p.380, CHOWDHURY, S. R.; IMRAN, M.; CASTILLO, C. Tweet4act : Using Incident-Specific Profiles for Classifying Crisis-Related Messages. Proceedings of the 10th International Conference on Information Systems for Crisis Response and Management (ISCRAM). p.1 5, COOPER, S.; KHATIB, F.; TREUILLE, A.; BARBERO, J.; LEE, J.; BEENEN, M.; LEAVER-FAY, A.; BAKER, D.; POPOVIĆ, Z.; PLAYERS, F. Predicting protein structures with a multiplayer online game. Nature, v. 466, n. 7307, p , adapta: Adaptive Approach for Information Integration to Support Decision Making in Complex Environments, Universidade Federal do Rio de Janeiro, 129p, CORDEIRO, K. DE F.; MARINO, T. B.; CAMPOS, M. L. M.; BORGES, M. R. S. Use of Linked Data in the design of information infrastructure for collaborative emergency management system. Proceedings of the th International Conference on Computer Supported Cooperative Work in Design (CSCWD). p , COSKUN, E.; OZCEYLAN, D. Complexity in Emergency Management and Disaster Response Information Systems (EMDRIS). Proceedings of the International Conference at Information System for Crisis Response and Management, DAVID, J. M. Z.; MACIEL, R. S. P. Middleware para sistemas colaborativos. In: M. PIMENTEL; H. FUKS (Orgs.); Sistemas Colaborativos. 1 a Edição ed., p.416, DIAZ, F.; METZLER, D.; AMER-YAHIA, S. Relevance and ranking in online dating systems. Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval - SIGIR 10. p.66, DINIZ, V. B.; BORGES, M. R. S.; GOMES, J. O.; CANÓS, J. H. Knowledge management support for collaborative emergency response. Proceedings of the 9th International Conference on Computer Supported Cooperative Work in Design. p , DISQUE-DENÚNCIA. Disque Denúncia - Números. Disponível em: < Acesso em: 1/6/2014. DRANSCH, D.; POSER, K.; FOHRINGER, J.; LUCAS, C. Volunteered Geographic Information for Disaster Management. Citizen E-Participation in Urban Governance. p , ENEH JOY NNENNA, O. H. O. Mobile Positioning Techniques in GSM Cellular Networks: A Comparative Performance Analysis. International Journal of Computer Technology and Electronics Engineering, v. 2, n. 6, p , 2012.

180 180 ESRI. Emergency/Disaster Management. Disponível em: < Acesso em: 21/8/2013. FERREIRA, A. B. H. Dicionário Aurélio Eletrônico. Disponível em: < Acesso em: 6/6/2015. Architectural Styles and the Design of Network-based Software Architectures, Tese de Doutorado, University of California, Não-Extensividade Termodinâmica, Invariância Discreta de Escala e Elasto- Plasticidade: Estudo Numérico de um Modelo Geomecânico Auto-Organizado Criticamente, Pontifícia Universidade Católica do Rio de Janeiro, 189p, 2003a. Não-extensividade termodinâmica, invariância discreta de escala e elasto-plasticidade: estudo numérico de um modelo geomecânico auto-organizado criticamente, Pontifícia Universidade Católica do Rio Janeiro, 2003b. FILIPPO, D.; FILHO, J. V.; ENDLER, M.; FUKS, H. Mobilidade e ubiquidade para colaboração. In: H. PIMENTEL, M.; FUKS (Org.); Sistemas Colaborativos. 1 a Edição ed., p.416, FININ, T.; MURNANE, W.; KARANDIKAR, A.; KELLER, N.; MARTINEAU, J.; DREDZE, M. Annotating Named Entities in Twitter Data with Crowdsourcing. In: C. Callison-Burch; M. Dredze (Orgs.);. v. 2010, p.80 88, FITZGERALD, M. IAPA: Two Months On, Haitian Press Still Devastated by Earthquake. Disponível em: < >.. GEOSMS. Open GeoSMS for Emergency and Disaster Management. Disponível em: < Acesso em: 24/2/2013. GO, A.; BHAYANI, R.; HUANG, L. Twitter Sentiment Classification using Distant Supervision., p. 1 6, GOOGLE. Nosso Planeta Mobile: Brasil - Como entender o usuário de celular. Disponível em: < Acesso em: 1/6/2012. GOUVEIA, C.; FONSECA, A. New approaches to environmental monitoring: the use of ICT to explore volunteered geographic information. GeoJournal, v. 72, n. 3-4, p , GOUVEIA, C.; FONSECA, A. New approaches to environmental monitoring: the use of ICT to explore volunteered geographic information. GeoJournal, v. 72, n. 3-4, p , 2008.

181 181 GRONEWOLD, N. Devastated Haiti Braces for an Active Hurricane Season. New York Times, 12. jul HART, G. The five W s: An old tool for the new task of audience analysis. Technical Communication, v. 43, n. 2, p , HEINZELMAN, J.; WATERS, C. Crowdsourcing Crisis Information in Disaster- Affected Haiti. Washington, D.C, USA, HEINZELMAN, J.; WATERS, C. Crowdsourcing Crisis Information in Disaster-. Washington, DC, HERAVI, B. R.; BORAN, M.; BRESLIN, J. G. Towards Social Semantic Journalism. Sixth International AAAI Conference on Weblogs and Social Media, HERAVI, B. R.; MCGINNIS, J. A Framework for Social Semantic Journalism. First International IFIP Working Conference on Value-Driven Social & Semantic Collective Intelligence (VaSCo), at ACM Web Science HEYLIGHEN, F. Building a Science of Complexity. Annual Conference of the Cybernetic Society, HOLLAND, J. H. Complex Adaptive Systems: A Primer. Disponível em: < Acesso em: 17/7/2012. HOWARD, B. C. Scanning Social Media to Improve Typhoon Haiyan Relief Efforts., p , HUGHES, A. L.; PALEN, L. Twitter adoption and use in mass convergence and emergency events. International Journal of Emergency Management, v. 6, n. 3/4, p. 248, ITAIPU. Situação no Haiti pode piorar. Disponível em: < Acesso em: 6/6/2014. KAMEL BOULOS, M. N.; RESCH, B.; CROWLEY, D. N.; BRESLIN, J. G.; SOHN, G.; BURTNER, R.; PIKE, W. A; JEZIERSKI, E.; CHUANG, K.-Y. S. Crowdsourcing, citizen sensing and sensor web technologies for public and environmental health surveillance and crisis management: trends, OGC standards and application examples. International journal of health geographics, v. 10, p. 67, KAUFMANN, N.; VEIT, D. More than fun and money. Worker Motivation in Crowdsourcing A Study on Mechanical Turk Crowdsourcing A Study on Mechanical Turk. AMCIS 2011 Proceedings, KIRA, K.; RENDELL, L. A. The feature selection problem: traditional methods and a new algorithm. Proceedings of the tenth national conference on Artificial intelligence. p , 1992.

182 182 KUZNETSOV, S. Motivations of contributors to Wikipedia. ACM SIGCAS Computers and Society, v. 36, n. 2, p. 1 7, LEITE, M. S.; REINISCH, A. C. C. S.; BORNIA, A. C. A Cadeia de Suprimento vista como um Sistema Adaptativo Complexo (SAC): convivência dialógica de conceitos. XXIII Encontro Nacional de Engenharia de Produção, LINDEL, M. K.; PRATER, C.; PERRY, R. W. Introduction to Emergency Management. John Wiley & Sons, MARINO, T. B.; NASCIMENTO, B. S. DO; BORGES, M. R. S. GIS Supporting Data Gathering and Fast Decision Making in Emergencies Situations. Proceedings of the 9th International ISCRAM Conference. p.1 6, MARIOTTI, H. Pensamento Complexo: Suas Aplicações à Liderança, à Aprendizagem e ao Desenvolvimento Sustentável. 2 a Ediçao ed.são Paulo, Brasil: Atlas, MAZUMDAR, S.; LANFRANCHI, V.; CANO, A. E. Visualising Topical Sentiment and Influence in Social Media. Proceedings of Social Media and Linked Data for Emergency Response (SMILE) Workshop. Extended Semantic Web Conference, ESWC p.1 12, MCCALLUM, A.; NIGAM, K. A Comparison of Event Models for Naive Bayes Text Classification. AAAI-98 Workshop on Learning for Text Categorization. p.41 48, MILLER, J. H.; PAGE, S. E. Complex Adaptative Systems: An introduction to Computational Models of Social Life. Princeton University Press, MIRANDA, R. C. R. O uso da informação na formulação de ações estratégicas pelas empresas. Ciência da Informação, v. 28, n. 3, p , MITCHELL, M. Complexity: The Emerging Science At The Edge Of Order And Chaos. USA: Touchstone Books, MITCHELL, M. Complexity: A Guided Tour. USA: Oxford University Press, MORIN, E. Introdução ao Pensamento Complexo. 3 a Edição ed.porto Alegre, Brasil: Sulina, MUNRO, R. Crowdsourcing and the crisis-affected community. Information Retrieval, v. 16, n. 2, p , NONAKA, I.; TAKEUCHI, H. Criação do Conhecimento na Empresa: como as empresas geram a dinâmica da inovação. Rio de Janeiro, Brasil: Campus, OCHA. How are disaster relief efforts organised? Cluster Approach. Disponível em: < Acesso em: 11/12/2012.

183 183 OLTEANU, A.; CASTILLO, C.; DIAZ, F.; VIEWEG, S. CrisisLex: A Lexicon for Collecting and Filtering Microblogged Communications in Crises. In: A. Arbor (Org.); Proceedings of the AAAI Conference on Weblogs and Social Media (ICWSM 14), PALAZZO, L. A. M. Complexidade, caos e auto-organização. Oficina de Inteligência Artificial III, Anais. p.49 67, PASSANT, A.; BRESLIN, J. G.; DECKER, S. Open, distributed and semantic microblogging with SMOB. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). v LNCS, p , PASSONNEAU, R. Sentiment Analysis of Twitter Data. Proceeding LSM 11 Proceedings of the Workshop on Languages in Social Media. p.30 38, Avaliação da Qualidade de Dados pela Não Conformidade, Universidade Federal do Rio de Janeiro, 110p, Modelagem primária da temperatura do ar em uma floresta de transição Amazôniacerrado no norte de Mato Grosso, Universidade Federal de Mato Grosso, PUROHIT, H.; CASTILLO, C.; DIAZ, F.; SHETH, A.; MEIER, P. Emergency-relief coordination on social media: Automatically matching resource requests and offers. First Monday, v. 19, n. 1, p. 1 42, R. SABRA JAFARZADEH, J. Emergency management 2.0: Integrating social media in emergency communications. The New England journal of medicine, v. 9, n. 1, p , REISSWITZ, F. Análise De Sistemas. Rio de Janeiro, Brasil: Clube de Autores, REUTER, C.; MARX, A.; PIPEK, V. Social Software as an Infrastructure for Crisis Management - a Case Study About Current Practice and Potential Usage. Proceedings of the 8th International ISCRAM Conference, ROGSTADIUS, J.; KOSTAKOS, V. Towards Real-time Emergency Response using Crowd Supported Analysis of Social Media. Computational Linguistics, ROGSTADIUS, J.; KOSTAKOS, V.; KITTUR, A.; SMUS, B.; LAREDO, J.; VUKOVIC, M. An Assessment of Intrinsic and Extrinsic Motivation on Task Performance in Crowdsourcing Markets.,, n. Gibbons 1997, p , AgileOOHDM, Pontifícia Universidade Católica do Rio de Janeiro, 78p, SCHÖLKOPF, B.; SMOLA, A. J.; WILLIAMSON, R. C.; BARTLETT, P. L. New Support Vector Algorithms. Neural Computation, v. 12, n. 5, p , SHETH, A. Citizen Sensing, Social Signals, and Enriching Human Experience. IEEE Internet Computing, v. 13, n. 4, p , 2009.

184 184 SILVESCU, A.; CARAGEA, C.; HONAVAR, V. Combining Super-Structuring and Abstraction on Sequence Classification Ninth IEEE International Conference on Data Mining. p , SIMON, H. A. The Architecture of Complexity. The American Philosophical Society. Disponível em: < Acesso em: 17/5/2012. SINGH, P.; PARK, I.; LEE, J. Information Sharing: A Study of Information Attributes and their Relative Significance During Catastrophic Events. In: K. J. Knapp (Org.); Cyber Security and Global Information Assurance. p , SMUTS, J. C. Holism and evolution. New York, USA: The Gestalt Journal Press, SOS. 112 in Sweden: The 2008 Annual Activity Report. Stockholm, Sweden, SPRING, A.; ROGSTADIUS, J.; VUKOVIC, M.; TEIXEIRA, C. A.; KOSTAKOS, V.; KARAPANOS, E.; LAREDO, J. A. CrisisTracker: Crowdsourced social media curation for disaster awareness. IBM Journal of Research and Development, v. 57, n. 5, p. 4:1 4:13, STVILIA, B.; TWIDALE, M. B.; SMITH, L. C.; GASSER, L. Information quality work organization in wikipedia. Journal of the American Society for Information Science and Technology, v. 59, n. 6, p , TANG, J. C.; CEBRIAN, M.; GIACOBE, N. A.; KIM, H.-W.; KIM, T.; WICKERT, D. BEAKER. Reflecting on the DARPA Red Balloon Challenge. Communications of the ACM, v. 54, n. 4, p. 78, TSUR, O.; LITTMAN, A.; RAPPOPORT, A. Efficient Clustering of Short Messages into General Domains. Seventh International AAAI Conference on Weblogs and Social Media. p.10, USHAHIDI. Data Science for Social Good and Ushahidi. Summer Fellowship 2013: Ushahidi, VIEIRA, C. L. Sistemas Complexos: A fronteira entre a ordem e o caos. Rio de Janeiro, Brasil, VIVACQUA, A. S.; GARCIA, A. C. B. Ontologia de colaboração. In: M. Pimentel; H. Fuks (Orgs.); Sistemas Colaborativos2. 1 a Ediçao ed., p.416, VOSS, J. Tagging, Folksonomy & Co - Renaissance of Manual Indexing?. 10th international Symposium for Information Science. p.12, VUKOVIC, M. Crowdsourcing for Enterprises Congress on Services - I. p , WALDROP, M. Complexity: The Emerging Science at the Edge of Order and Chaos. Simon & Schuster, 1992.

185 185 WEISER, M. Computer for the twenty-first century. Scientific American, v. 265, n. 3, p , XAVIER-DA-SILVA, J. O que é Geoprocessamento?. Revista do CREA-RJ N o 79, p , XAVIER-DA-SILVA, J.; MARINO, T. B. Citizenship through data sharing in the Amazon region. Proceedings of the 2nd International Conference on Computing for Geospatial Research & Applications - COM.Geo 11. p.1 5, 2011.

186 186 Apêndices Apêndice A Requisitos básicos para a elaboração de bibliotecas de comunicação para as fontes de informações colaborativas 1. Ser uma classe PHP. Ex.: class Twitter {... } 2. Conter a função: Public Function getmessages($strkeywords = '', $strfromdatetime = '', $strtodatetime = '', $dbllatitude = '', $dbllongitude = '', $dblradiuskm = '') { return <results> } 2.1. Parâmetros da função: $strkeywords: restringe os resultados da busca a palavras-chave específicas, separadas pelo caractere vírgula (,). Exemplo: haiti,earthquake,port au prince,port prince,tremblant $strfromdatetime: determina que o conjunto de publicações retornado deve conter somente registros criados a partir da data estabelecida pelo parâmetro. Formato: YYYY-MM-DD HH:MM:SS Exemplo: :43:00 $strtodatetime: determina que o conjunto de publicações retornado deve conter somente registros criados até da data estabelecida pelo parâmetro. Formato: YYYY-MM-DD HH:MM:SS Exemplo: :59:59 $dbllatitude: coordenada latitude referente ao ponto central de referência da filtragem espacial dos resultados. Formato: DD.DDDDDD (grau decimal) Exemplo: $dbllongitude: coordenada longitude referente ao ponto central de referência da filtragem espacial dos resultados. Formato: DD.DDDDDD (grau decimal) Exemplo: $dblradiuskm: determina que o conjunto de publicações retornado deve conter somente registros criados a partir da data estabelecida em tal parâmetro. Formato: Decimal Exemplo: O retorno XML deve conter as tags <results> para identificar o início do conjunto de publicações e <post> para identificar cada publicação capturada. 3. Função: public function postmessage($iduser, $strmessage) {} NÃO OBRIGATÓRIA 3.1. Parâmetros da função: $strid: identificador único do usuário da fonte de informação. $txtmessage: mensagem a ser enviada ao usuário.

187 187 Apêndice B Exemplo de código PHP do script para coleta de publicações da rede social Facebook através do processo [COL] Coletar Publicações <?php class Facebook { private $accountuser = "colaboracaosocial@gmail.com"; private $accountuserpassword = "Colabora2.0"; private $appid = " "; private $appsecret = "51ecf8812cd5e5bf42132fcc9e84c0f3"; public function postmessage($strid, $txtmessage) { // Send to user $strid@@facebook.com $txtmessage = utf8_decode($txtmessage); $strto = $strid. '@facebook.com'; $txtmessage = $strsubject. ' <br>'. $txtmessage; $blnresult SOCIALCOL: FEEDBACK,$txtMessage); return $blnresult; } public function getmessages($strkeywords, $strfromdatetime='', $strtodatetime='',$strlatitude='',$strlongitude='',$strradiuskm='') { $arrresult = array(); /* Setting filters */ $arrkeywords = array(); if ($strkeywords) { $arrkeywords = explode(',', utf8_encode($strkeywords)); } // Parameters $arrfilterparams = array(); if($strfromdatetime)$arrfilterparams[]='&since='.$strfromdatetime; if($strtodatetime) $arrfilterparams[]='&until='.$strtodatetime); if($strlatitude) $arrfilterparams[]='&center='.$strlatitude.','.$strlongitude; if($strradiuskm)$arrfilterparams[]='&distance='.$strradiuskm*1000; $arrfilterparams[] = '&limit=100'; }?> } // First getting a access token $strtoken = $this->getaccesstoken(); foreach ($arrkeywords as $strkeyword) { $strkeyword = str_replace(' ', '+', $strkeyword); $strurlrequest = ' $strtoken. '&q='.$strkeyword. implode('',$arrfilterparams); $data = $this->strings->processurl($strurlrequest); $json = $this->strings->objectify('json', $data); // Loop for each result foreach($json->{"data"} as $entry) { $arrresult['post'][] = $entry; } } $strxml = $this->strings->strarraytoxml($arrresult); return $strxml;

188 188 Apêndice C Vocabulário de referência organizado para a associação de atributos comuns e anotação das publicações tratadas Termo do Vocabulário Tipo Definição Original do Termo URI Post.strPrimaryKey Chave- Primária Information source primary key atribute. Ex.: Post.What.strAttachedFileURL Texto The URI of a file attached to an Item.Ex.: Post.What.strLanguage Texto The set of tags, constructed according to RFC 1766, for the identification of languages.ex.: en-us Post.What.strMessage Texto The content of the Item in plain text format.ex.: Just seen a house in fire at city center Post.What.strMessageOriginal Texto The content of the Item in plain text format, under original language.ex.: Acabo de ver uma residência pegando fogo no centro Post.What.strTags Texto The topic of the resource. Typically, the subject will be represented using keywords, key phrases, or classification codes. Recommended best practice is to use a controlled vocabulary.ex.: Request for Food Post.When.dtPosted Data/Hora The date and time of the last activity associated with a SIOC

189 189 concept instance, and expressed in ISO 8601 format. This could be due to a reply Post or Comment, a modification to an Item, etc. Ex.: T18:50Z Post.Where.dblLatitude Numérico The WGS84 latitude of a SpatialThing (decimal degrees).ex.: Post.Where.dblLongitude Numérico The WGS84 longitude of a SpatialThing (decimal degrees).ex.: Post.Where.PlaceName Texto The location of the thing. More info: Copacabana - Rio de Janeiro - Brasil Post.Who.From.strID Texto Refers to the foaf:agent or foaf:person who owns this sioc:useraccount.ex.: wgs84_pos#lat wgs84_pos#long #Place

190 190 Apêndice D Especificação da Ontologia SocialCol para Anotação de Publicações Correlatas <rdf:rdf > xmlns:rdf=" xmlns:rdfs=" xmlns:owl=" xmlns:dcterms=" xmlns:sioc=" xmlns:scol=" <owl:ontology rdf:about=" rdf:type=" <dcterms:title xml:lang="en">socialcol Ontology Namespace</dcterms:title> <owl:versioninfo>revision: 1.0</owl:versionInfo> <dcterms:description xml:lang="en">socialcol (Social Collaboration) is an ontology for describing the spatial, temporal and taxonomic correlations between posts originated from heterogeneous information sources(sensors, social media, SMS, s).</dcterms:description> <rdfs:seealso rdf:resource=" rdfs:label="socialcol Ontology Specification"/> </owl:ontology> <owl:objectproperty> <rdfs:label xml:lang="en">isspatialcorrelatedto</rdfs:label> <rdfs:comment xml:lang="en">specifies that this Post is correlated to another Post due to their spatial proximity.</rdfs:comment> <rdfs:domain rdf:resource=" </owl:objectproperty> <owl:objectproperty> <rdfs:label xml:lang="en">istimecorrelatedto</rdfs:label> <rdfs:comment xml:lang="en">specifies the temporal correlation between two posts due to the short time interval between their publications.</rdfs:comment> <rdfs:domain rdf:resource=" </owl:objectproperty> <owl:objectproperty> <rdfs:label xml:lang="en">istaxonomiccorrelatedto</rdfs:label> <rdfs:comment xml:lang="en">specifies the taxonomic correlation between two Posts once there were found common subjects between their contents.</rdfs:comment> <rdfs:domain rdf:resource=" </owl:objectproperty> </rdf:rdf>

191 191 Apêndice E Histórico de contatos por para a solicitação das bases de dados 1. Organização Mission 4636 De: Tiago Marino (tiagomarino@ufrj.br) Enviada: segunda-feira, 18 de novembro de :56:50 Para: info@mission4636.org (info@mission4636.org) Anexos: Marino, Nascimento, Borges GIS Supporting Data Gathering and Fast Decision Making in Emergencies Situations.pdf (557,2 KB), Curriculum System of Curriculum Lattes (Tiago Badre Marino).pdf (278,0 KB), Architecture for Selection, Processing and Sharing Collaborative Information for Decision Support in Emergency Situationsv2.pdf (815,0 KB) My name is Tiago Marino. I'm a PhD student in computer science post-graduate program at the Federal University of Rio de Janeiro (Brazil). By over 10 years I've also been volunteering with CENACID - a UNDAC partner, coordinated by an UNDAC team expert (prof. Renato Lima). During this time I had the opportunity to support dozens of disaster's response missions occurred in Brazil and America Latina (including 2010 Haiti Earthquake). My main role inside the group is related to field assessments information management, generated during our missions. I'm responsible to organize it and provide updated maps, situation reports, and so on... At Geoprocessing Laboratory, I developed a GIS which handles and organizes these kind of information (details in paper attached to this message). So that's a small briefing about myself and my interests. Currently I'm in the 3rd year of my PhD, in a internship at DERI/Galway, at Social Software Group (leaded by John Breslin) ( and my focus evolves Collaborative Information for Decision Support During Emergency Responses. My experiment works over automated procedure for posts translation, classification, location, grouping considering different information sources such as social networks, phone calls, sms, , sensor, data gathered from field agents, social collaboration, etc. For my experimentation I've already collected a couple of datasets related to 2010 Haiti earthquake disaster. The point is that if I could have any dataset related to 2010 Haiti disaster, it could be very helpful for my experiment tests. As I plan to evaluate my techniques under different communication channels it would be useful if I could have a SMS/Twitter datasets. Please, if you need more information about my research, it will be a pleasure to share it with you. Take this opportunity to congratulate you for the wonderful work and service to humanity causes. All the best Tiago Marino

192 192 De: Enviada: domingo, 24 de novembro de :31:05 Para: Anexos: mission_4636_anonymized_v2.tsv (7,5 MB) Thank you, Tiago The messages are attached as tab-separated columns. Here is a definition of the fields: id: unique id number for the message date_received: the date the message was received by Mission 4636 message: the actual 4636 message translation: the translation and notes sender_phone_anon: the phone number (anonymized but consistent) primary_category: the main category given to the message latitude: latitude of the reported location longitude: longitude of the reported location city: the name of the city dept: the name of the department missing_person_status: the missing person status date_last_modified: the time that the message was finalized and sent to responders time_to_process: the time taken to process the message all_categories: the full set of categories actionable: whether of not the message was 'actionable' (partial) ushahidi_date_added: the date the message was published in the Ushahidi Crisis Map ushahidi_time_to_process: the time taken for the message to be added to the Ushahidi@Tufts Crisis Map workforce: the workforce: Mission 4636 volunteers, or paid workers within Haiti While the messages have been anonymized, there may still contain some personally identifying information, so please follow the guidelines at: When referring to this data in your research, please cite the following paper: Munro, Robert, Crowdsourcing and Crisis Affected Community. Journal of Information Retrieval, 16(2), Springer Robert was a member of Mission 4636 and the only person who interviewed us Haitians when writing the report. If you haven't already, you can also reach out to him directly: robert.munro@gmail.com We wish you the best with your research! The Mission 4636 coordinators

193 Organização Sahana Foundation De: Tiago Marino Enviada: segunda-feira, 18 de agosto de :51:13 Para: Michael Howden Anexos: Marino, Nascimento, Borges GIS Supporting Data Gathering and Fast Decision Making in Emergencies Situations.pdf (557,2 KB), Curriculum System of Curriculum Lattes (Tiago Badre Marino).pdf (278,0 KB), Architecture for Selection, Processing and Sharing Collaborative Information for Decision Support in Emergency Situationsv2.pdf (815,0 KB) Dear colleague Michael, My name is Tiago Marino. I'm a PhD student in computer science post-graduate program at the Federal University of Rio de Janeiro (Brazil). By over 10 years I've also been collaborating as volunteer with the CENACID - a UNDAC partner, coordinated by an UNDAC team expert (prof. Renato Lima). During this time I had the opportunity to support dozens of disaster's response missions occurred in Brazil and America Latina (including 2010 Haiti Earthquake). My main role inside the group is related to field assessments information management, generated during our missions. I'm responsible to organize it and provide updated maps, situation reports, and so on... At Geoprocessing Laboratory, I developed a GIS which handles and organizes this kind of information (details in paper attached to this message). So that's a small briefing about myself and my interests. Currently I'm in the 4th year of my PhD and my focus evolves Collaborative Information for Decision Support During Emergency Responses. My experiment works over automated procedure for posts translation, classification, location, grouping considering different information sources such as social networks, phone calls, sms, , sensor, data gathered from field agents, social collaboration, etc.. For my experimentation I've already collected a couple of datasets related to 2010 Haiti earthquake disaster. By reading about your contribution at I've noticed that you built a valuable dataset regarding 2010 Haiti disaster. So I was wondering if you could share this dataset with me. I ensure you that's just for research purpose. I won't expose any private content and compromise to credit your institution in my work and any publication originated from this work. I've got your from a PhD mate, Kelli Faria, which already contacted you before in order to request data for her thesis research as well. We are part of a workgroup which inspects topics related to information and crisis situations. By the way, regarding Kelli's previous request, she stated me that she tried to contact the person responsible for the Philippines disaster dataset - Mr. Sandy - but she still couldn't have access to the data she requested. When I told her that I was about to write to you, she kindly asked me if I could state this

194 194 issue (her fail to get the data by contacting him) to you. Please, if you need more information about my research, it will be a pleasure to share it with you. Take this opportunity to congratulate you for the wonderful work and service to humanity causes. All the best Tiago Marino De: Michael Howden (michael@sahanafoundation.org) Enviada: terça-feira, 19 de agosto de :01:04 Para: Tiago Marino (tiagomarino@ufrj.br) Mark & Fran - Do either of you know if there is a backup of the Haiti data anywhere? Or the Sandy Relief? Any issues you can see with sharing this information? Tiago - I'm new in the role, some hopefully Mark or Fran will be able to shed some light on this! I would be really interested in see the output of any of your research. Have you had a look at our other deployments: Perhaps the Timor-Leste Disaster Risk Management Information System ( - you should be able to extract much of that information - but I may be able to help put you in touch with some of the users. I would suggest that Kelli tries following up again with Sandy. I would also suggest that perhaps she determine exactly what information she wants. A DB dump is a big ask - perhaps a few exports would be a lot easier to get permission to provide! I will discuss this with Sandy if I get a chance to talk to him. I would also be interested if there was any potential to form any sort of partnership with your group? Through Sahana we are able to collect a large amount of data about disasters which could be valuable to you. Your research and analysis of this data could help to deliver more value to the organizations using Sahana. Let me know if this is something you're interested in and would like to discuss further. Cheers Michael Howden - CEO, Sahana Software Foundation De: Fran Boon (fran@sahanafoundation.org) Enviada: terça-feira, 19 de agosto de :48:33 Para: Tiago Marino (tiagomarino@ufrj.br) Anexos: rms_req.7z A copy of that table from our DB is attached. It certainly has some of the Tweak the Tweet data...i'm not sure if this also has 4636 data mixed-in (I know I have that separately too) You might be able to get a better dataset from the original person: project: The server is offline...we have no funds to keep old sites alive indefinitely. Best Wishes, Fran.

195 Apêndice F Diagrama Entidade-Relacionamento (DER) do repositório de coleta e processamento da plataforma experimental SocialCol 195

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados 1. Introdução O governo é um dos maiores detentores de recursos da informação. Consequentemente, tem sido o responsável por assegurar que tais recursos estejam agregando valor para os cidadãos, as empresas,

Leia mais

Processos de gerenciamento de projetos em um projeto

Processos de gerenciamento de projetos em um projeto Processos de gerenciamento de projetos em um projeto O gerenciamento de projetos é a aplicação de conhecimentos, habilidades, ferramentas e técnicas às atividades do projeto a fim de cumprir seus requisitos.

Leia mais

Capítulo 2 Usabilidade... 24 2.1 Definição de usabilidade... 25 2.2 Resumo... 39 2.3 Leitura recomendada... 39

Capítulo 2 Usabilidade... 24 2.1 Definição de usabilidade... 25 2.2 Resumo... 39 2.3 Leitura recomendada... 39 Prefácio... IX Lista de Siglas e Abreviaturas... XIII Lista de Figuras e Quadros... XVI Capítulo 1 Portal web... 1 1.1 Definição de portal web... 3 1.2 Portal corporativo... 8 1.3 Resumo... 22 1.4 Leitura

Leia mais

PlusPixel Marketing Digital SOMOS MAIS SOCIAIS DO QUE NUNCA

PlusPixel Marketing Digital SOMOS MAIS SOCIAIS DO QUE NUNCA PlusPixel Marketing Digital SOMOS MAIS SOCIAIS DO QUE NUNCA Proposta de Marketing Digital Design inox Marketing de Resultados A PlusPixel vem oferecendo seus serviços desde o início da internet, isso nos

Leia mais

Política de Gerenciamento de Risco Operacional

Política de Gerenciamento de Risco Operacional Política de Gerenciamento de Risco Operacional Departamento Controles Internos e Compliance Fevereiro/2011 Versão 4.0 Conteúdo 1. Introdução... 3 2. Definição de Risco Operacional... 3 3. Estrutura de

Leia mais

Questionário de avaliação de Práticas X Resultados de projetos - Carlos Magno Xavier (magno@beware.com.br)

Questionário de avaliação de Práticas X Resultados de projetos - Carlos Magno Xavier (magno@beware.com.br) Obrigado por acessar esta pesquisa. Sei como é escasso o seu tempo, mas tenha a certeza que você estará contribuindo não somente para uma tese de doutorado, mas também para a melhoria das práticas da Comunidade

Leia mais

Aprimoramento através da integração

Aprimoramento através da integração Aprimoramento através da integração Uma parceria para implementar uma solução de aprendizagem em tempo recorde Visão Geral Com mais de 70 anos de excelência na produção de conhecimento no Brasil, a Fundação

Leia mais

CÓPIA MINISTÉRIO DA FAZENDA Conselho Administrativo de Recursos Fiscais

CÓPIA MINISTÉRIO DA FAZENDA Conselho Administrativo de Recursos Fiscais Fl. 2 MINISTÉRIO DA FAZENDA Conselho Administrativo de Recursos Fiscais PORTARIA CARF Nº 64, DE 18 DE NOVEMBRO DE 2015. Dispõe sobre a Política de Gestão de Riscos do Conselho Administrativo de Recursos

Leia mais

PROJETO DE COOPERAÇÃO TÉCNICA INTERNACIONAL. Projeto 914 BRA5065 - PRODOC-MTC/UNESCO DOCUMENTO TÉCNICO Nº 03

PROJETO DE COOPERAÇÃO TÉCNICA INTERNACIONAL. Projeto 914 BRA5065 - PRODOC-MTC/UNESCO DOCUMENTO TÉCNICO Nº 03 PROJETO DE COOPERAÇÃO TÉCNICA INTERNACIONAL Diretrizes e Estratégias para Ciência, Tecnologia e Inovação no Brasil Projeto 914 BRA5065 - PRODOC-MTC/UNESCO DOCUMENTO TÉCNICO Nº 03 RELATÓRIO TÉCNICO CONCLUSIVO

Leia mais

Módulo 9 A Avaliação de Desempenho faz parte do subsistema de aplicação de recursos humanos.

Módulo 9 A Avaliação de Desempenho faz parte do subsistema de aplicação de recursos humanos. Módulo 9 A Avaliação de Desempenho faz parte do subsistema de aplicação de recursos humanos. 9.1 Explicações iniciais A avaliação é algo que faz parte de nossas vidas, mesmo antes de nascermos, se não

Leia mais

Backsite Serviços On-line

Backsite Serviços On-line Apresentação Quem Somos O Backsite Com mais de 15 anos de mercado, o Backsite Serviços On-line vem desenvolvendo soluções inteligentes que acompanham o avanço das tecnologias e do mundo. Com o passar do

Leia mais

Introdução. Para a condução de cada ação teremos presentes duas questões importantes:

Introdução. Para a condução de cada ação teremos presentes duas questões importantes: Fevereiro 2014 Introdução A Escola é hoje um mundo onde todos os atores educativos têm voz por isso a facilidade, a celeridade, a clareza e a abertura são as caraterísticas da comunicação que possibilitam

Leia mais

O Gerenciamento de Documentos Analógico/Digital

O Gerenciamento de Documentos Analógico/Digital Tipos de GED: Document imaging Document management Document Imaging / Document Management O Gerenciamento de Documentos Analógico/Digital Mundo analógico Criação Revisão Processamento Arquivo Mundo digital

Leia mais

Administração de Sistemas de Informação I

Administração de Sistemas de Informação I Administração de Sistemas de Informação I Prof. Farinha Aula 04 Conceito Sistema de Informação é uma série de elementos ou componentes inter-relacionados que coletam (entrada), manipulam e armazenam (processo),

Leia mais

Inovação aberta na indústria de software: Avaliação do perfil de inovação de empresas

Inovação aberta na indústria de software: Avaliação do perfil de inovação de empresas : Avaliação do perfil de inovação de empresas Prof. Paulo Henrique S. Bermejo, Dr. Prof. André Luiz Zambalde, Dr. Adriano Olímpio Tonelli, MSc. Pamela A. Santos Priscila Rosa LabGTI Laboratório de Governança

Leia mais

ESTRUTURA DE GERENCIAMENTO DO RISCO OPERACIONAL DO BANCO COOPERATIVO SICREDI E EMPRESAS CONTROLADAS

ESTRUTURA DE GERENCIAMENTO DO RISCO OPERACIONAL DO BANCO COOPERATIVO SICREDI E EMPRESAS CONTROLADAS ESTRUTURA DE GERENCIAMENTO DO RISCO OPERACIONAL DO BANCO COOPERATIVO SICREDI E EMPRESAS CONTROLADAS Versão : 31 de dezembro de 2008 CONTEÚDO 1. INTRODUÇÃO...3 2. ORGANIZAÇÃO DA GESTÃO DE RISCO OPERACIONAL...3

Leia mais

Engenharia de Software e Gerência de Projetos Prof. Esp. André Luís Belini Bacharel em Sistemas de Informações MBA em Gestão Estratégica de Negócios

Engenharia de Software e Gerência de Projetos Prof. Esp. André Luís Belini Bacharel em Sistemas de Informações MBA em Gestão Estratégica de Negócios Engenharia de Software e Gerência de Projetos Prof. Esp. André Luís Belini Bacharel em Sistemas de Informações MBA em Gestão Estratégica de Negócios Cronograma das Aulas. Hoje você está na aula Semana

Leia mais

NORMA BRASILEIRA DE CONTABILIDADE TÉCNICA DO SETOR PÚBLICO NBCT (IPSAS)

NORMA BRASILEIRA DE CONTABILIDADE TÉCNICA DO SETOR PÚBLICO NBCT (IPSAS) NORMA BRASILEIRA DE CONTABILIDADE TÉCNICA DO SETOR PÚBLICO NBCT (IPSAS) Temas para Discussão 1) DISPOSIÇÕES GERAIS 2) DEFINIÇÕES GERAIS 3) CARACTERÍSTICAS E ATRIBUTOS DA INFORMAÇÃO DE CUSTOS 4) EVIDENCIAÇÃO

Leia mais

INTRODUÇÃO. Entendemos por risco a probabilidade de ocorrer um dano como resultado à exposição de um agente químico, físico o biológico.

INTRODUÇÃO. Entendemos por risco a probabilidade de ocorrer um dano como resultado à exposição de um agente químico, físico o biológico. INTRODUÇÃO No nosso dia-a-dia enfrentamos diferentes tipos de riscos aos quais atribuímos valor de acordo com a percepção que temos de cada um deles. Estamos tão familiarizados com alguns riscos que chegamos

Leia mais

CA Mainframe Chorus for Storage Management Versão 2.0

CA Mainframe Chorus for Storage Management Versão 2.0 FOLHA DO PRODUTO CA Mainframe Chorus for Storage Management CA Mainframe Chorus for Storage Management Versão 2.0 Simplifique e otimize suas tarefas de gerenciamento de armazenamento, aumente a produtividade

Leia mais

Controle da produção baseado em códigos de barras

Controle da produção baseado em códigos de barras Controle da produção baseado em códigos de barras Fábio Favaretto (PUCPR) fabiofav@ccet.pucpr.br Alfredo Iarozinski Neto (PUCPR) alfredo@ccet.pucpr.br Resumo O controle da produção é um processo que tem

Leia mais

O Uso da Inteligência Competitiva e Seus Sete Subprocessos nas Empresas Familiares

O Uso da Inteligência Competitiva e Seus Sete Subprocessos nas Empresas Familiares O Uso da Inteligência Competitiva e Seus Sete Subprocessos nas Empresas Familiares O uso da Inteligência Competitiva como processo para monitorar tecnologias, legislação, ambiente regulatório, concorrência,

Leia mais

Gerenciamento de custos do projeto

Gerenciamento de custos do projeto PMBOK Visão Geral O PMBOK (Project Management Body of Knowledge) é um guia do Conjunto de Conhecimentos em de Projetos, o qual inclui práticas comprovadas que são amplamente aplicadas na gestão de s, além

Leia mais

SISTEMAS DE INFORMAÇÃO GERENCIAIS

SISTEMAS DE INFORMAÇÃO GERENCIAIS SISTEMAS DE INFORMAÇÃO GERENCIAIS Aluno: Luiza Cavalcanti Marques Orientador: Silvio Hamacher Introdução A modelagem e a utilização de bancos de dados em atividades gerenciais têm sofrido um aumento significativo

Leia mais

Plano de Trabalho BVS Brasil https://goo.gl/d3eccm

Plano de Trabalho BVS Brasil https://goo.gl/d3eccm Plano de Trabalho BVS Brasil https://goo.gl/d3eccm Linha estratégica 1: Fortalecimento da Rede BVS Brasil Prioridade 1.1 Ampliação das alianças e das redes que atuam na informação científica e técnica

Leia mais

Unidade 9: Diálogos deliberativos

Unidade 9: Diálogos deliberativos Unidade 9: Diálogos deliberativos Como podemos utilizar as sínteses de evidências? Informar os grupos de interesse Divulgação da síntese de políticas Informações adaptadas derivadas da síntese Meios de

Leia mais

Copyright Proibida Reprodução. Prof. Éder Clementino dos Santos

Copyright Proibida Reprodução. Prof. Éder Clementino dos Santos NOÇÕES DE OHSAS 18001:2007 CONCEITOS ELEMENTARES SISTEMA DE GESTÃO DE SSO OHSAS 18001:2007? FERRAMENTA ELEMENTAR CICLO DE PDCA (OHSAS 18001:2007) 4.6 ANÁLISE CRÍTICA 4.3 PLANEJAMENTO A P C D 4.5 VERIFICAÇÃO

Leia mais

Apresentação do Manual de Gestão de IDI

Apresentação do Manual de Gestão de IDI Seminário Final do Projeto IDI&DNP Coimbra 31 de março Miguel Carnide - SPI Conteúdos. 1. O CONCEITO DE IDI (INVESTIGAÇÃO, DESENVOLVIMENTO E INOVAÇÃO) 2. OVERVIEW DO MANUAL 3. A NORMA NP 4457:2007 4. A

Leia mais

Novas Formas de Aprender e Empreender

Novas Formas de Aprender e Empreender Novas Formas de Aprender e Empreender DÚVIDAS FREQUENTES 1. Sobre o Prêmio Instituto Claro, Novas Formas de Aprender e Empreender 1.1. O que é o Prêmio? O Prêmio Instituto Claro Novas Formas de Aprender

Leia mais

UNIVERSIDADE ESTADUAL DA PARAÍBA CENTRO DE CIÊNCIAS E TECNOLOGIA DEPARTAMENTO DE QUÍMICA CURSO DE LICENCIATURA EM QUÍMICA LINDOMÁRIO LIMA ROCHA

UNIVERSIDADE ESTADUAL DA PARAÍBA CENTRO DE CIÊNCIAS E TECNOLOGIA DEPARTAMENTO DE QUÍMICA CURSO DE LICENCIATURA EM QUÍMICA LINDOMÁRIO LIMA ROCHA UNIVERSIDADE ESTADUAL DA PARAÍBA CENTRO DE CIÊNCIAS E TECNOLOGIA DEPARTAMENTO DE QUÍMICA CURSO DE LICENCIATURA EM QUÍMICA LINDOMÁRIO LIMA ROCHA FACILITADOR VIRTUAL DA APRENDIZAGEM EM QUÍMICA Campina Grande-

Leia mais

BIBLIOTECA VIRTUAL EM SAÚDE: uma construção coletiva Virtual Health Library: a collective construction

BIBLIOTECA VIRTUAL EM SAÚDE: uma construção coletiva Virtual Health Library: a collective construction 1 BIBLIOTECA VIRTUAL EM SAÚDE: uma construção coletiva Virtual Health Library: a collective construction Marine Fumiyo Otake Arakaki*; Mônica da Silva Peres*; Selma Palombo*; Yara Maria Spinola e Castro*;

Leia mais

QiDEIA C O M U N I C A Ç Ã O

QiDEIA C O M U N I C A Ç Ã O QiDEIA CREATE WHAT YOU SEE. CREATE WHAT YOU FEEL. CREATE WHAT YOU HAVE NEVER SEEN. JUST CREATE. NATHAN SAWAYA QUEM SOMOS A Qideia é uma agência de comunicação, vocacionada para a estratégia e implementação

Leia mais

2 Fundamentação Conceitual

2 Fundamentação Conceitual 2 Fundamentação Conceitual 2.1 Computação Pervasiva Mark Weiser define pela primeira vez o termo Computação Ubíqua ou Computação Pervasiva (Ubiquitous Computing) em (10). O autor inicia o trabalho com

Leia mais

APRESENTAÇÃO DO PROJETO GEO CIDADES

APRESENTAÇÃO DO PROJETO GEO CIDADES 1 APRESENTAÇÃO DO PROJETO GEO CIDADES O Global Environment Outlook (GEO) é um projeto iniciado em 1995 pelo Programa das Nações Unidas para o Meio Ambiente (PNUMA) para avaliar o estado do meio ambiente

Leia mais

Guia de utilização da notação BPMN

Guia de utilização da notação BPMN 1 Guia de utilização da notação BPMN Agosto 2011 2 Sumário de Informações do Documento Documento: Guia_de_utilização_da_notação_BPMN.odt Número de páginas: 31 Versão Data Mudanças Autor 1.0 15/09/11 Criação

Leia mais

COORDENAÇÃO DE EAD MANUAL DE UTILIZAÇÃO DO MOODLE 2.6 PERFIL ALUNO. Versão 1.0

COORDENAÇÃO DE EAD MANUAL DE UTILIZAÇÃO DO MOODLE 2.6 PERFIL ALUNO. Versão 1.0 COORDENAÇÃO DE EAD MANUAL DE UTILIZAÇÃO DO MOODLE 2.6 PERFIL ALUNO Versão 1.0 2015 SUMÁRIO 1. O MOODLE 3 2. Acesso à Plataforma 3 2.1. Cadastrar-se em uma disciplina 4 2.2. Página Inicial do Curso 5 3.

Leia mais

Provedor de serviços de software oferece solução econômica de gestão eletrônica

Provedor de serviços de software oferece solução econômica de gestão eletrônica Windows Azure Soluções para clientes - Estudo de caso Provedor de serviços de software oferece solução econômica de gestão eletrônica Visão geral País ou região: Índia Setor: Tecnologia da informação Perfil

Leia mais

O Banco Central do Brasil em 29/06/2006 editou a Resolução 3380, com vista a implementação da Estrutura de Gerenciamento do Risco Operacional.

O Banco Central do Brasil em 29/06/2006 editou a Resolução 3380, com vista a implementação da Estrutura de Gerenciamento do Risco Operacional. 1 POLÍTICA DE GERENCIAMENTO DO RISCO OPERACIONAL 1.1 Introdução O Banco Central do Brasil em 29/06/2006 editou a Resolução 3380, com vista a implementação da Estrutura de Gerenciamento do Risco Operacional.

Leia mais

Introdução Ciclo de vida tradicional de desenvolvimento Prototipagem Pacotes de software Desenvolvimento de 4ª geração Terceirização

Introdução Ciclo de vida tradicional de desenvolvimento Prototipagem Pacotes de software Desenvolvimento de 4ª geração Terceirização Prof. Ricardo José Pfitscher Material elaborado com base em: José Luiz Mendes Gerson Volney Lagemann Introdução Ciclo de vida tradicional de desenvolvimento Prototipagem Pacotes de software Desenvolvimento

Leia mais

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001 47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações

Leia mais

Um mercado de oportunidades

Um mercado de oportunidades Um mercado de oportunidades Como grandes, pequenas e médias empresas se comunicam? Quem são os principais interlocutores e como procurá-los? Como desenvolver uma grande campanha e inovar a imagem de uma

Leia mais

Correntes de Participação e Critérios da Aliança Global Wycliffe [Versão de 9 de maio de 2015]

Correntes de Participação e Critérios da Aliança Global Wycliffe [Versão de 9 de maio de 2015] Correntes de Participação e Critérios da Aliança Global Wycliffe [Versão de 9 de maio de 2015] Introdução As Organizações da Aliança Global Wycliffe desejam expressar a unidade e a diversidade do Corpo

Leia mais

O guia completo para uma presença. online IMBATÍVEL!

O guia completo para uma presença. online IMBATÍVEL! O guia completo para uma presença online IMBATÍVEL! Sumário Introdução 3 Capítulo 1 - Produção de Conteúdo: Por que e Como produzir 5 Capítulo 2 - Distribuição e Divulgação 8 Capítulo 3 - Monitoramento

Leia mais

Planejamento - 7. Planejamento do Gerenciamento do Risco Identificação dos riscos. Mauricio Lyra, PMP

Planejamento - 7. Planejamento do Gerenciamento do Risco Identificação dos riscos. Mauricio Lyra, PMP Planejamento - 7 Planejamento do Gerenciamento do Risco Identificação dos riscos 1 O que é risco? Evento que representa uma ameaça ou uma oportunidade em potencial Plano de gerenciamento do risco Especifica

Leia mais

perspectivas e abordagens típicas de campos de investigação (Senra & Camargo, 2010).

perspectivas e abordagens típicas de campos de investigação (Senra & Camargo, 2010). 1 Introdução Os avanços na tecnologia da informação, bem como o crescimento da sociedade da informação através do uso da Internet, obrigaram os governos de inúmeros países, em seus mais variados níveis,

Leia mais

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES Diretoria de Programas e Bolsas no País - DPB

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES Diretoria de Programas e Bolsas no País - DPB Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES Diretoria de Programas e Bolsas no País - DPB EDITAL Nº 019/2010/CAPES Chamada para Publicação Revista Brasileira de Pós-Graduação RBPG

Leia mais

3 Gerenciamento de Projetos

3 Gerenciamento de Projetos 34 3 Gerenciamento de Projetos Neste capítulo, será abordado o tema de gerenciamento de projetos, iniciando na seção 3.1 um estudo de bibliografia sobre a definição do tema e a origem deste estudo. Na

Leia mais

REFLEXÕES PEDAGÓGICAS

REFLEXÕES PEDAGÓGICAS REFLEXÕES PEDAGÓGICAS A forma como trabalhamos, colaboramos e nos comunicamos está evoluindo à medida que as fronteiras entre os povos se tornam mais diluídas e a globalização aumenta. Essa tendência está

Leia mais

29/05/2012. Gestão de Projetos. Luciano Gonçalves de Carvalho FATEC. Agenda. Gerenciamento de Integração do Projeto Exercícios Referências FATEC

29/05/2012. Gestão de Projetos. Luciano Gonçalves de Carvalho FATEC. Agenda. Gerenciamento de Integração do Projeto Exercícios Referências FATEC Gestão de Projetos 1 Agenda Gerenciamento de Integração do Projeto Exercícios Referências 2 1 GERENCIAMENTO DA INTEGRAÇÃO DO PROJETO 3 Gerenciamento da Integração do Projeto Fonte: EPRoj@JrM 4 2 Gerenciamento

Leia mais

Cursos livres EAD GUIA BÁSICO PARA USO CORPORATIVO. www.webaula.com.br

Cursos livres EAD GUIA BÁSICO PARA USO CORPORATIVO. www.webaula.com.br Cursos livres EAD GUIA BÁSICO PARA USO CORPORATIVO www.webaula.com.br Índice 3 introdução 3 introdução 3 O que são cursos livres, afinal? 4 Características dos cursos livres 5 Vantagens dos cursos livres

Leia mais

Capítulo 2 Objetivos e benefícios de um Sistema de Informação

Capítulo 2 Objetivos e benefícios de um Sistema de Informação Capítulo 2 Objetivos e benefícios de um Sistema de Informação 2.1 OBJETIVO, FOCO E CARACTERÍSTICAS DOS SISTEMAS DE INFORMAÇÃO. Os Sistemas de Informação, independentemente de seu nível ou classificação,

Leia mais

Olá, Somos Ideatera - Studio Tecnológico

Olá, Somos Ideatera - Studio Tecnológico Olá, Somos Ideatera - Studio Tecnológico O parceiro certo para aumentar a produtividade, visibilidade e alcance de sua marca e/ou website! Breve descrição do que oferecemos: Web Analytics: Este serviço

Leia mais

Thalita Moraes PPGI Novembro 2007

Thalita Moraes PPGI Novembro 2007 Thalita Moraes PPGI Novembro 2007 A capacidade dos portais corporativos em capturar, organizar e compartilhar informação e conhecimento explícito é interessante especialmente para empresas intensivas

Leia mais

POLÍTICAS DE SELEÇÃO, AQUISIÇÃO, ATUALIZAÇÃO E AVALIAÇÃO DA COLEÇÃO DA BIBLIOTECA DA FACULDADE CATÓLICA SALESIANA DO ESPÍRITO SANTO

POLÍTICAS DE SELEÇÃO, AQUISIÇÃO, ATUALIZAÇÃO E AVALIAÇÃO DA COLEÇÃO DA BIBLIOTECA DA FACULDADE CATÓLICA SALESIANA DO ESPÍRITO SANTO POLÍTICAS DE SELEÇÃO, AQUISIÇÃO, ATUALIZAÇÃO E AVALIAÇÃO DA COLEÇÃO DA BIBLIOTECA DA FACULDADE CATÓLICA SALESIANA DO ESPÍRITO SANTO ELABORAÇÃO Janine Silva Figueira Vitória 2015 SUMÁRIO 1 POLÍTICA DE DESENVOLVIMENTO

Leia mais

Aula 03-04: Modelos de Sistemas Distribuídos

Aula 03-04: Modelos de Sistemas Distribuídos UNIVERSIDADE Computação Aula 03-04: Modelos de Sistemas Distribuídos 2o. Semestre / 2014 Prof. Jesus Principais questões no projeto de um sistema distribuído (SD) Questão de acesso (como sist. será acessado)

Leia mais

UM NOVO CONCEITO EM ORGANIZAÇÃO DE ACERVOS

UM NOVO CONCEITO EM ORGANIZAÇÃO DE ACERVOS UM NOVO CONCEITO EM ORGANIZAÇÃO DE ACERVOS Descubra como o SophiA Acervo pode ajudar sua instituição na catalogação, organização e recuperação de acervos dos mais diversos tipos, sejam eles objetos da

Leia mais

Conceitos Básicos de Rede. Um manual para empresas com até 75 computadores

Conceitos Básicos de Rede. Um manual para empresas com até 75 computadores Conceitos Básicos de Rede Um manual para empresas com até 75 computadores 1 Conceitos Básicos de Rede Conceitos Básicos de Rede... 1 A Função de Uma Rede... 1 Introdução às Redes... 2 Mais Conceitos Básicos

Leia mais

GESTÃO DE RISCO OPERACIONAL

GESTÃO DE RISCO OPERACIONAL GESTÃO DE RISCO OPERACIONAL Definição de Risco Operacional Riscos Operacionais cobrem as instâncias onde a corretora pode sofrer perdas inerentes direta ou indiretamente a processos internos falhos ou

Leia mais

GOVERNANÇA DE TI: Um desafio para a Auditoria Interna. COSME LEANDRO DO PATROCÍNIO Banco Central do Brasil

GOVERNANÇA DE TI: Um desafio para a Auditoria Interna. COSME LEANDRO DO PATROCÍNIO Banco Central do Brasil GOVERNANÇA DE TI: Um desafio para a Auditoria Interna COSME LEANDRO DO PATROCÍNIO Banco Central do Brasil Programação da Apresentação Evolução da Auditoria Interna de TI no Banco Central; Governança de

Leia mais

Computação Móvel para Contribuir à Educação e Sustentabilidade ESTUDO DE CASO

Computação Móvel para Contribuir à Educação e Sustentabilidade ESTUDO DE CASO Computação Móvel para Contribuir à Educação e Sustentabilidade ESTUDO DE CASO Marina Palmito Costa Lucas Rezende Monteiro Escola de Arquitetura e Urbanismo Universidade Federal de Minas Gerais Computação

Leia mais

ADMINISTRAÇÃO I. Família Pai, mãe, filhos. Criar condições para a perpetuação da espécie

ADMINISTRAÇÃO I. Família Pai, mãe, filhos. Criar condições para a perpetuação da espécie 1 INTRODUÇÃO 1.1 ORGANIZAÇÃO E PROCESSOS A administração está diretamente ligada às organizações e aos processos existentes nas mesmas. Portanto, para a melhor compreensão da Administração e sua importância

Leia mais

REGULAMENTO DO NUPE NÚCLEO DE PESQUISA E EXTENSÃO

REGULAMENTO DO NUPE NÚCLEO DE PESQUISA E EXTENSÃO REGULAMENTO DO NUPE NÚCLEO DE PESQUISA E EXTENSÃO A Direção Geral da Faculdade ESUP, torna público o presente Regulamento do NUPE Núcleo de Pesquisa e Extensão que tem por finalidade normatizar as atividades

Leia mais

Diagrama de fluxo de dados na Plataforma Vicon SAGA. Terminologias de bancos de dados: Banco de Dados, Tabela, Campos, Registros

Diagrama de fluxo de dados na Plataforma Vicon SAGA. Terminologias de bancos de dados: Banco de Dados, Tabela, Campos, Registros Exercício Objetivo Aplicativo Exercício para ambientação com Sistemas de Informação e Bancos de Dados. O usuário criará modelará um banco de dados aplicado ao contexto de desastres; realizará cadastros

Leia mais

Planejamento e Gestão Estratégica

Planejamento e Gestão Estratégica Planejamento e Gestão Estratégica O Governo de Minas estabeleceu como um dos eixos norteadores da suas políticas públicas a eficiência na utilização dos recursos e a oferta de serviços com qualidade cada

Leia mais

Gerenciamento de Projetos Modulo VIII Riscos

Gerenciamento de Projetos Modulo VIII Riscos Gerenciamento de Projetos Modulo VIII Riscos Prof. Walter Cunha falecomigo@waltercunha.com http://waltercunha.com Bibliografia* Project Management Institute. Conjunto de Conhecimentos em Gerenciamento

Leia mais

Análise do processo de avaliação contínua em um curso totalmente à distância

Análise do processo de avaliação contínua em um curso totalmente à distância Análise do processo de avaliação contínua em um curso totalmente à distância Joice Lee Otsuka Instituto de Computação Universidade Estadual de Campinas (Unicamp) 1 Caixa Postal 6176 CEP: 13083-970 - Campinas,

Leia mais

Texto para discussão. Desenvolvimento profissional dos integrantes da carreira de EPPGG

Texto para discussão. Desenvolvimento profissional dos integrantes da carreira de EPPGG 1 Introdução Texto para discussão Desenvolvimento profissional dos integrantes da carreira de EPPGG Como resultado da coleta de subsídios para aperfeiçoamento da gestão da carreira de Especialista em Políticas

Leia mais

Gestão da Qualidade em Projetos

Gestão da Qualidade em Projetos Gestão da Qualidade em Projetos Definição do Escopo Escopo O escopo do projeto define o que precisa ser feito. Isso se refere a todo o trabalho que deve ser realizado com a finalidade de produzir todas

Leia mais

APRESENTAÇÃO DA OFICINA DA INOVAÇÃO

APRESENTAÇÃO DA OFICINA DA INOVAÇÃO APRESENTAÇÃO DA OFICINA DA INOVAÇÃO DIRETORIA DE PESQUISA E DESENVOLVIMENTO. OFICINA DA INOVAÇÃO Página 1 de 10 ÍNDICE DO PORTFOLIO Apresentação dos serviços da Oficina da Inovação... 3 Consultoria...

Leia mais

Plenária II O Profissional Arquivista e a Gestão do Conhecimento: demandas contemporâneas nas organizações.

Plenária II O Profissional Arquivista e a Gestão do Conhecimento: demandas contemporâneas nas organizações. Plenária II O Profissional Arquivista e a Gestão do Conhecimento: demandas contemporâneas nas organizações. Profa. Dra. Maria do Rocio F. Teixeira Salvador, 2013 Conhecimento Organizacional 2 A Produção

Leia mais

Procuramos empreendedores com as seguintes características:

Procuramos empreendedores com as seguintes características: SOBRE A ALPARGATAS Quem nunca usou um Bamba? Ou uma calça US Top, um tênis Rainha, uma sandália Havaianas, ou jogou com uma bola Topper? A Alpargatas e suas marcas estiveram e estarão sempre presentes

Leia mais

Gerenciamento do ciclo de vida de um documento Simone de Abreu

Gerenciamento do ciclo de vida de um documento Simone de Abreu Gerenciamento do ciclo de vida de um documento Simone de Abreu É o gerenciamento do ciclo de vida de todos os registros, em todos os tipos de mídia, desde a criação até a destruição ou arquivo permanente.

Leia mais

Redes sociais corporativas

Redes sociais corporativas Redes sociais corporativas Como utilizar as plataformas de comunicação interna para engajar funcionários Isabela Pimentel Apresentação Redes sociais corporativas são plataformas utilizadas nas empresas

Leia mais

PRIORIDADES EM SERVIÇOS E ORGANIZAÇÃO DO TRABALHO. Professora Andréia Ribas rp_andreiaribas@hotmail.com

PRIORIDADES EM SERVIÇOS E ORGANIZAÇÃO DO TRABALHO. Professora Andréia Ribas rp_andreiaribas@hotmail.com PRIORIDADES EM SERVIÇOS E ORGANIZAÇÃO DO TRABALHO Professora Andréia Ribas rp_andreiaribas@hotmail.com Organização Processo de estabelecer relações entre as pessoas e os recursos disponíveis tendo em vista

Leia mais

08/05/2009. Cursos Superiores de. Prof.: Fernando Hadad Zaidan. Disciplina: PIP - Projeto Integrador de Pesquisa. Objetivos gerais e específicos

08/05/2009. Cursos Superiores de. Prof.: Fernando Hadad Zaidan. Disciplina: PIP - Projeto Integrador de Pesquisa. Objetivos gerais e específicos Faculdade INED Cursos Superiores de Tecnologia Disciplina: PIP - Projeto Integrador de Pesquisa Objetivos gerais e específicos Objetivo resultado a alcançar; Geral dá resposta ao problema; Específicos

Leia mais

Curso Superior de Tecnologia em Gestão de Recursos Humanos. Professora Mestranda Elaine Araújo

Curso Superior de Tecnologia em Gestão de Recursos Humanos. Professora Mestranda Elaine Araújo Curso Superior de Tecnologia em Gestão de Recursos Humanos Professora Mestranda Elaine Araújo E o profissional de RH... Como deve mergulhar na abordagem da Gestão do Conhecimento? Qual sua contribuição

Leia mais

QUALIFICAÇÃO E CERTIFICAÇÃO DE PESSOAL EM CORROSÃO E PROTEÇÃO

QUALIFICAÇÃO E CERTIFICAÇÃO DE PESSOAL EM CORROSÃO E PROTEÇÃO ABRACO 00 de 0 OBJETIVO Esta norma estabelece a sistemática adotada pela Associação Brasileira de Corrosão ABRACO para o funcionamento do Sistema Nacional de Qualificação e Certificação em Corrosão e Proteção.

Leia mais

Tutorial 7 Fóruns no Moodle

Tutorial 7 Fóruns no Moodle Tutorial 7 Fóruns no Moodle O Fórum é uma atividade do Moodle que permite uma comunicação assíncrona entre os participantes de uma comunidade virtual. A comunicação assíncrona estabelecida em fóruns acontece

Leia mais

Módulos QM de sistemas ERP ou MES X Sistemas LIMS?

Módulos QM de sistemas ERP ou MES X Sistemas LIMS? Módulos QM de sistemas ERP ou MES X Sistemas LIMS? Georgio Raphaelli Labsoft Tecnologia E-mail: georgior@gmail.com Resumo: Diferenças conceituais e práticas entre os módulos de controle e gestão da qualidade

Leia mais

NORMA TÉCNICA PARA IMPLANTAÇÃO DE NOVOS SISTEMAS OU APLICAÇÕES NO BANCO DE DADOS CORPORATIVO

NORMA TÉCNICA PARA IMPLANTAÇÃO DE NOVOS SISTEMAS OU APLICAÇÕES NO BANCO DE DADOS CORPORATIVO NORMA TÉCNICA PARA IMPLANTAÇÃO DE NOVOS SISTEMAS OU APLICAÇÕES NO BANCO DE DADOS CORPORATIVO Referência: NT-AI.04.02.01 http://www.unesp.br/ai/pdf/nt-ai.04.02.01.pdf Data: 27/07/2000 STATUS: EM VIGOR A

Leia mais

LISTA DE VERIFICAÇAO DO SISTEMA DE GESTAO DA QUALIDADE

LISTA DE VERIFICAÇAO DO SISTEMA DE GESTAO DA QUALIDADE Questionamento a alta direção: 1. Quais os objetivos e metas da organização? 2. quais os principais Produtos e/ou serviços da organização? 3. Qual o escopo da certificação? 4. qual é a Visão e Missão?

Leia mais

DESCRIÇÃO DAS PRÁTICAS DE GESTÃO DA INICIATIVA

DESCRIÇÃO DAS PRÁTICAS DE GESTÃO DA INICIATIVA DESCRIÇÃO DAS PRÁTICAS DE GESTÃO DA INICIATIVA Como é sabido existe um consenso de que é necessário imprimir qualidade nas ações realizadas pela administração pública. Para alcançar esse objetivo, pressupõe-se

Leia mais

1Ò&/(2'(('8&$d 2$',67Æ1&,$1($' PROCEDIMENTOS PARA DISCIPLINAS A DISTÂNCIA MANUAL DO ALUNO

1Ò&/(2'(('8&$d 2$',67Æ1&,$1($' PROCEDIMENTOS PARA DISCIPLINAS A DISTÂNCIA MANUAL DO ALUNO 1Ò&/(2'(('8&$d 2$',67Æ1&,$1($' PROCEDIMENTOS PARA DISCIPLINAS A DISTÂNCIA MANUAL DO ALUNO 2 SUMÁRIO 1 INTRODUÇÃO... 03 2 PROCEDIMENTOS PARA MATRÍCULA...04 3. PARTICIPAÇÃO NAS DISCIPLINAS EAD...04 4 AVALIAÇÃO

Leia mais

agility made possible

agility made possible RESUMO DA SOLUÇÃO Utilitário ConfigXpress no CA IdentityMinder a minha solução de gerenciamento de identidades pode se adaptar rapidamente aos requisitos e processos de negócio em constante mudança? agility

Leia mais

ILHABELA QUER. Oliver Reinis é Advogado, Programador, Cidadão e Ativista. Carlos Pedro Sant Ana é Arquiteto, Designer Gráfico, Cidadão e Ativista.

ILHABELA QUER. Oliver Reinis é Advogado, Programador, Cidadão e Ativista. Carlos Pedro Sant Ana é Arquiteto, Designer Gráfico, Cidadão e Ativista. ILHABELA QUER 1.APRESENTAÇÃO Este projeto consiste no desenvolvimento de uma Plataforma Digital para agilizar e potencializar a participação cidadã na vida pública da comunidade em que está inserida. As

Leia mais

ECONTEXTO. Auditoria Ambiental e de Regularidade

ECONTEXTO. Auditoria Ambiental e de Regularidade Auditoria Ambiental e de Regularidade Organização Internacional das Entidades Fiscalizadoras Superiores - INTOSAI Grupo de Trabalho sobre Auditoria Ambiental - WGEA ECONTEXTO Este artigo é um resumo do

Leia mais

Análise de Tarefas. Análise Hierárquica de Tarefas

Análise de Tarefas. Análise Hierárquica de Tarefas Análise de Tarefas Em IHC, a análise de tarefas pode ser utilizada em diferentes momentos do desenvolvimento de software, destacando-se três atividades: (a) análise da situação atual (apoiada ou não por

Leia mais