SISTEMA DE APOIO À DECISÃO APLICADA AOS RECURSOS HÍDRICOS SUBTERRÂNEOS

Tamanho: px
Começar a partir da página:

Download "SISTEMA DE APOIO À DECISÃO APLICADA AOS RECURSOS HÍDRICOS SUBTERRÂNEOS"

Transcrição

1 Universidade Estadual do Ceará (UECE) Pró-Reitoria de Pós Graduação e Pesquisa (PROPGq) Centro Federal de Educação Tecnológica do Ceará (CEFET-CE) Diretoria de Pesquisa e Pós-Graduação (DIPPG) Universidade Federal do Rio de Janeiro (UFRJ) Escola Politécnica Departamento de Eletrônica e de Computação SISTEMA DE APOIO À DECISÃO APLICADA AOS RECURSOS HÍDRICOS SUBTERRÂNEOS FREDERICO CLÁUDIO PEIXINHO Dissertação de Mestrado Rio de Janeiro RJ Março

2 SISTEMA DE APOIO À DECISÃO APLICADA AOS RECURSOS HÍDRICOS SUBTERRÂNEOS Frederico Cláudio Peixinho DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DO PROGRAMA DE MESTRADO PROFISSIONAL EM COMPUTAÇÃO APLICADA DA UNIVERSIDADE ESTADUAL DO CEARÁ, COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A CERTIFICAÇÃO DE CONCLUSÃO DO CURSO Aprovada por: Prof. Flávio Luis de Mello, D. Sc. (Orientador) Prof. Luiz Felipe Coutinho, De. (Examinador) Prof. Airton Fontenele Sampaio Xavier, LDc (Examinador) Prof: Guilherme Lincoln Aguiar Ellery, DSc. (Examinador) RIO DE JANEIRO, RJ BRASIL Março/2012

3 ii PEIXINHO, FREDERICO CLÁUDIO Sistema de Apoio à Decisão aplicado aos Recursos Hídricos Subterrâneos [Rio de Janeiro] 2012 VII, 125 P. 29,7 cm (UECE, Mestrado, MPCOMP, 2012) Dissertação Universidade Estadual do Ceará, UECE 1. Sistema de Apoio à Decisão I. I. POLI/UFRJ II. Título (série)

4 iii DEDICATÓRIA À minha esposa e filhas que sempre estiveram presentes me estimulando e compartilhando os momentos de dificuldades e renúncias. Edmea, Joana, Carolina e Gabriela

5 iv Ergo a cabeça ela não treme se a busco não a encontro vazia. Aristóteles Damasceno Peixinho, meu pai.

6 v AGRADECIMENTOS A Deus por me permitir transitar na vida terrena com o compromisso do aprimoramento intelectual e moral, tendo a ciência e o saber, como fio condutor para o meu progresso espiritual. À UFRJ Escola Politécnica da Universidade Federal do Rio de Janeiro, uma referência no ensino superior. Aos professores, do Mestrado Profissional em Computação Aplicada da UECE, que tanto contribuíram com seus ensinamentos, incentivos e apoio a este trabalho. Em especial, aos professores José Francisco Julião, DSc. (UECE), e Francisco Xavier, DSc. (UECE), que transferiram com maestria os seus conhecimentos e saberes, bem como incentivaram e apoiaram no desenvolvimento desta dissertação. Igualmente e em especial, aos professores Flávio Luis de Mello, DSc. (UFRJ) e Edilberto Strauss, Ph.D. (UFRJ) que me orientaram e incentivaram, respectivamente, na condução deste trabalho. Aos colegas do Mestrado Profissional em Computação Aplicada, realizada na UECE Rio de Janeiro, pelo estímulo e contribuição. Aos colegas de trabalho, Ricardo Villafan, Maria Antonieta Mourão, Francisco Barbosa, Marcos Nóbrega, Josias Lima, Leonardo da Matta, Maria Cristina Maio e parentes Carolina Carneiro Peixinho e Priscila Peixinho Fiorindo, que contribuíram com sugestões, material e informações. A todos que direta ou indiretamente contribuíram com sugestões, material e informações e que por lapso ou esquecimento não foram citados..

7 vi SISTEMA DE APOIO À DECISÃO APLICADO AOS RECURSOS HÍDRICOS SUBTERRÂNEOS Frederico Cláudio Peixinho Março/2012 Orientador: Flávio Luis de Mello Esta dissertação apresenta uma metodologia, apoiada no Business Intelligence (BI), para oferecer apoio à decisão do setor de recursos hídricos subterrâneos, dado que este recurso é vital e estratégico para a implementação das políticas públicas e a melhoria da qualidade de vida da população de uma dada região. A ideia fundamental consistiu em propor um modelo para projetar um sistema de apoio à decisão, a partir da base de dados operacional, que enriquecida e sintetizada, resulta numa base de dados referencial, servindo esta de suporte para a construção de um repositório de dados (Data Warehouse) para em seguida, utilizar tecnologias OLAP (On-line Analytical Processing) e algoritmos de Mineração de Dados (Data Minning). A abordagem metodológica se apoia nos principais componentes do BI - Base de Dados (Data Warehouse), Análise de Negócio (OLAP e Data Mining), Monitoria e Avaliação do Desempenho (Business Performance Management). Neste sentido, vislumbra-se, com o uso deste modelo de sistema de apoio à decisão, o aumento da eficácia no armazenamento, operação e gestão de dados de poços profundos, já que este ambiente constitui fonte de informações estratégicas para a gestão e o aproveitamento racional dos recursos hídricos subterrâneos. Palavras chave: Data Warehouse, OLAP, Data Mining, Business Performance Management, Sistema de Informações de Águas Subterrâneas.

8 vii DECISION SUPPORT SYSTEM APPLIED TO GROUNDWATER RESOURCES Advisor: Flávio Luis de Mello Frederico Cláudio Peixinho March/2012 This dissertation aims to present a methodology, based on Business Intelligence (BI) to provide decision support to managers and business analysts in the field of groundwater resources, considering that this resource is vital and strategic to the implementation of public policies and improved quality of life in a given region. The fundamental idea is to propose a methodology to extract a basic framework that will support the construction of data repository (Data Warehouse) from the enriched and synthesized operational database. Then, the next steps consists of the application of OLAP technology (Online Analytical Processing) and Data Mining algorithms (Data Minning), to provide historical and current data of performance, and a better understanding of the usage profile and the use of groundwater resources. The methodological approach relies on major components of BI - Database (Data Warehouse), business analysis (OLAP and Data Mining), performance assessment (Business Performance Management) and user interface (Dashboard) - applied to the groundwater operational database. Thus, it is expected that the use of this decision support system based on Data Warehouse and other components, increases efficiency in storage, data management and operation of deep wells, since this environment is a source of strategic information for management and rational exploitation of groundwater resources. Keywords: Data Warehouse, OLAP, Data Mining, Business Performance Management, Information System for Groundwater.

9 viii ANA BI BPM BSC CPRM DM DNAEE DW EIS ETL KDD ODS OLAM OLAP OLTP OMS PNRH PNUMA RIMAS ROLAP SIAGAS SAD SNIRH SQL SGB USGS WEKA XML SIGLAS Agência Nacional de Águas Business Intelligence Business Performance Management Balanced Scorecard Companhia de Pesquisas e Recursos Minerais Data Mining Departamento Nacional de Águas e Energia Elétrica Data Warehouse Executive Information Systems Extration, Transformation and Load Knowledge Discovery in Data Bases Operational Data Store On-line Analytical Mining On-Line Analytical Processing On-line Transaction Processing Organização Mundial da Saúde Política Nacional de Recursos Hídricos Programa das Nações Unidas para o Meio Ambiente Rede Integrada de Monitoramento das Águas Subterrâneas do Brasil Relational On-Line Analytical Processing Sistema de Informações de Águas Subterrâneas Sistema de Apoio à Decisão Sistema Nacional de Informações sobre Recursos Hídricos Strutured Query Language Serviço Geológico do Brasil United State Geological Survey Waikato Environment for Knowlegde Analysis Extensible Markup Language

10 ix Sumário Capítulo 1 Introdução Contextualização Justificativa Objetivos Estrutura da Dissertação 23 Capítulo 2 Fundamentação Teórica Contextualização Sistema de Apoio à Decisão O processo de Busca do Conhecimento em Banco de Dados Data Warehouse Data Mart Metadados Granularidade Visão Geral do Processo de Data Warehouse Arquitetura Geral do Data Warehouse Processo de Extração, Transformação e Carga ETL Modelagem Multidimensional Análise de Negócios e Visualização de Dados Tecnologia OLAP Multidimensionalidade Cubo de Dados Data Mining Funcionalidades da Mineração de Dados Análise Descritiva Análise de Prognóstico Técnicas para Obtenção das Funcionalidades Algumas técnicas e algoritmos utilizados na mineração de dados Abordagem de Mineração de Dados Business Performance Management Balanced Scorecard Arquitetura do BPM Dashboard e Scorecards Trabalhos Relacionados 63

11 x Capítulo 3 Modelo Conceitual de Sistema de Apoio à Decisão SAD Descrição Geral Modelo de Negócio Modelo de Proposta de Valor Modelo de Interface do Usuário Modelo de Operação Modelo Estratégico Modelo Econômico Descrição do Sistema Operacional SIAGAS/RIMAS Preprocessamento Estrutura do Data Store Operacional Data Warehouse Departamental Análise de Negócios e Visualização de Dados Análise do Negócio das Águas Subterrâneas Relatórios e Consultas para Visualização dos Dados Business Performance Management (BPM) 95 Capítulo 4 SAD aplicado a Estudo de Caso Critérios para Seleção de Projeto Piloto Caracterização da Empresa Projeto Piloto Diagnóstico do Estado da Arte do Sistema de Apoio à Decisão Aplicado aos Recursos Hídricos Subterrâneos Implantação do Modelo Proposto na Área do Projeto Piloto Preprocessamento: Análise de Consistência e Enriquecimento da Base de Dados Base de Dados Operacional/ Data Store Operacional Criação de Data Warehouse Análise do Negócio Business Performance Management BPM 110 Capítulo 5 Conclusão 113 Bibliografia 115 Anexos 117

12 xi Lista de Figuras Figura 1: Distribuição da Água na Terra Figura 2: Distribuição Percentual do Povoamento do Banco de Dados SIAGAS Figura 3: Etapas do Processo KDD Figura 4: Estrutura e Visualização do Data Warehouse Figura 5: Interatividade entre Funcionalidades e Técnicas de Mineração de dados Figura 6: Funcionalidades em Mineração de Dados Figura 7: Sub-funcionalidades da Análise e do Descobrimento Figura 8: Gráfico de Nível d água de um Poço USGS Figura 9: Modelo Conceitual do SAD Aplicado aos Recursos Hídricos Subterrâneos Figura 10: Modelo de Negócio do SAD Aplicado aos Recursos Hídricos Subterrâneos Figura 11: Modelo de Dados SIAGAS Figura 12: Módulo de Entrada de Dados Figura 13: Módulo de Consulta na Web cruzamento de informação espacial e tabular Figura 14: Módulo de Consulta na Web espacialização de dados Figura 15: Módulo de Análise e Interpretação de Dados relatórios Figura 16: Rede RIMAS Mapa de Situação dos Aquíferos Figura 17: Mapa de Distribuição dos Poços Cadastrados na Base de Dados Figura 18: Arquitetura de um Operacional Data Store (ODS) Figura 19: Modelo Lógico do MGE Figura 20: Modelo Conceitual do SAD Figura 21: Mapa de Localização dos Poços Figura 22: Mapas de Isovalores de Qualidade de Água Figura 23: Principais Indicadores de Qualidade de Água de Poços

13 xii Lista de Tabelas Tabela 1: Os quatro níveis de dados do ambiente arquitetural de um data warehouse Tabela 2: Exemplos de consultas referentes aos quatro níveis de dados Tabela 3: Funcionalidades e suas técnicas para mineração de dados Tabela 4: Quadro geral de atributos relevantes cadastrados na base de dados Tabela 5: Tabela de anexos da dissertação

14 13 Capítulo 1 - Introdução Este capítulo introdutório descreve as principais motivações para realização do trabalho, apresenta os objetivos e a justificativa da pesquisa e finaliza expondo a estrutura e organização da dissertação. 1.1 Contextualização A abundância e a escassez de água tem tido, através dos tempos, profundas repercussões na evolução dos povos, influenciando em certas regiões, em função das disponibilidades hídricas, as condições de florescimento, fixação e desenvolvimento das civilizações (CUNHA et al., 1980). A água é um bem vital e estratégico para a humanidade e representa uma moeda de negociação cada vez mais valiosa entre as nações. Na atualidade as mudanças climáticas, o crescimento populacional, o aumento vertiginoso da concentração urbana, os desastres naturais, envolvendo eventos hidrológicos extremos e a deficiente infraestrutura hídrica (saneamento básico) são os principais fatores que têm trazido enormes prejuízos sociais e econômicos, principalmente, às populações menos assistidas. Segundo TUNDIZI (2003), é falsa a aparente concepção de que a água doce é abundante. Somente 3% da água do planeta é disponível como água doce. Destes 3%, cerca de 75% estão congelados nas calotas polares e cerca de 10% estão reservados aos aquíferos. Portanto 15% dos 3% de água doce estão disponíveis. A figura 1 apresenta a distribuição da água na Terra. Vale considerar que o suprimento global tem reduzido gradativamente com o aumento da população, dos usos múltiplos e com a perda do mecanismo de retenção da água.

15 14 Figura 1 - Distribuição da Água na Terra Fonte: (TUNDIZI, 2003) O mapa mundial assinala que estamos ampliando as regiões do planeta com enorme déficit hídrico e com consequentes problemas relacionados à saúde pública. De acordo com o relatório sobre Economias Verde lançado em Estocolmo pelo Programa das Nações Unidas para o Meio Ambiente (PNUMA) durante a Conferência da Semana Mundial da Água, em agosto de 2011, quase 1 bilhão de pessoas não têm acesso à água; 2,6 bilhões não têm acesso ao saneamento básico; e 1,4 milhões de crianças menores de cinco anos morrem a cada ano como resultado da falta de acesso à água potável e aos serviços adequados de saneamento básico (UNEP, 2011). Estudos técnicos mundiais indicam que mais de 76 milhões de pessoas, a maioria crianças, morrerão de doenças relacionadas com a água até 2020, a não ser que se adotem medidas urgentes para recuperar os mananciais hídricos do planeta. Segundo a Organização Mundial de Saúde (OMS), em relatório produzido em 2000, estima-se que 04 (quatro) bilhões de casos de diarreias ocorrem a cada ano, matando cinco milhões de pessoas. No Brasil, morrem atualmente 29 pessoas/dia por doenças decorrentes da qualidade da água e do não tratamento de esgotos.

16 15 O Brasil, país de dimensão continental, possui uma grande disponibilidade hídrica, distribuída de forma desigual em relação à densidade populacional. A produção total das águas doces, no Brasil, representa 53% do continente sul-americano ( m 3 /s) e 12% do total mundial ( m 3 /s) (REBOUÇAS 1996). Os principais problemas em recursos hídricos no Brasil são: escassez de água, principalmente, na região semi-árida brasileira; desastres naturais envolvendo eventos hidrológicos extremos (secas e inundações); conflitos de uso da água principalmente nas regiões decorrentes dos seus usos múltiplos; contaminação das águas superficiais e subterrâneas. Para enfrentar estes problemas, no âmbito da gestão dos recursos hídricos, foi instituída pela Lei 9.433, em 08 de janeiro de 1997, uma nova Política Nacional de Recursos Hídricos - PNRH, fundamentada nos princípios da gestão descentralizada e participativa. Todavia, os efeitos negativos dos problemas acima apontados em especial a escassez de água decorrente das estiagens e secas no semiárido - sobre a população são manifestados pela fome, sede e miséria e estão atrelados à extrema vulnerabilidade da estrutura econômico-social e à baixa eficácia de mecanismos adotados para o aproveitamento, preservação, controle e gestão dos recursos hídricos e para o fortalecimento da economia local. Os problemas sociais decorrentes da seca inserem-se nas grandes questões de ordem nacional, dada à magnitude e o número de pessoas atingidas. Com vistas a minimizar os perversos efeitos da estiagem, o governo tem adotado medidas de intervenção de natureza emergencial, destinadas a assegurar os meios mínimos de subsistência das populações nos períodos mais críticos, ou de caráter permanente que visam ao fortalecimento da infraestrutura local, a partir da execução de obras públicas (barragens, açudes, poços tubulares, etc.). Um exemplo deste fato foi o Programa Emergencial de Combate aos Efeitos da Seca, instituído em 1998, através do Decreto nº 2618, de que teve como

17 16 meta a perfuração, recuperação de poços tubulares e a implantação de dessalinizadores nos municípios inseridos no Polígono das Secas. Como aspectos positivos deste Programa merecem ser destacados o modelo participativo de tomada de decisão; a validação técnica das obras era feita por órgão independente e credenciado (Companhia de Pesquisa de Recursos Minerais - CPRM) e a execução de obras (construção e recuperação de poços) que resultaram na melhor relação custo-benefício do empreendimento. Não obstante os pontos positivos deste Programa, muitos problemas estruturais e recorrentes permaneceram, dentre os quais se destacam: gestão e controle ineficaz, pelo Estado, das águas subterrâneas, sob os quais detêm competência legal, visando o disciplinamento do seu uso. Como resultado agravam-se os problemas de superexplotação (excesso de retirada de água) e contaminação dos aquíferos; inexistência de um sistema permanente de monitoramento e controle da perfuração de poços. Diversos órgãos têm bases de dados próprias, na maioria, desatualizadas e despadronizadas. De acordo com a cartilha elaborada pelo Ministério de Meio Ambiente, em 2001, relativa ao Programa de Águas Subterrâneas KETTLELHUT (2001), observamos os seguintes desafios a serem enfrentados nesta área: a necessidade da gestão integrada da água com base nos instrumentos da Política Nacional de Recursos Hídricos; o controle dos usos e da qualidade das águas insatisfatórios, em face da dispersão e falta de articulação legal e institucional; as legislações existentes apresentavam lacunas e até mesmo conflitos carecendo de ajustes para promover uma gestão integrada dos recursos hídricos; existência de reconhecida carência de conhecimentos básicos em águas subterrâneas, que necessitam ser rapidamente desenvolvidos; a necessidade de mobilização social que resulte na vigilância da sociedade sobre o uso e controle racionais das águas subterrâneas.

18 17 A CPRM - o Serviço Geológico do Brasil (SGB), estabeleceu como diretriz estratégica desenvolver um Sistema de Informações de Águas Subterrâneas SIAGAS, o qual foi implantado em A referida instituição definiu como estratégia manter estreita articulação com outros organismos provedores de dados, em especial os órgãos estaduais gestores dos recursos hídricos, firmando Acordos de Cooperação Técnica, de modo a garantir um padrão de referência nesta área e possibilitar a integração de bases de dados. Nesta vertente, ela priorizou o Programa de Água Subterrânea para a região Nordeste, em particular, o Cadastramento de Fontes de Abastecimento por Água Subterrânea. Neste sentido, a empresa vem realizando desde 1998 o citado cadastramento, inicialmente, nos estados do Ceará e Sergipe, ampliando sua atuação para todo o território nacional. A alimentação da base de dados do SIAGAS é feita através das fichas de poços, fornecidas por entidades públicas e privadas. Estas fichas, elaboradas à época da construção do poço, apresentavam inconsistências (coordenadas geográficas incorretas) e imprecisões (campos não preenchidos) que estão sendo depuradas pelo SGB. Em 2009, a CPRM implantou a Rede Integrada de Monitoramento de Águas Subterrâneas do Brasil RIMAS que se constitui numa nova fonte de dados de poços para base de dados operacional de águas subterrâneas. Os dados gerados nesta rede além de serem mais representativos e confiáveis têm a característica de registrar variações temporais dos parâmetros hidrogeológicos, permitindo avaliar o comportamento dos processos hidrológicos e gerar relatórios que possam estabelecer tendências e avaliar cenários sobre a utilização dos recursos hídricos subterrâneos. O monitoramento das águas subterrâneas, através da rede RIMAS, gerando dados contínuos e completos; a coleta e medição dirigida de parâmetros nos poços existentes; a alimentação da base de dados com poços oriundos do processo de outorga pelo uso da água são procedimentos que resultam no enriquecimento da base de dados operacional de águas subterrâneas e contribui para melhorar o sistema de apoio à decisão em recursos hídricos.

19 18 A base de dados operacional de águas subterrâneas conta com expressiva quantidade de poços cadastrados e tem a tendência, nos próximos anos, de aumentar significativamente o volume de dados armazenados. Este cenário sinaliza para que se disponha de ferramentas de gerenciamento eficaz de armazenamento de dados, com o uso de sistemas inteligentes, baseados em descoberta de conhecimento. Segundo (RAMOS et al.,1989), a área geocientífica, em especial, a hidrologia ciência que estuda a ocorrência, a distribuição o movimento e propriedades da água na atmosfera, na superfície e no subsolo terrestre - envolve a realização de estudos de fenômenos de natureza estocástica (precipitação, vazão, níveis de água, etc.), exigindo a formação de séries hidrológicas extensas para se ter uma melhor predição e representatividade do fenômeno analisado. Assim, consoante LACERDA (2010), verificamos que em um ambiente competitivo, complexo e com rápidas mudanças, as empresas submetidas às pressões diversas devem buscar inovar suas práticas de gerenciamento, de modo a melhorar seu desempenho, garantindo vantagens competitivas em relação os concorrentes. Atualmente, manipula-se uma grande base de dados, exigindo a utilização de sistema de suporte à gerência, envolvendo o uso de altas tecnologias para análise, prospecção e visualização de informações. Para isso torna-se importante a utilização do Business Intelligence (BI), um termo guarda chuva que engloba ferramentas, arquitetura, bases de dados, data warehouse, gerenciamento de desempenho, metodologias, tudo integrado em uma suíte de software. Os principais objetivos do BI são permitir o acesso interativo aos dados (às vezes em tempo real), proporcionar a manipulação desses dados e fornecer aos gerentes e analistas de negócios a capacidade de realizar análises aprimoradas para tomada de decisão (TURBAN et al., 2008). Diante de um ambiente globalizado, a tecnologia de informação torna-se uma importante aliada na aplicação das políticas públicas, principalmente, daquelas voltadas para melhoria da qualidade de vida da população, nas áreas de recursos hídricos, meio ambiente e saúde pública. As empresas começam a perceber a necessidade de terem maior agilidade, disponibilidade e confiabilidade das suas informações, para que possam tomar as melhores decisões. A Business Intelligence (BI) vem ao encontro dessa

20 19 realidade, pois utiliza, de forma integrada, seus principais componentes - Base de dados (Data Warehouse - DW), Análise de Negócio ( Online Transaction Processing- OLAP e Data Mining - DM), Gestão e Análise de Desempenho (Business Performance Management BPM) para melhorar a tomada de decisão. Portanto, a gestão aleatória dará lugar à inteligência de negócio (GOUVEIA,2009). O avanço tecnológico tem possibilitado o armazenamento de grandes e múltiplas quantidades de dados. É necessário fazer melhor uso destes, através de técnicas de enriquecimento de dados, para conferir maior eficácia na tomada de decisão. Uma análise preliminar da base de dados operacional de poços profundos administrada pelo Sistema de Informações de Águas Subterrâneas (SIAGAS) indica que a mesma tem um conteúdo extraordinário de dados permitindo extrair informações muito úteis destinadas às políticas públicas relacionadas com recursos hídricos, tais como: a) gestão das águas subterrâneas; b) avaliação hidrogeológica; c) revitalização de poços; d) superexplotação e contaminação dos aquíferos, dentre outros. Todavia, é necessário realizar o enriquecimento e depuração dos dados, que pelo seu histórico, apresentam inconsistências e falhas, de modo a agregar maior valor à base de dados. Dispor de um Sistema de Apoio à Decisão aplicado aos Recursos Hídricos Subterrâneos constitui uma valiosa ferramenta para planejadores, analistas de negócio e gerentes da área de recursos hídricos, que a partir da análise de dados históricos e atuais, situações, métricas e desempenho, podem tomar as melhores decisões. Esta dissertação apresenta um modelo conceitual, baseado em BI de um sistema de apoio à decisão aplicado aos recursos hídricos subterrâneos. 1.2 Justificativa Partindo do pressuposto que a água é um bem natural e estratégico, verificamos que o Brasil tem uma disponibilidade hídrica superficial de m 3 /s, cujo potencial corresponde a 53% do total referente à América do Sul e 12% da água doce do planeta.

21 20 Em relação às águas subterrâneas, nosso país dispõe de um sistema aquífero fissural que ocupa 53% do território nacional e possui bacias sedimentares que ocupam 42% da superfície do país. Não obstante, devido ao grande volume de água doce, disponível no Brasil, observamos enormes desafios a serem enfrentados relativos à sua gestão e aproveitamento, pois 80% da produção hídrica brasileira se concentram em três grandes unidades hidrográficas: Amazonas, São Francisco e Paraná (PEIXINHO & FEITOSA, 2008). Além disso, embora o potencial hídrico subterrâneo no Brasil seja bastante expressivo, o seu aproveitamento ainda é relativamente pequeno, devido à tradição histórica brasileira de realizar em maior escala o aproveitamento das águas superficiais. Isto decorreu do fato do setor elétrico ter exercido, ao longo de mais de 60 anos, a liderança no aproveitamento dos recursos hídricos para a geração de energia, efetuando um monitoramento hidrológico contínuo nas principais bacias hidrográficas e garantindo um rico acervo de informações sobre o regime hidrológico brasileiro. A evolução histórica dos recursos hídricos, em nosso país, demonstra que ficou a cargo do Ministério de Minas e Energia, através do Departamento Nacional de Energia Elétrica (DNAEE), extinto em 1996, a incumbência de realizar a gestão dos recursos hídricos, até a promulgação da Lei 9.433, que instituiu a Política Nacional de Recursos Hídricos. A implantação da Política Nacional de Recursos Hídricos, em 1997, estabeleceu uma nova configuração no modelo de gestão das águas no Brasil, obedecendo a princípios que privilegiam a participação e a descentralização nos processos decisórios, novos atores sugiram neste processo, destacando-se os Conselhos, Comitês e Agências de Bacias. Além disso, instituiu instrumentos para a gestão dos recursos hídricos. Entre os principais desafios em recursos hídricos no Brasil destacam-se: 1. Cheias esse fenômeno hidrológico ocorre nas principais bacias hidrográficas brasileiras (Nordeste, Centro-Oeste, Sul e Sudeste) provocando inundações principalmente associadas a escorregamentos de encostas,

22 21 resultando em desastres naturais com enormes prejuízos sócio-econômicos (Sul e Sudeste). 2. Conflitos de Uso características das regiões Sul e Sudeste aonde a oferta de águas é insuficiente para atender a demanda de múltiplos usos. 3. Contaminação das Águas ocorre, na maioria das regiões densamente povoadas e/ou que tem um saneamento básico deficitário. 4. Escassez de água com ocorrência predominantemente nas bacias da região Nordeste. O déficit hídrico existente no Nordeste associado à elevada densidade populacional levou a se buscar, de forma alternativa, o aproveitamento dos recursos hídricos subterrâneos através da exploração de poços profundos. A deficiência no processo de gestão e controle das águas subterrâneas, em especial, do processo de perfuração de poços tem resultado em ineficiência no sistema de recursos hídricos com elevados desperdícios de água e baixa produtividade para atendimento a população. O SIAGAS compõe o Sistema Nacional de Informações sobre os Recursos Hídricos da Política Nacional de Recursos Hídricos e visa apoiar a pesquisa, os estudos, a gestão e o aproveitamento das águas subterrâneas. Dentre os principais desafios nesta área merecem destaques: a) a necessidade de internalizar o uso da ferramenta SIAGAS nos órgãos gestores estaduais de recursos hídricos, que detêm o poder legal sobre as águas subterrâneas, permitindo a padronização e intercâmbio dos dados, a nível nacional; b) a necessidade de enriquecimento da base de dados relativo a dados geológicos, hidrodinâmicos e hidroquímicos (vide figura 2); e c) ter à disposição um sistema de apoio à decisão em recursos hídricos.

23 SIAGAS - Cadastro de Poços NORTE ENTIDADE PROPRIETÁRIO USO FORMAÇÃO LITOLOGIA SITUAÇÃO N. ESTÁTICO N. DINÂMICO VAZÃO PH CONDUTIVIDADE FERRO CLORETO SÓLIDOS TOTAIS COLIFORMES Figura 2 Distribuição Percentual do Povoamento do Banco de Dados SIAGAS A motivação da pesquisa está orientada pelos seguintes aspectos: tornar a base de dados de água subterrânea referência em qualidade dos dados, para dar suporte à pesquisa, estudos, gestão e aproveitamento das águas subterrâneas; motivar os órgãos gestores e intervenientes na utilização das ferramentas SIAGAS e SAD, no processo de gestão das águas subterrâneas; aumentar a eficácia do programa de águas subterrâneas. 1.3 Objetivos A água subterrânea é parte integrante do ciclo hidrológico, representando 98% das águas doces e líquidas do planeta. Elas são responsáveis pela alimentação e pela regularização (perenização) dos rios, dos córregos, dos lagos e outros, permitindo que estes continuem fluindo na época de estiagem/seca. As referidas águas têm importância estratégica, pois normalmente apresentam elevado padrão de qualidade, físico-química e bacteriológica. Além disso, não são afetadas por períodos de estiagens prolongados e sua obra de captação (poço) pode ser construída próxima ao local da demanda. No Brasil, devido à grande e rica rede de drenagem fluvial, historicamente, se utilizou as águas superficiais em detrimento das águas subterrâneas predominantemente.

24 23 O crescente consumo e aproveitamento das águas têm proporcionado o uso mais intenso das águas subterrâneas. A gestão eficaz das águas subterrâneas pressupõe a existência de sistemas de informações que as organizem e lhes dêem representatividade e confiabilidade. Assim, a intenção é despertar o interesse dos pesquisadores, gestores e usuários dos recursos hídricos subterrâneos, na adequada produção de dados, armazenamento, recuperação e difusão de informações, bem como no uso de Sistema de Apoio à Decisão aplicado aos Recursos Hídricos Subterrâneos, baseado em Business Intelligence. Consequentemente, os resultados deste trabalho terão validade para os profissionais envolvidos em projetos de Data Warehouse e Análise de Negócio, bem como o uso de ferramentas para manipulação e análise de dados tais como: Data Mining, Business Performance Management e Dashboard. Objetivo geral O objetivo geral da pesquisa é projetar um modelo conceitual de um Sistema de Apoio à Decisão, apoiado em BI, aplicado aos recursos hídricos subterrâneos, composto das seguintes etapas: Projetar um Sistema de Apoio à Decisão (SAD) baseado no BI. Estruturar uma Base de Dados Referencial (Data Store Operacional- ODS ). Objetivo específicos Estabelecer critérios para o enriquecimento da base de dados Simular a aplicação do SAD numa área piloto 1.4 Estrutura da Dissertação A presente dissertação está estruturada em 5 capítulos, em que o 1º já foi exposto, e os demais estão descritos a seguir. O Capítulo 2 configura o estado da arte da pesquisa e tem por finalidade apresentar os principais conceitos envolvidos com o tema da dissertação, sob a forma de revisão bibliográfica. O capítulo 3 descreve a metodologia para construção do modelo conceitual de um Sistema de Apoio à Decisão, baseado em BI, analisando os componentes do modelo

25 24 que envolve o Sistema Operacional (SIAGAS/RIMAS), Data Store Operacional, Data Warehouse, OLAP, Data Mining e Business Performance Management - BPM. O capítulo 4 apresenta um protótipo do modelo conceitual SAD aplicado aos recursos hídricos subterrâneos em Porto Velho Rondônia. O capítulo 5 retoma as discussões gerais do trabalho de forma conclusiva, finalizando a dissertação com os resultados e contribuições relevantes, dificuldades encontradas e as indicações para trabalhos futuros.

26 25 Capítulo 2 Fundamentação Teórica Este capítulo configura o estado da arte da dissertação e busca discutir os requisitos relacionados aos Sistemas de Apoio à Decisão, Data Warehouse, OLAP, Data Mining e Business Performance Intelligence. São apresentados os principais conceitos e a importância dos processos decisórios, mostrando a relevância para a utilização do Business Intelligence. 2.1 Contextualização A hidrologia é uma ciência de natureza estocástica, ou seja, não determinística, necessitando formar séries históricas extensas para a sua utilização racional e eficiente na gestão e no aproveitamento dos recursos hídricos. Portanto, dispor de uma base de dados hidrológica confiável e representativa é fundamental para dela extrair informações valiosas na aplicação dos recursos hídricos. Atualmente, o Brasil dispõe de um banco de dados de hidrologia de superfície bastante expressivo, construído ao longo dos 90 anos de levantamento hidrometeorológico para atender, primordialmente, o aproveitamento hidroenergético. São mais de 500 milhões de dados de precipitação, evaporação, níveis d água, descargas líquidas e sólidas dos rios, qualidade da água e armazenamento em uma base de dados administrada pelo Sistema Nacional de Informações sobre Recursos Hídricos. No entanto, o mesmo não se pode dizer em relação à formação da base de dados de água subterrânea. Historicamente, prevaleceu, em nosso país, a gestão e o aproveitamento dos recursos hídricos superficiais. Mais recentemente, o Serviço Geológico do Brasil, implantou o Sistema de Informações de Águas Subterrâneas SIAGAS, que permitiu formar uma base de dados de águas subterrâneas que hoje conta com cerca de poços cadastrados. O SIAGAS tem sido utilizado como um instrumento importante de tomada de decisão no campo da gestão e aproveitamento dos recursos hídricos subterrâneos, obtendo o reconhecimento do Conselho Nacional de Recursos Hídricos - CNRH, que recomenda a sua adoção pelos órgãos gestores e os usuários de informações

27 26 hidrogeológicas. Além disso, o SIAGAS foi implantado em Cuba e existe a perspectiva de sua utilização pelos Serviços Geológicos dos países ibero-americanos. Não obstante, devido ao controle frágil exercido pelos órgãos gestores dos recursos hídricos, cujo domínio é estadual, tem resultado numa base de dados com muitas falhas e inconsistências, limitando a sua utilização, principalmente nas aplicações seguintes: aumento do conhecimento sobre a disponibilidade e vulnerabilidade hídrica; melhoria da eficiência das obras hídricas; e gestão e controle da contaminação das águas subterrâneas, dentre outros. Neste sentido, torna-se importante adotar um sistema de apoio à decisão que proporcione uma avaliação crítica das informações de água subterrânea, auxiliando os gestores a definir tendências, apontar problemas e absorver decisões inteligentes. 2.2 Sistema de Apoio à Decisão O Sistema de Apoio à Decisão, baseado em BI, se utiliza de várias tecnologias, dentre elas, Data Warehouse, Data Mart, Sistema Gerenciadores de Banco de Dados, Processamento Analítico On-line (OLAP), Banco de Dados Multidimensionais, Mineração de Dados (Data Minning), entre outros. Segundo GOUVEIA (2009), as Ferramentas de Apoio à Decisão (FAD) fazem parte do conceito BI ou Inteligência do Negócio e constituem o conjunto de tecnologias que permitem o cruzamento de informações, o suporte à análise dos indicadores de desempenho de um negócio. Com elas, é possível apresentar informações dos negócios, sob forma gráfica, simulando a ocorrência e oferecendo maior capacidade de análise para descobrimento de novos conhecimentos e padrões. De acordo com TURBAN et al. (2009), o termo BI foi cunhado pelo Gartner Group em meados da década de Este conceito, todavia, iniciou muito antes, com os sistemas de geração de relatório SIG na década de Neste período os sistemas de geração de relatórios eram estáticos, bidimensionais e não possuíam recursos de análise. No início dos anos 80 surgiu o conceito de sistema de informações executivas

28 27 (EIS). Foram introduzidos na década de 1990 recursos de geração de relatórios dinâmicos e multidimensionais (ad hoc ou sob demanda), prognósticos, análise de tendências e detalhamento e fatores críticos de sucesso. O uso desses recursos e alguns novos apareceram sob o nome de BI. Em 2005 incorporou-se ao BI recurso de inteligência artificial, bem como poderosos recursos de análise. O maior objetivo do BI é definir regras e técnicas que permitam as empresas gerenciar os seus dados transformando-os em depósitos estruturados de informações, independente de sua origem. Entre os depósitos de informações estruturados destaca-se o Data Warehouse, que armazena informações em estruturas dimensionais e representa uma forma de dar suporte a tomada de decisões. Esta evolução dos Sistemas de Apoio à Decisão (SAD) foi em função da necessidade das organizações estarem focadas na captação, compreensão e exploração dos seus dados, em face do ciclo de negócio estar cada vez mais apertado, exigindo uma decisão melhor e mais rápida. Os gerentes precisam de informações certas, na hora certa e no lugar certo. O uso do SAD decorreu, também, do crescente aumento da quantidade de dados armazenados em meio eletrônico, da constante diminuição do custo de armazenamento de dados e do aumento da eficiência das tecnologias de informações. De acordo com ELMASRI (2005), os bancos de dados de apoio à decisão são extensos, com elevado grau de indexação e envolvem muitas redundâncias. As chaves quase sempre envolvem um componente temporal e as consultas são normalmente complexas. Os sistemas de banco de dados para apoio à decisão diferem dos sistemas de banco de dados tradicionais, pelo fato daqueles serem quase sempre para leitura/consulta e, dificilmente, para atualizações. Por esta razão verifica-se dificuldade de manipular grande número de variáveis e de dados históricos. Daí a necessidade de extrair informações relevantes da base de dados transacional ou operacional. Segundo TURBAN et al. (2009), o BI tem quatro grandes componentes: um data warehouse, composto de dados fontes; a análise de negócios, um conjunto de ferramentas para manipular e analisar dados no data warehouse, o qual inclui o data

29 28 mining; business performance management (BPM) para monitoramento e análise de desempenho e uma interface com o usuário (como o dashboard). No caso do data warehouse, estamos diante de um ambiente técnico enquanto que o ambiente de análise está mais voltado para o analista de negócio. O usuário pode se conectar ao sistema por meio de interface do usuário, como navegador e a alta administração pode usar o BPM e o dashboard. 2.3 O processo de Busca do Conhecimento em Banco de Dados Com o aumento exponencial da quantidade de dados armazenada em base de dados, o homem necessita de ferramentas computacionais que o auxiliem na análise, interpretação e na construção de relacionamento de dados. Nesta vertente, o objetivo aqui é realizar a extração em grandes bases de dados informações desconhecidas e válidas que possam ser utilizadas para tomada de decisões. Para atender esta nova realidade surge uma nova linha de pesquisa denominada Descoberta de Conhecimento em Bases de Dados (Knowledge Discovery in Databases KDD), mas popularmente, denominada de Mineração de dados (PEIXINHO, 2009). O KDD surge como um amplo conceito de busca do conhecimento e envolve diversas áreas de conhecimento, dentre as quais merecem destaque: Estatística Data Warehousing Reconhecimento de Padrões Inteligência Computacional e Aprendizado de Máquinas Banco de Dados A título de ilustração, segue a figura 3 em que cada etapa da execução do processo KDD possui uma interseção com as demais. Desta forma os resultados obtidos numa fase podem ser utilizados para melhorar os resultas das próximas fases. Este procedimento revela uma interatividade, na perspectiva de melhorar os resultados a cada interação (GOUVEIA, 2009).

30 29 Figura 3 Etapas do Processo KDD Fonte: Adaptação de SYMEONIDIS, et al. (2005) O KDD, quando abordado sob a ótica do resultado, é definido como um processo de extração trivial de informação, implícita, previamente desconhecida e potencialmente útil, a partir dos dados armazenados em banco de dados. Conceituado sob a ótica de processo, o KDD é considerado como uma tarefa de descoberta de conhecimento intensivo, consistindo de interações complexas, feitas ao longo do tempo entre o homem e uma grande base de dados, possivelmente suportada por um conjunto heterogêneo de ferramentas. O KDD também é considerado como sendo um processo composto de etapas operacionais de pré-processamento, mineração de dados e pós-processamento (GOLDSCHMIDT et. al., 2005). A etapa de pré-processamento refere-se à execução de tarefas de captação, organização e tratamento de dados. Em seguida, temos a etapa de Data Mining, considerada essencial, relacionada com a extração do conhecimento útil no âmbito da aplicação KDD. O pós-processamento, algumas vezes dispensável, tem o objetivo de viabilizar a avaliação da utilidade do conhecimento descoberto (GOLDSCHMIDT et. al., 2005). A complexidade do processo KDD está diretamente associada à dificuldade em perceber e interpretar adequadamente inúmeros fatos observáveis durante o processo e na dificuldade em conjugar dinamicamente tais interpretações de forma a decidir quais

31 30 ações devem ser realizadas em cada caso (GOLDSCHMIDT et. al., 2005). Ao analista cabe a difícil tarefa de orientar o processo KDD. O processo de descoberta de conhecimento envolve seis estágios, a saber: 1) Seleção, 2) Limpeza, 3) Codificação, 4) Enriquecimento, e 5) Mineração de Dados e 6) Relatórios. As organizações passaram a utilizar-se de duas categorias de banco de dados: o banco de dados transacional para atender operações normais e o Data Warehouse para dar suporte às decisões estratégicas, ao prover uma sólida plataforma de dados históricos integrados a partir dos quais é possível fazer análises. A seleção dos dados é extraída do banco de dados transacional e, para facilitar este processo, eles são copiados para um banco de dados separado, ou mesmo para o próprio Data Warehouse. O estágio de Limpeza dos dados é feito através de algoritmos com o objetivo de depurá-los. Ele abrange qualquer tratamento realizado sobre os dados selecionados de forma a garantir a qualidade (completude, veracidade e integridade) dos fatos por eles representados. A codificação dos dados, por sua vez, é realizada de modo que eles fiquem em condições de serem usados como entrada dos algoritmos de reconhecimento de padrões. Esta é uma atividade criativa que deve ser realizada diversas vezes para se obter a melhor solução. O enriquecimento dos dados consiste em buscar mais informações que possam ser reunidas aos registros existentes, aprimorando-os para que estes contribuam no processo de descoberta de conhecimento. Por fim, a etapa de mineração de dados, que alguns autores consideram com sinônimo da Descoberta de Conhecimento em Bases de Dados, envolve a aplicação de algoritmos sobre os dados, na busca de conhecimento implícito e útil. Nesta etapa são definidos técnicas e algoritmos a serem utilizados no problema em questão, tais como: Ferramenta de Consulta, Técnicas Estatísticas, Visualização, Processamento Analítico

32 31 on-line (ferramenta OLAP), Árvores de Decisão, Redes Neurais, Regras de Associação e Algoritmo Genético. 2.4 Data Warehouse O DATA WAREHOUSING é um ambiente computacional onde os usuários extraem informações estratégicas que os ajudam a conduzir seu processo de negócio. A seguir, abordaremos definições e conceitos sobre o referido ambiente computacional. O produto do DATA WAREHOUSING é o DATA WAREHOUSE(DW), um conjunto de dados produzidos para dar suporte à decisão, de interesse dos níveis gerenciais da organização. Segundo TURBAN et al., (2009), os dados são, normalmente, estruturados de modo a estarem disponíveis em um formato pronto para as atividades de processamento analítico (p. ex. processamento analítico on line [OLAP], data mining, consultas, geração de relatórios, outras aplicações de suporte à decisão). De acordo com INMON (2005), o termo é definido como um depósito de dado orientado por assunto, integrado, não volátil, variável com o tempo, para apoiar as decisões da gerência. Uma maneira de apresentar o data warehousing é recorrer as suas características fundamentais: Orientação por assunto. Os dados são organizados por assunto pormenorizado, como vendas, produto ou clientes, e contem informações relevantes para tomada de decisão, permitindo avaliar o desempenho da organização. Um data warehouse difere de um banco de dado operacional, por que estes são orientados por processo e lidam com transações que atualizam o banco de dados. Integrado. A integração é uma característica de um data warehouse. Os dados advindos de diferentes fontes como BD operacionais, arquivos textos, sistemas legados, etc. devem estar em formato consistente. Aparecem conflitos de nomenclatura e discrepância entre unidades de medidas a serem superados.

33 32 Variável no tempo (série temporal). Um data warehouse mantém dados históricos e por conseguinte detectam tendências, variações e relações de longo prazo que permitem fazer previsões e comparações. Não-volátil. Após os dados serem inseridos no data warehouse não podem ser alterados. Os dados obsoletos são descartados e as alterações são consideradas como dados novos. Segundo TURBAN et al. (2009), as características adicionais de um data warehouse que podem ser incluídas são as seguintes: Baseado em Web. Os data warehouses são desenvolvidos para ambiente informatizado eficiente baseado na Web; Relacional/multidimensional. Um data warehouse usa tanto um estrutura relacional como multidimensional; Cliente/Servidor. Um data warehouse, para proporcionar acesso mais fácil, usa arquitetura cliente/servidor. Em tempo real. Os data warehouse mais recentes já incluem recursos de acesso e análise em tempo real. Inclui metadados. O uso do metadados (dado sobre dado) no data warehouse tem a finalidade de informar como os dados estão organizados e como usa-lo de forma mais eficiente. Portanto, o data warehouse (DW) é um repositório de dados especiais, enquanto que o data warehousing é um processo inteiro. Existem três tipos de data warehouses: data mart (DM), data store operacional (ODS) e data warehouses empresariais (EDW). 2.5 Data Mart De acordo com GOUVEIA (2009 apud KIMBAL, et al.2002: 36): Um Data Mart é um Data Warehouse de menor capacidade e complexidade usado para atender a uma unidade específica de negócios. Portanto, são tipicamente mais fáceis de construir e manter.

34 33 Segundo TURBAN et al. (2009:58), um data warehouse une banco de dados de toda a empresa; já um data mart, geralmente, é menor e se concentra em um assunto ou departamento específico. O Data Mart é um subconjunto de um Data Warehouse, que consiste em uma única área temática (p. ex., marketing, produção). Um Data Mart pode ser dependente ou independente. Um Data Mart dependente é um subconjunto criado diretamente do Data Warehouse. Uma vantagem é ter um modelo de dados consistentes e para toda a empresa, além de produzir dados de qualidade. Um Data Mart independente é um Data Warehouse pequeno, projetado para uma unidade estratégica de negócios (UEN) ou um departamento, mas cuja fonte não seja um EDW. Ele é útil nas seguintes condições (GOUVEIA, 2009): Os dados devem estar segregados para melhorar o desempenho do sistema do ponto de vista do usuário; Deve ter cópia dos dados onde somente às pessoas autorizadas tenham acesso; Em ambiente corporativo é importante que seja fortalecido o conceito de propriedade em banco de dados. Data stores operacionais O data store operacional (ODS) é um tipo de banco de dado constantemente usado na área de preparação temporária de um Data Warehouse. Ele difere do Data Warehouse porque seu conteúdo pode ser atualizado durante o curso das operações comerciais. Um ODS é usado para decisões de curto prazo e envolve operações de consolidação de vários sistemas-fonte, permitindo uma visão integrada e quase em tempo real dos dados voláteis e correntes. Data warehouse empresarial Um data warehouse empresarial (EDW) é um data warehouse em grande escala e utilizado por toda a organização. Esta dimensão lhe proporciona meios para integrar dados oriundos de muitas fontes em um formato padronizado, possibilitando maior eficiência das aplicações deste BI até suporte a decisão.

35 Metadados Os metadados são componentes muito importantes dentro do ambiente, pois ajudam a identificar e localizar os demais dados do DW. Eles descrevem a estrutura e alguns significados a respeito dos dados e contribuem para seu uso eficiente ou ineficiente (TURBAN et al., 2009). Em termos de uso, os metadados podem ser definidos como técnico ou de negócios. Segundo KASSAM (2002 apud TURBAN, 2009:59), os metadados de negócios incluem informações que aumentam a compreensão sobre os dados tradicionais (estruturados). O seu principal objetivo é oferecer contexto aos dados relatados, isto é, informações enriquecedoras que conduzem à geração do conhecimento. Existem considerações éticas a serem observadas na coleta e posse de informações contidas nos metadados, inclusive questões de natureza intelectual e de privacidade que surgem no estágio de desenvolvimento do projeto. 2.7 Granularidade A granularidade diz respeito ao nível de detalhamento das informações que estão armazenadas no Data Warehouse. Segundo INMON (1997), constitui a informação mais importante do projeto. Quanto maior o nível de detalhamento dos dados, menor é a granularidade do DW. A granularidade está ligada ao volume dos dados armazenados e, consequentemente, determina o grau de consulta que pode ser extraído da base de dados. Ao definir um nível mais detalhado, o usuário terá informações em qualquer nível de agregação e maior será o detalhamento da consulta. Cabe a equipe de sistemas, projetar adequadamente o Data Warehouse de maneira a atender satisfatoriamente às consultas e análises dos gerentes, com tempos de resposta satisfatórios e com tamanho e crescimento do banco de dados perfeitamente gerenciável. 2.8 Visão Geral do Processo de Data Warehouse Muitas organizações, sejam elas públicas ou privadas, têm, constantemente, gerado dados e informações em níveis cada vez maiores e os armazenam em sistemas informatizados. Manter e usar estes dados e informações, num ambiente extremamente competitivo e dinâmico, se torna uma tarefa bastante complexa, principalmente quando se considera questões de escalabilidade. Também aumenta cada vez mais o número de usuários que deseja acessar as informações contínuas e cada vez mais confiáveis e

36 35 representativas, exigindo que as organizações criem data warehouses armazéns com grande quantidade de dados, em série temporal para o suporte à decisão. Na figura 4 é mostrado o conceito de data warehouse. Os principais componentes de um processo de data warehousing, segundo TURBAN et al. (2009), são os seguintes: Figura 4 Estrutura e Visualização do Data Warehouse Fonte de Dados. Os dados são coletados em múltiplas fontes, através de sistemas operacionais independentes ou integrados. Extração de Dados. Os dados são extraídos com um software personalizado ou comercial chamado ETL (extração, transformação e carga). Carregamento dos Dados. Os dados são carregados numa área intermediária, para serem transformados e limpos e, posteriormente, enviados para carga no data warehouse. Banco de Dados Abrangente. É o banco de dados empresarial que fornece informações relevantes resumidas e detalhadas extraídas de diversas fontes de dados. Metadados. Os metadados são utilizados pelo pessoal de TI e pelos usuários. Ele dispõe de regras para organizar resumos de dados, com facilidades de indexação e busca, as quais podem ser realizadas por ferramentas da Web.

37 36 Ferramentas de milddleware. São ferramentas para acesso ao data warehouse. Usuários avançados podem criar suas próprias consultas em SQL. 2.9 Arquitetura Geral do Data Warehouse Segundo GOUVEIA (2009), ao se projetar um Data Warehouse há de considerar dois tipos de dados: dados primitivos (operacionais ou atômicos) e dados derivados. Os dados primitivos são atuais, passíveis de atualização e processados repetidamente. Enquanto os dados derivados são, em geral, valores históricos baseados em assuntos ou negócios, resumidos, ou refinados e são processados de forma heurística (INMON, 2005). A escolha do dado primitivo para armazenamento no DW tem vantagens e desvantagens. O maior benefício é dispor de uma base mais rica para efetuar a pesquisa, proporcionando uma análise mais profunda e cuidadosa dos dados, permitindo avaliar, a partir do histórico, tendências, fazer previsões ou elaborar cenários. A principal desvantagem é a ocupação de maior área para armazenamento dos dados e a exigência de maior capacidade de processamento para que não haja perda de performance na consulta e análise dos dados. Já a escolha dos dados derivados para armazenamento no DW apresenta, também, vantagens e desvantagens. O maior benefício é que os dados já estão resumidos e no formato apropriado para consulta. Além de ocupar menos espaço para armazenamento, o processamento é mais rápido. Como desvantagem a sumarização reduz a capacidade de pesquisa e análise. Normalmente as empresas adotam ambas as forma de armazenamento. De acordo com INMON (2005) existem 04 (quatro) níveis do ambiente arquitetural de um Data Warehouse: 1) Nível Operacional, 2) Nível Atômico, 3) Nível Departamental; e 4) Nível Individual, como mostra a Tabela 1.

38 37 Tabela 1 Os quatro níveis de dados do ambiente arquitetural de um data warehouse Nível Operacional Nível Atômico Nível Departamental Nível Individual Dados detalhados Dados mais granular Dados paroquial (restritos) Dados temporários Dia a dia (cotidiano) valores atuais Variáveis no tempo (histórico) Alguns derivados e alguns primitivos Consulta ad hoc Alta Probabilidade de Acesso Picos de Acesso Tipos de Departamento Heurístico Orientado Aplicação à Orientado a Assunto Orientado por departamento de negócio Baseado em PCs ou estações de Trabalho Fonte: Adaptação (INMON, 2005) Segundo GOUVEIA (2009), o nível operacional de dados está relacionado com aplicação envolvendo dados primitivos e atende ao processamento de transações de alta performance. O nível atômico ou Data Warehouse contem dados primitivos que não sofrem atualizações, além de alguns dados derivados. Já o nível departamental contem quase exclusivamente dados derivados. Este nível é definido de acordo com a necessidade dos usuários finais adaptadas às necessidades do Departamento. Na tabela 2 são apresentados os 04 (quatro) níveis de dados.

39 38 Tabela 2 Exemplos de consultas referentes aos quatro níveis de dados Nível Operacional Nível Atômico Nível Departamental Nível Individual -Qual a vazão de produção do poço neste momento? - Qual o histórico de médias de vazões produção. Vazão produção captada no poço analisado está aumentando? - Quais são as tendências em relação ao setor analisado? Medição da vazão de produção (Abril de 2011): 2 m 3 /h. Ponto n o Maio a Agosto de 2010 Vazão de produção = 2,5 m 3 /h. Ponto n o Maio a Agosto de 2007 = 2,5 m 3 /h. Inspecionar os poços para constar a sua situação em termos de estado de funcionamento (paralisado, abandonado e não instalado) Setembro Dezembro de 2010 Vazão bombeada = 3,0 m 3 /h. a Setembro a Dezembro de 2007: 2,5 m 3 /h. Ponto n o Janeiro a Abril de 2007: 3,0 m 3 /h. Janeiro a Abril de 2007: 2,5 m 3 /h. No nível operacional considera a vazão produção do poço para atender o consumo de um dado cliente, a partir do último levantamento efetuado. No nível atômico ou de Data Warehouse a consulta possibilita extrair informação sobre o histórico da vazão de produção no poço para consumo de um dado cliente, no período de considerado. No terceiro nível, ou seja, Data Mart obtêm-se informações de maior complexidade e orientada ao negócio para tomada de decisão. Como exemplo, poderia considerar uma relação de todos os usuários de poços, por tipo de uso. Como consulta neste nível tem-se: qual a tendência do volume de água produzido do poço num período considerado. O retorno desta consulta são as médias de volume bombeado agrupado por períodos.

40 39 O nível individual possibilita a previsão de informações fornecendo projeções de cenários por meio de análises heurísticas. Os dados neste nível são geralmente temporários e de pequenas proporções (GOUVEIA, 2009). No que tange a arquitetura básica de data warehousing, segundo TURBAN et al. (2009), a mais comum são as de duas e três camadas. HOFFER et al. (2007) as distinguem pela divisão do Data Warehouse em três partes: O data warehouse composto dos dados e do software associados. Software de aquisição dados que extrai os dados de sistemas legados e fontes externas. Software de cliente (front-end) que permite o usuário acessar e analisar os dados a partir do data warehouse. O data warehouse integrado a Internet produz o data warehousing baseado na Web. Sua arquitetura de três camadas inclui PC cliente, servidor de Web e servidor de aplicação. No lado do cliente é necessário uma conexão a Internet e um navegador de Web. No lado do servidor é usado um servidor Web para gerenciar o fluxo de entrada e a saída de informações entre o servidor e o cliente. Esta tarefa é apoiada por um Data Warehouse e um servidor de aplicação (TURBAN, et. al., 2009). Segundo ARYYACHANDRA e WATSON (2005), existem 10 fatores que afetam a decisão relativa à seleção de arquitetura, descritos a seguir. Interdependência de informações entre as unidades da organização Demanda de informações da alta administração Nível de urgência de um data warehouse Natureza das tarefas do usuário final Limitação de recursos Visão estratégica do data warehouse antes da implementação Compatibilidade com os sistemas existentes Capacidade interna da equipe de Tecnologia de Informação (TI) Questões de natureza técnica Fatores sociais/políticos

41 40 Estes fatores guardam semelhança com os descritos na literatura para sistemas de informações, Sistema de Apoio à Decisão e Business Intelligence (BI). Não obstante a importância das questões técnicas prevalecem as questões de ordem comportamental, como a satisfação das necessidades de informação da Alta Administração e o envolvimento do usuário no processo de desenvolvimento Processo de Extração, Transformação e Carga - ETL Para a construção de um DW é necessário manipular uma grande quantidade de dados e organizá-los de maneira estruturada num DW. Esta manipulação dos dados é feita através de um processo de Extração, Transformação e Carga (Extraction Transformation and Load). Esta etapa é vista com uma das mais críticas de um projeto de DW, pois uma falha no processo de carregamento do DW pode trazer consequências imprevisíveis posteriormente. A etapa de extração, como o próprio nome diz, realiza a extração de dados de uma ou mais fontes. Em muitos projetos de DW é necessário fazer a extração de vários dados, que estão espalhados em sistemas operacionais e fontes externas. A fase de transformação é responsável pela conversão dos dados extraídos de sua forma anterior para a que deve estar. A carga corresponde a colocação dos dados no Data Warehouse. Primeiramente, os dados passam por limpeza ou filtragem onde o objetivo é garantir a integridade dos dados, deixando-os em um estado consistente antes de serem carregados no DW. Em seguida é necessário deixar os dados de forma homogênea visando a sua integridade, uma das principais características do ambiente de DW. A última etapa do processo de ETL é a carga propriamente dita dos dados extraídos e transformados para o DW. Existem hoje no mercado várias ferramentas, de código aberto, que auxiliam a execução dessa fase do projeto, tais como: Kettlei, O CloverETL2 e o Talend Open Studio3.

42 Modelagem Multidimensional A modelagem de dados é uma das mais importantes diferenças entre um ambiente operacional e um ambiente de DW. Em um ambiente operacional normalmente se emprega o modelo Entidade e Relacionamento (ER) para garantir o desempenho das transações, eliminado a redundância dos dados. Já no ambiente de DW necessitamos de uma técnica que suporte o ambiente de análise multidimensional de dados. Em banco de dados que manipulam multidimensões existem, basicamente, dois tipos principais de estruturas ou esquemas, o esquema estrela (star schema) e o esquema floco de neve (snowflakeschema). Cada um dos esquemas possui suas características que serão descritas mais adiante, no entanto, qualquer que seja o esquema utilizado, existem três elementos básicos: fato: um fato é uma coleção de itens de dados, cada fato representa um item, um evento de negócio de uma empresa. É representado pelos valores numéricos e implementado pelas tabelas denominadas tabelas de fato; dimensões: são os elementos que participam de um fato, as dimensões determinam o contexto de um assunto de negócios; medidas: são os atributos numéricos que representam um fato, a performance de um indicador de negócios relativo às dimensões que participam desse fato. Uma medida é determinada pela combinação das dimensões que participam de um fato e estão localizadas como atributos de um fato. A ideia principal da modelagem multidimensional é que quase todos os tipos de dados de negócio podem ser representados por um cubo de dados, onde as células do cubo contêm os valores medidos e os lados definem as dimensões. Um cubo nos permite representar um modelo tridimensional, entretanto usualmente um modelo dimensional consiste de mais de três dimensões, o que é definido com um hipercubo. A visualização de um hipercubo é muito difícil, desta forma adota-se a referência cubo para qualquer modelo multidimensional.

43 42 Modelo Estrela O modelo estrela é o termo comum para a designação de modelos de dados multidimensionais. Sua composição possui uma grande entidade central, a tabela de fatos, e um conjunto de entidades menores, as tabelas de dimensões, formando uma estrela. Os relacionamentos entre a entidade fato e as dimensões são simples ligações entre as duas entidades em um relacionamento de um para muitos no sentido da dimensão para o fato. A utilização do modelo estrela possibilita alguns benefícios em relação a uma estrutura relacional para o processamento analítico, entre eles podemos destacar o rápido tempo de resposta, o seu fácil entendimento e baixa manutenção. Modelo Floco de Neve O modelo de dados multidimensional é usualmente similar a uma estrela em seu design. Um fato está no centro da estrela e as dimensões estão ao redor, formando as pontas da estrela. O modelo floco de neve, basicamente, é uma extensão do modelo estrela, onde uma ou mais dimensões são decompostas, formando uma hierarquia de dimensões. A decomposição das dimensões é o resultado da aplicação da terceira forma normal sobre as tabelas de dimensão. Como é um modelo normalizado, ele evita a redundância de valores textuais em uma tabela Análise de Negócios e Visualização de Dados Muitas organizações têm acumulado uma grande quantidade de dados que bem manipulados podem produzir informações valiosas, permitindo que sejam usadas com sucesso nos seus negócios. O ato de permitir a análise da decisão por meio de acesso a todos os dados e informações relevantes é conhecido como análise de negócios (BA) (TURBAN, et al., 2009). A BA inclui OLAP, multidimensionalidade, visualização de dados, SIG, data mining e técnicas de análise avançada.

44 43 Os dados analisados com o uso da BA podem ser encontrados em um Data Warehouse, ser dados operacionais ou estar em arquivos da Internet. O uso de software de análise de negócio, o qual contempla um conjunto de ferramentas de relatórios, modelos estatísticos e técnicas de visualização, coloca a disposição dos tomadores de decisões informações oportunas, precisas e detalhadas. Uma característica importante que a ferramenta de análise de negócios possibilita é coletar e analisar informações em vários pontos e distribui-la rapidamente. Conforme TURBAN et. al.(2009), isto é possível da seguinte maneira: criação de Data Warehouse que integra e padroniza dados provenientes de muitas fontes e locais; uso de software que permite fácil consulta dos dados de qualquer local, a qualquer momento; uso de software para preparar e distribuir relatórios; uso de software de BI para realizar várias análises de dados, visando descobrir oportunidades ou problemas e encontrar soluções ou tendências; uso de software de BI para alertar gerentes e outros; descoberta de status de vendas e estoques de forma rápida ( ou seja, usando relatórios); O BA, portanto, oferece modelos e procedimentos de análise e monitoramento dos dados de modo a garantir uma vantagem competitiva. Ao usar o software para BA o usuário faz consulta e requisita relatório ad hoc ou realiza análises. É possível realizar consultas em várias camadas. A BA utiliza um grande número de ferramentas, as quais podem ser classificadas em 03 (três) categorias: descoberta de informações e conhecimento; Data, text e web mining; Suporte à decisão e sistemas inteligentes.

45 Tecnologias OLAP Para atender a necessidade de operação transacional surgiram, inicialmente, as tecnologias denominadas On-line Transaction Processing (OLTP). As principais operações neste tipo de processamento são alteração, inclusão, exclusão e consultas. As tecnologias On-Line Analytical Processing (OLAP) foram concebidas para desenvolver atividades de geração e respostas às consultas, solicitação de relatórios e gráficos ad hoc, realização de análises estatísticas e construção de apresentações visuais. Alguns tipos de informações podem ser de interesse dos planejadores de recursos hídricos: qual a quantidade de poços paralisados e inativos, agrupados por categoria da qualidade da água (água doce, salobra e salgada) ou qual a variação do nível estático dos poços situados num dado aquífero. Segundo TURBAN et al. (2009), os produtos OLAP oferecem recursos de modelagem, análise e visualizações de grande conjunto de dados, ou para gerenciamento de banco de dados (SGBD) ou, mais frequentemente para sistema de Data Warehouse. Ainda de acordo com autor, são os seguintes tipos de OLAP: OLAP multidimensional (MOLAP) quando o OLAP é implementado através de um banco de dados multidimensional. As transações são resumidas em visões multidimensionais e os dados são organizados em estrutura de cubo; OLAP relacional (ROLAP) quando um banco de dados OLAP é implementado por um banco relacional existente e é chamado de ROLAP relacional. Ela extrai dados de banco de dados relacional. Database OLAP é um sistema de gerenciamento de banco de dados relacional projetado para hospedar estrutura e realizar cálculos de OLAP. Desktop OLAP. O desktop OLAP envolve ferramentas OLAP simples e baratas que executam análise multidimensional e apresentação de dados baixados de bancos de dados relacional. Conforme GOUVEIA (2009), a principal vantagem em utilizar a ferramenta OLAP ao invés de uma ferramenta de banco de dados, é que ela apresenta facilidades

46 45 quanto a visualização e manipulação do modelo dimensional (tabela, fatos e dimensões). Uma outra vantagem é que não há necessidade de escrever queries SQL, como ocorre em ambiente puramente de Banco de Dados, pois esta ferramenta dispõe de interface gráfica para dar suporte a realização de consultas Multidimensionalidade Cubo de Dados Uma importante característica das tecnologias OLAP é permitir uma visão conceitual multidimensional. Os fatores que são levados em consideração na multidimensionalidade são dimensão, medidas e tempo. Seguem alguns exemplos: Dimensões. Alguns exemplos de dimensão são: produtos, equipes de produção, segmentos de mercado, unidade de negócios e locais de distribuição; Medidas. Alguns exemplos de medidas são: dinheiro, volume de produção, número de funcionário, lucro previsto vs. real; Tempo. Alguns exemplos de tempo são: diário, semanal, trimestral e anual. TURBAN et al. (2009) afirmam que um banco de dados multidimensional é um banco de dados cuja organização permite uma análise multidimensional. Os dados são trazidos de um data warehouse. Um exemplo de como a multidimensionalidade funciona: um gerente deseja saber a produção de um serviço, uma área geográfica específica, de uma equipe de produção, durante um dado mês. A resposta a esta pergunta pode ser obtida, mais rapidamente pelo usuário, independente da estrutura do banco de dados, se os dados estiverem organizados em bancos de dados multidimensionais, ou a consulta ou produtos de softwares estiverem projetados para multidimensionalidade. O usuário terá a funcionalidade de pesquisar em várias dimensões e níveis de dados por meio de tabelas ou gráficos e realizar interpretações rápidas. O cubo de dados é utilizado para representar dados em um conjunto, com medidas de interesse. O tal cubo pode ser bidimensional, tridimensional ou com outra dimensão. Cada dimensão representa um atributo no banco de dados, e as células no cubo de dados representam medidas de interesse.

47 46 Segundo TURBAN et al. (2009), a análise de cubos permite realizar consultas através de busca de uma série de visualização de relatórios, usando os recursos do software OLAP, permitindo ao usuário ter visões parciais de um cubo de dados. O termo cubo refere-se a um conjunto de dados altamente correlacionados que são organizados para permitir a combinação de qualquer atributo em um cubo. De acordo com relatório de uma pesquisa do Grupo Gartner (apud GRAY e WATSON, 1998) a multidimensionalidade possui algumas limitações: o banco de dados multidimensional pode ocupar mais espaço de memória do que um banco relacional; o carregamento do banco de dados consome tempo e recursos significativos do sistema, dependendo do volume de dados e número de dimensões; as interfaces e manutenção são mais complexas em banco de dados multidimensionais do que em banco de dados relacionais. Estão em constante evolução os estudos para tornar cada vez mais eficiente a manipulação da estrutura dimensional dos cubos de dados, buscando otimizar as consultas e operações OLAP Data Mining Segundo TAN et al. (2006), Data Mining ou Mineração de Dados é o processo de descoberta de informações úteis em grandes depósitos de dados. As técnicas de mineração são organizadas para atuar sobre grandes bancos de dados de modo a descobrir padrões úteis e recentes que poderiam de alguma forma permanecer ignorados. As técnicas de mineração de dados são utilizadas para ampliar uma ampla gama de inteligência do negócio com a criação de perfis de clientes ou para responder a questões científicas como o relacionamento entre a frequência e a intensidade dos distúrbios no ecossistema assim como as secas com o aquecimento global. A mineração de dados é uma parte integral da descoberta de conhecimento em banco de dados (KDD Knowledge Discovery in Databases) e envolve a aplicação de algoritmos sobre os dados, na busca de conhecimento implícito e útil. Na mineração dos dados são definidos técnicas e algoritmos a serem utilizados no problema em questão, tais como:

48 47 Ferramenta de Consulta Técnicas Estatísticas Visualização Processamento Analítico on-line (ferramenta OLAP) Arvores de decisão Redes Neurais Regras de Associação Algoritmo Genético A ferramenta de consulta representa o primeiro passo no projeto de Mineração de Dados, sendo uma análise rústica do conjunto de dados, utilizando-se de ferramenta tradicional de consulta antes de aplicar algoritmo de análise mais avançado, pois é necessário conhecer alguns aspectos básicos e estruturais do conjunto de dados. Uma boa prática para iniciar o processo é extrair algumas informações estatísticas simples do conjunto de dados, as quais ajudam a estabelecer procedimentos para o julgamento dos algoritmos de aprendizagem e do reconhecimento de padrões. As técnicas de visualização dos dados representam métodos muito úteis para se conhecer a qualidade do conjunto de dados e onde os padrões podem ser usados. A ferramenta OLAP é utilizada para responder a várias consultas, com diversos tipos de relações, onde a análise multidimensional é necessária. Por sua vez a árvore de decisão é uma técnica de classificação utilizada a partir da qual se procura descobrir uma função que mapeie um conjunto de registros em um conjunto de rótulos categóricos pré-definidos. As redes neurais artificiais são modelos matemáticos inspirados no princípio de funcionamento dos neurônios biológicos na estrutura do cérebro. Esses modelos simulam computacionalmente habilidades humanas tais como aprendizados, generalizações, associação e abstração. Portanto, constitui um dos algoritmos utilizados nas tarefas do KDD.

49 48 As regras de associação são utilizadas para distinguir na pesquisa do banco de dados, associação interessante dentre outras que não o são. Abrange a busca de itens que frequentemente ocorram em transações de banco de dados. Os algoritmos genéticos são técnicas que procuram obter boas soluções para problemas complexos. O processo é adaptativo, pois as soluções existentes a cada instante influenciam a busca por futuras soluções (GOLDSCHMIT et al., 2005). A apresentação dos resultados do processo pode ser feita através de relatório contendo descrição textual das tendências ou através de gráficos que mostrem as relações do modelo Funcionalidades da Mineração de Dados No processo de mineração de dados é possível utilizar diversos tipos de armazenamento e banco de dados. Em função do tipo de dados é possível definir que tipo de padrões ou relacionamento se quer obter através de mineração dos dados. A funcionalidade na mineração de dados é uma busca para especificar que tipos de padrões ou relacionamentos existem entre os registros ou variáveis que podem ser usadas na mineração (AZEVEDO et al., 2005). Alguns autores tratam essa funcionalidade como recompensas (outcomes) ou tarefas (tasks). A literatura, em muitos casos não deixa clara a diferença entre funcionalidades e técnicas. A seguir, a figura 5 mostra, em camadas, as interações entre funcionalidades técnicas e algoritmos.

50 49 Figura 5 - Interatividade entre funcionalidades e técnicas de mineração de dados As funcionalidades em mineração de dados são classificadas como Análise Descritiva e Análise de Prognóstico. A figura 6 ilustra essa abordagem de funcionalidade da mineração de dados. Esta forma de expressar a funcionalidade facilita quando surge nova necessidade de análise de dados. Neste caso somente é necessário identificar a que resultado pretende chegar para escolher a técnica a aplicar.

51 50 Figura 6 - Funcionalidades em Mineração de Dados Análise Descritiva A Análise Descritiva é a área da investigação nos dados que descreve fatos relevantes, não triviais e desconhecidos dos usuários, bem como analisa a qualidade dos dados existentes, com o objetivo de validar o processo de mineração dos dados. A análise descritiva está subdividida em Análise Prévia e Descobrimento AZEVEDO e CÔRTES (2005): análise prévia é o processo de análise da base de dados visando identificar anomalias ou resultados raros que podem influenciar os resultados da mineração dos dados; conhecimento é o processo de examinar a base de dados e encontrar padrões escondidos, sem que se exista uma ideia ou hipótese previamente estabelecida.

52 51 A análise prévia e o conhecimento podem ser subdivididas em subfuncionalidades, conforme figura 7, a seguir Figura 7 Sub-funcionalidades da Análise e do Descobrimento Análise de Prognóstico A análise de prognóstico é a área da investigação nos dados que busca inferir resultados a partir dos padrões encontrados na análise descritiva, ou seja, prognosticar o comportamento de um novo conjunto de dados. É possível dividi-la em Predição (Estimação e Predição) e Classificação.

53 52 Estimação é o processo de predizer algum valor, baseado num padrão conhecido. Por exemplo, conhecendo-se o padrão de despesas e a idade de uma pessoa, estima-se o seu salário e seu número de filhos. Predição - é o processo de predizer um comportamento futuro, baseado em vários valores. Por exemplo, baseado na formação escolar, no trabalho atual e no ramo de atividade profissional de uma pessoa, é feita a predição que seu salário será de certo montante até determinado ano. Classificação é o processo de predizer algum valor para uma variável categórica. Por exemplo, um banco financeiro pode determinar que um conjunto de clientes oferece risco ou não para contrair empréstimo pessoal Técnicas para obtenção das funcionalidades Definidas as funcionalidades para se chegar ao processo de mineração de dados é necessário escolher quais técnicas deverão ser utilizadas para garantir maior aderência na obtenção dos resultados. Por exemplo, a funcionalidade de estimação pode ser feita através da utilização da técnica de regressão linear e regressão múltipla. A tabela 3 apresenta um conjunto parcial de técnicas utilizadas para cada funcionalidade (AZEVEDO et al., 2005). Tabela 3 Funcionalidades e suas técnicas para mineração de dados Funcionalidade Sub-Funcionalidade Técnica Análise Prévia Descobrimento Análise de outliers Análise de desvios Visualização Ferramentas de consulta e técnicas estatísticas Indução por árvores de decisão Ferramentas de consulta e técnicas de estatísticas Indução por árvores de decisão Agregações e gráficos diversos

54 53 Classificação Indução por árvore de decisão Análise de associações Mineração de regras de associação booleanas unidimensionais a partir de bancos de dados transacionais. Mineração de regras de associação em múltiplos níveis a partir de banco de dados transacionais e data warehouse Mineração de regras de associação multidimensionais a partir de bancos de dados transacionais e data warehouse Da mineração de associação à análise de correlação Mineração de associação baseada em restrição Agrupamento (clustering) Métodos de particionamento Métodos hierárquicos Métodos baseados em densidade Métodos baseados em grid Métodos de clustering baseados em modelos abordagem estatística e redes neurais Análise de outliers Descrição do Conceito Sumarização e Generalização dos (caracterização e dados baseados em caracterização comparação) Caracterização analítica análise da relevância do atributo Segmentação Indução por árvore de decisão Sumarização e Agregação e gráficos diversos Visualização

55 54 Análise em dados no Análise de dados textual e formato texto recuperação de informações Mineração de textos classificação de documentos e associação de palavras chaves Estimação/Predição Estimação/Predição Regressão Linear Regressão Múltipla Regressão não Linear Regressão Logística Regressão de Poisson Outros modelos de regressão Classificação Classificação Indução por árvores de decisão Classificação bayeana Classificação por backpropagation Redes Neurais Artificiais Análise de vizinhança (k-nearest Neighbor) Casos baseados em Raciocínio Algoritmos genéticos Abordagem por conjunto fuzzy Algumas técnicas e algoritmos utilizados na mineração de dados A seguir serão expostas algumas técnicas e algoritmos que são utilizados na mineração de dados. Ferramenta de consulta e técnicas de estatística O primeiro passo na mineração de dados é realizar uma análise simples, preliminar, grosseira do conjunto de dados a ser minerado, através do uso de ferramentas de consulta. Por exemplo, aplicando as funções built-in da linguagem SQL de um banco de dados relacional é possível extrair informações significativas sobre a distribuição dos dados.

56 55 Conforme AZEVEDO et al. (2005), uso de funções estatísticas, como média aritmética, desvio padrão, valores máximos e mínimos e distribuição percentual de todo o conjunto de dados, bem como a geração de gráficos a partir dos dados, constituem passos iniciais importantes na mineração de dados. Visualização A técnica de visualização é muito útil para descobrir padrões em conjunto de dados. Não obstante possa parecer uma técnica não muito sofisticada, permite ter uma medida sobre a qualidade dos dados e de onde padrões podem ser encontrados. Na fase mais avançada de mineração de dados, é possível a utilização de gráficos tridimensionais de forma interativa (AZEVEDO et al., 2005). Análise de Vizinhança (K-nearest neighbor) Quando se interpreta dados como um ponto no espaço é necessário definir o conceito de vizinhança, o qual significa identificar um conjunto de registros que estão próximos, que são fechados por alguma característica dos dados (AZEVEDO et al., 2005). Constitui basicamente uma técnica de pesquisa e não de conhecimento e é utilizada na análise de prognósticos. Árvore de Decisão Uma árvore de decisão é um fluxograma (flow-chart) que tem a estrutura de uma árvore, onde cada nó interno representa uma decisão sobre um atributo que determina como os dados serão particionados pelos seus nós filhos. Cada ramo (subárvore) representa o resultado do teste e cada folha representa a distribuição dos registros. Quando utilizada em análise de prognóstico ou em classificação, sua aplicação é denominada por alguns autores de indução por árvore de decisão. Sua utilização recomenda o treinamento do método, utilizando várias amostras nos dados, até que se conheçam as melhores regras para segmentação dos dados (AZEVEDO et al., 2005). Regras de Associação Esta técnica consiste basicamente em encontrar conjunto de itens que ocorram simultaneamente e de forma frequente em um banco de dados (GOLDSCHMIDT et al.,

57 ). Ela permite expor características e tendências extraídas da base de dados, gerando redes de conexões presentes no conjunto de dados usando as associações item a item. Considera-se que a presença de um item impõe a existência de outro na mesma transação. O banco de dados é considerado como uma coleção de transações, cada um envolvendo um conjunto de itens. Na área de marketing é conhecido como análise de transações de compras (market basket analysis) (AZEVEDO et al., 2005). Redes neurais artificiais Em termos intuitivos redes neurais artificiais (RNAs) são modelos matemáticos inspirados nos princípios de funcionamento dos neurônios biológicos e na estrutura do cérebro (GOLDSCHMIDT et al., 2005). Esses modelos têm a capacidade de adquirir, armazenar e utilizar conhecimento experimental e buscam simular computacionalmente habilidades humanas tais como aprendizado, generalização, associação e abstração. Algoritmos Genéticos (AGs) Os Algoritmos Genéticos são modelos computacionais de busca e otimização inspirados na teoria da evolução de Charles Darwin e da reprodução genética. Enquanto os métodos de otimização e buscas convencionais trabalham, geralmente, de forma sequencial, avaliando a cada instante uma possível solução, os AGs trabalham com um conjunto de soluções simultaneamente. Modelados após o surgimento adaptativo de espécies biológicas a partir de mecanismos evolutivos os AGs vêm sendo aplicados com sucesso em campos diversificados como análise de imagem, escalonamentos e projetos de engenharia (AZEVEDO et al., 2005). Técnicas de análise de agrupamento (clustering) A técnica de Clusterização, também chamada de agrupamento é usada para particionar os registros de uma base de dados em subconjunto ou clusters, de tal forma que os elementos em um cluster compartilhem um conjunto de propriedades comuns que os diferenciem dos elementos de outros clusters. O objetivo é ordenar casos (ex. pessoas, coisas e eventos) em grupos ou clusters de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre os membros de clusters diferentes (TURBAN, et al., 2009).

58 Abordagem de mineração de dados A abordagem de mineração de dados ou metodologias de aplicação descreve como o usuário irá conduzir o processo da mineração na obtenção de suas funcionalidades. Essencialmente existem as abordagens top-down e bottom-up, e uma terceira que é a combinação destas abordagens. Na abordagem top-down o usuário parte do princípio de que existe uma hipótese ou uma ideia preconcebida que deseja confirmá-la ou rejeitá-la. Em relação à abordagem bottom-up, também chamada de busca do conhecimento, o usuário inicia o processo de exploração de dados na tentativa de descobrir alguma coisa que ainda não é conhecimento. Na aplicação de uma dessas abordagens o usuário decidirá se usará a abordagem para busca do conhecimento na forma direta ou indireta. Busca do conhecimento direta Na busca de conhecimento na forma direta ou supervisionada sua meta é orientada. Os passos a serem seguidos são os seguintes: identificar a fonte de dados selecionados para mineração; preparar os dados para análise; construir e treinar o modelo computacional; avaliar o modelo computacional. Busca do conhecimento indireta Na busca de conhecimento na forma indireta ou não supervisionada não existe uma meta bem definida. As ferramentas são mais livres na sua aplicação sobre os dados e espera-se descobrir uma estrutura significativa sobre os dados. São adotados os seguintes passos: identificar a fonte de dados; preparar os dados para análise; construir e treinar o modelo computacional; avaliar o modelo computacional; aplicar o modelo computacional no novo conjunto de dados; identificar potenciais objetivos para busca de conhecimento direta;

59 58 gerar novas hipóteses para teste Business Performance Management BPM Segundo TURBAN et al. (2009), business performance management é o componente final do processo de BI. Este componente baseia-se na metodologia balanced scorecard que trata de uma estrutura para definir, implementar e gerenciar a estratégia de negócios de uma empresa conectando aos seus objetivos factuais. O BPM usa a análise e a geração de relatórios e as consultas do BI. Seu objetivo é otimizar o desempenho geral de uma organização. De acordo com o referido autor, o BPM é o que define como sendo um conjunto de softwares, processos de negócios e medidas de sucesso dos negócios (métricas e KPI s key performance indicators) que, quando combinados, permitem a organização, agir e influenciar na performance de seus negócios. O BPM realiza avaliação de desempenho real do negócio de modo que seja possível compreender onde e quando o negócio está em risco, assim como evitar situações potenciais de risco. Consoante DUTRA (2002), um projeto de implementação de solução de BPM leva em conta a existência de um ambiente de Business Intelligence. Não obstante, a análise das informações pertinentes ao passado seja relevante é a capacidade de prever situações futuras que o justifica. No entanto, as previsões futuras devem considerar as movimentações históricas, sazonalidades, fatos externos, etc. Pode-se afirmar que quanto melhor o modelo de Data Warehouse ou dos Data Marts disponíveis, tanto melhor serão também os resultados das aplicações de planos orçamentários, forecasts e simulações. O BPM inclui um conjunto de processo de ciclo fechado que liga a estratégia à execução a fim de otimizar o desempenho dos negócios. Os principais processos são: definir estratégias, planejar, monitorar, agir ou ajustar. Para otimizar o desempenho dos negócios é necessário que as empresas tenham sistema de medida de desempenho, que auxilie os gerentes a rastrear a implementação das estratégicas de negócios comparando os resultados reais com as estratégias e

60 59 objetivos. O sistema de medida de desempenho engloba métodos sistemáticos de união das metas de negócios com relatórios de retorno periódico que indicam o progresso em relação às metas (SIMONS, 2002). De acordo com TURBAN et al. (2009), existe muito mais em relação à medida de desempenho do que simplesmente manter o escore. Um sistema de medida de desempenho efetivo deveria ajudar a fazer o seguinte: alinhar objetivos de nível superior com iniciativas básicas; identificar oportunidades e problemas em tempo; determinar prioridade e alocar recursos com base nas prioridades; mudar medidas quando os processos e estratégicas mudam; delinear responsabilidades, entender o desempenho real relativo às responsabilidades, e recompensar e reconhecer as realizações; agir para melhorar os processos e procedimentos quando os dados os autorizam; planejar e prever de forma mais confiável e oportuna. Para atender estes pressupostos é necessária uma estrutura de medida de desempenho holística. Nos últimos 40 anos muitos sistemas foram propostos, alguns deles com foco no financeiro, enquanto outros centrados nos processos, como o gerenciamento da qualidade total (TQM) Balanced Scorecard - BSC Um dos mais conhecidos e utilizados sistema de gerenciamento é o Balanced Scorecard BSC. O BSC foi concebido, originalmente, segundo os seus autores, como ferramenta de gestão de mensuração balanceada, apoiada em medida financeira e não-financeira, que traduzia a missão e a estratégia de uma unidade de negócio em objetivos e medidas tangíveis. Sua proposta original visava superar as limitações da gestão baseada apenas em indicadores financeiros. A sua mensuração incorporava novos indicadores que comunicam vetores de desempenho futuro, sob a forma de criação de valor mediante investimentos em clientes, fornecedores, empregados, tecnologia e inovação.

61 60 A experiência da aplicação do BSC, com sucesso, em organizações públicas e privadas, mostrou que ele é mais do que um sistema de gestão de mensuração e sim de gestão estratégica, pois além de manter o interesse no desempenho financeiro, revela com clareza os vetores de desempenho superior e de longo prazo em termos competitivos e de criação de valor. Nesta nova abordagem, busca-se converter a estratégia em processo contínuo a ser executado, não somente pela Alta Administração, mas também por toda a organização (PEIXINHO, 2002). De acordo com KAPLAN et al. (2001), nas suas pesquisas sobre empresas bemsucedidas do balanced scorcard revelaram um padrão consistente na consecução do foco e alinhamento estratégico. Foi observada a atuação de cinco princípios comuns, chamados de princípios da organização focalizada na estratégia: Principio 1. - Traduzir as estratégias em Termos Operacionais o BSC fornece sistema referencial para descrever e comunicar a estratégia de maneira coerente e criativa para toda a organização denominado Mapa Estratégico. Princípio 2 Alinhar a Organização à Estratégia - trata-se de um princípio fundamental para garantir o alinhamento de todos ao foco estratégico. Este princípio busca promover o alinhamento entre o scorecard corporativo e os scorecards das unidades de negócios e de serviços de apoio. Princípio 3 Transformar a Estratégia em Tarefa de Todos. Este princípio estabelece, para as organizações orientadas para a estratégia, a necessidade de que todos os empregados compreendam a estratégia e conduzam as suas tarefas cotidianas de modo a contribuir para o seu êxito. Princípio 4 Converter a Estratégia em Processo Contínuo. As empresas que adotam o BSC implementam de forma integrada, num único processo, o gerenciamento estratégico e o gerenciamento tácito (orçamentos financeiros e avaliações mensais) de forma ininterrupta e contínua. Este processo envolve as seguintes etapas vinculadas à estratégia: orçamentação, sistema de informações (feedback) e reuniões.

62 61 Principio 5 Mobilizar a Mudança por meio da Liderança Executiva. Este princípio propõe, através de Liderança Executiva concentrar inicialmente o foco na mobilização das pessoas e, em seguida, no processo de governança para se concluir com a implementação de novo sistema gerencial. O BSC é planejado para superar as limitações de sistemas que têm foco financeiro. Ele faz isso traduzindo a visão e estratégia de uma empresa em objetivos financeiros e não financeiros, medidas, metas e iniciativas. Para alinhar as estratégias e as ações, o BSC utiliza o Mapa Estratégico que é arquitetura genérica para descrever a estratégia. A lógica de causa e efeito do referencial constitui a hipótese da estratégia (KAPLAN et al., 2001) Arquitetura do BPM O termo arquitetura de sistema refere-se aos projetos lógicos e físicos de um sistema. O projeto lógico detalha os elementos funcionais e suas interações enquanto o projeto fisico especifica como o projeto lógico vai ser implementado e implantado. O BPM, segundo TURBAN et al. (2009), envolve a integração de componentes individuais, que devem ser integrados para contribuir para a implementação bemsucedida da estratégia. Estes componentes, exemplificado são os seguintes: camada de banco de dados - camada que contém a definição da organização, que abrange seu passado, presente e futuro e é expressa em termos de estrutura e regras de negócios; ela também contém informações e vínculos a informações, na forma de planos e resultados; camada de aplicações - esta camada alimenta os processos BPM transformando a interação do usuário e os dados fontes em orçamentos, planos, previsões, relatórios e análises; camada de cliente ou interface de usuário - camada utilizada para dirigir e regular a implementação da estratégia por meio de comunicação, colaboração e orientação com o usuário.

63 62 Na arquitetura de BPM a camada de banco de dados proporcionam os metadados, bem como os dados sobre os quais se apóiam as aplicações BPM. Esta camada também armazena documentos estratégicos, planos táticos, dentre outos. A camada acomoda uma variedade de aplicações, que envolvem um ciclo fechado, desde o planejamento estratégico a planejamento operacional, orçamento, monitoramento, ajustes e ação. A interface com usuário é a ponte que liga o BPM ao usuário final. A interface é função da aplicação específica que está sendo acessada, bem como do papel dos usuários, seus objetivos e expectativas. Nos últimos anos o navegador Web tornou-se a ferramenta principal de acesso às informações em um sistema BPM Dashboards e Scorecards Segundo TURBAN et al. (2009), os scorecards e dashboard são componentes comuns, de grande parte dos sistemas de gerenciamento, sistema de medição de desempenho e suítes de BPM. Tanto um quanto o outro proporcionam exibições visuais de informações importantes, consolidadas e organizadas em uma tela única para serem absorvidas e exploradas facilmente. Eles fornecem informações imediatas sobre o desempenho dos negócios em toda a empresa. Ainda que scorecards e dashboards tenham muitos pontos em comum existem diferenças entre os dois. A mais importante delas é que os dashboards de desempenho são apresentações visuais para monitorar o desempenho operacional, enquanto os scorecards de desempenho são exibições visuais voltadas para mapear o progresso com relação às metas estratégicas e táticas. O autor acima citado afirma que os scorecards e dashborards bem planejados possuem as seguintes características: usam componentes visuais (p.ex., gráficos, barras de desempenho, indicadores, medidores, semáforos) para destacar de forma imediata os dados e exceções que exigem ação; são transparentes aos usuários; ou seja, apresentam facilidades e uso com pouco treinamento;

64 63 combinam dados de diversos sistemas para formar um visão do negócio única, resumida e unificada; possibilitam a realização de drill down (ou navegar através) em fonte de dados ou relatórios; apresentam uma visualização dinâmica e prática com atualização pontual dos dados. exigem poucos ou nenhum código customizados para implantar e manter Trabalhos Relacionados Vale ressaltar que não foi encontrado nenhum trabalho no nível de abordagem do tema Sistema de Apoio à Decisão, baseado em BI, aplicado aos recursos hídricos subterrâneos. Na literatura existem pesquisas e trabalhos específicos utilizando separadamente os componentes do BI (data warehouse, data mining e ferramentas OLAP), merecendo destacar, todavia, a dissertação que trata da Mineração de Dados em Data Warehouse para Sistema de Abastecimento (GOUVEIA, 2009). Este trabalho apresenta uma proposta de utilizar a tecnologia de banco de dados com a finalidade de oferecer apoio à decisão para os gestores do setor de saneamento. Envolvem as tarefas de sintetizar e organizar num Data Warehouse os dados do setor de saneamento e aplicar tecnologias OLAP e algoritmos de Mineração de Dados para obtenção de resultados que proporcionem aos gestores um melhor entendimento dos processos e torne mais eficaz à tomada de decisão. O levantamento feito internacionalmente, tanto na ambiência institucional como de pesquisa em recursos hídricos mostrou que a maioria dos sistemas de informações em recursos hídricos não utiliza de forma integrada os componentes que compõem o BI. Normalmente, é adotado o sistema de apoio à decisão voltado para modelagem de bacias hidrográficas e simulação de cenários que visam responder questões relacionadas à disponibilidade e uso dos recursos hídricos. A seguir são apresentadas algumas experiências: Continente Europeu Projeto de Pesquisa (BELO, et. al., 2000) - compreende o desenvolvimento de um sistema de informação para a análise e validação de

65 64 qualidade das águas na região de Alqueva, em Portugal. A plataforma do sistema pressupõe uma abordagem multidisciplinar, incluindo a participação de técnicos responsáveis pela gestão da água, especialistas de modelagem hidrológica, de qualidade da água, de gestão de base de dados e processamento analítico. Em termos básicos, envolve o monitoramento, diagnóstico e emissão de relatórios. O sistema, também, permite definir cenários na gestão das águas. Sua estrutura é constituída de 03 (três) subsistemas: sistema de informação; de modelação e análise. Projeto de Pesquisa um Sistema de Data Warehousing para à Área da Qualidade da Água Este trabalho foi centrado na criação de um sistema de data warehousing para qualidade de água para consumo urbano e para a prática balnear. Posteriormente foi feito um estudo acerca da previsão da qualidade da água nestas duas situações, para os anos seguintes, através de técnicas de mineração de dados. As áreas de estudo escolhidas foram a barragem de Crestuma-Lever e a praia fluvial Olho D água, em Portugal, respectivamente. (FERNANDES, et. al., 2001). Continente Americano Projeto Institucional United State Geological Survey USGS dispõe de um Sistema Nacional de Informações sobre Águas (USGS National Information System), o qual contém dados sobre recursos hídricos para a nação, de acesso público. Em relação a águas subterrâneas, o USGS tem cerca de registros de poços, com informações de coordenadas geográficas, dados descritivos de poços, profundidade e tipo de aquífero. Uma rede de monitoramento de poços é mantida fornecendo dados on line acerca de nível d água, gerando relatórios analíticos. A título de ilustração, segue o gráfico da Figura 8, que apresenta um relatório do sistema via Web.

66 65 Figura 8: Gráfico de Nível D água de um Poço Além disso, o USGS dispõe de Data Warehouse para avaliação nacional da qualidade da água. Este trabalho começou em 1991 com a coleta sistemática de dados físicos, químicos e biológicos de qualidade de água de 42 unidades de estudos (bacias). O Data Warehouse contêm os seguintes dados: concentração química da água; variáveis descritivas da unidade de estudo fluxo diário dos locais de amostragem amostras de nutrientes, sedimentos e organismos aquáticos A maioria destes dados é originário do Sistema Nacional de Informações de Qualidade de Água, do USGS. Continente Asiático No continente asiático, tomando como referência a experiência da Índia, constata-se a existência de um sistema de apoio à decisão aplicado a recursos hídricos. É uma ferramenta usada para planejamento e gestão dos recursos hídricos. O sistema é personalizado e definido para cada agência gestora de água. O sistema se apoia em base

67 66 de dados e modelos matemáticos. Sua saída são relatórios simples no padrão MSprodutos (EXCEL e WORD) ou HTML para publicação na WEB. Este sistema tem por objetivo atender ao desenvolvimento integrado dos recursos hídricos abordando cinco componentes de planejamento e gestão da água: Planejamento de águas superficiais e subterrâneas Operação integrada de reservatórios Monitoramento, avaliação e gestão das secas; Gestão da qualidade de água de superfície e subterrânea Em relação a sua funcionalidade o sistema contempla: Gerenciamento das séries espaciais e temporais; Gestão de cenários para definir e executar simulações do modelo que permitem análise e processamento dos resultados. Análise de custo-benefício mediante método de multicritério; Análise e processamento dos resultados. Destaca-se como ferramentas usadas pelo sistema o seguinte: MB MIKE BASIN TA Temporal Analyst M11 MIKE 11 MS MIKESHE

68 67 Capítulo 3 Modelo Conceitual de Sistema de Apoio à Decisão aplicado aos Recursos Hídricos Subterrâneos Este capítulo descreve a metodologia para construção do modelo conceitual de um Sistema de Apoio à Decisão, baseado em Business Intelligence BI, envolvendo a descrição do sistema operacional (SIAGAS/RIMAS), do Data Warehouse, da Análise do Negócio e da Monitoria e Avaliação de Desempenho. 3.1 Descrição Geral Na concepção do modelo conceitual do SAD, baseado em Business Intelligence (BI) aplicado aos recursos hídricos subterrâneos, levou-se em conta os seguintes aspectos relacionados às Políticas de Recursos Hídricos: as águas subterrâneas são de domínio dos Estados da Federação, que tem legislação própria sobre recursos hídricos e dispõe de sistemas de informação e base de dados específicos, que ainda não se integram com o Sistema de Informações de Águas Subterrâneas - SIAGAS; o SIAGAS é recomendado pelo Conselho Nacional de Recursos Hídricos CNRH, através da Moção n o 018, como instrumento a ser adotado na gestão dos recursos hídricos subterrâneos, devido ao fato de gerenciar uma base de dados nacional de águas subterrâneas e por adotar um modelo e dicionário de dados padronizados; a necessidade de se dispor de uma base de dados confiável e representativa oriunda de diversas fontes de dados, devidamente integrada e consistida, proporcionando a existência de um sistema de apoio à decisão em recursos hídricos voltado para a gestão estratégica desta área de conhecimento. Um Sistema de Apoio à Decisão (SAD), integrado ao Business Intelligence consiste num ambiente projetado para apoiar, contribuir e influenciar na tomada de decisão nos níveis operacional, tático e estratégico. Conforme ilustra a figura 9, o SAD projetado nesta pesquisa é constituído pelos seguintes componentes:

69 68 a) Base de Dados Operacionais a.1 Base de Dados Operacional (SIAGAS/RIMAS) a.2 Base de Dados Referencial ( Operacional Data Store ODS) b) Data Warehouse Departamental c) Ferramenta de Apoio a Decisão (Análise e Visualização da Informação) c.1 Ferramentas OLAP c.2 Data Mining d) Gestão Estratégica do Negócio d.1 Business Performance Management BPM Figura 9 Modelo Conceitual do SAD Aplicado a Recursos Hídricos Subterrâneos Fonte: Adaptação de (FERNANDES, 2010). A solução de governança para sistemas não integrados é organizar a maneira como a informação é armazenada, disponibilizada e acessada. Este cenário favorece ao desenvolvimento de Data Warehouse que é um ambiente propício para integrar dados espalhados em diversas fontes por um formato único e específico para consultas. Sob determinadas condições, às vezes, torna-se necessária a existência de um Data Store Operacional (ODS), ou seja, um banco de dados intermediário, entre o banco de dados operacional e o data warehouse. Ao contrário dos conteúdos estáticos de um data warehouse, os conteúdos do ODS são atualizados durante o curso das

70 69 operações. Ele consolida dados de diversos sistemas-fonte e dá uma visão integrada e quase em tempo real de dados voláteis e correntes (TURBAN et al., 2009). Segundo GOUVEIA (2009), a coleção de dados inter-relacionados é formada por informações internas e externas à organização e por dados históricos. No ambiente de apoio à decisão o papel do SGBD é permitir que os usuários definam, construam e manipulem o banco de dados com dados integrados e compartilhados. O SGBD pode representar a unificação de diversos arquivos, que, de outra maneira, seriam distintos, eliminando-se total ou parcialmente as redundâncias. O SIAGAS é um sistema operacional que tem a capacidade de receber dados de diversas fontes e armazená-lo num formato único e específico para consulta. Todavia estas fontes de dados por vezes são incompletas, inconsistentes e não padronizadas. Esta condição permite considerar no modelo proposto de sistema de apoio à decisão deste trabalho um Data Store ou Base de Dados Referencial, a qual representará uma base operacional com um subconjunto de dados mais qualificado, bem como servirá de área de preparação para o Data Warehouse Departamental. Quando se deseja extrair informações de uma determinada área da empresa sugere-se implementar o Data Warehouse Departamental ao invés do Data Warehouse Corporativo. Em vista disso, na concepção do SAD para águas subterrâneas adotou-se com referência o Data Warehouse Departamental. As Ferramentas de Apoio à Decisão, no contexto deste trabalho, são softwares que manipulam os dados extraídos do Data Warehouse através de estrutura de cubos de dados, de funções de agregação, estatísticas ou de funções gráficas. Elas auxiliam na simulação dos dados, proporcionando a descoberta do conhecimento. 3.2 Modelo de Negócio Modelo de Proposta de Valor O Brasil ao instituir, em 08 de janeiro de 1997, a lei relativa à Política Nacional de Recursos Hídricos - PNRH, que organiza o setor de planejamento e gestão dos recursos hídricos, estabeleceu um novo marco institucional, para a gestão da água, inspirada no modelo francês, que pressupõe uma gestão descentralizada, participativa e

71 70 democrática, envolvendo os múltiplos usos e suas diversas formas de compartilhamento. Os países que avançaram na gestão integrada dos recursos hídricos adotaram os seguintes princípios básicos: a adoção da bacia hidrográfica como unidade de planejamento; uso múltiplo das águas; o reconhecimento da água como um bem finito e vulnerável; o reconhecimento do valor econômico da água, indutor do seu uso racional; gestão descentralizada e participativa, ou seja, o que pode ser decidido em níveis hierárquicos mais baixos do governo não pode ser resolvido por nível mais altos da hierarquia. Em relação à lei acima citada foram definidos cinco instrumentos essenciais à gestão das águas, abaixo descritos: o Plano Nacional de Recursos Hídricos, que atualiza e consolida os planos diretores de recursos hídricos; a Outorga de Direito de Uso dos Recursos Hídricos, o qual o usuário recebe uma autorização, ou uma concessão, ou ainda uma permissão para fazer uso da água; a Cobrança pelo Uso da Água, essencial para criar as condições de equilíbrio entre a oferta e a demanda e harmonizar os interesses dos diversos usuários; o Enquadramento dos Corpos D água em Classes de Uso; o Sistema Nacional de Informações sobre Recursos Hídricos - SNIRH, encarregado de coletar, organizar, consistir e difundir a base de dados relativa aos recursos hídricos. O Brasil é um país federativo e, por conseguinte, os Estados e o Distrito Federal dispõem de políticas próprias em recursos hídricos, mas, na essência, os princípios e instrumentos de gestão das águas são semelhantes aos da política nacional. Em relação ao quinto instrumento acima mencionado, o Sistema Nacional de Informações sobre Recursos Hídricos (SNIRH), o mais aderente ao propósito desta dissertação, o que se pode dizer é que o Sistema de Informações de Águas Subterrâneas

72 71 SIAGAS, concebido em 1996, se incorporará ao SNIRH, ainda em desenvolvimento. Não obstante a maioria dos estados tenha legislação sobre recursos hídricos, ainda não dispõe de sistemas de informações sobre recursos hídricos, o que torna o SIAGAS, incrementado com componentes do BI, um ferramenta de apoio à decisão para águas subterrâneas, junto aos gestores e intervenientes em recursos hídricos, apresentando os seguintes fatores críticos de sucesso: gestão otimizada da informação recebida; integração dos resultados de diferentes áreas; eliminação da duplicação do trabalho; promoção de análises multi-disciplinares; intercâmbio de dados e informações entre os órgãos; articulação entre os diversos sistemas de informações. A utilização pelos usuários (planejadores, gestores, pesquisadores, etc) do sistema de apoio à decisão aplicado aos recursos hídricos subterrâneos, ancorado no SIAGAS, o qual adota modelo e dicionário de dados padronizados constitui num diferencial do Serviço Geológico do Brasil, em face de sua competência e por promover a unificação das bases de dados, facilitando o intercâmbio e integração entre sistemas, nos diversos níveis hierárquicos e por proporcionar maior eficiência, eficácia e efetividade na aplicação dos instrumentos que compõem à política nacional de recursos hídricos Modelo de Interface com o Usuário O Sistema de Apoio à Decisão preconizado manterá uma interface com o usuário, de forma transparente, seja na geração como no uso dos dados. A coleta dos dados será feita de forma descentralizada e assíncrona, se apoiando em acordos de cooperação técnica para promover o intercâmbio permanente de dados entre os principais fornecedores externos e o SGB. Por outro lado, a maioria das fontes externas utilizará ferramenta SIAGAS para transferência de dados, o que eliminará a necessidade de utilização de importadores de dados. Uma forma de alimentação de dados é por meio do programa de entrada de dados do sistema, disponível para download, bem como pela possibilidade de alimentação dos dados via web.

73 72 Em relação ao uso dos dados e informações, serão colocadas à disposição do usuário ferramentas de middleware as quais permitirão o acesso a base de dados pelos usuários avançados e permitirão escrever a sua própria consulta em SGL. Além disso outras facilidades funcionais estarão disponíveis como geração de relatórios customizados "ad hoc" e download da base de dados. Deverão ser elaborados programas de treinamento à distância para os usuários, visando à fidelização do uso do sistema. Os principais tópicos do treinamento são: a) metodologia de cadastramento de fontes por abastecimento de águas subterrâneas; b) implantação, operação e utilização do sistema de apoio à decisão aplicado às águas subterrâneas; c) metodologia para realização da outorga de direito de uso dos recursos hídricos subterrâneos Modelo de Operação O modelo de operação envolverá, de forma descentralizada e assíncrona, a execução dos processos de coleta, consistência e alimentação de dados, extraídos de diversas fontes, tais como: a) interna: dados da rede integrada de monitoramento das águas subterrâneas e de projetos específicos do SGB; b) externa: dados dos órgãos gestores e intervenientes em recursos hídricos e de usuários diversos. A alimentação dos dados, para banco de dados central será feita da seguinte forma: fontes internas: transferência, via WEB, para o banco central de dados; fontes externas: transferência, em meio digital ou Web, para unidades descentralizadas do SGB que, após consistidas, serão transferidas, via WEB, para o banco central de dados. Cabe observar que a consistência dos dados é uma questão que deve ser abordada segundo duas estratégias distintas de processamento. A primeira, e mais evidente, é que determinados atributos podem ser criticados e validados automaticamente pelo sistema, pois são facilmente caracterizados e determinados por regras perfeitamente definidas. O atributo de ph da água, por exemplo, é sabidamente um valor entre 0 e 14 (valor prático). Deste modo, um valor preenchido com 50 pode ser perfeitamente identificado pelo sistema, que exibirá um aviso de exceção. Um caso

74 73 análogo seria uma georeferenciação de um poço perfurado em uma coordenada geográfica localizada em um oceano, lago, ou rio. A segunda estratégia, por sua vez, está relacionada a critérios subjetivos, ou ainda, de modelagem computacional significativamente mais complexa. Os dados preenchidos por um operador tido como distraído devem ser analisados por um ser humano para poder identificar eventuais equívocos. Entretanto, como caracterizar que o operador foi displicente? Além disso, seja um poço que tradicionalmente tem uma profundidade de 20m, mas que em um determinado momento é atualizado para 2m. Houve de fato uma variação significativa, ou foi simplesmente um erro de digitação? A intervenção humana tende a ser a resposta mais adequada para ambos os casos, ao menos no presente momento de maturidade do sistema. Os dados armazenados na base central serão transferidos para um Data Store Operacional e, em seguida, realizada a extração dos dados para um Data Mart Departamental, com vista a sua disponibilização (Navegadores Web, Portais Corporativos e Outras Ferramentas). A figura 10 ilustra o modelo de negócio para o Sistema de Apoio à Decisão Aplicado aos Recursos Hídricos Subterrâneos. Figura 10 - Modelo de Negócio do SAD Aplicado aos Recursos Hídricos Subterrâneos

75 Modelo Estratégico Segundo CHIAVENATO et al. (2003), o processo de planejamento estratégico é constituído dos seguintes elementos: Declaração de missão Visão de negócios Diagnóstico estratégico externo Diagnóstico estratégico interno Fatores críticos de sucesso Sistema de planejamento estratégico Definição de objetivos Análise dos grupos de influência Formalização do plano Auditoria de desempenho e resultados. O processo de planejamento estratégico, analisado sob a ótica do Sistema de Apoio à Decisão aplicado aos recursos hídricos subterrâneos, apresenta-se da seguinte forma: Declaração de Missão gerar e difundir o conhecimento hidrológico e geológico para o desenvolvimento sustentável do país, através do uso, entre as diversas formas, de Sistema de Apoio à Decisão. Visão do Negócio tornar o Sistema de Apoio à Decisão aplicado aos recursos hídricos subterrâneos reconhecido nacional e internacionalmente como a ferramenta de suporte à gestão dos recursos hídricos subterrâneos. Diagnóstico Estratégico Externo: a necessidade de implementar os instrumentos das políticas de recursos hídricos, nos níveis federal e estaduais, em especial os sistemas de informações sobre recursos hídricos, constituem uma oportunidade para dotar todos os órgãos gestores de ferramenta adequada para a implementação dos instrumentos de gestão. Diagnóstico estratégico interno - a elevada capilaridade operacional da empresa, tendo unidades executivas na maioria das unidades da federação; o modelo e dicionário de dados padronizados, facilitando o intercâmbio de informações; a utilização de equipes técnicas especialmente treinadas na

76 75 consistência, alimentação e produção de conhecimento no âmbito da hidrogeologia são competências essenciais que a credenciam na liderança deste sistema; Fatores Críticos de Sucesso - para consecução da missão destacam-se como fatores críticos de sucesso: a) formalizar parcerias com os órgãos gestores e intervenientes em recursos hídricos; b) aperfeiçoar e modernizar o sistema de informações de águas subterrâneas e agregar valor ao mesmo introduzindo a filosofia de sistema de apoio à decisão baseado em BI; c) promover o enriquecimento da base de dados; Planejamento Estratégico a longo prazo pretende-se que todos os órgãos gestores em recursos hídricos (federal e estaduais) adotem o Sistema de Apoio à Decisão aplicado aos recursos hídricos subterrâneos. Internacionalmente o mesmo deve estar incorporado aos serviços geológicos dos países íbero-americanos; Plano de Ação a implementação das ações estratégicas dar-se-á buscando parcerias com os diversos órgãos intervenientes em recursos hídricos, visando o intercâmbio de dados, treinamento técnico, enriquecimento de dados e fornecimento de facilidades no âmbito do acesso e disponibilização de dados e informações; Avaliação de Desempenho e Resultados utilização do Sistema de Gerenciamento de Projetos, associada à metodologia Business Performance Management para medir os resultados alcançados Modelo Econômico O modelo econômico que dará apoio ao Sistema de Apoio à Decisão Aplicado aos Recursos Hídricos Subterrâneos estará sustentado nos seguintes mecanismos: Nacional a) recurso do Programa de Aceleração de Crescimento - PAC para execução dos projetos: coleta, consistência e alimentação e difusão de informações hidrogeológicas; aperfeiçoamento e modernização do sistema; e cadastramento de fontes de abastecimento por águas subterrâneas; enriquecimento da base de dados;

77 76 b) acordos de cooperação técnica com os órgãos gestores e intervenientes em recursos hídricos visando o intercâmbio de dados para o sistema; c) fortalecimento financeiro e institucional dos órgãos gestores de recursos hídricos; Internacional a) acordos de cooperação técnicas com os serviços geológicos dos países iberoamericanos; b) desenvolvimento de projeto multinacional de avaliação das águas subterrâneas dos países ibero-americanos. 3.3 Descrição do Sistema Operacional SIAGAS/RIMAS Sistema de Informações de Águas Subterrâneas - SIAGAS A Companhia de Pesquisas de Recursos Minerais O Serviço Geológico do Brasil objeto deste trabalho tem a missão de gerar e difundir conhecimento hidrológico e geológico para o desenvolvimento sustentável do país. Foi dentro desta linha de atuação que, em 1997, o SGB desenvolveu o Sistema de Informações de Águas Subterrâneas - SIAGAS, com o objetivo de coletar, consistir, armazenar e disponibilizar dados e informações hidrogeológicas. Inicialmente, o SIAGAS visou dar suporte à elaboração de mapas hidrogeológicos inseridos no Programa Levantamentos Geológicos Básicos da CPRM e, posteriormente, ampliou o espectro de atuação para atender as demandas dos diversos tipos de usuários incluindo aqueles relacionados com as políticas de recursos hídricos. Como consequência o Conselho Nacional de Recursos Hídricos CNRH, emitiu a moção n o 38 recomendando a adoção do SIAGAS na gestão dos recursos hídricos. Uma das preocupações prioritárias foi de fornecer aos gerentes e tomadores de decisão informações cada vez mais qualificadas e relevantes. Daí que a filosofia adotada foi de construir um banco de dados relacional, estruturado em um modelo e dicionário de dados padrão, com uma gama ampla de atributos, de modo a permitir maior

78 77 flexibilidade, racionalização e intercâmbio com outras bases de dados e com outros sistemas. Outra finalidade do sistema era permitir o fácil acesso à informação pela Internet, por parte das entidades públicas e privadas. Para compor o seu acervo de dados foram originalmente coletadas fichas, relatórios e dados de poços fornecidos por diversas instituições públicas e privadas, as quais passaram a integrar uma rede interinstitucional para intercâmbio de dados hidrogeológicos viabilizada através de Acordos de Cooperação Técnica. Em 2002 foram feitas melhorias no seu modelo de dados, bem como incorporada nova funcionalidade ao sistema através do aplicativo de análise e interpretação de dados hidrogeológicos. Atualmente, o SIAGAS é um sistema de informações operacional que fornece suporte a pesquisa, estudos e gestão das águas subterrâneas. A sua arquitetura é de cliente-servidor e se apoia no SGBD SQL Server, permitindo o controle rigoroso das permissões de acesso, carregamento e alteração dos dados. Ele incorpora na sua estrutura ferramentas gráficas, para consistência de dados; sistema de informações geográficas e rotinas de importação e exportação de dados em diversos formatos. Os recursos apresentados pelo programa de entrada de dados poderão estimular a padronização e a integração interinstitucional, facilitando a constituição de uma base de dados nacional. O programa de consulta na Web oferece facilidades de pesquisas hierarquizadas, tanto pontuais como espaciais, permitindo aos usuários, utilizá-lo numa ampla gama de aplicações e, opcionalmente, aos usuários da área de pesquisa, planejamento e gestão, contar via parceria ou aquisição no mercado, com poderosa ferramenta de interpretação de dados. O modelo de dados é relacional e contempla 59 (cinquenta e nove) tabelas dispostas no formato Esquema Estrela, idealizado por Ralph Kimball, conforme figura 11.

79 78 Figura 11 Modelo de Dados do SIAGAS O dicionário de dados é padronizado e está descrito na Tabela 5. O SIAGAS é constituído por 03 (três) módulos: Módulo de Entrada de Dados - possui funções de atualização de dados de poços (inclusão, exclusão e alteração), de consistência dados e de geração de relatórios simplificados. Este software é de uso público e irrestrito. Na figura 12 é apresentada uma tela de entrada de dados, a qual contempla funcionalidades relacionadas com a captura de imagem e de fotos e visualização do estado dos atributos ( existente ou não) na base de dados.

80 79 Figura 12 Módulo de Entrada de Dados Módulo de Consulta na Web - permite realizar pesquisas simples e complexas na base de dados de poços, utilizando ferramentas SIG para realizar cruzamento de informações em mapas e tabelas, bem como realizar a exportação dos dados, num limite fixado, em diversos formatos. As figuras 13 e 14, a seguir, ilustram este tipo de pesquisa.

81 80 Figura 13 Módulo consulta na Web - cruzamento de informação espacial e tabular Figura 14 Módulo Consulta na Web - espacialização de dados

82 81 Módulo de Análise e Interpretação de Dados - possui funcionalidades de ambiente SIG, permitindo a análise e interpretação de dados hidrogeológicos e a geração de relatórios avançados. Este aplicativo é de uso restrito do SGB. A figura 15 apresenta um tipo de saída de dados. Figura 15 Módulo de Análise e Interpretação de Dados Relatórios A CPRM na condição de empresa pública Governo Federal vem adotando a política de uso de software livre. Neste sentido, o SIAGAS está migrando do ambiente proprietário para ambiente de multiplataforma, já tendo o Módulo II Análise e Interpretação de Dados ajustado para esta nova configuração. Os dados contidos na base de dados operacional de águas subterrâneas da CPRM são provenientes de fontes internas e externas. As fontes internas são dos projetos de cadastramento de fontes de abastecimento por águas subterrâneas e da Rede Integrada de Monitoramento de Águas Subterrâneas RIMAS, esta última recentemente implantada. As fontes externas são provenientes dos órgãos gestores e intervenientes em recursos hídricos e empresas perfuradoras de poços.

83 82 Neste contexto a referida base de dados apresenta três níveis de qualidade dos dados, em relação as falhas e inconsistências: Nível 1 dados armazenados com regular qualidade. As fontes destes dados são predominantemente de empresas privadas ou de órgãos gestores e intervenientes dos recursos hídricos, os quais ainda não implantaram de forma satisfatória mecanismo/instrumento de controle e/ou processo de outorga pelo direito de uso da água. Nível 2 - dados armazenados com boa qualidade. As fontes de dados são oriundas, principalmente, dos órgãos gestores e intervenientes em recursos hídricos que implantaram instrumentos de outorga pelo uso da água ou têm mecanismo de controle sobre a captação das águas subterrâneas. Nível 3 - dados armazenados com muito boa qualidade. Dados provenientes de projetos de pesquisas e da rede integrada de monitoramento de águas subterrâneas. Rede Integrada de Monitoramento de Águas Subterrâneas - RIMAS A Rede Integrada de Monitoramento de Águas Subterrâneas do Brasil RIMAS, a qual se integra o SIAGAS, iniciou sua implantação, pelo SGB, em 2009, e conta 182 estações monitoradas distribuídas nos principais aquíferos brasileiros, conforme a figura 16. O seu objetivo é ampliar o conhecimento hidrogeológico e acompanhar a variação espacial e temporal da qualidade e quantidade das águas subterrâneas para fins de gestão integrada dos recursos hídricos.

84 83 Figura 16 Rede RIMAS Mapa de Situação dos Aquíferos O critério de seleção dos aquíferos para compor a rede RIMAS foram os seguintes: aquíferos sedimentares; importância socioeconômica; aspectos de vulnerabilidade natural e risco; representatividade espacial do aquífero; existência de poços de monitoramento. A densidade dos poços da rede é variável e levou em conta o uso da água, o uso e ocupação do solo, a densidade demográfica e a extensão do aquífero. Além disso, considerou-se que a densidade deveria ser suficiente para obtenção dos valores representativos das condições hidrogeológicas, carga hidráulica, variação de níveis d água e alterações da qualidade. Além dos dados básicos relativos à engenharia do poço, hidrodinâmicos e hidroquímicos levantados quando da instalação do ponto de monitoramento, também são obtidos os seguintes parâmetros na rede de monitoramento: nível d água, na frequência diária; condutividade elétrica, na frequência trimestral;

85 84 análise físico-química completa, na frequência de 5 anos. Os equipamentos de medição utilizados são semiautomáticos, os quais armazenam os dados em data logger, para recolhimento trimestral pela equipe de campo. Os dados coletados no data logger serão submetidos a uma análise de consistência utilizando ferramentas estatísticas. Após este tratamento os dados são enviados para armazenamento na base central de dados. Desta forma os dados recolhidos pela rede RIMAS e que compõe a base de dados operacional de águas subterrâneas corresponde ao segmento da base de dados que apresentam melhores características para compor um Data Mart Operacional e Data Warehouse Departamental, componentes do modelo de sistema de apoio à decisão proposto neste trabalho. Os dados levantados na rede RIMAS tem uma estrutura de dados compatível com a do SIAGAS, necessitando, apenas, pequenos ajustes no modelo de dados. 3.4 Pré-processamento A base de dados operacional de águas subterrâneas contém cerca de poços cadastrados, de todo território nacional, como ilustra a figura 17. Os dados nela contidos são insumos essenciais para diversas aplicações em hidrologia, tais como: gestão dos recursos hídricos, avaliação das disponibilidades hídricas, através dos mapas hidrogeológicos, aumento de oferta da água, por meio da revitalização dos poços profundos ou para o controle da contaminação dos aquíferos, entre outros.

86 85 Figura 17 Mapa de distribuição dos poços cadastrados na base de dados Os dados que compõem a base de dados podem ser agrupados nas seguintes classes: dados gerais; formação geológica; dados hidrodinâmicos; dados hidroquímicos. Estas classes de dados guardam diferenciados níveis de importância em relação aos tipos de aplicação. A gestão de recursos hídricos tem necessidades de dados, com igual nível de importância de todas as classes, enquanto o controle da contaminação dos aquíferos demanda dados, com maior relevância, da classe de dados hidroquímicos. Para traçar uma política de aumento de oferta de água, através da revitalização de poços, em região com elevado stress hídrico, como o semiárido brasileiro, dispor de dados hidrodinâmicos e hidroquímicos são essenciais para o adequado aproveitamento da água. A produção de mapas hidrogeológicos, como os outros tipos de aplicações, necessita de dados de todas as classes, porém dispor de dados da classe formação geológica (perfil litológico e construtivo) é essencial para a qualidade do mapa

87 86 hidrogeológico produzido. Desta forma, quanto mais completos forem os dados do registro do poço maior a chance de ter dados qualificados, essencial para o sistema de suporte a decisão. Sob esta ótica, esta dissertação permitiu direcionar ações no sentido de aprimorar o conteúdo informativo da base de dados, a saber: coleta e armazenamento de dados da rede RIMAS, os mais completos e qualificados; coleta e armazenamento de dados, oriundos do órgãos estaduais gestores de recursos hídricos, que realizam a outorga do uso da água, que por requisito fornece dados de poços mais qualificados; levantamento de campo dos poços escolhidos na base de dados, mediante critério de negócio pré-estabelecido. Historicamente, o controle e gerenciamento deficiente das águas subterrâneas resultaram na formação de uma base de dados que apresenta falhas e inconsistências. O presente trabalho tornou evidentes estas características e permitiu adotar medidas com o objetivo de minimizar seu impacto na operação do Sistema de Apoio à Decisão. Neste sentido, além das ações acima apresentadas estão sendo formalizados acordos de cooperação técnica com os órgãos gestores e intervenientes para uso do SIAGAS e intercâmbio de dados. Os dados que compõe a base de dados são oriundos de fontes internas e externas. As fontes internas são dos projetos desenvolvidos pela CPRM ou da Rede Integrada de Monitoramento de Águas Subterrâneas RIMAS, enquanto que as fontes externas são provenientes dos órgãos gestores e empresas públicas e privadas. O processo de alimentação da base de dados é feito mensalmente de forma descentralizada, pelas Unidades Regionais da CPRM. Previamente, os dados são consistidos e posteriormente remetidos para armazenamento na base de dados. O Módulo de Entrada de Dados do SIAGAS é ferramenta utilizada para consistir e remeter os dados para a base central de dados. Foi feito um diagnóstico na base de dados operacional de águas subterrâneas para identificar a quantidade de registro de dados existente por atributo e relacionar com as principais aplicações. O resultado encontra-se sintetizado na tabela, a seguir:

88 87 Tabela 4 Quadro geral de atributos relevantes cadastrados na base de dados QUADRO GERAL DE ATRIBUTOS CADASTRADOS NA BASE DE DADOS DE POÇOS ATRIBUTOS RELEVANTES % ATRIBUTOS Dados Gerais Código do Ponto 100% Coordenadas Geográficas 100% Municipio 100% Bacia 81% Localidade 88% Proprietário 100% % Médio Atributo Cadastrado 95% Dados Geológico e Litológicos Formação Geológica 50% Litologia 51% % Médio Atributo Cadastrado 51% Dados Hidrodinâmico Nível Estático 60% Nível Dinâmico 47% Vazão 53% % Médio Atributo Cadastrado 53% Dados Hidroquímicos ph 15% Condutividade Életrica 23% Sólidos Totais Dissolvidos 4% DBO 0% Cloretos 5% Ferro Total 5% Coliformes Fecais 2% % Médio Atributo Cadastrado 8% Fonte: SIAGAS -Base de Dados Operacional ATRIBUTOS RELEVANTES POR USO GESTÃO ESTUDO OFERTA CONTAMINAÇÃO X X X X X X X X X X Assim, interpretamos as características da tabela exposta: a classe de dados Dados Gerais é a que apresenta o melhor resultado, ou seja, 95 % dos atributos desta classe contem dados na base de dados; as classes de dados Dados Geológicos e Litológicos e Hidrodinâmicos têm, em média, 51% e 53%, respectivamente, de atributos com registros na base de dados; a classe de dados Hidroquímico tem somente, em média, 8% de registros cadastrado na base de dados; Esta constatação mostra a necessidade de uma ação mais efetiva de enriquecimento de dados e reforça a necessidade de criar uma base de dados referencial (Data Store Operacional), um dos componentes do sistema de apoio à decisão proposto neste trabalho.

89 Estrutura do Data Store Operacional Segundo LIMA (2010), o Data Store Operacional (ODS) é visto como uma arquitetura que é alimentada por programas de transformação e integração (i/t). A Figura 18 mostra o posicionamento clássico do ODS. Figura 18 Arquitetura de um Operacional Data Store (ODS) Fonte: LIMA (2010) Estes programas de transformação e integração podem ser os mesmos programas que alimentam um DW ou programas separados. O ODS, por sua vez, alimenta um DW. Alguns dados operacionais podem ir diretamente para o DW utilizando a camada de programas ETL, enquanto outros dados operacionais são enviados para o ODS e depois, do ODS, para Data Warehouse. De acordo com LIMA (2010), o ODS é integrado, orientado ao assunto, volátil e tem uma estrutura tipo current-valued (valores atuais), desenhada para atender aos usuários operacionais, em grandes processos de integração, permitindo um melhor desempenho. Por sua vez, o ODS atua num duplo papel - de um lado é operacional, pois permite um alto tempo de resposta e uma alta disponibilidade, estando qualificado para atuar como base de um sistema de missão crítica; por outro lado, o ODS tem,

90 89 claramente, característica de um SAD, pois é integrado, orientado a assunto e incorpora alguns importantes requisitos para o suporte a decisão. Já o desenho clássico e fundamental de um ambiente ODS começa com um modelo de dado que reflete as necessidades de informação da empresa. Tabelas normalizadas são definidas na modelagem dos dados e constituem o que se pode chamar de desenho lógico. Quando estas tabelas normalizadas são combinadas no desenho físico é chamado de normalização suave. Num desenho com a normalização leve as tabelas são combinadas com base nos conteúdos, como chaves comuns e uso geral comum LIMA (2010). O banco de dados de operacional administrado pelo SIAGAS segue uma modelagem dimensional segundo o esquema floco de neve. Este esquema é uma extensão do Esquema Estrela e consiste na decomposição de uma ou mais dimensões, formando hierarquia nas dimensões, isto é normalizando-as. É utilizado este esquema quando se tem dimensões grandes que são estáticas ou semiestáticas. O Data Store ou Base de Dados Referencial proposto para compor o SAD deste trabalho tem o mesmo tipo de modelagem do banco de dados operacional, porém, com um número reduzido de dimensões e atributos, somente considerando aqueles mais relevantes no contexto do negócio. 3.6 Data Warehouse Departamental De acordo com TURBAN et al. (2009), as organizações estão coletando dados, informações e conhecimento em níveis cada vez maiores e, manter e usar estes dados está se tornando cada vez mais complexo. Com o advento da Internet o número de usuários que acessam informações está crescendo cada vez mais. O trabalho com múltiplos bancos de dados vem se tornando uma tarefa muito difícil e que exige um grande conhecimento especializado. A CPRM é uma empresa pública que atua no campo da geração e difusão do conhecimento geocientífico, nas áreas de geologia, hidrologia e meio ambiente. A empresa manipula grande quantidade de dados que necessitam estar armazenados em

91 90 bancos de dados, de modo a permitir tomada de decisões estratégicas. Atualmente, estes dados estão organizados em bases de dados temáticas, sendo que uma dela refere-se à hidrogeologia, um importante segmento de serviço da instituição. Os dados hidrogeológicos são coletados interna e externamente, estes últimos, dos órgãos gestores e intervenientes em recursos hídricos. Estes dados, depois de efetuada sua depuração são armazenados numa base central e difundidos para o usuário final, através de sistema transacional/operacional (SIAGAS). O SAD proposto considera a necessidade de prover uma plataforma de dados históricos integrados a partir do qual se possa fazer análise para dar suporte às decisões estratégicas. O ambiente mais adequado para atender esta finalidade é o de um Data Warehouse. O motivo principal que leva a considerar no modelo conceitual do SAD aplicado aos recursos hídricos subterrâneos, o ambiente de Data Warehouse Departamental ou Data Mart ao invés de um ambiente de banco de dados tradicional, reside no fato dos ambientes de suporte à decisão e extração do conhecimento em bases de dados serem caracterizados pela não volatilidade e pela complexidade das consultas ad hoc. A escolha do Data Warehouse Departamental, ou seja, um Data Mart ao invés de Data Warehouse Corporativo decorreu do fato de se estar projetando um SAD para uma área específica de serviço da empresa. Em relação ao modelo de dados, é proposto adotar o modelo dimensional ao invés do modelo tradicional, denominado relacional por que o modelo dimensional atende melhor aos requisitos relacionados com maior facilidade em manipular funções de agregações, associações, classificações, entre outros aspectos, próprios do ambiente do sistema de apoio à decisão ao contrário do que ocorre com o modelo relacional cujo foco reside na definição de um modelo de transação eficiente GOUVEIA (2008). Vale considerar que a fonte principal de dados para o Data Store Operacional - ODS e Data Warehouse vem da base de dados operacional administrada pelo SIAGAS, cujo modelo de dados é normalizado e tem um dicionário de dados padronizado. Esta característica reduz a complexidade de estrutura do ODS ou Base de Dados Referencial,

92 91 bem como facilita a execução das etapas de processamento e transformação do processo KDD. 3.7 Análise de Negócios e Visualização de Dados Neste item será abordada a análise de negócios com suas respectivas características, bem como a visualização dos dados Análise do Negócio das Águas Subterrâneas Cada vez mais estão sendo necessários dados e informações detalhadas, precisas e oportunas para dar suporte à decisão e a implementação de estratégicas em recursos hídricos. A seguir são apresentadas as principais áreas que demandam dados e informações sobre recursos hídricos subterrâneos: Gestão dos Recursos Hídricos Os dados e informações de águas subterrâneas são insumos essenciais para a aplicação dos instrumentos de gestão dos recursos hídricos. O deficiente controle das águas subterrâneas, a carência de dados confiáveis e representativos e a falta de sistemas integrados de informações são os principais fatores que mais tem contribuído para aplicação deficiente do instrumento de outorga de direito do uso da água, cuja atribuição é dos órgãos estaduais em recursos hídricos. O modelo de sistema de apoio à decisão proposto neste trabalho considera o estabelecimento de mecanismo de integração entre o SIAGAS os sistemas de informações de recursos hídricos dos órgãos gestores e intervenientes em recursos hídricos. Estudos Hidrogeológicos A ampliação do conhecimento dos recursos hídricos subterrâneos nos principais aquíferos brasileiros envolve a elaboração de mapas hidrogeológicos, apoiado em sistema de informações geográficas (SIG). Os dados de poços são insumos essenciais na elaboração destes mapas. A insuficiência de dados e a ausência de sistema de informações geográficas integrado aos mapas são as principais deficiências do processo. No modelo conceitual de SAD aplicado aos recursos hídricos subterrâneos propõe-se

93 92 incorporar funcionalidades relacionadas à integração da base de dados aos mapas hidrogeológicos. Oferta de Água Ampliar a oferta de água, principalmente, nas regiões com elevado deficit hídrico, como o semiárido nordestino, através da revitalização de poços, tem sido a estratégia adotada pelo Governo. Para realizar este trabalho é fundamental dispor de sistema de apoio à decisão que, a partir de uma regra negócio estabelecida, escolha a melhor alternativa para recuperação dos poços. Atualmente este procedimento é feito em ambiente externo ao SIAGAS. No modelo conceitual proposto neste trabalho será considerada a análise de negócio acima exposta. Contaminação das Águas A contaminação das águas subterrâneas é pouco conhecida no Brasil em decorrência de falta de informações. A base de dados atual contempla um número muito pequeno de parâmetros hidroquímicos. O grande esforço deve ser concentrado no processo de enriquecimento dessa base de dados. No modelo de SAD considerado neste trabalho, destaca-se o uso da técnica de mineração de dados, principalmente, aplicada à avaliação da qualidade das águas subterrâneas. A partir da análise de negócio de águas subterrâneas o modelo conceitual do sistema de apoio à decisão aplicada à água subterrânea, deve considerar: ferramenta automática de extração, transformação e carga (ETL) dos dados provenientes de fontes externas para o banco de dados operacional administrado pelo SIAGAS; data store operational - ODS, derivado da base de dados operacional, o qual constitui a base de dados referencial; data warehouse departamental serve para organizar dados para o processamento analítico da informação; ferramentas para análise de negócios estruturado nos seguintes níveis: descoberta de informações e conhecimento, suporte decisão e visualização

94 Relatórios e Consulta para Visualização de Dados Segundo TURBAN et al. (2009), o termo processamento analítico online (OLAP) normalmente refere-se a uma gama de atividades realizada por usuários finais em sistema online. OLAP inclui atividades de geração e respostas de consultas, solicitação de relatórios e gráficos ad hoc e execução dos mesmos, realização de análises estatísticas tradicionais ou modernas e construção de apresentações visuais. Os produtos OLAP oferecem recursos de modelagem, análise e visualização de grandes quantidades de dados, ou para sistema de gerenciamento de dados (SGDB) ou para sistema de data warehouse. Eles oferecem uma visão conceitual multidimensional dos dados. Uma das características que devem estar presentes em ferramenta OLAP é a capacidade de efetuar operações como: drill Across: ocorre quando o usuário pula de nível intermediário dentro de uma mesma dimensão; por exemplo a dimensão tempo é composta por ano, semestre, trimestre, mês e dia. A operação drill Across é executada quando o usuário, estando na dimensão de ano, passa direto para trimestre ou mês, sem visitar a dimensão de semestre; drill Down: ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo a granularidade. drill Up: é o oposto do drill Down, ocorre quando o usuário aumenta a granularidade, diminuindo o nível de detalhamento da informação; drill Thought: ocorre quando o usuário passa de uma informação contida numa dimensão para outra. Por exemplo: Inicia na dimensão do tempo e no próximo passo analisa a informação por região; Slice e Dice: é uma das principais características de uma ferramenta OLAP. Como a ferramenta OLAP recupera microcubo (no OLAP as informações são armazenadas em cubos multidimensionais, que gravam valores quantitativos e medidas, permitindo a visualização através de diversos ângulos. Estas medidas são organizadas em categorias descritivas, chamadas de dimensões e formam, assim, a estrutura de cubo), surgiu a necessidade de criar um módulo, que se convencionou de Slice and Dice, para ficar

95 94 responsável por trabalhar esta informação. Ele serve para modificar a posição da informação, trocar linhas por colunas de maneira a facilitar a compreensão do usuário e girar o cubo sempre que houver necessidade. A ferramenta OLAP, que obedece a estrutura cliente/servidor multiusuário, pode ser implementada de diversas formas, classificadas nos seguintes tipos: OLAP multidimensional (MOLAP). Quando o OLAP é implementado através de um banco de dados (ou data store) multidimensional especializado, ele é chamado de OLAP multidimensional (MOLAP). Os dados são organizados em estrutura de cubos. Seu uso é mais adequado para consultas financeiras. Com o MOLAP as consultas são mais rápidas, pois a consolidação já foi realizada. OLAP relacional (ROLAP). Quando um banco de dados OLAP é implementado através de um banco de dados relacional existente, ele é chamado de OLAP relacional (ROLAP). As ferramentas OLAP relacional extraem dados de bancos de dados relacionais. Database OLAP e Web OLAP (DOLAP e Web OLAP). O database OLAP se refere a um sistema de gerenciamento de banco de dados relacional projetado para hospedar uma estrutura e executar cálculos OLAP. O Web OLAP se refere a dados de OLAP acessíveis de um navegador da Web. Desktop OLAP. O desktop OLAP envolve ferramentas OLAP simples e baratas que executam análise local multidimensional e apresentação de dados baixados de bancos de dados relacionais ou multidimensionais para máquinas do cliente. A Oracle e a Microsoft, grandes fornecedores de banco de dados, fornecem servidores OLAP juntamente com banco de dados relacionais tradicionais: OLAP option da Oracle e Analysis Services 2005 da Microsoft. Além disso, temos outras ferramentas OLAP, como Distributor Data Solutions da MicroStrategy e Analytics Maestro da Centage Corporation. O Analysis Services 2005 é uma tecnologia utilizada por trás do Analysis Services Ele vem com o conceito UDM (Unified Dimensional Model) Modelo Dimensional Unificado), o qual permite que DBAs (Database Administrator) e

96 95 desenvolvedores definam dimensões, cubos OLAP e hierarquias de forma abstrata que possam subsequentemente ser armazenados em bases de dados relacionais ou multidimensionais. O OLAP Option da Oracle é executado com um processo único, com única instância de banco de dados, sendo portável para todas as plataformas de servidor em que o banco de dados Oracle pode ser executado. O DSS MicroStrategy é classificada como uma ferramenta ROLAP por acessar um banco relacional via comandos SQL. A ferramenta OLAP Maestro, é fornecida e desenvolvida pela Hyper Consultoria em Informática. Ela suporta a metodologia de desenvolvimento de Data Warehouse. Esta medotologia tem a vantagem de ter resolvido o problema de conformidade entre conceitos e dimensões. O Maestro resolve este problema através do uso de um repositório central onde são definidas medidas e dimensões. A tecnologia OLAP permite ao usuário realizar cálculos complexos, através de consultas com maior flexibilidade e funcionalidade. As qualidades essenciais das ferramentas OLAP são a rapidez, a sumarização e análise flexível dos dados. 3.8 Business Performance Management (BPM) A empresa considerada neste trabalho é pública, fundada em 1969, que atua em todo território nacional, realizando pesquisa, estudos e levantamentos básicos em geologia e hidrologia. No âmbito de sua competência legal lhe cabe, entre outras atribuições, desenvolver sistemas de informações que resultem na produção de base de dados, relatórios, mapas e cartas temáticas que traduzam o conhecimento mineral e hidrológico nacional, tornando-os acessíveis aos interessados. Sua estrutura organizacional segue o modelo tradicional ou hierárquico, cuja autoridade e poder estão graduados por níveis de gerência estratégica (presidência e diretorias), gerência tática (departamentos e divisões) e gerência operacional (Unidades Regionais). Em condições especiais, esta estrutura passa a ser

97 96 multidimensional, integrando, a estrutura tradicional por funções com a estrutura por projeto. Os principais clientes estão assim distribuídos: Órgãos Federais (70%), Estaduais e Municipais (10%), Academia (10%) e Empresas Privadas (10%). Modelo de Gestão Estratégica Um pressuposto importante para o modelo de SAD proposto neste trabalho é que a empresa adote o Modelo de Gestão Estratégica MGE baseado no Balanced Scorecard BSC. A figura 19 apresenta o modelo lógico do MGE. Neste modelo o indicador de desempenho serve como elemento de integração e alinhamento estratégico entre os níveis operacional, tático e estratégico da empresa. A presente dissertação foi influenciada pelo referido modelo, que permitiu, a partir dos indicadores de desempenho corporativo e de cada unidade de negócio redirecionar a estratégia de captação dos dados de poços de diferentes fontes de alimentação.

98 97 Figura 19 - Modelo Lógico do MGE Objetivos Estratégicos Os objetivos estratégicos são os seguintes: Levantamento de Informações Básicas Sistemas de Apoio à Decisão Pesquisa e Estudos Interpretativos Metas Estratégicas As metas estratégicas para a área de águas subterrâneas, objeto do estudo deste trabalho, para o período , são as seguintes: Instalar e operar (mil) poços na rede integrada de monitoramento de águas subterrâneas; Promover o cadastramento de (cem mil) poços no banco de dados operacional de águas subterrâneas;

99 98 Promover a consistência de dados de (cem mil) poços no banco de dados operacional de águas subterrâneas Elaborar 20 (vinte) mapas hidrogeológicos, em ambiente SIG, nos níveis regional e estadual; Desenvolver 04 (quatro) estudos, aplicando as técnicas de mineração de dados, sobre águas subterrâneas. Desenvolver 04 (quatro) sistemas integrados de apoio à decisão, aplicados aos recursos hídricos subterrâneos; Implantar 01 (uma) rede integrada de gerenciamento de informações hidrogeológica. Indicadores de Desempenho Os indicadores de desempenho a serem adotados são os seguintes: Indicador de Desempenho Geral Informações levantadas Indicadores de Desempenho Específicos Poços monitorados Poços cadastrados Poços consistidos Mapas elaborados Sistemas produzidos Relatórios elaborados Estudos realizados

100 99 Capítulo 4 - SAD aplicado ao Estudo de Caso Este capítulo apresenta um protótipo do modelo conceitual de sistema de apoio à decisão aplicado as águas subterrâneas Rondônia Porto Velho 4.1 Critérios para Seleção de Projeto Piloto Considerando que a elaboração deste trabalho objetivou definir um modelo de sistema de apoio à decisão aplicado aos recursos hídricos subterrâneos e as condições de sua aplicabilidade e que ele é mais aderente ao ambiente das organizações públicas que atuam na geração de informações sobre recursos hídricos e implementação de seus instrumentos, optou-se por simular um protótipo do modelo levando em conta as seguintes condições de contorno: público alvo órgãos governamentais; natureza da empresa empresa pública; política de informação acesso público, irrestrito; política de Tecnologia de Informação uso de software livre. 4.2 Caracterização da Empresa Uma empresa pública, que atua, no âmbito nacional e cuja missão é gerar e difundir conhecimento geológico e hidrológico, para o desenvolvimento sustentável do país, identificou, por avaliação própria e pressões do ambiente externo a necessidade de aperfeiçoar os seus sistemas de informações geocientíficas, apropriando-se então das modernas tecnologias existentes no mercado, no âmbito da inteligência do negócio, para introduzir um novo conceito de sistema de apoio a decisão, de modo a responder de forma rápida, precisa e detalhada as demandas por informações de seus clientes/parceiros. Além disso, a empresa redirecionou sua política de informação para adotar o uso de software livre e permitir o acesso à informação de forma democrática, pública e irrestrita. A partir de 2005 a empresa implantou o modelo de gestão de organização orientada à estratégia, segundo o princípio estabelecido no Balanced Scorecard (BSC)

101 100 e um sistema de gerenciamento de projeto, de modo a garantir que estratégias traçadas pela empresa sejam implementadas, de forma alinhada e compartilhadas por toda a força de trabalho. A empresa tem um escritório central no Rio de Janeiro, que exerce os papéis de coordenação e administração dos seus programas e 11 (onze) unidades executivas distribuídas nas seguintes localidades: Manaus, Porto Velho, Belém, Recife, Teresina, Fortaleza, Salvador, São Paulo, Porto Alegre, Belo Horizonte e Goiânia. 4.3 Projeto Piloto O projeto piloto escolhido para servir como protótipo na modelagem do sistema de suporte à decisão foi o sistema de informação de águas subterrâneas. A Unidade Regional de Porto Velho foi a que apresentou os melhores requisitos para modelar o sistema decorrentes dos seguintes fatores: necessidade de aperfeiçoar o sistema de informações de águas subterrâneas (sistema transacional ou operacional) para atender as demandas dos usuários internos e externos; atender à política de uso de software livre, transferindo-se da plataforma proprietária para multiplataforma; necessidade de fidelização do parceiro/cliente em relação ao sistema de informações de águas subterrâneas e ao sistema de suporte à decisão aplicado aos recursos hídricos subterrâneos; necessidade de ampliar enriquecer a base de dados de águas subterrâneas para atender as necessidades dos estudos, da gestão e do aproveitamento racional das águas subterrâneas; o fato de a Unidade de Porto Velho ser aquela com maior amplitude de conhecimento, experiências e dados necessários a atender os requisitos de modelo proposto. O projeto piloto foi implantado no ambiente do Escritório Central e da Regional de Porto Velho. Antes, porém, foi feito um diagnóstico do estado da arte do sistema de apoio à decisão aos recursos hídricos subterrâneos, adotado pela empresa, cotejando-o com o modelo proposto de SAD aos recursos hídricos subterrâneos.

102 Diagnóstico do Estado da Arte do Sistema de Apoio à Decisão Aplicado aos Recursos Hídricos Subterrâneos O diagnóstico foi realizado segundo o seguinte roteiro de trabalho: realização de reuniões presenciais e não presenciais (vídeo conferência), com usuários internos e externos, usuários do banco de dados e do sistema de informações de águas subterrâneas para fins de pesquisas, estudos, gestão e aproveitamento dos dados de águas subterrâneas, de modo a firmar um entendimento do processo como um todo; análise de sistema de informações de águas subterrâneas, em relação sua estrutura de dados, funcionalidade, configuração e adequação as políticas de TI e as demandas dos usuários; avaliação da base de dados de águas subterrâneas visando identificar qual o nível de qualidade da informação armazenada na base de dados; realização de entrevistas para conhecer a efetividade dos processos de gestão estratégicas e de projetos, bem como avaliar o funcionamento dos indicadores de desempenho. O diagnóstico realizado permitiu identificar problemas de natureza técnica, gerencial e institucional, relacionadas com o sistema de apoio à decisão a seguir apontadas: falhas e inconsistências na base de dados de água subterrâneas resultando em prejuízo no uso da informação e no processo de tomada de decisão; fontes de dados dispersas e não integradas; incapacidade de compartilhar dados de forma oportuna; falta de padronização dos dados provenientes de várias fontes externas; falta de integração entre o sistema de informação de água subterrânea da empresa e os sistemas de outras instituições envolvidas; acordos de cooperação para intercâmbio de dados deficientes; consultas e geração de relatórios de limitado valor agregado para tomada de decisão;

103 102 deficiente comunicação e troca de informação entre a empresa e seus clientes/parceiros; deficiente integração entre os diversos componentes do sistema de monitoramento e avaliação de desempenho; gerenciamento de projeto ineficaz; falta de alinhamento estratégico. Com base no diagnóstico realizado foi planejada a implantação do modelo protótipo do sistema proposto. 4.5 Implantação do Modelo Proposto na área do Projeto Piloto O diagnóstico realizado permitiu definir o modelo de Sistema de Apoio à Decisão como ilustrado na figura 20 e que envolveu o desenvolvimento das seguintes atividades, que serão melhor apresentadas nas subseções seguintes: Pré-processamento da Base de Dados Construção do Data Store Operacional Criação do Data Warehouse Elaboração da Análise de Negócio Implementação da gerência de processos utilizando BPM Figura 20 - Modelo Conceitual do SAD

104 Preprocessamento: Análise de Consistência e Enriquecimento da Base de Dados Foi elaborado um manual de procedimento para análise e tratamento de dados; e realizado treinamento para análise e alimentação da base de dados na área piloto escolhida para aplicação do modelo protótipo. A ação de enriquecimento da base de dados foi desenvolvida, após ser efetuada uma prospecção na base de dados e identificar os atributos que apresentavam a maior incidência de falta de dados. Os resultados da pesquisa permitiram adotar, no âmbito da área do projeto piloto, as seguintes medidas: alimentação da base de dados de águas subterrâneas com os dados provenientes da Rede de Monitoramento Integrado das Águas Subterrâneas, os quais se apresentam bastante qualificados (completos e consistentes); alimentação da base de dados de águas subterrâneas com os dados coletados junto aos órgãos gestores estaduais que realizam outorga do direito de uso das águas, cujo registro de dados dos poços se apresentam completos e consistentes; realização de campanha de campo para levantar dados complementares dos poços existentes na base de dados, segundo regra de negócio estabelecida. Foi feito, adicionalmente, o cadastramento de 108 (cento e oito) poços situados na cidade de Porto Velho, utilizados para abastecimento residencial e efetuada a coleta de dados para análise da água. os dados acima levantados serviram para realizar estudos de qualidade das águas subterrâneas, na área do projeto piloto, com base em técnicas estatísticas Base de Dados Operacional/ Data Store Operacional Para a criação do Data Store Operacional foram realizadas as seguintes ações: adequação do modelo de dados e das rotinas do sistema de informações de águas subterrâneas para sincronização com as diversas fontes de dados;

105 104 definição do processo de migração do sistema de informações de águas subterrâneas da plataforma proprietária (Windows) para multiplataforma (Windows/Linux); definição de estrutura de dados e de rotinas para extração de dados da base de dados de água subterrâneas para o Data Store Operacional; Criação de Data Warehouse Um sistema de data warehousing serve de suporte para sistemas de apoio à decisão, isto é, serve de base para aplicação de técnicas direcionadas a extração de informações estratégicas que depois servirão de base para a tomada de decisões no ambiente organizacional. A organização para este tipo de sistema é orientada por assunto permitindo integrar os dados provenientes de diversas fontes, além de garantir informações históricas e não voláteis. A aplicação do modelo proposto não considerou, no momento, a necessidade de criação de Data Warehouse Departamental e, sim, de Data Store Operacional, pelas seguintes razões: fonte de dados: a integração, bem como os processos de extração, transformação e carga dos dados provenientes de diversas fontes são tarefas típicas a serem realizadas no ambiente de data warehousing. Todavia, estas tarefas foram feitas no ambiente operacional, utilizando-se, para tal, o módulo de entrada de dados do sistema de informações de águas subterrâneas; estas tarefas foram facilitadas pelo uso do formato de dados do sistema de informações de águas subterrâneas. modelagem de dados: a modelagem dimensional uma técnica utilizada para estruturar os dados de forma intuitiva e que permite um acesso com boa performance utilizado em ambiente de data warehouse - não foi considerada necessária nesta aplicação devido ao uso de estrutura padronizada de dados do sistema de informações de águas subterrâneas. data store operacional: trata-se de um banco de dados operacional usado como área temporária de um data warehouse. Ele pode ser atualizado,

106 105 consolidar dados de diversos sistemas fontes e dar uma visão integrada e quase em tempo real de dados voláteis e correntes. Os processos ETL de um ODS são idênticos aos de um data warehouse. Considerando que foi desenvolvido um ODS operacional para o modelo proposto, o qual incorpora caraterísticas e algumas funcionalidades do DW optou-se por não desenvolver o Data Warehouse Análise do Negócio A análise de negócios é uma ampla categoria de aplicações e técnicas para reunir, armazenar, analisar e fornecer acesso aos dados, com o objetivo de ajudar os usuários da empresa a tomarem as melhores decisões comerciais e estratégicas (TURBAN et al., 2009). Para simulação do modelo proposto, na área do projeto piloto, foram realizadas as seguintes tarefas: identificação dos tipos de consulta e relatórios de saídas necessários a partir do critério de negócio estabelecido foi feita pesquisa/consulta à base de dados para extrair informações relevantes com vista a estruturar o programa de cadastramento de poços seletivos. Os dados levantados neste cadastramento possibilitarão o enriquecimento da base de dados. As pesquisas foram feitas com o gerenciador de base de dados SQL-Server 2.08 e concentraram-se em identificar a inexistência de registros dos atributos relativos ao perfil litológico e construtivo e dados hidrodinâmicos e hidroquímicos dos poços. As principais pesquisas/consultas realizadas foram as seguintes: poços que não possuem perfil litológico e construtivo; estes dados são importantes na elaboração de mapa hidrogeológico; poços que não possuem dados hidroquímicos; importante para avaliar a qualidade de água dos aquíferos. poços que apresentam as características acima apontadas localizados nos aquíferos monitorados através da rede integrada de águas subterrâneas.

107 106 Concluiu-se que dos 1981 poços cadastrados na base de dados, 351 poços atendem a requisitos acima enumerados e, os mesmos serão utilizados para promover o enriquecimento da base de dados. incorporação ao sistema de informação de águas subterrâneas de ferramentas OLAP - para o estudo de caso foram incorporadas ao SIAGAS as seguintes ferramentas: geração e resposta às consultas - a partir da consulta à base de dados de poço de Porto Velho, foram geradas tabelas de poços que atendem aos seguintes critérios: Critério I relação de poços que dispõem, simultaneamente, de registros de níveis estático e dinâmico e de vazão de poços, porém não há dados de perfil litológico e construtivo. Além de atender os requisitos acima estão situados nos aquíferos prioritários para fins de monitoramento das águas subterrâneas; Critério II - relação de poços que dispõem, simultaneamente, de registros de níveis estático e dinâmico e de vazão dos poços, porém não há dados hidroquímicos (Ph, condutividade elétrica e sólido totais dissolvidos). Além de atender os requisitos acima estão situados nos aquíferos prioritários para fins de monitoramento das águas subterrâneas. geração de relatórios e gráficos relatórios e gráficos que informem ao gerente de negócio da empresa, por exemplo: qual a quantidade evolutiva de poços alimentados na base de dados pelo órgão gestor de recursos hídricos; qual a situação dos poços armazenados na base de dados, que apresentam o maior percentual de registros de poços armazenados, por fonte de alimentação (órgão gestor, projetos específicos e rede de monitoramento de águas subterrâneas - RIMAS).

108 107 análise estatística de dados: foram realizadas análises estatísticas para identificar correlações entre parâmetros construtivos dos poços e qualidade da água. avaliação da qualidade de águas dos poços da cidade de Porto Velho a contaminação de uma água extraída de um poço tubular pode advir de duas situações: contaminação pela infiltração de águas superficiais nos poços em virtude de condições construtivas precárias; contaminação do aquífero decorrente de atividades antrópicas. Assim, os poços bem construídos são aqueles que possuem pelo menos: proteção sanitária/selo solitário; cimentação da parte superior do poço; informações construtivas que permitem avaliar os aquíferos interceptados e as profundidades de entrada d água, perfil litológico, revestimento, filtros e entradas d água. Então, para se determinar a contaminação das águas é necessário efetuar a análise de vários parâmetros, alguns de grande complexidade analítica e de coleta e preservação. Entretanto, como uma avaliação preliminar pode-se efetuar a análise de alguns parâmetros indicadores, cujo valor ou concentração pode indicar contaminação da água subterrânea. A resolução do Conselho Nacional de Recursos Hídricos orienta para que seja feito na frequência semestral o levantamento dos seguintes parâmetros: ph, cloretos, nitritos, nitratos, dureza total, alcalinidade total, ferro total, sólidos totais dissolvidos, e coliformes termotolerantes (fecais). Uma pesquisa interessante é extrair do banco de dados informações relevantes sobre as condições construtivas precárias dos poços ou desconhecidas e correlacionar com a qualidade da água.

109 108 Neste estudo foram feitas coletas de amostras em 108 (cento e oito) poços, no período de maio e junho de 2011, na sede do município de Porto Velho RO e realizadas medições de 11 (onze) variáveis físicas, químicas e biológicas. Nessa campanha foi utilizado o índice de qualidade de água segundo a Resolução CONAMA N o 357, de 17 de março de Os dados coletados em campo foram: data e hora da coleta, ocorrência de chuva, coordenadas geográficas, os parâmetros físico-químicos e bacteriológicos, natureza dos poços (amazônico ou tubular), profundidade, nível estático, nome do proprietário e endereço da localidade. A figura 21 apresenta a distribuição dos poços na área de estudo escolhida. A figura 22 destaca mapas de isovalores relativos à condutividade elétrica e a sólidos totais dissolvidos, dois parâmetros importantes na medida de qualidade da água dos poços. A figura 23 apresenta gráficos extraídos de dados organizados em planilha Excel relativos a alguns indicadores de qualidade de água, respeitando os valores máximos permitidos pela Portaria n o 518 do Ministério da Saúde e Resolução CONAMA n o 357.

110 109 Figura 21 Mapa de Localização dos Poços Figura 22 Mapas de Isovalores de Qualidade de Água

111 110 Figura 23 Principais Indicadores de Qualidade de Água de Poços Business Performance Management - BPM TURBAN et al. (2009) afirmam que o BPM é um conjunto integrado de processos, ferramentas, metodologia, métricas e aplicações projetadas para impelir o desempenho geral da empresa. Ele ajuda as empresas a converterem suas estratégias e objetivos em planos, monitorar o desempenho em relação aos seus planos, analisar a variação entre resultados reais e planejados, e ajustar os seus objetivos e ações em respostas a essa análise. A empresa em questão adotou o modelo de gestão estratégica, baseado no Balanced Scorecard tanto no nível corporativo como por unidade de negócio, e implantou um sistema de gerenciamento de projeto. A implementação do BPM no âmbito da empresa e do projeto piloto seguiu a metodologia do BSC e iniciou com a definição dos temas estratégicos; passando para a construção dos mapas estratégicos corporativos e das unidades de negócio e a estruturação dos programas e ações a serem desenvolvidas. Em seguida foram

112 111 elaborados os projetos contemplando o plano de trabalho, orçamento, indicadores de desempenho e metas físicas e financeiras. Os indicadores de desempenho da unidade de negócio foram vinculados a seu mapa estratégico. Apresenta-se abaixo os principais componentes do sistema de avaliação de desempenho considerados no projeto piloto: Unidade Negócio: Amazônia Programa: Gestão do Conhecimento Geocientífico; Ação: Levantamento Hidrogeológico Projeto: Gestão da Informação Hidrogeológica Indicador de Desempenho: Poços Cadastrados Meta Anual (2012): poços cadastrados. A arquitetura do sistema BPM da empresa é composta de três camadas (banco de dados, aplicações e de cliente ou interface com o usuário) que permite monitorar a implementação da estratégia da empresa. O modelo de Sistema de Apoio à Decisão ora apresentado, incorporando componentes do BI, tem o propósito de ser um suporte computadorizado à decisão, facilitando o monitoramento do ambiente e aprimorando as ações de respostas no setor de recursos hídricos subterrâneos. A fim de determinar a estrutura do modelo para aplicação na área de recursos hídricos subterrâneos, foi analisado o funcionamento do sistema de informações de águas subterrâneas e sua capacidade de dar suporte à tomada de decisão. Desta forma foi feito um diagnóstico do conteúdo da base de dados operacional sob a administração do sistema e constatou-se que, embora exista uma quantidade expressiva de dados, o nível de falta de dados e inconsistência é elevado, reduzindo a eficácia do sistema como ferramenta de suporte à decisão.

113 112 Com isto, este trabalho possibilitou definir, a partir de consulta orientada à base de dados, regras de negócios, que resultem no enriquecimento da base de dados, além de confirmar a necessidade de ter no modelo proposto a componente Data Store e ferramentas OLAP para consulta e geração de relatórios avançados. Uma análise do processo que envolve a administração da base de dados de água subterrânea, pelo SIAGAS, permitiu verificar que os dados armazenados na referida base são provenientes de fontes internas e externas. Uma das fontes é a rede integrada de monitoramento de águas subterrâneas (RIMAS), que fornece dados contínuos e qualificados. Tanto a necessidade de integrar dados de várias fontes como receber dados com as características de confiabilidade e temporalidade da rede RIMAS são requisitos que tornam o Data Warehouse um componente necessário e previsto no modelo proposto. A existência de vários atores atuando em recursos hídricos subterrâneos que necessitam de informações estratégicas para tomada de decisão vai ao encontro do modelo proposto o qual incorpora à análise do negócio um sistema de monitoramento e de avaliação de desempenho.

114 113 Capítulo 5 Conclusão O ambiente em que as empresas atualmente operam, sejam elas públicas ou privadas, é de crescente pressão para que sejam tomadas decisões com rapidez sob condições quase sempre mutantes. Tomar decisões, em certas circunstâncias, para serem eficazes, exige a manipulação de grandes quantidades de dados e informações. Num ambiente volátil e competitivo a qualidade e a pontualidade da informação constitui um fator crítico de sucesso. Esta assertiva também é válida no campo da ciência hidrológica. É preciso dispor de grande massa de dados hidrológicos para se inferir, com maior precisão, o comportamento do fenômeno que está sendo estudado. No campo da hidrogeologia a existência de uma volumosa base de dados de poços profundos nos permite explorá-la e tomar decisões mais acertadas nesta área de conhecimento. Uma das principais motivações para realização deste trabalho foi propor uma nova abordagem de Sistema de Apoio à Decisão Aplicada aos Recursos Hídricos Subterrâneos, no qual estejam incorporadas, de forma integrada, os componentes do BI envolvendo (SIAGAS, Data Warehouse, Ferramentas OLAP, Data Mining e Business Performance Management BPM). A utilização deste sistema de apoio à decisão trará benefícios, para área de recursos hídricos, nos seguintes aspectos: internalizar a cultura de Business Intelligence BI no ambiente dos recursos hídricos subterrâneo, incorporando a visão estratégica ao processo de tomada de decisão; fornecer aos tomadores de decisão ferramentas mais poderosas de consulta e análise do negócios, nos níveis operacionais, tático e estratégico; melhorar a qualidade da base de dados, visando à fidelização dos usuários do referido sistema; melhorar a produtividade e a qualidade dos serviços que se utilizam dos dados administrados pelo sistema;

115 114 aumentar a eficiência na gestão da informação de águas subterrâneas. Vale destacar que, embora tenha sido proposto um sistema de apoio à decisão aplicado a uma área específica de conhecimento ele, também, se aplica para as demais áreas de negócio da empresa. Em decorrência do estudo abordado nesta dissertação, alguns assuntos merecem aprofundamento em pesquisas ou trabalhos futuros. Os principais são: aperfeiçoar e automatizar as técnicas de análise de consistência de dados de águas subterrâneas; desenvolver mecanismos para integração de dados de águas subterrâneas provenientes de várias fontes/organismos; aplicar técnicas de mineração de dados, na área de hidrologia. Aperfeiçoar mecanismos integrados de natureza política, institucional, técnica, financeira e legal junto aos órgãos gestores e intervenientes, que proporcionem mais efetividade e qualidade no fornecimento dos dados. Finalmente, espera-se com este trabalho contribuir para a melhoria da qualidade e o aumento da eficiência na gestão de informações em apoio aos recursos hídricos subterrâneos.

116 115 Bibliografia AZEVEDO, H., CÔRTES, S., Data Mining Conceitos, Ferramentas e Aplicações. Texto para estudo do Curso Data Mining Pontifícia Universidade Católica PUC, BELO,O., LOURENÇO,A., SARMENTO, P., et al. AQUA- Um Sistema de Informação para Análise e Validação de Parâmetros de Qualidade da Água em Alqueva. Artigo. Universidade do Minho, Portugal, CUNHA, V., GONÇALVES, A. S., FIGUEIREDO, V. A., et. al. A Gestão das Águas Princípios Fundamentais e sua Aplicação em Portugal. 1 a ed. Lisboa, Editora Calouste Gulbenkian, 1980 CHIAVENATO,I., SAPIRO,A., Planejamento Estratégico Fundamentos e Aplicações. 2 a ed. Rio de Janeiro, Editora Campos, 2004 DUTRA,A.J., Business Performance Management. Disponível em: Acessado em 03 de setembro de ELMASRI, R. E., e SHAMKANT B. N., Sistemas de Banco de Dados [Trad]. 4 a ed. Pearson, FERNANDES, J., DUARTE, A.S., Um Sistema de Data Warehousing para a Área da Qualidade da Água. Disponível em: acessado em 28 de agosto de GOLDSCHMIT, R., PASSOS, E., Data Mining Um Guia Prático. 1 a ed. São Paulo: Editora Campus, GOUVEIA. R. M. M., Mineração de Dados em Data Warehouse para Sistema de Abastecimento de Água. Dissertação de Mestrado, Universidade Federal da Paraíba, HOFFER, J.A., PRESCOTT, M.B., MCFADDEN, F.R., Modern Database Management, 8 th, Ed. Upper Saddle River, NJ: Prentice Hall, INMON, W.H., Building the Data Warehouse: Getting Started. 4 a Edição. Editora: Wiley Publishing, Inc, KAPLAN, R. S., D.P.NORTON., Organização Orientada para a Estratégia. 5 a ed. Rio de Janeiro, Editora Campus, KETTLELHUT, J. T. S., Programa de Águas Subterrâneas. Cartilha PAS MMA; Disponível em: MMA.pdf; acessado em 27 de agosto de 2011.

117 116 LACERDA, S., Business Intelligence e apoio a tomada de decisões. Disponível em: acessado em 27 de agosto de LIMA, C.A.L., Data Warehouse/Business Intelligence. Disponível em: -data-store; acessado em 22 de fevereiro de PEIXINHO, F. C, FEITOSA, F. A., Água é Vida. In: Silva, C. R., Geodiversidade do Brasil Conhecer o passado para entender o presente e prever o futuro. Rio de Janeiro - RJ, CPRM, RAMOS, F., OCCHIPINTI, A. G; NOVA, N.A. V., Engenharia Hidrológica. Porto Alegre, ABRH, REBOUÇAS, A. C., Diagnóstico do Setor de Hidrogeologia. São Paulo. Associação Brasileira de Águas Subterrâneas, p. SIMONS, R., Performance Measurement and Control Systems for Implementing Strategy. Upper Saddle River, NJ: Prentice Hall, TAN,P., STEINBACH, M., KUMAR,V., Introdução ao DATA MINING Mineração de Dados. Rio de Janeiro. Editora Ciência Moderna, TURBAN, E., SHARD, R., ARONSON, J. E., et. al. Business Intelligence - Um Enfoque Gerencial para a Inteligência do Negócio. Porto Alegre: Editora Artmed, TUNDIZI, J. G., Água no Século XXI: Enfrentando a Escassez. São Paulo: Editora Rima, UNEP. Towards a Green Economy: Pathways to Sustainable Development and Poverty Eradication. In Report United Nations Enviromnent Programme, Disponível em: acessado em 27 de agosto de 2011.

118 117 Anexos Modelos de Documento Os anexos (documentos) que servem de apoio a esta dissertação são apresentados a seguir: Anexo Sigla Nome do Documento I FCP Ficha de Cadastramento de Poços II TED Tabela de Estrutura de Dados III MAS Moção Adoção do SIAGAS IV MRS Modelo de Relatório de Saída V TDP Tabela de Dados de Poços Extrato - Porto Velho Tabela 5 - Relação de Anexos da Dissertação

119 118 Anexo I FCP FICHA DE CADASTRAMENTO DE POÇOS CADASTRAMENTO DE POÇOS SIAGAS - MAPA HIDROGEOLOGICO DO BRASIL SIG DADOS GERAIS Código do Poço: Ponto no Cadastro: Código no SIAGAS: Fotografia: Natureza do Ponto: Poço Tubular Poço Escavado Poço Amazonas Fonte Natural Coordenadas Geográficas (**usar SAD69): Latitude, Longitude, Localidade:... UF:...Município:... Proprietário do Terreno:... Endereço do Proprietário:... Perfurado em:.../.../... **PERFURADOR:... DADOS HIDROGEOLÓGICOS Contratante:... Tipo Formação: Natureza do Aqüífero: Poroso Fissural Cárstico Profundidade (m): Informada:... Medida:... CARACTERÍSTICAS DO POÇO Tipo de Revestimento: Aço PVC Comum PVC Aditivado Diâm.Int.(pol):... Altura da boca (m):... INSTALAÇÕES DO POÇO Equipamento Bombeamento: Bomba Centrífuga Bomba Injetora Compressor Catavento Bomba Manual Sarilho Bomba Submersa Não Equipado Outros Reservatório: Alvenaria Aço Tambor Fibra Amianto Crivo da Bomba (m)... Potência do Equipamento (cv)... Capacidade (m 3 )... Diâmetro do Tubo Edutor(pol)... Data Instalação.../.../... Dessalinizador: Sim Não Fabricante:... Capacidade de Produção (m 3 /h):... Data da Instalação:.../.../... Situação: Em Instalação Em Operação Paralisado Abandonado Motivo da Paralisação: Com Defeito Necessita troca de membranas Falta de manutenção SITUAÇÃO DO POÇO Abandonado Colmatado Fechado Obstruído Em Operação Parado Não Instalado DADOS OPERACIONAIS DO POÇO Vazão (m3/h) Níveis da Água (m) Regime de Bombeamento Medida: Informada:... Nível Estático (NE):... Nível Dinâmico (ND):... Informado Medido Horas / Dia:... Dias / Semana:...

120 119 Anexo I FCP FICHA DE CADASTRAMENTO DE POÇOS - CONTINUAÇÃO QUALIDADE DA ÁGUA Condutividade Elétrica (µs/cm) Cor Odor Valor:... Quando não coletar amostra justificar em Observações Límpida Turva Com Odor Inodora USO DA ÁGUA Abastecimento doméstico Abastecimento doméstico/animal Abastecimento doméstico/irrigação Abastecimento industrial Abastecimento múltiplo Abastecimento urbano Doméstico/irrigação/animal Irrigação Outros (lazer,etc.) Pecuária Sem uso OBSERVAÇÃO Justificativa da falta de coleta de amostra de água e / ou outras observações: Informante:...Recenseador:... Data:.../...../... Assinatura do Recenseador:... Assinatura Coordenação de Área:... Observação Importante sempre buscar a informação do nome do **PERFURADOR do poço, para posterior recuperação dos dados construtivos e litológicos em relatórios.

121 120 Anexo II TED TABELA DE ESTRUTURA DE DADOS BASE DE DADOS REFERENCIAL

122 121 Anexo III MAS MOÇÃO DE ADOÇÃO DO SIAGAS

123 122 Anexo IV MRS MODELO DE RELATÓRIO SAÍDA

124 123 Anexo V TDP TABELA DE DADOS DE POÇOS PROJETO PILOTO PORTO VELHO

125 124 Anexo V TDP TABELA DE DADOS DE POÇOS PROJETO PILOTO PORTO VELHO CONTINUAÇÃO

126 125 Anexo IV TDP TABELA DE DADOS DE POÇOS PROJETO PILOTO PORTO VELHO CONTINUAÇÃO

FREDERICO CLÁUDIO PEIXINHO

FREDERICO CLÁUDIO PEIXINHO UNIVERSIDADE ESTADUAL DO CEARÁ (UECE) INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO CEARÁ UNIVERSIDADE FEDERAL DO RIO DE JANEIRO FREDERICO CLÁUDIO PEIXINHO SISTEMA DE APOIO À DECISÃO APLICADO

Leia mais

BUSINESS INTELLIGENCE BI Aplicado à Gestão das Águas Subterrâneas. Frederico Cláudio Peixinho Flávio Luis de Mello 23 a 26 de Outubro de 2012

BUSINESS INTELLIGENCE BI Aplicado à Gestão das Águas Subterrâneas. Frederico Cláudio Peixinho Flávio Luis de Mello 23 a 26 de Outubro de 2012 XVII Congresso Brasileiro de Águas Subterrâneas Bonito - MT Serviço Geológico do Brasil CPRM BUSINESS INTELLIGENCE BI Aplicado à Gestão das Águas Subterrâneas Frederico Cláudio Peixinho Flávio Luis de

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Capítulo 2 Data Warehousing

Capítulo 2 Data Warehousing Capítulo 2 Data Warehousing Objetivos de Aprendizado Compreender as definições e os conceitos básicos dos data warehouses Compreender as arquiteturas de data warehousing Descrever os processos usados no

Leia mais

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009.

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. REFERÊNCIAS o o Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. Competição Analítica - Vencendo Através da Nova Ciência Davenport,

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

Data Warehouses Uma Introdução

Data Warehouses Uma Introdução Data Warehouses Uma Introdução Alex dos Santos Vieira, Renaldy Pereira Sousa, Ronaldo Ribeiro Goldschmidt 1. Motivação e Conceitos Básicos Com o advento da globalização, a competitividade entre as empresas

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

Business Intelligence e ferramentas de suporte

Business Intelligence e ferramentas de suporte O modelo apresentado na figura procura enfatizar dois aspectos: o primeiro é sobre os aplicativos que cobrem os sistemas que são executados baseados no conhecimento do negócio; sendo assim, o SCM faz o

Leia mais

Data Warehousing Visão Geral do Processo

Data Warehousing Visão Geral do Processo Data Warehousing Visão Geral do Processo Organizações continuamente coletam dados, informações e conhecimento em níveis cada vez maiores,, e os armazenam em sistemas informatizados O número de usuários

Leia mais

Uma estrutura (framework) para o Business Intelligence (BI)

Uma estrutura (framework) para o Business Intelligence (BI) Uma estrutura conceitural para suporteà decisão que combina arquitetura, bancos de dados (ou data warehouse), ferramentas analíticas e aplicações Principais objetivos: Permitir o acesso interativo aos

Leia mais

Business Intelligence

Business Intelligence e-book Senior Business Intelligence 1 Índice 03 05 08 14 17 20 22 Introdução Agilize a tomada de decisão e saia à frente da concorrência Capítulo 1 O que é Business Intelligence? Capítulo 2 Quatro grandes

Leia mais

Chapter 3. Análise de Negócios e Visualização de Dados

Chapter 3. Análise de Negócios e Visualização de Dados Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos

Leia mais

Módulo 2. Definindo Soluções OLAP

Módulo 2. Definindo Soluções OLAP Módulo 2. Definindo Soluções OLAP Objetivos Ao finalizar este módulo o participante: Recordará os conceitos básicos de um sistema OLTP com seus exemplos. Compreenderá as características de um Data Warehouse

Leia mais

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani BI Business Intelligence A inteligência Empresarial, ou Business Intelligence, é um termo do Gartner Group. O conceito surgiu na década de 80 e descreve

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.2 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

BUSINESS INTELLIGENCE -Inteligência nos Negócios-

BUSINESS INTELLIGENCE -Inteligência nos Negócios- UNIVERSIDADE SÃO FRANCISCO CENTRO DE CIÊNCIAS JURÍDICAS, HUMANAS E SOCIAIS BUSINESS INTELLIGENCE -Inteligência nos Negócios- Curso: Administração Hab. Sistemas de Informações Disciplina: Gestão de Tecnologia

Leia mais

Data Warehouse Processos e Arquitetura

Data Warehouse Processos e Arquitetura Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997)

Leia mais

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP.

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. Eduardo Cristovo de Freitas Aguiar (PIBIC/CNPq), André Luís Andrade

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

SAD orientado a DADOS

SAD orientado a DADOS Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a DADOS DISCIPLINA: Sistemas de Apoio a Decisão SAD orientado a dados Utilizam grandes repositórios

Leia mais

Universidade de Brasília Departamento de Ciência da Informação e Documentação Profa.:Lillian Alvares

Universidade de Brasília Departamento de Ciência da Informação e Documentação Profa.:Lillian Alvares Universidade de Brasília Departamento de Ciência da Informação e Documentação Profa.:Lillian Alvares Comunidades de Prática Grupos informais e interdisciplinares de pessoas unidas em torno de um interesse

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

Adriano Maranhão BUSINESS INTELLIGENCE (BI),

Adriano Maranhão BUSINESS INTELLIGENCE (BI), Adriano Maranhão BUSINESS INTELLIGENCE (BI), BUSINESS INTELLIGENCE (BI) O termo Business Intelligence (BI), popularizado por Howard Dresner do Gartner Group, é utilizado para definir sistemas orientados

Leia mais

CARTA DAS ÁGUAS DO ACRE 2015

CARTA DAS ÁGUAS DO ACRE 2015 CARTA DAS ÁGUAS DO ACRE 2015 A Carta das Águas do Acre 2015 é o documento resultado do Seminário Água e Desenvolvimento Sustentável realizado pelo Governo do Estado do Acre, através da Secretaria de Estado

Leia mais

Interatividade aliada a Análise de Negócios

Interatividade aliada a Análise de Negócios Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining. BUSINESS INTELLIGENCE COM DADOS EXTRAÍDOS DO FACEBOOK UTILIZANDO A SUÍTE PENTAHO Francy H. Silva de Almeida 1 ; Maycon Henrique Trindade 2 ; Everton Castelão Tetila 3 UFGD/FACET Caixa Postal 364, 79.804-970

Leia mais

Uma Ferramenta Web para BI focada no Gestor de Informação

Uma Ferramenta Web para BI focada no Gestor de Informação Uma Ferramenta Web para BI focada no Gestor de Informação Mikael de Souza Fernandes 1, Gustavo Zanini Kantorski 12 mikael@cpd.ufsm.br, gustavoz@cpd.ufsm.br 1 Curso de Sistemas de Informação, Universidade

Leia mais

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo Unidade III PRINCÍPIOS DE SISTEMAS DE INFORMAÇÃO Prof. Luís Rodolfo Vantagens e desvantagens de uma rede para a organização Maior agilidade com o uso intenso de redes de computadores; Grandes interações

Leia mais

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence Juntamente com o desenvolvimento desses aplicativos surgiram os problemas: & Data Warehouse July Any Rizzo Oswaldo Filho Década de 70: alguns produtos de BI Intensa e exaustiva programação Informação em

Leia mais

Gerenciamento de Dados e Gestão do Conhecimento

Gerenciamento de Dados e Gestão do Conhecimento ELC1075 Introdução a Sistemas de Informação Gerenciamento de Dados e Gestão do Conhecimento Raul Ceretta Nunes CSI/UFSM Introdução Gerenciando dados A abordagem de banco de dados Sistemas de gerenciamento

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de 1 Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Descrever

Leia mais

Modelagem de Sistemas de Informação

Modelagem de Sistemas de Informação Modelagem de Sistemas de Informação Professora conteudista: Gislaine Stachissini Sumário Modelagem de Sistemas de Informação Unidade I 1 SISTEMAS DE INFORMAÇÃO...1 1.1 Conceitos...2 1.2 Objetivo...3 1.3

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS Vimos em nossas aulas anteriores: COMPUTADOR Tipos de computadores Hardware Hardware Processadores (CPU) Memória e armazenamento Dispositivos de E/S

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares Universidade de Brasília Faculdade de Ciência da Informação Prof a Lillian Alvares Fóruns Comunidades de Prática Mapeamento do Conhecimento Portal Intranet Extranet Banco de Competências Memória Organizacional

Leia mais

Prova INSS RJ - 2007 cargo: Fiscal de Rendas

Prova INSS RJ - 2007 cargo: Fiscal de Rendas Prova INSS RJ - 2007 cargo: Fiscal de Rendas Material de Apoio de Informática - Prof(a) Ana Lucia 53. Uma rede de microcomputadores acessa os recursos da Internet e utiliza o endereço IP 138.159.0.0/16,

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto OLPT x OLAP Roteiro OLTP Datawarehouse OLAP Operações OLAP Exemplo com Mondrian e Jpivot

Leia mais

Sistemas de Apoio à Inteligência do Negócio

Sistemas de Apoio à Inteligência do Negócio Sistemas de Apoio à Inteligência do Negócio http://www.uniriotec.br/~tanaka/sain tanaka@uniriotec.br Visão Geral de Business Intelligence Evolução dos Sistemas de Informação (computadorizados) 1950 s:

Leia mais

Serviço Geológico do Brasil CPRM

Serviço Geológico do Brasil CPRM Serviço Geológico do Brasil CPRM A Rede de Monitoramento de Águas Subterrâneas do Serviço Geológico do Brasil: Desafios e Estágio Atual de Implantação. Maria Antonieta Alcântara Mourão Frederico Cláudio

Leia mais

EDUCAÇÃO AMBIENTAL E GESTÃO DOS RECURSOS HÍDRICOS

EDUCAÇÃO AMBIENTAL E GESTÃO DOS RECURSOS HÍDRICOS EDUCAÇÃO AMBIENTAL E GESTÃO DOS RECURSOS HÍDRICOS EDUCANDO PARA UM AMBIENTE MELHOR Apresentação A Secretaria de Estado do Meio Ambiente e dos Recursos Hídricos do Rio Grande do Norte SEMARH produziu esta

Leia mais

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence. Tópicos Avançados Business Intelligence Banco de Dados Prof. Otacílio José Pereira Unidade 10 Tópicos Avançados Business Inteligence Roteiro Introdução Níveis organizacionais na empresa Visão Geral das

Leia mais

Gestão de TI. Aula 10 - Prof. Bruno Moreno 30/06/2011

Gestão de TI. Aula 10 - Prof. Bruno Moreno 30/06/2011 Gestão de TI Aula 10 - Prof. Bruno Moreno 30/06/2011 Aula passada... Gestão do Conhecimento 08:46 2 Aula de Hoje... BI Apresentação do artigo IT doesn t matter Debate 08:48 3 Caso da Toyota Toyota Motor

Leia mais

Uma aplicação de Data Warehouse para apoiar negócios

Uma aplicação de Data Warehouse para apoiar negócios Uma aplicação de Data Warehouse para apoiar negócios André Vinicius Gouvêa Monteiro Marcos Paulo Oliveira Pinto Rosa Maria E. Moreira da Costa Universidade do Estado do Rio de Janeiro - UERJ IME - Dept

Leia mais

Construção de um Sistema de Informações Estratégicas, Integrando Conhecimento, Inteligência e Estratégia.

Construção de um Sistema de Informações Estratégicas, Integrando Conhecimento, Inteligência e Estratégia. Construção de um Sistema de Informações Estratégicas, Integrando Conhecimento, Inteligência e Estratégia. Introdução Sávio Marcos Garbin Considerando-se que no contexto atual a turbulência é a normalidade,

Leia mais

Curso Superior de Tecnologia em BD

Curso Superior de Tecnologia em BD Curso Superior de Tecnologia em BD Arquitetura de Business Intelligence Aula 2 Definindo Sistemas de Business Intelligence, suas Fronteiras e Aplicações Objetivos Entender os Tipos de Processos de Decisão

Leia mais

Administração estratégica da Informação: definição, controle estratégias de mercado Prof. MSc Hugo Vieira L. Souza

Administração estratégica da Informação: definição, controle estratégias de mercado Prof. MSc Hugo Vieira L. Souza Administração estratégica da Informação: definição, controle estratégias de mercado Prof. MSc Hugo Vieira L. Souza Este documento está sujeito a copyright. Todos os direitos estão reservados para o todo

Leia mais

Pós-Graduação Business Intelligence

Pós-Graduação Business Intelligence Pós-Graduação Business Intelligence Tendências de Mercado de Business Intelligence Aula 04 Como se organizar para o sucesso em BI Dinâmica Organizacional Complexa Cria o maior ônus para o sucesso de BI

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

Aline França a de Abreu, Ph.D

Aline França a de Abreu, Ph.D Aline França a de Abreu, Ph.D igti.eps.ufsc.br 07 / 10/ 04 Núcleo de estudos Criado em 1997 - UFSC/EPS Equipe multidisciplinar, com aproximadamente 20 integrantes OBJETIVO Gerar uma competência e uma base

Leia mais

Inteligência Empresarial. BI Business Intelligence. Business Intelligence 22/2/2011. Prof. Luiz A. Nascimento

Inteligência Empresarial. BI Business Intelligence. Business Intelligence 22/2/2011. Prof. Luiz A. Nascimento Inteligência Empresarial Prof. Luiz A. Nascimento BI Pode-se traduzir informalmente Business Intelligence como o uso de sistemas inteligentes em negócios. É uma forma de agregar a inteligência humana à

Leia mais

Sobre o que falaremos nesta aula?

Sobre o que falaremos nesta aula? Business Intelligence - BI Inteligência de Negócios Prof. Ricardo José Pfitscher Elaborado com base no material de: José Luiz Mendes Gerson Volney Lagmman Introdução Sobre o que falaremos nesta aula? Ferramentas

Leia mais

01/12/2009 BUSINESS INTELLIGENCE. Agenda. Conceito. Segurança da Informação. Histórico Conceito Diferencial Competitivo Investimento.

01/12/2009 BUSINESS INTELLIGENCE. Agenda. Conceito. Segurança da Informação. Histórico Conceito Diferencial Competitivo Investimento. BUSINESS INTELLIGENCE Agenda BI Histórico Conceito Diferencial Competitivo Investimento Segurança da Objetivo Áreas Conceito O conceito de Business Intelligencenão é recente: Fenícios, persas, egípcios

Leia mais

Complemento I - Noções Introdutórias em Data Warehouses

Complemento I - Noções Introdutórias em Data Warehouses Complemento I - Noções Introdutórias em Data Warehouses Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados

Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados Disciplina: Ferramentaspara Tomadade Decisão Prof.: Fernando Hadad Zaidan Unidade 1.2 1 Conceitos Iniciais Tomada de Decisão, Modelagem

Leia mais

PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012

PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012 PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012 Curso: TECNOLOGIA EM GESTÃO COMERCIAL Habilitação: TECNÓLOGO Disciplina: NEGÓCIOS INTELIGENTES (BUSINESS INTELLIGENCE) Período: M V N 4º semestre do Curso

Leia mais

Sistema Integrado de Gestão ERP Sistema Integrado de Gestão

Sistema Integrado de Gestão ERP Sistema Integrado de Gestão Sistema Integrado de Gestão ERP Sistema Integrado de Gestão ERP Prof: Edson Thizon ethizon@gmail.com Sistema ERP; Processos de Desenvolvimento, Seleção, Aquisição, Implantação de ERP; Aderência e divergência

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

ERP & BI ENTENTENDO A BUSCA CONSTANTE DAS EMPRESAS POR UM SISTEMA QUE FORNEÇA INFORMAÇÕES CONFIÁVEIS PARA TOMADA DE DECISÃO*

ERP & BI ENTENTENDO A BUSCA CONSTANTE DAS EMPRESAS POR UM SISTEMA QUE FORNEÇA INFORMAÇÕES CONFIÁVEIS PARA TOMADA DE DECISÃO* ERP & BI ENTENTENDO A BUSCA CONSTANTE DAS EMPRESAS POR UM SISTEMA QUE FORNEÇA INFORMAÇÕES CONFIÁVEIS PARA TOMADA DE DECISÃO* RESUMO Marilia Costa Machado - UEMG - Unidade Carangola Graciano Leal dos Santos

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS Capítulo 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7.1 2003 by Prentice Hall OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação?

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Gestão de Tecnologia da Informação

Programa do Curso de Pós-Graduação Lato Sensu MBA em Gestão de Tecnologia da Informação Programa do Curso de Pós-Graduação Lato Sensu MBA em Gestão de Tecnologia da Informação Apresentação O programa de Pós-graduação Lato Sensu em Gestão de Tecnologia da Informação tem por fornecer conhecimento

Leia mais

Arquitetura de Disseminação de Informações baseada em Datawarehouse 05/04/2006

Arquitetura de Disseminação de Informações baseada em Datawarehouse 05/04/2006 Arquitetura de Disseminação de Informações baseada em Datawarehouse 05/04/2006 Agenda A Informal Perspectiva Histórica Modelos de Arquitetura Benefícios para Gestão Caso de Referência Agenda A Informal

Leia mais

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO Proposta de Formação Complementar: BUSINESS INTELLIGENCE E SUA APLICAÇÃO À GESTÃO Aluno: Yussif Tadeu de Barcelos Solange Teixeira

Leia mais

Criação e uso da Inteligência e Governança do BI

Criação e uso da Inteligência e Governança do BI Criação e uso da Inteligência e Governança do BI Criação e uso da Inteligência e Governança do BI Governança do BI O processo geral de criação de inteligência começa pela identificação e priorização de

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

PROPOSTA DE UMA ARQUITETURA PARA CONSTRUÇÃO DE UM DATA WAREHOUSE PARA GESTÃO DA SAÚDE PÚBLICA DE UM MUNICÍPIO DO VALE DO ITAJAÍ

PROPOSTA DE UMA ARQUITETURA PARA CONSTRUÇÃO DE UM DATA WAREHOUSE PARA GESTÃO DA SAÚDE PÚBLICA DE UM MUNICÍPIO DO VALE DO ITAJAÍ PROPOSTA DE UMA ARQUITETURA PARA CONSTRUÇÃO DE UM DATA WAREHOUSE PARA GESTÃO DA SAÚDE PÚBLICA DE UM MUNICÍPIO DO VALE DO ITAJAÍ Renan Felipe dos Santos Prof. Alexander Roberto Valdameri,Orientador ROTEIRO

Leia mais

Bloco Administrativo

Bloco Administrativo Bloco Administrativo BI Business Intelligence Objetivo O objetivo deste artigo é dar uma visão geral sobre o Módulo Business Intelligence, que se encontra no Bloco Administrativo. Todas informações aqui

Leia mais

Business Intelligence e Inteligência Analítica BUSINESS INTELLIGENCE

Business Intelligence e Inteligência Analítica BUSINESS INTELLIGENCE Business Intelligence e Inteligência Analítica BUSINESS INTELLIGENCE Sumário Conceitos/Autores chave... 3 1. Introdução... 4 2. Teoria de Negócios... 5 3. Profi ssionais de BI... 6 4. Verdades e Mitos

Leia mais

Business Intelligence Conceitos, Metodologia de Desenvolvimento e Exemplos de BI

Business Intelligence Conceitos, Metodologia de Desenvolvimento e Exemplos de BI Matriz: Av. Caçapava, 527 CEP 90.460-130 Tecnopuc: Av. Ipiranga, 6681 Prédio 32 Sala 109 CEP 90.619-900 Porto Alegre - RS, Brasil Contate-nos: +55 (51) 3330.7777 contato@dbccompany.com.br www.dbccompany.com.br

Leia mais

18. Qualidade de Dados em Data Warehouse - Objetivos e Sucesso

18. Qualidade de Dados em Data Warehouse - Objetivos e Sucesso 18. Qualidade de Dados em Data Warehouse - Objetivos e Sucesso Uma das características das Ciências Exatas é a precisão das informações obtidas; a segurança dos dados extraídos nos processos usados. Cálculos

Leia mais

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares Universidade de Brasília Faculdade de Ciência da Informação Profa. Lillian Alvares Fóruns / Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias e experiências que

Leia mais

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares Universidade de Brasília Departamento de Ciência da Informação e Documentação Prof a.:lillian Alvares Fóruns óu s/ Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias

Leia mais

AULAS 11 e 12 BUSINESS INTELLIGENCE INTELIGÊNCIA NOS NEGÓCIOS

AULAS 11 e 12 BUSINESS INTELLIGENCE INTELIGÊNCIA NOS NEGÓCIOS AULAS 11 e 12 BUSINESS INTELLIGENCE INTELIGÊNCIA NOS NEGÓCIOS CONCEITO Business (negócio): Quer dizer a intermediação de uma atividade comercial com fins lucrativos. Intelligence (inteligência): Faculdade

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Data Warehouse. Debora Marrach Renata Miwa Tsuruda Debora Marrach Renata Miwa Tsuruda Agenda Introdução Contexto corporativo Agenda Introdução Contexto corporativo Introdução O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos

Leia mais

MBA EM BUSINESS INTELLIGENCE

MBA EM BUSINESS INTELLIGENCE MBA EM BUSINESS INTELLIGENCE Como a sua empresa estrutura informações estratégicas? Como as decisões são tomadas? São considerados, dados, informações e tendências, de macroambientes? O quanto você conhece

Leia mais

ATENÇÃO: ESTE ARTIGO NÃO PODERÁ SER UTILIZADO PARA FINS COMERCIAIS. DEVERÁ OBRIGATORIAMENTE SER REFERENCIADO COMO:

ATENÇÃO: ESTE ARTIGO NÃO PODERÁ SER UTILIZADO PARA FINS COMERCIAIS. DEVERÁ OBRIGATORIAMENTE SER REFERENCIADO COMO: ATENÇÃO: ESTE ARTIGO NÃO PODERÁ SER UTILIZADO PARA FINS COMERCIAIS. DEVERÁ OBRIGATORIAMENTE SER REFERENCIADO COMO: Fabre, Jorge Leandro; Carvalho, José Oscar Fontanini de. (2004). Uma Taxonomia para Informações

Leia mais

IMPLANTAÇÃO DO DW NA ANVISA

IMPLANTAÇÃO DO DW NA ANVISA IMPLANTAÇÃO DO DW NA ANVISA Bruno Nascimento de Ávila 1 Rodrigo Vitorino Moravia 2 Maria Renata Furtado 3 Viviane Rodrigues Silva 4 RESUMO A tecnologia de Business Intelligenge (BI) ou Inteligência de

Leia mais

Sistemas de Informação Aplicados a AgroIndústria Utilizando DataWarehouse/DataWebhouse

Sistemas de Informação Aplicados a AgroIndústria Utilizando DataWarehouse/DataWebhouse Sistemas de Informação Aplicados a AgroIndústria Utilizando DataWarehouse/DataWebhouse Prof. Dr. Oscar Dalfovo Universidade Regional de Blumenau - FURB, Blumenau, Brasil dalfovo@furb.br Prof. Dr. Juarez

Leia mais

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br Sistema Tipos de sistemas de informação Everson Santos Araujo everson@everson.com.br Um sistema pode ser definido como um complexo de elementos em interação (Ludwig Von Bertalanffy) sistema é um conjunto

Leia mais

Processos Hidrológicos CST 318 / SER 456. Tema 1 Introdução ANO 2015

Processos Hidrológicos CST 318 / SER 456. Tema 1 Introdução ANO 2015 Processos Hidrológicos CST 318 / SER 456 Tema 1 Introdução ANO 2015 Camilo Daleles Rennó Laura De Simone Borma http://www.dpi.inpe.br/~camilo/prochidr/ Aulas 1 Introdução - Camilo 2 Precipitação/Interceptação

Leia mais

Gestão Integrada de Águas Urbanas

Gestão Integrada de Águas Urbanas Gestão Integrada de Águas Urbanas Prof. Carlos E. M. Tucci Consultor do Banco Mundial São Paulo 4 a 6 de dezembro de 2012 1 Impactos Aumento da magnitude das vazões e da frequência de inundações; Aumento

Leia mais

Conceitos Básicos. Geoprocessamento: Uma Ferramenta Para o Desenvolvimento Regional Sustentável. Conceitos Básicos.

Conceitos Básicos. Geoprocessamento: Uma Ferramenta Para o Desenvolvimento Regional Sustentável. Conceitos Básicos. Geoprocessamento: Uma Ferramenta Para o Desenvolvimento Regional Sustentável Sistema de Informação Dados Armazenados Questão Informação Laboratório de Geoprocessamento (LAGEO) Programa de Mestrado em Ciências

Leia mais

QUAIS INSTRUMENTOS SÃO USADOS NO MONITORAMENTO DE PROGRAMAS SOCIAIS?

QUAIS INSTRUMENTOS SÃO USADOS NO MONITORAMENTO DE PROGRAMAS SOCIAIS? COMO SE FAZ NO BRASIL: PRINCIPAIS INSTRUMENTOS DE MONITORAMENTO DE PROGRAMAS SOCIAIS COMO SE FAZ O MONITORAMENTO? O monitoramento de programas envolve as seguintes etapas:» 1ª etapa: Coleta regular de

Leia mais

INSTRUÇÃO NORMATIVA Nº 01, DE 27 DE FEVEREIRO DE 2007.

INSTRUÇÃO NORMATIVA Nº 01, DE 27 DE FEVEREIRO DE 2007. INSTRUÇÃO NORMATIVA Nº 01, DE 27 DE FEVEREIRO DE 2007. Dispõe sobre a emissão de outorga de direito de uso dos recursos hídricos de domínio do Estado da Bahia, assim como a sua renovação, ampliação, alteração,

Leia mais