PROJETO E IMPLEMENTAÇÃO DE DATAWAREHOUSE

Tamanho: px
Começar a partir da página:

Download "PROJETO E IMPLEMENTAÇÃO DE DATAWAREHOUSE"

Transcrição

1 PROJETO E IMPLEMENTAÇÃO DE DATAWAREHOUSE BOA VISTA-RR 2015

2 A TOMADA DE DECISÃO NAS ORGANIZAÇÕES O PROCESSO DECISORIAL É um processo organizacional considerado de grande relevância para um gerenciamento eficaz das organizações. É o poder de escolher, em determinada circunstância, o caminho mais adequado para a empresa. Para que um negócio ganhe a vantagem competitiva é necessário que ele alcance um desempenho superior, e para tanto, a organização deve estabelecer uma estratégia adequada, tomando as decisões certas. ELEMENTOS DO PROCESSO DECISORIAL Em toda decisão existem, no mínimo, seis elementos, a saber: 1. O tomador da decisão: é o indivíduo ou grupo de indivíduos que faz uma escolha dentre vários cursos de ação disponíveis. 2. Objetivos: são os objetivos que o tomador de decisão pretende alcançar por meio de suas ações. 3. O sistema de valores: são os critérios de preferência que o tomador de decisão usa para fazer sua escolha. 4. Cursos de ação: são as diferentes sequências de ação que o tomador de decisão pode escolher. 5. Estados da natureza: são aspectos do ambiente que envolvem o tomador de decisão e que afetam sua escolha de cursos de ação. São fatores ambientais fora do controle do tomador de decisões, como as condições de certeza, risco ou incerteza. 6. Consequências: representam os efeitos resultantes de um determinado curso de ação e de um determinado estado da natureza NIÍVEIS DE DECISÃO Existem três diferentes áreas de decisão na empresa, a saber: 1. Decisões estratégicas: relacionadas com as relações entre a empresa e o ambiente; guiam e dirigem o comportamento da empresa, principalmente quando ela expande e altera sua posição produto/mercado. São tomadas no nível institucional. 2. Decisões administrativas: relacionadas com a estrutura e configuração organizacional da empresa, com a alocação e distribuição de recursos. São tomadas no nível intermediário. 3. Decisões operacionais: relacionadas com a seleção e orientação do nível operacional encarregado de realizar a tarefa técnica. 1

3 ETAPAS DO PROCESSO DE TOMADA DE DECISÃO: As decisões são tomadas em resposta a algum problema a ser resolvido, a alguma necessidade a ser satisfeita ou a algum objetivo a ser alcançado. A decisão envolve um processo, isto é, uma sequência de passos ou fases que se sucedem. Daí o nome processo decisorial para descrever essa sequência de fases. Na realidade, o processo decisorial pode ser descrito em quatro fases essenciais, a saber: 1. Definição e diagnóstico do problema. Esta fase envolve a obtenção dos dados e fatos a respeito do problema, suas relações com o contexto mais amplo, suas causas, definições e seu diagnóstico. 2. Procura de soluções alternativas mais promissoras. Esta fase envolve a busca de cursos alternativos de ação possíveis e que se mostrem mais promissores para a solução do problema, satisfação da necessidade ou alcance do objeto. 3. Análise e comparação dessas alternativas de solução. É a fase na qual as várias alternativas de curso de ação são analisadas, ponderadas e comparadas, no sentido de verificar os custos (tempo, de esforços, de recursos etc) e os benefícios que possam trazer, bem como consequências futuras e prováveis quanto á sua adoção. 4. Seleção e escolha da melhor alternativa como um plano de ação. A escolha de uma alternativa de curso de ação implica no abandono dos demais cursos alternativos. Há sempre um processo de seleção e de escolhas dentre várias alternativas apresentadas. A racionalidade está implícita nesta atividade de escolha. CONDIÇÕES DE DECISÃO As decisões podem ser tomadas dentro de três condições, a saber: 1. Incerteza: nas condições de decisão sob incerteza, o tomador de decisão tem pouco ou nenhum conhecimento ou informação para utilizar como base para atribuir probabilidade a cada estado da natureza ou a cada evento futuro. Em casos extremos de incerteza não é possível estimar o grau de probabilidade de que o evento venha ocorrer. É a situação típica com que se defronta o nível institucional das empresas, exigindo um planejamento contingencial que permita alternativas variadas e flexíveis. 2. Risco: nas situações de decisão sob risco, o tomador de decisão tem informação suficiente para predizer os diferentes estados da natureza. Porém, a qualidade dessa informação e sua interpretação pelos diversos administradores podem variar amplamente e cada administrador pode atribuir diferentes probabilidades conforme sua crença ou intuição, experiência anterior, opinião etc. 3. Certeza: nas situações sob certeza, o administrador tem completo conhecimento das consequências ou dos resultados das várias alternativas de cursos de ação para resolver o problema. É a decisão mais fácil de se tomar, 2

4 pois cada alternativa pode ser associada com os resultados que pode produzir. Mesmo que o administrador não tenha condições de investigar todas as alternativas disponíveis, ele pode escolher a melhor dentre as alternativas consideradas. Esta é uma situação excepcional e não a regra. TÉCNICAS DE APOIO À TOMADA DE DECISÃO: Brainstorming: Auxilia um grupo a imaginar/criar tantas ideias quanto possível em torno de um assunto ou problema, de forma criativa. Deve ser utilizada quando for necessário conhecer melhor o universo de uma situação, colher informações, opiniões e sugestões dos participantes, identificando problemas existentes e encontrando soluções criativas para o problema identificado. Pode ser estruturada ou não estruturada: o Estruturada: Cada indivíduo dever dar uma ideia a cada rodada. o Não-estruturada: As ideias são dadas conforme surge nas mentes dos indivíduos. Matriz de prioridade: Prioriza alternativas baseadas em determinados critérios e deve ser utilizada quando o objetivo é estabelecer uma entre diversas alternativas por meio de análise mais apurada. Árvores de decisão ou diagrama da árvore: Permite indicar, de forma gráfica, e cronológica, um caminho a ser seguido em um processo de decisão, explicitando etapas a serem cumpridas para alcançar o objetivo pretendido. 3

5 Mapas Cognitivos: Permite retratar ideias, sentimentos, valores, atitudes e seus interrelacionamentos, de modo a viabilizar o estudo, e posterior análise, utilizando para tal uma representação gráfica. Formalmente, os mapas cognitivos são definidos como grafos, em que cada conceito é considerado um nó, e uma relação de influência é uma ligação entre os nós. 4

6 EXERCÍCIO 1) Uma adequada compreensão do tema 'processo decisório' implica ter como corretas as seguintes afirmações, exceto: a) um problema cuja solução não dispõe de alternativas já está, por si só, resolvido. b) um único problema pode ser percebido de formas diferentes por diferentes indivíduos. c) o processo racional de tomada de decisão não exclui o uso da subjetividade. d) mesmo a melhor decisão pode acarretar um resultado desastroso. e) a tomada de decisão em equipe é preferível à tomada de decisão individual. 2) Nas organizações, as decisões rotineiras e as decisões causadas por variáveis diversas são denominadas, respectivamente, a) contínuas e de informações gerenciais. b) de apoio a decisões e não-estruturadas. c) estruturadas e de apoio a decisões. d) recorrentes e de informações gerenciais. e) estruturadas e não-estruturadas. 3) Na gestão contemporânea, o processo de tomada de decisão deve ter como objetivo a) apontar, dentre as alternativas satisfatórias, aquela que pode levar ao resultado desejado. b) indicar a alternativa realmente ótima para levar ao resultado projetado. c) elaborar cenários estratégicos que permitam calcular as opções com maior probabilidade de sucesso. d) definir as oportunidades e as ameaças existentes no ambiente de negócios. e) encontrar as alternativas que satisfaçam os interesses dos setores mais importantes da direção. 4) A tomada de decisão é um processo através do qual se seleciona-se uma ou mais alternativas de ação para se atingir o objetivo desejado. Em relação ao processo decisório, pode-se afirmar que a) a tomada de decisão é inerente essencialmente ao nível estratégico, cabendo ao nível tático seu desdobramento, e ao nível operacional, sua execução. b) a identificação e o diagnostico da situação problema ou a da oportunidade constituem etapas do processo decisório. c) a tomada de decisão no nível estratégico pode ser mais facilmente delegada do que no nível operacional. d) a dificuldade para que as informações sejam reunidas e organizadas, sendo mais facilmente modeláveis, não existe nas decisões não programadas. e) as decisões programadas são apropriadas para um ambiente de baixa incerteza. 5

7 5) Em um processo decisório, uma oportunidade diz respeito à(s) seguinte(s) fase(s): a) identificação da situação. b) diagnóstico da situação. c) desenvolvimento de oportunidades. d) avaliação de alternativas. e) seleção e implementação. 6) A decisão tomada corriqueiramente sobre assuntos inéditos e não programados caracteriza-se como uma tomada de decisão a) de nível operacional. b) de nível tático. c) equivocada. d) sem feedback. e) de nível estratégico. 7) A técnica de geração de ideias, de modo isolado ou associativo, que possam, por sua vez, estimular novas ideias com a finalidade de solucionar problemas é denominada a) ciclo PDCA b) matriz GUT. c) matriz de Ischikawa (causa e efeito). d) brainstorming. e) diagrama de Pareto. 8) No processo de tomada de decisões, os administradores devem pesar alternativas, muitas das quais envolvem acontecimentos futuros difíceis de serem previstos. Por isso, as situações de tomada de decisão são frequentemente classificadas em um continuum que vai da certeza (altamente previsível) à turbulência (altamente imprevisível). Conforme sugerido por James A. Stoner e Edward R. Freeman (1992), o risco refere-se à condição para tomada de decisão: a) na qual os administradores enfrentam situações externas imprevisíveis ou não têm as informações necessárias para estabelecer a probabilidade de determinados eventos. b) em que os administradores têm informações precisas, mensuráveis e confiáveis sobre os resultados das várias alternativas que estão sendo consideradas. c) em que os administradores conhecem a probabilidade de que uma determinada alternativa leve a um objetivo ou resultado desejado. d) que ocorre quando as metas não são claras ou quando o meio ambiente muda muito rapidamente. e) na qual os administradores têm informações insuficientes, porém confiáveis, sobre os resultados daquilo que está sendo levado em consideração no momento da tomada de decisões. 6

8 O USO DE DADOS E INFORMAÇÃO NAS ORGANIZAÇÕES A Inteligência Competitiva Inteligência Competitiva (ou Inteligência Organizacional) é a atividade de coletar, analisar e aplicar, legal e eticamente, informações relativas às capacidades, vulnerabilidades e intenções dos concorrentes, ao mesmo tempo monitorando o ambiente competitivo em geral. A definição de Zanasi (1998, p. 45) para sistema organizacional inteligente traz a essência da Inteligência Competitiva (IC) ao descrever esse sistema como elemento essencial para que as empresas possam: coletar informações do ambiente externo para entender as forças e fraquezas dos competidores; avaliar sua própria competitividade; prever as intenções dos competidores e as expectativas dos clientes e prever ações governamentais. Informação como Insumo Básico para as Atividades da Organização As organizações produzem e utilizam dados, informações e conhecimento de diferentes naturezas e, utilizam também, dados, informações e conhecimento produzidos externamente à organização que possibilitam um melhor desempenho no mercado em que atuam. Dentre eles pode-se citar: a) Estratégicos: subsidiam a tomada de decisão da alta administração e possibilitam aos analistas estratégicos definirem para a organização, as diretrizes, as políticas, os programas, as linhas de atuação, as prioridades, os indicadores de desempenho, os planos e planejamentos, ou seja, os cenários futuros, a missão e as metas, a atuação na sociedade e a imagem institucional; b) Mercado: possibilitam à alta administração, bem como à área comercial perceber oportunidades de negócios tanto no mercado nacional quanto no mercado internacional; c) Financeiros: viabilizam aos profissionais da área financeira processarem estudos de custos, lucros, riscos e controles; d) Comerciais: subsidiam a área comercial na exportação e/ou importação de materiais, produtos e serviços, bem como subsidiam a área jurídica em relação à legislação do país no qual estabelece-se a transação comercial; e) Estatísticos: subsidiam as áreas estratégica, financeira, comercial e de P&D, identificando em termos percentuais e/ou numéricos questões ligadas ao negócio da organização como: índices de exportação, importação, demandas e restrições de mercado, índices econômicos, poder aquisitivo, PIB, índice de desemprego, balança comercial, índices de investimentos etc.; 7

9 f) De Gestão: atendem as necessidades dos gerentes e executivos da organização no planejamento e gerenciamento de projetos, no gerenciamento de pessoas e situações diversas; g) Tecnológicos: subsidiam a área de P&D no desenvolvimento de produtos, materiais e processos tecnológicos, bem como monitoram a concorrência quanto as inovações de produtos, materiais e processos; h) Gerais: disseminados a todas as áreas da organização, possibilitando aos profissionais uma atualização constante, como por exemplo: notícias, fatos e acontecimentos etc.; i) Cinzentas: de qualquer natureza, para qualquer área e com qualquer finalidade de uso, que não são detectados em buscas formais de informação, como por exemplo: colégio invisível, memória de pessoas, documentos confidenciais de difícil acesso, corredores informais eletrônicos (Internet), etc. As unidades de trabalho que atuam diretamente com a gestão da informação, gestão do conhecimento ou inteligência competitiva, trabalham com essas diferentes naturezas informacionais e as encontram de três formas diferentes (figura abaixo): Os dados, informações e conhecimento estruturados são aqueles acessados dentro ou fora da organização e podem ser entendidos como aqueles que compõem bancos e bases de dados internos e externos, redes de comunicação como Internet, Intranets, publicações impressas etc. Dados, informações e conhecimento estruturáveis basicamente são aqueles produzidos pelos diversos setores da organização, porém sem seleção, tratamento e acesso. Como exemplo pode-se citar: cartões de visita, colégio invisível, nota fiscal, atendimento ao consumidor, entre outros. Dados, informações e conhecimento não-estruturados são aqueles produzidos externamente à organização, porém sem filtragem e tratamento. Alguns exemplos: informações veiculadas na mídia, mais especificamente TV e rádio, boatos, acontecimentos sociais e políticos. A inteligência competitiva necessita ter o mapeamento e a prospecção de dados, informações e conhecimento produzidos internamente e externamente à organização, 8

10 conhecer profundamente as pessoas chave da organização independentemente de cargos, assim como as pessoas estratégicas fora da organização, saber quais setores/instituições participam dos fluxos informacionais, formais e informais, tanto no ambiente interno quanto externo à organização, estar sensíveis as necessidades informacionais dos clientes internos e externos, visando elaborar produtos e serviços informacionais de qualidade e direcioná-los de forma adequada e, finalmente diminuir o stress informacional da organização. Todas essas ações visam, portanto, criar uma cultura informacional/intelectual na organização. Os dados, informações e conhecimento prospectados sobre empresas, produtos, mercados, materiais, processos, meio ambiente, tecnologia, pessoas, política, economia, finanças, comércio etc., têm a finalidade de dar maior segurança às direções perseguidas pela organização. Agregar valor é fundamental para que o processo de inteligência competitiva da organização, seja efetivo. Por isso, os serviços e produtos devem ser personalizados ao público usuário. Uma outra questão importante para a inteligência competitiva é a validade dos dados, informações e conhecimento, isto é, realmente eles respondem as perguntas críticas do negócio da organização quanto a consistência e confiabilidade, utilidade e obsolescência e, finalmente a confidencialidade exigida. O processo de inteligência competitiva organizacional deve seguir sete passos para seu funcionamento contínuo. São eles: 1. Identificar os "nichos" de inteligência internos e externos à organização; 2. Prospectar, Acessar e Coletar os dados, informações e conhecimento produzidos internamente e externamente à organização; 3. Selecionar e Filtrar os dados, informações e conhecimento relevantes para as pessoas e para a organização; 4. Tratar e Agregar Valor aos dados, informações e conhecimento mapeados e filtrados, buscando linguagens de interação usuário / sistema; 5. Armazenar através de Tecnologias de Informação os dados, informações e conhecimento tratados, buscando qualidade e segurança; 6. Disseminar e transferir os dados, informações e conhecimento através de serviços e produtos de alto valor agregado para o desenvolvimento competitivo e inteligente das pessoas e da organização; 7. Criar mecanismos de feedback da geração de novos dados, informações e conhecimento para a retroalimentação do sistema. O modelo proposto abaixo mostra de forma geral o Processo da Inteligência Competitiva que a organização deve gerenciar para obter competitividade empresarial. A inteligência competitiva possibilita o desenvolvimento da organização de forma contínua num mercado cada vez mais agressivo. 9

11 Dados, informação e conhecimento, conforme já mencionado anteriormente, são matérias-primas para o processo de inteligência competitiva. Através dela é possível estabelecer uma cultura organizacional baseada em informação e conhecimento, visando maior flexibilidade de atuação no mercado, assim como maior capacidade de criação e geração de tecnologia, ou seja, maior competitividade. Inteligência competitiva será o grande diferencial das organizações para esse novo milênio. 10

12 EXERCÍCIO 1) A definição: Capacidade de uma corporação como um todo de reunir informação, inovar, criar conhecimento e atuar efetivamente baseada no conhecimento que ela gerou refere-se: a) ao valor agregado da informação. b) ao capital intelectual. c) ao conhecimento tático. d) à vantagem competitiva. e) à inteligência organizacional. 2) No processo de desenvolvimento de inteligência competitiva organizacional, o responsável pela coleta de dados e informações solicitadas, monitoramento do ambiente, elaboração de entrevistas e manutenção das bases de dados atualizadas é o a) Coletor. b) Analista. c) Gerente. d) Gestor. e) Mentor. 3) Considere: Uma das vantagens do KM é o bom time-to-market que pode ser conferido ao corpo executivo das empresas, cuja capacidade de tomada de decisão com rapidez e eficiência é maximizada. Tal resultado pode ser ainda mais positivo quando as organizações combinam gestão do conhecimento com o processo de monitoramento dos ambientes competitivo, concorrencial e organizacional, visando subsidiar o processo decisório e o alcance das metas estratégicas de uma empresa. O trecho grifado no texto pode ser resumido como a) controle de concorrência ao acesso dos dados. b) gerenciamento dos recursos humanos do projeto. c) processos de monitoramento e controle dos projetos. d) processo de inteligência competitiva. e) gerenciamento do escopo do projeto. 11

13 BUSINESS INTELLIGENCE Business Intelligence (Inteligência Empresarial ou Inteligência de Negócios) é a capacidade de uma empresa para capturar, selecionar, analisar e gerenciar as informações relevantes para a gestão do negócio com o objetivo de: Inovar e criar conhecimento. Reduzir riscos na tomada de decisão e evitar surpresas. Direcionar, assertivamente, os planos de negócios e a implementação de ações. Criar oportunidades de negócios. Apoiar o desenvolvimento de produtos/serviços com uma base de informação confiável, eficiente e ágil. Monitorar, analisar e prever, eficientemente, as questões relacionadas ao core business. Gerar valor aos negócios. A infra-estrutura de Business Intelligence (BI) compreende: a extração, data warehouses, data marts e ferramentas para gerenciamento da informação e análise de dados como o data mining. Entre as definições mais aceitas está a que aponta BI como um termo guarda-chuva quer se refere a uma variedade de aplicações usadas para analisar e organizar uma série de dados. Também são considerados como sistemas, processos e tecnologias que partem desses dados e os transformam em um modelo visual que permite análises sofisticadas das 12

14 tendências de negócio. Oferecem uma estrutura de buscas efetiva, acessível e acurada; com métricas de negócio e relatórios que permitem aos lideres de negócio se manterem informados para tomar decisões baseados em fatos. De maneira resumida, BI é a habilidade para que a pessoa certa receba a informação adequada no momento correto para tomar a melhor decisão. A inteligência de negócio baseia-se em 4 atividades principais que servem de norte para o desenvolvimento de qualquer solução de BI: Gathering Data: coletar dados de diversas fontes; Storing Data: organizar esses dados; Analysing Data: analisar esses dados; Provinding Access to Data: compartilhar resultados com os executivos mais importantes da empresa. A área de BI está diretamente envolvida com os projetos de implementação de inúmeros sistemas transacionais (ST) em uma empresa: 13

15 ERP - Enterprise Resource Planning B2B Business to Business B2C Business to Consumer CI Competitive Intelligence KMS Knwonledge Management System CRM Customer Relationship Management PRM Partner Relationship Management EAI Enterprise Application Integration BSC Balanced Score Card (obs: refere-se a sistemas que apoiam o BSC em uma empresa) 14

16 EXERCÍCIO 1) O grande desafio do profissional de TI que gerencia qualquer processo é a análise dos fatos relacionados à função que exerce em uma organização. Essa análise deve ser feita com as ferramentas e os dados disponíveis, permitindo aos executivos e gerentes detectar as tendências e tomar as decisões com eficiência e eficácia. Devido a essa necessidade, surgiu o conceito de Business Intelligence - "BI". Assinale a alternativa que indique duas características dos atuais sistemas de Business Intelligence. a) procurar relações de causa e efeito / extrair e integrar dados de múltiplas fontes. b) evitar a utilização de ferramentas automatizadas / desprezar dados contextualizados. c) extrair e integrar dados de múltiplas fontes / evitar a utilização de ferramentas automatizadas. d) desprezar dados contextualizados / trabalhar exclusivamente com fatos reais e não hipotéticos. e) trabalhar exclusivamente com fatos reais e não hipotéticos / procurar relações de causa e efeito. 2) Business Intelligence (BI) refere-se ao processo para tomada de decisões em uma empresa, sendo de elevada importância a existência de um repositório próprio para os dados consolidados e já transformados em "informação real", que pode ser um Data Warehouse ou um Data Mart. Nesse contexto, duas aplicações são identificadas: a primeira, que sustenta o negócio por meio de ferramentas OLTP (On Line Transaction Processing), e a segunda, que analisa o negócio por meio de ferramentas OLAP (On Line Analytical Processing). Essas aplicações têm, como objetivos principais, respectivamente: a) levantamento e armazenamento de dados/ implementação de testes. b) controle e registro de transações/identificação de tendências. c) projeto e análise de sistemas/transformação de processos. d) pesquisa e teste de software/especificação de requisitos. e) busca e coleta de informações/substituição de rotinas. 3) A área de BI - Business Intelligence está diretamente envolvida com os projetos de implementação das aplicações de a) B2B, B2C e BSC. b) EAI, B2B e B2C. c) EAI, CRM e ERP. d) CI, KMS e BSC. e) CRM, PRM e ERP. 4) A inteligência do negócio (eventualmente mais conhecida como Business Intelligence) I. é construída quando a arquitetura de TI especificamente orienta-se para os interesses ou especialidades do negócio de forma exclusiva. II. utiliza ferramentas que consolidam, analisam e acessam vastas quantidades de dados para ajudar os usuários a tomar melhores decisões empresariais. III. utiliza como principais ferramentas os softwares para consulta e relatórios de banco de dados, ferramentas para análise multidimensional de dados e o data mining. 15

17 IV. confere às empresas a capacidade de acumular informações; adquirir conhecimentos sobre clientes, concorrentes e operações internas; e mudar o comportamento de tomada de decisão a fim de alcançar maior lucratividade e outras metas corporativas. Está correto o que se afirma em a) I e II, apenas. b) I, II e III, apenas. c) II e IV, apenas. d) II, III e IV, apenas. e) I, II, III e IV. 16

18 SISTEMAS DE APOIO À DECISÃO O Sistema de Apoio à Decisão (SAD) é um sistema baseado em computadores que através de informações e modelos especializados ajudam a resolver problemas organizacionais, sua função é apoiar o processo de tomada de decisão em áreas de planejamento estratégico, controle gerencial e controle operacional, sendo isso o que o diferencia dos demais tipos de sistemas de informações. Sua demanda surgiu diante do crescimento competitivo das organizações, pois o SAD é desenvolvido através de dados históricos e experiências individuais que são incorporados como informações úteis possibilitando melhores condições para a tomada de decisão e aumentando as vantagens obtidas pela empresa. Muitas empresas estão utilizando o SAD para melhorar o processo decisório. As razões citadas pelos gerentes são, segundo Turban (2004, p. 374): Necessidades de informações novas e mais precisas; Necessidade de Ter informações mais rapidamente; O monitoramento das inúmeras operações de negócios da empresa estava cada vez mais difícil; A empresa estava operando em uma economia instável; A empresa enfrentava maior concorrência nos mercados interno e externo; Os sistemas instalados na empresa não apoiavam adequadamente os objetivos de maior eficiência, rentabilidade e ingresso em mercados lucrativos; O departamento de sistemas de informação não conseguia mais atender à diversidade de necessidades imediatas da empresa e de seus executivos e não havia funções de análise de negócio embutidas nos sistemas existentes. Características Permitem o armazenamento de grandes volumes de dados e de diferentes fontes; Possuem flexibilidade de relatórios e apresentações; Possuem orientação gráfica e de texto; Suportam análise de Drill Down/Up; Realizam análises complexas e sofisticadas, utilizando pacotes de software avançados; Utilizam modelos analíticos; Permitem análise e simulação de cenários (ex: dados os custos atuais de distribuição qual o transporte que deve ser utilizado?); Orientado por métricas de desempenho; Orientado a processos de negócios; Apoiado por tecnologias especializadas. Tipos de sistemas de apoio à decisão. Sistemas de Informação Executiva (EIS) 17

19 Sistemas Especialistas (Expert Systems) Sistemas Artificiais / Redes Neurais Componentes de sistemas de apoio à decisão. SISTEMA DE GERÊNCIA DE BANCO DE DADOS (SGBD) SISTEMA DE GERÊNCIA DE BANCO DE MODELOS (SGBM) SISTEMA DE GERÊNCIA DE INTERFACE O banco de dados SAD que é uma coleção de dados atuais e históricos de uma variedade de sistemas ou grupos pode ser um pequeno banco de dados em um computador isolado ou ele pode ser um poderoso data warehouse continuamente atualizado por dados organizacionais. O sistema de software pode conter várias ferramentas OLAP, ferramentas de datamining ou uma coleção de modelos matemáticos ou analíticos que podem ser facilmente acessados pelo usuário do SAD. A interface do SAD que permite ao usuário interagir com o sistema de software deve ser simples. Um modelo de SAD pode ser físico, matemático ou verbal, visto que cada SAD é construído para um propósito, ele poderá fazer diferentes coleções de modelos disponíveis na organização dentro da realidade do propósito desejado. Os modelos mais conhecidos e utilizados são: Modelos estatísticos; Modelos de otimização ou Modelos de previsão; Modelos de biblioteca e Modelos de análise de sensibilidade 18

20 EXERCÍCIO 1) O sistema de apoio a decisão a) visa obter informações de todos os níveis a partir de informações detalhadas armazenadas nos sistemas de processamento de ações. b) analisa dados on-line coletados por sistemas de processamento de transição, para ajudar as pessoas a executar ações operacionais. c) visa obter informações de alto nível a partir de informações gerenciais armazenadas nos sistemas de processamento de documentos. d) analisa dados coletados por sistemas de processamento de inovação, para ajudar as pessoas a viabilizarem ações de transcrições. e) analisa dados on-line coletados por sistemas de processamento de transação, para ajudar as pessoas a tomarem decisões de negócios. 2) Um sistema de apoio à decisão informatizado, no seu modelo básico, tem quatro componentes. Assinale qual dos relacionados abaixo NÃO é um desses componentes. a) Sistema de Gerência de Metadados em Data Warehouse (SGMD) b) Sistema de Gerência de Banco de Modelos (SGBM). c) Sistema de Gerência de Banco de Dados (SGBD). d) Sistema de Gerência de Interface. e) Usuário. 3) Sistemas são conjunto de tarefas, controles e programas que interagem de maneira a obter resultados complementares e têm como objetivo um fim certo e planejado. Como exemplo, pode-se citar um modelo genérico de tomada de decisão que analisa um grande número de variáveis, para que seja possível o posicionamento a uma determinada questão. Trata-se de um sistema denominado: a) Sistema de Informações Executivas (SIE). b) Sistema de Apoio à Decisão (SAD). c) Sistema de Informações Gerenciais (SIG). d) Automação de Escritórios (AE). 4) Os sistemas de apoio à decisão são sistemas que ajudam na análise de informações do negócio. Os Banco de Dados de apoio à decisão exibem certas características especiais. NÃO é uma característica adicional dos Bancos de Dados de apoio à decisão. a) Em geral, a integridade é uma preocupação (supõe-se que os dados estão corretos quando são carregados pela primeira vez e não são atualizados subsequentemente). b) As colunas tendem a ser usadas em combinação. c) As chaves frequentemente incluem um componente temporal. d) O Banco de Dados tende a estar fortemente indexado. e) O Banco de Dados envolve frequentemente vários tipos de redundância controlada. PROJETO DE BI: ETAPAS, EQUIPE E TIPOS DE SOLUÇÃO 19

21 ETAPAS DO PROJETO DE BI O projeto de BI deve ser realizado de forma iterativa, dividindo a tarefa macro em iterações com objetivos menos ambiciosos e mais facilmente delimitados. De uma maneira geral as etapas do projeto de BI organizam-se da mesma forma que os projetos de engenharia em geral. Justificativa: Avaliação das necessidades que motivam o projeto. Planejamento: Planejamento tático e estratégico que definem como o projeto será cumprido e entregue. Análise de negócio: Análise detalhada do problema ou oportunidade de negócio para entendimento dos requisitos de uma potencial solução o produto. Projeto: Concepção de um produto que resolva o problema ou aproveite a oportunidade. Construção: Desenvolvimento do produto que trará o retorno sobre o investimento desejado em um período pré-determinado. Entrega: Implantação ou venda do produto finalizado, mensuração da efetividade para definir se o retorno sobre o investimento foi alcançado, excedido ou falhou. ETAPAS DO PROJETO DE DESENVOLVIMENTO ITERATIVO DETALHAMENTO DAS ETAPAS DO PROJETO DE DESENVOLVIMENTO ITERATIVO 20

22 JUSTIFICATIVA PLANEJAMENTO ANÁLISE DO NEGÓCIO Oportunidade de Negócio Problema ou oportunidade de negócio definido e solução de BI proposta Justificativa do custo de cada versão do aplicativo de BI e definição clara dos seus objetivos Avaliação da Infraestrutura Empresarial Infraestrutura Técnica: hardware, software, middleware, SGBD s, sistemas operacionais, componentes de rede, repositórios de metadados, utilitários, etc. Infraestrutura Não Técnica: padrões de metadados, padrões de nomenclatura de dados, modelo de dados empresarial, metodologias, padrões de teste, resoluções de disputas, etc. Planejamento do Projeto Detalhamento de escopo, equipe, orçamento, tecnologia, representantes do negócio Acompanhamento próximo do progresso do projeto Definição dos Requisitos do Projeto Definição do escopo do projeto. Definição dos requisitos mínimos de cada iteração. Análise de dados Análise da qualidade dos dados disponíveis nas fontes Adaptação dos modelos de dados existentes às fontes de dados e requisitos dos usuários. Consolidação e conciliação dos dados provenientes de diversas áreas da organização que muitas vezes se valem de regras de negócio e padrões de modelagem distintos para cada área. Prototipagem do Aplicativo Análise das versões funcionais do aplicativo Utilização de ferramentas de prototipagem rápidas oferecidas pelos principais frameworks de desenvolvimento ou mesmo de terceiros Percepção das potencialidades e limites da tecnologia pelas equipe de negócios Ajuste dos requisitos de projeto e expectativas Análise do Repositório de Metadados Definição dos metadados a serem capturados e armazenados Mapeamento dos metadados de negócio nos metadados da ferramenta de BI Definição da utilização de um repositório comercial ou do desenvolvimento de um repositório próprio 21

23 PROJETO CONSTRUÇÃO Projeto do Banco de Dados Projeto dos esquemas dos bancos de dados em função dos requisitos de acesso às informações Armazenamento tanto de dados agregados quanto detalhados Projeto de ETL Limpeza dos dados coletados Transformação dos dados coletados para as estruturas de armazenamento de dados projetadas Carregamento dos dados tratados nos repositórios Utilização de ferramentas específicas para tarefas ETL Projeto do Repositório de Metadados Documentação do metamodelo de dados Opção pela utilização de um modelo entidade-relacional ou orientado a objetos Implementação de todos os requisitos do metamodelo lógico no projeto Desenvolvimento de ETL Desenvolvimento de extensões das ferramentas para lidar com as características únicas de cada projeto Desenvolvimento do Aplicativo Desenvolvimento de soluções robustas para prover acesso aos dados e ferramentas de análise a pessoas com pouca ou nenhuma experiência nesse tipo de tarefa. Mineração de Dados Identificação e exposição de informações escondidas nas características e relacionamentos entre os dados. Identificação de relações não óbvias ou previsíveis entre os dados Desenvolvimento do Repositório de Metadados A necessidade do desenvolvimento aplica-se unicamente aos casos onde se fez a opção por não utilizar uma solução comercial disponível Dada a sua complexidade, em geral, é tratado como um projeto com equipe específica e desenvolvimento paralelo ao da solução de BI. 22

24 ENTREGA Implementação Verificação e teste exaustivo de todos os componentes do aplicativo de BI Treinamento da equipe de negócios e demais stakeholders Disponibilização de helpdesk Manutenção das bases de dados de BI Agendamento e execução das tarefas de ETL Monitoramento de desempenho Ajuste das bases fonte Avaliação da Versão Houve respeito aos prazos e orçamentos? Como foram solucionadas as disputas? Quais ajustes foram feitos nos processos? Avaliação das ferramentas, tecnologias e processos À medida que as pessoas envolvidas com o projeto conhecem mais a solução de BI, as potencialidades e limitações da tecnologia ficam mais claras e os requisitos impostos por esses usuários podem mudar. É importante que a equipe de desenvolvimento entenda essa situação para não se frustrarem. É importante considerar também que nem todos os requisitos dos usuários são estratégicos nem precisam ser mapeados em estruturas multidimensionais. Por mais modernas que sejam as ferramentas de ETL, dificilmente todas as particularidades serão contempladas. Dessa forma, o desenvolvimento de extensões dos aplicativos torna-se uma tarefa quase obrigatória para a realização desse tipo de tarefa de forma adequada. Uma das tarefas mais importantes no desenvolvimento iterativo é a análise daquilo que funcionou e daquilo que deve ser melhorado na próxima iteração. O aprendizado a respeito da metodologia e da forma de trabalho da equipe deve ser contínuo, adaptando a solução e a metodologia de desenvolvimento a cada versão lançada. 23

25 EQUIPE DO PROJETO DE BI A equipe de desenvolvimento do projeto de BI deve possuir habilidades complementares para alcançar os objetivos com sucesso. Deve-se ter pessoal especializado especialmente para o desenvolvimento de ETL, do aplicativo e dos repositórios de dados e metadados. A equipe é dividida em dois grupos fundamentais: Equipe fundamental (core): auto-organizada com redistribuição de tarefas entre si bem como auto-análise do trabalho. Equipe extendida: participam do projeto sem que ele seja sua principal atividade. Podem ter um cronograma de atuação junto à equipe fundamental ou participarem de sessões onde sua expertise é necessária. EQUIPE FUNDAMENTAL Um grupo restrito de 4 ou 5 (nunca mais que 7) participantes terá 100% de sua disponibilidade alocada no projeto de BI do seu início até o fim. Esse grupo de membros permanentes será responsável pela liderança do projeto e terá atribuições como: Gerente de projeto Representantes do negócio Analista do departamento de TI Técnico (analista ou programador sênior) de TI Há também membros permanentes das etapas, que ficam 100% alocados no projeto durante as etapas nas quais seus conhecimentos são requeridos. Dentre eles destacam-se: Desenvolvedor líder do aplicativo: projeta e acompanha o desenvolvimento do aplicativo de acesso e análise de dados Arquiteto de Infraestrutura de BI: estabelece e mantém a infraestrutura técnica de BI. Apesar de fazer parte da equipe fundamental, em geral, está hierarquicamente subordinado ao arquiteto estratégico do time estendido. Representante do Negócio: participa da modelagem das sessões, definições de dados, escreve casos de teste, toma decisões de negócios, resolve disputas entre unidades de negócio e aumentam a qualidade dos dados sob controle da unidade de negócio de BI. 24

26 EQUIPE ESTENDIDA Os membros da equipe estendida são aqueles que não se dedicam exclusivamente ao projeto em momento algum do ciclo de desenvolvimento mas são utilizados na realização de tarefas específicas no seu desenrolar. Nesse grupo demos listar: Administrador de Dados: analisa os dados inter-oganizacionais, cria modelos lógicos específicos para o projeto, mescla os modelos lógicos de dados com os modelos lógicos organizacionais. Especialista em Mineração de Dados: seleciona e executa as tarefas de mineração de dados Analista de Qualidade de Dados: avalia a qualidade da fonte de dados e prepara as especificações de limpeza para a tarefa de ETL Administrador de Banco de Dados: projeta, carrega, monitora e faz a sintonia das bases de dados Desenvolvedor Líder de ETL: projeta e acompanha os processos de ETL Desenvolvedor de Aplicativo: codifica os programas de relatórios e dashboards, escreve consultas e desenvolve os programas de acesso e análise de dados Suporte de BI: mentoring e treinamento da equipe de BI Patrocinador Empresarial: coloca o projeto de BI em evidência na empresa e elimina os entraves dentro da organização Desenvolvedor de ETL: codifica programas e configura as ferramentas de ETL Auditor de TI Analista de QA: determina os riscos e exposição do projeto de BI devido à perda de controle interno ou fatores externos, é o profissional responsável por atuar com auditorias internas e externas Desenvolvedor do Repositório de Metadados: codifica programas de migração de metadados e carregar os repositórios. Equipe de Serviços de Rede: mantém o ambiente de rede. Equipe Operacional: executa os programas em lote de ETL, sistemas de acesso e análise de dados e do repositório de metadados. Executivo de Segurança: garantem que os requisitos de segurança estejam definidos e que as funcionalidades de segurança sejam testadas nas ferramentas e bases de dados. Stakeholders: cuidam de responsabilidades específicas no projeto de TI de acordo com sua função e habilidades Arquiteto Estratégico: gerencia a infraestrutura técnica da organização Equipe de Serviços Técnicos: mantém a infraestrutura de hardware e sistemas operacionais 25

27 TIPOS DE SOLUÇÃO DE BI As aplicações de BI podem ser dividias em 7 subgrupos principais que diferem entre si pela forma de acesso e exibição dos dados e pelo tipo de análise oferecida. São elas: Consulta direta à base Mineração de dados Relatórios padronizados Aplicativos Analíticos Dashboards Scorecards BI Operacional A maior parte das ferramentas pode ser acessada através de um portal corporativo de BI enquanto algumas funcionam como aplicações standalone ou mesmo integrada a outros sistemas de negócio. A forma de acesso pode ser dividia entre: Ad hoc: acesso customizado feito individualmente pelo usuário, é destinado a usuários experientes familiarizados com a construção de consultas e tarefas de mineração de dados Push-button: relatórios disponíveis a partir da seleção de parâmetros prédeterminados ou mesmo com opções padrão Relatórios operacionais: exibem sempre as mesmas informação sem a possibilidade de o usuário os configurar A análise oferecida pelos aplicativos pode ser: Estratégica: utilizada para a tomada de decisão de alto nível na empresa, em geral direcionada a cargos gerenciais e diretoria Tática: utilizada na operação ou produção, visa dar suporte às atividades de rotina da empresa 26

28 EXERCÍCIO Considere a Figura abaixo para as questões 1, 2 e 3: 1) Considerando o contexto da solução de BI do Grupo Montanhês, no segundo parágrafo, a integração inicial apenas dos dados financeiros e contábeis vindas de sistemas legados indica que a) foi utilizada uma implementação top down. Nesta implementação há um grande trabalho inicial, envolvendo todas as pessoas da empresa que irão participar do projeto, o que força a empresa a definir regras de negócio de forma corporativa antes de se iniciar o projeto do DW. b) não foi utilizada a implementação top down, porque o processo se iniciou com a extração, transformação e integração das informações dos sistemas internos, dados externos e das fontes operacionais para um ODS. c) foi utilizada uma implementação bottom up, porque a partir do DW foram extraídos os dados e metadados para os Data Marts departamentais do grupo empresarial. d) foi utilizada uma implementação bottom up, que permite que o planejamento e desenho dos Data Marts possam ser realizados sem esperar pela infraestrutura corporativa do DW, permitindo um ROI mais rápido. 27

29 e) foi utilizada uma implementação combinada que tem o propósito de integrar a arquitetura top down com a bottom up, usando diversos modelos de Data Marts, gerados de uma só vez. 2) Ao grupo Montanhês foi apresentada uma solução de BI que trouxe diversas vantagens para o grupo empresarial. O resultado dessa solução permitiu: 1 - Informação disponível para gestão 2 - Visão de curvas de comportamento 3 - Agilidade de ferramentas para apoio à gestão 4 - Segurança de informações para decisão 5 - Maior abrangência de visão de indicadores 6 - Recursos mais abrangentes para análise de negócios 7 - Necessidades e expectativas atendidas por ferramentas de TI A solução apresentada foi a) um projeto de banco de dados transacional. b) uma modelagem de banco de dados multidimensional. c) um projeto de Data Warehouse. d) um query & report de uma ferramenta OLAP. e) uma operação ETL. 3) Nos parágrafos 5 e 6, são feitas referências à geração de relatórios e à consulta a painéis. Sobre este tema é correto afirmar que a) os relatórios são gerados automaticamente pelo sistema de BI e os usuários finais os acessam por meio de painéis, que são equipamentos acoplados aos monitores. b) os painéis consolidam informações gerenciais geradas por ferramentas OLTP, que acessam o DW para gerar relatórios padronizados. c) o sistema OLTP recebe dados de ferramentas OLAP para realizar as análises que geram os relatórios. Essa carga de dados acontece conforme a necessidade da empresa. Os painéis servem de apoio aos usuários para a tomada de decisões gerenciais. d) um painel típico é formado por gráficos e outros recursos visuais que expandem os dados apresentados nos relatórios. Os relatórios gerados pelo sistema de BI são concisos e pouco precisos e os painéis mais detalhados e mais complexos, por isso de uso exclusivo dos altos executivos. e) os usuários finais têm acesso às ferramentas OLAP para extrair os dados das bases e construir relatórios capazes de responder às suas questões gerenciais. Os paineis sumarizam parte das informações de forma concisa e clara usando recursos visuais. 4) Os portais corporativos oferecem acesso on-line às informações e aplicações das empresas por meio das tecnologias de Internet, com objetivo de apoiar diretamente o negócio e ajudar essas empresas a serem mais competitivas. Esses portais a) devem incluir ferramentas de inteligência de negócios (Business Inteligence), gestão de conteúdo, data warehouse e informações estratégicas. 28

30 b) devem integrar internet, intranet, extranet e sistemas legados, permitindo assim o aumento dos níveis de eficiência e de qualidade das relações nas organizações para serem considerados colaborativos. c) são soluções puramente técnicas, pois dependem das Tecnologias de Informação e Comunicação (TICs) para impactar os processos de negócio. d) têm, como um de seus principais apelos, a promessa de fazerem o just in time da informação: levar a informação certa, para a pessoa certa, na hora certa. e) necessitam, fundamentalmente, de estabelecer métricas para avaliá-los e acompanhar a sua evolução, porém, as únicas métricas realmente úteis são as qualitativas, que avaliam o grau de satisfação do usuário com o portal. 29

31 INTRODUÇÃO FUNDAMENTOS DO DESIGN DIMENSIONAL A modelagem dimensional é a técnica utilizada para se ter uma visão multidimensional dos dados e não uma visão simplista, como na modelagem relacional. Abaixo tem-se dois comparativos do modelo relacional com o modelo dimensional. TABELAS FATO E DIMENSÕES A modelagem dimensional é constituída basicamente de dois tipos de tabelas: Tabelas fatos: o Contém valores (métricas) o E as chaves o Podem existir várias no modelo o Pk=concatenação de Fk das dimensões o Uso de chaves sequenciais 30

32 Tabelas dimensões o Pontos de entrada o Hierarquias e níveis de quebra o Granularidade coerente com fato FASES DA MODELAGEM DIMENSIONAL As fases da modelagem dimensional são de extrema importância para serem cumpridas em um projeto de BI. As fases podem ser divididas em: Contato e definição da área de negócios; Levantamento das necessidades; Planejamento do projeto; Objetivos; Dificuldades para encontrar as informações almejadas; Indicadores estratégicos; Métricas iniciais; Restrições de informações; Estrutura e tecnologia; No levantamento das necessidades, deve ser considerado: Dificuldades e restrições o Indicadores, métricas e comparativos o Sempre observar as dimensões e as combinações Importante ter o modelo de dados existentes: MER Arquivos, dados manuais, planilhas eletrônicas. 31

33 ESTRUTURAS DO MODELO DIMENSIONAL A estrutura de um modelo dimensional é importante no que tange aos seguintes aspectos: quantidade de tabelas; disposição das tabelas; normalização ou desnormalização; acesso; desempenho; hierarquias; cascateamento das tabelas; Desnormalização Na modelagem do banco de dados relacional aplicamos a normalização (formas normais). Contudo, no DW ou Data Marts faz-se necessário, em alguns casos, desnormalizar as tabelas. Visa obter o grau de desempenho elevado ao reduzir o número de junções das tabelas. Agilidade na consolidação também é uma característica da desnormalização. Existem quatro modelos, cada com suas características, como mostra a figura a seguir: Star Schema (estrela); Snowflake (flocos de neve); Starflake; Galaxy. 32

34 SCHEMA ESTRELA o Dimensões desnormalizadas o Voltado para acessos com mais performance o Hierarquias achatadas o Uma tabela fato ao centro e as dimensões ligadas à ela. SCHEMA SNOWFLAKE (flocos de neve) o Modelo similar a Entidades e Relacionamentos o Tabelas em cascata o Normalizado o Hieraquias mantidas o Muitas tabelas o Muitas junções 1 : N SCHEMA STARFLAKE o Combinação das duas anteriores o Dimensões com N x N com outras tabelas GALAXY SCHEMA o Várias fatos o As dimensões podem estar dispostas de formas diversas o As fatos não se relacionam 33

35 ARQUITETURA DO DATA WAREHOUSE INTRODUÇÃO A teoria de banco de dados foi difundida e está disponível há alguns anos. Nesta teoria os dados eram armazenados com o propósito maior de realizar operações transacionais, sejam em tempo real, sejam em um intervalo de tempo programado. Mas também eram utilizados, em menor frequência, para a execução de processos analíticos. O conceito de Data Warehouse (armazém de dados) surgiu no início da década de 80 quando os sistemas gerenciadores de banco de dados (SGBD) apareceram como facilitadores da computação de dados, e consequentemente, facilitadores da tomada de decisão. Alguns autores dizem que Inmon é o pai do Data Warehouse, isto pelo fato de Inmon ter observado que os dados poderiam ser organizados em um ativo corporativo que o mesmo nomeou de Data Warehouse. Data Warehouse é uma coleção de dados orientada por assuntos, integrada, variante ao tempo, e não volátil, que tem por objetivo dar suporte aos processos de tomada de decisão. Orientado por assunto: a primeira característica do DW é que ela é orientada em torno dos grandes assuntos da empresa. Integrado: os dados encontrados dentro do armazém de dados serão sempre, sem possibilidades de exceção, integrados. Não volátil: modificações nos dados já existentes não ocorrem no data warehouse. Variante no tempo: os dados no Data Warehouse podem ser apresentados em tempos determinados. Tem-se duas estratégias para elaboração de um DW, que são defendida pelos dois principais autores: Monolítica - tudo de uma vez (Bill Inmon - DW) Incremental - passo a passo (Ralph Kimball - Data Marts) Também pode-se pensar em uma convergência destes dois mundos: Data Marts com plano de integração definido para o DW Integração evolutiva implementação gradativa 34

36 DATA WAREHOUSE Os dados disponíveis nos Data Warehouses poderão ser acessados pelos gerentes, analistas e usuários finais, possibilitando a realização de várias tarefas, tais como processamento analítico (OLAP) ou inteligência empresarial (BI business intelligence). O Data Warehouse - armazém de dados - armazena o acúmulo de dados históricos. Pode conter dados por muitos anos, com tamanho de armazenamento muito grande. Normalmente depois de completadas as transações comerciais na aplicação ou no armazenamento de dados operacionais, elas são transferidas para o warehouse. Também pode-se estabelecer uma periodicidade adequada para esta transferência dos dados. Para o funcionamento da inteligência empresarial, os dados brutos operacionais, mantidos nos bancos de dados corporativos, espalhados por vários sistemas da organização e em fontes heterogêneas, são colocados (processo de ETL extração, transformação e carga) em um Data Warehouse. Usando ferramentas de inteligência nos negócios, são feitas consultas, relatórios diversos, ou quaisquer outras análises, como gráfico e relatórios. Pode ser iniciado também o processo de Data Mining - mineração de dados. (Figura abaixo). 35

37 Respond: No Data Mining são fornecidas percepções dos dados corporativos que não podem ser obtidos com o OLAP. São feitas descobertas de padrões e relacionamentos ocultos em grandes bancos de dados e inferindo regras a partir deles para prever comportamentos futuros. Tais modelos e regras são utilizados para guiar o processo de decisão e prever o efeito de decisões. Os tipos de informações que são obtidos com o data mining incluem: associações; sequências; classificações; aglomerações e prognósticos. (LAUDON; LANDON; 2007). Esses sistemas podem realizar análises de alto nível quanto a padrões ou tendências, mas também podem esmiuçar os dados para revelar mais detalhes, se forem necessários. O Data Warehouse (DW) é um componente central de uma infraestrutura de Business intelligence (BI), funciona como um repositório, ou seja, um armazém de análise de informações numéricas estáveis e verificáveis (Jacobson et al. 2007). 36

38 Machado (2004) explica que, de forma geral e como demonstrado na figura abaixo a estrutura do DW está em evolução. A evolução pode ser considerada como uma resposta à complexidade deste ambiente e à dificuldade de integrar todos os componentes. Os sistemas transacionais (OLTP) dão o início a esta construção incremental. Observa-se na figura os Data Marts. São pequenos DW que atendem a certas áreas específicas das organizações. As vantagens de se trabalhar com Data Marts são: custo mais baixo testes facilitados menor tempo de implantação GRANULARIDADE, MÉTRICAS E INDICADORES O Grão é a unidade de medida de um indicador para serem obtidos resultados de desempenho. Tem o nível atômico de dados - nas tabela fato e dimensão. Considerações que devem ser levadas em conta: Volumes de dados Necessidade de informações para o negócio Disponibilidade do dado fonte Algumas possibilidades de granularidade: Nível de transações (Documento da NF) Nível de ítem de um documento (Item da NF, da OS, do Pedido) 37

39 Tempo: o Nível diário o Nível semanal o Nível mensal, etc A granularidade da tabela Fato está diretamente relacionada com as granularidades das tabelas dimensões. Para implantação eficiente de todos os conceitos do BI, a utilização de indicadores de desempenho é fundamental como instrumento estratégico para o processo de tomada de decisão. Os indicadores permitem por meio de análise e interpretação de dados, a evidência de fatos que facilitam o processo. De acordo com Tavares (2005), as medidas de desempenho podem focalizar o futuro e não apenas o registro do desempenho passado. O estudo dos indicadores é fundamental para uma projeção futura, com elaboração de tendências e metas. Segundo Leme Filho (2004), os indicadores de desempenho têm como principal objetivo apresentar de forma clara a situação de determinados assuntos de negócios que a empresa considera como vitais. O autor mostra que, para serem intuitivos, os indicadores de desempenho devem ser representados através de gráficos e cores, com poucas informações escritas e números. Sendo assim, a representação visual facilita o entendimento por parte dos gestores da evolução e projeção dos resultados obtidos pelas empresas e permite um ganho no processo de tomada de decisão, além de fornecer uma interface mais amigável para o mesmo. As métricas são as medicas colocadas na tabela fato para obtenção das análises. São ligados à granularidade. Escolher para a tabela Fato os atributos numéricos. Os típicos são: Quantidade Valor Custo do produto Lucro Consumo Etc. 38

40 DIMENSÕES CONFORMADAS E CHAVES NO MODELO DIMENSIONAL Assim como a granularidade, o conceito de dimensões conformadas é um dos pilares da modelagem dimensional. Diz respeito às entidades (dimensões) que servem de perspectivas de análise para qualquer assunto da organização. Ou seja, as dimensões estão em conformidade com os assuntos escolhidos. Modelar dimensões conformadas significa que seus atributos não são conflitantes com um ou mais Data Marts ou com o Data Warehouse. Ex.: se estivermos falando de unidades vendidas (métrica) de uma loja (dimensão) em um mês (dimensão), estamos falando do mesmo dado de um produto (dimensão). A modelagem dimensional tem por meta construir DW com dimensões conformadas e fatos com granularidade mais próximos possíveis. No intuito de criar maior estabilidade, as chaves no modelo dimensional tem um princípio diferente do modelo relacional. No relacional utilizamos muito chaves inteligentes, que carregam significado nas mesmas. Já no modelo dimensional, para dimensões e fatos, utilizamos Surrogate Keys. Surrogate Key (SK) = chave numérica sequencial. Sem nenhum sentido embutido, evitando conflito de mudanças de chave; Contudo, nas tabelas dimensões, mantemos as chaves inteligentes do modelo relacional para a identificação dos registros. 39

41 EXERCÍCIO 1) Com relação aos conceitos de modelagem dimensional, assinale a opção correta. a) Na abordagem utilizada por Kimball, todos os dados de uma empresa são reunidos em um repositório central, caracterizado por um projeto dimensional, e que pode ser consultado diretamente. b) A abordagem de Inmon consolida todas as informações de uma empresa em um repositório central chamado data warehouse corporativo. Essa abordagem é caracterizada por um projeto na terceira forma normal, no qual os dados são consultados diretamente por aplicativos de data warehouse. c) Na abordagem de Kimball, os data marts são adaptados às necessidades e pontos de vista de um grupo de negócios específico, suportando a modelagem dimensional, e são consultados por aplicativos de data warehouse. d) A abordagem de data marts autônomos tem foco empresarial e atende às necessidades dentro de uma área de assunto. Seu desenvolvimento necessita explorar o uso de elementos de dados comuns em toda a empresa. e) Se, em um sistema transacional usando-se um esquema estrela, um cliente, identificado por Codigo_do_cliente 1010, modificar o seu endereço da empresa sede, então, para fins analíticos, não será possível acompanhar a história de endereços desse cliente, pois, nessa abordagem, depende-se de Codigo_do_cliente para identificar uma linha exclusiva na dimensão cliente, de tal forma que não é possível armazenar várias versões do cliente. 2) A literatura especializada lista quatro etapas a serem seguidas nos processos de Modelagem Dimensional no que concerne Data Warehouses e Data Marts. Essas etapas caracterizam-se pela identificação/especificação: a) do processo de negócio; da granularidade; das dimensões; das medidas; b) da granularidade; das dimensões; das medidas; do ETL; c) das dimensões; das medidas; do modelo físico da base de dados; do ETL; d) das dimensões; das medidas; do modelo lógico da base de dados; do ETL; e) do processo de negócio; das dimensões; das medidas; do modelo lógico da base de dados. 40

42 TABELAS DIMENSIONAIS E DESIGN DAS DIMENSÕES Modelar corretamente o DW será um diferencial para o BI. As análises dependem diretamente de como o DW foi modelado. FUNDAMENTOS E CONCEITOS As tabelas dimensão são pontos de entradas da estrutura do DW. A principal função é reunir os atributos que serão utilizados para qualificar e sumarizar as consultas analíticas. São compostas de atributos textuais. Dimensões e seus atributos servem também como filtros e como cabeçalho (header) dos relatórios. Dimensões típicas: o Produto/serviço: o que vendo o Fornecedor: quem vende o Cliente: quem compra o Tempo: quando foi feito a compra o Local: loja, cidade, estado, etc - onde Abaixo temos uma modelagem Estrela de um DW. Ao centro a tabela foto (f_venda). E conectado a ela as dimensões (d_vendedor; d_tempo; d_filial; d_produto). CARACTERÍSTICAS DAS DIMENSÕES As dimensões são criadas para descrever todos os atributos necessários. Devem ter atributos descritivos, porém sem campos nulos. Normalmente um DW ou Data Mart tem entre 4-15 dimensões: Menos: faltou observação(tempo-espaço-tipo) Mais: dimensões supérfluas ou necessita a divisão do DW 41

43 As dimensões são os descritores das Fatos. Aplica o conceito de SK (surrogate key chave sequencial) para independência. Não esquecendo de manter, como atributo, a chave inteligente do BD Relacional. HIERARQUIAS EM DIMENSÕES As dimensões normalmente tem hierarquias, e as hierarquias tem níveis. As dimensões podem ser relacionadas com mais de uma tabela fato, ou mesmo com mais de uma dimensão no mesmo DW. O relacionamento entre as dimensões são feitas dependendo de JOINS, o que compromete a performance das consultas analíticas. As operações de hierarquias são roll-up (aumenta o nível de agregação) e drill-down (diminui o nível de agregação). Estas operações são normalmente realizadas segundo as hierarquias (1:N) das Dimensões, mas não necessariamente, Ex: Tempo: dia semana quinzena mês trimestre ano Produto: produto sub categoria categoria departamento Fornecedor: fornecedor cidade região EquipeDeVenda: equipe região DIMENSÕES COMPARTILHADAS As dimensões podem ser compartilhadas entre vários projetos de DW ou Data Marts. É fundamental para a integração, pois será o ponto de conexão entre as Fatos. Observar sempre a granularidade necessária para as dimensões: o Tempo ano-semestre-trimestre-mês-dia o Cliente tipo de cliente-cliente o Geografia país-região-estado-cidade-loja DIMENSÕES TÍPICAS E SEUS ATRIBUTOS Sempre (ou na maioria dos casos) a dimensão TEMPO estará presente nos DW. Os servidores tratam a dimensão tempo como especial: Podem ser obtidas diretamente de uma fonte simples: campo data de uma tabela Podem ser obtidas de uma tabela fonte: dimensão tempo bem projetada com dia, feriados, tags de fim de semana, etc Normalmente define-se tempo como uma dimensão a ser compartilhada com todos os Data Marts. Tabela dimensão TEMPO padrão: o Chave SK surrogage key (PK) o Campo de data (chave inteligente do BD relacional) o Dia-semana o Número-do-dia-mês 42

44 o Número-dia-geral (corrido no ano - 01 a 365) o número-semana-ano (01 a 52) o Mês o Trimestre o Período fiscal Estes atributos são apenas sugestivos para a tabela dimensão Tempo, pois dependerá do levantamento das necessidades da organização. Tabela dimensão CLIENTE padrão: o Chave SK (Pk) o Chave inteligente do BD relacional o Prenome e meio-nome o Sobrenome o Sexo o Profissão o Data nascimento o Etc. Estes atributos são apenas sugestivos para a tabela dimensão Cliente, pois dependerá da necessidade da organização. Algumas dicas quanto aos atributos: o Escolher com cuidado os campos; o Campos candidatos a remoção: Campos usados por poucos usuários Campos que não tenham valor de negócio Campos de dimensões degeneradas, como número de ordem/pedidos, caso a granularidade seja o item dessas entidades 43

45 EXERCÍCIO 1) Um dos modelos mais utilizados na modelagem de data warehouses é o modelo dimensional, sobre o qual é correto afirmar que a) o número mínimo de tabelas dimensão em um modelo dimensional é 2. b) cada modelo dimensional contém, pelo menos, 2 tabelas fato c) as tabelas dimensão contêm atributos que visam descrever características de cada dimensão. d) cada tabela fato não pode conter mais do que 10 atributos. e) a cardinalidade do relacionamento entre tabelas dimensão e tabelas fato é de 1 para 1. 44

46 TABELAS FATO CONCEITOS É tabela dominante (principal) em um modelo de DW - podem existir várias no mesmo DW. Fica rodeada pelas tabelas Dimensão. O armazenamento de valores das medidas e o volume de dados históricos é muito grande. Para as PKs usa chaves SK (surrogate key numérico, sequencial, sem significado), e é a convergência das FKs das Dimensões. As tabelas Fato são compostas basicamente pelas chaves (atributos qualitativos das tabelas Dimensão) e pelas métricas (atributos quantitativos). MÉTRICAS E GRANULARIDADE Escolher para a tabela Fato os atributos numéricos. Típicos: Quantidade Valor Custo do produto Lucro Consumo Etc. Decidir a granularidade pensando nas dimensões. Ex: Hora ou Dia? As dimensões deverão estar em conformidade (servir de perspectivas para as análises). Ex: De acordo com a escolha (Hora ou Dia), dados das dimensões deverão estar preparados. FATOS E SEUS DADOS Manter conformidade/coerência também entre fatos e as medidas/valores, com o mesmo sentido, fórmulas de cálculos, etc. Lembre-se, porém: as tabelas Fatos são gigantescas (alto volume) e isso requer compromissos na escolha de seus campos. Compromisso entre performance e armazenamento. Campos candidatos a remoção: Campos usados por poucos usuários Campos que não tenham valor de negócio Campos potencialmente derivados (conceito de elementos virtuais) Ex: valor total (valor unitário * quantidade do item) 45

47 DADOS HETEROGÊNEOS NA TABELA FATO Exemplo: Produtos heterogêneos na indústria financeira - Conta corrente, seguro, empréstimo, poupança, habitação, etc. Diferentes fatos e dados para cada linha de negócio. Dimensões comuns (clientes, agências, tempo) Estratégia: o Múltiplas tabelas fato e dados específicos o Dimensões únicas e conformes 46

48 CUBOS OLAP x OLTP OLAP: On-line Analytical Processing - Processamento analítico on-line. Refere-se ao conjunto de processos para criação, gerência e manipulação de dados multimensionais para análise e visualização pelo usuário em busca de uma maior compreensão destes dados. É usual a expressão ferramenta OLAP, referindo-se aos sistemas com estas funcionalidades e que são, juntamente com o SGBD, a base do ambiente de DW. OLTP: On-line Transaction Processing Dados orientados a transações (T) Ambiente com alta taxa de transações Dados são atualizados Dados relacionais OLAP: On-line Analytical Processing Dados orientados a análise (A) de informação Ambiente de baixa taxa de transações Dados são consultados Dados são atualizados em períodos de tempo Dados dimensionais CONCEITOS DE CUBOS Cubos são estruturas dinâmicas para gerar os relatórios OLAP. Podem ter várias dimensões: tempo, região, produto, etc. Nossa visão consegue perceber até três dimensões no Cubo, mas podem ter mais. Cubos diferem de relatórios tradicionais (Transacionais) que são estáticos. São estruturas de dados que forma um subconjunto de um banco de dados grande (DW). Podem ser manipulados e visualizados por inúmeros ângulos e diferentes níveis de agregação, onde é possível, através de suas dimensões (faces ou eixos), analisar uma determinada situação. Um cubo é criado tendo em mente o tipo de consulta que um gerente de projeto deseja fazer. Ao projetar um cubo é importante levar em conta as prováveis consultas que poderão ser feitas. O projeto de um cubo deve priorizar a escolha e a organização das dimensões que podem influenciar nas medidas relacionadas para a tomada de decisão. DW e Data Marts são compostos de N cubos, porém o cubo é implementado separadamente. Cada cubo é uma visão dimensional de dados formado por: Uma tabela fato e N tabelas dimensões; 47

49 Pode ter mais de uma tabela fato, mas nunca interligadas as dimensões que as interligam; Cubos como visão dimensional podem ser materializados/implementados em: Consultas OLAP Forma física de tabelas relacionais vistas como estruturas dimensionais Tem-se ainda que operações especiais permitem decompor um cubo de N dimensões em sub-cubos de até 3 dimensões. O CUBO Abaixo uma imagem característica do Cubo. Neste caso, está indicando (um cubo branco) as vendas (métricas) na localização RJ (eixo Z), do produto Bavária (eixo Y) no tempo T4 (eixo X). SLICE X DICE Seleção e projeção do cubo de dados Slice (fatia): seleção / projeção com variação de valores (fatia) de uma ou mais dimensões. o Exemplo: as vendas da região Norte, no ano 2011, de todos os Produtos Dice (dados): seleção / projeção de valores fixos em todas as dimensões. o Exemplo: as vendas da região Norte, no ano 2011, do Produto X 48

50 AS FASES PARA CONSTRUÇÃO DE UM DW CONSTRUÇÃO DO DW É importante enumerar as fases de um projeto para construção de um DW: 1. Contato e definição da área de negócios; 2. Levantamento das necessidades; 3. Modelagem do DW; 4. Definição sobre a estrutura - estrutura (Star, Snowflake, etc.) 5. Definição da granularidade 5.1. Menor mais espaço; 5.2. Maior menos espaço; 6. Métricas; 7. Definição das dimensões e seus atributos; 8. Definição das chaves; 9. Relacionamentos das tabelas dimensão; 10. Tabelas Fatos 11. Cubos As fases que seguem são a implementação em uma ferramenta de BI. A CONSTRUÇÃO DE UM DW Vamos partir de um modelo relacional para mostrar a construção de um DW. Abaixo temos um modelo clássico de um sistema de vendas (DER), com seis tabelas. A empresa tem filiais que possui vendedores. Estes realizam as vendas com seus respectivos itens. Os itens possuem produtos que estão ligados à categorias dos produtos. 49

51 No levantamento das necessidades decidiu-se pela performance do DW e o modelo estrela foi escolhido. Os gestores indicaram: os atributos que desejavam visualizar no DW; as métricas (quantidade da venda e valor da venda). De posse destas informações colhidas junto aos gestores, começou-se a elaborar o DW. As chaves surrogate key (SK) foram fortemente modeladas e as chaves inteligentes do DER foram preservadas. Observa-se no modelo do DW abaixo, modelado a partir do DER anterior: escolha da estrutura Star (estrela); as chaves das dimensões são SK, como id-vendedor da tabela dimensão d_vendedor; presença das chaves inteligentes, como cod_vendedor da dimensão d_vendedor; atributos qualificadores, como nome_vendedor da tabela d_vendedor; presença da tabela tempo, padrão em um DW: d_tempo; desnormalização realizada na tabela d_produto em função do modelo estrela; formação da chave primária composta da tabela fato (f_venda) a partir das chaves das tabelas Dimensão, todas SK: id_vendedor + id_filial + id_produto + id_tempo presença de mais um campo (cod_venda) para compor a chave primária composta da Fato f_venda: este campo torna-se necessário na medida que que, se composição da chave for apenas dos 4 campos (id_vendedor + id_filial + id_produto + id_tempo), haverá Key Violation na chave primária. Portanto, o cod_venda preservará a unicidade da chave primária da tabela Fato. Presença na tabela fato das métricas: que_venda_prod e valor_venda_prod. 50

52 ERROS COMUNS A SEREM EVITADOS NA MODELAGEM DIMENSIONAL E CONSIDERAÇÕES FINAIS Aceitar a premissa de que os responsáveis pelos sistemas transacionais da organização são muito importantes e ocupados para gastar tempo com a equipe da modelagem dimensional. Projetar o modelo dimensional baseado em um relatório específico. Não conversar com os usuários de negócio. Não definir uma equipe que preserve o conhecimento após o término do projeto. Não obter patrocinadores fortes. Os objetivos não são diretos com os negócios da organização. Não desenvolver uma forma eficiente de comunicar bem o projeto. Definir uma metodologia que não seja prática e interativa, com entregas em tempo razoável. Colocar atributos de texto usados para restrições e agrupamento numa tabela de fatos. Limitar atributos em dimensões para economizar espaço. Ignorar a necessidade de cuidar de mudanças em atributos de dimensões. Resolver todos os problemas de desempenho de consultas adicionando mais hardware. Usar chaves operacionais ou inteligentes para junções de tabelas de dimensão com tabela de fatos. 51

53 EXERCÍCIO 1) Um depósito de dados é utilizado para armazenar, de forma consolidada, informações relativas às atividades de uma organização em bancos de dados. Nesse contexto, o datawarehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transicionais, permitindo uma melhor análise de eventos passados, oferecendo suporte às tomadas de decisões presentes e à decisão de eventos futuros. Com relação ao datawarehouse, analise as afirmativas a seguir. I. Caracteriza se pela volatilidade dos dados, facilitando a realização de frequentes atualizações dos mesmos. II. Aplicações OLAP destinam se à análise e à manipulação de dados do datawarehouse sob múltiplas perspectivas. III. ETL são ferramentas que realizam a extração de dados de diversos sistemas, a transformação desses dados conforme regras de negócios e a carga dos mesmos em um datawarehouse. Assinale: a) se somente a afirmativa I estiver correta. b) se somente a afirmativa II estiver correta. c) se somente a afirmativa III estiver correta. d) se somente as afirmativas I e II estiverem corretas. e) se somente as afirmativas II e III estiverem corretas. 2) A tecnologia de Data Warehouse oferece suporte às ferramentas OLAP, que apresentam visões multidimensionais de dados permitindo a análise das operações de negócio para facilitar a tomada de decisões. Estas ferramentas suportam algumas operações de maneira a dar aos analistas o poder de observar os dados de várias maneiras em níveis diferentes. Considere duas destas operações mostradas nas figuras abaixo. 52

54 As operações mostradas na Figura 1 e na Figura 2, respectivamente, são a) drill-down e ROLAP. b) rotação e drill-down. c) ROLAP e drill-through. d) rotação e roll-up. e) roll-up e rotação. 3) Em relação aos DWs (Data warehouses), assinale a alternativa correta. a) São orientados a objetos. b) Não variam com o tempo. c) São voláteis. d) Evitam o uso de gerenciadores de bancos de dados tradicionais, reduzindo custos, mas podem causar impactos significativos nos sistemas operacionais. e) Seus dados não podem ser alterados, mas podem ser excluídos. 4) A arquitetura de data warehouse de três camadas contém as seguintes camadas: a) Primeira camada: sistema operacional com os dados e o software para aquisição. Segunda camada: especificação de dados. Terceira camada: servidor de monitoramento e cliente. b) Primeira camada: sistema aplicativo. Segunda camada: data warehouse. Terceira camada: clientes preferenciais. c) Primeira camada: sistema operacional com arquiteturas diferenciadas. Segunda camada: data center. Terceira camada: servidor de aplicação e cliente. 53

55 d) Primeira camada: sistema operacional com os dados e o software para aquisição. Segunda camada: data warehouse. Terceira camada: servidor de aplicação e cliente. e) Primeira camada: sistema aplicativo com os dados e o software para aquisição. Segunda camada: data warehouse. Terceira camada: relatórios e telas de operação. 5) Data warehouses são: a) otimizados para o processamento de transações. b) multidimensionais. c) atualizados em tempo real. d) materializados por demanda. e) sínteses de bancos de dados subjacentes. 54

56 ALGUMAS REFERÊNCIAS ADAMSON, Christopher. Star Schema: The Complete Reference. McGraw Hill, BARBIERI, Carlos. BI - Business Intelligence - Modelagem & Tecnologia. São Paulo: Axcel Books, BARBIERI, Carlos. Bi2 - Business Intelligence - Modelagem e Qualidade. Rio de Janeiro: Editora Campus Elsevier, INMON, W. H. Building the Data Warehouse. Wiley, 3a ed JACOBSON, Reed; MISNER, Stacia; CONSULTING, Hitachi. Microsoft SQL Server 2005 Analysis Services passo a passo. Porto Alegre, Bookman, KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: The Complete Guide to Dimension Modeling (2nd Edition). John Wiley & Sons, LAUDON, K. C.; LAUDON J. P. Sistemas de informação gerenciais: administrando a empresa digital. 7. ed. São Paulo: Prentice Hall, LEME FILHO, Trajano. Business Intelligence no Microsoft Excel. Rio de Janeiro: Axcel Books do Brasil, MACHADO, Filipe Nery Rodrigues. Tecnologia e projeto de Data Werehose: uma visão multidimensional. São Paulo: Érica, TAVARES, Mauro Calixta. Gestão Estratégica. São Paulo: Atlas, TURBAN, Efraim; RAINER JR, R. K.; POTTER, E. P. Administração de tecnologia da informação: teoria e prática. 3.ed. Rio de Janeiro: Elsevier,

57 EXERCÍCIOS PRÁTICOS

58 Exercício 1 Criando a transformação Hello World 1 Crie uma pasta chamada pdi_labs no seu computador. 2 Abra o Spoon. 3 A partir do menu principal escolha Arquivo -> Nova Transformação. Será mostrada a transformação Transformation 1 na área de trabalho. Obs.: Caso deseje, utilize as teclas de atalho CTRL-N 4 Do lado direito da tela é mostrada a árvore de steps. Clique na opção Design e Expanda a opção Input. 5 Arraste e solte o ícone do step Generate Rows para a área de trabalho da transformação. 6 Dê um duplo-clique para abrir o step e digite os dados abaixo e clique OK em seguida: Nome do step: Gera 10 mensagens Em Fields: o Nome: mensagem o Tipo: String o Valor: Hello World!

59 Obs.: Você também pode abrir o step para edição clicando com o botão direito e escolhendo a opção Editar Step. 7 Na árvore de steps, expanda a opção Flow e arraste e solte o ícone do step Dummy para a área de trabalho da transformação. 8 Vamos criar um hop para ligar os dois steps. Clique com o botão direito no step Generate Rows, segure a tecla Shift e arraste o cursor do mouse para o step Dummy. 9 Vamos adicionar uma nota à transformação. Clique com o botão direito em qualquer parte da área de trabalho da transformação e escolha a opção Nova Nota. Digite o texto da nota. 10 Salve a transformação na pasta pdi_labs com o nome hello_world. Será gerado um arquivo XML com extensão.ktr. 11 Podemos rodar uma prévia da transformação, antes de sua execução real. Clique com o botão direito no step Dummy e escolha a opção Preview. Obs.: Você poderá rodar a previsão da transformação clicando no step desejado e, em seguida, clicando no ícone Preview da barra de opções.

60 12 Após carregar a janela de diálogo de Preview, clique no botão Quick Launch para visualizar o resultado da transformação. 13 O que foi feito nessa transformação? O step Generate Rows simplesmente gera várias linhas de registros, de acordo com os parâmetros informados. Experimente editar o step para acrescentar outros campos e mudar o tamanho do conjunto de registros gerados. O step Dummy apenas recebe os registros gerados e não faz nada. 14 Um pequeno detalhe: nós não executamos a transformação, apenas visualizamos uma prévia de sua execução. Para executar a transformação clique no botão Run e após abrir a janela de diálogo clique no botão Launch. 15 O resultado real da execução aparece na aba do log. As métricas de execução aparecem na aba da janela do log. O nível de detalhe do log de execução pode ser configurado na tela anterior. Obs.: na execução de grandes volumes de dados recomenda-se deixar o nível do log como Basic.

61 Exercício 2 Criando a transformação Hello World Fulano 1 Vamos expandir a transformação do exercício anterior para obter dados de uma fonte, fazer uma pequena transformação nos dados e armazenar o resultado em um arquivo texto. Crie um arquivo texto com os dados abaixo: Fulano Sicrano Beltrano Salve o arquivo na pasta pdi_labs com o nome fulano.txt. 2 Crie uma nova transformação e salve-a com o nome de hello_world_fulano.ktr. O objetivo dessa transformação é ler o arquivo texto acima, adicionar a frase Hello World e uma sequência para cada frase criada. Ao final, todas as frases criadas serão gravadas em um arquivo texto. 3 Adicione um step Text file input da opção Input. Edite o step com as seguintes informações: - na aba File, campo File or directory, clique no no botão Navegar para localizar o arquivo fulano.txt. Em seguida, clique no botão Add para colocar o arquivo na lista. - Na aba Content, desmarque a opção Header. Se você não fizer isso, o Spoon entenderá que a primeira linha do arquivo texto é um cabeçalho com o nome de um ou mais campos. - Na aba Fields, digite o nome do campo (nome) e o seu tipo (String). Clique OK.

62 4 Adicione um step Add constants, do tipo Transform. Edite o step com as seguintes informações nos campos Nome, Tipo e valor: - Nome: mensagem; Tipo: String; Valor=Hello World - Nome: exclamação; Tipo: String; Valor=! -Nome: espaço; Tipo: String; Valor= (espaço em branco) 5 Crie um hop ligando os dois steps. 6 Ainda nos steps do tipo Transform, adicione um Add Sequence. Em seguida, crie um hop ligando o Add constants ao Add sequence. Edite esse step para ver os seus parâmetros (não vamos alterá-los para esse exercício). 7 Entre nas opções de steps do tipo Output e adicione um step Text file output. Em seguida, crie um hop ligando o step Add sequence a Text file output. Edite as configurações do step:

63 - Na aba File, digite o caminho de um arquivo de texto com o nome resultado (o step adiciona por default a extensão.txt) no campo Filename. - Na aba Content, limpe o conteúdo do campo Separator (caso contrário, o step colocará um separador na saída do arquivo) e desmarque a opção Header. - Na aba Fields, clique no botão Obtém campos. Se tudo foi feito corretamente até agora, serão mostrados os campos de acordo com a figura abaixo. Observe que os campos foram gerados pelos steps anteriores. Queremos que seja gravada no arquivo a mensagem <valuename> <mensagem><espaço> <nome><exclamacao>. Para que isso ocorra devemos modificar a ordem dos campos. Clique com o botão direito em cima do campo valuename e escolha a opção move up. Repita a operação até que o campo valuename seja o primeiro da lista. Repita a operação com os demais campos. A figura abaixo mostra a disposição final dos campos. 8 Salve a transformação e execute em seguida. O resultado gerado é um arquivo texto com as seguintes linhas:

64 1 Hello World Fulano! 2 Hello World Sicrano! 3 Hello World Beltrano! Exercício 3 Criando uma conexão com um banco de dados. 1- Nos exercícios anteriores mostramos como obter dados a partir de uma fonte de dados baseada em arquivos texto. Para os exercícios futuros precisaremos extrair, transformar e carregar dados em tabelas de um banco. Para facilitar o processo de aprendizagem, vamos utilizar o SGBD open source Apache Derby. Faça o download da última versão através da url 2- Descompacte o arquivo em uma pasta no seu computador. Em seguida, copie o arquivo /lib/derby.jar para a pasta /JDBC/libext de sua instalação do PDI. 3- Abra o Spoon e carregue a transformação do exercício anterior. Em seguida, clique no botão View na barra lateral. Expanda a aba Conexões. 4- Com o botão direito, clique em cima da opção Conexões e escolha Novo. 5- Na aba General, digite os seguintes parâmetros: - Connection type: Generic database - Access: Native (JDBC) - Custom Connection Url: jdbc:derby:<path_do_banco>/<banco>;create=true - Custom Driver Class Name: org.apache.derby.jdbc.embeddeddriver

65 6 Clique no botão Test para verificar se a conexão com o banco está OK. Em seguida, retire o texto ;create=true da Url de conexão (caso contrário, as tabelas serão apagadas e criadas a cada inicialização da conexão). Clique em OK. 6- Podemos tornar a conexão visível para todas as transformações e Jobs de nossa instalação do PDI. Para isso, clique com o botão direito em cima da conexão criada e escolha a opção Share. Note que o texto da conexão está em negrito agora. 7- O banco criado está vazio, sem nenhuma tabela. Mais adiante vamos utilizar essa e outras conexões para a modelagem dimensional e a execução do processo de ETL. Exercício 4 Extraindo dados de um arquivo texto, realizando uma transformação e carregando o resultado em um arquivo texto. 1 Para realizar esse exercício você precisará de dois arquivos armazenados na pasta Bases: capes.xls e ies.csv. O primeiro contém informações sobre a avaliação dos programas de Pós-Gradução das Instituições de Ensino Superior (IES) do país. O segundo arquivo é uma tabela de lookup contendo o código e a sigla das IES s. Vamos mostrar a extração de dados a partir de dois arquivos (Excel e CSV), uma pequena transformação e o carregamento dos dados em um arquivo texto. Abra a planilha e veja que o campo ies possui a sigla da instituição. Queremos gravar em um arquivo texto parte dos dados da planilha e o código da instituição no lugar de sua sigla. Para iniciar, abra o Spoon e crie uma nova transformação. 2 Abra a categoria Input e adicione os steps Excel Input e CSV file input. Em seguida, expanda a categoria Lookup e adicione o step Stream lookup. Da categoria Transform, adicione o step Select values. Da categoria Output, adicione o step Text file output. Por fim, crie os hop s para conectar os steps, de acordo com a figura abaixo.

66 3 Edite o step Excel input com os seguintes parâmetros: Aba Files o File or directory: localize o arquivo capes.xls com o botão Navegar. Em seguida, clique em Add para adicionar o arquivo ao grid. Para ter certeza que o arquivo foi localizado, clique no botão Show filename(s). Aba Sheets o Clique no botão Get sheetname e escolha a planilha desejada. Se o nome da planilha não aparecer na lista, reveja os parâmetros da aba Files. Aba Content o Certifique-se que o campo Header esteja marcado (vamos precisar dele na próxima aba). o Esse arquivo foi gravado no Linux! Mude o campo Encoding para UTF-8. Aba Fields o Clique no botão Get fields from header now e veja todos os campos disponíveis no arquivo. o Dê uma olhada nos dados que serão extraídos do arquivo, clicando no botão Preview rows. Clique Ok e salve a transformação. 4 Edite o step CSV file input com os seguintes parâmetros: Filename: localize o arquivo ies.csv com o botão Navegar. Delimiter: ; (ponto-e-vírgula) Desmarque a opção Lazy conversion. Clique no botão Obtém campos e veja os campos que serão lidos. Clique no botão Preview para visualizar uma amostra dos dados. o Na grade com os campos, diminua o tamanho do campo idies para 1 (propriedade Length). Rode novamente o preview. o Retire o símbolo da moeda (R$) da propriedade Currency.

67 5 Antes de editar o step Stream lookup, dê uma olhada no fluxo de registros de entrada. Clique com o botão direito em cima do step e escolha a opção Mostra campos de entrada. Deverão ser exibidos 41 campos (39 da planilha e 2 do arquivo texto). 6 Edite o step Stream lookup com os seguintes parâmetros: Lookup step: escolha o step CSV file input. Clique nos botões Get fields e Get lookup fields. As grades de campos deverão ter a configuração da figura abaixo. Na grade de cima, remova todos os campos, deixando apenas o campo ies. Em Lookup Field escolha o campo sigla_ies. Na grade de baixo, remova o campo sigla_ies. No campo idies, digite o valor id_instituicao na propriedade New name. As grades deverão ter a configuração abaixo. Salve a transformação. Na área de trabalho, clique com o botão direito em cima do step Stream lookup e escolha a opção Mostra campos de saída. Observe que temos agora 40 campos (o último é o campo que denota o id da instituição).

68 7 Suponha que não precisamos de todos os campos vindos da planilha. Além disso, queremos modificar o nome dos campos que serão carregados ao final do processo de transformação. Edite o step Select values com os seguintes parâmetros: Aba Meta-data o Fieldname: escolha o campo area digite id_area na propriedade Rename to e escolha Integer na propriedade Type. o Repita a operação com o campo codigo_programa, com o nome id_programa. A grade deverá ter a configuração abaixo. Aba Remove o Clique no botão Get fields to remove e exclua os seguintes campos: area, codigo_programa, ies, nome_programa, inicio_mestrado, inicio_doutorado, conceito_recomendado e id_instituicao. A lista de campos que queremos excluir deverá ter a configuração abaixo. Salve a transformação e veja os campos de saída do step, clicando com o botão direito em cima dele. 8 Vamos editar o step Text file output com os seguintes parâmetros: Aba File o Filename: <path>\resultado Aba Fields o Clique no botão Obtém campos e veja os campos que serão gravados. Alterações de formato, tamanho, etc. poderão ser feitas diretamente na grade. o Clique no botão Minimal width e veja que o step fornece um formato padrão para os campos. 9 - Salve a transformação. Na área de trabalho, clique com o botão direito em cima do step Text file output e escolha a opção Preview. Na janela de diálogo, marque a opção

69 Text file output, conforme a figura abaixo. Se tudo foi configurado corretamente, será mostrada uma amostra dos dados que serão gravados. 10 Execute a transformação e veja o arquivo gerado. O que fizemos nessa transformação? Mostramos como extrair dados de dois arquivos com formatos diferentes (.xls e.csv). Fizemos duas transformações nos dados extraídos: trocamos o nome da IES por seu código e retiramos os campos que não queríamos gravar. Além disso, alteramos os metadados de dois campos. Carregamos o resultado da transformação em um arquivo texto. Exercício 5 Extraindo dados de um conjunto de arquivos 1 Para esse exercício vamos utilizar as planilhas armazenadas na pasta /pdi_labs/base/planilhas. Crie uma nova transformação e copie/cole os steps e hops da transformação do exercício anterior. 2 Edite o step Excel input. Na grade de arquivos selecionados da aba Files, marque o arquivo capes.xls e clique no botão Delete. 3 Acesse a pasta planilhas e adicione todos os arquivos na grade usando o botão Add (Ok...não precisa adicionar todos. São 45 arquivos ). Verifique se o step carregou os arquivos clicando no botão Show filename(s).

70 4 Na aba Sheets exclua a planilha do exercício anterior e clique em Get sheetname(s) para pesquisar pelas planilhas de todos os arquivos selecionados no passo anterior. Escolha a planilha plan Na aba Content certifique-se que o campo Header esteja marcado e que o Encoding do arquivo seja UTF-8 ou ISO (experimente colocar outra codificação e veja o que irá ocorrer). 6 Na aba Fields clique no botão Get fields from header now, lembrando-se de limpar a lista de campos do exercício anterior (confirme na janela de diálogo). Salve a transformação e execute-a. Veja o resultado do arquivo gerado pela transformação. Exercício 6 Extraindo dados de um conjunto de arquivos, usando expressões regulares. 1 A solução adotada no exercício anterior pode ser refeita para evitar a inclusão de cada arquivo manualmente (imagine uma aplicação real com milhares de arquivos). Abra a transformação do exercício anterior e edite o step Excel input. 2 Na aba Files, exclua todos os arquivos da grade Selected files. No campo File ou directory digite o caminho para a pasta onde as planilhas estão armazenadas (ex.: E:\pdi_labs\bases\planilhas\). Adicione o caminho à lista de arquivos clicando no botão Add. 3 No campo Selected files, digite a seguinte expressão na propriedade Wildcard:.*\.xls

71 4 Para garantir que os arquivos serão lidos usando a expressão regular, clique no botão Show filename(s) e veja a lista de arquivos que serão lidos. Salve a transformação e execute-a, observando o arquivo gerado. Exercício 7 Selecionando, alterando campos e gerando a saída em uma planilha. 1 Vamos melhorar o cabeçalho do arquivo gerado. Abra o exercício anterior e edite o step Select values. Remova todos os campos selecionados nas abas Remove e Metadata. 2 Na aba Select & Alter digite os nomes dos campos, de acordo com a figura abaixo. Salve a transformação e veja os campos de saída do step. 3 Clique no step File text output e apague-o. Da categoria Output, crie um step do tipo Excel output. Crie um hop ligando os steps Select values e Excel output. 4 Edite o step Excel output com os seguintes parâmetros: Aba File o Filename: o caminho e nome da planilha gerada. Aba Fields o Clique nos botões Obtém campos e Minimal Width (opcional) Aba Content o Explore as opções da aba (Split, sheet name, protect, templates) 5 Salve a transformação e veja a sua execução.

72 Exercício 8 Obtendo informações do sistema. 1 Vamos acrescentar uma informação correspondente à data e hora em que o registro foi gravado no arquivo. Abra a transformação do exercício anterior e crie um step Get system info da categoria Input. Coloque esse step entre o Select values e o Excel output. Crie os hops ligando os steps, de acordo com a figura abaixo. 2 Edite o step Get system info com os seguintes parâmetros: 3 Edite o step Excel output, com as seguintes alterações: Na aba Fields, clique no botão Obtém campos, e verifique se o campo data_hora_atualizacao será exibido.

73 4 Salve a transformação e execute-a. Veja o arquivo gerado. Exercício 9 Aplicando formatos para datas e números. 1 Você deve ter notado que os registros gravados nos arquivos dos exercícios não possuem uma formatação adequada. Antes de colocar os formatos corretos devemos escolher qual step deverá formatar os valores. Por uma questão de coesão, os steps mais adequados são aqueles relacionados às atividades de transformação. Vamos editar o step Select values para aplicar os formatos. 2 No step Select values, marque todas as linhas da aba Select & alter, recorte e cole na aba Meta-data. Complete as propriedades com os valores abaixo. 3 Edite o step Excel output, abrindo a aba Fields. No campo data_hora_atualizacao digite o seguinte formato: dd/mm/yyyy HH:mm:ss Se existir, limpe o formato dos demais campos. 4 Salve a transformação, execute-a e observe o arquivo gerado. Exercício 10 Extraindo uma lista com dados de países de um arquivo XML. 1- Para esse exercício vamos utilizar o arquivo countries.xml que encontra-se na pasta /pdi_labs/bases/xml. Abra o arquivo e observe a sua estrutura. 2- Crie uma nova transformação e adicione os steps Get data from XML e Excel output. Crie um hop ligando os steps.

74 3- Edite o step Get data from XML, com os seguintes parâmetros: Aba File o File or directory: encontre o arquivo countries.xml e adicione à lista. Aba Content o Clique no botão Get Xpath nodes e selecione /world/country/language Aba Fields o Preencha a grade de acordo com a figura abaixo. 4- Clique em Preview rows para visualizar uma prévia dos dados extraídos.

75 5- Salve a transformação e edite o Step Excel output para gravar o resultado em uma planilha. 6- Rode a transformação e veja os dados dos países em formato de planilha. Exercício 11 Calculando valores de novos campos 1 Para executar esse exercício, localize o arquivo notas-fulano.txt na pasta Bases do material do curso. Esse arquivo descreve as notas de 3 alunos. Queremos converter as notas da escala de 0 a 10 para uma escala de 0 a 5 e calcular a média para cada aluno. 2 Crie uma nova transformação e adicione um step Text file input. Edite o step e informe a localização do arquivo, conforme mostrado nos exercícios anteriores. Na aba Fields, clique em Obtém campos para recuperar os cabeçalhos dos campos e faça um preview dos dados. 3 Adicione um step Select values. Crie um hop ligando o Text file input ao Select values. Edite esse último step com os parâmetros mostrados na figura abaixo. Esse step é necessário para formatar os dados lidos no arquivo. 4 Da categoria Transform, crie um step do tipo Calculator. Crie um hop ligando o Select values a esse novo step. Edite o step de acordo com a figura abaixo.

76 O que fizemos aqui? Basicamente, definimos um fator de conversão das notas (fator_divisao). Depois, dividimos as quatro notas pelo fator, criando quatro novos campos (nota_1_nova,...). Em seguida, utilizamos quatro campos auxiliares para fazer o somatório das notas (numero_notas, aux1, aux2 e total). Por fim, calculamos a média e armazenamos o resultado em um novo campo (media). Faça um preview na transformação e você deverá ver os novos campos. 5 Crie um novo step Select values e hop ligando o Calculator ao novo step. Selecione e altere os campos que serão enviados para o step de carregamento, de acordo com a figura abaixo. 6 Crie um step Dummy apenas para visualizar os dados em modo de preview (se preferir, salve o resultado em um arquivo texto ou planilha). O preview dos dados deverá ser semelhante ao da figura abaixo. Salve a transformação.

77 Exercício 12 Calculando valores dos campos versão com step Formula. 1 Vamos explorar uma nova forma de converter as notas e calcular as médias do exemplo anterior. Abra a transformação salva anteriormente e exclua o step Calculator. 2 Na categoria Scripting, crie um novo step do tipo Formula e posicione-o no lugar ocupado pelo Calculator. Recrie os hops que foram excluídos quando você apagou o Calculator. 3- Edite o step Formula. Em New Field, adicione um campo chamado nota1. Clique na célula da coluna Formula, ao lado do campo que você acabou de criar. Será exibida uma janela de diálogo (despreze a mensagem de erro). Na parte superior da janela, digite [nota_1]/20. Clique em Ok e volte para a grade de inclusão dos campos. 4 Repita o processo para os demais campos, de acordo com a figura abaixo.

78 5 Crie um quinto campo chamado media e digite a fórmula average([nota_1];[nota_2];[nota_3];[nota_4])/20. 6 Edite o segundo step Select values para selecionar os campos que serão armazenados, conforme a figura abaixo. Teste a transformação em preview. Salve a transformação. Exercício 13 Criando agregações em grupos de linhas. 1 Abra a transformação do exercício anterior. Crie um step Value Mapper, da categoria Transform e ligue o último Select values com ele. Em seguida, crie um step Group by, da categoria Statistics.

79 2 Altere o segundo Select values, na aba Meta-data, para arredondar o valor do campo media. 3 Edite o step Value Mapper, com os seguintes parâmetros da figura abaixo: Faça um preview dos dados e veja se o step mapeou o valor arredondado da média para um conceito, variando entre A e E.

80 4 Edite o step Group by de acordo com a figura abaixo. Esse step irá agregar as linhas a partir campo conceito e exibir o número de ocorrências de cada agrupamento (fique à vontade para testar outras funções de agregação desse step). Salve a transformação e testa-a no preview. Exercício 14 Filtrando linhas de um dataset 1 Abra a transformação anterior e crie um step do tipo Filter rows, da categoria Flow. Crie um segundo step Dummy e crie os hops de acordo com a figura abaixo.

81 2 Edite o step Filter rows, com os parâmetros da figura abaixo. 3 Salve a transformação e faça um preview em cada step Dummy da transformação. Note que o fluxo enviado para cada step varia de acordo com a condição informada no Filter rows. Exercício 15 Exemplo de cópia do stream do dataset 1 Abra uma nova transformação e crie um step Excel input. Acesse o arquivo areas.xls, disponível na pasta bases do material do curso. Obtenha a planilha (aba Sheets) e recupere os campos (aba Fields, com o botão Get fields...). Dê um preview para visualizar os dados carregados.

82 2 Crie dois steps do tipo Dummy e dois hops, saindo simultaneamente do step Excel input e conectados com cada Dummy, de acordo com a figura abaixo. Ao aparecer a janela de diálogo, responda que você quer realizar uma cópia.

83 3 Execute a transformação e observe a quantidade de registros lidos por cada step Dummy. Exercício 16 Exemplo de distribuição do stream do dataset 1 Abra a transformação do exercício anterior, clique com o botão direito em cima do step Excel input e escolha a opção Movimento dos dados -> Distribui os dados para os próximos steps. 2 Execute a transformação e veja o número de registros lidos por cada step Dummy.

84 Exercício 17 Exemplo de distribuição do stream usando o step Switch/Case. 1 Abra a transformação do exercício anterior e acrescente um step Switch/Case, da categoria Flow e um terceiro step Dummy, conforme a figura abaixo. 2 Edite o step Switch/case, de acordo com as configurações abaixo.

85 3 Salve a transformação e execute-a, observando a quantidade de registros lidos por cada step Dummy. Caso queira conferir os registros que foram lidos em cada step Dummy, faça um preview e observe como o step Switch/Case realizou o filtro baseado no valor do campo cod_area. Exercício 18 Fazendo conversões no rowset. 1 Para realizar esse exercício, precisaremos do arquivo movies.txt, localizado na pasta bases do material distribuído. Abra uma nova transformação e crie um step Text File input. Acesse o arquivo movies.txt, adicione à lista de arquivos selecionados. Na aba Contents coloque : (dois pontos) como separador. Desmarque as opções Header e No empty rows. Na aba Fields, crie dois campos: caracteristica e descricao. Obtenha uma preview dos dados e veja os valores carregados.

86 Note que as características variam em quantidade para cada filme. 2 Nesse exercício, vamos utilizar alguns steps voltados para auxiliar o trabalho do projetista. Inicialmente, vamos criar um step do tipo Modified Javascript value, da categoria Scripting. Esse step permite a criação de campos através de linhas de código em Javascript. Queremos criar uma coluna Film, no dataset lido do arquivo texto. Ligue o Text Input file a esse step com um hop e edite-o, de acordo com os parâmetros abaixo.

87 Esse código cria um campo Film e preenche o seu valor com o nome do filme. Dê um preview no step e verifique se o campo será preenchido corretamente. 3 Em seguida, crie um step do tipo Filter rows. Nosso objetivo agora é filtrar todas as linhas que estão com o campo descricao nulo. Edite esse step com a seguinte condição: 4 O próximo passo é fazer a conversão dos dados de linhas para colunas. Para isso, vamos criar um step do tipo Row denormalizer, da categoria Transform. Edite esse step de acordo com a figura abaixo.

88 A partir do campo filme, a linhas com o conteúdo Ano, Gênero, Diretor e Atores são convertidas em colunas, com o valor do campo descrição. Dê um preview na transformação e veja os valores convertidos. 5 O último passo é preencher as colunas com valores vazios com a string n/a. Para isso, vamos criar um step do tipo If field value is null, da categoria Utility. Edite o step de acordo com os parâmetros abaixo. Salve a transformação e execute o seu preview. O resultado deverá ser semelhante ao da figura abaixo.

89 Exercício 19 Validando dados do rowset. 1 Para esse exercício vamos utilizar o arquivo capes.xls, localizado na pasta bases do material do curso. Crie um step Excel input e leia o arquivo, conforme mostrado nos exercícios anteriores. 2 Em seguida, vamos criar um step para validar os campos do dataset lido. Queremos impedir que um determinado campo nulo seja repassado para os steps de carregamento. Crie um step do tipo Data Validator, da categoria Validation. Edite o step e clique no botão New validation. Dê um nome para a validação e edite os seus campos, de acordo com os parâmetros abaixo: Marque o campo Report all erros, not only first. Em Name of field to validate, escolha o campo Escore_3. No bloco Data, desmarque a opção Null allowed? Salve a transformação e execute-a. Verifique que a transformação irá parar quando o primeiro valor nulo do campo Escore_3 for encontrado. Exercício 20 Criando as tabelas de um banco de dados 1 Para esse exercício, vamos utilizar o arquivo scripts-js.sql, localizados na pasta script do material do curso. Esses scripts criam as tabelas que armazenam os dados de uma loja online de vendas de jogos. Antes de iniciar, verifique se a conexão pdi_labs_con (criada no Exercício 3) está disponível. Acesse a aba View e expanda a árvore de conexões. Edite a conexão e pressione o botão Test.

90 2 Crie uma nova transformação e adicione um step do tipo Execute SQL script, da categoria Scripting. Edite o step, escolhendo a conexão pdi_labs_con no campo Connection. Em seguida, abra o arquivo scripts-js.sql em um editor de texto, copie e cole o seu conteúdo no campo SQLscript to execute. Salve a transformação e execute. 3 Vamos confirmar se as tabelas foram realmente criadas. Na opção View, expanda a árvore de conexões e clique com o botão direito em cima da conexão pdi_labs_con, escolhendo a opção Explorar. Caso as tabelas tenham sido criadas corretamente, você poderá ver a lista expandindo a opção Tables.

91 A base de dados do exemplo possui 9 tabelas, de acordo com uma breve descrição de suas características abaixo: Tabela manufacturers products buy_methods payment_methods countries cities customers Descrição Informações sobre os fabricantes dos produtos Produtos que estão à venda na loja, como jogos, quebra-cabeça, acessórios, etc. Contém informações sobre as modalidades de compra (física, por telefone, pela internet, etc.) Contém informações sobre as modalidades de pagamento (dinheiro, cartão, cheque) Uma lista de países Uma lista de cidades Os clientes cadastrados na loja Invoices/invoices_detail Cabeçalho e detalhe das informações de faturas

92 Exercício 21 Carregando as tabelas através de transformações 1 Vamos agora carregar os dados nas tabelas do banco a partir de um conjunto de arquivos localizados na pasta /bases/banco do material distribuído. Os arquivos que você deverá usar estão listados abaixo: BUY_METHODS.csv CITIES.csv COUNTRIES.csv CUSTOMERS.xls INVOICES.xls INVOICES_DETAIL.xls MANUFACTURERS.xml PAYMENT_METHODS.xml PRODUCTS.xml 2 Crie uma nova transformação e adicione vários steps para ler cada arquivo de entrada. Você terá que criar 3 Text File input, 3 Excel input e 3 Get data from XML. Conforme mostrado nos exercícios anteriores, para cada step de entrada, localize o arquivo e adicione-o à lista de arquivos selecionados. Configure o conteúdo na aba Content e obtenha os campos na aba Fields. 3 Em seguida, crie 9 steps do tipo Table output, que irão armazenar os dados nas tabelas criadas no exercício anterior.

93 4 Edite cada Table output da seguinte forma: Connection: escolha pdi_labs_con. Target table: uma das tabelas criadas no execício anterior. Clique no botão Navegar para escolher uma tabela da conexão. (ex.: BUY_METHODS) Aba Database Fields: o Clique no botão Enter Field mapping e escolha os mapeamentos adequados

94 Salve a transformação e repita esse passo para cada step Table output. 5 Para verificar se as tabelas foram realmente carregadas, clique na opção View, expanda a árvore de conexões e clique com o botão direito em cima da conexão pdi_labs_con, escolhendo a opção Explorar. Escolha uma tabela e clique na opção Preview First 100 rows of <nome_da_tabela>.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Business Intelligence e ferramentas de suporte

Business Intelligence e ferramentas de suporte O modelo apresentado na figura procura enfatizar dois aspectos: o primeiro é sobre os aplicativos que cobrem os sistemas que são executados baseados no conhecimento do negócio; sendo assim, o SCM faz o

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br Sistema Tipos de sistemas de informação Everson Santos Araujo everson@everson.com.br Um sistema pode ser definido como um complexo de elementos em interação (Ludwig Von Bertalanffy) sistema é um conjunto

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Interatividade aliada a Análise de Negócios

Interatividade aliada a Análise de Negócios Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,

Leia mais

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

Data Warehousing Visão Geral do Processo

Data Warehousing Visão Geral do Processo Data Warehousing Visão Geral do Processo Organizações continuamente coletam dados, informações e conhecimento em níveis cada vez maiores,, e os armazenam em sistemas informatizados O número de usuários

Leia mais

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS Vimos em nossas aulas anteriores: COMPUTADOR Tipos de computadores Hardware Hardware Processadores (CPU) Memória e armazenamento Dispositivos de E/S

Leia mais

Bloco Administrativo

Bloco Administrativo Bloco Administrativo BI Business Intelligence Objetivo O objetivo deste artigo é dar uma visão geral sobre o Módulo Business Intelligence, que se encontra no Bloco Administrativo. Todas informações aqui

Leia mais

BUSINESS INTELLIGENCE -Inteligência nos Negócios-

BUSINESS INTELLIGENCE -Inteligência nos Negócios- UNIVERSIDADE SÃO FRANCISCO CENTRO DE CIÊNCIAS JURÍDICAS, HUMANAS E SOCIAIS BUSINESS INTELLIGENCE -Inteligência nos Negócios- Curso: Administração Hab. Sistemas de Informações Disciplina: Gestão de Tecnologia

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares Universidade de Brasília Departamento de Ciência da Informação e Documentação Prof a.:lillian Alvares Fóruns óu s/ Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias

Leia mais

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo Unidade III PRINCÍPIOS DE SISTEMAS DE INFORMAÇÃO Prof. Luís Rodolfo Vantagens e desvantagens de uma rede para a organização Maior agilidade com o uso intenso de redes de computadores; Grandes interações

Leia mais

Data Warehouse Processos e Arquitetura

Data Warehouse Processos e Arquitetura Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997)

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009.

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. REFERÊNCIAS o o Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. Competição Analítica - Vencendo Através da Nova Ciência Davenport,

Leia mais

Planejamento operacional e sistemas automatizados de gestão de recursos organizacionais. Prof. Gilberto Porto porto@gilbertoporto.com.

Planejamento operacional e sistemas automatizados de gestão de recursos organizacionais. Prof. Gilberto Porto porto@gilbertoporto.com. Planejamento operacional e sistemas automatizados de gestão de recursos organizacionais Prof. Gilberto Porto porto@gilbertoporto.com.br Sistemas de Informação SE SSD/ SAE Estratégico Tipos de decisão Não

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto OLPT x OLAP Roteiro OLTP Datawarehouse OLAP Operações OLAP Exemplo com Mondrian e Jpivot

Leia mais

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de 1 Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Descrever

Leia mais

Aula 03 CLASSIFICAÇÃO DOS SISTEMAS DE INFORMAÇÃO

Aula 03 CLASSIFICAÇÃO DOS SISTEMAS DE INFORMAÇÃO Aula 03 CLASSIFICAÇÃO DOS SISTEMAS DE INFORMAÇÃO Na prática, não existe uma classificação rígida, permitindo aos autores e principalmente as empresas classificar seus sistemas de diversas maneiras. A ênfase

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

01/12/2009 BUSINESS INTELLIGENCE. Agenda. Conceito. Segurança da Informação. Histórico Conceito Diferencial Competitivo Investimento.

01/12/2009 BUSINESS INTELLIGENCE. Agenda. Conceito. Segurança da Informação. Histórico Conceito Diferencial Competitivo Investimento. BUSINESS INTELLIGENCE Agenda BI Histórico Conceito Diferencial Competitivo Investimento Segurança da Objetivo Áreas Conceito O conceito de Business Intelligencenão é recente: Fenícios, persas, egípcios

Leia mais

Universidade de Brasília Departamento de Ciência da Informação e Documentação Profa.:Lillian Alvares

Universidade de Brasília Departamento de Ciência da Informação e Documentação Profa.:Lillian Alvares Universidade de Brasília Departamento de Ciência da Informação e Documentação Profa.:Lillian Alvares Comunidades de Prática Grupos informais e interdisciplinares de pessoas unidas em torno de um interesse

Leia mais

Curso Data warehouse e Business Intelligence

Curso Data warehouse e Business Intelligence Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Apresentação Os projetos de Data Warehouse e Business Intelligence são dos mais interessantes e complexos de desenvolver

Leia mais

Data Warehouses Uma Introdução

Data Warehouses Uma Introdução Data Warehouses Uma Introdução Alex dos Santos Vieira, Renaldy Pereira Sousa, Ronaldo Ribeiro Goldschmidt 1. Motivação e Conceitos Básicos Com o advento da globalização, a competitividade entre as empresas

Leia mais

Sistemas de Apoio à Inteligência do Negócio

Sistemas de Apoio à Inteligência do Negócio Sistemas de Apoio à Inteligência do Negócio http://www.uniriotec.br/~tanaka/sain tanaka@uniriotec.br Visão Geral de Business Intelligence Evolução dos Sistemas de Informação (computadorizados) 1950 s:

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Aline França a de Abreu, Ph.D

Aline França a de Abreu, Ph.D Aline França a de Abreu, Ph.D igti.eps.ufsc.br 07 / 10/ 04 Núcleo de estudos Criado em 1997 - UFSC/EPS Equipe multidisciplinar, com aproximadamente 20 integrantes OBJETIVO Gerar uma competência e uma base

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

Dados x Informações. Os Sistemas de Informação podem ser:

Dados x Informações. Os Sistemas de Informação podem ser: CONCEITOS INICIAIS O tratamento da informação precisa ser visto como um recurso da empresa. Deve ser planejado, administrado e controlado de forma eficaz, desenvolvendo aplicações com base nos processos,

Leia mais

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura

Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Curso Data warehouse e Business Intelligence Fundamentos, Metodologia e Arquitetura Apresentação Os projetos de Data Warehouse e Business Intelligence são dos mais interessantes e complexos de desenvolver

Leia mais

Sistemas de Informações Gerenciais

Sistemas de Informações Gerenciais Sistemas de Informações Gerenciais Aula 4 Sistema de Informação SI baseado em computadores Organização, administração e estratégia Professora: Cintia Caetano INTRODUÇÃO Sistemas de Informação são parte

Leia mais

SAD orientado a DADOS

SAD orientado a DADOS Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a DADOS DISCIPLINA: Sistemas de Apoio a Decisão SAD orientado a dados Utilizam grandes repositórios

Leia mais

Material de Apoio. Sistema de Informação Gerencial (SIG)

Material de Apoio. Sistema de Informação Gerencial (SIG) Sistema de Informação Gerencial (SIG) Material de Apoio Os Sistemas de Informação Gerencial (SIG) são sistemas ou processos que fornecem as informações necessárias para gerenciar com eficácia as organizações.

Leia mais

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) AULA 07 MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) JAMES A. O BRIEN MÓDULO 01 Páginas 286 à 294 1 AULA 07 SISTEMAS DE APOIO ÀS DECISÕES 2 Sistemas de Apoio à Decisão (SAD)

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

Sistema Integrado de Gestão ERP Sistema Integrado de Gestão

Sistema Integrado de Gestão ERP Sistema Integrado de Gestão Sistema Integrado de Gestão ERP Sistema Integrado de Gestão ERP Prof: Edson Thizon ethizon@gmail.com Sistema ERP; Processos de Desenvolvimento, Seleção, Aquisição, Implantação de ERP; Aderência e divergência

Leia mais

Modelagem de Sistemas de Informação

Modelagem de Sistemas de Informação Modelagem de Sistemas de Informação Professora conteudista: Gislaine Stachissini Sumário Modelagem de Sistemas de Informação Unidade I 1 SISTEMAS DE INFORMAÇÃO...1 1.1 Conceitos...2 1.2 Objetivo...3 1.3

Leia mais

Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados

Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados Disciplina: Ferramentaspara Tomadade Decisão Prof.: Fernando Hadad Zaidan Unidade 1.2 1 Conceitos Iniciais Tomada de Decisão, Modelagem

Leia mais

Estudar os Sistemas de Processamento de Transação (SPT)

Estudar os Sistemas de Processamento de Transação (SPT) Estudar a Colaboração Empresarial. Objetivos do Capítulo Estudar os Sistemas de Processamento de Transação (SPT) Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Estudar

Leia mais

PROCESSOS PODEROSOS DE NEGÓCIO. ideiaconsultoria.com.br 43 3322 2110 comercial@ideiaconsultoria.com.br

PROCESSOS PODEROSOS DE NEGÓCIO. ideiaconsultoria.com.br 43 3322 2110 comercial@ideiaconsultoria.com.br PROCESSOS PODEROSOS DE NEGÓCIO ideiaconsultoria.com.br 43 3322 2110 comercial@ideiaconsultoria.com.br POR QUE ESCREVEMOS ESTE E-BOOK? Nosso objetivo com este e-book é mostrar como a Gestão de Processos

Leia mais

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence Juntamente com o desenvolvimento desses aplicativos surgiram os problemas: & Data Warehouse July Any Rizzo Oswaldo Filho Década de 70: alguns produtos de BI Intensa e exaustiva programação Informação em

Leia mais

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence.

Tópicos Avançados Business Intelligence. Banco de Dados Prof. Otacílio José Pereira. Unidade 10 Tópicos Avançados Business Inteligence. Tópicos Avançados Business Intelligence Banco de Dados Prof. Otacílio José Pereira Unidade 10 Tópicos Avançados Business Inteligence Roteiro Introdução Níveis organizacionais na empresa Visão Geral das

Leia mais

CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD)

CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD) 1 CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD) A necessidade dos SAD surgiu em decorrência de diversos fatores, como, por exemplo: Competição cada vez maior entre as

Leia mais

Lista de Exercícios - COBIT 5

Lista de Exercícios - COBIT 5 Lista de Exercícios - COBIT 5 1. O COBIT 5 possui: a) 3 volumes, 7 habilitadores, 5 princípios b) 3 volumes, 5 habilitadores, 7 princípios c) 5 volumes, 7 habilitadores, 5 princípios d) 5 volumes, 5 habilitadores,

Leia mais

Criação e uso da Inteligência e Governança do BI

Criação e uso da Inteligência e Governança do BI Criação e uso da Inteligência e Governança do BI Criação e uso da Inteligência e Governança do BI Governança do BI O processo geral de criação de inteligência começa pela identificação e priorização de

Leia mais

Uma estrutura (framework) para o Business Intelligence (BI)

Uma estrutura (framework) para o Business Intelligence (BI) Uma estrutura conceitural para suporteà decisão que combina arquitetura, bancos de dados (ou data warehouse), ferramentas analíticas e aplicações Principais objetivos: Permitir o acesso interativo aos

Leia mais

APLICATIVOS CORPORATIVOS

APLICATIVOS CORPORATIVOS Sistema de Informação e Tecnologia FEQ 0411 Prof Luciel Henrique de Oliveira luciel@uol.com.br Capítulo 3 APLICATIVOS CORPORATIVOS PRADO, Edmir P.V.; SOUZA, Cesar A. de. (org). Fundamentos de Sistemas

Leia mais

Apresentação do Portfólio da ITWV Soluções Inteligentes em Tecnologia

Apresentação do Portfólio da ITWV Soluções Inteligentes em Tecnologia P ORTFÓ FÓLIO Apresentação do Portfólio da ITWV Soluções Inteligentes em Tecnologia versão 1.1 ÍNDICE 1. A EMPRESA... 3 2. BI (BUSINESS INTELLIGENCE)... 5 3. DESENVOLVIMENTO DE SISTEMAS... 6 3.1. PRODUTOS

Leia mais

Chapter 3. Análise de Negócios e Visualização de Dados

Chapter 3. Análise de Negócios e Visualização de Dados Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos

Leia mais

Sistemas de Informação Gerenciais (SIG)

Sistemas de Informação Gerenciais (SIG) Faculdade de Engenharia - Campus de Guaratinguetá Sistemas de Informação Gerenciais (SIG) Prof. José Roberto Dale Luche Unesp Um SISTEMA DE INFORMAÇÃO é um conjunto de componentes inter-relacionados, desenvolvidos

Leia mais

e-business A IBM definiu e-business como: GLOSSÁRIO

e-business A IBM definiu e-business como: GLOSSÁRIO Através do estudo dos sistemas do tipo ERP, foi possível verificar a natureza integradora, abrangente e operacional desta modalidade de sistema. Contudo, faz-se necessário compreender que estas soluções

Leia mais

Sistemas de Informações

Sistemas de Informações Sistemas de Informações Prof. Marco Pozam- mpozam@gmail.com A U L A 0 3 Ementa da disciplina Sistemas de Informações Gerenciais: Conceitos e Operacionalização. Suporte ao processo decisório. ERP Sistemas

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Ementa Conceitos básicos de informática; evolução do uso da TI e sua influência na administração; benefícios; negócios na era digital; administração

Leia mais

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares Universidade de Brasília Faculdade de Ciência da Informação Profa. Lillian Alvares Fóruns / Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias e experiências que

Leia mais

PROJETO UTILIZANDO QLIKVIEW PARA ESTUDO / SIMULAÇÃO DE INDICADORES

PROJETO UTILIZANDO QLIKVIEW PARA ESTUDO / SIMULAÇÃO DE INDICADORES PROJETO UTILIZANDO QLIKVIEW PARA ESTUDO / SIMULAÇÃO DE INDICADORES Fábio S. de Oliveira 1 Daniel Murara Barcia 2 RESUMO Gerenciar informações tem um sido um grande desafio para as empresas diante da competitividade

Leia mais

SISTEMAS DE INFORMAÇÃO GERENCIAIS

SISTEMAS DE INFORMAÇÃO GERENCIAIS SISTEMAS DE INFORMAÇÃO GERENCIAIS O PODER DA INFORMAÇÃO Tem PODER quem toma DECISÃO Toma DECISÃO correta quem tem SABEDORIA Tem SABEDORIA quem usa CONHECIMENTO Tem CONHECIMENTO quem possui INFORMAÇÃO (Sem

Leia mais

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares Universidade de Brasília Faculdade de Ciência da Informação Prof a Lillian Alvares Fóruns Comunidades de Prática Mapeamento do Conhecimento Portal Intranet Extranet Banco de Competências Memória Organizacional

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento

Leia mais

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Sumário Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Capítulo 2 - Reputação corporativa e uma nova ordem empresarial 7 Inovação e virtualidade 9 Coopetição 10 Modelos plurais

Leia mais

Tecnologias e Sistemas de Informação

Tecnologias e Sistemas de Informação Universidade Federal do Vale do São Francisco Curso de Administração Tecnologia e Sistemas de Informação - 02 Prof. Jorge Cavalcanti jorge.cavalcanti@univasf.edu.br www.univasf.edu.br/~jorge.cavalcanti

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.2 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

SISTEMAS DE INFORMAÇÃO CONCEITOS

SISTEMAS DE INFORMAÇÃO CONCEITOS SISTEMAS DE INFORMAÇÃO CONCEITOS 1. Sabe-se que o conceito de Sistema de Informação envolve uma série de sistemas informatizados com diferentes características e aplicações, os quais, porém, têm em comum

Leia mais

Sistemas de Informação Empresarial. Gerencial

Sistemas de Informação Empresarial. Gerencial Sistemas de Informação Empresarial SIG Sistemas de Informação Gerencial Visão Integrada do Papel dos SI s na Empresa [ Problema Organizacional ] [ Nível Organizacional ] Estratégico SAD Gerência sênior

Leia mais

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr.

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr. 15 Aula 15 Tópicos Especiais I Sistemas de Informação Prof. Dr. Dilermando Piva Jr. Site Disciplina: http://fundti.blogspot.com.br/ Conceitos básicos sobre Sistemas de Informação Conceitos sobre Sistemas

Leia mais

www.projetode redes.co m.br www.redesde com p uta dores. com. br

www.projetode redes.co m.br www.redesde com p uta dores. com. br Outras Apostilas em: www.projetode redes.co m.br www.redesde com p uta dores. com. br Centro Universitário Geraldo di Biase 1. Sistemas, Processos e Informações Ao observarmos o funcionamento de um setor

Leia mais

EVER SANTORO www.eversantoro.com.br DOCENCIA > UNIP

EVER SANTORO www.eversantoro.com.br DOCENCIA > UNIP GESTÃO DAS INFORMAÇÕES EVER SANTORO www.eversantoro.com.br DOCENCIA > UNIP CONTEÚDO PROGRAMÁTICO PROGRAMAÇÃO EXPOSIÇÃO DA DISCIPLINA Cultura da informação Informação estratégica Conceito ampliado de informação

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.3 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

INTELIGÊNCIA COMPETITIVA. Transformando dados em decisões estratégicas

INTELIGÊNCIA COMPETITIVA. Transformando dados em decisões estratégicas INTELIGÊNCIA COMPETITIVA Transformando dados em decisões estratégicas Primeiramente, qual a diferença? DADOS INFORMAÇÃO CONHECIMENTO CONHECIMENTO Conjunto de informações analisadas INFORMAÇÃO Conjunto

Leia mais

Conceitos. - Sistema de Informação, Estruturas e Classificação. - Dados x Informações. Edson Almeida Junior www.edsonalmeidajunior.com.

Conceitos. - Sistema de Informação, Estruturas e Classificação. - Dados x Informações. Edson Almeida Junior www.edsonalmeidajunior.com. Conceitos - Sistema de Informação, Estruturas e Classificação - Dados x Informações Edson Almeida Junior www.edsonalmeidajunior.com.br Definição de Sistema Uma coleção de objetos unidos por alguma forma

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

Trata-se de uma estratégia de negócio, em primeira linha, que posteriormente se consubstancia em soluções tecnológicas.

Trata-se de uma estratégia de negócio, em primeira linha, que posteriormente se consubstancia em soluções tecnológicas. CUSTOMER RELATIONSHIP MANAGEMENT Customer Relationship Management CRM ou Gestão de Relacionamento com o Cliente é uma abordagem que coloca o cliente no centro dos processos do negócio, sendo desenhado

Leia mais

Capítulo 13: Tecnologia da Informação. Prof.: Roberto Franciscatto

Capítulo 13: Tecnologia da Informação. Prof.: Roberto Franciscatto Capítulo 13: Tecnologia da Informação Prof.: Roberto Franciscatto Introdução Uma informação é um arranjo de dados (nomes, palavras, números, sons, imagens) capazes de dar forma ou sentido a algo do interesse

Leia mais

PÓS-GRADUAÇÃO Lato Sensu. Gestão e Tecnologia da Informação

PÓS-GRADUAÇÃO Lato Sensu. Gestão e Tecnologia da Informação IETEC - INSTITUTO DE EDUCAÇÃO TECNOLÓGICA PÓS-GRADUAÇÃO Lato Sensu Gestão e Tecnologia da Informação BAM: Analisando Negócios e Serviços em Tempo Real Daniel Leôncio Domingos Fernando Silva Guimarães Resumo

Leia mais

Os novos usos da tecnologia da informação na empresa

Os novos usos da tecnologia da informação na empresa Os novos usos da tecnologia da informação na empresa Internet promoveu: Transformação Novos padrões de funcionamento Novas formas de comercialização. O maior exemplo desta transformação é o E- Business

Leia mais

KDD E MINERAÇÃO DE DADOS:

KDD E MINERAÇÃO DE DADOS: KDD E MINERAÇÃO DE DADOS: Revisão em Data Warehouses Prof. Ronaldo R. Goldschmidt ronaldo@de9.ime.eb.br rribeiro@univercidade.br geocities.yahoo.com.br/ronaldo_goldschmidt 1 DATA WAREHOUSES UMA VISÃO GERAL

Leia mais

A importância da. nas Organizações de Saúde

A importância da. nas Organizações de Saúde A importância da Gestão por Informações nas Organizações de Saúde Jorge Antônio Pinheiro Machado Filho Consultor de Negócios www.bmpro.com.br jorge@bmpro.com.br 1. Situação nas Empresas 2. A Importância

Leia mais

Prof. Ronaldo R. Goldschmidt. ronaldo.rgold@gmail.com

Prof. Ronaldo R. Goldschmidt. ronaldo.rgold@gmail.com DATA WAREHOUSES UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt ronaldo.rgold@gmail.com 1 DATA WAREHOUSES UMA INTRODUÇÃO Considerações Iniciais Conceitos Básicos Modelagem Multidimensional Projeto de Data

Leia mais

APÊNDICE A QUESTIONÁRIO APLICADO AOS GESTORES

APÊNDICE A QUESTIONÁRIO APLICADO AOS GESTORES 202 INSTRUÇÕES DE PREENCHIMENTO ALGUNS COMENTÁRIOS ANTES DE INICIAR O PREENCHIMENTO DO QUESTIONÁRIO: a) Os blocos a seguir visam obter as impressões do ENTREVISTADO quanto aos processos de gestão da Policarbonatos,

Leia mais

Unidade III PLANEJAMENTO ESTRATÉGICO DE. Prof. Daniel Arthur Gennari Junior

Unidade III PLANEJAMENTO ESTRATÉGICO DE. Prof. Daniel Arthur Gennari Junior Unidade III PLANEJAMENTO ESTRATÉGICO DE TECNOLOGIA DA INFORMAÇÃO Prof. Daniel Arthur Gennari Junior Sobre esta aula Gestão do conhecimento e inteligência Corporativa Conceitos fundamentais Aplicações do

Leia mais

IMPLANTAÇÃO DO DW NA ANVISA

IMPLANTAÇÃO DO DW NA ANVISA IMPLANTAÇÃO DO DW NA ANVISA Bruno Nascimento de Ávila 1 Rodrigo Vitorino Moravia 2 Maria Renata Furtado 3 Viviane Rodrigues Silva 4 RESUMO A tecnologia de Business Intelligenge (BI) ou Inteligência de

Leia mais

Coletividade; Diferenciais; Informação; Dado; Informação; Conhecimento. Coletar informação; e Identificar as direções.

Coletividade; Diferenciais; Informação; Dado; Informação; Conhecimento. Coletar informação; e Identificar as direções. Revisão 1 Coletividade; Diferenciais; Informação; Dado; Informação; Conhecimento Coletar informação; e Identificar as direções. Precisa; Clara; Econômica; Flexível; Confiável; Dirigida; Simples; Rápida;

Leia mais

Sistemas Integrados de Gestão História e Evolução do Conceito

Sistemas Integrados de Gestão História e Evolução do Conceito Sistemas Integrados de Gestão História e Evolução do Conceito Sistemas de Informação Prof. Gerson gerson.prando@fatec.sp.gov.br Evolução dos SI OPERACIONAL TÁTICO OPERACIONAL ESTRATÉGICO TÁTICO ESTRATÉGICO

Leia mais

Sistema de Informação

Sistema de Informação Sistema de Informação É um conjunto de partes coordenadas, que buscam prover a empresa com informações, com o objetivo de melhorar a tomada de decisões. Conjunto organizado de pessoas, hardware, software,

Leia mais

SPEKTRUM SOLUÇÕES DE GRANDE PORTE PARA PEQUENAS E MÉDIAS EMPRESAS SPEKTRUM SAP Partner 1

SPEKTRUM SOLUÇÕES DE GRANDE PORTE PARA PEQUENAS E MÉDIAS EMPRESAS SPEKTRUM SAP Partner 1 SPEKTRUM SOLUÇÕES DE GRANDE PORTE PARA PEQUENAS E MÉDIAS EMPRESAS SPEKTRUM SAP Partner 1 PROSPERE NA NOVA ECONOMIA A SPEKTRUM SUPORTA A EXECUÇÃO DA SUA ESTRATÉGIA Para as empresas que buscam crescimento

Leia mais

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Introdução a Data Warehousing e OLAP Introdução a Data Warehouse e Modelagem Dimensional Visão

Leia mais

SAD. Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares

SAD. Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares SAD Paulo Silva, Rodolfo Ribeiro, Vinicius Tavares DataWarehouse Armazena informações relativas a uma organização em BD Facilita tomada de decisões Dados são coletados de OLTP(séries históricas) Dados

Leia mais

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO Proposta de Formação Complementar: BUSINESS INTELLIGENCE E SUA APLICAÇÃO À GESTÃO Aluno: Yussif Tadeu de Barcelos Solange Teixeira

Leia mais

Inteligência Organizacional, Inteligência Empresarial, Inteligência Competitiva, Infra-estrutura de BI mas qual é a diferença?

Inteligência Organizacional, Inteligência Empresarial, Inteligência Competitiva, Infra-estrutura de BI mas qual é a diferença? Inteligência Organizacional, Inteligência Empresarial, Inteligência Competitiva, Infra-estrutura de BI mas qual é a diferença? * Daniela Ramos Teixeira A Inteligência vem ganhando seguidores cada vez mais

Leia mais

Thiago Locatelli de OLIVEIRA, Thaynara de Assis Machado de JESUS; Fernando José BRAZ Bolsistas CNPq; Orientador IFC Campus Araquari

Thiago Locatelli de OLIVEIRA, Thaynara de Assis Machado de JESUS; Fernando José BRAZ Bolsistas CNPq; Orientador IFC Campus Araquari DESENVOLVIMENTO DE AMBIENTE PARA A GESTÃO DO CONHECIMENTO RELACIONADO AOS DADOS PRODUZIDOS PELO SISTEMA DE GERENCIAMENTO DE TRANSITO DA CIDADE DE JOINVILLE/SC PARTE I Thiago Locatelli de OLIVEIRA, Thaynara

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais