Informática Business Intelligence Professor Márcio Hunecke www.acasadoconcurseiro.com.br
Informática Aula XX BUSINESS INTELLIGENCE (BI) Conceitos de dado, informação, conhecimento e inteligência É importante distinguir dados, informação, conhecimento e acrescentar o conceito de inteligência. Considerando uma tabela fictícia, o valor 35 na 1ª linha com a 2ª coluna é um dado. Dados são representações de informações. Sozinhos não dizem nada. Quando entendemos que o 35 significa a idade do cliente José, por exemplo, estamos transformando o dado em informação. As pessoas trabalham com informações, mas a tecnologia armazena dados. Já conhecimento seria: Todos os clientes da cidade de SP têm saldo médio maior que 9 mil reais. Notem, isto não é uma informação que está explícita na tabela. Só conseguimos chegar a esse conhecimento se cruzarmos informações diferentes. Conhecimento, portanto, vem das informações. Mas está acima. As pessoas recebem muitas informações no seu dia a dia, mas nem tudo fica retido, nem tudo é útil, nem tudo será utilizado mais adiante. O que resta, o que é útil, o que é utilizado forma o conhecimento desta pessoa. Já o conceito de inteligência (alguns chamam de sabedoria) está acima do conhecimento. Imagine um grupo de pessoas numa sala fechada (nada entra ou sai) recebendo uma tarefa: quebrar a cadeira onde estão sentados. Admitamos que todos possuem a mesma força física e foram criados e educados em famílias e escolas semelhantes. Ou seja, possuem o mesmo nível de conhecimento, obtido por estudos nas escolas, leitura em casa, viagens, experiência, etc. Algumas destas pessoas conseguirão resolver o problema e outras não. Mas por que, se todas possuem a mesma força física e os mesmos conhecimentos? A diferença está na forma como cada um utiliza o conhecimento que tem e as conexões que faz em seu cérebro. Isto é inteligência, ou seja, saber resolver problemas utilizando o conhecimento que possui. E isto se aplica também em poder resolver problemas novos, usando adaptações, analogias, etc. Tenha em mente que os altos volumes de dados e informações nem sempre geram conhecimento se não forem adequadamente interpretados, além disso, a qualidade dos dados deve ser considerada para a adequada apuração e geração da informação e consequentemente obtenção do conhecimento. www.acasadoconcurseiro.com.br 3
Dados Dados são códigos que constituem a matéria prima da informação, ou seja, é a informação não tratada. Os dados representam um ou mais significados que isoladamente não podem transmitir uma mensagem ou representar algum conhecimento. Em uma pesquisa eleitoral por exemplo, são coletados dados, isto é, cada participante da pesquisa fornece suas opiniões e escolhas sobre determinados candidatos, mas essas opiniões não significam muita coisa no âmbito da eleição. Só depois de ser integrada com as demais opiniões é que teremos algo significativo. Outro exemplo seria em uma investigação policial por exemplo. Inicialmente colhe-se depoimentos, analisa pistas e busca qualquer tipo de dado que possa ser útil. Contudo, isoladamente esses dados não vão dizer quem é o criminoso. Informações Informações são dados tratados. O resultado do processamento de dados são as informações. As informações têm significado, podem ser tomadas decisões ou fazer afirmações considerando as informações. No exemplo da pesquisa eleitoral, os pesquisadores retêm dados dos entrevistados, mas quando inseridos nos sistemas e processados produzem informações e essas informações diz que tem mais chance de ser eleito, entre outras. No exemplo anterior da investigação policial, ainda que de forma manual, os investigadores irão reunir todos os dados, analisar, processar e chegar a relatórios informativos que darão ao juiz, advogados e promotores as informações necessárias para realizar o julgamento. Salvo engano, isto é chamado de inquérito policial. Desta forma podemos dizer que as informações é o conjunto de dados que foram processados, seja por meio eletrônico, mecânico ou manual e que produziu um resultado com significado. Conhecimento O conhecimento vai além de informações, pois ele além de ter um significado tem uma aplicação. Veja aqui os tipos de conhecimento. Conhecimento é o ato ou efeito de abstrair ideia ou noção de alguma coisa, como por exemplo: conhecimento das leis; conhecimento de um fato (obter informação); conhecimento de um documento; termo de recibo ou nota em que se declara o aceite de um produto ou serviço; saber, instrução ou cabedal científico (homem com grande conhecimento). As informações são valiosas, mas o conhecimento constitui um saber. Produz ideias e experiências que as informações por si só não será capaz de mostrar. Se informação é dado trabalhado, então conhecimento e informação trabalhada. 4 www.acasadoconcurseiro.com.br
Informática Business Intelligence Prof. Márcio Hunecke Business Intelligence Business Intelligence refere-se ao processo de coleta, organização, análise, compartilhamento e monitoramento de informações que oferecem suporte a gestão de negócios. É um conjunto de técnicas e ferramentas para auxiliar na transformação de dados brutos em informações significativas e uteis a fim de analisar o negócio. As tecnologias BI são capazes de suportar uma grande quantidade de dados desestruturados para ajudar a identificar, desenvolver e até mesmo criar uma nova oportunidade de estratégia de negócios. O objetivo do BI é permitir uma fácil interpretação do grande volume de dados. Identificando novas oportunidades e implementando uma estratégia efetiva baseada nos dados, também pode promover negócios com vantagem competitiva no mercado e estabilidade a longo prazo. Tecnologias BI fornecem histórico, atual e previsíveis visões das operações de negócios. As habituais funções do BI são relatórios, processos de análise online, análises, mineração de dados, processamento de eventos complexos, gerenciamento de desempenho dos negócios, benchmarking, mineração de texto, análises previsíveis e análises prescritivas. O BI pode ser usado para ajudar na decisão de uma grande variedade de negócios variando do operacional ao estratégico. Decisões de operações básicas incluem posição do produto ou atribuição de preços. Decisões de estratégia de negócios abrangem prioridades, objetivos e direções do mais amplo nível. Em todos os casos, o BI é mais efetivo quando combinado a dados procedentes do mercado em que uma companhia opera (dados externos) com dados de fontes internas da companhia para os negócios, como dados financeiros ou operacionais (dados internos). Quando os dados externos e internos são combinados, podem fornecer um cenário mais completo. Na realidade, cria uma inteligência que não pode ser derivada por nenhum conjunto de dados. Inteligência empresarial também pode ser definida como a Atividade de Inteligência aplicada à atividade econômica com a identificação de forças e fraquezas da companhia e o monitoramento dos stakeholders para antecipação de ameaças à organização e melhor aproveitamento das oportunidades de negócios. Figura 1 Representação do ambiente BI www.acasadoconcurseiro.com.br 5
Data Warehouse Executivos tomadores de decisão (diretores, gerentes, analistas, etc.) necessitam de ferramentas de apoio a tomada de decisão. É aí que entram os sistemas de suporte à decisão (Decision Support Systems DSS), ferramentas que ofereçam consultas sob demanda, interfaces gráficas, etc. Um data warehouse visa integrar os dados internos e externos de uma organização em uma estrutura unificada, a fim de permitir uma melhor utilização dos dados. A partir de uma estrutura de DW obtida, a análise destes dados se dá através de sistemas como OLAP (On-Line Analytical Processing) e data mining. Um data warehouse é uma coleção de dados orientada por assuntos, integrada, variante no tempo, que tem por objetivo dar suporte aos processos de tomada de decisão. O data warehouse é um banco de dados contendo dados extraídos do ambiente de produção da empresa (OLTP), que foram selecionados, tendo sido otimizados para processamento de consulta e não para processamento de transações através de um processo de extração transformação e carga (ou ETL Extract transform and Load). De maneira geral, um data warehouse pode consolidar dados de outras fontes externas, incluindo informações provenientes de planilhas eletrônicas, documentos, dados da web, etc. O objetivo de um data warehouse é fornecer uma imagem única da realidade do negócio. De uma forma geral, sistemas de data warehouse compreendem um conjunto de programas que extraem dados do ambiente de dados operacionais da empresa, um banco de dados que os mantém, e sistemas que fornecem estes dados aos seus usuários. Sistemas de Data Warehouse revitalizam os sistemas da empresa, pois: permitem que sistemas mais antigos continuem em operação; consolidam dados inconsistentes dos sistemas mais antigos em conjuntos coerentes; extraem benefícios de novas informações oriundas das operações correntes; Como se vê, existem diferentes visões do que seria um data warehouse: uma arquitetura, um conjunto de dados semanticamente consistente com o objetivo de atender diferentes necessidades de acesso a dados e extração de relatórios, ou ainda, um processo em constante evolução, que utiliza dados de diversas fontes heterogêneas para dar suporte a consultas adhoc (sob demanda), relatórios analíticos e à tomada de decisão. Propósitos de um Data Wharehouse Para entender o propósito do DW, analisaremos as seguintes questões: Nós possuímos montanhas de dados, no entanto, não conseguimos acessá-los. É necessário facilitar o acesso às informações para os usuários de negócio. Apenas mostre-me o que é importante. 6 www.acasadoconcurseiro.com.br
Informática Business Intelligence Prof. Márcio Hunecke Nós precisamos que as pessoas usem a informação para suportar uma tomada de decisão baseada em fatos. Uma das missões do data Warehouse é justamente consolidar os dados que são importantes para a tomada de decisão. Evitar o Achômetro. Data Warehouse e Data Mart Um data mart é uma subdivisão ou subconjunto de um data warehouse. Os data marts são como pequenas fatias de data warehouse, que armazenam subconjuntos de dados. Normalmente o data mart é direcionado para uma linha de negócios ou equipe, sendo que a sua informação costuma pertencer a um único departamento. Extraindo informações do Data Warehouse Existem várias maneiras de recuperar informações de um data warehouse, as formas de extração mais comuns no mercado hoje são: Ferramentas OLAP; Ferramentas Data mining. Ferramentas de Data Mining Data mining (ou mineração de dados) é o processo de extrair informação válida, previamente desconhecida e de máxima abrangência a partir de grandes bases de dados, usando-as para efetuar decisões cruciais. Data mining vai muito além da simples consulta a um banco de dados, no sentido de que permite aos usuários explorar e inferir informação útil a partir dos dados, descobrindo relacionamentos escondidos no banco de dados. Um ambiente de apoio à tomada de decisões, integrando técnicas de data mining sobre um ambiente de data warehousing, possibilita um grande número de aplicações, que já vêm sendo implementadas em diversos segmentos de negócios, como manufatura, automação de pedido de remessas, varejo, gerenciamento de inventários, financeiro, análise de risco, transporte, gerenciamento de frotas, telecomunicação, análise de chamadas, saúde, analise de resultados, marketing, estabelecimento do perfil dos consumidores, seguros, detecção de fraude, dentre outros. www.acasadoconcurseiro.com.br 7
OLAP Partindo dos primórdios da informatização, quando um sistema que gerava relatórios era a principal fonte de dados residentes na empresa, toda vez que uma análise necessitasse ser feita, eram necessários produzir novos relatórios. Estes relatórios tinham que ser produzidos pela área de informática e, normalmente, precisavam de muito tempo para ficar prontos. E, também, apresentavam os seguintes problemas: Os relatórios eram estáticos; O acúmulo de diferentes tipos de relatórios num sistema gerava um problema de manutenção. Então surgiu o conceito de OLAP (On-Line Analytic Processing). OLAP é um software cuja tecnologia de construção permite aos analistas de negócios, gerentes e executivos analisar e visualizar dados corporativos de forma rápida, consistente e principalmente interativa. A funcionalidade OLAP é inicialmente caracterizada pela análise dinâmica e multidimensional dos dados consolidados de uma organização permitindo que as atividades do usuário final sejam tanto analíticas quanto navegacionais A tecnologia OLAP é geralmente implementada em ambiente multiusuário e cliente/servidor, oferecendo assim respostas rápidas às consultas ad-hoc (construção de listagens, interligando a informação disponível na base de dados conforme as necessidades especificas da empresa, assim como a sua exportação, possibilitando várias simulações), não importando o tamanho do banco de dados nem sua complexidade. Hoje em dia, essa tecnologia também vem sendo disponibilizada em ambiente Web. Essa tecnologia auxilia o usuário a sintetizar informações corporativas por meio de visões comparativas e personalizadas, análises históricas, projeções e elaborações de cenários. A classificação de ferramentas OLAP é uma tarefa imprecisa e gera alguma perplexidade por parte dos profissionais envolvidos na escolha e aquisição de uma ferramenta analítica, uma vez que não existe nenhuma característica peculiar que dite como a ferramenta deva ser construída, qual tecnologia deva ser usada em sua construção, nem mesmo que funcionalidades devem ser implementadas. Para tornar o processo de classificação mais complexo, muitos fornecedores anunciam características que tornam suas ferramentas compatíveis com funcionalidades OLAP sem que estas sejam sequer ferramentas OLAP. Outras oferecem suítes de produtos que são conhecidos como os melhores do mercado. Atualmente existem no mercado diversos produtos OLAP que se diferenciam muito uns dos outros, tal fato gera uma situação muitas vezes contraditória no momento da escolha da ferramenta mais adequada às necessidades de uma organização. Para tornar o problema ainda mais complexo, nem os profissionais de tecnologia da informação (TI) nem os usuários finais estão suficientemente informados sobre que produtos OLAP adquirir. O processo de avaliação de uma ferramenta OLAP envolve análise das: funcionalidades, arquitetura, e interfaces e impacto sobre a organização. O processo de aquisição de uma ferramenta OLAP deveria envolver não só os profissionais de TI como também os grupos de usuários finais. Porém, nem sempre esta premissa é verdadeira. 8 www.acasadoconcurseiro.com.br
Informática Business Intelligence Prof. Márcio Hunecke Diversas organizações relatam sérios problemas de comunicação entre as equipes envolvidas na escolha de uma ferramenta OLAP. A escolha de uma ferramenta OLAP inadequada pode ocasionar severas consequências para um projeto de data warehouse, entre as quais podemos citar: Falha total do projeto e consequente perda dos benefícios esperados para os negócios da empresa, além dos prejuízos financeiros gerados pelo alto custo da aquisição de software, serviços e treinamentos das equipes iniciais do projeto resultando benefícios ilusórios e temporários. Esta situação é muito comum em diversas organizações e sob certos aspectos gera piores resultados. Falha parcial do projeto onde apenas alguns módulos sobrevivem, reduzindo assim o escopo, estando comparados com o item anterior, uma vez que passam a existir menores incentivos para substituir os sistemas atuais. Funcionalidades da Ferramenta OLAP A funcionalidade de uma ferramenta OLAP é caracterizada pela análise multidimensional dinâmica dos dados, apoiando o usuário final nas suas atividades. Arquiteturas OLAP Acompanhando a evolução dos sistemas, introduziram uma nova classe de Ferramentas no mercado, que se chamava de OLAP (On-Line Analitical Processing), que permitiam acesso rápido aos dados conjugado com funcionalidades de análise multidimensional dos mesmos pelos usuários finais. A rapidez exigida tinha de ser satisfatória. A análise deveria ser dinâmica, onde o usuário poderia fazer a consulta que quisesse sem depender de um profissional, multidimensional e compartilhado. A análise multidimensional é uma das grandes utilidades da tecnologia OLAP, consistindo em ver determinados cubos de informações de diferentes ângulos e de vários níveis de agregação. Os cubos são massas de dados que retornam das consultas feitas ao banco de dados e podem ser manipulados e visualizados. Operações da Análise OLAP Drill Down: Ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo o grau de granularidade. Drill Up: é o contrário do Drill Down, ele ocorre quando o usuário aumenta o grau de granularidade, diminuindo o nível de detalhamento da informação. Slice (fatiar) seleciona dados de uma única dimensão de um cubo OLAP. www.acasadoconcurseiro.com.br 9
Dice extrai um subcubo do cubo original executando uma operação de seleção em duas ou mais dimensões. Pivot (rotacional) Operação de rotação que permite visualizar dados de uma nova perspectiva. 10 www.acasadoconcurseiro.com.br
Questões 1 (2018 FUNDEP (Gestão de Concursos) CODEMIG Analista de Sistemas) O conceito de business intelligence (BI), de forma mais ampla, pode ser entendido como a utilização de variadas fontes de informação para se definir estratégias de competitividade nos negócios da empresa. Analise as seguintes afirmativas sobre business intelligence e assinale com V as verdadeiras e com F as falsas. ( ) Os conceitos de BI estão em sua essência relacionados com uma específica e única forma de tratamento das informações. Os dados de natureza operacional e informacional possuem os mesmos objetivos relacionados aos sistemas tradicionais. ( ) O objetivo maior das técnicas de BI está exatamente na definição de regras e técnicas para a formatação adequada dos volumes de dados, visando transportá-los em depósitos estruturados de informações, independentemente de sua origem. ( ) A definição de estruturas modeladas dimensionalmente, armazenadas em data ware-house ou marts e interpretadas pela ótica analítica das ferramentas de OLAP (on line analytical processing) ou pelo prisma inferencial das ferramentas de data mining, atinge também os objetivos propostos pelas premissas de BI. ( ) As ferramentas para um ambiente BI são ferramentas técnicas de construção e uso. As ferramentas gerenciais não estão incluídas nos objetivos. As ferramentas de construção auxiliam no processo de extração de dados e as ferramentas de uso incluem os mecanismos de manipulação de dados. As ferramentas de gerência auxiliam o processo de armazenamento e permissões de acesso. Assinale a sequência CORRETA. a) V F V F b) F V F V c) V F F V d) F V V F 2. (2018 CESPE CGM de João Pessoa PB Auditor M. Desenvolvimento de Sistemas) A respeito de business intelligence, julgue o próximo item. Business intelligence pode ser definido como um processo inteligente de coleta, organização, análise, compartilhamento e monitoração de dados que, depois de processados, geram informações para o suporte e para a tomada de decisões no ambiente de negócios. ( ) Certo ( ) Errado 3. (2017 UPENET/IAUPE UPE Analista de Sistemas Banco de Dados) Sobre business intelligence, analise as afirmativas abaixo: I. Uma das etapas da abordagem OLAP diz respeito às ferramentas que são utilizadas para extração dos dados do repositório para posterior inserção no datawarehouse. II. A predição de eventos é uma das propriedades da mineração de dados. III. O data warehouse é um banco de dados que contém dados voláteis sumarizados de várias formas para respostas rápidas a consultas. Está CORRETO o que se afirma em a) III, apenas. b) I e III, apenas. c) II e III, apenas. d) I, II e III. e) II, apenas. www.acasadoconcurseiro.com.br 11
4. (2015 FCC TRT 9ª REGIÃO (PR) Técnico Judiciário Área Apoio Especializado Tecnologia da Informação) Uma plataforma de Business Intelligence envolve o DW Data Warehouse e diversos componentes, dentre os quais, encontram-se I. um subconjunto de informações do DW que podem ser identificados por assuntos ou departamentos específicos. II. ferramentas com capacidade de análise em múltiplas perspectivas das informações armazenadas. III. ferramentas com capacidade de descoberta de conhecimento relevante. Encontram correlações e padrões dentro dos dados armazenados. IV. processo de extração, tratamento e limpeza dos dados para inserção no DW. Os componentes de I a IV são, correta e respectivamente, a) Staging Area Data Mining OLAP ETL. b) Data Mart OLAP Data Mining ETL. c) OLTP Drill Through Drill Across Staging Area. d) Cubo de dados Data Mining OLTP Operações Drill. e) Staging Area OLAP Data Mining Operações Drill. 5. (2015 FCC TRT 4ª REGIÃO (RS) Analista Judiciário Tecnologia da Informação) Considere a arquitetura geral de um sistema de BI- Business Intelligence mostrada na figura abaixo. Nesta arquitetura a) Data Marts representam áreas de armazenamento intermediário criadas a partir do processo de ETL. Auxiliam na transição dos dados das fontes OLTP para o destino final no Data Warehouse. b) OLAP é um subconjunto de informações extraído do Data Warehouse que pode ser identificado por assuntos ou departamentos específicos. Utiliza uma modelagem multidimensional conhecida como modelo estrela. c) os dados armazenados no Data Warehouse são integrados na base única mantendo as convenções de nomes, valores de variáveis e outros atributos físicos de dados como foram obtidos das bases de dados originais. d) o Data Warehouse não é volátil, permite apenas a carga inicial dos dados e consultas a estes dados. Além disso, os dados nele armazenados são precisos em relação ao tempo, não podendo ser atualizados. e) Data Mining se refere ao processo que, na construção do Data Warehouse, é utilizado para composição de análises e relatórios, armazenando dados descritivos e qualificando a respectiva métrica associada. 6. (2015 FCC TRT 4ª REGIÃO (RS) Técnico Judiciário Tecnologia da Informação) Considere a figura abaixo que traz componentes de um sistema de BI-Business Intelligence. 12 www.acasadoconcurseiro.com.br
Informática Business Intelligence Prof. Márcio Hunecke Os elementos I, II, III e IV indicados na figura são, correta e respectivamente, associados com: a) PL/SQL Oracle 11g OLAP Data Mining. b) Portal Corporativo SGBD Consultas SQL Cubo de Dados. c) SGBD Data Warehouse OLAP Data Mining. d) Oracle Cubo de Dados Consultas PL/ SQL OLAP. e) OLTP Data Warehouse Operações Drill Cubo de Dados. 7. (2015 CESPE FUB Analista de Tecnologia da Informação) A respeito de Business Intelligence e sua aplicação em corporações, julgue o item a seguir. Em um ambiente de Business Intelligence, o usuário pode deparar com diferentes requisitos de infraestrutura para atender às necessidades de cada uma das instâncias dos sistemas analíticos. ( ) Certo ( ) Errado 8. (2015 CESPE FUB Analista de Tecnologia da Informação) A respeito de Business Intelligence e sua aplicação em corporações, julgue o item a seguir. A estabilidade da arquitetura de dados assegura a análise histórica dos dados operacionais armazenados nas bases de dados. ( ) Certo ( ) Errado 9. (2014 FUNCAB SEFAZ-BA Auditor Fiscal Tecnologia da Informação Tarde) Alguns termos relacionados com as estruturas de bancos de dados estão disponibilizados na coluna I. Estabeleça a correta correspondência com os seus significados, disponibilizados na coluna II. Coluna I 1. Data Marts 2. OLAP 3. Business Inteligence 4. Metadados Coluna II ( ) Camada de diretório de dados da arquitetura do datawarehouse. ( ) Tipo ou variação de um datawarehouse. ( ) Cria, administra, analisa e gera relatórios sobre dados multidimensionais. ( ) Modelo utilizado pelas empresas para descobrir padrões de comportamento de determinado grupo de clientes. A sequência correta é: a) 1, 2, 3 e 4. b) 1, 4, 2 e 3. c) 4, 2, 3 e 1. d) 4, 1, 2 e 3. e) 2, 3, 1 e 4. 10. (2014 FUNCAB MDA Analista de Bussiness Inteligence) Os projetos de Business Intelligence apresentam a seguinte característica: a) as especificações do projeto são estabelecidas sem necessitar da análise de requisitos. b) o desenvolvimento do projeto depende diretamente dos indicadores de desempenho. c) o uso de protótipos no projeto deve excluir a participação do cliente no processo. d) o desenvolvimento do projeto independe do apoio da gestão. e) as fases do projeto são totalmente independentes uma das outras. Gabarito: 1. D 2. C 3. E 4. B 5. D 6. C 7. C 8. E 9. D 10. B www.acasadoconcurseiro.com.br 13