GESTÃO DE DADOS NAS ORGANIZAÇÕES Prof. Robson Almeida
INFRA-ESTRUTURA DE SISTEMAS DE INFORMAÇÃO 3
CONCEITOS Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único caractere Campo: Grupo de palavras ou um número completo Registro: Grupo de campos relacionados Arquivo: Grupo de registros do mesmo tipo Banco de dados: Grupo de arquivos relacionados
CONCEITOS Entidade: Pessoa, coisa, lugar, evento sobre o qual se mantém a informação Atributo: Descrição de uma entidade específica Campo-chave: Campo identificador usado para recuperar, atualizar e ordenar registros
GESTÃO DE DADOS Banco de Dados É o recurso responsável pelo armazenamento de forma estruturada de um conjunto de dados e informações sobre uma determinada organização. Este ambiente é o coração de qualquer sistema de informação baseado em computador.
HIERARQUIA DE DADOS
CAMPO X REGISTRO X ARQUIVO
SISTEMA DE GERENCIAMENTO DE BANCO DE DADOS (SGBD) Um tipo de software específico para criar, armazenar, organizar e acessar dados de um banco de dados Separa as visões lógica e física dos dados Visão lógica: como os usuários finais vêem os dados Visão física: como os dados estão realmente estruturados e organizados Exemplos de DBMS: Microsoft Access, DB2, Oracle Database, Microsoft SQL Server, MYSQL
MODELO ENTIDADE-RELACIONAMENTO (MER) Qual o problema? O problema é que pode haver muitas peças e fornecedores para cada pedido.
SGBD RELACIONAL
TABELA DE BANCO DE DADOS RELACIONAL Um banco de dados relacional organiza os dados na forma de tabelas bidimensionais. Temos aqui uma tabela para a entidade FORNECEDOR e vemos como ela representa a entidade e seus atributos.
MODELO ENTIDADE-RELACIONAMENTO (MER) Este diagrama mostra a relação entre as entidades FORNECEDOR e PEÇA.
MODELO ENTIDADE-RELACIONAMENTO (MER)
MODELO ENTIDADE-RELACIONAMENTO (MER)
SGBD HIERÁRQUICO
SGBD EM REDE
PRINCIPAIS ELEMENTOS DE UM SGBD Gerenciamento de dados Planejamento de dados e metodologia de modelagem Tecnologia e gerenciamento de bancos de dados Usuários
GESTĀO ESTRATÉGICA DE DADOS
INTELIGÊNCIA EMPRESARIAL Inteligência empresarial: ferramentas que consolidam, analisam e acessam vastas quantidades de dados para ajudar os usuários a tomar melhores decisões empresariais Processamento analítico on-line (OLAP) Data minning e análise preditiva Associações Seqüências Classificações Aglomerações Prognósticos
OLAP Processamento analítico on-line (OLAP) Análise multidimensional de dados Permite a manipulação e a análise de grandes volumes de dados a partir de várias dimensões/perspectivas
DATA WAREHOUSE Como um Banco de Dados pode ajudar a melhorar o desempenho e a tomada de decisão nas organizações? Data Warehouse Banco de dados que armazena dados correntes e históricos de potencial interesse para os tomadores de decisão de toda a empresa. Data marts Subconjunto de um Data Warehouse, no qual uma porção resumida ou altamente focalizada dos dados da organização é colocada em um banco separado destinado a uma população específica de usuários
Dados correntes e históricos são extraídos de sistemas operacionais internos à organização. Esses dados são combinados com dados de fontes externas e reorganizados em um banco central projetado para análise gerencial e produção de relatórios. O diretório de informações fornece aos usuários informações sobre os dados disponíveis no armazém MINERAÇÃO DE DADOS
Uma série de ferramentas analíticas trabalha com os dados armazenados nos bancos de dados, encontrando padrões e insights que ajudam gerentes e funcionários a tomar melhores decisões e, assim, aprimorar o desempenho organizacional. INTELIGÊNCIA EMPRESARIAL
INTELIGÊNCIA EMPRESARIAL
INTELIGÊNCIA EMPRESARIAL ETL, do inglês Extract Transform Load (Extração Transformação Caregamento), são ferramentas de software cuja função é a extração de dados de diversos sistemas, transformação desses dados conforme regras de negócios e por fim o carregamento dos dados geralmente para um Data Mart e/ou Data Warehouse
DESCOBERTA DO CONHECIMENTO (KDD)
GERENCIAMENTO DE RECURSO DE DADOS Definindo uma Política de Informação 1. Uma política de informação especifica as regras para compartilhar, disseminar, adquirir, padronizar, classificar e inventariar a informação 2. O gerenciamento de dados é responsável pelas políticas e procedimentos específicos pelos quais os dados podem ser gerenciados como recurso organizacional. 3. Grandes organizações costumam ter um grupo de gerenciamento e projeto de bancos de dados dentro da divisão corporativa de sistemas de informação 4. Baixa qualidade de dados é o maior obstáculo para o sucesso do gerenciamento do relacionamento com o cliente
GERENCIAMENTO DE RECURSO DE DADOS Definindo uma Política de Informação 5. Os problemas de qualidade de dados podem ser causados por dados redundantes e inconsistentes produzidos por múltiplos sistemas 6. Erros de entrada de dados são a causa de muitos problemas de qualidade de dados 7. Auditoria de qualidade de dados é um levantamento estruturado da precisão e do nível de integridade dos dados em um sistema de informação 8. O data cleanning (limpeza e padronização) consiste em atividades para detectar e corrigir, no banco de dados, dados incorretos, incompletos, formatados inadequadamente ou redundantes
QUESTÃO 1 Uma aplicação específica está varrendo diversas bases de dados de uma organização: bancos de dados transacionais, planilhas eletrônicas, arquivos de texto, documentos eletrônicos, todos os tipos de objetos que possam conter informações estão sendo analisados em busca de padrões, tendências, transformações etc, que possam apoiar a Diretoria no processo de tomada de decisões. O texto acima descreve: A) OLAP B) Datawarehouse C) Datamining D) Pivoteamento E) ETL
QUESTÃO 2 Data Mining é parte de um processo maior denominado: A) Datawarehouse B) Data Mart C) Business Intelligence D) Knowledge Discovery in Database E) Database Marketing
QUESTÃO 3 BI é o processo de coleta, transformação, análise e distribuição de dados, coletados em informações estratégicas, para tomadas de decisões nas empresas, incorporando o conceito de gerenciamento dados e permitindo extrair dados arquivados em vários sistemas, identificá-los, definir padrões, detectar tendências e fazer previsões. A) CERTO B) ERRADO
QUESTÃO 4 Os termos Business Intelligence (BI) e Big Data confundem-se em certos aspectos. Uma conhecida abordagem para identificação dos pontos críticos de cada paradigma é conhecida como 3V, e destaca: A) variedade, visualização, volume B) velocidade, virtualização, volume; C) virtualização, visualização, volume; D) variedade, velocidade, volume; E) variedade, visualização, virtualização.
QUESTÃO 5 Ao utilizar armazenamento dos dados em nuvem, a localização do processamento de aplicações Big Data não influenciará os custos e o tempo de resposta, uma vez que os dados são acessíveis a partir de qualquer lugar. A) CERTO B) ERRADO
QUESTÃO 6 Os dados de sistemas OLAP se baseiam nas informações contidas nos diversos softwares utilizados pela empresa (ERPs, planilhas, arquivos texto, arquivos XML etc.). Estes sistemas possuem uma camada onde estão os dados originais e outra camada onde estão os dados tratados (um gigantesco repositório de dados sobre assuntos diversos preparados para serem consultados por um sistema OLAP), que chamamos de: A) Data Mining. B) Online Transactional Database. C) Data Mart. D) Big Data. E) Datawarehouse.