Curso de Bacharelado em Ciência da Computação. Leandro Lopes Schimitt EXPLORANDO DATA MINING COM DATA QUALITY

Tamanho: px
Começar a partir da página:

Download "Curso de Bacharelado em Ciência da Computação. Leandro Lopes Schimitt EXPLORANDO DATA MINING COM DATA QUALITY"

Transcrição

1 Curso de Bacharelado em Ciência da Computação Leandro Lopes Schimitt EXPLORANDO DATA MINING COM DATA QUALITY Canoas, 2009

2 Leandro Lopes Schimitt EXPLORANDO DATA MINING COM DATA QUALITY Monografia apresentada ao Curso de Ciência da Computação do Centro Universitário La Salle, como parte dos requisitos para obtenção do título de Bacharel em Ciência da Computação, sob a orientação da Profa. Dra. Patrícia Kayser Vargas Mangan e coorientação da Profa. Dra. Marisa Tsao. Canoas, Junho de 2009

3 RESUMO Este trabalho tem como temas centrais data mining e data quality management ambos sendo utilizados em uma base de dados de pesquisa oriunda do projeto DATASinos. A utilização do data mining se justifica por ser um processo multidisciplinar que pode envolver conceitos de banco de dados, inteligência artificial, utilização de autômatos, redes neurais, sistemas baseados em conhecimento, busca e reconhecimento de padrões e computação de alto desempenho entre outros. A qualidade de dados agrega valor ao processo dando mais veracidade ao resultado das informações. O trabalho em conjunto com a mineração de dados busca trazer subsídios mais autênticos no processamento da informação, através dessa combinação é que este trabalho foi pautado, trazendo informações a cerca desses assuntos. O assunto qualidade de dados teve seus conceitos baseados na utilização do DMBOK (data management body of knowledge) utilizando uma das atividades do framework com a função de gerenciar a qualidade de dados. Palavras-chave: mineração de dados, gerenciamento de dados do corpo de conhecimento, qualidade de dados.

4 ABSTRACT This paper has as main themes data mining and data quality management, wich are used in a database of research generated DATASinos project. The use of data mining is justified as a multidisciplinary process that may involve concepts of database, artificial intelligence, use of automata, neural networks, knowledge based systems, search and recognition of standards and high performance computing and others.the data quality adds a valuable process to give more accuracy to the result of the information. Working with data mining intends to bring more real benefits in the information processing, through this combination is that this work was based, providing information about such matters. The issue of data quality has its concepts based on the use of DMBOK (data management body of knowledge) using the framework of the activities with the function of managing the data quality. Keywords: data mining, data management body of knowledge, data quality.

5 LISTA DE FIGURAS Figura 1 O functional framework do DMBOK Figura 2 - Nove funções da governança de dados Figura 3 Os sete elementos de ambiente Figura 4 Fluxograma adaptado da concepção metodológica para análise da Microbacia João Corrêa Figura 5 Fluxograma ajustado da concepção metodológica para análise da Microbacia João Corrêa Figura 6 Casos de uso do sistema

6 LISTA DE TABELAS Quadro 1 : Resumo das técnicas de data mining Quadro 2 : Softwares de data mining e fabricantes Tabela 1: Dados Secundários obtidos no projeto DATASinos Tabela 2: Faixas de qualidade de água para o IQA do COMITESINOS Tabela 3 : Parâmetros e pesos relativos para cálculo do IQA da COMITESINOS 42 Quadro 3 : Alguns arquivos da implementação final Tabela 4: Cronograma de atividades do projeto DATASinos

7 LISTA DE SIGLAS COREDE Conselho Regional de Desenvolvimento CTE Coliformes Termotolerantes DBO Demanda Bioquímica de Oxigênio DAMA Data Management DM Data Management DMBOK - Data Management Body of Knowledge DQ - Data Quality DQO Demanda Química de Oxigênio FEPAM Fundação Estadual de Proteção Ambiental IQA Índice de Qualidade da Água NO Nitrato NSF National Sanitation Foudation OD Oxigênio Dissolvido OLAP - On-line Analytical Processing PO Fosfato Total SIG - Sistema de Informações Geográficas STD Sólidos Totais Dissolvidos

8 SUMÁRIO 1 INTRODUÇÃO CONCEITOS DE DATA MINING Tarefas de data mining Técnicas de data mining Indução de regras Árvores de decisão Regras de associação Redes neurais Aproximação de vizinhanças Sofwares de data mining Considerações Finais DMBOK - DATA MANAGEMENT BODY OF KNOWLEDGE Funcionamento do DMBOK Qualidade de dados Considerações Finais DESENVOLVIMENTO DO PROJETO Projeto DATASinos DATASinos em Números Uma reflexão sobre a qualidade dos dados Análise de requisitos ImportarArquivo: Importação de Arquivos CalcularIQA: Cálculo da qualidade da água CruzarInformações: Considerações Finais IMPLEMENTAÇÃO E AVALIAÇÃO DE RESULTADOS Implementação Avaliação CONCLUSÃO REFERÊNCIAS APÊNDICE A PLANILHA PADRÃO PARA COLETA APÊNDICE B TRECHO DE CÓDIGO DE INSERÇÃO NO BANCO... 58

9 1 INTRODUÇÃO A captação de informações pode ser feita de diversas maneiras e utilizada de igual forma em outras tantas, tentando fazer com que estas informações sejam traduzidas de modo benéfico, coerente e produtivo. As bases de dados computacionais podem trazer informações desconexas, que em um processo de tomada de decisões podem fomentar induções incorretas. Dentro das pesquisas em Ciência da Computação, vários esforços são feitos relativos a avanços na área de Banco de Dados. O data mining vem a somar nesta área, agregando conhecimentos das mais variadas áreas da computação, destacando-se por ser multidisciplinar. Também pode auxiliar em predições, e isso o torna um processo importante na busca do conhecimento das informações, que podem conter algum tipo de padrão que futuramente tornar-se-á uma indução para responder perguntas relevantes. Neste contexto, o tema qualidade vem agregando benefícios para o processo da busca do conhecimento, uma vez que os dados são as peças mais importantes para a mineração dos dados. Este trabalho busca informações de como organizar a qualidade através de atividades descritas em um framework do DMBOK, que passa a ser estudada em conjunto com data mining, para a execução de um projeto. O estudo da área de gerenciamento da qualidade e suas atividades visam dar um grau de confiabilidade maior para os resultados que serão efetuados nas consultas futuras a base de dados. Ao mesmo tempo, a metodologia e os resultados propostos podem servir de ponto de partida para trabalhos futuros em outras bases de dados.

10 10 Segundo Daniel Loschin (2008) : Qualidade dos dados é uma metodologia para identificar a fonte de um problema contínuo e, em seguida, corrigir o problema na fonte para evitar novas ocorrências. Mas, a fim de medir qualidade em uma forma objetiva, deve-se primeiro decidir que tipo de métricas serão utilizadas. Este trabalho tem por proposição perfazer todo o processo desde a coleta destes dados até futuras inferências para busca de respostas. O objetivo é poder captar as informações de base de dados de formatos distintos de maneira automática e, após iniciar o gerenciamento da qualidade de dados do DMBOK para posteriormente aplicar em conjunto o processo data mining. Este trabalho está dividido da seguinte forma : a primeira parte trata de conceitos a respeito de data mining. A segunda parte apresenta o corpo de conhecimento do gerenciamento de dados de uma maneira mais genérica procurando focar em de itens de gerenciamento destinada a qualidade de dados. A terceira parte visa fazer um apanhado geral sobre o projeto DATASinos, destacando a sua importância. A quarta parte mostra um modelo de uso do gerenciamento da qualidade de dados e data mining aplicados na base de dados do projeto DATASinos. A quinta parte apresenta a implementação e uma avaliação deste modelo previsto e seu funcionamento. A sexta parte se destina à conclusão do trabalho.

11 2 CONCEITOS DE DATA MINING Segundo Hand; Manilla; Smyth (2001), a melhor definição para data mining seria análise de padrões de dados (frequentemente grande) observados para achar relacionamentos insuspeitos e resumir os dados em novas formas que serão entendidas e utilizáveis para o responsável. Outros autores ((KLÖSGEN; ZYTKOW, 2001 e HAN; KAMBER, 2001) preferem destacar o data mining como processo relevante na descoberta do conhecimento na base de dados(knowledge Discovery in Databases ou KDD). Sob outra ótica, data mining pode ser considerado como principal processo utilizado na descoberta de conhecimento, como ilustrado no trecho a seguir: Existem várias maneiras de combinar padrões estatísticos e modelos de abordagens tal como regressão ou avanço de modelos lineares generalizados com métodos de mineração de conhecimento. O método data mining pode ser aplicado na fase exploratória para pegar dados familiares e achar variáveis relevantes. (KLÖSGEN; ZYTKOW, 2001) Outro trabalho (HAN ; KAMBER, 2001) trata do data mining como um passo no processo da descoberta do conhecimento, ao afirmar que muitas pessoas tratam data mining como um sinônimo para outro termo popularmente utilizado que é descoberta do conhecimento em base de dados ou KDD. Alternativamente, outras visões de data mining são simplesmente um passo essencial no processo da descoberta do conhecimento na base de dados, onde métodos inteligentes são aplicados para extrair padrões.

12 12 Poderia se resumir estas definições do seguinte modo: data mining é a descoberta de respostas para determinadas questões utilizando a extração de dados da base de dados através de um algoritmo inteligente. O problema concentra-se em identificar padrões, garimpar dados, para em um passo posterior poder conduzir as inferências com uma possibilidade de obter melhores resultados, reduzindo a probabilidade de futuros ruídos ou até induções erradas. Essas ocorrências têm de refletir se não a realidade, o mais próximo dela, extraindo fontes de dados desconexas para algo compreensível e possivelmente utilizável. Nas próximas seções são abordadas questões como as tarefas, técnicas e softwares de data mining, procurando descrever questões iniciais para o desenvolvimento de um futuro projeto, que são utilizadosneste trabalho. 2.1 Tarefas de data mining A execução das tarefas mais tradicionais dos algoritmos de data mining incluem(agrawal ;IMIELINSKI; SWAMI, 1993a): - Classificação. A construção dos agrupamentos, processo que permite encontrar propriedades comuns em conjuntos de objetos. É efetuada verificando a variável (ou variáveis) definida(s) pelo usuário e as classes a considerar. A classificação lida com valores discretos. - Segmentação (clustering). O usuário não tem o poder de interferir nesta tarefa, já que o mesmo não exerce qualquer influência em sua execução. A segmentação permite enquadrar os dados em diversas classes, determinadas a partir dos dados existentes, ao contrário da classificação, em que as mesmas são predefinidas pelo usuário. - Sumarização. O resultado desta etapa é a obtenção de um determinado subconjunto de dados obtido através da generalização, permitindo uma descrição resumida dos mesmos (CHEN; HAN; YU, 1996). Entre os exemplos mais simples

13 13 de sumarização, encontra-se a determinação da média ou desvio padrão de uma amostra (FAYYAD et al., 1996a). - Associação. Permite determinar relacionamentos entre atributos da Base de Dados, verificando a correlação que existe entre os mesmos. As correlações encontradas deveram satisfazer o nível de suporte e confiança exigido pelo usuário (AGRAWAL ;IMIELINSKI; SWAMI, 1993a). - Sequência. É utilizada para determinar relações temporais em conjuntos de dados que apresentam várias transações separadas no tempo. É, assim, utilizada na análise de séries temporais, e tem como objetivo modelar os desvios e evolução dos seus registros ao longo do tempo (AGRAWAL et al., 1996). Regras de sequência podem ser vistas como um caso particular de regras de associação, nas quais o(s) antecedente(s) e o consequente de uma dada regra estão relacionados por componentes temporais. 2.2 Técnicas de data mining Existe uma grande variedade de técnicas de data mining (FAYYAD et al., 1996b). Elas são agrupadas em quatro grandes grupos: indução de regras (que inclui as árvores de decisão e as regras de associação), redes neurais, algoritmos genéticos e aproximação de vizinhanças. A escolha da regressão constitui uma das principais técnicas de previsão (BERRY; LINOFF, 2000). A sua forma mais comum, regressão linear, combina numa equação todas as variáveis de entrada (variáveis independentes) de forma a determinar o valor da variável de saída (variável dependente). Na regressão, os dados são analisados de uma forma geométrica. Os valores dos atributos considerados são utilizados para definir pontos no espaço. A equação de regressão descreve a linha que melhor se adapta a estes dados, isto é, a que minimiza a distância média dos pontos à linha. A regressão, está disponível como técnica em diversas ferramentas de data mining, mas apenas pode ser utilizada com dados numéricos e é muito sensível à

14 14 distribuição apresentada pelos dados. No quadro 1 pode ser observado o resumo das técnicas de data mining que são descritas neste capítulo. Quadro 1 : Resumo das técnicas de data mining Técnicas de data mining Características Indução de regras Árvores de decisão Processo de aprendizagem considerando todos os registros do banco de dados como regras. Estruturas que representam um conjunto de decisões. Nodos possuem os atributos, ramos descrevem valores possíveis para os nodos. Regras de associação Encontrar relacionamento entre os atributos Redes neurais existentes na base de dados. São agrupados em 3 grandes grupos: nodos de entrada, nodos de saída e nodos intermediários. 2 estágios, primeiro aprendizagem,e o segundo a previsão. Aproximação de vizinhanças É baseada no princípio de que registros Fonte: Autoria própria semelhantes estão próximos uns dos outros Indução de regras Na indução de regras, que permite gerar árvores de decisão ou regras de associação, os registros da Base de Dados são tratados como regras, que são sucessivamente generalizadas de modo a resumirem o seu conteúdo (RAINSFORD; RODDICK, 1996). Entre as vantagens da utilização desta técnica encontra-se: a) facilidade na interpretação dos resultados, apresentados em regras de fácil compreensão; b) facilidade de incorporação de conhecimento do domínio, explícito em regras, no processo de descoberta de conhecimento; e

15 15 c) facilidade de armazenamento das regras encontradas numa base de conhecimento. As regras obtidas podem ser derivadas utilizando indução top-down ou bottom-up. Na aproximação bottom-up o sistema inicia o processo de aprendizagem considerando todos os registros da Base de Dados como regras, as quais são posteriormente generalizadas. Na estratégia top-down o processo é iniciado partindo de conceitos gerais, que descrevem os dados, os quais são posteriormente refinados por um processo de especialização. Essas regras são apresentadas ao usuário de acordo com o número de vezes que estão corretas e pela freqüência que são aplicadas. Os resultados encontrados pelo sistema de indução de regras são apresentados na forma de condicionais (por exemplo, SE profissão = atleta ENTÃO idade < 30 anos) Árvores de decisão São constituídas por estruturas em árvore que representam um conjunto de decisões. Possuem uma representação simples sendo facilmente interpretadas pelos utilizadores. Os algoritmos de indução de árvores permitem gerar regras de classificação dos dados, baseadas na informação armazenada na base de dados. Além de poderem lidar com grandes quantidades de dados, permitem utilizar diretamente o resultado/conhecimento nelas explícito (ADRIAANS; ZANTINGE, 1996). Em uma árvore de decisão, nos nodos das árvores possuem os atributos a classificar, enquanto que os ramos descrevem os valores possíveis para esses atributos. As folhas da árvore agrupam as diversas classes em que cada registro pode ser classificado (RAINSFORD; RODDICK, 1996). As árvores de decisão podem ser representadas por conjuntos de regras. Cada folha da árvore dá origem a uma regra, sendo o seu conteúdo apresentado na parte que diz respeito a consequência (resultado). A parte antecedente da

16 16 regra constitui uma conjunção de valores, respeitando os atributos existentes no ramo que une a folha à raiz da árvore Regras de associação A descoberta de regras de associação em grandes bases de dados foi inicialmente analisada por Agrawal; Imielinski; Swami(1993b), com o objetivo de determinar regras que relacionem uma conclusão (por exemplo, a compra de um produto) com um conjunto de condições (por exemplo, a compra de outros produtos). As regras de associação (ADRIAANS; ZANTINGE, 1996) permitem encontrar relacionamentos entre os atributos existentes em uma base de dados representado-os na forma da seguinte regra: Se X Então Y ou X => Y. Dada uma Base de Dados T, que armazena um conjunto de atributos A, tal que A = A1,A2,...,An, uma regra de associação existente em T é representada por X => Y, sendo X um subconjunto de atributos de A. Y representa um único atributo de A, não presente em X (AGRAWAL et al., 1993b). A regra X => Y é verificada no conjunto das transações de T com um fator de confiança c, 0 c 1, se c% das transações de T que satisfazem X também satisfazem Y (MOHAN, 2000). O suporte de uma regra indica o número de transações de T que suportam a regra, isto é, o subconjunto de registros que satisfazem a união dos atributos que integram a parte antecedente (X) e consequente (Y) da regra. Estas duas medidas de interesse, das regras encontradas, permitem conhecer a força de uma regra, confiança, e a sua significância estatística, suporte. Devem ser analisadas simultaneamente, uma vez que o suporte pode ser elevado (percentagem de registros que satisfazem a regra), e a regra possuir uma associação fraca, confiança pequena, sendo diminuto o número de registros em que é possível prever Y, conhecendo X.

17 Redes neurais Redes neurais são sistemas de classificação modelados segundo os princípios do sistema nervoso humano. São compostas por um conjunto de unidades, organizadas em níveis. As diversas unidades (nodos) encontram-se conectadas através de ligações, as quais têm associado um determinado peso. Os diversos nodos que constituem uma rede encontram-se agrupados em três grandes grupos: Nodos de entrada, encarregados de receber os dados a analisar, nodos de saída que transmitem os sinais à saída da rede e um número ilimitado de níveis intermediários que contêm os nodos intermediários(adriaans ; ZANTINGE, 1996). Existem dois estágios distintos na utilização destas redes. O primeiro diz respeito à aprendizagem, no qual a rede é treinada para a execução de determinada tarefa. A segunda fase trata da previsão, na qual a rede é utilizada para classificar registros desconhecidos (ADRIAANS ; ZANTINGE, 1996) Aproximação de vizinhanças A técnica de aproximação de vizinhanças (nearest neighbour) é baseada no princípio de que registros semelhantes estão próximos uns dos outros, quando analisados numa perspectiva espacial. A verificação da localização dos registros, interpretados como pontos no espaço, permite a identificação de regiões, denominadas classes (ou segmentos), que definem características comuns para os registros que representam (ADRIAANS; ZANTINGE, 1996). Esta técnica apresenta-se com um desempenho que exige muito do processamento, pois sua complexidade aumenta à medida que o número de registros a serem analisados também aumenta, já que cada registro é comparado com os registros restantes da amostra.

18 18 A implementação desta técnica passa pela construção de partições, dos objetos armazenados na Base de Dados, num conjunto de k classes, sendo k um parâmetro de entrada. Cada classe pode ser representada pelo seu centro de gravidade (estratégia k-means), isto é, pela localização média de todos os membros do segmento, ou por um dos objetos da classe próximo do seu centro (estratégia k-medoid) (ESTER; KRIEGEL; SANDER, 1998). Para determinar as classes, cada registro é transformado num ponto no espaço, apresentando este tantas dimensões quantos os atributos em análise. O valor de cada campo é interpretado como a distância da origem até a sua localização num dado eixo (BERRY; LINOFF, 2000). 2.3 Sofwares de data mining Algumas empresas de grande porte já utilizam deste processo para poderem comercializar seus sistemas, dentre elas o Quadro 1 apresenta algumas e seus respectivos softwares de data mining: Quadro 2 : Softwares de data mining e fabricantes. Nome Fabricante Funções Intelligent Miner IBM algoritmos para regras de associação, MineSet Clementine DBMiner Genamics Expression Fonte: Autoria própria Silicon Graphics Inc. Integral Solutions Ltd. DBMiner Technology Inc. Genamics Developer classificação, regressão, padrões sequenciais, clustering. algoritmos para regras de associação, classificação, análise estatística. algoritmos de regras de indução, redes neurais, classificação e ferramentas de visualização. algoritmos de regras de associação, classificação, clustering. algoritmos de análise de sequências

19 19 O Intelligent Miner possui os seguintes tipos de funções de pesquisa: Associações, Classificação Neural, Classificação em Árvore, Agrupamento Demográfico, Agrupamento Neural, Padrões Sequenciais, Sequências Similares, Previsão Neural e Previsão RBF (Função de Base Radial). (INTELLIGENT MINER). O MineSet consiste em 3 componentes básicos (MINESET): - Um módulo de controle centralizado, consistindo de uma ferramenta de interface gráfica chamada pela ferramenta gerencial, e um processo conhecido como DataMover, o qual executa no servidor parte do Mineset. - Data mining analítico, com nove ferramentas de data mining : Gerador de Regras de Associação, Filas Automáticas, Gerador de Cluster (Agrupamentos), Coluna Importante, Tabela de Decisão - Indutor e Classificador, Árvore de Decisão Indutor e Classificador, Evidencia - Indutor e Classificador, Árvore de Opção - Indutor e Classificador e Árvore de Regressão - Indutor e Regressor. - Ferramenta de visualização, mostra os dados utilizando diferentes visões: Cluster(Agrupamentos), Tabela de Decisão, Evidência, Mapas, Registro, Dispersão, Splat, Estatística e Árvore. Para a prospecção de dados, a ferramenta Clementine disponibiliza um conjunto técnicas de modelação que incluem: redes neurais, indução de regras, regras associativas e agrupamentos: redes neurais a ferramenta tem a operação "Train Net" que permite criar e treinar uma rede neural. Definindo os campos de input e de output dos dados de treino, a rede neural "aprende" a classificar ou prever os valores dos campos de output através dos valores dos campos de input. Note-se que as regras de decisão para a classificação são internas à rede neural, sendo difícil de acompanhar o raciocínio usado no processo de tomada de decisão. Indução de regras a ferramenta dispõe de duas operações ("Build Rule" e C5.0) que produzem regras sob a forma de árvores de decisão, representando como classificar os dados em diferentes resultados. A estrutura das árvores representa explicitamente o raciocínio da tomada de decisão. Regras de associação estas regras associam uma condição particular a um conjunto de

20 20 condições. A ferramenta dispõe dos algoritmos (Generalised Rule Induction) "GRI" e APRIORI que automaticamente encontram associações que existam entre os atributos, explicitando essas regras associativas. Agrupamentos (clustering) a ferramenta dispõe do algoritmo "K-Means" que cria um modelo de agrupamento, isto é, descobre semelhanças nos dados originais e agrupa-os de forma a maximizar a similaridade dentro do grupo e a maximizar a diferença entre grupos. Regressão linear esta operação produz uma equação que melhor adequa os valores numéricos de output aos valores numéricos de input. (BATISTA et al. 1999) O DbMiner oferece os seguintes recursos: OLAP Browser, Cube Browser, Associação, Classificação e Clustering (agrupamentos). Genamics Expression é uma aplicação para análise de DNA e sequência de proteínas. As opções da ferramenta são as seguintes: Sequência de Anotação, Mapa de Sequência, Restrição Análise, Primer Design e Análise, ORF Predição, Encontrar Padrão, Tradução Reversa, Degenerate DNA/Protein Support, GenBank Searching, Padrão e Motif Identificação, Alinhamento de Sequência Múltipla, Matriz de Distância, Predição da estrutura da proteína, Algoritmo Lightning-fast e Plugin Arquitetura para Desenvolvedores. 2.4 Considerações Finais Neste capítulo foram abordados conceitos de data mining, seguindo as definições de vários autores sobre o assunto, além de serem tratadas outras questões como tarefas (classificação, segmentação, sumarização, associação e seqüências), técnicas (indução de regras, árvores de decisão, regras de associação, redes neurais, aproximação de vizinhança) e apresentando alguns softwares com suas principais características. No próximo capítulo são abordados alguns conceitos sobre DMBOK e questões referentes à qualidade de dados, o qual alguns destes conceitos são utilizados como referência para a execução deste trabalho.

21 3 DMBOK - DATA MANAGEMENT BODY OF KNOWLEDGE A DAMA international e a DAMA foundation (DAMA, 2009) estão desenvolvendo um guia para o gerenciamento dos dados o DMBOK guide. Uma comissão editorial de trabalho foi formada para orientar no desenvolvimento do DMBOK e publicações conexas. O editorial inclui a participação de instituições locais dos membros do capítulo DAMA. Os membros da DAMA são voluntários para contribuir e rever projetos. Na opinião do DAMA(2009): Todo o corpo de conhecimento sobre gestão de dados é bastante grande e está em constante crescimento. A idéia do guia é fornecer uma introdução definitiva à gestão de dados, onde são apresentados um padrão de visão para as funções de gerenciamento de dados, terminologias e melhores práticas sem descrever métodos e técnicas específicas. O guia DMBOK não tentará ser uma completa autoridade sobre qualquer função específica de gerenciamento de dados. Este guia visa introduzir alternativa válida de opiniões e aceita discutir onde possam existir possíveis divergências. (...) As metas do DMBOK são: criar um consenso para uma visão geral de dados de funções de gestão, fornecer a definição de funções de gestão de dados comumente utilizados, resultados, papéis e outras terminologias, identificar os princípios orientadores para a gestão de dados, visão comumente aceite de boas práticas, métodos e técnicas amplamente adotadas, abordagens alternativas e significativas,

22 22 identificar brevemente questões culturais e organizacionais comuns, clarificar o âmbito e limites da gestão de dados e orientar os leitores a recursos adicionais para uma maior compreensão. (DAMA,20009) O DMBOK trata sobre functional framework, qual seria a razão de sua existência: O DMBOK functional framework existe para fornecer uma estrutura coerente para documentação do DMBOK, definir os termos e definições para os processos de gerenciamento de dados, papéis e produtos citados consistentemente ao longo do guia DMBOK, guia as avaliações da função de uma organização de gerenciamento de dados e sua estratégia, e orienta e sugere iniciativas para implementar e melhorar o gerenciamento. O functional framework do DMBOK identifica 9 dados principais das funções de gestão, cada um descrito por 7 elementos de ambiente. A figura 1 apresenta o functional framework do DMBOK. Os elementos de ambiente utilizados do functional framework para este trabalho são Activities(Atividades) e Practices & Techniques (Práticas e Técnicas) conforme demonstrada na figura 1.

23 23 Figura 1 O functional framework do DMBOK. Fonte: DAMA, O gerenciamento da qualidade de dados é somente uma categoria das funções que o DMBOK oferece. Existem nove funções para gerenciamento de dados como são mostradas na figura 2. Esta categoria, assim como as outras, oferece 4 atividades com suas respectivas tarefas e descritas abaixo conforme DAMA(2009).

24 24 Figura 2 - Nove funções da governança de dados. Fonte: DAMA, Governança de dados (Data Governance) planejar, supervisionar e controlar os dados utilizados; - Arquitetura de dados, análise e desenho (Data Architecture, Analysis & Design) - modelagem e especificação de dados; - Gerenciamento da base de dados (Database Management) desenho, implementação e suporte da base de dados; - Gerenciamento da segurança de dados(data Security Management) assegura privacidade, acesso e confidencialidade apropriados; - Gerenciamento da qualidade de dados(data Quality Management) definir, monitorar e melhorar a qualidade de dados; - Referencia e mestre de gerenciamento de dados(reference & Master Data Management) gestão da versão principal e réplicas; - Data Warehousing & Gestão de inteligência de negócios(data Warehousing & Business Intelligence Management) habilita relatório e análise; - Documentar, registrar & gestão de conteúdo (Document, Record & Content Management ) gestão de dados fora da base;

25 25 - Gestão de meta dados ( Meta Data Management ) integração, controle e fornecer meta dados; E por fim, para encerrar esta seção é importante falar sobre um dos componentes do Functional Framework do DMBOK, os elementos de ambiente, que no DMBOK são em número de sete. Os sete elementos de ambiente proporcionam uma forma lógica e coerente para descrever cada função. Os elementos fornecem uma estrutura para: Uma apresentação consistente em cada capítulo do DMBOK, organizar questões de avaliação, conclusões e recomendações e orientar o planejamento estratégico para cada função. A idéia de elementos de ambiente não é nova. O functional framework identifica sete elementos conforme figura 3. Figura 3 Os sete elementos de ambiente. Fonte: DAMA, 2009 Os elementos básicos segundo DAMA(2009) são : a) Metas e princípios(goals & Principles) Direcionar o objetivo de cada função e o princípio fundamental que são referência para o desempenho da mesma; b) Atividades(Activities) Cada função é decomposta em níveis de atividades. Algumas atividades são agrupadas em sub-funções. As atividades podem ser decompostas em tarefas e passos; c) Produtos(Deliverables) A informação, a base de dados física e as documentações criadas como resultados intercalares e finais de cada função. Alguns destes produtos são considerados essenciais,

26 26 alguns geralmente recomendados, e outros opcionais dependendo das circunstâncias; d) Papéis e responsabilidades(roles and Responsibilities) O negócio e o papel da tecnologia da informação na realização e supervisão das funções, e as responsabilidades específica para cada papel em cada função. Muitos papéis participarão em várias funções; e) Práticas e técnicas(practices & Techniques) - Métodos e técnicas comuns e populares usadas para executar os processos e produzir resultados. Podem também incluir convenções comuns, recomendações de melhores práticas e abordagens alternativas sem elaboração; f) Tecnologia(Technology) Categoria de tecnologia de apoio (principalmente software), padrões e protocolos, critério de seleção de produtos e as curvas de aprendizagem. De acordo com política DAMA, vendedores ou produtos não devem ser mencionados; e g) Organização e cultura(organization and Culture) Podem incluir : Gestão de métricas incluindo medidas de tamanho, esforço, tempo, custo, qualidade, eficácia, a produtividade, o sucesso e o valor empresarial; fatores críticos de sucesso; relatando as estruturas; estratégia utilizada; orçamento e alocação de recursos; trabalho em equipe e dinâmica de grupo; autoridade e autorizados; valores e crenças compartilhados; expectativas e atitudes; estilo pessoal e diferentes preferências; ritos culturais, rituais e símbolos, organização patrimonial e gerenciamento cultural e organizacional. 3.1 Funcionamento do DMBOK Esta seção mostra um esboço das funções, sub-funções e atividades através do ponto de vista da DAMA. Segundo a DAMA(2009), o padrão adotado é

27 27 o seguinte: funções e sub-funções são nomeados com substantivo, enquanto as atividades são nomeadas com verbo. Cada atividade é classificada como pertencente a um dos quatro Grupos de Atividade: a) Planejamento de atividades(p) Atividades que definem o rumo estratégico e tático para outras atividades de gerenciamento de dados. O planejamento de atividades pode ser executado em uma base recorrente; b) Controle de atividades(c) Supervisiona atividades executadas na base corrente; c) Desenvolvimento de atividades(d) Atividades desenvolvidas no interior do projeto e reconhecidas como parte do sistema do ciclo de vida do desenvolvimento(sdlc), criando produtos através de análise, desenho, construção, testes e implantação; d) Atividades operacionais(o) Atividades de serviço e suporte executadas na base corrente. 3.2 Qualidade de dados Segundo Terra ( 2007), o problema da qualidade de dados é definido da seguinte maneira: " Os problemas de qualidade de dados são gerados por, entre outras razões, erros de entrada de dados, acomodação indevida de informações devido à inexistência de uma forma adequada de armazená-las, integração de fontes de dados, erros sistêmicos como modelagem inadequada ou insuficiente e softwares incompletos na validação de entrada de dados, bem como devido à integração de fontes de dados, evolução e a necessidade de interação de novos sistemas com outros sistemas legados."

28 28 Outro artigo(lima;maçada;vargas, 2006) trata de como a qualidade pode ser vista através de um mapa conceitual onde foram separadas seções de trabalho e classificadas com as seguintes visões: Organizacional : refere-se ao impacto da qualidade da informação na organização, seu gerenciamento, influencia na estrutura e produção, e abordagens de táticas e estratégias;. Comportamental: analisa o aspecto humano na qualidade de dados, na performance das tarefas diárias, a inserção da qualidade de dados na habilidade profissional e capacidades e acima de tudo uma visão interna e externa dos clientes da organização; Operacional : examina os aspectos técnicos e metodológicos da qualidade de dados, bem como medidas, os desenvolvimentos de aplicação, ferramentas para controle de dados e sistemas de informações; denota aproximação operacional. Apresentados esses conceitos pode-se observar o gerenciamento da qualidade de dados com uma da perspectiva diferente, à do DMBOK, que apresenta as seguintes atividades: - Desenvolver e promover a conscientização da qualidade de dados; - Definir métricas da qualidade de dados; - Definir requerimentos e regras de negócio da qualidade de dados; - Análise / Perfil / Medida / Monitor da qualidade de dados; - Ajuste dos níveis de serviço da qualidade de dados; - Certificado da qualidade de dados; - Identificar, encaminhar e resolver problemas de qualidade de dados; - Conduzir campanhas de limpeza; - Desenhar e Implementar procedimentos Operacionais de qualidade de dados; - Monitorar procedimentos operacionais da qualidade de dados; - Testar e Validar requerimentos da qualidade dados; - Auditar a qualidade de dados.

29 29 Cada atividade é classificada como pertencente a um dos quatro Grupos de Atividade. No data quality mangament as atividades são distribuídas da seguinte maneira : Atividades de Desenvolvimento: Definir a qualidade dos dados Requisitados e Regras de Negócios; Desenho, Implementação e Procedimentos Operacionais; Testar e validar a qualidade dos dados Requisitados. Atividades de Planejamento: Definir métricas da qualidade de dados; Ajuste dos níveis do serviço de qualidade de dados. Atividades de Controle: Analise / Perfil / Medida / Monitor de qualidade dos dados; Certificado da qualidade de dados; Identificar, Encaminhar e Resolver Problemas de qualidade de dados; Monitor Data Quality Management - Procedimentos Operacionais; Auditar a qualidade dos dados. Atividades Operacionais: Desenvolver e promover a qualidade dos dados Conscientes; Realização de campanhas de limpeza. Dentre as atividades apresentadas foi escolhida a de controle: Identificar, Encaminhar e Resolver Problemas de Qualidade de Dados, levando-se em consideração que a base de dados a que este trabalho foi submetido está sendo utilizada para consultas e os seus dados não devem ser modificados, pois o projeto desta base de dados é muito anterior a este trabalho. O que está sendo sugerido, é uma mudança para coletas futuras, uma tentativa de identificação de padrões que possam ser adotados nos processos, pontos que possam ser ajustados, e novos procedimentos na utilização desta base de dados visando um retorno com uma qualidade melhorada desde o processo de coleta de informações até a sua utilização através da Ciência da Computação como facilitador e apoiador de pesquisa. 3.3 Considerações Finais Neste capítulo foram abordadas questões referentes à qualidade dos dados, o DMBOK Guide e seu funcionamento descrevendo suas funções e

30 30 atividades e como estas trabalham sobre a base de dados e de que maneira contribuem para a qualidade. Foram apresentadas doze atividades para a função de gerenciamento de qualidade, e levando-se em conta o cronograma de entrega, e qual das atividades se encaixaria melhor neste trabalho, a escolhida entre as doze foi a atividade de identificar, encaminhar e resolver problemas de qualidade de dados. Com base nos conceitos apresentados neste capítulo e no capítulo 2 (Conceitos de data mining) tem-se subsídios para o desenvolvimento do projeto o qual é abordado no próximo capítulo, e que traz também uma descrição sobre o projeto DATASinos e os módulos que são implementadas para este trabalho.

31 4 DESENVOLVIMENTO DO PROJETO Considerando-se os conceitos apresentados nos capítulos anteriores, podese constatar, através de suas características, que as áreas de data mining e data quality podem ter um vasto campo para utilização e influenciam de maneira positiva os resultados. Ainda assim, existe uma necessidade bastante grande de aplicar estas teorias em situações reais para avaliar a eficácia das propostas. Este trabalho se propõe a fazer um estudo de caso no Projeto DATASinos (descrito na Seção 4.1) com o intuito de aplicar técnicas de data mining e data quality facilitando os trabalhos futuros e a análise dos dados atuais. Na Seção 4.2 é tratada da análise de requisitos detalhada para o desenvolvimento deste projeto. 4.1 Projeto DATASinos O projeto DATASinos (2009) apresenta um sistema informações sociais, econômicas e ambientais via WEB, utilizando o sistema de informações geográficas SPRING e o programa para definição de zonas ecológico-econômicas ZEEBRA, subsidiando a tomada de decisões nas esferas pública e privada, com vistas ao desenvolvimento sustentável da região do Vale do Rio dos Sinos composta de 14 municípios ( Araricá, Campo Bom, Canoas, Dois Irmãos, Estância Velha, Esteio, Ivoti, Nova Hartz, Nova Santa Rita, Novo Hamburgo, São Leopoldo, Sapiranga e Sapucaia do Sul ), com objetivo de fomentar a pesquisa e a mobilidade do conhecimento no âmbito da região.(datasinos, 2009)

32 32 Com este projeto a região passou a conhecer sua estrutura e passou a avaliá-la em seu potencial para possíveis investimentos, além de identificar possíveis problemas para poder torná-los visíveis para futuramente tratá-los de maneira concreta e decidida, diagnosticar áreas de carência, fazendo isto através da coleta de dados, e a abertura de suas informações para eventuais trabalhos no âmbito acadêmico, que visam ter uma agregação científica a despeito dos problemas, e possíveis soluções para a região. Estes procedimentos de abertura possibilitam que áreas de conhecimento distintas atuem de forma solidária corroborando no intercâmbio de informações. Segundo o relatório técnico-científico parcial (DATASINOS, 2004): O projeto DATASinos se motiva no atendimento da demanda da sociedade segundo o processo de Participação Popular(PPP). Envolve um conjunto de atividades e ações interligadas a serem empreendidas por uma equipe multidisciplinar de pesquisadores das mais diversas áreas (Economia, Computação, Geoprocessamento, Química, História, Geologia, Biologia, Ciências Políticas). Alguns objetivos do Projeto DATASinos(2004) são: - Estruturar a base de dados - SIG - Sistema de Informações geográficas centralizada, com informações sociais, econômicas e ambientais secundárias; - Realizar coleta de dados primários sócio-econômico-ambientais, em locais de provável impacto, nas áreas a serem definidas pelo levantamento no banco de dados; - Padronizar e disponibilizar o sistema de acesso às informações aos usuários do COREDE e demais interessados; - Apoiar pesquisas sociais, econômicas e ambientais sobre a região do Vale do Rio dos Sinos; e - Subsidiar a análise e a tomada de decisões para o desenvolvimento regional sustentável.. Este trabalho faz referências ao projeto DATASinos, pois é baseado em informações sócio-econômicas com informações físico-químicas dos recursos

33 33 hídricos contidas em seu escopo, que serviu como base para o desenvolvimento da ferramenta, contendo o gerenciamento de qualidade de dados (Data Quality Management ) e o processo de data mining fazendo uso também de uma base de dados de formatos distintos de forma automática. Para que o processo transcorra normalmente é preciso que se faça uma análise na base de dados para ajustes de modelagem e adequação do gerenciamento da qualidade de dados e do processo de data mining. Este trabalho também visa auxiliar principalmente no último objetivo listado, uma vez que a obtenção de conhecimento através de data mining sob dados que tenham passado por ajustes de qualidade pode ser um importante subsídio para toamadas de decisão DATASinos em Números Abaixo alguns dados do projeto DATASinos que também podem ser verificados na página do projeto(datasinos, 2009) : a) A região do COREDE Vale do Rio dos Sinos se situa a leste do Estado do Rio Grande do Sul. b) A área física, deste COREDE, representa 0,5% em relação à do Estado. c) O COREDE Vale do Rio dos Sinos é constituído por 14 municípios representados, em ordem alfabética, por: Araricá, Campo Bom, Canoas, Dois Irmãos, Estância Velha, Esteio, Ivoti, Nova Hartz, Nova Santa Rita, Novo Hamburgo, Portão, São Leopoldo, Sapiranga e Sapucaia do Sul. d) Os dados censitários, para o ano de 2005, demonstram que o COREDE Vale do Rio dos Sinos concentra 12,25% da população, em apenas 14 municípios, ou seja, 2,82% do total de 497 municípios do Rio Grande do Sul (RS). Sua densidade demográfica é 24,6 vezes maior que a média do RS. e) O coeficiente de mortalidade infantil é superior em 1,95 por mil nascidos vivos para o Estado, do que em relação a este COREDE. A expectativa

34 34 de vida ao nascer do Estado, para o ano de 2000, foi maior em 0,29 anos, em relação ao COREDE Vale do Rio dos Sinos, possivelmente devido à elevada densidade demográfica e/ou condições ambientais mais precárias. f) A taxa de analfabetismo é 72,2% menor do que a média do RS. g) O produto Interno Bruto a preço de mercado (PIBpm), para o ano de 2004, no COREDE Vale do Rio dos Sinos, representou 15,22% do total do Estado, com PIB per capita de R$ 3.341,00 superior a média de R$ ,00 do RS. h) As exportações dos municípios integrantes deste COREDE, para o ano de 2005, representaram 23,64% em relação ao total do Estado. O projeto DATASinos é composto de 5 bases de dados, 397 tabelas e registros de caráter ambiental sem considerar as tabelas com informações sócio-econômica disponibilizada pelo IBGE. Para a execução deste trabalho foi utilizada como referência, a base de dados coredes2_secundarios sendo utilizada as seguintes tabelas : Campobom, Canoas, Doisirmaos_bruta, Esteio, Ivoti, Novasantarita, Novohamburgo e Saoleo_fisico_quim. Na tabela 1 é demonstrada a composição completa da base de dados coredes2_secundarios. Tabela 1: Dados Secundários obtidos no projeto DATASinos 2. Tabela Conteúdo Registros Campobom Tabela com os parâmetros de coleta da cidade de Campo Bom Tamanho De armazenamento (KB) Canoas Tabela com os parâmetros de coletada cidade de Canoas Doisirmaos_bruta Tabela com os parâmetros 7 6.1

35 35 Doisirmaos_poco Esteio Ivoti de coletada de superfície cidade de Dois Irmãos Tabela com os parâmetros de coletada de poços da cidade de Dois Irmãos Tabela com os parâmetros de coleta da cidade de Esteio Tabela com os parâmetros de coleta da cidade de Ivoti Municipios Dados do manancial Novasantarita Novohamburgo Tabela com os parâmetros de coleta da cidade de Nova Santa Rita Tabela com os parâmetros de coleta da cidade de Novo Hamburgo Saoleo_fisico_quim Parâmetros físico-quimico de São Leopoldo Saoleo_organicos Parâmetros orgânicos de São Leopoldo Total Fonte: Adaptados do DATASinos II Uma reflexão sobre a qualidade dos dados Após o levantamento funcional, passou-se a análise dos dados do projeto. Inicialmente foi feita uma pesquisa em arquivo contendo os dados que seriam importados e criado um conjunto de regras para que fossem satisfeitas as

36 36 condições iniciais de importação. Questões como limites de valores para determinados campos, valores inexistentes ou possibilidade de estarem duplicados são controlados nesta etapa. A idéia de qualidade tem por objetivo eliminar possíveis ruídos e não conformidades na informação para tornar os dados mais confiáveis, e como escolha para a implementação do projeto foi usada como referência a atividade de Identificar, Encaminhar e Resolver Problemas de qualidade de dados do DMBOK, pois foi verificado que alguns dos problemas com referência à qualidade de dados do projeto DATASinos está concentrado na transposição dos dados recolhidos pelos COREDES. Buscando corrigir, ou pelo menos reduzir este efeito fez-se um estudo tentando-se sanar, ou pelo menos minimizar erros. No cenário atual, toda a verificação de dados é feita de forma manual, o que demanda muito esforço e tempo da equipe envolvida. A solução proposta foi a implementação de um projeto que pudesse importar estas bases distintas de maneira automática seguindo algumas regras de proposição de valores e avaliação de dados, para que os mesmos estivessem em condições normais para a execução e futura utilização. A figura 4 mostra a concepção metodológica para análise da Microbacia João Correa, quais são os procedimentos para a captação das amostras para análise até a inserção dos mesmos na base de dados.

37 37 Figura 4 Fluxograma adaptado da concepção metodológica para análise da Microbacia João Corrêa. Fonte: adaptação de Silva, A qualidade tem de estar presente nas seguintes situações do fluxograma da figura 4, no momento do recebimento dos dados, onde é efetuada uma verificação pontual de alguns dados da amostra. A figura 4 mostra como é o procedimento atual e fazendo alguns ajustes neste procedimento teremos a seguinte situação conforme mostra a figura 5. Figura 5 Fluxograma ajustado da concepção metodológica para análise da Microbacia João Corrêa. Fonte: adaptação de Silva, 2008.

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

COBIT (CONTROL OBJECTIVES FOR INFORMATION AND RELATED TECHNOLOGY)

COBIT (CONTROL OBJECTIVES FOR INFORMATION AND RELATED TECHNOLOGY) Universidade Federal de Santa Catarina Departamento de Informática e Estatística INE Curso: Sistemas de Informação Disciplina: Projetos I Professor: Renato Cislaghi Aluno: Fausto Vetter Orientadora: Maria

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

Guia do Nexus. O Guia Definitivo para o Nexus: O exoesqueleto do desenvolvimento Scrum escalado. Desenvolvido e mantido por Ken Schwaber e Scrum.

Guia do Nexus. O Guia Definitivo para o Nexus: O exoesqueleto do desenvolvimento Scrum escalado. Desenvolvido e mantido por Ken Schwaber e Scrum. Guia do Nexus O Guia Definitivo para o Nexus: O exoesqueleto do desenvolvimento Scrum escalado Desenvolvido e mantido por Ken Schwaber e Scrum.org Tabela de Conteúdo Visão Geral do Nexus... 2 O Propósito

Leia mais

Gerenciamento de Projetos Modulo I Conceitos Iniciais

Gerenciamento de Projetos Modulo I Conceitos Iniciais Gerenciamento de Projetos Modulo I Conceitos Iniciais Prof. Walter Cunha falecomigo@waltercunha.com http://waltercunha.com Bibliografia* Project Management Institute. Conjunto de Conhecimentos em Gerenciamento

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

C O B I T. Gerenciamento dos Riscos Mitigação. Aceitação. Transferência. Evitar/Eliminar.

C O B I T. Gerenciamento dos Riscos Mitigação. Aceitação. Transferência. Evitar/Eliminar. C O B I T Evolução Estratégica A) Provedor de Tecnologia Gerenciamento de Infra-estrutura de TI (ITIM) B) Provedor de Serviços Gerenciamento de Serviços de TI (ITSM) C) Parceiro Estratégico Governança

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Módulo 4. Visão geral dos controles do COBIT aplicáveis para implantação da Sarbanes, o papel de TI, a importância dos softwares e exercícios

Módulo 4. Visão geral dos controles do COBIT aplicáveis para implantação da Sarbanes, o papel de TI, a importância dos softwares e exercícios Módulo 4 Visão geral dos controles do COBIT aplicáveis para implantação da Sarbanes, o papel de TI, a importância dos softwares e exercícios Estruturas e Metodologias de controle adotadas na Sarbanes COBIT

Leia mais

GERENCIAMENTO DE RISCOS EM PROJETOS: UMA COMPARAÇÃO ENTRE O PMBOK E A ISO-31000

GERENCIAMENTO DE RISCOS EM PROJETOS: UMA COMPARAÇÃO ENTRE O PMBOK E A ISO-31000 GERENCIAMENTO DE RISCOS EM PROJETOS: UMA COMPARAÇÃO ENTRE O E A -31000 Maildo Barros da Silva 1 e Fco.Rodrigo P. Cavalcanti 2 1 Universidade de Fortaleza (UNIFOR), Fortaleza-CE, Brasil phone: +55(85) 96193248,

Leia mais

CAPÍTULO 1 INTRODUÇÃO

CAPÍTULO 1 INTRODUÇÃO CAPÍTULO 1 INTRODUÇÃO A atuação do homem no meio ambiente, ao longo da história, fornece provas de suas ações em nome do progresso. Esta evolução tem seu lado positivo, pois abre novos horizontes, novas

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

A IMPORTÂNCIA DO TESTE DE SOFTWARE PARA A QUALIDADE DO PROJETO

A IMPORTÂNCIA DO TESTE DE SOFTWARE PARA A QUALIDADE DO PROJETO A IMPORTÂNCIA DO TESTE DE SOFTWARE PARA A QUALIDADE DO PROJETO Autora: LUCIANA DE BARROS ARAÚJO 1 Professor Orientador: LUIZ CLAUDIO DE F. PIMENTA 2 RESUMO O mercado atual está cada vez mais exigente com

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

MBA Gestão da Tecnologia de Informação

MBA Gestão da Tecnologia de Informação MBA Gestão da Tecnologia de Informação Informações: Dias e horários das aulas: Segundas e Terças-feiras das 18h00 às 22h00 aulas semanais; Sábados das 08h00 às 12h00 aulas quinzenais. Carga horária: 600

Leia mais

A estrutura do gerenciamento de projetos

A estrutura do gerenciamento de projetos A estrutura do gerenciamento de projetos Introdução O Guia do Conhecimento em Gerenciamento de Projetos (Guia PMBOK ) é uma norma reconhecida para a profissão de gerenciamento de projetos. Um padrão é

Leia mais

Programa do Módulo 2. Processo Unificado: Visão Geral

Programa do Módulo 2. Processo Unificado: Visão Geral 9.1 Programa do Módulo 2 Orientação a Objetos Conceitos Básicos Análise Orientada a Objetos (UML) O Processo Unificado (RUP) Processo Unificado: Visão Geral 9.2 Encaixa-se na definição geral de processo:

Leia mais

PMBOK 4ª Edição I. Introdução

PMBOK 4ª Edição I. Introdução PMBOK 4ª Edição I Introdução 1 PMBOK 4ª Edição Um Guia do Conhecimento em Gerenciamento de Projetos Seção I A estrutura do gerenciamento de projetos 2 O que é o PMBOK? ( Project Management Body of Knowledge

Leia mais

http://www.publicare.com.br/site/5,1,26,5480.asp

http://www.publicare.com.br/site/5,1,26,5480.asp Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário

Leia mais

Padrões de Contagem de Pontos de Função

Padrões de Contagem de Pontos de Função Padrões de Contagem de Pontos de Função Contexto Versão: 1.0.0 Objetivo O propósito deste documento é apresentar os padrões estabelecidos para utilização da técnica de Análise de Pontos de Função no ambiente

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

GESTÃO DE T.I. COBIT. José Luís Padovan jlpadovan@gmail.com

GESTÃO DE T.I. COBIT. José Luís Padovan jlpadovan@gmail.com GESTÃO DE T.I. COBIT José Luís Padovan jlpadovan@gmail.com COBIT Control Objectives for Information and Related Technology Copyright 1996, 1998, 2000 Information Systems Audit and Control Foundation. Information

Leia mais

PROCESSOS PODEROSOS DE NEGÓCIO. ideiaconsultoria.com.br 43 3322 2110 comercial@ideiaconsultoria.com.br

PROCESSOS PODEROSOS DE NEGÓCIO. ideiaconsultoria.com.br 43 3322 2110 comercial@ideiaconsultoria.com.br PROCESSOS PODEROSOS DE NEGÓCIO ideiaconsultoria.com.br 43 3322 2110 comercial@ideiaconsultoria.com.br POR QUE ESCREVEMOS ESTE E-BOOK? Nosso objetivo com este e-book é mostrar como a Gestão de Processos

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Diretoria de Sistema - DS Superintendência de Arquitetura de Sistemas - SAS Gerência de Arquitetura de Informação - GAAS

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

CURSO DE SISTEMAS DE INFORMAÇÃO

CURSO DE SISTEMAS DE INFORMAÇÃO 1 CURSO DE SISTEMAS DE INFORMAÇÃO EMENTÁRIO DAS DISCIPLINAS 2011.1 BRUSQUE (SC) 2015 2 SUMÁRIO 1ª FASE... 4 01 ARQUITETURA DE COMPUTADORES... 4 02 FILOSOFIA... 4 03 FUNDAMENTOS MATEMÁTICOS PARA COMPUTAÇÃO...

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Mining Os métodos tradicionais de Data Mining são: Classificação Associa ou classifica um item a uma ou várias classes categóricas pré-definidas.

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

CobiT: Visão Geral e domínio Monitorar e Avaliar. Daniel Baptista Dias Ernando Eduardo da Silva Leandro Kaoru Sakamoto Paolo Victor Leite e Posso

CobiT: Visão Geral e domínio Monitorar e Avaliar. Daniel Baptista Dias Ernando Eduardo da Silva Leandro Kaoru Sakamoto Paolo Victor Leite e Posso CobiT: Visão Geral e domínio Monitorar e Avaliar Daniel Baptista Dias Ernando Eduardo da Silva Leandro Kaoru Sakamoto Paolo Victor Leite e Posso CobiT O que é? Um framework contendo boas práticas para

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

PLANEJAMENTO - ESCOPO - TEMPO - CUSTO

PLANEJAMENTO - ESCOPO - TEMPO - CUSTO PLANEJAMENTO - ESCOPO - TEMPO - CUSTO PAULO SÉRGIO LORENA Julho/2011 1 Planejamento escopo, tempo e custo PROGRAMA DA DISCIPLINA Apresentação professor Programa da disciplina Avaliação Introdução Processos

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

Modelagem de Sistemas de Informação

Modelagem de Sistemas de Informação Modelagem de Sistemas de Informação Professora conteudista: Gislaine Stachissini Sumário Modelagem de Sistemas de Informação Unidade I 1 SISTEMAS DE INFORMAÇÃO...1 1.1 Conceitos...2 1.2 Objetivo...3 1.3

Leia mais

CobiT 4.01 OBJETIVOS DE CONTROLE PARA INFORMAÇÃO E TECNOLOGIAS RELACIONADAS

CobiT 4.01 OBJETIVOS DE CONTROLE PARA INFORMAÇÃO E TECNOLOGIAS RELACIONADAS CobiT 4.01 OBJETIVOS DE CONTROLE PARA INFORMAÇÃO E TECNOLOGIAS RELACIONADAS METODOLOGIA DE AUDITORIA PARA AVALIAÇÃO DE CONTROLES E CUMPRIMENTO DE PROCESSOS DE TI NARDON, NASI AUDITORES E CONSULTORES CobiT

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

COBIT. Governança de TI. Juvenal Santana, PMP tecproit.com.br

COBIT. Governança de TI. Juvenal Santana, PMP tecproit.com.br COBIT Governança de TI Juvenal Santana, PMP tecproit.com.br Sobre mim Juvenal Santana Gerente de Projetos PMP; Cobit Certified; ITIL Certified; OOAD Certified; 9+ anos de experiência em TI; Especialista

Leia mais

GESTÃO DE PROJETOS. "Quando o mar está calmo, qualquer barco navega bem." O que é um projeto? Prof. Me. Francisco César Vendrame. W.

GESTÃO DE PROJETOS. Quando o mar está calmo, qualquer barco navega bem. O que é um projeto? Prof. Me. Francisco César Vendrame. W. GESTÃO DE PROJETOS Prof. Me. Francisco César Vendrame "Quando o mar está calmo, qualquer barco navega bem." W. Shakespeare O que é um projeto? Projeto é um empreendimento não repetitivo (único), caracterizado

Leia mais

Engenharia de Software

Engenharia de Software CENTRO UNIVERSITÁRIO NOVE DE JULHO Profº. Edson T. França edson.franca@uninove.br Software Sistemas Conjunto de elementos, entre os quais haja alguma relação Disposição das partes ou dos elementos de um

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS Acerca dos conceitos básicos de gerenciamento de projetos e considerando o PMBOK, julgue os itens a seguir. 51 No gerenciamento de um projeto, deve-se utilizar não apenas as ferramentas

Leia mais

Engenharia de Requisitos

Engenharia de Requisitos Engenharia de Requisitos Introdução a Engenharia de Requisitos Professor: Ricardo Argenton Ramos Aula 08 Slide 1 Objetivos Introduzir a noção de requisitos do sistema e o processo da engenharia de requisitos.

Leia mais

Governança de TI com COBIT, ITIL e BSC

Governança de TI com COBIT, ITIL e BSC {aula #2} Parte 1 Governança de TI com melhores práticas COBIT, ITIL e BSC www.etcnologia.com.br Rildo F Santos rildo.santos@etecnologia.com.br twitter: @rildosan (11) 9123-5358 skype: rildo.f.santos (11)

Leia mais

Combinando a norma ISO 10006 e o guia PMBOK para garantir sucesso em projetos

Combinando a norma ISO 10006 e o guia PMBOK para garantir sucesso em projetos Combinando a norma ISO 10006 e o guia PMBOK para garantir sucesso em projetos Combining the ISO 10006 and PMBOK to ensure successful projects 1 Por Michael Stanleigh Tradução e adaptação para fins didáticos

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

GERENCIAMENTO DE PROJETOS EM UM ESCRITÓRIO DE ARQUITETURA: VISÃO TRADICIONAL X NEGÓCIOS BASEADOS EM PROJETOS

GERENCIAMENTO DE PROJETOS EM UM ESCRITÓRIO DE ARQUITETURA: VISÃO TRADICIONAL X NEGÓCIOS BASEADOS EM PROJETOS GERENCIAMENTO DE PROJETOS EM UM ESCRITÓRIO DE ARQUITETURA: VISÃO TRADICIONAL X NEGÓCIOS BASEADOS EM PROJETOS Ana Carolina Freitas Teixeira¹ RESUMO O gerenciamento de projetos continua crescendo e cada

Leia mais

FINANÇAS EM PROJETOS DE TI

FINANÇAS EM PROJETOS DE TI FINANÇAS EM PROJETOS DE TI 2012 Material 1 Prof. Luiz Carlos Valeretto Jr. 1 E-mail valeretto@yahoo.com.br Objetivo Objetivos desta disciplina são: reconhecer as bases da administração financeira das empresas,

Leia mais

Gestão da Tecnologia da Informação

Gestão da Tecnologia da Informação TLCne-051027-P0 Gestão da Tecnologia da Informação Disciplina: Governança de TI São Paulo, Outubro de 2012 0 Sumário TLCne-051027-P1 Conteúdo desta Aula Abordar o domínio Adquirir e Implementar e todos

Leia mais

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS Vimos em nossas aulas anteriores: COMPUTADOR Tipos de computadores Hardware Hardware Processadores (CPU) Memória e armazenamento Dispositivos de E/S

Leia mais

Tradução livre do PMBOK 2000, V 1.0, disponibilizada através da Internet pelo PMI MG em abril de 2001

Tradução livre do PMBOK 2000, V 1.0, disponibilizada através da Internet pelo PMI MG em abril de 2001 Capítulo 8 Gerenciamento da Qualidade do Projeto O Gerenciamento da Qualidade do Projeto inclui os processos necessários para garantir que o projeto irá satisfazer as necessidades para as quais ele foi

Leia mais

Alternativas de Integração de Dados Gerenciando Valor e Qualidade

Alternativas de Integração de Dados Gerenciando Valor e Qualidade Soluções para Possibilitar Relacionamentos Duradouros com Clientes Alternativas de Integração de Dados Gerenciando Valor e Qualidade Utilizando uma abordagem regulada para incorporar serviços de qualidade

Leia mais

Lista de Exercícios - COBIT 5

Lista de Exercícios - COBIT 5 Lista de Exercícios - COBIT 5 1. O COBIT 5 possui: a) 3 volumes, 7 habilitadores, 5 princípios b) 3 volumes, 5 habilitadores, 7 princípios c) 5 volumes, 7 habilitadores, 5 princípios d) 5 volumes, 5 habilitadores,

Leia mais

Módulo 2. Definindo Soluções OLAP

Módulo 2. Definindo Soluções OLAP Módulo 2. Definindo Soluções OLAP Objetivos Ao finalizar este módulo o participante: Recordará os conceitos básicos de um sistema OLTP com seus exemplos. Compreenderá as características de um Data Warehouse

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Sistemas de Informação I

Sistemas de Informação I + Sistemas de Informação I Tipos de SI Ricardo de Sousa Britto rbritto@ufpi.edu.br + Introdução 2 n As organizações modernas competem entre si para satisfazer as necessidades dos seus clientes de um modo

Leia mais

Resultados alcançados com a Ferramenta Channel em implementação de sucesso da Gerência de Projetos no nível G de maturidade do MR-MPS

Resultados alcançados com a Ferramenta Channel em implementação de sucesso da Gerência de Projetos no nível G de maturidade do MR-MPS Resultados alcançados com a Ferramenta Channel em implementação de sucesso da Gerência de Projetos no nível G de maturidade do MR-MPS Mauricio Fiorese 1, Alessandra Zoucas 2 e Marcello Thiry 2 1 JExperts

Leia mais

Unisant Anna Gestão Empresarial com ERP 2014 Modelagem de Sistemas - UML e MER

Unisant Anna Gestão Empresarial com ERP 2014 Modelagem de Sistemas - UML e MER Objetivo dessa aula é descrever as características e a simbologia dos diagramas UML e MER na modelagem de sistemas de informação de uma forma a permitir a comunicação entre técnicos e gestores. Modelagem

Leia mais

CobiT 4.1 Plan and Organize Manage Projects PO10

CobiT 4.1 Plan and Organize Manage Projects PO10 CobiT 4.1 Plan and Organize Manage Projects PO10 Planejar e Organizar Gerenciar Projetos Pedro Rocha http://rochapedro.wordpress.com RESUMO Este documento trás a tradução do objetivo de controle PO10 (Gerenciamento

Leia mais

fagury.com.br. PMBoK 2004

fagury.com.br. PMBoK 2004 Este material é distribuído por Thiago Fagury através de uma licença Creative Commons 2.5. É permitido o uso e atribuição para fim nãocomercial. É vedada a criação de obras derivadas sem comunicação prévia

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

Gerenciamento de Projetos

Gerenciamento de Projetos Gerenciamento de Projetos PMI, PMP e PMBOK PMI (Project Management Institute) Estabelecido em 1969 e sediado na Filadélfia, Pensilvânia EUA, o PMI é a principal associação mundial, sem fins lucrativos,

Leia mais

Curso Tecnólogo em Gestão da Tecnologia da Informação - 2013 -

Curso Tecnólogo em Gestão da Tecnologia da Informação - 2013 - Curso Tecnólogo em Gestão da Tecnologia da Informação - 2013 - O Curso Tecnólogo em Gestão da Tecnologia da Informação é um curso da área de informática e tem seu desenho curricular estruturado por competências

Leia mais

2 Auto-sintonia de Bancos de Dados e Agentes de Software

2 Auto-sintonia de Bancos de Dados e Agentes de Software 2 Auto-sintonia de Bancos de Dados e Agentes de Software A uso da abordagem de agentes de software 1 pode trazer benefícios a áreas de aplicação em que é necessário construir sistemas autônomos, ou seja,

Leia mais

Etapas da evolução rumo a tomada de decisão: Aplicações Isoladas: dados duplicados, dados inconsistentes, processos duplicados.

Etapas da evolução rumo a tomada de decisão: Aplicações Isoladas: dados duplicados, dados inconsistentes, processos duplicados. Histórico Etapas da evolução rumo a tomada de decisão: Aplicações Isoladas: dados duplicados, dados inconsistentes, processos duplicados. Sistemas Integrados: racionalização de processos, manutenção dos

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

AUDITORIA DE PROCESSOS BASEADA EM RISCOS. Diorgens Miguel Meira

AUDITORIA DE PROCESSOS BASEADA EM RISCOS. Diorgens Miguel Meira AUDITORIA DE PROCESSOS BASEADA EM RISCOS Diorgens Miguel Meira AGENDA 1 2 3 4 5 O BANCO DO NORDESTE TECNOLOGIA DA INFORMAÇÃO NO BNB AUDITORIA NO BANCO DO NORDESTE SELEÇÃO DE PROCESSOS CRÍTICOS AUDITORIA

Leia mais

Auditoria de Sistemas. UNIPAC Ipatinga Segurança e Auditoria de Sistemas Prof. Thiago Lopes Lima

Auditoria de Sistemas. UNIPAC Ipatinga Segurança e Auditoria de Sistemas Prof. Thiago Lopes Lima Auditoria de Sistemas UNIPAC Ipatinga Segurança e Auditoria de Sistemas Prof. Thiago Lopes Lima Auditoria É uma atividade que engloba o exame das operações, processos, sistemas e responsabilidades gerenciais

Leia mais

Modelo para Documento de. Especificação de Requisitos de Software

Modelo para Documento de. Especificação de Requisitos de Software Modelo para Documento de Especificação de Requisitos de Software (Baseado na norma IEEE Std 830-1993 - Recommended Practice for Software Requirements Specifications) A boa organização lógica do documento

Leia mais

Interatividade aliada a Análise de Negócios

Interatividade aliada a Análise de Negócios Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,

Leia mais

Com relação às áreas de conhecimento de projetos conforme o. PMBoK, julgue os itens subseqüentes.

Com relação às áreas de conhecimento de projetos conforme o. PMBoK, julgue os itens subseqüentes. De acordo com o comando a que cada um dos itens de 1 a 70 se refira, marque, na folha de respostas, para cada item: o campo designado com o código C, caso julgue o item CERTO; ou o campo designado com

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Melhores práticas para gerenciamento de suporte a serviços de TI

Melhores práticas para gerenciamento de suporte a serviços de TI Melhores práticas para gerenciamento de suporte a serviços de TI Adriano Olimpio Tonelli Redes & Cia 1. Introdução A crescente dependência entre os negócios das organizações e a TI e o conseqüente aumento

Leia mais

Prof. Dr. Ivanir Costa. Unidade III QUALIDADE DE SOFTWARE

Prof. Dr. Ivanir Costa. Unidade III QUALIDADE DE SOFTWARE Prof. Dr. Ivanir Costa Unidade III QUALIDADE DE SOFTWARE Normas de qualidade de software - introdução Encontra-se no site da ABNT (Associação Brasileira de Normas Técnicas) as seguintes definições: Normalização

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Os casos de uso dão conta da maioria dos requisitos de um sistema computacional.

Os casos de uso dão conta da maioria dos requisitos de um sistema computacional. Unidade 3: Modelagem de requisitos e de soluções (Parte a) 1 Casos de uso 1.1 Conceitos básicos e parâmetros de descrição Os casos de uso dão conta da maioria dos requisitos de um sistema computacional.

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

Unidade III PLANEJAMENTO ESTRATÉGICO DE. Prof. Daniel Arthur Gennari Junior

Unidade III PLANEJAMENTO ESTRATÉGICO DE. Prof. Daniel Arthur Gennari Junior Unidade III PLANEJAMENTO ESTRATÉGICO DE TECNOLOGIA DA INFORMAÇÃO Prof. Daniel Arthur Gennari Junior Sobre esta aula Gestão do conhecimento e inteligência Corporativa Conceitos fundamentais Aplicações do

Leia mais

- Project Management Institute. Disciplina de Engenharia de Software. PMP- Project Management Professional PMBOK

- Project Management Institute. Disciplina de Engenharia de Software. PMP- Project Management Professional PMBOK Disciplina de Engenharia de Software Material elaborado por Windson Viana de Carvalho e Rute Nogueira Pinto em 19/07/2004 Material alterado por Rossana Andrade em 22/04/2009 - Project Management Institute

Leia mais

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Rafaela Giroto, 10º módulo de Ciência da Computação,

Leia mais

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO Santa Maria, 10 de Outubro de 2013. Revisão aula anterior Documento de Requisitos Estrutura Padrões Template Descoberta

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

PREVIEW DAS PRINCIPAIS SEÇÕES DA NBR ISO 19011

PREVIEW DAS PRINCIPAIS SEÇÕES DA NBR ISO 19011 CENTRO DA QUALIDADE, SEGURANÇA E PRODUTIVIDADE PARA O BRASIL E AMÉRICA LATINA PREVIEW DAS PRINCIPAIS SEÇÕES DA NBR ISO 19011 Diretrizes para auditorias de sistemas de gestão da qualidade e/ou ambiental

Leia mais

REQUIREMENTS TRACEABILITY MATRIX: AUTOMATIC GENERATION AND VISUALIZATION

REQUIREMENTS TRACEABILITY MATRIX: AUTOMATIC GENERATION AND VISUALIZATION REQUIREMENTS TRACEABILITY MATRIX: AUTOMATIC GENERATION AND VISUALIZATION Seminário da disciplina Engenharia de Requisitos Aluno: Eliaquim Lima Sá Neto (elsn@cin.ufpe.br) Autores 2 Sandra Fabbri Professora

Leia mais

Construção de um Sistema de Informações Estratégicas, Integrando Conhecimento, Inteligência e Estratégia.

Construção de um Sistema de Informações Estratégicas, Integrando Conhecimento, Inteligência e Estratégia. Construção de um Sistema de Informações Estratégicas, Integrando Conhecimento, Inteligência e Estratégia. Introdução Sávio Marcos Garbin Considerando-se que no contexto atual a turbulência é a normalidade,

Leia mais