UNIJUI - UNIVERSIDADE REGIONAL DO NOROESTE DO ESTADO DO RIO GRANDE DO SUL. DCEEng DEPARTAMENTO DE CIÊNCIAS EXATAS E ENGENHARIAS

Tamanho: px
Começar a partir da página:

Download "UNIJUI - UNIVERSIDADE REGIONAL DO NOROESTE DO ESTADO DO RIO GRANDE DO SUL. DCEEng DEPARTAMENTO DE CIÊNCIAS EXATAS E ENGENHARIAS"

Transcrição

1 1 UNIJUI - UNIVERSIDADE REGIONAL DO NOROESTE DO ESTADO DO RIO GRANDE DO SUL DCEEng DEPARTAMENTO DE CIÊNCIAS EXATAS E ENGENHARIAS APLICAÇÃO DE PROCESSOS DE DESCOBERTA DE CONHECIMENTO EM BANCO DE DADOS PROVENIENTE DE UM ERP PABLO BOFF PIGOZZO Ijuí Novembro / 2013

2 2 UNIJUI - UNIVERSIDADE REGIONAL DO NOROESTE DO ESTADO DO RIO GRANDE DO SUL DCEEng DEPARTAMENTO DE CIÊNCIAS EXATAS E ENGENHARIAS APLICAÇÃO DE PROCESSOS DE DESCOBERTA DE CONHECIMENTO EM BANCO DE DADOS PROVENIENTE DE UM ERP PABLO BOFF PIGOZZO Trabalho de Conclusão de Curso apresentado ao Curso de Ciência da Computação do Departamento de Ciências Exatas e Engenharias (DCEEng), da Universidade Regional do Noroeste do Estado do Rio Grande do Sul (UNIJUÍ), como requisito para a obtenção do título Bacharel em Ciência da Computação. Orientador: Prof. Me. Vinícius Maran Ijuí Novembro / 2013

3 3 APLICAÇÃO DE PROCESSOS DE DESCOBERTA DE CONHECIMENTO EM BANCO DE DADOS PROVENIENTE DE UM ERP PABLO BOFF PIGOZZO Trabalho de Conclusão de Curso apresentado ao Curso de Ciência da Computação do Departamento de Ciências Exatas e Engenharias (DCEEng), da Universidade Regional do Noroeste do Estado do Rio Grande do Sul (UNIJUÍ), como requisito para a obtenção do título Bacharel em Ciência da Computação. Orientador: Prof. Me. Vinícius Maran BANCA EXAMINADORA Prof. Me. Rogério Samuel de Moura Martins Ijuí Novembro / 2013

4 4 A menos que modifiquemos a nossa maneira de pensar, não seremos capazes de resolver os problemas causados pela forma como nos acostumamos a ver o mundo. Albert Einstein

5 5 AGRADECIMENTOS A Deus, por ter iluminado e mostrado o caminho para chegar até aqui. Aos meus pais, Loreno e Terezinha, exemplo de pessoas, ensinaramme acima de tudo que, impossível e desistência, são duas palavras que não devem fazer parte do cotidiano. Todo o apoio, incondicional, diga-se de passagem, pois nunca mediram esforços para me ajudar a realizar este sonho, dedicação, amor, paciência, compreensão e carinho passado foram fundamentais. apoiadora. A minha irmã, Paola, que acompanhou de perto, sempre presente e A todos os meus familiares, especialmente o tio Vilmar, que esteve junto em todos os momentos. Aos amigos e colegas. A todos os meus professores pelo direcionamento e por contribuir diretamente nessa conquista, em especial, ao professor Vinícius pela paciência, dedicação e empenho durante o desenvolvimento do presente trabalho de conclusão de curso. conquista. E a todos que participaram, direta ou indiretamente, desta grande

6 6 LISTA DE SIGLAS ACID Atomicidade, Consistência, Isolamento e Durabilidade DCBD Descoberta de Conhecimento em Banco de Dados MD Mineração de Dados DM Data Mining DW Data Warehouse ODM Oracle Data Miner KDD Knowledge Discovery in Databases CRISP-DM Cross-Industry Standard Processo of Data Mining MBA Market Basket Analysis ERP Enterprise Resource Planning WEKA Waikato Environment for Knowledge Analysis SGBD Sistema Gerenciador de Banco de Dados ETL Extract Transform Load SSL Secure Sockets Layer SQL Structured Query Language

7 7 LISTA DE TABELAS Tabela 1: Campos necessários dos Clientes e suas Categorias...46 Tabela 2: Amostra dos dados extraídos dos Clientes...47 Tabela 3: Campos necessários das Vendas, Produtos e Categorias de Produtos...49 Tabela 4: Primeira parte da amostra dos dados exportados das Vendas...50 Tabela 5: Segunda parte da amostra dos dados exportados das Vendas...50 Tabela 6: Resultados da Associação de Produtos, gerado pelo algoritmo Apriori...64 Tabela 7: Resultado da Associações de Categorias de produtos nas Vendas...68

8 8 LISTA DE FIGURAS Figura 1: Etapas do processo de melhoria na qualidade dos dados (SCHREIBER et al., 2000)...16 Figura 2: Etapas do Processo de DCBD (Adaptada de Fayyad et al.,1996)..18 Figura 3: Processo CRISP-DM (CRISP-DM, 2000)...20 Figura 4: Fases do conceito de CRISP-DM (Camilo et al., 2009)...23 Figura 5: Etapas da implementação...37 Figura 6: Interface de usuário do Oracle Data Miner...42 Figura 7: Exemplo de Fluxo de Trabalho do Oracle Data Miner...42 Figura 8: Análise de um modelo de árvore de decisão...43 Figura 9: Interface de usuário do Aqua Data Studio...44 Figura 10: Diagrama Entidade-Relacionamento das tabelas de Clientes e Grupo de Clientes...46 Figura 11: Diagrama Entidade-Relacionamento das tabelas envolvidas em uma Venda...48 Figura 12: Modelo de objeto usado pelo ODM para MD...52 Figura 13: Fluxo de trabalho do problema de Analise de Risco à Inadimplência...54 Figura 14: Fluxo de trabalho da busca por Associação de Produtos nas Vendas...56 Figura 15: Resultado da implementação do algoritmo Árvore de Decisão...59 Figura 16: Resultado gerado para o Nó Figura 17: Resultado gerado para o Nó Figura 18: Resultado gerado para o Nó Figura 19: Exemplo de Regras Associativas geradas pelo algoritmo Apriori.65 Figura 20: Variação do suporte com relação ao Lift...66 Figura 21: Resultado das Regras Associativas satisfatórias geradas pelo algoritmo Apriori...68

9 9 RESUMO As empresas estão necessitando aprimorar, cada vez mais, seus negócios devido a alta competitividade, e esta não é uma tarefa fácil. Uma alternativa que tem se mostrado muito viável parte do conceito de que, quanto maior for o conhecimento de causa, mais precisas e otimizadas serão as decisões sobre o domínio. Como as empresas armazenam, comumente, grandes quantidades de dados, parte destes, oriundos de suas atividades administrativas diárias, é possível obter conhecimento útil através de técnicas específicas e direcionadas a este propósito. Diante deste contexto, o principal objetivo deste trabalho é aplicar processos de Descoberta de Conhecimento em Banco de Dados, mais especificamente, Mineração de Dados e seus algoritmos, visando agregar conhecimento relevante e decisório para a empresa. O projeto foi desenvolvido com o auxílio de diversas ferramentas direcionadas a para este fim, as quais, serviram para tarefas que partiram desde a extração de dados até a análise dos resultados e submissão à empresa para aproveitamento e posterior feedback. Palavras-chave: Data Warehouse, Mineração de Dados, Apriori, Árvore de Decisão, Processo de Descoberta de Conhecimento em Banco de Dados.

10 10 ABSTRACT Companies, more often, need to improve their business due to high competitively, and that is not an easily accomplished task. An alternative that has been showing highly viable considers that, the more you know about the case, more precise the decisions can be. As the companies stores, usually, big chunks of data, some of them derived from daily administrative tasks, it is possible to obtain useful knowledge by using specific and directed techniques for that purpose. With this context, the main goal of this project is to implement processes of Knowledge Discovery in Databases, more specifically, Data Mining and its algorithms, to gather relevant knowledge and decisions for the company. The project was developed with the help of various tools, its were used from tasks like the data extraction to the analysis of the results and the submission to the company for approval and future feedback. Keywords: Data Warehuse, Data Mining, Apriori, Decision Tree, Knowledge Discovery in Databases.

11 11 SUMÁRIO 1 INTRODUÇÃO PROBLEMA ORGANIZAÇÃO DO TEXTO DESCOBERTA DE CONHECIMENTO EM BANCO DE DADOS (DCBD) TRATAMENTO DOS DADOS CONCEITOS DE DCBD Processo de Fayyad Etapas do conceito CRISP- DM DATAWAREHOUSE E MINERAÇÃO DE DADOS DATAWAREHOUSE MINERAÇÃO DE DADOS (MD) Classificação Associação Agrupamento ou Categorização Padrões Sequenciais ALGORITMOS DE MINERAÇÃO Algoritmo Apriori Algoritmo de Árvores de Decisão PROCESSO DE DESCOBERTA DE CONHECIMENTO EM BANCO DE DADOS DE UM ERP CONTEXTO DA APLICAÇÃO Análise e Identificação de Grupos de Risco à Inadimplência Cesta de Produtos e Vendas Associadas APLICAÇÃO DA MINERAÇÃO DE DADOS AMBIENTE DE TRABALHO UTILIZADO FERRAMENTAS PostgreSQL e PgAdmin Oracle Database Oracle Data Mining (ODM) Aqua Data Studio EXTRAÇÃO E PROCESSAMENTO DOS DADOS IMPLEMENTAÇÃO DE UM DATA WAREHOUSE APLICAÇÃO DOS MODELOS DE MINERAÇÃO DE DADOS E SEUS ALGORITMOS Aplicação do algoritmo de Árvore de Decisão na análise de grupos de risco à inadimplência Aplicação do algoritmo Apriori na busca de novos padrões associativos nas vendas de produtos ANÁLISE DOS RESULTADOS E FEEDBACK ANÁLISE DE GRUPOS DE RISCO À INADIMPLÊNCIA ANÁLISE DE RESULTADOS DA BUSCA DE PADRÕES ASSOCIATIVOS DE PRODUTOS E SUAS CATEGORIAS NAS VENDAS SUBMISSÃO DOS RESULTADOS E FEEDBACK... 69

12 12 6 CONCLUSÕES E TRABALHOS FUTUROS REFERÊNCIAS BIBLIOGRÁFICAS... 71

13 13 1 INTRODUÇÃO Com a crescente e necessária utilização e evolução de sistemas informatizados nos diversos ramos empresariais, tem-se a consequência de um significativo aumento na quantidade de dados manipulados e armazenados. Também considera-se como um agravante, o custo de armazenamento atualmente barato, tornando-se assim um facilitador deste processo de geração de grandes massas de dados. Emergindo às dificuldades em recuperar estes através do uso de métodos convencionais, sejam eles estatísticos, em formato de planilhas e/ou relatórios, exige-se então procedimentos mais avançados e complexos para a descoberta de novos conhecimentos em bancos de dados, conhecidos como Processos de Descoberta de Conhecimento em Banco de Dados (KDD - Knowledge Discovery in Databases). No contexto de um ambiente coorporativo, é de fundamental importância obter informações relevantes e detalhadas, auxiliando os diversos níveis gerenciais na difícil tarefa de tomada de decisões, melhorando os índices de acerto e criando um diferencial em relação as concorrentes do mesmo ramo (ELMASRI; NAVATHE, 2000, pg. 699). 1.1 Problema Segundo Fayyad et al (1996), corporações tem promovido um crescimento em larga escala de seus bancos de dados, ultrapassando os limites usuais e incapacitando-as de posteriormente, extrair estas informações para análise, gerando a necessidade de novas técnicas e ferramentas para fazer esta tarefa. Diante desse problema, uma das alternativas mais adequadas é a utilização de Processos de Descoberta de Conhecimento em Banco de Dados, mais especificamente, Mineração de Dados. Suas técnicas e ferramentas para a obtenção e extração de conjuntos de informações são capazes de servir de apoio nas áreas estratégicas e de tomada de decisões de uma empresa, auxiliando no negócio como um todo e otimizando seus respectivos processos e resultados.

14 14 Desta forma, o principal objetivo deste trabalho é classificar e catalogar dados para a aplicação de uma técnica de mineração visando obter novas informações relevantes e conhecimento implícito no domínio de um ERP comercial. As informações resultantes do processo serão utilizadas para auxiliar a tomada de decisões nas áreas de negócios de uma organização empresarial. 1.2 Organização do Texto Este trabalho está estruturado da seguinte forma: o Capítulo 2 apresenta o referencial teórico, descrevendo as tecnologias e conhecimentos envolvidos na realização do trabalho. No capítulo 3 é apresentada a escolha das técnicas, algoritmos e ferramentas de análise, demonstrando como é feito o desenvolvimento e aplicação dos conhecimentos obtidos. O Capítulo 4 apresenta o processo de descoberta de conhecimento em uma base de dados utilizada por um ERP comercial. O Capítulo 5 apresenta a análise dos resultados e o feedback apresentado à empresa. O Capítulo 6 apresenta as conclusões deste trabalho.

15 15 2 DESCOBERTA DE CONHECIMENTO EM BANCO DE DADOS (DCBD) O Processo de Descoberta de Conhecimento em Banco de Dados (KDD) é um conjunto de passos para efetuar a extração de coleções de dados onde as técnicas comuns não conseguem efetividade à frente de grandes quantidades de dados, transformando esses dados em informações úteis e conhecimento. Para Goldschmidt (2005), independentemente do campo de estudo e também da quantidade de dados que tem-se sobre um determinado domínio, nada significa quando não se pode interpretá-los a fim de obter conhecimentos úteis. Com o constante aumento na quantidade de dados armazenados, indaga-se cada vez mais sobre o que são, para que servem esses e qual é o seu valor no contexto que está alocado. Tanto no universo corporativo, no qual serão focados os estudos do presente trabalho e os processos de mineração, como em diversos outros, conhecer os dados que se está manipulando é extremamente importante. A visão obtida sobre uma análise de dados de má qualidade compromete diretamente o resultado do processo como um todo, portanto é fundamental definir os tipos de dados que serão utilizados. Assim, podemos classificar os dados em dois tipos: quantitativos e qualitativos. Os dados quantitativos são representados utilizando valores numéricos, podendo ter valores discretos e contínuos. Define-se para esse tipo, dados nos quais apontam informações que representam quantidade propriamente dita. A qualitativa sempre é apresentada por valores nominais ou ordinais, sendo que o último é geralmente representado em forma categórica. Fayyad (1997) afirma que nos ramos de negócios, os dados detêm importantes informações mercadológicas. Através destes dados então, temse a oportunidade de melhorar o desempenho, otimizar processos e resolver problemas da organização, tornando-a mais eficiente e competitiva. Entendendo-se que os conjuntos de dados puros não são informações e precisam ser transformados, pode-se então definir informação como um conjunto de dados que tem sentido e valor em um determinado contexto. O

16 16 objetivo de trabalhar com esses dados, é a obtenção do conhecimento que venha a auxiliar na prática, as pessoas a tomarem uma decisão ou criar novos conhecimentos sobre o domínio em questão. 2.1 Tratamento dos Dados Para conseguir dados mais claros e úteis, tem-se formas de normalizálos antes de qualquer análise. Segundo Han et al. (2006), pode-se chamar esse trabalho de pré-processamento e é constituído basicamente de quatro etapas (Figura 1): Figura 1: Etapas do processo de melhoria na qualidade dos dados (SCHREIBER et al., 2000) Limpeza dos Dados A primeira etapa no processo de tratamento de dados é a de limpeza, na qual verifica-se dados com diversas inconsistências, como valores errados, nulos e inválidos. As formas de corrigir esses problemas vão desde remoção de registros com problema, até a substituição e aplicação de métodos de agrupamento para descoberta de conhecimento comum. Toda e

17 17 qualquer atividade executada nessa etapa, tem que ser feita de forma que não altere o resultado final e nem descaracterize o dado. Integração dos Dados A etapa de integração tem um nível de dificuldade e trabalho elevado, pois geralmente tem-se dados de diversas fontes e dos mais variados tipos, portanto deve-se unificá-los em um lugar só de forma concisa e que não prejudique a integridade dos mesmos. Transformação dos Dados Esta etapa visa ajustar os valores para que tenham sentido diante da técnica aplicada, por exemplo, transformando valores numéricos em categóricos e vice-versa. Algumas tarefas que são feitas neste etapa são: remoção de valores errados, agrupamentos e classificações, conversão de diversos valores diferentes em valores padronizados e geração de novos dados a partir dos já existentes, visando melhorar a qualidade destes. (HAN; KAMBER, 2006). Redução dos Dados A última etapa visa reduzir as quantidades de dados pois, geralmente, quando se objetiva a aplicação de mineração de dados, o volume de dados é alto, consequentemente demorando mais tempo e consumindo mais recursos no processamento dos mesmos. Com uma boa redução de dados, tem-se ganhos significativos nos resultados finais, tornando o processo todo mais ágil, eficiente e exato. Para fazer a redução de dados, podemos utilizar estruturas de dados otimizadas, seleção de subconjuntos de atributos, buscas por duplicidades e dimensionalidade. Através dos processos de melhoria da qualidade dos dados, tem-se uma probabilidade maior de transformá-los em conhecimento, sendo este então, um dos bens mais valiosos para os processos decisórios e estratégicos das empresas, portanto, tem-se como foco principal a obtenção do mesmo. Este conhecimento pode ser obtido através de ferramentas, metodologias e processos, nas quais serão vistas a seguir (WEISS; INDURKHYA, 1998).

18 Conceitos de DCBD Após ter os dados trabalhados a fim de obter melhor qualidade, devese aplicar os processos de DCBD. Serão abordados dois conceitos de processos, um definido por Fayyad et al. (1996) e o CRISP-DM Processo de Fayyad As etapas do processo definido por Fayyad et al. (1996) são: Seleção, Pré-processamento, Transformação, Mineração de Dados e por fim a Interpretação. A Figura 2 apresenta uma representação das etapas definidas por Fayyad et al. (1996). Figura 2: Etapas do Processo de DCBD (Adaptada de Fayyad et al.,1996) Seleção de Dados Como no primeiro passo, faz-se a seleção de dados que interessam ao objetivo à partir do(s) banco(s) de dados disponíveis. Os dados resultantes desta etapa são de extrema importância para o alcance dos resultados adequados, visto que se não forem os corretos pré-selecionados, as análises e aplicações das técnicas propostas não farão sentido. A fim de reafirmar a importância dessa etapa, Brauner (2003), define que [...] o sucesso do processo depende da escolha correta dos dados que formam o conjunto de dados alvo, pois é neste subconjunto que, mais adiante

19 19 no processo, serão aplicados os algoritmos para descoberta de conhecimento. Pré-processamento Esta fase do processo consiste em pegar os dados fornecidos pela etapa de seleção e efetuar um pré-processamento, eliminando possíveis problemas de redundância, falta de formatação, dados incompletos, ruído e qualquer anormalidade que possa comprometer os resultados, ou seja, efetuando uma espécie de limpeza da seleção dos dados. Transformação Neste momento os dados podem ser padronizados de acordo com as necessidades das técnicas de mineração de dados e seus algoritmos, pois estas podem exigir uma formatação para conseguir obter melhores resultados. Normalmente, são realizados agrupamentos de dados e consequentemente, uma melhora na disposição dos dados, como a criação de coleções de informações repetidas para otimizar o desempenho e execução do algoritmo proposto. Aqui, pode-se também, realizar a transformação de dados para reduzir a sua quantidade (ELSAMRI; NAVATHE, 2000). Mineração de Dados (MD) Esta etapa é considerada como a mais importante do processo de DCBD e é a caracterização e busca de padrões nas informações. Aplica-se técnicas e algoritmos em busca de conhecimento implícito e útil no resultado de todos os passos anteriores (BRAUNER, 2003). Interpretação dos Resultados Sendo a última etapa do processo, cabe a ela fazer a interpretação do resultado gerado pelo processo de mineração de dados. Os resultados podem ser exibidos de diversas formas, relatórios, demonstrativos ou arquivos de texto, desde que atendam o objeto de propiciar uma análise minuciosa destes.

20 20 Quando não atinge a meta prevista, é possível que se volte à qualquer uma das etapas anteriores para refazê-la, gerando um novo conjunto de informações que serão reanalisadas Etapas do conceito CRISP-DM O método de CRISP-DM (Cross-Industry Standard Processo of Data Mining) é um dos métodos mais utilizados e documentados do processo de KDD. Consiste em 6 fases, separando algumas etapas (Figura 3) como a Distribuição da Interpretação (Olson et al., 2008). Figura 3: Processo CRISP-DM (CRISP-DM, 2000) A Figura 3 apresenta os fluxos multidirecionais, ou seja, podemos ir e voltar entre algumas fases. As fases são descritas a seguir. Entendimento do Negócio Nesta etapa, tem-se como principal objetivo a concepção do problema e qual é a necessidade da utilização de mineração de dados. Visa portanto, definir claramente o que se deseja ter como resultado palpável e

21 21 compreensível e, qual é o nível de sucesso que deseja-se atingir. A clara compreensão do negócio irá auxiliar bastante nas próximas etapas. Entendimento dos Dados A fase de entendimento dos dados começa com a coleta e extração, e prossegue com atividades que visam familiarizar-se com os dados obtidos. Busca-se juntamente com isso, identificar problemas de qualidade, descobrir os primeiros resultados ou sinais, detectar subconjuntos interessantes para formar hipóteses sobre informações ocultas. Existe uma estreita ligação entre o entendimento do negócio e compreensão dos dados. A formulação do problema de mineração de dados e plano do projeto, requerem, pelo menos, alguma compreensão dos dados disponíveis. Preparação dos Dados A fase de preparação de dados abrange todas as atividades necessárias para construir os conjuntos de dados que serão usados para alimentar as ferramentas de modelagem, a partir dos dados iniciais. A tarefa de preparação de dados pode ser executada diversas vezes e não necessita de uma ordem pré-estabelecida. As tarefas incluem, seleção de tabelas, registros e atributos, bem como a transformação e limpeza para normalizar, corrigir e melhorar ao máximo a qualidade dos dados. Modelagem Depois de ter os dados compreendidos e preparados para uso, começa a fase de modelagem, na qual várias técnicas de modelagem são selecionadas, aplicadas e feito a calibragem dos parâmetros. Normalmente existem diversas técnicas para o mesmo tipo de problema, porém algumas delas requerem tipos de dados em formatos específicos, o que agrega um pouco de complexidade e trabalho ao processo. Existe uma forte ligação entre a etapa de Preparação de Dados e a Modelagem, visto que na Modelagem pode-se idealizar novos formatos e conjuntos de dados para a etapa anterior, alterando-a em busca de melhora no processo e resultado.

22 22 Avaliação Esta fase, segundo Camilo et al., (2009) é considerada uma fase crítica do processo de mineração, nesta etapa é necessária a participação de especialistas nos dados, conhecedores do negócio e tomadores de decisão. Faz-se uso de ferramentas gráficas para ajudar na visualização e análise dos resultados e modelos. Antes de executar os processamentos finais, é necessário fazer uma reavaliação e teste de confiabilidade do modelo e os passos utilizados ao logo de todo o seu processo de construção, para estar seguro e certo que serão atingidos os objetivos do negócio. Os testes que podem ser executados são cross validation, suplied test set, use training set, percentage Split (Camilo et al., 2009). Após a realização dos testes, é necessário verificar os indicadores de análise de resultados obtidos para auxiliar na análise dos mesmos. Também de acordo com Camilo et al., (2009), estes indicadores são: matriz de confusão; índice de correção e incorreção de instâncias mineradas; estatísticas kappa; erro médio absoluto; erro relativo médio; precisão, F-measure dentre outros. Distribuição Criação do modelo não é necessariamente o fim do projeto. Mesmo que o propósito do modelo é aumentar o conhecimento dos dados, o conhecimento adquirido terá de ser organizado e apresentado de uma forma que o cliente possa usá-lo. Isso, na maioria das vezes, envolve a aplicação de modelos dinâmicos nos processos de na tomada de decisões de uma organização, por exemplo, a personalização em tempo real de páginas da Web ou de pontuação repetida de bases de dados de marketing. Dependendo dos requisitos, a fase de distribuição pode ser tão simples como gerar um relatório, ou tão complexo, como a implementação de um processo de mineração de dados em toda a empresa. Em muitos casos, é o cliente, não o analista de dados, que realiza as etapas de distribuição, no entanto, mesmo quando o analista a fizer, é importante para o cliente entender para saber quais ações devem ser tomadas e também escolher quais dos modelos criados devem ser seguidos.

23 23 A Figura 4 apresenta o resumo de todas as fases do CRISP-DM, acompanhadas das tarefas genéricas e seus resultados. Figura 4: Fases do conceito de CRISP-DM (Camilo et al., 2009) Após o estudo do processo de KDD, foi realizado um estudo sobre os principais algoritmos e ferramentas que implementam os algoritmos de mineração. Este estudo é apresentado no capítulo a seguir.

24 24 3 DATAWAREHOUSE E MINERAÇÃO DE DADOS 3.1 Datawarehouse Os dados cabíveis de aplicação dos processos de DCBD são dos mais variados tipos e origens, desde bancos de dados operacionais, até Data Warehouse (DW) e Data Marts. Quando se usa as duas últimas opções, consequentemente é possível ter uma qualidade melhor de dados, pois já foram anteriormente trabalhados e melhorados, sendo este um preceito desses sistemas de armazenamento. Um Data Warehouse (DW) é um conjunto de dados baseado em assuntos, integrado, não-volátil e variante em relação ao tempo, de apoio às decisões gerenciais segundo (INMON, 1997, pg. 33). A proposta inicial de um DW, em sua concepção, era ser simplesmente um depósito de dados, ou seja, armazém de informações captadas ao longo do tempo. No entanto, foram surgindo usos e necessidades para essas informações, resultando no incremento e criação de conjuntos de ferramentas, metodologias e técnicas para se utilizar em um DW. Atualmente ele é muito mais que armazém de dados, é responsável por prover dados transformados em informações, que suportam e auxiliam facilmente áreas estratégicas de tomada de decisões e tornando-se invariavelmente um diferencial de competitividade, quando bem extraído. Ao comparar-se um banco de dados transacional comum e um Data Warehouse, tem-se claramente a visão de que o segundo é um conjunto de dados com histórico, não atualizável e estático, já um banco de dados comum está em constante atualização e manipulação, perdendo a capacidade temporal, visto que ao alterar um registro, perde-se seu estado anterior. O conceito de Data Mart, é exatamente o mesmo que Data Warehouse, porém é voltado para uma área específica. 3.2 Mineração de Dados (MD) Para Silva (2000), Mineração de Dados é uma técnica para determinar padrões de comportamento em grandes bases de dados, auxiliando na tomada de decisão. Para Guizzo (2000), mineração de dados é a extração

25 25 de informações potencialmente uteis e previamente desconhecidas de grandes bancos de dados, servindo de forma prática para a descoberta perfis de consumidores e outros comportamentos que não seriam identificados nem por especialistas em processos típicos. Baseando-se nas definições acima, pode-se afirmar que MD é um procedimento para a extração de conhecimento implícito e útil de um banco de dados, no qual, métodos comuns não atingem os objetivos, considerandose que é a parte fundamentas das transformações de dados em informações significativas. A mineração de dados difere de técnicas estatísticas, porque, ao invés de verificar padrões hipotéticos, utiliza os próprios dados para descobrir tais padrões. Acredita-se também que o volume de informações e dados no mundo duplique a cada 20 meses. O crescimento em tamanho e em quantidade dos bancos de dados, é provavelmente, ainda mais rápido (FRAWLEY et al., 1992). Para extrair informações dos mais variados tipos e áreas, precisa-se de diversas técnicas e algoritmos, portanto, pode-se dizer, que cada objeto de estudo, enquadra-se melhor em determinada técnica. O processo de escolha da melhor técnica, e também, a mais adequada, depende então do conhecimento a respeito dos dados e resultados a serem visados, ou seja: quais atributos, quais relacionamentos são importantes e possíveis, o que é mais útil ao usuário, padrões já conhecidos e assim por diante. O processo de escolha, se deve ao fato de que não existe um método de MD universal, que possa ser aplicado a todas as situações (FAYYAD et al., 1996). Segundo Witten et al. (2005), Olson et al. (2008) e Bramer (2007), a mineração de dados pode ser usada, entre tantas outras, nas seguintes áreas: Retenção de clientes: identificação de perfis para determinados produtos e venda cruzada; Bancos: identificar padrões para auxiliar no gerenciamento de relacionamento com o cliente;

26 26 Cesta de Supermercado: identificar associações de produtos em vendas; Cartão de Crédito: identificar segmentos de mercado, identificar padrões de rotatividade; Cobrança: detecção de fraudes; Telemarketing: acesso facilitado aos dados do cliente; Eleitoral: identificação de um perfil para possíveis votantes; Medicina: indicação de diagnósticos mais precisos; Segurança: na detecção de atividades terroristas e criminais; Auxílio em pesquisas biométricas; RH: identificação de competências em currículos; Tomada de Decisão: filtrar as informações relevantes, fornecer indicadores de probabilidade. Diante das várias tarefas desenvolvidas em Data Mining, tem-se claro que seu objetivo primário é a predição ou a descrição. A predição usa atributos para predizer os valores futuros de uma ou mais variáveis (atributos) de interesse. A descrição contempla o que foi descoberto nos dados sob o ponto de vista da interpretação humana. Existem diversas técnicas que atingem os mais variados objetivos e propósitos. Serão descritas as mais utilizadas somente, dentre estas, foram escolhidas duas para utilização e obtenção dos resultados no presente trabalho. Estas duas terão seus algoritmos explicados de forma mais detalhada e as outras somente uma breve introdução a respeito. Dentre as técnicas mais utilizadas tem-se: Classificação Segundo Elmasri e Navathe, (2000), classificação é o processo de encontrar um modelo que descreva classes de diferentes dados. As classes são predeterminadas. Pode-se chamar isso de atividade de aprendizado supervisionado, pois quando o modelo é construído, ele serve para classificar diversos outros dados. As etapas para o aprendizado são claras, começam com um treinamento baseado em conjuntos de dados que já foram trabalhados,

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

ETEC Dr. Emílio Hernandez Aguilar

ETEC Dr. Emílio Hernandez Aguilar ETEC Dr. Emílio Hernandez Aguilar Grupo: Leonardo; Ronaldo; Lucas; Gustavo; Fabio. 2º Informática Tarde 2º Semestre de 2009 Introdução O PostgreSQL é um SGBD (Sistema Gerenciador de Banco de Dados) objeto-relacional

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br Sistema Tipos de sistemas de informação Everson Santos Araujo everson@everson.com.br Um sistema pode ser definido como um complexo de elementos em interação (Ludwig Von Bertalanffy) sistema é um conjunto

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

BUSINESS INTELLIGENCE -Inteligência nos Negócios-

BUSINESS INTELLIGENCE -Inteligência nos Negócios- UNIVERSIDADE SÃO FRANCISCO CENTRO DE CIÊNCIAS JURÍDICAS, HUMANAS E SOCIAIS BUSINESS INTELLIGENCE -Inteligência nos Negócios- Curso: Administração Hab. Sistemas de Informações Disciplina: Gestão de Tecnologia

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

INDICE 3.APLICAÇÕES QUE PODEM SER DESENVOLVIDAS COM O USO DO SAXES

INDICE 3.APLICAÇÕES QUE PODEM SER DESENVOLVIDAS COM O USO DO SAXES w w w. i d e a l o g i c. c o m. b r INDICE 1.APRESENTAÇÃO 2.ESPECIFICAÇÃO DOS RECURSOS DO SOFTWARE SAXES 2.1. Funcionalidades comuns a outras ferramentas similares 2.2. Funcionalidades próprias do software

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Curso de Data Mining

Curso de Data Mining Curso de Data Mining Sandra de Amo Aula 2 - Mineração de Regras de Associação - O algoritmo APRIORI Suponha que você seja gerente de um supermercado e esteja interessado em conhecer os hábitos de compra

Leia mais

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO:

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: Bacharelado em Sistemas de Informação DISCIPLINA: Fundamentos de Sistemas de Informação PROFESSOR: Paulo de Tarso Costa de Sousa TURMA: BSI 2B

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

http://www.publicare.com.br/site/5,1,26,5480.asp

http://www.publicare.com.br/site/5,1,26,5480.asp Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

Softwares de Sistemas e de Aplicação

Softwares de Sistemas e de Aplicação Fundamentos dos Sistemas de Informação Softwares de Sistemas e de Aplicação Profª. Esp. Milena Resende - milenaresende@fimes.edu.br Visão Geral de Software O que é um software? Qual a função do software?

Leia mais

3 Market Basket Analysis - MBA

3 Market Basket Analysis - MBA 2 Mineração de Dados 3 Market Basket Analysis - MBA Market basket analysis (MBA) ou, em português, análise da cesta de compras, é uma técnica de data mining que faz uso de regras de associação para identificar

Leia mais

Business Intelligence e ferramentas de suporte

Business Intelligence e ferramentas de suporte O modelo apresentado na figura procura enfatizar dois aspectos: o primeiro é sobre os aplicativos que cobrem os sistemas que são executados baseados no conhecimento do negócio; sendo assim, o SCM faz o

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO Proposta de Formação Complementar: BUSINESS INTELLIGENCE E SUA APLICAÇÃO À GESTÃO Aluno: Yussif Tadeu de Barcelos Solange Teixeira

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Módulo 2. Definindo Soluções OLAP

Módulo 2. Definindo Soluções OLAP Módulo 2. Definindo Soluções OLAP Objetivos Ao finalizar este módulo o participante: Recordará os conceitos básicos de um sistema OLTP com seus exemplos. Compreenderá as características de um Data Warehouse

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados: MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação

Leia mais

Administração de Banco de Dados

Administração de Banco de Dados Administração de Banco de Dados Professora conteudista: Cida Atum Sumário Administração de Banco de Dados Unidade I 1 INTRODUÇÃO A BANCO DE DADOS...1 1.1 Histórico...1 1.2 Definições...2 1.3 Importância

Leia mais

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Programação com acesso a BD. Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br Programação com acesso a BD Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br 1 Introdução BD desempenha papel crítico em todas as áreas em que computadores são utilizados: Banco: Depositar ou retirar

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Expanda suas Capacidades Analíticas

Expanda suas Capacidades Analíticas Módulos IBM SPSS Statistics Expanda suas Capacidades Analíticas Um guia resumido dos módulos para o IBM SPSS Statistics Base Destaques Existem vários produtos IBM SPSS para te ajudar em cada fase do projeto

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Introdução a Computação

Introdução a Computação Introdução a Computação Aula 04 SGBD Sistemas Gerenciadores de Bancos de Dados Prof. MSc. Edilberto Silva edilms@yahoo.com Conceitos Básicos DADOS: são fatos em sua forma primária. Ex: nome do funcionário,

Leia mais

Simulação Computacional de Sistemas, ou simplesmente Simulação

Simulação Computacional de Sistemas, ou simplesmente Simulação Simulação Computacional de Sistemas, ou simplesmente Simulação Utilização de métodos matemáticos & estatísticos em programas computacionais visando imitar o comportamento de algum processo do mundo real.

Leia mais

APRESENTAÇÃO DO PRODUTO. Mais que um software, o método mais eficaz para conciliar.

APRESENTAÇÃO DO PRODUTO. Mais que um software, o método mais eficaz para conciliar. APRESENTAÇÃO DO PRODUTO Mais que um software, o método mais eficaz para conciliar. Com Conciliac é possível conciliar automaticamente qualquer tipo de transação; Bancos, Cartões de Crédito e Débito, Contas

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011 Banco de Dados Aula 1 - Prof. Bruno Moreno 16/08/2011 Roteiro Apresentação do professor e disciplina Definição de Banco de Dados Sistema de BD vs Tradicional Principais características de BD Natureza autodescritiva

Leia mais

SISTEMA DE BANCO DE DADOS. Banco e Modelagem de dados

SISTEMA DE BANCO DE DADOS. Banco e Modelagem de dados SISTEMA DE BANCO DE DADOS Banco e Modelagem de dados Sumário Conceitos/Autores chave... 3 1. Introdução... 4 2. Arquiteturas de um Sistema Gerenciador... 5 3. Componentes de um Sistema... 8 4. Vantagens

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Sobre o que falaremos nesta aula?

Sobre o que falaremos nesta aula? Business Intelligence - BI Inteligência de Negócios Prof. Ricardo José Pfitscher Elaborado com base no material de: José Luiz Mendes Gerson Volney Lagmman Introdução Sobre o que falaremos nesta aula? Ferramentas

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Sumário Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Capítulo 2 - Reputação corporativa e uma nova ordem empresarial 7 Inovação e virtualidade 9 Coopetição 10 Modelos plurais

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

Data Warehouse Processos e Arquitetura

Data Warehouse Processos e Arquitetura Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997)

Leia mais

Material de Apoio. Sistema de Informação Gerencial (SIG)

Material de Apoio. Sistema de Informação Gerencial (SIG) Sistema de Informação Gerencial (SIG) Material de Apoio Os Sistemas de Informação Gerencial (SIG) são sistemas ou processos que fornecem as informações necessárias para gerenciar com eficácia as organizações.

Leia mais

01/12/2009 BUSINESS INTELLIGENCE. Agenda. Conceito. Segurança da Informação. Histórico Conceito Diferencial Competitivo Investimento.

01/12/2009 BUSINESS INTELLIGENCE. Agenda. Conceito. Segurança da Informação. Histórico Conceito Diferencial Competitivo Investimento. BUSINESS INTELLIGENCE Agenda BI Histórico Conceito Diferencial Competitivo Investimento Segurança da Objetivo Áreas Conceito O conceito de Business Intelligencenão é recente: Fenícios, persas, egípcios

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

ORGANIZAÇÃO CURRICULAR

ORGANIZAÇÃO CURRICULAR ORGANIZAÇÃO CURRICULAR O curso Técnico em Informática, em Nível Médio Subseqüente, será organizado de forma semestral, com aulas presenciais, compostos por disciplinas, com conteúdos estabelecidos, tendo

Leia mais

Introdução Banco de Dados

Introdução Banco de Dados Introdução Banco de Dados Vitor Valerio de Souza Campos Adaptado de Vania Bogorny Por que estudar BD? Os Bancos de Dados fazem parte do nosso dia-a-dia: operação bancária reserva de hotel matrícula em

Leia mais

CONCEITOS BÁSICOS. 1. Conceitos básicos de BD, SBD e SGBD BANCO DE DADOS I

CONCEITOS BÁSICOS. 1. Conceitos básicos de BD, SBD e SGBD BANCO DE DADOS I CONCEITOS BÁSICOS 1. Conceitos básicos de BD, SBD e SGBD A importância da informação para a tomada de decisões nas organizações tem impulsionado o desenvolvimento dos sistemas de processamento de informações.

Leia mais

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS Vimos em nossas aulas anteriores: COMPUTADOR Tipos de computadores Hardware Hardware Processadores (CPU) Memória e armazenamento Dispositivos de E/S

Leia mais

Apresentação do Portfólio da ITWV Soluções Inteligentes em Tecnologia

Apresentação do Portfólio da ITWV Soluções Inteligentes em Tecnologia P ORTFÓ FÓLIO Apresentação do Portfólio da ITWV Soluções Inteligentes em Tecnologia versão 1.1 ÍNDICE 1. A EMPRESA... 3 2. BI (BUSINESS INTELLIGENCE)... 5 3. DESENVOLVIMENTO DE SISTEMAS... 6 3.1. PRODUTOS

Leia mais

Capítulo 1. Introdução. 1.1 Linguagens. OBJETIVOS DO CAPÍTULO Ao final deste capítulo você deverá ser capaz de:

Capítulo 1. Introdução. 1.1 Linguagens. OBJETIVOS DO CAPÍTULO Ao final deste capítulo você deverá ser capaz de: i Sumário 1 Introdução 1 1.1 Linguagens....................................... 1 1.2 O que é um Compilador?................................ 2 1.3 Processadores de Programas: Compiladores, Interpretadores

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Conceitos Básicos Introdução Banco de Dados I Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM Dados

Leia mais

Alternativas de Integração de Dados Gerenciando Valor e Qualidade

Alternativas de Integração de Dados Gerenciando Valor e Qualidade Soluções para Possibilitar Relacionamentos Duradouros com Clientes Alternativas de Integração de Dados Gerenciando Valor e Qualidade Utilizando uma abordagem regulada para incorporar serviços de qualidade

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

SQL APOSTILA INTRODUÇÃO A LINGUAGEM SQL

SQL APOSTILA INTRODUÇÃO A LINGUAGEM SQL SQL APOSTILA INTRODUÇÃO Uma linguagem de consulta é a linguagem por meio da qual os usuários obtêm informações do banco de dados. Essas linguagens são, tipicamente, de nível mais alto que as linguagens

Leia mais

Revisão para a prova B2. Conteúdo das Aulas: 10, 11 e 14

Revisão para a prova B2. Conteúdo das Aulas: 10, 11 e 14 Revisão para a prova B2 Conteúdo das Aulas: 10, 11 e 14 Disciplina: Serviços de Redes Microsoft Professor: Fernando Santorsula fernando.santorsula@esamc.br Disciplina: Serviços de Redes Microsoft Professor:

Leia mais

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc. MODELAGEM DE DADOS PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS Aula 2 Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord 1 Objetivos: Revisão sobre Banco de Dados e SGBDs Aprender as principais

Leia mais

Data Warehouses Uma Introdução

Data Warehouses Uma Introdução Data Warehouses Uma Introdução Alex dos Santos Vieira, Renaldy Pereira Sousa, Ronaldo Ribeiro Goldschmidt 1. Motivação e Conceitos Básicos Com o advento da globalização, a competitividade entre as empresas

Leia mais

Introdução. Banco de dados. Por que usar BD? Por que estudar BD? Exemplo de um BD. Conceitos básicos

Introdução. Banco de dados. Por que usar BD? Por que estudar BD? Exemplo de um BD. Conceitos básicos Introdução Banco de Dados Por que usar BD? Vitor Valerio de Souza Campos Adaptado de Vania Bogorny 4 Por que estudar BD? Exemplo de um BD Os Bancos de Dados fazem parte do nosso dia-a-dia: operação bancária

Leia mais

Data Warehouse Mineração de Dados

Data Warehouse Mineração de Dados Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 18/12/2014 Data Warehouse Data Mining Big Data A mina de ouro debaixo dos bits 2 Data Warehouse: A Memória da Empresa

Leia mais

1. CONCEITOS BÁSICOS DE BD, SBD E SGBD

1. CONCEITOS BÁSICOS DE BD, SBD E SGBD Introdução 1. CONCEITOS BÁSICOS DE BD, SBD E SGBD A importância da informação para a tomada de decisões nas organizações tem impulsionado o desenvolvimento dos sistemas de processamento de informações.

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

MBA Analytics em Big Data

MBA Analytics em Big Data MBA Analytics em Big Data Inscrições Abertas Início das Aulas: 04/06/2015 Dias e horários das aulas: Segunda-Feira 19h00 às 23h00 Semanal Sexta-Feira 19h00 às 23h00 Semanal Carga horária: 600 Horas Duração:

Leia mais

SISTEMAS DE INFORMAÇÃO GERENCIAIS

SISTEMAS DE INFORMAÇÃO GERENCIAIS SISTEMAS DE INFORMAÇÃO GERENCIAIS O PODER DA INFORMAÇÃO Tem PODER quem toma DECISÃO Toma DECISÃO correta quem tem SABEDORIA Tem SABEDORIA quem usa CONHECIMENTO Tem CONHECIMENTO quem possui INFORMAÇÃO (Sem

Leia mais

Obtenção de regras de associação sobre compras governamentais: Um estudo de caso 1

Obtenção de regras de associação sobre compras governamentais: Um estudo de caso 1 Obtenção de regras de associação sobre compras governamentais: Um estudo de caso 1 Keila Michelly Bispo da Silva 2, Starlone Oliverio Passos 3,Wesley Vaz 4 Resumo: O processo de compras governamentais

Leia mais

Modelagem de Sistemas de Informação

Modelagem de Sistemas de Informação Modelagem de Sistemas de Informação Professora conteudista: Gislaine Stachissini Sumário Modelagem de Sistemas de Informação Unidade I 1 SISTEMAS DE INFORMAÇÃO...1 1.1 Conceitos...2 1.2 Objetivo...3 1.3

Leia mais

CAPÍTULO 5. Introdução ao Gerenciamento de Bancos de Dados.

CAPÍTULO 5. Introdução ao Gerenciamento de Bancos de Dados. CAPÍTULO 5. Introdução ao Gerenciamento de Bancos de Dados. VISÃO GERAL DO CAPÍTULO O objetivo do capítulo é enfatizar o gerenciamento dos recursos de dados de organizações que utilizam computadores. O

Leia mais

Automação do Processo de Instalação de Softwares

Automação do Processo de Instalação de Softwares Automação do Processo de Instalação de Softwares Aislan Nogueira Diogo Avelino João Rafael Azevedo Milene Moreira Companhia Siderúrgica Nacional - CSN RESUMO Este artigo tem como finalidade apresentar

Leia mais

Colaboração nas Empresas SPT SIG Aplicações Empresariais

Colaboração nas Empresas SPT SIG Aplicações Empresariais Capítulo 3: Sistemas de Apoio Gerenciais Colaboração nas Empresas SPT SIG Aplicações Empresariais Objetivos do Capítulo Explicar como os SI empresariais podem apoiar as necessidades de informação de executivos,

Leia mais

O Valor do Licenciamento do SQL Server 2012 Versus Oracle Database

O Valor do Licenciamento do SQL Server 2012 Versus Oracle Database White Paper Publicado em: Janeiro de 2012 Aplica-se ao: SQL Server 2012 O Valor do Licenciamento do SQL Server 2012 Versus Oracle Database Resumo: As mudanças no produto e no licenciamento da Microsoft

Leia mais

Sistemas Empresariais. Capítulo 3: Sistemas de Negócios. Colaboração SPT SIG

Sistemas Empresariais. Capítulo 3: Sistemas de Negócios. Colaboração SPT SIG Capítulo 3: Sistemas de Negócios Colaboração SPT SIG Objetivos do Capítulo Explicar como os SI empresariais podem apoiar as necessidades de informação de executivos, gerentes e profissionais de empresas.

Leia mais

Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI

Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI Janeiro de 2011 p2 Usuários comerciais e organizações precisam

Leia mais

Consistência da Base Cadastral e Controle da Qualidade dos Dados de Faturamento

Consistência da Base Cadastral e Controle da Qualidade dos Dados de Faturamento XVIII Seminário Nacional de Distribuição de Energia Elétrica SENDI 2008-06 a 10 de outubro Olinda - Pernambuco - Brasil Consistência da Base Cadastral e Controle da Qualidade dos Dados de Faturamento Carlos

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais