Data Mining... Ou procurar uma pepita de ouro em uma poça de lama!

Tamanho: px
Começar a partir da página:

Download "Data Mining... Ou procurar uma pepita de ouro em uma poça de lama!"

Transcrição

1 Data Mining... Ou procurar uma pepita de ouro em uma poça de lama! Luiz Carlos da Costa SPEI Ney José Araújo Kloster CEFET-PR Karin Sylvia Graeml Rosane de Fátima Mazia Abstract:.This paper is an introduction to Data Mining: what it is, what it is based upon, which are the technologies that support it, why is it spreading so fast and what are the fields that can benefit the most from it. It also discusses its connection to Data Warehouse and others mechanisms of artificial intelligence. Key words: Data Mining (DM), Data WareHouse(DW), Artificial Intelligence (IA) Introdução A busca do conhecimento sempre foi uma das maiores atividades exercidas pelo homem. Nas últimas décadas, o mundo dos negócios armazenou uma quantidade absurda de dados, principalmente no que diz respeito ao perfil dos consumidores. Hoje as empresas reagem mais rapidamente às mudanças no mercado precisando comparar e melhorar seu desempenho continuamente para adquirir a melhor prática, aliado a busca agressiva de informações para ganhar eficiência e gerar algumas habilidades essenciais na corrida para estar a frente das rivais. As informações tornam-se cada vez mais essenciais aos negócios e é necessário converter toda essa informação em estratégias de marketing. Nesse contexto entra o Data Mining, uma ferramenta atual, que trata de tecnologias baseadas na nova geração de hardware e software, incluindo estatística, IA, redes neuronais etc...para explorar grandes bases de dados e descobrir relações e padrões existentes nessas informações. Histórico A obtenção do conhecimento está se tornando difícil devido ao crescimento das bases de dados em número, tamanho e disponibilidade, decorrentes do grande crescimento industrial e mercantil, surgindo questionamentos como: O que fazer com essa grande massa de dados? O que interessa nesses dados armazenados? Neste ímpeto surge um método de extração de conhecimento desconhecido, de regras e padrões inesperados, processo este denominado de Data Mining. Surgindo em meados dos anos 80, este conceito confirma a importância de se obter informações que possam ser utilizadas para melhorar o bem estar do homem, e coloca esta área de pesquisa como um campo novo e promissor da Informática em geral. Quer conhecer melhor os clientes,tornar o marketing mais eficiente e fazer sua empresa prosperar na Internet? Prepare-se,então, para minerar seus dados ( TEIXEIRA, 2000). Pense no rastro que uma pessoa deixa ao longo de um dia: ligações telefônicas, pager, fax, correio eletrônico, farmácia, supermercado, banco, uso do cartão de crédito e outras transações que usam computadores. Esse acúmulo de dados esconde informações preciosas que nem mesmo especialistas em cálculo de risco com anos de experiência são capazes de enxergar. É de suma importância extrair o máximo dos dados coletados e diretamente proporcional a competitividade do mercado em que a empresa atua.

2 Com o advento de ferramentas de extração de dados e análises entre 80/90 o acesso por parte dos usuários finais agilizou a busca e visualização dos diversos dados existentes através de ferramentas Query, Report e OLAP. Por exemplo : Qual a venda de um produto X por região?, ou Qual o índice de variação de lucros nos últimos meses? O usuário sabia quais elementos combinar como: tempo, região, etc...para saber apenas os volumes envolvidos. Com o Data Mining, começaram a surgir deduções como: O sexo feminino, com idade de 25 e 30 anos, nível universitário, tem tendência a comprar artigos de qualidade independente do preço, visando sempre a qualidade ou O cliente que no final do dia passa no supermercado para comprar cerveja, sempre leva fraldas para bebê ou O cliente que em uma mercearia compra margarina geralmente leva geléia também. Estas inferências são diferentes de mera análise estatística destes elementos em separado pois a combinação de fatores, para um query/report, teria que advinhar quais as melhores combinações entre os elementos. Há uma grande confusão entre ferramentas tradicionais e a ferramenta DM. Essa confusão se dá entre query, reporting e OLAP, porque esses dão somente uma análise tabular, enquanto o DM devido ao seu procedimento cientifico de análise por meio de classificação, identificação, clusterização e segmentação identifica todas as possibilidades de correlações existentes nas fontes de dados. O processo de busca por padrão pode ser automatizado ou envolver um analista da área de Marketing, direcionando assim o teor da pesquisa, podendo desenvolver aplicações que venham a extrair dos bancos de dados informações críticas, com o objetivo de estreitar ainda mais o relacionamento da empresa com os consumidores finais Inteligência Artificial (IA) Inteligência Artificial é o estudo e a criação de máquinas que exibam qualidades semelhantes as humanas, incluindo a capacidade de raciocinar ( LAUDON,1999). Envolve muitos termos complexos e de utilização ampla, sendo necessário delinear um conceito superficial sobre o assunto para melhor compreensão de como ela é utilizada pelo DM. A Inteligência Artificial é o estudo de como fazer os computadores realizarem tarefas em que, no momento, as pessoas são melhores. Com o contínuo crescimento da IA surgiu uma área denominada de Aprendizado de Máquina, muito utilizada pela DM. Aprendizado refere-se a mudança de comportamento diante de uma situação dada, incorrida por suas experiências repetidas naquela situação, em tendências de respostas nativas, maturação ou estados temporários do paciente. Os computadores já possuem a capacidade de aprender, advindo basicamente do fato de poderem interpretar suas entradas de modo que seu desempenho gradativamente melhore. Estatística Estatística é uma área bem mais matemática e precisa que as demais, referindo-se a compilação, apresentação, análise e utilização de dados numéricos para fazer inferências e tomar decisão em face de incertezas na economia, negócios e outras ciências sociais e físicas. O conceito estatístico mais empregado em Data mining é o das Probabilidades. Descoberta de Conhecimento em Bases de Dados É basicamente um software ou um possível hardware, que suporta utilizar/integrar vários métodos de descoberta de conhecimento, a maioria dos quais são baseados em pesquisa, e podem ser usados em modo interativo ou automatizados. Devem buscar ser o mais exatos, eficientes e versáteis possíveis.

3 dados dados DW pré-processamento DM pós -processamento integração conhecimento Figura 1: Descoberta do Conhecimento em Base de dados KDD A figura acima demonstra os principais passos para descoberta de conhecimento num Banco de Dados. Este processo é denominado de Knowledge Discovery in Databases KDD, onde DW- Data Warehouse, PRE-PROC -Pré-processamento para o Data Mining, DM - Data Mining, POS-PROC - Pós-processamento dos resultados obtidos pelo Data Mining. Data Warehouse (DW) À medida que as informações precisam ser modificadas, os métodos de armazenamento e recuperação de dados também devem mudar. Os bancos de dados orientados a objetos e de hipermídia, juntamente com os armazéns de dados (Data Warehouse), estão transformando o modo de gerência de dados.( JONH,1996) Existem vários conceitos do que é Data Warehouse(DW): DW é um processo em andamento que aglutina dados de fontes heterogêneas, dados históricos e dados externos para atender a necessidade de consultas estruturadas e ad-hoc, relatórios analíticos e suporte a decisão (HARJINDER,1996). DW é uma coleção de dados orientados por assuntos, integrados, variáveis com o tempo e não voláteis, do interesse exclusivo do usuário, resultado da operação de vários sistemas computacionais., que podem ser utilizados para relatórios e análises gerenciais(inmon,1997). DW é uma coleção de técnicas e tecnologias que juntas disponibilizam um enfoque objetivo e ordenado para tratar com o problema do usuário final de acessar informações que estão distribuídas em vários sistemas de suporte a decisão (BARQUINI,1996). Um ambiente de DW é constituído de 3 componentes funcionais: : a aquisição de dados, identificando dados legais e tornando-os acessíveis ao DW para uso; a área de armazenagem, composta de bases de dados e/ou arquivos que contem os dados em formatos que tornem fácil aos usuários chegarem a eles); e a área de acesso, que inclui a rede, computadores pessoais, e ferramentas de acesso que os usuários utilizam para trabalhar com a informação disponível. Além destas três partes funcionais, é suportado por dois componentes críticos de infra-estrutura: a infraestrutura física (hardware, redes, e softwares) e a infra-estrutura operacional ( pessoas, regras, responsabilidades, e procedimentos). Aquisição Armazenamento Acesso Infra-estrutura operacional Infra-estrutura Física Figura 2: O DW e seus componentes Os princípios por trás dos paradigmas do DW somente começam a fazer sentido com a quebra dos antigos princípios preconizados pelas metodologias de desenvolvimento dos Sistemas e Banco de Dados. Onde o

4 antigo paradigma ordenava a eliminação da redundância de dados e a otimização do espaço em disco como chaves do projeto, DW diz que a duplicação é normal, e em muitos casos, uma boa atitude a ser tomada. Onde a antiga ciência da gerência dos dados insiste no uso de entidades-relacionamentos e em normalização, DW preconiza uma abordagem mais prática e baseada em resultados. Onde a metodologia JAD ( Joint Apllication Development) e os ciclos de desenvolvimento dos sistemas provêem uma burocracia decorrente de décadas de experiência na construção destes sistemas, DW assume uma visão interativa, com o aprendizado ao longo do caminho como design do sistema. Características BD Operacionais Data Warehouse Objetivo Operações diárias no negócio Analisar o negócio Uso Operacional Informativo Tipo de processamento OLTP OLAP Unidade de trabalho Inclusão, alteração, exclusão Carga e consulta Número de usuários Milhares Centenas Tipo de usuário Operadores Comunidade gerencial Interação com o usuário Somente pré-definida Pré-definida e ad-hoc Condições dos dados Dados operacionais Dados Analíticos Volume Megabytes-gigabytes Gigabytes-terabytes Histórico 60 a 90 dias 5 a 10 anos Redundância Não ocorre Ocorre Estrutura Estática Variável Manutenção desejada Mínima Constante Acesso a registros Dezenas Milhares Atualização Contínua (tempo real) Periódica (em batch) Integridade Transação A cada atualização Número de índices Poucos/simples Muitos/complexos Intenção dos índices Localizar um registro Aperfeiçoar consultas Tabela 1 Diferenças entre Banco de Dados Operacionais e Data Warehouse Na Tabela 1 estão relacionados algumas diferenças entre BD Operacionais e DW, bem como a diferença dos dados que eles manipulam. Analisando-se cuidadosamente esta tabela, pode-se ter uma visão geral do que é DW: um meio dos usuários analisarem informações históricas de outros processos para melhorarem os processos atuais e futuros. Características do Data Warehouse As principais características do DW, segundo INMON(1996) são: - Orientação por assunto: armazena-se os dados de temas específicos de interesse do usuário, levando-se em conta no projeto do analista quais os objetivos da DW do usuário. - Integração: a mais importante, pois é ela quem define o modelo único para os dados provenientes dos diversos sistemas, que possuem variadas formas de representação. - Variação no tempo: como todos os dados no DW são precisos em algum instante no tempo, diz-se que eles variam com o tempo. - Não volatilidade: após a carga inicial dos dados, não existem alterações posteriores, somente consultas. - Localização: os dados podem ser armazenados fisicamente de três formas: local único, centralizando o banco de dados em um DW integrado, maximizando o poder de processamento e agilizando a busca dos dados; áreas de interesse; níveis de detalhes. - Credibilidade dos dados :é o mais importante para o sucesso de qualquer projeto que se proponha a extrair dados para suportar decisões estratégicas para o negócio da empresa.

5 - Granularidade: é o nível de detalhe ou de resumo contido nas unidades de dados. Quanto maior o nível de detalhes menor o nível de granularidade. Data Mining Grande parte de nossa inteligência vem da nossa capacidade de perceber padrões e regularidades e, por vezes, ocorrem ilusões não apenas em nossa visão, mas também em uma série de outras habilidades cognitivas, o que nos faz ter ocasionalmente uma percepção distorcida da realidade, levando-nos então a buscar auxílio nas ferramentas computacionais e técnicas de Data Mining. Tal como OLAP, que pode significar quase tudo, vendedores e analistas industriais tem adotado o termo Data Mining indiscriminadamente. O resultado é uma definição coletiva que inclui todas as ferramentas empregadas para ajudar os usuários a analisarem e compreenderem seus dados. Muitas das ferramentas técnicas usadas hoje em DM, estiveram aí por muitos anos, tendo origem nas pesquisas de inteligência artificial nos anos 80 e 90, e somente agora aplicadas em sistemas de grandes bases de dados. Discute-se muito a sua implementação em tecnologias de bases de dados relacionais, embora estas técnicas possam ser também aplicadas em outras representações de dados, incluindo domínios de dados espaciais, domínios baseados em textos e domínios multimídia.. Algumas definições de Data mining: É um conjunto de técnicas baseadas numa geração de hardware e software que envolve métodos matemáticos, algoritmos e heurísticas para explorar grandes bases de dados e descobrir padrões e relações existentes nessas informações. É um conjunto de técnicas que inclui análises estatísticas, visualizações, árvore de decisão, redes neuronais,etc., para explorar grandes bases de dados e descobrir relações e padrões existentes nestes dados. Nos próximos dois anos, segundo prevê o Forrester Research, haverá uma explosão de projetos de Data Mining, quase o quádruplo do que existe hoje. Tudo começa com uma carga de dados históricos minuciosamente detalhados que precisam ser peneirados em busca de gemas. Depois, tem-se que decidir qual o problema que se quer resolver: aumentar a taxa de resposta de mala direta, encontrar credores de hipotecas ou impulsionar a venda em mercearias, por exemplo. É necessário ferramentas de mineração baseadas em algoritmos que vasculhem todos os dados em busca de modelos. As próprias ferramentas funcionam de diversas maneiras: baseadas em desktop, cliente servidor, SAS, etc.. Categorias de ferramentas de DM Inclui-se nestas categorias, todas as ferramentas que, quando disponibizadas ao usuário final, lhes dão habilidade para fazerem análises de informações pré-definidas pelos próprios ou ad hoc, com o propósito de solução de problemas específicos dos negócios. - Ferramentas de query e reports; - Agentes softwares que planejam, executam, avaliam, ou pesquisam coisas para os usuários; - OLAP ( Processos Analíticos Online) Ferramentas de análise multi-dimensionais - Análise Estatística Tradicional SPSS/SAS e outros pacotes estatísticos - Descoberta de Dados Redes Neuronais, árvores de decisão, CART, e outros avanços da inteligência artificial e softwares de conhecimento genérico; - Visualização Sistemas que gráfica ou geograficamente exibem relacionamentos complexos de dados; - Ferramentas WEB softwares que permitem pesquisa, perguntas, e trabalho de agentes no ambiente WWW. Atividades básicas Existem quatro atividades básicas exercidas pelo Data Mining: Descoberta de regras de associação, Classificação, Sumarização e Clustering. - Descoberta de Regras de Associação: esta tarefa resume-se em descobrir todas as regras de associação numa determinada base de dados com um mínimo suporte e uma mínima confiança. - Classificação: a tarefa desta atividade é descobrir um relacionamento entre os atributos previsores e o atributo meta, usando registros cuja classe é conhecida. Esta atividade é muito importante, pois através do

6 relacionamento descoberto é possível prever a classe de um registro com classe desconhecida. Cada registro consiste de Atributo Meta e Atributos Previsores, onde a classe de atributo é definida pelo atributo meta. Normalmente os dados são divididos em dois grandes grupos: de treinamento, onde a classe é conhecida; e de teste, onde a classe é desconhecida. Há um único atributo meta, e os demais atributos são previsores, com parte do problema consistindo-se em determinar automaticamente a importância dos atributos previsores, através de medidas objetivas para medir a qualidade da classificação. - Sumarização: esta atividade tem a finalidade de separar registros de uma determinada base de dados de acordo com as classes, ou seja, um grupo de registros para cada classe. Isto é feito através da execução de um procedimento de sumarização dentro de cada classe. - Clustering: a tarefa tem a finalidade de agrupar registros semelhantes criando novas classes. Após a execução desta tarefa, pode-se aplicar métodos de classificação e sumarização para descobrir regras de classificação e regras de sumarização. Neste caso, não há atributo especial, sendo a importância de cada atributo geralmente considerada equivalente à dos demais, além da dificuldade de medir-se a qualidade de clustering. Métodos de abordagem Dentro do processo de Data Mining existem vários métodos de abordagem entre os mais conhecidos estão Indução de Regras, Redes Neurais, Aprendizado Baseado em Casos, Algoritmos Genéticos e Lógica Fuzzy. - Indução de regras: Este método tem a finalidade de aperfeiçoar regras candidatas, isto é, torná-las mais gerais ou mais especialistas. - Árvores de Decisão: Um dos principais métodos de indução de regras são as árvores de decisão. Ela representa o conhecimento extraído de uma base de dados através de uma árvore. A construção da árvore é feita de forma Top Down, onde inicialmente todas as tuplas são colocadas na raiz da árvore. Seleciona-se um atributo que servirá para dividir o conjunto de tuplas do nó da raiz, e assim por diante, onde o objetivo é separar as classes. - Redes Neuronais : Os anos 80 marcaram a Inteligência Artificial devido ao reaparecimento das Redes Neurais, também conhecidas por Sistemas Conexionistas ou Sistemas de Processamento Distribuído. Estes sistemas tomaram por base para as suas arquiteturas os estudos mais recentes sobre a inteligência, particularmente o córtex do cérebro e princípios neuro-fisiológicos. Desta maneira as Redes Neurais podem ser definidas como método de representação do conhecimento através de certos processos biológicos. As suas características mais marcantes são a capacidade de aprendizado, tolerância a falhas e a possibilidade de operação com alto grau de paralelismo. - Aprendizado Baseado em Casos: O método do Vizinho mais Próximo é o que ao invés de descobrir um conjunto de regras a partir de dados, simplesmente usa os dados diretamente para classificação. - Algoritmos Genéticos: Um algoritmo genético é um procedimento interativo para evoluir uma população de indivíduos, onde estes indivíduos são possíveis soluções para um problema. Em cada nova população gerada é calculada uma função de fitness que mede a qualidade da população gerada. Caso a população não satisfaça o fitness desejado operadores genéticos são aplicados aos indivíduos atuais para criar novos indivíduos. Dificuldades ou problemas para a utilização de Data Mining Falta de visão de longo prazo; Nem todos os arquivos estão atualizados; Luta entre departamentos; Pobre cooperação por parte do Sistema de Informação; Restrições legais e de privacidade; Diferença de suporte dos dados; Problema de tempo; Interpretação do resultado.

7 Considerações sobre os benefícios, qualidade e utilização do DM É importante que se tenha novas e refinadas informações que o permita agir dentro do contexto e que seja possível medir os benefícios decorrentes do DM, Os resultados devem ser apresentados em planilhas acompanhados de gráficos, com o sistema sendo capaz de explicar cada pedaço de informação de maneira clara., não sendo necessário o domínio da estatística pelos usuários. Os usuários devem ter o poder de contato direto e acesso aos refinados sistemas de conhecimento, não sendo necessário se utilizar de intermediários como analistas para obter mais informações após ter alguns resultados. O usuário pode obter informações mais refinadas, se assim o desejar, quando quiser. Após o projeto inicial do sistema, o pessoal de suporte para o sistema deve ser mantido mínimo, com um administrador de DB sendo capaz de administrar o DBMS. O sistema DM deve ser capaz de disponibilizar conhecimentos fundamentais para suportar centenas de usuários, cada um com uma diferente perspectiva de grupo. Cada usuário deve receber respostas consistentes a suas perguntas. É importante que o sistema cubra uma vasta rede de relacionamentos e disponibilize alta qualidade de informação, permitindo a análise dos dados e tornando-os disponíveis toda semana ou mês, sempre realizando análises nos ítens ou fatores que causem impactos significativos nas mudanças. O incremento de análise pode ser automático ou mediante demanda. O sistema deve atuar em plataformas abertas ( UNIX) e mecanismos populares (DBMS Oracle, Sybase, etc..) nos servidores, permitindo apresentar resultados aos usuários na intranet corporativa... Considerações do ponto de vista da arquitetura, poder e escalabilidade do DM A melhor maneira é colocar tudo no servidor. Qualquer tentativa de trazer os dados ao cliente poderá trazer limitações serias de aplicabilidade do sistema em grandes bases de dados. A melhor arquitetura é a que usa o poder de um grande servidor baseado em SQL,mas operado por uma intranet.. É melhor trabalhar em suas bases de dados reais do que em exemplos, extraídos de arquivos mais magros. Deve permitir acesso a tabelas de bases de dados em sua forma nativa, permitindo o uso de múltiplos processadores para processamento não SQL, e ser capaz de minerar grandes e múltiplas tabelas de bases de dados diretamente por ele mesmo no servidor. O fenômeno OLAP demonstrou conclusivamente que o mundo dos negócios não são de dimensões simples. Então, um sistema DM deve ser capaz de automaticamente descobrir relacionamentos através de múltiplas dimensões. São vários os formatos das regras de descobrimento do sistema, que vão de árvores de decisão a simples afinidades Em alguns casos o usuário deve interagir e guiar o sistema, construindo a árvore de decisão. Entretanto, uma melhor abordagem é pelo sistema que usa sua própria iniciativa nos processos de mineração, formulando hipóteses automaticamente, baseado no tipo de dados. O sistema pode começar por ele mesmo selecionando os relacionamentos significativos nos dados e inclinar-se para os mais importantes. A análise pode dar-se rotineiramente em base semanal ou mensal. O sistema deve manejar todo tipo de dados em sua formas uniformes e nativas, isto é: números, datas e constantes devem permanecer números, datas e constantes internas. Não deve ser necessário construir números binários pelo usuário. O sistema deve ser capaz de utilizar as capacidades funcionais ( e outras dependências) que existam na base de dados, entendendo o conceito de hierarquias e ser capaz de usá-lo para descobertas através de dimensões múltiplas. Não deve ser sensível aos ruídos e deve internamente usar lógica fuzzy para clarear e limpar os dados. E ainda que permaneçam ruídos, deve produzir significativos achados provenientes dos dados, mesmo que o ruído ainda esteja presente. Áreas de Aplicação Pode-se classificar a aplicação de DM em grupos de problemas que tenham características similares através de diferentes domínios de aplicação: - Vendas - identificar padrões de comportamento dos consumidores; encontrar características dos consumidores de acordo com a região demográfica; prever quais consumidores serão atingidos nas

8 campanhas de marketing. Exemplo: Em recente trabalho realizado por uma companhia seguradora americana, constatou-se que todo proprietário de carro esportivo que tinha um segundo carro, não apresentava o mesmo risco que os demais. Como o prêmio de seguro é elevado nesta categoria, com uma redução no preço, conquistou-se pontos preciosos de participação do mercado. - Finanças Detectar padrões de fraudes no uso dos cartões de crédito; identificar os consumidores que estão tendendo a mudar a companhia do cartão de crédito; identificar regras de estocagem a partir dos dados do mercado; encontrar correlações escondidas nas bases de dados. - Seguros e Planos de Saúde- Determinar quais procedimentos médicos são requisitados ao mesmo tempo; Prever quais consumidores comprarão novas apólices; identificar comportamentos fraudulentos. - Transporte Determinar a distribuição dos horários entre os vários caminhos; analisar padrões de sobrecarga. - Medicina Caracterizar o comportamento dos pacientes para prever novas consultas; identificar terapias de sucessos para diferentes doenças. Conclusão A conclusão que se chega é que no Brasil ainda estamos na fase da implantação de Data Warehouse, com algumas ações isoladas de Data Mining. Com a explosão dos dados armazenados, principalmente pelo registro automático dos hábitos pela Web, surge a necessidade vital de selecionar dados significativos que por meio de análises de DM, se transformem em informações facilitadoras de tomadas de decisões. O poder computacional hoje disponibilizado nas mesas dos usuários, aliado ao aparecimento de softwares com interface amigável, permite disseminação e conseqüente utilização das técnicas de DM O problema a resolver é a coleta dos dados que farão parte do Data Warehouse, pois o sistema precisa de dados históricos, e o nosso país não possuía até então cultura de armazenamento de arquivos históricos de transações. Geralmente, num projeto, deve-se destinar 80% dos recursos para o DW e o restante para o processo de DM. A importância de extrair o máximo possível dos dados coletados é diretamente proporcional à competitividade do mercado em que a empresa atua.por exemplo, em empresas de telefonia, onde o garimpo de dados é uma ferramenta essencial na disputa pelos clientes.(intensidade do uso, tipos de atendimento, horário de utilização), os executivos das companhias conseguem enxergar em quais clientes vale a pena investir numa campanha de marketing e quais a empresa pode se dar ao luxo de perderem. Em bancos, a ferramenta já vem sendo utilizada desde 1998,com os resultados obtidos reduzindo os custos de venda de produtos de 15% a 30%, além do ganho de produtividade. Muitas empresas não usam DM devido a grande desorganização e até mesmo inexistência de informações para analisar. Em contrapartida as empresas que adotaram a estratégia tem uma visão global de seu negócio a qualquer momento, mas a idéia é saber, com a ajuda de empresas especializadas em traçar perfis de hábito e consumo, qual o produto certo para as pessoas certas. Referências bibliográficas ADRIAANS, P. e ZANTINGE, D. Data Mining. Addison- Wesley LongmanLimited, Inglaterra BARQUINI, R.. Planning and designing the warehouse, New Jersey, Prentice- Hall 1996, BATINI C. e Lenzerini, M.. Comparative analysis of methodologies for databas schema integration, ACM Computing Surveys, New York, v. 18, nº 4,pg Dezembro, FREITAS, A. A.. Data Mining mineração de dados. Apostila do curos ministrado no CEFET-PR. INMON, W. H.. Building the data warehouse, Jonh Wiley Sons Inc.,New York INMON, W. H.. Como construir o data warehouse, Campus, Rio de Janeiro, 1997, 38 pg. LAUDON Jane, P e. LAUDON Kenneth C..Information Systems and the Internet, LTC,1999

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

SAD orientado a DADOS

SAD orientado a DADOS Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a DADOS DISCIPLINA: Sistemas de Apoio a Decisão SAD orientado a dados Utilizam grandes repositórios

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de 1 Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Descrever

Leia mais

Chapter 3. Análise de Negócios e Visualização de Dados

Chapter 3. Análise de Negócios e Visualização de Dados Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

Data Warehouse Processos e Arquitetura

Data Warehouse Processos e Arquitetura Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997)

Leia mais

Sobre o que falaremos nesta aula?

Sobre o que falaremos nesta aula? Business Intelligence - BI Inteligência de Negócios Prof. Ricardo José Pfitscher Elaborado com base no material de: José Luiz Mendes Gerson Volney Lagmman Introdução Sobre o que falaremos nesta aula? Ferramentas

Leia mais

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago

DATA WAREHOUSE. Rafael Ervin Hass Raphael Laércio Zago DATA WAREHOUSE Rafael Ervin Hass Raphael Laércio Zago Roteiro Introdução Aplicações Arquitetura Características Desenvolvimento Estudo de Caso Conclusão Introdução O conceito de "data warehousing" data

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

http://www.publicare.com.br/site/5,1,26,5480.asp

http://www.publicare.com.br/site/5,1,26,5480.asp Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário

Leia mais

2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução

2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução 2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução De acordo com [FAYY96], o conceito de descoberta de conhecimento em bases de dados pode ser resumido como o processo não-trivial de identificar

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Data Warehouses Uma Introdução

Data Warehouses Uma Introdução Data Warehouses Uma Introdução Alex dos Santos Vieira, Renaldy Pereira Sousa, Ronaldo Ribeiro Goldschmidt 1. Motivação e Conceitos Básicos Com o advento da globalização, a competitividade entre as empresas

Leia mais

Trata-se de uma estratégia de negócio, em primeira linha, que posteriormente se consubstancia em soluções tecnológicas.

Trata-se de uma estratégia de negócio, em primeira linha, que posteriormente se consubstancia em soluções tecnológicas. CUSTOMER RELATIONSHIP MANAGEMENT Customer Relationship Management CRM ou Gestão de Relacionamento com o Cliente é uma abordagem que coloca o cliente no centro dos processos do negócio, sendo desenhado

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

CONHECENDO E CONCEITUANDO SISTEMAS DE INFORMAÇÃO

CONHECENDO E CONCEITUANDO SISTEMAS DE INFORMAÇÃO CONHECENDO E CONCEITUANDO SISTEMAS DE INFORMAÇÃO Franco Vieira Sampaio 1 Atualmente a informática está cada vez mais inserida no dia a dia das empresas, porém, no início armazenavam-se os dados em folhas,

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Bloco Administrativo

Bloco Administrativo Bloco Administrativo BI Business Intelligence Objetivo O objetivo deste artigo é dar uma visão geral sobre o Módulo Business Intelligence, que se encontra no Bloco Administrativo. Todas informações aqui

Leia mais

Os novos usos da tecnologia da informação na empresa

Os novos usos da tecnologia da informação na empresa Os novos usos da tecnologia da informação na empresa Internet promoveu: Transformação Novos padrões de funcionamento Novas formas de comercialização. O maior exemplo desta transformação é o E- Business

Leia mais

Gerenciamento de Dados e Gestão do Conhecimento

Gerenciamento de Dados e Gestão do Conhecimento ELC1075 Introdução a Sistemas de Informação Gerenciamento de Dados e Gestão do Conhecimento Raul Ceretta Nunes CSI/UFSM Introdução Gerenciando dados A abordagem de banco de dados Sistemas de gerenciamento

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

MBA em Gestão de Empreendimentos Turísticos

MBA em Gestão de Empreendimentos Turísticos Prof. Martius V. Rodriguez y Rodriguez, DSc martius@kmpress.com.br MBA em Gestão de Empreendimentos Turísticos Gestão do Conhecimento e Tecnologia da Informação Gestão do Conhecimento evolução conceitual.

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é

Leia mais

Business Intelligence e ferramentas de suporte

Business Intelligence e ferramentas de suporte O modelo apresentado na figura procura enfatizar dois aspectos: o primeiro é sobre os aplicativos que cobrem os sistemas que são executados baseados no conhecimento do negócio; sendo assim, o SCM faz o

Leia mais

Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI

Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI Janeiro de 2011 p2 Usuários comerciais e organizações precisam

Leia mais

Como melhorar a tomada de decisão. slide 1

Como melhorar a tomada de decisão. slide 1 Como melhorar a tomada de decisão slide 1 P&G vai do papel ao pixel em busca da gestão do conhecimento Problema: grande volume de documentos em papel atrasavam a pesquisa e o desenvolvimento. Solução:

Leia mais

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) AULA 07 MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) JAMES A. O BRIEN MÓDULO 01 Páginas 286 à 294 1 AULA 07 SISTEMAS DE APOIO ÀS DECISÕES 2 Sistemas de Apoio à Decisão (SAD)

Leia mais

Sistemas de Informação Gerenciais (SIG)

Sistemas de Informação Gerenciais (SIG) Faculdade de Engenharia - Campus de Guaratinguetá Sistemas de Informação Gerenciais (SIG) Prof. José Roberto Dale Luche Unesp Um SISTEMA DE INFORMAÇÃO é um conjunto de componentes inter-relacionados, desenvolvidos

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

SISTEMAS DE INFORMAÇÃO GERENCIAIS

SISTEMAS DE INFORMAÇÃO GERENCIAIS SISTEMAS DE INFORMAÇÃO GERENCIAIS O PODER DA INFORMAÇÃO Tem PODER quem toma DECISÃO Toma DECISÃO correta quem tem SABEDORIA Tem SABEDORIA quem usa CONHECIMENTO Tem CONHECIMENTO quem possui INFORMAÇÃO (Sem

Leia mais

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo Unidade III PRINCÍPIOS DE SISTEMAS DE INFORMAÇÃO Prof. Luís Rodolfo Vantagens e desvantagens de uma rede para a organização Maior agilidade com o uso intenso de redes de computadores; Grandes interações

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

Módulo 2. Definindo Soluções OLAP

Módulo 2. Definindo Soluções OLAP Módulo 2. Definindo Soluções OLAP Objetivos Ao finalizar este módulo o participante: Recordará os conceitos básicos de um sistema OLTP com seus exemplos. Compreenderá as características de um Data Warehouse

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS Capítulo 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7.1 2003 by Prentice Hall OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação?

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD)

CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD) 1 CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD) A necessidade dos SAD surgiu em decorrência de diversos fatores, como, por exemplo: Competição cada vez maior entre as

Leia mais

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining.

Palavras-chave: On-line Analytical Processing, Data Warehouse, Web mining. BUSINESS INTELLIGENCE COM DADOS EXTRAÍDOS DO FACEBOOK UTILIZANDO A SUÍTE PENTAHO Francy H. Silva de Almeida 1 ; Maycon Henrique Trindade 2 ; Everton Castelão Tetila 3 UFGD/FACET Caixa Postal 364, 79.804-970

Leia mais

SISTEMAS INTELIGENTES DE APOIO À DECISÃO

SISTEMAS INTELIGENTES DE APOIO À DECISÃO SISTEMAS INTELIGENTES DE APOIO À DECISÃO As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO:

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: Bacharelado em Sistemas de Informação DISCIPLINA: Fundamentos de Sistemas de Informação PROFESSOR: Paulo de Tarso Costa de Sousa TURMA: BSI 2B

Leia mais

Motivação: inundação de informação. Data warehouse. Inteligência computacional aplicada em finanças, comércio e indústria

Motivação: inundação de informação. Data warehouse. Inteligência computacional aplicada em finanças, comércio e indústria Programa de Especialização em Inteligência Computacional Motivação: inundação de informação Morrendo de sede por conhecimento em um oceano de dados Inteligência computacional aplicada em finanças, comércio

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence Juntamente com o desenvolvimento desses aplicativos surgiram os problemas: & Data Warehouse July Any Rizzo Oswaldo Filho Década de 70: alguns produtos de BI Intensa e exaustiva programação Informação em

Leia mais

CAPÍTULO 5. Introdução ao Gerenciamento de Bancos de Dados.

CAPÍTULO 5. Introdução ao Gerenciamento de Bancos de Dados. CAPÍTULO 5. Introdução ao Gerenciamento de Bancos de Dados. VISÃO GERAL DO CAPÍTULO O objetivo do capítulo é enfatizar o gerenciamento dos recursos de dados de organizações que utilizam computadores. O

Leia mais

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Data Warehouse. Debora Marrach Renata Miwa Tsuruda Debora Marrach Renata Miwa Tsuruda Agenda Introdução Contexto corporativo Agenda Introdução Contexto corporativo Introdução O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos

Leia mais

INSTITUTO VIANNA JÚNIOR LTDA FACULADE DE CIENCIAS ECONOMICAS VIANNA JUNIOR DATA MINING - EXTRAÇÃO E EXPLORAÇÃO DE CONHECIMENTO.

INSTITUTO VIANNA JÚNIOR LTDA FACULADE DE CIENCIAS ECONOMICAS VIANNA JUNIOR DATA MINING - EXTRAÇÃO E EXPLORAÇÃO DE CONHECIMENTO. INSTITUTO VIANNA JÚNIOR LTDA FACULADE DE CIENCIAS ECONOMICAS VIANNA JUNIOR DATA MINING - EXTRAÇÃO E EXPLORAÇÃO DE CONHECIMENTO. Lúcia Helena de Magalhães 1 Márcio Aarestrup Arbex 2 Resumo Este artigo tem

Leia mais

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados: MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação

Leia mais

Estudar os Sistemas de Processamento de Transação (SPT)

Estudar os Sistemas de Processamento de Transação (SPT) Estudar a Colaboração Empresarial. Objetivos do Capítulo Estudar os Sistemas de Processamento de Transação (SPT) Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Estudar

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas e técnicas

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

Etapas da evolução rumo a tomada de decisão: Aplicações Isoladas: dados duplicados, dados inconsistentes, processos duplicados.

Etapas da evolução rumo a tomada de decisão: Aplicações Isoladas: dados duplicados, dados inconsistentes, processos duplicados. Histórico Etapas da evolução rumo a tomada de decisão: Aplicações Isoladas: dados duplicados, dados inconsistentes, processos duplicados. Sistemas Integrados: racionalização de processos, manutenção dos

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

Sistemas de Informações Gerenciais

Sistemas de Informações Gerenciais Sistemas de Informações Gerenciais Aula 4 Sistema de Informação SI baseado em computadores Organização, administração e estratégia Professora: Cintia Caetano INTRODUÇÃO Sistemas de Informação são parte

Leia mais

Data Warehousing Visão Geral do Processo

Data Warehousing Visão Geral do Processo Data Warehousing Visão Geral do Processo Organizações continuamente coletam dados, informações e conhecimento em níveis cada vez maiores,, e os armazenam em sistemas informatizados O número de usuários

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009.

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. REFERÊNCIAS o o Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. Competição Analítica - Vencendo Através da Nova Ciência Davenport,

Leia mais

Módulo 6: Inteligência Artificial

Módulo 6: Inteligência Artificial Módulo 6: Inteligência Artificial Assuntos: 6.1. Aplicações da IA 6.2. Sistemas Especialistas 6.1. Aplicações da Inteligência Artificial As organizações estão ampliando significativamente suas tentativas

Leia mais

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br Sistema Tipos de sistemas de informação Everson Santos Araujo everson@everson.com.br Um sistema pode ser definido como um complexo de elementos em interação (Ludwig Von Bertalanffy) sistema é um conjunto

Leia mais

Uma estrutura (framework) para o Business Intelligence (BI)

Uma estrutura (framework) para o Business Intelligence (BI) Uma estrutura conceitural para suporteà decisão que combina arquitetura, bancos de dados (ou data warehouse), ferramentas analíticas e aplicações Principais objetivos: Permitir o acesso interativo aos

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012

PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012 PLANO DE ENSINO DO 2º SEMESTRE LETIVO DE 2012 Curso: TECNOLOGIA EM GESTÃO COMERCIAL Habilitação: TECNÓLOGO Disciplina: NEGÓCIOS INTELIGENTES (BUSINESS INTELLIGENCE) Período: M V N 4º semestre do Curso

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

Thalita Moraes PPGI Novembro 2007

Thalita Moraes PPGI Novembro 2007 Thalita Moraes PPGI Novembro 2007 A capacidade dos portais corporativos em capturar, organizar e compartilhar informação e conhecimento explícito é interessante especialmente para empresas intensivas

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Sistemas de Informação Sistemas de Apoio às Operações Sistemas

Leia mais

Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados

Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados Faculdade Pitágoras Curso Superior de Tecnologia: Banco de Dados Disciplina: Ferramentaspara Tomadade Decisão Prof.: Fernando Hadad Zaidan Unidade 1.2 1 Conceitos Iniciais Tomada de Decisão, Modelagem

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

ASSUNTO DA APOSTILA: SISTEMAS DE INFORMAÇÃO E AS DECISÕES GERENCIAIS NA ERA DA INTERNET

ASSUNTO DA APOSTILA: SISTEMAS DE INFORMAÇÃO E AS DECISÕES GERENCIAIS NA ERA DA INTERNET AULA 02 ASSUNTO DA APOSTILA: SISTEMAS DE INFORMAÇÃO E AS DECISÕES GERENCIAIS NA ERA DA INTERNET JAMES A. O BRIEN CAPÍTULO 01 continuação Páginas 03 à 25 1 COMPONENTES DE UM SISTEMA DE INFORMAÇÃO Especialistas

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

LISTA DE EXERCÍCIOS. Mede a capacidade de comunicação de computadores e dispositivos. Operam em diferentes plataformas de hardware

LISTA DE EXERCÍCIOS. Mede a capacidade de comunicação de computadores e dispositivos. Operam em diferentes plataformas de hardware 1. A nova infra-estrutura de tecnologia de informação Conectividade Mede a capacidade de comunicação de computadores e dispositivos Sistemas abertos Sistemas de software Operam em diferentes plataformas

Leia mais

Estratégias em Tecnologia da Informação. ERP, CRM, BI, Data mining, Data warehouse, ETL Gerenciamento de Dados e Conhecimento

Estratégias em Tecnologia da Informação. ERP, CRM, BI, Data mining, Data warehouse, ETL Gerenciamento de Dados e Conhecimento Estratégias em Tecnologia da Informação Capítulo 7 ERP, CRM, BI, Data mining, Data warehouse, ETL Gerenciamento de Dados e Conhecimento Material de apoio 2 Esclarecimentos Esse material é de apoio para

Leia mais

Data Warehouse - DW ADM. MARTÍN GLASS CRA/MT 4742

Data Warehouse - DW ADM. MARTÍN GLASS CRA/MT 4742 Data Warehouse - DW Data Warehouse (Armazém de Dados) é um depósito integrado de informações, disponíveis para análise e para a construção de filtros de busca; Centraliza informações localizadas em diferentes

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

Inteligência de Negócio. Brian Cowhig

Inteligência de Negócio. Brian Cowhig Inteligência de Negócio Brian Cowhig Inteligência de Negócio O Que é Inteligência de Negócio? Três Níveis de Inteligência de Negócio Database Query OLAP Data Mining Produtos de Inteligência de Negócio

Leia mais

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS

TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS TÉCNICAS DE INFORMÁTICA WILLIAN FERREIRA DOS SANTOS Vimos em nossas aulas anteriores: COMPUTADOR Tipos de computadores Hardware Hardware Processadores (CPU) Memória e armazenamento Dispositivos de E/S

Leia mais

Pós-Graduação em Engenharia Elétrica Inteligência Artificial

Pós-Graduação em Engenharia Elétrica Inteligência Artificial Pós-Graduação em Engenharia Elétrica Inteligência Artificial João Marques Salomão Rodrigo Varejão Andreão Inteligência Artificial Definição (Fonte: AAAI ): "the scientific understanding of the mechanisms

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais