Mineração de Dados: Conceitos e Aplicações

Tamanho: px
Começar a partir da página:

Download "Mineração de Dados: Conceitos e Aplicações"

Transcrição

1 UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS BACHARELADO EM SISTEMAS DE INFORMAÇÃO BRUNO ALISSON ELISEU DE ALMEIDA Mineração de Dados: Conceitos e Aplicações Anápolis Novembro, 2011

2 UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS BACHARELADO EM SISTEMAS DE INFORMAÇÃO BRUNO ALISSON ELISEU DE ALMEIDA Mineração de Dados: Conceitos e Aplicações Trabalho de Conclusão de Curso apresentado ao Departamento de Sistemas de Informação da Unidade Universitária de Ciências Exatas e Tecnológicas da Universidade Estadual de Goiás, como requisito parcial para obtenção do grau de Bacharel em Sistemas de Informação. Orientador: Prof. Esp. Ronaldo de Castro Del Fiaco Anápolis Novembro, 2011

3

4

5 FICHA CATALOGRÁFICA ALMEIDA, Bruno Alisson Eliseu de. Mineração de Dados: Conceitos e Aplicações. Anápolis, (UEG / UnUCET, Bacharelado em Sistemas de Informação, 2011). Monografia.Universidade Estadual de Goiás, Unidade Universitária de Ciências Exatas e Tecnológicas. Departamento de Sistemas de Informação. 1. Mineração de Dados 2. Data Mining REFERÊNCIA BIBLIOGRÁFICA ALMEIDA, Bruno Alisson Eliseu de. Mineração de Dados: Conceitos e Aplicações. Anápolis, p. Monografia Curso de Sistemas de Informação, UnUCET, Universidade Estadual de Goiás. CESSÃO DE DIREITOS NOME DO AUTOR: Bruno Alisson Eliseu de Almeida TÍTULO DO TRABALHO: Mineração de Dados: Conceitos e Aplicações GRAU/ANO: Graduação /2011. É concedida à Universidade Estadual de Goiás permissão para reproduzir cópias deste trabalho, emprestar ou vender tais cópias para propósitos acadêmicos e científicos. O autor reserva outros direitos de publicação e nenhuma parte deste trabalho pode ser reproduzida sem a autorização por escrito do autor. Bruno Alisson Eliseu de Almeida Rua T-65 N 360 Alta Vista Residencial Apto Setor Bela Vista CEP Goiânia GO Brasil

6 Dedico esse trabalho à minha mãe e meus irmãos que sempre me apoiaram e seguraram uma barra para que eu pudesse chegar até aqui. Dedico também esse trabalho em memória do meu pai que não me deixou desistir.

7 AGRADECIMENTOS Ao meu orientador Prof. Ronaldo, pelo constante apoio, incentivo, dedicação e amizade essenciais para o desenvolvimento deste trabalho e para o meu desenvolvimento como pesquisador. Aos meus colegas de turma pelo incentivo. chegado até aqui. Aos meus pais e irmãos por nunca me deixarem desistir e sem os quais não teria A todos, os meus sinceros agradecimentos.

8 LISTA DE ILUSTRAÇÕES Figura 1 - Pirâmide Mineração de Dados... 4 Figura 2 - Áreas Envolvidas na Mineração de Dados... 6 Figura 3 - Mineração de Dados... 6 Figura 4 - Árvore de Decisão... 9 Figura 5 - Redes Neurais Artificiais Figura 6 - Clusterização Figura 7 - Fases KDD Figura 8 - Matriz Curricular do Curso de Sistemas de Informação Figura 9 WEKA Tela Inicial Figura 10 WEKA Tela Explorer Figura 11 - WEKA - Arquivo ARFF Aberto Figura 12 - WEKA Tela de Classificação Figura 13 - WEKA - Escolha do Algorítmo Figura 14 - WEKA - Execução do Algorítmo Figura 15 - Resultado WEKA Figura 16 - Estrutura Árvore Weka Figura 17 - Árvore WEKA Figura 18 - Pôster Mineração de Dados: Conceitos e Aplicações... 46

9 LISTA DE TABELAS Tabela 1 - tb_weka Tabela 2 - Cronograma de atividades proposto no projeto do Trabalho de Conclusão de Curso44

10 LISTA DE ABREVIATURAS E SIGLAS Siglas UEG UnUCET DM KDD SGBD SQL ODBC OLAP FAPESP USP ICMC MIRVIsIM SI JVM Descrição Universidade Estadual de Goiás Unidade Universitária de Ciências Exatas e Tecnológicas Data Mining Knowledge Discovery in Databases Sistema Gerenciador de Bancos de Dados Structure Query Language Open Data Base Connectivity On-Line Analytical Processing Fundação de Amparo à Pesquiso do Estado de São Paulo Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Sigla em inglês para Mineração, indexação, recuperação e visualização de dados em sistemas de arquivamento de imagens médicas Sistemas de Informação Java Virtual Machine

11 RESUMO A quantidade e de dados gerados no mundo atualmente é muito grande, até mesmo dentro das empresas esses dados chegam a formar grandes bases de dados. A velocidade com que a informação circula, principalmente na Internet, também é muito grande. Apenas armazenar esses dados e utilizá-los em buscas simples não representa uma vantagem para as empresas. A Mineração de Dados surge então como solução para esse problema, possibilitando que sejam encontrados padrões nos dados que possibilitem que sejam tomadas novas ações que favoreçam a empresa. O trabalho descrito nesse projeto visa produzir material teórico necessário para que sejam compreendidos os conceitos de Mineração de Dados, suas técnicas e as vantagens que pode trazer para a organização. Palavras-chave: Mineração de Dados, KDD, dados, informação, conhecimento.

12 ABSTRACT The amount of data generated and the world today is very large, even within companies that data come to form large databases. The quickness with which information circulates, especially on the Internet, is also very large. Only store data and use them in simple searches do not represent an advantage for companies. Data Mining then arises as a solution to this problem, allowing them to be found in the data standards that enable new actions are taken to promote the company. The work described in this project aims at producing theoretical material needed to be understood that the concepts of Data Mining, its techniques and the advantages it can bring to the organization. Keywords: Data Mining, KDD, data, information, knowledge.

13 SUMÁRIO INTRODUÇÃO... 1 CAPÍTULO 1 REFERENCIAL TEÓRICO Mineração de Dados Histórico Definição Tarefas Desempenhadas Técnicas KDD Definição Fases do KDD APLICABILIDADE DA MINERAÇÃO DE DADOS Wal-Mart Vestibular PUC-RJ Bank of America A.C. Milan FAPESP CAPÍTULO 2 RELAÇÃO ENTRE A MÉDIA FINAL OBTIDAS NAS DISCIPLINAS DO CURSO DE SI DA UEG E O DESEMPENHO ACADÊMICO O Curso de Sistemas de Informação Base de Dados Proposta Etapas Seleção dos Dados Limpeza Transformação Mineração de Dados O formato de arquivo ARFF Escolha do Algorítmo Utilizando o WEKA Interpretação CONCLUSÃO / RECOMENDAÇÕES REFERÊNCIAS APÊNDICE I CRONOGRAMA DE ATIVIDADES DO TRABALHO DE CONCLUSÃO DE CURSO APÊNDICE II - PÔSTER APRESENTADO NO III SIMPÓSIO DE TECNOLOGIA DA INFORMAÇÃO E III SEMANA DE INICIAÇÃO CIENTÍFICA DO CURSO DE SISTEMAS DE INFORMAÇÃO UNUCET-UEG/

14 1 INTRODUÇÃO Atualmente, o volume de dados gerados em qualquer ambiente, seja ele corporativo, governamental, científico ou até mesmo na própria Internet é incrivelmente grande. A tendência é que esse volume de dados continue a crescer, principalmente pelo crescimento da utilização de dispositivos móveis e da automação cada vez maior das atividades das empresas. As organizações vêm constantemente buscando formas de agregar valor aos seus negócios e alcançar diferenciais com relação aos seus concorrentes em um mercado que se mostra cada vez mais competitivo. Nesse contexto, tanto os dados gerados internamente pela organização quanto os dados oriundos de fontes externas podem ajudar a promover essa vantagem competitiva que a organização busca. Nesse cenário, a Mineração de Dados pode representar um importante papel para a organização. A Mineração de Dados busca encontrar padrões ou tendências dentro de uma coleção de dados. Assim sendo, a Mineração de Dados pode identificar nos dados da organização padrões que dificilmente seriam observados de outra maneira. A Mineração de Dados pode encontrar padrões e tendências na base de dados da organização ajudando a identificar padrões no comportamento dos clientes, tendências de mercado, comportamento fraudulento e etc., informações essas que permitem às organizações a tomada de decisões estratégicas que podem representar uma vantagem competitiva para a instituição. A Mineração de Dados encontra padrões em bases de dados por meio da aplicação de algorítmos, a escolha do algorítmo depende do tipo dos dados que irão ser analisados e do resultado que se espera. Os dados também precisam ser trabalhados antes da aplicação dos algorítmos. As diferentes técnicas que podem ser aplicadas na Mineração de Dados serão descritas no decorrer deste trabalho. Mas a Mineração de Dados não pode ser tratada como um processo completo e isolado, na realidade, trata-se de uma etapa de um processo maior, o KDD (Knowledge Discovery In Databases, em português, Descoberta de Conhecimento em Bancos de Dados),

15 2 onde são executadas etapas antes e depois da Mineração de Dados para que possa ser extraída informação de interesse da organização. A Mineração de Dados corresponde à principal etapa do KDD, onde o algorítmo escolhido é aplicado na base de dados, mas existem etapas que devem ser executadas antes que o algorítmo possa ser aplicado e essas etapas fazem parte do KDD. Os dados onde a mineração de dados será aplicada precisam ser tratados para que o algorítmo possa ser aplicado. Mesmo não sendo o alvo de estudo deste trabalho, a ligação existente entre Mineração de Dados e KDD não permite que seja tratado de um ser mencionar o outro. Assim, as etapas que compreendem o KDD também serão tratados durante o projeto mas sem que haja um aprofundamento muito grande. Para a demonstração da Mineração de Dados será utilizado o WEKA (Waikato Environment Knowledge Analysis, em português, Ambiente Waikato de Análise de Conhecimento), software que começou a ser desenvolvido em 1993 usando Java, na Universidade de Waikato na Nova Zelândia. O WEKA consiste em uma coleção de algorítmos da área de Inteligência Artificial dedicada ao aprendizado de máquinas. A justificativa em cima da qual esse trabalho se baseia é o fato de que toda organização deseja agregar cada vez mais valor ao seu negócio e assim adquirir uma vantagem sobre a concorrência, e que toda organização, independente do porte, possui uma quantidade de dados razoável armazenados que podem ser explorados e transformados em informação valiosa para a empresa. O principal objetivo do trabalho é fornecer uma material teórico sobre Mineração de Dados, expondo das técnicas utilizadas, as formas como os dados podem ser transformados e os tipos de resultados que podem ser obtidos. Para que o trabalho não fique apenas na parte teórica e a aplicação da Mineração de Dados possa ser melhor observado, será realizado um estudo de caso para que possam ser demonstrados todos os passos que compreendem a Mineração de Dados e que são necessários para transformar dados em informação. Entre os passos que serão demonstrados no estudo de caso serão feitos passos do KDD, uma vez que a Mineração de Dados só compreende a aplicação dos algorítmos e não os

16 3 passos que precedem a execução dos algorítmos, etapas que são feitas no KDD e que são de extrema importância e que influenciam diretamente nos resultados da Mineração de Dados. Em nenhum momento deste trabalho será dito que uma técnica é melhor ou mais eficiente que outra, visto que o objetivo não é avaliar as técnicas e sim expos quais as técnicas disponíveis e quais resultados podem ser obtidos com cada uma delas.

17 4 CAPÍTULO 1 REFERENCIAL TEÓRICO Neste capítulo será exposto a Mineração de Dados, as técnicas de Mineração de Dados, o KDD e as técnicas de KDD. As vantagens que a utilização da Mineração de Dados pode proporcionar às organizações também serão apresentadas nesse capítulo. O objetivo deste é fornecer uma base de conhecimento sobre o assunto que será abordado durante todo o projeto, para que o objeto do estudo e os resultados da pesquisa possam ser comprendidos. 1.1 Mineração de Dados Figura 1 - Pirâmide Mineração de Dados Fonte: HALFEN, Histórico O termo Mineração de Dados não é novo, começou a ser utilizado por volta de 1960, onde seu objetivo principal era a coleção de dados em computadores, feitos em fitas e discos fornecidos pela IBM e CDC. Esses dados eram armazenados para que posteriormente fosse possível fazer a restrospectiva e a distribuição estática dos dados.

18 5 Na década de 1980, com a aprimoramento das tecnologias de acesso dinâmico aos dados, como os SGBD s (Sistema Gerenciador de Bancos de Dados), SQL (Structure Query Language, em português, Linguagem de Consulta Estruturada), ODBC (Open Data Base Connectivity, em português, Conectividade de Banco de Dados Livre) e bancos de dados relacionais, fornecidos principalmente por Oracle, Sybase, Infomix, IBM e Microsoft, a Mineração de Dados passou a ter como principal característica a retrospectiva e a distribuição dinâmica dos dados a nível de registro. Com o surgimento do data warehousing e do suporte à decisão, OLAP (On-Line Analytical Processing, ou em português, Processamento Analítico Online) e bancos de dados multidimensionais na década de 1990, tendo como principais fornecedores Pilot, Comshare, Arbor, Cognos e Microstrategy, possibilitaram uma nova evolução para a Mineração de Dados que passou a permitir a retrospectiva e a distribuição dinâmica dos dados em múltiplos níveis. Atualmente a Mineração de Dados é utilizada comercialmente na tentativa de prever resultados futuros através da análise dos dados, dispondo de algorítmos avançados, computadores multiprocessados e banco de dados massivos, a Mineração de Dados tem como principal objetivo a prospectiva e a distribuição de informação ativa. Os principais fornecedores são Pilot, Lockheed, IBM e SGI Definição Mineração de Dados é o termo usado para generalizar um conjunto de técnicas utilizadas para analisar e extrair informações de bases de dados, encontrando padrões nos dados que possam ser úteis para a organização. Praticamente não existe nenhuma área de conhecimento em que as técnicas de Mineração de Dados não possam ser aplicadas. A Mineração de Dados traz consigo uma série de idéias e técnicas para uma grande variedade de campos. A diferença entre as áreas de conhecimento está nos termos utilizados, mas todas usam diferentes técnicas para chegar ao mesmo resultado, a informação.

19 6 Figura 2 - Áreas Envolvidas na Mineração de Dados Fonte: (VIANA) Figura 3 - Mineração de Dados Fonte: O autor, adaptada de (MARTIN). O aumento das transações comerciais por meio eletrônico, em especial as feitas pela Internet, possibilitou às empresas armazenarem em suas bases de dados registros contendo preciosos dados sobre seus clientes. Os produtos adquiridos, e até mesmo os que foram apenas consultados, aliados aos dados exigidos no momento do cadastro formam o perfil do cliente.

20 7 O conhecimento do perfil do cliente possibilita oferecer um serviço mais personalizado. Os diversos sites de compra online se utilizam de técnicas de Mineração de Dados, por exemplo, no momento do cadastro o cliente determina suas áreas de interesse, a partir desse instante os s enviados a esse cliente passam a conter apenas ofertas voltadas para suas áreas de interesse. Outro exemplo acontece durante a própria navegação no site, ao buscar um produto são mostradas sugestões de produtos que também foram adquiridos por compradores anteriores juntamente com o produto buscado. Mesmo dispondo de ferramentas para automatizar o processo de Mineração de Dados, a participação de um profissional é indispensável uma vez que algumas das tarefas devem ser feitas manualmente, como a seleção dos dados ou a criação das regras, podendo influenciar nos resultados obtidos Tarefas Desempenhadas De acordo com a necessidade a Mineração de Dados pode realizar diferentes tarefas sobre os dados com a finalidade de melhor organizá-los. Associação: Consiste em determinar quais fatos ou objetos tendem a ocorrer num mesmo evento ou nume mesma transação. Exemplo: quais produtos costumam ser adquiridos numa mesma compra, sistomas parecidos entre pacientes. Classificação: Consiste em construir um modelo que possa ser aplicado a dados não classificados visando categorizar os objetos em classes. Exemplo: classificar pedidos de crédito; tratamento de pacientes. Predição/Previsão: A predição é usada para definir um provável valor para uma ou mais variáveis. A previsão é utilizada quando se tem séries temporais (dados organizados cronologicamente). Exemplo: estimar o tempo de vida de um paciente; estimar a renda total de uma família; demanda de consumidores para um novo produto. Agrupamentos ou Clusterização: É um processo de partição, que visa dividir uma população em subgrupos mais homogêneos entre si,

21 8 tornando a visualização por parte do usuário mais simples e compreensível. É diferente da tarefa de classificação, pois não existem classes predefinidas, os objetos são agrupados de acordo com a similaridade. Exemplo: agrupar clientes por região; agrupar clientes com comportamento de compra similar Técnicas Não existe uma técnica que resolva todos os problemas de Mineração de Dados. Existem diferentes técnicas para diferentes propósitos, a escolha da técnica a ser empregada está relacionada com o tipo de dado no que será aplicada. Árvores de Decisão Um problema complexo é dividido em problemas mais simples de serem resolvidos. É um modelo preditivo, visualizado em forma de árvore. Cada ramo da árvore é visto como um problema mais simples enquanto cada nó é visto como um subconjunto dos dados que resolvem esse problema.

22 9 Figura 4 - Árvore de Decisão Fonte: O autor, adaptada de (CARACIOLO, 2009). No exemplo acima, é mostrada uma árvore de decisão propícia a uma ação de marketing, baseando-se na idade, na renda e no estado civil do cliente é determinado se ele compraria ou não o produto. A partir de uma árvore de decisão é possível derivar regras que podem aplicadas aos dados. No caso do exemplo da Figura 4, é possível derivar a seguinte regra: caso o cliente tenha idade entre 18 e 35 anos ele não compra o produto, por outro lado, se ele tiver idade entre 36 e 55 anos e for solteiro ele comprará o produto. Regras de Indução A técnica de regras de indução é altamente automatizada e, possivelmente, é a melhor técnica de Mineração de Dados para expor todas as possibilidades de padrões existentes em um banco de dados (BERSON et. al., 1999). A regra de indução consiste em uma expressão condicional do tipo: se <condição> então <consequência>

23 10 Após a formação das regras, constrói-se uma tabela com o percentual de precisão (frequência com que a regra está correta) e cobertura (com que frequência pode ser usada). Quanto maior o percentual, melhor a regra. Redes Neurais Artificiais As redes neurais artificiais são técnicas que procuram reproduzir de maneira simplificada as conexões do sitema biológico neural. Estruturalmente, consistem em um conjunto de elementos interconectados, chamados neurônios, organizados em camadas que aprendem pela modificação de suas conexões. Tipicamente, tem-se uma camada de entrada ligada a uma ou mais camadas intermediárias que são ligadas a uma camada de saída (BERRY e LINOFF, 1997). A partir de um conjunto de treinamento, procura-se aprender padrões gerais que possam ser aplicados à classificação ou predição de dados. A função de cada neurônio é avaliar valores de entrada, calcular o total para valores de entrada combinados, comparar com um total limiar e determinar o valor de saída. Figura 5 - Redes Neurais Artificiais Fonte: (CARVALHO)

24 11 Uma rede neural é formada por uma ou mais camadas de entrada, n camadas intermediárias(dependendo da complexidade do problema e ser resolvido) e apenas uma camada de saída. A função básica de cada neurônio é avaliar os dados de entrada e calcular um valor para saída. As operações realizadas por cada neurônio são bastante simples, mas a conexão entre os neurônios é capaz de criar procedimentos complexos. Análise de Regressão Busca explicar uma ou várias variáveis de interesse em função de outras. Depois de ser construído o modelo (que é uma equação matemática), ele pode ser usado para realizar predições ou calcular probabilidades. Possui quatro passos: seleção das variáveis, diagnóstico para verificar se o modelo é adequado, aplicação de medidas remediadoras para quando as condições do modelo não são satisfeitas e validação do modelo. Clusterização Também chamada de segmentação dos dados ou análise de agrupamentos, consistem em agrupar dados em subconjuntos, esses subconjuntos são chamados clusters. Os objetos dentro de um mesmo cluster são mais semelhantes entre si do que qualquer objeto dentro de outro cluster. O algorítmo de clusterização identifica as relações entre os dados e gera uma série de clusters baseando-se nelas. Figura 6 - Clusterização Fonte: Microsoft

25 KDD Falar sobre Mineração de Dados sem mencionar o KDD é impossível, uma vez que estão intimamente ligados, a Mineração de Dados não é um processo isolado e é a principal fase do KDD. A diferença entre os dois é bem sensível, sendo tratados em alguns trabalhos como se fossem o mesmo processo, quando na verdade o KDD é um processo de transformação dos dados em informação e a Mineração de Dados consiste em encontrar padrões dentro de uma base de dados Definição Segundo FAYYAD et. al., KDD é o processo não trivial, de extração de informações implícitas, previamente desconhecidas e potencialmente úteis, a partir dos dados armazenados em um banco de dados. Resumindo, KDD é o processo de extração de informações de bases de dados que possam ser úteis aos usuários e que são mais difíceis de obter sem que os dados armazenados sejam trabalhados. O KDD compreende todo o ciclo que o dado percorre até virar conhecimento ou informação. O processo é interativo e iterativo. Interativo porque o usuário pode intervir e controlar o curso das atividades, iterativo por ser uma sequência finita de operações onde o resultado de cada uma é dependente do resultado das que a precedem.

26 13 Figura 7 - Fases KDD Fonte: O autor, adaptada de (FAYYAD et al. (1996)) Fases do KDD Seleção Esta é a primeira fase do processo. É escolho do conjunto de dados, pertencentes a um domínio, que farão partes da análise. A escolha dos dados fica a cargo de um especialista do domínio. A complexidade do processo se dá pelo fato de os dados poderem vir de fontes diferentes e em formatos diferentes. Possui impacto significante sobre a qualidade dos resultados do processo, uma vez que toda a análise será feita sobre os dados selecionados nesse passo. Pré-Processamento e Limpeza Nesta fase são realizadas tarefas que eliminem dados redundantes e inconsistentes, recuperem dados incompletos e avaliem possíveis dados discrepantes ao domínio (outliners). O auxílio do especialista do domínio é fundamental. São também utilizados métodos de redução ou transformação para diminuir o número de variáveis envolvidas no processo, visando melhorar o desempenho do algorítmo de análise. Dados Ausentes (Missing Values): Um problema comum nessa fase é a ausência de valores para determinadas variáveis, ou seja, registros com dados incompletos, seja por falha na seleção dos dados ou revisão. O tratamento destes casos se faz necessário para que os resultados da

27 14 Mineração sejam confiáveis. Existem três alternativas de solução: imputação, fazer a previsão dos dados ausentes e completá-los individualmente; substituir o valor faltante pela média aritmética da variável; excluir o registro. Dados Discrepantes (Outliners): São dados que possuem valores extremos, atípicos ou com características muito distintas dos demais registros. Normalmente são descartados da amostra, porém só deve ocorrer quando o dado representar erro de observação de medida ou problema similar. O dado deve ser analisado cuidadosamente antes da exclusão, pois embora seja atípico, pode representar um valor verdadeiro, apontando um comportamento não usual, uma tendência ou ação fraudulenta. Dados Derivados: Variáveis de uma população podem apresentar relacionamentos entre si. Se houver a necessidade de dados que não estejam disponíveis, é possivel obtê-los da transformação ou combinação de outros. Transformação Os dados necessitam ser armazenados e formatados adequadamente para que os algorítmos possam ser aplicados. É como encontrar computadores rodando diferentes SO s (Sistemas Operacionas) e diferentes SGBD s. Estes dados devem ser agrupados em um único repositório. Mineração de Dados Explicações detalhadas deste item se encontram no item 3.1 deste capítulo, uma vez que este é o assunto principal deste trabalho. Interpretação/Avaliação Esta fase deve ser feita em conjunto com um ou mais especialistas no assunto. O conhecimento adquirido através da Mineração de Dados deve ser interpretado e avaliado para que o resultado final seja obtido.

28 15 Caso o resultado não seja satisfatório, o processo pode retornar a qualquer uma das fases anteriores, o mais comum é modificar o conjunto de dados inicial ou trocar o algorítmo de Mineração de Dados. 1.3 APLICABILIDADE DA MINERAÇÃO DE DADOS Neste capítulo serão apresentados alguns exemplos reais da aplicação das técnicas de Mineração de Dados em diferentes organizações e em diferentes áreas de conhecimento para explicitando como a Mineração de Dados pode favorecer os negócios da empresa Wal-Mart Este é um dos mais famosos exemplos de Mineração de Dados. A rede americana de hipermercados Wal-Mart identificou que a venda de fraldas e cervejas aumentava nas noites de sexta-feira e traçou um perfil dos clientes que possuiam esse comportamento. Homens entre 25 e 30 anos, casados, que estavam voltando do trabalho na sexta-feira passavam no supermercado para comprar fraldas e acabavam comprando cerveja também. A ação tomada pela empresa foi relocar os produtos de modo que fraldas e cervejas passassem a ficar mais próximas e o resultado disso foi um aumento de 30% nas vendas Vestibular PUC-RJ A PUC-RJ utilizou a Mineração de Dados para analisar os dados de seu vestibular e encontrou a seguinte regra: se o candidato for do sexo feminino, trabalha e conseguiu boas notas no vestibular ele não efetuava a matrícula A justificativa encontrada para esse padrão de comportamento dos candidatos é que se uma mulher em idade de vestibular trabalha é por necessidade e nesse caso provavelmente fez inscrição em universidades públicas também. Se a candidata obteve boas

29 16 notas é também provável que tenho sido aprovada na instituição pública para a qual se inscreveu e portanto não efetuará sua matrícula na PUC-RJ. Com algumas excessões, como: candidatas que residiam próximo à unidade, pessoas mais velhas, de alto poder executivo, que voltaram a estudar por outro motivo que não seja obter uma profissão, etc., essa regra é obedecida pela maioria dos candidatos Bank of America O Bank of America utilizou técnicas de Mineração de Dados para selecionar entre seus clientes aqueles que apresentavam o menor risco de inadimplência em empréstimos. A partir dos resultados encontrados enviou cartas oferencendo limites de crédito aos seus clientes que possuiam filhos com idade entre 18 e 21 anos e que precisariam de dinheiro para comprar uma casa, o primeiro carro ou financiar a faculdade dos filhos. Como resultado dessa ação o banco teve um lucro de U$ 30 milhões em 3 anos A.C. Milan O clube de futebol italiano, Milan, iniciou em 2002 um projeto piloto que utilizava software para prever lesões em jogadores, uma vez que os jogadores representa o maior investimento do clube poder evitar tais lesões ou reduzir a gravidade delas e, consequentemente, tempo de recuperação dos atletas economizaria milhões de dólares aos cofres do clube. Através de um software desenvolvido pela Computer Associates, foram coletados dados nos treinamentos da equipe durante um período de tempo, permitindo que fossem feitas previsões médicas acumuladas de cada jogador possibilitando um melhor monitoramento do risco de lesões dos atletas FAPESP

30 17 Um projeto de pesquisa apoiado pela FAPESP gerou o protótipo de uma ferramenta de diagnósticos por imagem. O MIRVIsIM foi desenvolvido por um grupo coordenado pela professora Agma Juci Machado Traina, do ICMC da USP, em São Carlos. É comum o médico se lembrar de ter visto uma imagem parecida mas não se lembrar do diagnóstico do caso e analisar casos anteriores levaria muito tempo. A função do software é compara a imagem a ser analisada pelo radiologista com um banco de dados de outras já laudadas. Cor, posição e formato dos elementos retratados são utilizados como elementos a serem comparados. O especialista então recebe uma série de sugestões de diagnósticos levantados através da comparação das imagens.

31 18 CAPÍTULO 2 RELAÇÃO ENTRE A MÉDIA FINAL OBTIDAS NAS DISCIPLINAS DO CURSO DE SI DA UEG E O DESEMPENHO ACADÊMICO Neste capítulo será apresentado um exemplo da utilização da Mineração de Dados para obtenção de informação a partir de uma base de dados, descrevendos os passos utilizados e o resultado final. 2.1 O Curso de Sistemas de Informação O curso de Bacharelado em Sistemas de Informação começou a ser ofertado na UnUCET em fevereiro de 2002, em substituição ao curso de Tecnologia em Processamento de Dados, uma vez que o curso de Tecnologia em Processamento de Dados, criado em 1985, necessitava de algumas alterações e atualizações e o Ministério da Educação já havia feito orientações para que os cursos de natureza técnica fossem substituídos por outros da área de Computação e Informática. O objetivo do curso é formar profissionais para o desenvolvimento, implantação e gestão de sistemas de informação visando atender as demandas das organizações e da sociedade, utilizando as modernas técnicas da Tecnologia da Informação. A matriz curricular original do curso, de 2002, foi alterada em 2009, mas para este estudo ainda será utilizada a matriz curricular de 2002, visto que os dados utilizados compreendem o período de 2002 a 2007 e a nova matriz curricular só começou a entrar em vigar em 2009 e somente na 1ª série do curso.

32 19 Figura 8 - Matriz Curricular do Curso de Sistemas de Informação Da acordo com a matriz curricular de 2002 e que será utilizada neste estudo, o curso possui um tempo de integralização mínima de 4 e máximo de 7 anos, com um total de horas/aula, divididas no período noturno e com aulas aos sábados pela manhã nos 3 primeiros anos. A forma de ingresso é anual e são oferecidas um total de 40 vagas. Além das horas/aula que são cumpridas na universidade, o aluno também deve cumprir um total de 150 horas de atividades complementares, que podem incluir palestras, seminários, cursos, etc., como atividades para complementar e expandir os temas abordados em sala de aula e 360 horas de estágio supervisionado como forma de observar e aprender como é o dia a dia do profissional e como o conteúdo aprendido em sala pode ser aplicado na realidade.

33 20 A média necessária para que o aluno seja considerado aprovado em qualquer disciplina é 7 e o aluno também precisa ter o mínimo de 75% de presença na disciplina. A média final de cada disciplina é obtida da média aritmérica das notas obtidas nos 4 bimestres que compõem o ano letivo. Média = (nota 1º bimestre + nota 2º bimestre + nota 3º bimestre + nota 4º bimestre) / 4 Caso a média obtida pelo aluno na disciplina seja maior ou igual a 7, ele está aprovado na disciplina. Se o aluno obtiver média inferior a 3 na disciplina ele está reprovado. Caso a nota seja inferior a 7 e maior ou igual a 3, o aluno faz mais uma prova para obtenção de uma nova média. Média final = (média obtida + nota prova final) / 2 Caso a média obtida na prova final seja superior a 5 o alunos está aprovado, caso contrário o aluno está reprovado na disciplina. Em todos os casos o aluno precisa, obrigatoriamente, ter frequentado um mínimo de 75% das horas/aula ministradas, caso contrário estará reprovado independentemente da média que obtiver na disciplina. 2.2 Base de Dados A base de dados a ser utilizada é corresponde ao dados dos alunos do curso de Sistemas de Informação da UEG dos anos de 2002 a Proposta As propostas deste estudo de caso são estabelecer uma relação entre a média final obtidas nas disciplinas que compõem a grade curricular do curso e o desempenho acadêmico do aluno no decorrer do curso. A proposta pretende descobrir se as notas obtidas pelos alunos em certas disciplinas influencia no desempenho do aluno no decorrer do curso, ou seja, se esses alunos conseguiram concluir o curso no tempo mínimo exigido (4 anos).

34 Etapas Seleção dos Dados Primeiro foi feita a seleção dos dados que serão trabalhados na Mineração de Dados. Neste momento foi escolhida a base de dados de alunos do curso de SI dos anos de 2002 a A escolha da base de dados foi aleatória, já o período foi escolhido levando-se em conta as turmas que a primeira turma que ingressou (2002) e a última turma que se formou na universidade (2007), considerando-se que o curso possui 4 anos de duração mínima. A base de dados se encontra no formato ACCDB do Microsoft Access Limpeza com dados ausentes. Nesta etapa foi feita a limpeza da base de dados, retirando registros que estejam Transformação A base de dados precisa ser trabalhada antes que o algorítmo de mineração de dados possa ser aplicado. Neste momento, foram retirados dados que não são interessentes para a mineração de dados, como, endereço, cidade, estado, telefone, etc., e deixando apenas os dados que seriam relevantes ao estudo: notas das disciplinas, se o aluno completou o curso pleno (4 anos, sem reprovação em nenhuma disciplina). Os dados da base de dados também precisaram ser formatados para que não houvesse inconsistência nos dados. A base de dados em que será aplicada o algorítmo de Mineração de Dados ficou com a seguinte estrutura:

35 22 Tabela 1 - tb_weka Campo Tipo Descrição D1 Numércico Média final da disciplina de Álgebra D2 Numérico Média final da disciplina de Análise de Sistemas D3 Numérico Média final da disciplina de Arquitetura de Computadores D4 Numérico Média final da disciplina de Banco de Dados D5 Numérico Média final da disciplina de Cálculo Diferencial e Integral D6 Numérico Média final da disciplina de Conceitos de Inteligência Artificial D7 Numérico Média final da disciplina de Contabilidade e Economia para Computação D8 Numérico Média final da disciplina de Direito e Ética em Informática D9 Numérico Média final da disciplina de Eletricidade e Lógica Digital D10 Numérico Média final da disciplina de Empreendedorismo em Informática D11 Numérico Média final da disciplina de Engenharia de Software D12 Numérico Média final da disciplina de Inglês Instrumental D13 Numérico Média final da disciplina de Introdução à Computação

36 23 D14 Numérico Média final da disciplina de Linguagem e Técnicas de Programação D15 Numérico Média final da disciplina de Metodologia da Pesquisa Científica D16 Numérico Média final da disciplina de Novas Aplicações Em Sistemas de Informação D17 Numérico Média final da disciplina de O Profissional da Informática e a Sociedade D18 Numérico Média final da disciplina de Organização, Sistemas e Métodos D19 Numérico Média final da disciplina de Planejamento e Gestão de Sistemas de Informação D20 Numérico Média final da disciplina de Princípios de Sistemas de Informação e Teoria da Computação D21 Numérico Média final da disciplina de Probabilidade e Estatística D22 Numérico Média final da disciplina de Programação I D23 Numérico Média final da disciplina de Programação II D24 Numérico Média final da disciplina de Projeto de Graduação I D25 Numérico Média final da disciplina de Projeto de Graduação II D26 Numérico Média final da disciplina de Redes de Computadores Pleno Texto, S/N Indica se o aluno concluiu a universidade

37 24 no tempo mínimo(4 anos, sem reprovação) Fonte: O autor Mineração de Dados Como descrito anteriormente, para a demonstração do algorítmo de Mineração de Dados será utilizado o WEKA, mas o WEKA não é capaz de aplicar o algorítmo diretamente sobre uma base de dados do Microsoft Access, como é o caso da base que estamos utilizando. Portanto a tabela tb_weka precisa ser exportada para um arquivo no formato ARFF para que assim possa ser feita a leitura através do WEKA e o algorítmo seja aplicado O formato de arquivo ARFF O formato de arquivo ARFF (Attribute-Relation File Format), desenvolvido pela Machine Learning Project no Departamento de Ciência da Computação da Universidade de Waikato (mesma desenvolvedora do WEKA) para uso no WEKA, é um arquivo de texto ASCII que descreve uma lista de instâncias compartilhando um conjunto de atributos. dados: Por padrão, todo arquivo ARFF é dividido em 2 partes distintas, o cabeçalho e os Cabeçalho: o cabeçalho do arquivo ARFF contém o nome da relação e a declaração dos atributos. o o O nome da relação é definido na primeira linha do arquivo através da A declaração de atributos deve ser individualmente para cada atributo através da e define o nome e tipo do atributo. Os tipos de dados suportados pelo WEKA são 4, numérico, nominal, string e data: Numérico: os atributos podem ser numéros reais ou inteiros

38 25 Nominal: são definidos através de uma especificação nominal dos valores que o atributo pode assumir. Exemplo: {YES,NO}, {Y,N}, {A,B} String: são atributos que contém texto. Data: são atributos que representam uma data, utilizado o padrão ISO-8601 de formato de data e hora combinadas em uma string yyyy-mmdd't'hh:mm:ss Os dados do arquivo são definidos através da onde cada instância é representada em uma única linha e os atributos são separados por vírgula. Os valores que estiverem ausentes serão representados por um único ponto de interrogação (?). Todos os valores de atributos que possuirem espaços devem estar entre aspas duplas ( ) e para colocar comentários no arquivos utiliza-se a caracter percentagem (%) no início da linha. Assim sendo, o arquivo ARFF gerado ficou da seguinte forma: - Declaração da alunos - Declaração dos D1 D2 D3 D4 D5 D6 D7 D8 D9 real

39 D10 D11 D12 D13 D14 D15 D16 D17 D18 D19 D20 D21 D22 D23 D24 D25 D26 Pleno {S,N} - 6.6,6.7,5.3,6.1,7.25,7.3,7.4,7.1,7,7.5,5.1,7,7.7,7.7,7.2,8.1,7.2,7.9,7.5,9,7,8.15,7.2,7.2,8.1,7.7,S... Este é o exemplo de uma das várias linhas que a contém.

40 Escolha do Algorítmo Para a análise do arquivo ARFF foi escolhido o método de classificação e o algorítmo J48, em decorrência do escopo do trabalho e dos valores que compõem o arquivo ARFF. O método de classificação foi escolhido por atender as propostas feitas no início deste capítulo, ou seja, com o método de classificação pode-se prever se as notas em determinadas disciplinas influenciam podem dizer se o aluno concluirá o curso pleno ou não. O algorítmo J48 foi escolhido devido ao tipo dos dados que serão analisados. Segue abaixo uma explicação do funcionamento do algorítmo O algorítmo J48 constroi uma árvore de decisão. A forma de construção da árvore usa a abordagem top-down, em que o atibuto mais generalizado é considerado a raiz da árvore. A seguir, o próximo nó da árvore será o segundo atributo mais generalizado, e assim por diante até que seja encontrado o nó folha, que representa o atributo alvo Utilizando o WEKA A última versão do WEKA pode ser obtida em lembrando que por ter sido desenvolvido em Java, o WEKA precisa da JVM (Java Virtual Machine) instalada no computador onde será instalado. Atualmente o WEKA utiliza a JVM 1.6 e para evitar problemas durante a execução do programa, sugiro que seja escolhido o download do instalador que já venha com a JVM.

41 28 Figura 9 WEKA Tela Inicial Fonte: O autor Escolha a opção Explorer, e será apresentada a seguinte tela: Figura 10 WEKA Tela Explorer

42 29 Fonte: O autor Selecione a opção Open file... e navegue até a pasta onde se encontra o arquivo ARFF que deseja analisar. Após o arquivo ARFF ser aberto, algumas informações do arquivo já poderão ser observadas, como a quantidade de instâncias, o número de atributos, e informações sobre os próprios atributos individualmente como tipo de dado e os valores que esses atributos assumem. Figura 11 - WEKA - Arquivo ARFF Aberto Fonte: O autor A seguir clique na guia Classify e escolha o algorítmo que será aplicado, neste caso o algorítmo escolhido foi o J48 que se encontra na guia trees.

43 30 Figura 12 - WEKA Tela de Classificação Fonte: O autor

44 31 Figura 13 - WEKA - Escolha do Algorítmo Fonte: O autor O passo seguinte é escolher a opção Use training set em Test options, escolher qual o atributo será o nó folha da árvore e clicar em Start para que o WEKA começa a análise do arquivo ARFF e crie a árvore.

45 32 Figura 14 - WEKA - Execução do Algorítmo Fonte: O autor

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO:

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: Bacharelado em Sistemas de Informação DISCIPLINA: Fundamentos de Sistemas de Informação PROFESSOR: Paulo de Tarso Costa de Sousa TURMA: BSI 2B

Leia mais

MBA EM BUSINESS INTELLIGENCE

MBA EM BUSINESS INTELLIGENCE MBA EM BUSINESS INTELLIGENCE Como a sua empresa estrutura informações estratégicas? Como as decisões são tomadas? São considerados, dados, informações e tendências, de macroambientes? O quanto você conhece

Leia mais

Motivação: inundação de informação. Data warehouse. Inteligência computacional aplicada em finanças, comércio e indústria

Motivação: inundação de informação. Data warehouse. Inteligência computacional aplicada em finanças, comércio e indústria Programa de Especialização em Inteligência Computacional Motivação: inundação de informação Morrendo de sede por conhecimento em um oceano de dados Inteligência computacional aplicada em finanças, comércio

Leia mais

Sistema de pedidos para estabelecimentos de alimentação: QuickPed. Adailton Antonio Ribeiro

Sistema de pedidos para estabelecimentos de alimentação: QuickPed. Adailton Antonio Ribeiro 2011 Sistema de pedidos para estabelecimentos de alimentação: QuickPed Adailton Antonio Ribeiro UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS BACHARELADO EM SISTEMAS

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Inteligência de Negócio. Brian Cowhig

Inteligência de Negócio. Brian Cowhig Inteligência de Negócio Brian Cowhig Inteligência de Negócio O Que é Inteligência de Negócio? Três Níveis de Inteligência de Negócio Database Query OLAP Data Mining Produtos de Inteligência de Negócio

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento

Leia mais

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012 Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO

CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO FUNDAÇÃO UNIVERSIDADE DO TOCANTINS CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO Identificação do Curso Nome do Curso: Sistemas de Informação Titulação: Bacharelado Modalidade de ensino: Presencial

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução

2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução 2 Descoberta de Conhecimento em Bases de Dados 2.1. Introdução De acordo com [FAYY96], o conceito de descoberta de conhecimento em bases de dados pode ser resumido como o processo não-trivial de identificar

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

DESAFIO ETAPA 1 Passo 1

DESAFIO ETAPA 1 Passo 1 DESAFIO Um dos maiores avanços percebidos pela área de qualidade de software foi comprovar que a qualidade de um produto final (software) é uma consequência do processo pelo qual esse software foi desenvolvido.

Leia mais

Mineração de dados: um estudo de caso de concessão de crédito explorando o software Weka

Mineração de dados: um estudo de caso de concessão de crédito explorando o software Weka Mineração de dados: um estudo de caso de concessão de crédito explorando o software Weka Andreia Smiderle, Alessandra Marchiori de Oliveira Depto de Sistemas de Informação, Faculdade MATER DEI, 85501-030,

Leia mais

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1. O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar

Leia mais

CURSO DE SISTEMAS DE INFORMAÇÃO

CURSO DE SISTEMAS DE INFORMAÇÃO 1 CURSO DE SISTEMAS DE INFORMAÇÃO EMENTÁRIO DAS DISCIPLINAS 2011.1 BRUSQUE (SC) 2015 2 SUMÁRIO 1ª FASE... 4 01 ARQUITETURA DE COMPUTADORES... 4 02 FILOSOFIA... 4 03 FUNDAMENTOS MATEMÁTICOS PARA COMPUTAÇÃO...

Leia mais

Expanda suas Capacidades Analíticas

Expanda suas Capacidades Analíticas Módulos IBM SPSS Statistics Expanda suas Capacidades Analíticas Um guia resumido dos módulos para o IBM SPSS Statistics Base Destaques Existem vários produtos IBM SPSS para te ajudar em cada fase do projeto

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo

Unidade III PRINCÍPIOS DE SISTEMAS DE. Prof. Luís Rodolfo Unidade III PRINCÍPIOS DE SISTEMAS DE INFORMAÇÃO Prof. Luís Rodolfo Vantagens e desvantagens de uma rede para a organização Maior agilidade com o uso intenso de redes de computadores; Grandes interações

Leia mais

Sumário. Mineração de Dados aplicada à Gestão de Negócios. 1) Mineração de Dados

Sumário. Mineração de Dados aplicada à Gestão de Negócios. 1) Mineração de Dados Aula 1 Introdução -Mineração de Dados Prof. Dr. Sylvio Barbon Junior barbon@uel.br Sumário 1) Mineração de Dados 1) Atividades Relacionadas; 2) Desafios; 3) Exemplos de aplicativos; 4) Últimos assuntos;

Leia mais

Classificação Automática dos Usuários da Rede Social Acadêmica Scientia.Net

Classificação Automática dos Usuários da Rede Social Acadêmica Scientia.Net Classificação Automática dos Usuários da Rede Social Acadêmica Scientia.Net Vinícius Ponte Machado 1, Bruno Vicente Alves de Lima 2, Heloína Alves Arnaldo 3, Sanches Wendyl Ibiapina Araújo 4 Departamento

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

Palavras-Chaves: engenharia de requisitos, modelagem, UML.

Palavras-Chaves: engenharia de requisitos, modelagem, UML. APLICAÇÃO DA ENGENHARIA DE REQUISITOS PARA COMPREENSÃO DE DOMÍNIO DO PROBLEMA PARA SISTEMA DE CONTROLE COMERCIAL LEONARDO DE PAULA SANCHES Discente da AEMS Faculdades Integradas de Três Lagoas RENAN HENRIQUE

Leia mais

15 Conceitos de Bancos de Dados com o LibreOffice Base

15 Conceitos de Bancos de Dados com o LibreOffice Base Introdução a Informática - 1º semestre AULA 14 Prof. André Moraes Objetivos desta aula: Explorar as propriedades na criação de bancos de dados no LibreOffice Base; Criar e explorar tabelas; Criar e explorar

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS Acerca dos conceitos básicos de gerenciamento de projetos e considerando o PMBOK, julgue os itens a seguir. 51 No gerenciamento de um projeto, deve-se utilizar não apenas as ferramentas

Leia mais

Projeto Pedagógico do Bacharelado em Ciência da Computação. Comissão de Curso e NDE do BCC

Projeto Pedagógico do Bacharelado em Ciência da Computação. Comissão de Curso e NDE do BCC Projeto Pedagógico do Bacharelado em Ciência da Computação Comissão de Curso e NDE do BCC Fevereiro de 2015 Situação Legal do Curso Criação: Resolução CONSU no. 43, de 04/07/2007. Autorização: Portaria

Leia mais

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas 22 - Encontro Anual de Tecnologia da Informação Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas Elisa Maria Vissotto1, Adriane Barbosa Camargo2 1 Universidade Regional Integrada

Leia mais

Data Warehouse Mineração de Dados

Data Warehouse Mineração de Dados Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 18/12/2014 Data Warehouse Data Mining Big Data A mina de ouro debaixo dos bits 2 Data Warehouse: A Memória da Empresa

Leia mais

FACULDADE DE TALENTOS HUMANOS

FACULDADE DE TALENTOS HUMANOS FACULDADE DE TALENTOS HUMANOS PROJETO PEDAGÓGICO DO CURSO DE SISTEMAS DE INFORMAÇÃO UBERABA MG INSTITUTO EDUCACIONAL GUILHERME DORÇA PRESIDENTE: LUIZ HUMBERTO DORÇA FACULDADE DE TALENTOS HUMANOS DIRETOR

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

I. DO PROCESSO SELETIVO 1.1. O processo seletivo docente será composto de três etapas: homologação da inscrição, prova didática e entrevista.

I. DO PROCESSO SELETIVO 1.1. O processo seletivo docente será composto de três etapas: homologação da inscrição, prova didática e entrevista. Rua do Salete, 50, Barris - Salvador - Bahia. Tel: (71) 2108-8562 / 2108-8503 home page: www.cairu.br - E-mail: presidencia@fvc.br E D I T A L A FVC - Fundação Visconde de Cairu, informa a abertura das

Leia mais

3 Market Basket Analysis - MBA

3 Market Basket Analysis - MBA 2 Mineração de Dados 3 Market Basket Analysis - MBA Market basket analysis (MBA) ou, em português, análise da cesta de compras, é uma técnica de data mining que faz uso de regras de associação para identificar

Leia mais

SISTEMA DE INFORMAÇÃO EXECUTIVA UTILIZANDO DATA MINING BASEADO NA TÉCNICA ÁRVORE DE DECISÃO

SISTEMA DE INFORMAÇÃO EXECUTIVA UTILIZANDO DATA MINING BASEADO NA TÉCNICA ÁRVORE DE DECISÃO SISTEMA DE INFORMAÇÃO EXECUTIVA UTILIZANDO DATA MINING BASEADO NA TÉCNICA ÁRVORE DE DECISÃO OSCAR DALFOVO, M.A. dalfovo@furb.rct-sc.br Professor da Universidade Regional de Blumenau - FURB Professor do

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

MATRIZ CURRICULAR E DIMENSIONAMENTO DA CARGA HORÁRIA POR PERÍODO LETIVO (A CARGA HORÁRIA APRESENTADA NAS TABELAS REFEREM-SE À HORA AULA DE 50 MINUTOS)

MATRIZ CURRICULAR E DIMENSIONAMENTO DA CARGA HORÁRIA POR PERÍODO LETIVO (A CARGA HORÁRIA APRESENTADA NAS TABELAS REFEREM-SE À HORA AULA DE 50 MINUTOS) MATRIZ CURRICULAR E DIMENSIONAMENTO DA POR PERÍODO LETIVO (A APRESENTADA NAS TABELAS REFEREM-SE À HORA AULA DE 50 MINUTOS) PRIMEIRO SEMESTRE / 1 O ANO Leitura e Interpretação de Textos 2-40 Matemática

Leia mais

IC Inteligência Computacional Redes Neurais. Redes Neurais

IC Inteligência Computacional Redes Neurais. Redes Neurais Universidade Federal do Rio de Janeiro PÓS-GRADUAÇÃO / 2008-2 IC Inteligência Computacional Redes Neurais www.labic.nce.ufrj.br Antonio G. Thomé thome@nce.ufrj.br Redes Neurais São modelos computacionais

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Conceitos Básicos Introdução Banco de Dados I Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM Dados

Leia mais

UNIVERSIDADE CATÓLICA DE GOIÁS DEPARTAMENTO DE ENGENHARIA ENGENHARIA DE PRODUÇÃO MILLENA SILVA PAIVA ESTÁGIO SUPERVISIONADO EM ENGENHARIA DE PRODUÇÃO

UNIVERSIDADE CATÓLICA DE GOIÁS DEPARTAMENTO DE ENGENHARIA ENGENHARIA DE PRODUÇÃO MILLENA SILVA PAIVA ESTÁGIO SUPERVISIONADO EM ENGENHARIA DE PRODUÇÃO UNIVERSIDADE CATÓLICA DE GOIÁS DEPARTAMENTO DE ENGENHARIA ENGENHARIA DE PRODUÇÃO MILLENA SILVA PAIVA ESTÁGIO SUPERVISIONADO EM ENGENHARIA DE PRODUÇÃO GOIÂNIA 2015 2 UNIVERSIDADE CATÓLICA DE GOIÁS DEPARTAMENTO

Leia mais

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011 Banco de Dados Aula 1 - Prof. Bruno Moreno 16/08/2011 Roteiro Apresentação do professor e disciplina Definição de Banco de Dados Sistema de BD vs Tradicional Principais características de BD Natureza autodescritiva

Leia mais

Prof. Marcelo Machado Cunha www.marcelomachado.com mcelobr@yahoo.com.br

Prof. Marcelo Machado Cunha www.marcelomachado.com mcelobr@yahoo.com.br Prof. Marcelo Machado Cunha www.marcelomachado.com mcelobr@yahoo.com.br Ementa Introdução a Banco de Dados (Conceito, propriedades), Arquivos de dados x Bancos de dados, Profissionais de Banco de dados,

Leia mais

Identificação de Padrões em Registros de Doenças com Técnicas de Mineração de Dados

Identificação de Padrões em Registros de Doenças com Técnicas de Mineração de Dados Identificação de Padrões em Registros de Doenças com Técnicas de Mineração de Dados Resumo. Nas últimas décadas, tem aumentado à necessidade de um processo automatizado para a descoberta de informações

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Programa de Pós-graduação em Informática

Programa de Pós-graduação em Informática Resolução Nº 001/2007 Regula as atividades acadêmicas no Programa de Pós-graduação em Informática ART. 1º - Sobre o curso de nivelamento: 1º - O curso de nivelamento para os novos alunos selecionados no

Leia mais

Determinação dos Fatores Críticos na Análise de Desempenho de Alunos de Pósgraduação Utilizando Metodologia de Mineração de Dados

Determinação dos Fatores Críticos na Análise de Desempenho de Alunos de Pósgraduação Utilizando Metodologia de Mineração de Dados Resumo Determinação dos Fatores Críticos na Análise de Desempenho de Alunos de Pósgraduação Utilizando Metodologia de Mineração de Dados Autoria: Elizabeth de Oliveira Carpenter, Gerson Lachtermacher O

Leia mais

Licenciamento de Uso

Licenciamento de Uso Licenciamento de Uso Este documento é propriedade intelectual 2002 do Centro de Computação da Unicamp e distribuído sob os seguintes termos: 1. As apostilas publicadas pelo Centro de Computação da Unicamp

Leia mais

Data Warehouse - DW ADM. MARTÍN GLASS CRA/MT 4742

Data Warehouse - DW ADM. MARTÍN GLASS CRA/MT 4742 Data Warehouse - DW Data Warehouse (Armazém de Dados) é um depósito integrado de informações, disponíveis para análise e para a construção de filtros de busca; Centraliza informações localizadas em diferentes

Leia mais

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1

Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Estudo e Análise da Base de Dados do Portal Corporativo da Sexta Região da Polícia Militar com vista à aplicação de Técnicas de Mineração de Dados1 Rafaela Giroto, 10º módulo de Ciência da Computação,

Leia mais

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE RESUMO Fazer um bom levantamento e especificação de requisitos é algo primordial para quem trabalha com desenvolvimento de sistemas. Esse levantamento

Leia mais

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP 1 Data de entrega dos originais à redação em 15/03/2013 e recebido

Leia mais

A Utilização de Software Livre na Análise de QoS em Redes IP Utilizando Mineração de Dados

A Utilização de Software Livre na Análise de QoS em Redes IP Utilizando Mineração de Dados A Utilização de Software Livre na Análise de QoS em Redes IP Utilizando Mineração de Dados Maxwel Macedo Dias 1, Edson M.L.S. Ramos 2, Luiz Silva Filho 3, Roberto C. Betini 3 1 Faculdade de Informática

Leia mais

MBA EM BIG DATA (DATA SCIENCE)

MBA EM BIG DATA (DATA SCIENCE) MBA EM BIG DATA (DATA SCIENCE) Você já pensou que seu carro, seu celular, seu perfil nas redes sociais e até mesmo os sensores ao seu redor estão constantemente gerando dados? Segundo o IDC, em breve,

Leia mais

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES Kelton Costa; Patricia Ribeiro; Atair Camargo; Victor Rossi; Henrique Martins; Miguel Neves; Ricardo Fontes. kelton.costa@gmail.com; patriciabellin@yahoo.com.br;

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Unified Modeling Language UML - Notações

Unified Modeling Language UML - Notações Unified Modeling Language UML - Notações Prof. Ms. Elvio Gilberto da Silva elvio@fmr.edu.br UML Ponto de Vista É gerada com propósito geral de uma linguagem de modelagem visual usada para especificar,

Leia mais

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4

Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Sumário Capítulo 1 - A revolução dos dados, da informação e do conhecimento 1 B12 4 Capítulo 2 - Reputação corporativa e uma nova ordem empresarial 7 Inovação e virtualidade 9 Coopetição 10 Modelos plurais

Leia mais

Identificação rápida de gargalos Uma forma mais eficiente de realizar testes de carga. Um artigo técnico da Oracle Junho de 2009

Identificação rápida de gargalos Uma forma mais eficiente de realizar testes de carga. Um artigo técnico da Oracle Junho de 2009 Identificação rápida de gargalos Uma forma mais eficiente de realizar testes de carga Um artigo técnico da Oracle Junho de 2009 Identificação rápida de gargalos Uma forma mais eficiente de realizar testes

Leia mais

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Cruzeiro SP 2008 FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Projeto de trabalho de formatura como requisito

Leia mais

Curso: Bacharelado em Informática. Instituto de Ciências Matemáticas e de Computação

Curso: Bacharelado em Informática. Instituto de Ciências Matemáticas e de Computação Curso: Bacharelado em Informática Instituto de Ciências Matemáticas e de Computação Informações Básicas do Currículo Duração Ideal 8 semestres Mínima 6 semestres Máxima 14 semestres Carga Horária Aula

Leia mais

CENTRO UNIVERSITÁRIO FRANCISCANO CURSO DE PUBLICIDADE E PROPAGANDA REGULAMENTAÇÃO DOS PROJETOS EXPERIMENTAIS

CENTRO UNIVERSITÁRIO FRANCISCANO CURSO DE PUBLICIDADE E PROPAGANDA REGULAMENTAÇÃO DOS PROJETOS EXPERIMENTAIS 1 CENTRO UNIVERSITÁRIO FRANCISCANO CURSO DE PUBLICIDADE E PROPAGANDA REGULAMENTAÇÃO DOS PROJETOS EXPERIMENTAIS CAPÍTULO I DOS PROJETOS EXPERIMENTAIS EM PUBLICIDADE E PROPAGANDA Artigo 1º - Este regulamento

Leia mais

APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1.

APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1. APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1. SQUIZANI, Cleonice Schell 2 ; MORALES, Yuri 2 ; VIEIRA, Sylvio André Garcia 2 1 Trabalho de pesquisa - UNIFRA

Leia mais

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina SEMINC 2001 57 O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina MARIZA FERRO HUEI DIANA LEE UNIOESTE - Universidade Estadual do Oeste do Paraná CECE Centro de Engenharias e

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

Bloco Administrativo

Bloco Administrativo Bloco Administrativo BI Business Intelligence Objetivo O objetivo deste artigo é dar uma visão geral sobre o Módulo Business Intelligence, que se encontra no Bloco Administrativo. Todas informações aqui

Leia mais

Chapter 3. Análise de Negócios e Visualização de Dados

Chapter 3. Análise de Negócios e Visualização de Dados Chapter 3 Análise de Negócios e Visualização de Dados Objetivos de Aprendizado Descrever a análise de negócios (BA) e sua importância par as organizações Listar e descrever brevemente os principais métodos

Leia mais