Mineração de Dados: Conceitos e Aplicações

Tamanho: px
Começar a partir da página:

Download "Mineração de Dados: Conceitos e Aplicações"

Transcrição

1 UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS BACHARELADO EM SISTEMAS DE INFORMAÇÃO BRUNO ALISSON ELISEU DE ALMEIDA Mineração de Dados: Conceitos e Aplicações Anápolis Novembro, 2011

2 UNIVERSIDADE ESTADUAL DE GOIÁS UNIDADE UNIVERSITÁRIA DE CIÊNCIAS EXATAS E TECNOLÓGICAS BACHARELADO EM SISTEMAS DE INFORMAÇÃO BRUNO ALISSON ELISEU DE ALMEIDA Mineração de Dados: Conceitos e Aplicações Trabalho de Conclusão de Curso apresentado ao Departamento de Sistemas de Informação da Unidade Universitária de Ciências Exatas e Tecnológicas da Universidade Estadual de Goiás, como requisito parcial para obtenção do grau de Bacharel em Sistemas de Informação. Orientador: Prof. Esp. Ronaldo de Castro Del Fiaco Anápolis Novembro, 2011

3

4

5 FICHA CATALOGRÁFICA ALMEIDA, Bruno Alisson Eliseu de. Mineração de Dados: Conceitos e Aplicações. Anápolis, (UEG / UnUCET, Bacharelado em Sistemas de Informação, 2011). Monografia.Universidade Estadual de Goiás, Unidade Universitária de Ciências Exatas e Tecnológicas. Departamento de Sistemas de Informação. 1. Mineração de Dados 2. Data Mining REFERÊNCIA BIBLIOGRÁFICA ALMEIDA, Bruno Alisson Eliseu de. Mineração de Dados: Conceitos e Aplicações. Anápolis, p. Monografia Curso de Sistemas de Informação, UnUCET, Universidade Estadual de Goiás. CESSÃO DE DIREITOS NOME DO AUTOR: Bruno Alisson Eliseu de Almeida TÍTULO DO TRABALHO: Mineração de Dados: Conceitos e Aplicações GRAU/ANO: Graduação /2011. É concedida à Universidade Estadual de Goiás permissão para reproduzir cópias deste trabalho, emprestar ou vender tais cópias para propósitos acadêmicos e científicos. O autor reserva outros direitos de publicação e nenhuma parte deste trabalho pode ser reproduzida sem a autorização por escrito do autor. Bruno Alisson Eliseu de Almeida Rua T-65 N 360 Alta Vista Residencial Apto Setor Bela Vista CEP Goiânia GO Brasil

6 Dedico esse trabalho à minha mãe e meus irmãos que sempre me apoiaram e seguraram uma barra para que eu pudesse chegar até aqui. Dedico também esse trabalho em memória do meu pai que não me deixou desistir.

7 AGRADECIMENTOS Ao meu orientador Prof. Ronaldo, pelo constante apoio, incentivo, dedicação e amizade essenciais para o desenvolvimento deste trabalho e para o meu desenvolvimento como pesquisador. Aos meus colegas de turma pelo incentivo. chegado até aqui. Aos meus pais e irmãos por nunca me deixarem desistir e sem os quais não teria A todos, os meus sinceros agradecimentos.

8 LISTA DE ILUSTRAÇÕES Figura 1 - Pirâmide Mineração de Dados... 4 Figura 2 - Áreas Envolvidas na Mineração de Dados... 6 Figura 3 - Mineração de Dados... 6 Figura 4 - Árvore de Decisão... 9 Figura 5 - Redes Neurais Artificiais Figura 6 - Clusterização Figura 7 - Fases KDD Figura 8 - Matriz Curricular do Curso de Sistemas de Informação Figura 9 WEKA Tela Inicial Figura 10 WEKA Tela Explorer Figura 11 - WEKA - Arquivo ARFF Aberto Figura 12 - WEKA Tela de Classificação Figura 13 - WEKA - Escolha do Algorítmo Figura 14 - WEKA - Execução do Algorítmo Figura 15 - Resultado WEKA Figura 16 - Estrutura Árvore Weka Figura 17 - Árvore WEKA Figura 18 - Pôster Mineração de Dados: Conceitos e Aplicações... 46

9 LISTA DE TABELAS Tabela 1 - tb_weka Tabela 2 - Cronograma de atividades proposto no projeto do Trabalho de Conclusão de Curso44

10 LISTA DE ABREVIATURAS E SIGLAS Siglas UEG UnUCET DM KDD SGBD SQL ODBC OLAP FAPESP USP ICMC MIRVIsIM SI JVM Descrição Universidade Estadual de Goiás Unidade Universitária de Ciências Exatas e Tecnológicas Data Mining Knowledge Discovery in Databases Sistema Gerenciador de Bancos de Dados Structure Query Language Open Data Base Connectivity On-Line Analytical Processing Fundação de Amparo à Pesquiso do Estado de São Paulo Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Sigla em inglês para Mineração, indexação, recuperação e visualização de dados em sistemas de arquivamento de imagens médicas Sistemas de Informação Java Virtual Machine

11 RESUMO A quantidade e de dados gerados no mundo atualmente é muito grande, até mesmo dentro das empresas esses dados chegam a formar grandes bases de dados. A velocidade com que a informação circula, principalmente na Internet, também é muito grande. Apenas armazenar esses dados e utilizá-los em buscas simples não representa uma vantagem para as empresas. A Mineração de Dados surge então como solução para esse problema, possibilitando que sejam encontrados padrões nos dados que possibilitem que sejam tomadas novas ações que favoreçam a empresa. O trabalho descrito nesse projeto visa produzir material teórico necessário para que sejam compreendidos os conceitos de Mineração de Dados, suas técnicas e as vantagens que pode trazer para a organização. Palavras-chave: Mineração de Dados, KDD, dados, informação, conhecimento.

12 ABSTRACT The amount of data generated and the world today is very large, even within companies that data come to form large databases. The quickness with which information circulates, especially on the Internet, is also very large. Only store data and use them in simple searches do not represent an advantage for companies. Data Mining then arises as a solution to this problem, allowing them to be found in the data standards that enable new actions are taken to promote the company. The work described in this project aims at producing theoretical material needed to be understood that the concepts of Data Mining, its techniques and the advantages it can bring to the organization. Keywords: Data Mining, KDD, data, information, knowledge.

13 SUMÁRIO INTRODUÇÃO... 1 CAPÍTULO 1 REFERENCIAL TEÓRICO Mineração de Dados Histórico Definição Tarefas Desempenhadas Técnicas KDD Definição Fases do KDD APLICABILIDADE DA MINERAÇÃO DE DADOS Wal-Mart Vestibular PUC-RJ Bank of America A.C. Milan FAPESP CAPÍTULO 2 RELAÇÃO ENTRE A MÉDIA FINAL OBTIDAS NAS DISCIPLINAS DO CURSO DE SI DA UEG E O DESEMPENHO ACADÊMICO O Curso de Sistemas de Informação Base de Dados Proposta Etapas Seleção dos Dados Limpeza Transformação Mineração de Dados O formato de arquivo ARFF Escolha do Algorítmo Utilizando o WEKA Interpretação CONCLUSÃO / RECOMENDAÇÕES REFERÊNCIAS APÊNDICE I CRONOGRAMA DE ATIVIDADES DO TRABALHO DE CONCLUSÃO DE CURSO APÊNDICE II - PÔSTER APRESENTADO NO III SIMPÓSIO DE TECNOLOGIA DA INFORMAÇÃO E III SEMANA DE INICIAÇÃO CIENTÍFICA DO CURSO DE SISTEMAS DE INFORMAÇÃO UNUCET-UEG/

14 1 INTRODUÇÃO Atualmente, o volume de dados gerados em qualquer ambiente, seja ele corporativo, governamental, científico ou até mesmo na própria Internet é incrivelmente grande. A tendência é que esse volume de dados continue a crescer, principalmente pelo crescimento da utilização de dispositivos móveis e da automação cada vez maior das atividades das empresas. As organizações vêm constantemente buscando formas de agregar valor aos seus negócios e alcançar diferenciais com relação aos seus concorrentes em um mercado que se mostra cada vez mais competitivo. Nesse contexto, tanto os dados gerados internamente pela organização quanto os dados oriundos de fontes externas podem ajudar a promover essa vantagem competitiva que a organização busca. Nesse cenário, a Mineração de Dados pode representar um importante papel para a organização. A Mineração de Dados busca encontrar padrões ou tendências dentro de uma coleção de dados. Assim sendo, a Mineração de Dados pode identificar nos dados da organização padrões que dificilmente seriam observados de outra maneira. A Mineração de Dados pode encontrar padrões e tendências na base de dados da organização ajudando a identificar padrões no comportamento dos clientes, tendências de mercado, comportamento fraudulento e etc., informações essas que permitem às organizações a tomada de decisões estratégicas que podem representar uma vantagem competitiva para a instituição. A Mineração de Dados encontra padrões em bases de dados por meio da aplicação de algorítmos, a escolha do algorítmo depende do tipo dos dados que irão ser analisados e do resultado que se espera. Os dados também precisam ser trabalhados antes da aplicação dos algorítmos. As diferentes técnicas que podem ser aplicadas na Mineração de Dados serão descritas no decorrer deste trabalho. Mas a Mineração de Dados não pode ser tratada como um processo completo e isolado, na realidade, trata-se de uma etapa de um processo maior, o KDD (Knowledge Discovery In Databases, em português, Descoberta de Conhecimento em Bancos de Dados),

15 2 onde são executadas etapas antes e depois da Mineração de Dados para que possa ser extraída informação de interesse da organização. A Mineração de Dados corresponde à principal etapa do KDD, onde o algorítmo escolhido é aplicado na base de dados, mas existem etapas que devem ser executadas antes que o algorítmo possa ser aplicado e essas etapas fazem parte do KDD. Os dados onde a mineração de dados será aplicada precisam ser tratados para que o algorítmo possa ser aplicado. Mesmo não sendo o alvo de estudo deste trabalho, a ligação existente entre Mineração de Dados e KDD não permite que seja tratado de um ser mencionar o outro. Assim, as etapas que compreendem o KDD também serão tratados durante o projeto mas sem que haja um aprofundamento muito grande. Para a demonstração da Mineração de Dados será utilizado o WEKA (Waikato Environment Knowledge Analysis, em português, Ambiente Waikato de Análise de Conhecimento), software que começou a ser desenvolvido em 1993 usando Java, na Universidade de Waikato na Nova Zelândia. O WEKA consiste em uma coleção de algorítmos da área de Inteligência Artificial dedicada ao aprendizado de máquinas. A justificativa em cima da qual esse trabalho se baseia é o fato de que toda organização deseja agregar cada vez mais valor ao seu negócio e assim adquirir uma vantagem sobre a concorrência, e que toda organização, independente do porte, possui uma quantidade de dados razoável armazenados que podem ser explorados e transformados em informação valiosa para a empresa. O principal objetivo do trabalho é fornecer uma material teórico sobre Mineração de Dados, expondo das técnicas utilizadas, as formas como os dados podem ser transformados e os tipos de resultados que podem ser obtidos. Para que o trabalho não fique apenas na parte teórica e a aplicação da Mineração de Dados possa ser melhor observado, será realizado um estudo de caso para que possam ser demonstrados todos os passos que compreendem a Mineração de Dados e que são necessários para transformar dados em informação. Entre os passos que serão demonstrados no estudo de caso serão feitos passos do KDD, uma vez que a Mineração de Dados só compreende a aplicação dos algorítmos e não os

16 3 passos que precedem a execução dos algorítmos, etapas que são feitas no KDD e que são de extrema importância e que influenciam diretamente nos resultados da Mineração de Dados. Em nenhum momento deste trabalho será dito que uma técnica é melhor ou mais eficiente que outra, visto que o objetivo não é avaliar as técnicas e sim expos quais as técnicas disponíveis e quais resultados podem ser obtidos com cada uma delas.

17 4 CAPÍTULO 1 REFERENCIAL TEÓRICO Neste capítulo será exposto a Mineração de Dados, as técnicas de Mineração de Dados, o KDD e as técnicas de KDD. As vantagens que a utilização da Mineração de Dados pode proporcionar às organizações também serão apresentadas nesse capítulo. O objetivo deste é fornecer uma base de conhecimento sobre o assunto que será abordado durante todo o projeto, para que o objeto do estudo e os resultados da pesquisa possam ser comprendidos. 1.1 Mineração de Dados Figura 1 - Pirâmide Mineração de Dados Fonte: HALFEN, Histórico O termo Mineração de Dados não é novo, começou a ser utilizado por volta de 1960, onde seu objetivo principal era a coleção de dados em computadores, feitos em fitas e discos fornecidos pela IBM e CDC. Esses dados eram armazenados para que posteriormente fosse possível fazer a restrospectiva e a distribuição estática dos dados.

18 5 Na década de 1980, com a aprimoramento das tecnologias de acesso dinâmico aos dados, como os SGBD s (Sistema Gerenciador de Bancos de Dados), SQL (Structure Query Language, em português, Linguagem de Consulta Estruturada), ODBC (Open Data Base Connectivity, em português, Conectividade de Banco de Dados Livre) e bancos de dados relacionais, fornecidos principalmente por Oracle, Sybase, Infomix, IBM e Microsoft, a Mineração de Dados passou a ter como principal característica a retrospectiva e a distribuição dinâmica dos dados a nível de registro. Com o surgimento do data warehousing e do suporte à decisão, OLAP (On-Line Analytical Processing, ou em português, Processamento Analítico Online) e bancos de dados multidimensionais na década de 1990, tendo como principais fornecedores Pilot, Comshare, Arbor, Cognos e Microstrategy, possibilitaram uma nova evolução para a Mineração de Dados que passou a permitir a retrospectiva e a distribuição dinâmica dos dados em múltiplos níveis. Atualmente a Mineração de Dados é utilizada comercialmente na tentativa de prever resultados futuros através da análise dos dados, dispondo de algorítmos avançados, computadores multiprocessados e banco de dados massivos, a Mineração de Dados tem como principal objetivo a prospectiva e a distribuição de informação ativa. Os principais fornecedores são Pilot, Lockheed, IBM e SGI Definição Mineração de Dados é o termo usado para generalizar um conjunto de técnicas utilizadas para analisar e extrair informações de bases de dados, encontrando padrões nos dados que possam ser úteis para a organização. Praticamente não existe nenhuma área de conhecimento em que as técnicas de Mineração de Dados não possam ser aplicadas. A Mineração de Dados traz consigo uma série de idéias e técnicas para uma grande variedade de campos. A diferença entre as áreas de conhecimento está nos termos utilizados, mas todas usam diferentes técnicas para chegar ao mesmo resultado, a informação.

19 6 Figura 2 - Áreas Envolvidas na Mineração de Dados Fonte: (VIANA) Figura 3 - Mineração de Dados Fonte: O autor, adaptada de (MARTIN). O aumento das transações comerciais por meio eletrônico, em especial as feitas pela Internet, possibilitou às empresas armazenarem em suas bases de dados registros contendo preciosos dados sobre seus clientes. Os produtos adquiridos, e até mesmo os que foram apenas consultados, aliados aos dados exigidos no momento do cadastro formam o perfil do cliente.

20 7 O conhecimento do perfil do cliente possibilita oferecer um serviço mais personalizado. Os diversos sites de compra online se utilizam de técnicas de Mineração de Dados, por exemplo, no momento do cadastro o cliente determina suas áreas de interesse, a partir desse instante os s enviados a esse cliente passam a conter apenas ofertas voltadas para suas áreas de interesse. Outro exemplo acontece durante a própria navegação no site, ao buscar um produto são mostradas sugestões de produtos que também foram adquiridos por compradores anteriores juntamente com o produto buscado. Mesmo dispondo de ferramentas para automatizar o processo de Mineração de Dados, a participação de um profissional é indispensável uma vez que algumas das tarefas devem ser feitas manualmente, como a seleção dos dados ou a criação das regras, podendo influenciar nos resultados obtidos Tarefas Desempenhadas De acordo com a necessidade a Mineração de Dados pode realizar diferentes tarefas sobre os dados com a finalidade de melhor organizá-los. Associação: Consiste em determinar quais fatos ou objetos tendem a ocorrer num mesmo evento ou nume mesma transação. Exemplo: quais produtos costumam ser adquiridos numa mesma compra, sistomas parecidos entre pacientes. Classificação: Consiste em construir um modelo que possa ser aplicado a dados não classificados visando categorizar os objetos em classes. Exemplo: classificar pedidos de crédito; tratamento de pacientes. Predição/Previsão: A predição é usada para definir um provável valor para uma ou mais variáveis. A previsão é utilizada quando se tem séries temporais (dados organizados cronologicamente). Exemplo: estimar o tempo de vida de um paciente; estimar a renda total de uma família; demanda de consumidores para um novo produto. Agrupamentos ou Clusterização: É um processo de partição, que visa dividir uma população em subgrupos mais homogêneos entre si,

21 8 tornando a visualização por parte do usuário mais simples e compreensível. É diferente da tarefa de classificação, pois não existem classes predefinidas, os objetos são agrupados de acordo com a similaridade. Exemplo: agrupar clientes por região; agrupar clientes com comportamento de compra similar Técnicas Não existe uma técnica que resolva todos os problemas de Mineração de Dados. Existem diferentes técnicas para diferentes propósitos, a escolha da técnica a ser empregada está relacionada com o tipo de dado no que será aplicada. Árvores de Decisão Um problema complexo é dividido em problemas mais simples de serem resolvidos. É um modelo preditivo, visualizado em forma de árvore. Cada ramo da árvore é visto como um problema mais simples enquanto cada nó é visto como um subconjunto dos dados que resolvem esse problema.

22 9 Figura 4 - Árvore de Decisão Fonte: O autor, adaptada de (CARACIOLO, 2009). No exemplo acima, é mostrada uma árvore de decisão propícia a uma ação de marketing, baseando-se na idade, na renda e no estado civil do cliente é determinado se ele compraria ou não o produto. A partir de uma árvore de decisão é possível derivar regras que podem aplicadas aos dados. No caso do exemplo da Figura 4, é possível derivar a seguinte regra: caso o cliente tenha idade entre 18 e 35 anos ele não compra o produto, por outro lado, se ele tiver idade entre 36 e 55 anos e for solteiro ele comprará o produto. Regras de Indução A técnica de regras de indução é altamente automatizada e, possivelmente, é a melhor técnica de Mineração de Dados para expor todas as possibilidades de padrões existentes em um banco de dados (BERSON et. al., 1999). A regra de indução consiste em uma expressão condicional do tipo: se <condição> então <consequência>

23 10 Após a formação das regras, constrói-se uma tabela com o percentual de precisão (frequência com que a regra está correta) e cobertura (com que frequência pode ser usada). Quanto maior o percentual, melhor a regra. Redes Neurais Artificiais As redes neurais artificiais são técnicas que procuram reproduzir de maneira simplificada as conexões do sitema biológico neural. Estruturalmente, consistem em um conjunto de elementos interconectados, chamados neurônios, organizados em camadas que aprendem pela modificação de suas conexões. Tipicamente, tem-se uma camada de entrada ligada a uma ou mais camadas intermediárias que são ligadas a uma camada de saída (BERRY e LINOFF, 1997). A partir de um conjunto de treinamento, procura-se aprender padrões gerais que possam ser aplicados à classificação ou predição de dados. A função de cada neurônio é avaliar valores de entrada, calcular o total para valores de entrada combinados, comparar com um total limiar e determinar o valor de saída. Figura 5 - Redes Neurais Artificiais Fonte: (CARVALHO)

24 11 Uma rede neural é formada por uma ou mais camadas de entrada, n camadas intermediárias(dependendo da complexidade do problema e ser resolvido) e apenas uma camada de saída. A função básica de cada neurônio é avaliar os dados de entrada e calcular um valor para saída. As operações realizadas por cada neurônio são bastante simples, mas a conexão entre os neurônios é capaz de criar procedimentos complexos. Análise de Regressão Busca explicar uma ou várias variáveis de interesse em função de outras. Depois de ser construído o modelo (que é uma equação matemática), ele pode ser usado para realizar predições ou calcular probabilidades. Possui quatro passos: seleção das variáveis, diagnóstico para verificar se o modelo é adequado, aplicação de medidas remediadoras para quando as condições do modelo não são satisfeitas e validação do modelo. Clusterização Também chamada de segmentação dos dados ou análise de agrupamentos, consistem em agrupar dados em subconjuntos, esses subconjuntos são chamados clusters. Os objetos dentro de um mesmo cluster são mais semelhantes entre si do que qualquer objeto dentro de outro cluster. O algorítmo de clusterização identifica as relações entre os dados e gera uma série de clusters baseando-se nelas. Figura 6 - Clusterização Fonte: Microsoft

25 KDD Falar sobre Mineração de Dados sem mencionar o KDD é impossível, uma vez que estão intimamente ligados, a Mineração de Dados não é um processo isolado e é a principal fase do KDD. A diferença entre os dois é bem sensível, sendo tratados em alguns trabalhos como se fossem o mesmo processo, quando na verdade o KDD é um processo de transformação dos dados em informação e a Mineração de Dados consiste em encontrar padrões dentro de uma base de dados Definição Segundo FAYYAD et. al., KDD é o processo não trivial, de extração de informações implícitas, previamente desconhecidas e potencialmente úteis, a partir dos dados armazenados em um banco de dados. Resumindo, KDD é o processo de extração de informações de bases de dados que possam ser úteis aos usuários e que são mais difíceis de obter sem que os dados armazenados sejam trabalhados. O KDD compreende todo o ciclo que o dado percorre até virar conhecimento ou informação. O processo é interativo e iterativo. Interativo porque o usuário pode intervir e controlar o curso das atividades, iterativo por ser uma sequência finita de operações onde o resultado de cada uma é dependente do resultado das que a precedem.

26 13 Figura 7 - Fases KDD Fonte: O autor, adaptada de (FAYYAD et al. (1996)) Fases do KDD Seleção Esta é a primeira fase do processo. É escolho do conjunto de dados, pertencentes a um domínio, que farão partes da análise. A escolha dos dados fica a cargo de um especialista do domínio. A complexidade do processo se dá pelo fato de os dados poderem vir de fontes diferentes e em formatos diferentes. Possui impacto significante sobre a qualidade dos resultados do processo, uma vez que toda a análise será feita sobre os dados selecionados nesse passo. Pré-Processamento e Limpeza Nesta fase são realizadas tarefas que eliminem dados redundantes e inconsistentes, recuperem dados incompletos e avaliem possíveis dados discrepantes ao domínio (outliners). O auxílio do especialista do domínio é fundamental. São também utilizados métodos de redução ou transformação para diminuir o número de variáveis envolvidas no processo, visando melhorar o desempenho do algorítmo de análise. Dados Ausentes (Missing Values): Um problema comum nessa fase é a ausência de valores para determinadas variáveis, ou seja, registros com dados incompletos, seja por falha na seleção dos dados ou revisão. O tratamento destes casos se faz necessário para que os resultados da

27 14 Mineração sejam confiáveis. Existem três alternativas de solução: imputação, fazer a previsão dos dados ausentes e completá-los individualmente; substituir o valor faltante pela média aritmética da variável; excluir o registro. Dados Discrepantes (Outliners): São dados que possuem valores extremos, atípicos ou com características muito distintas dos demais registros. Normalmente são descartados da amostra, porém só deve ocorrer quando o dado representar erro de observação de medida ou problema similar. O dado deve ser analisado cuidadosamente antes da exclusão, pois embora seja atípico, pode representar um valor verdadeiro, apontando um comportamento não usual, uma tendência ou ação fraudulenta. Dados Derivados: Variáveis de uma população podem apresentar relacionamentos entre si. Se houver a necessidade de dados que não estejam disponíveis, é possivel obtê-los da transformação ou combinação de outros. Transformação Os dados necessitam ser armazenados e formatados adequadamente para que os algorítmos possam ser aplicados. É como encontrar computadores rodando diferentes SO s (Sistemas Operacionas) e diferentes SGBD s. Estes dados devem ser agrupados em um único repositório. Mineração de Dados Explicações detalhadas deste item se encontram no item 3.1 deste capítulo, uma vez que este é o assunto principal deste trabalho. Interpretação/Avaliação Esta fase deve ser feita em conjunto com um ou mais especialistas no assunto. O conhecimento adquirido através da Mineração de Dados deve ser interpretado e avaliado para que o resultado final seja obtido.

28 15 Caso o resultado não seja satisfatório, o processo pode retornar a qualquer uma das fases anteriores, o mais comum é modificar o conjunto de dados inicial ou trocar o algorítmo de Mineração de Dados. 1.3 APLICABILIDADE DA MINERAÇÃO DE DADOS Neste capítulo serão apresentados alguns exemplos reais da aplicação das técnicas de Mineração de Dados em diferentes organizações e em diferentes áreas de conhecimento para explicitando como a Mineração de Dados pode favorecer os negócios da empresa Wal-Mart Este é um dos mais famosos exemplos de Mineração de Dados. A rede americana de hipermercados Wal-Mart identificou que a venda de fraldas e cervejas aumentava nas noites de sexta-feira e traçou um perfil dos clientes que possuiam esse comportamento. Homens entre 25 e 30 anos, casados, que estavam voltando do trabalho na sexta-feira passavam no supermercado para comprar fraldas e acabavam comprando cerveja também. A ação tomada pela empresa foi relocar os produtos de modo que fraldas e cervejas passassem a ficar mais próximas e o resultado disso foi um aumento de 30% nas vendas Vestibular PUC-RJ A PUC-RJ utilizou a Mineração de Dados para analisar os dados de seu vestibular e encontrou a seguinte regra: se o candidato for do sexo feminino, trabalha e conseguiu boas notas no vestibular ele não efetuava a matrícula A justificativa encontrada para esse padrão de comportamento dos candidatos é que se uma mulher em idade de vestibular trabalha é por necessidade e nesse caso provavelmente fez inscrição em universidades públicas também. Se a candidata obteve boas

29 16 notas é também provável que tenho sido aprovada na instituição pública para a qual se inscreveu e portanto não efetuará sua matrícula na PUC-RJ. Com algumas excessões, como: candidatas que residiam próximo à unidade, pessoas mais velhas, de alto poder executivo, que voltaram a estudar por outro motivo que não seja obter uma profissão, etc., essa regra é obedecida pela maioria dos candidatos Bank of America O Bank of America utilizou técnicas de Mineração de Dados para selecionar entre seus clientes aqueles que apresentavam o menor risco de inadimplência em empréstimos. A partir dos resultados encontrados enviou cartas oferencendo limites de crédito aos seus clientes que possuiam filhos com idade entre 18 e 21 anos e que precisariam de dinheiro para comprar uma casa, o primeiro carro ou financiar a faculdade dos filhos. Como resultado dessa ação o banco teve um lucro de U$ 30 milhões em 3 anos A.C. Milan O clube de futebol italiano, Milan, iniciou em 2002 um projeto piloto que utilizava software para prever lesões em jogadores, uma vez que os jogadores representa o maior investimento do clube poder evitar tais lesões ou reduzir a gravidade delas e, consequentemente, tempo de recuperação dos atletas economizaria milhões de dólares aos cofres do clube. Através de um software desenvolvido pela Computer Associates, foram coletados dados nos treinamentos da equipe durante um período de tempo, permitindo que fossem feitas previsões médicas acumuladas de cada jogador possibilitando um melhor monitoramento do risco de lesões dos atletas FAPESP

30 17 Um projeto de pesquisa apoiado pela FAPESP gerou o protótipo de uma ferramenta de diagnósticos por imagem. O MIRVIsIM foi desenvolvido por um grupo coordenado pela professora Agma Juci Machado Traina, do ICMC da USP, em São Carlos. É comum o médico se lembrar de ter visto uma imagem parecida mas não se lembrar do diagnóstico do caso e analisar casos anteriores levaria muito tempo. A função do software é compara a imagem a ser analisada pelo radiologista com um banco de dados de outras já laudadas. Cor, posição e formato dos elementos retratados são utilizados como elementos a serem comparados. O especialista então recebe uma série de sugestões de diagnósticos levantados através da comparação das imagens.

31 18 CAPÍTULO 2 RELAÇÃO ENTRE A MÉDIA FINAL OBTIDAS NAS DISCIPLINAS DO CURSO DE SI DA UEG E O DESEMPENHO ACADÊMICO Neste capítulo será apresentado um exemplo da utilização da Mineração de Dados para obtenção de informação a partir de uma base de dados, descrevendos os passos utilizados e o resultado final. 2.1 O Curso de Sistemas de Informação O curso de Bacharelado em Sistemas de Informação começou a ser ofertado na UnUCET em fevereiro de 2002, em substituição ao curso de Tecnologia em Processamento de Dados, uma vez que o curso de Tecnologia em Processamento de Dados, criado em 1985, necessitava de algumas alterações e atualizações e o Ministério da Educação já havia feito orientações para que os cursos de natureza técnica fossem substituídos por outros da área de Computação e Informática. O objetivo do curso é formar profissionais para o desenvolvimento, implantação e gestão de sistemas de informação visando atender as demandas das organizações e da sociedade, utilizando as modernas técnicas da Tecnologia da Informação. A matriz curricular original do curso, de 2002, foi alterada em 2009, mas para este estudo ainda será utilizada a matriz curricular de 2002, visto que os dados utilizados compreendem o período de 2002 a 2007 e a nova matriz curricular só começou a entrar em vigar em 2009 e somente na 1ª série do curso.

32 19 Figura 8 - Matriz Curricular do Curso de Sistemas de Informação Da acordo com a matriz curricular de 2002 e que será utilizada neste estudo, o curso possui um tempo de integralização mínima de 4 e máximo de 7 anos, com um total de horas/aula, divididas no período noturno e com aulas aos sábados pela manhã nos 3 primeiros anos. A forma de ingresso é anual e são oferecidas um total de 40 vagas. Além das horas/aula que são cumpridas na universidade, o aluno também deve cumprir um total de 150 horas de atividades complementares, que podem incluir palestras, seminários, cursos, etc., como atividades para complementar e expandir os temas abordados em sala de aula e 360 horas de estágio supervisionado como forma de observar e aprender como é o dia a dia do profissional e como o conteúdo aprendido em sala pode ser aplicado na realidade.

33 20 A média necessária para que o aluno seja considerado aprovado em qualquer disciplina é 7 e o aluno também precisa ter o mínimo de 75% de presença na disciplina. A média final de cada disciplina é obtida da média aritmérica das notas obtidas nos 4 bimestres que compõem o ano letivo. Média = (nota 1º bimestre + nota 2º bimestre + nota 3º bimestre + nota 4º bimestre) / 4 Caso a média obtida pelo aluno na disciplina seja maior ou igual a 7, ele está aprovado na disciplina. Se o aluno obtiver média inferior a 3 na disciplina ele está reprovado. Caso a nota seja inferior a 7 e maior ou igual a 3, o aluno faz mais uma prova para obtenção de uma nova média. Média final = (média obtida + nota prova final) / 2 Caso a média obtida na prova final seja superior a 5 o alunos está aprovado, caso contrário o aluno está reprovado na disciplina. Em todos os casos o aluno precisa, obrigatoriamente, ter frequentado um mínimo de 75% das horas/aula ministradas, caso contrário estará reprovado independentemente da média que obtiver na disciplina. 2.2 Base de Dados A base de dados a ser utilizada é corresponde ao dados dos alunos do curso de Sistemas de Informação da UEG dos anos de 2002 a Proposta As propostas deste estudo de caso são estabelecer uma relação entre a média final obtidas nas disciplinas que compõem a grade curricular do curso e o desempenho acadêmico do aluno no decorrer do curso. A proposta pretende descobrir se as notas obtidas pelos alunos em certas disciplinas influencia no desempenho do aluno no decorrer do curso, ou seja, se esses alunos conseguiram concluir o curso no tempo mínimo exigido (4 anos).

34 Etapas Seleção dos Dados Primeiro foi feita a seleção dos dados que serão trabalhados na Mineração de Dados. Neste momento foi escolhida a base de dados de alunos do curso de SI dos anos de 2002 a A escolha da base de dados foi aleatória, já o período foi escolhido levando-se em conta as turmas que a primeira turma que ingressou (2002) e a última turma que se formou na universidade (2007), considerando-se que o curso possui 4 anos de duração mínima. A base de dados se encontra no formato ACCDB do Microsoft Access Limpeza com dados ausentes. Nesta etapa foi feita a limpeza da base de dados, retirando registros que estejam Transformação A base de dados precisa ser trabalhada antes que o algorítmo de mineração de dados possa ser aplicado. Neste momento, foram retirados dados que não são interessentes para a mineração de dados, como, endereço, cidade, estado, telefone, etc., e deixando apenas os dados que seriam relevantes ao estudo: notas das disciplinas, se o aluno completou o curso pleno (4 anos, sem reprovação em nenhuma disciplina). Os dados da base de dados também precisaram ser formatados para que não houvesse inconsistência nos dados. A base de dados em que será aplicada o algorítmo de Mineração de Dados ficou com a seguinte estrutura:

35 22 Tabela 1 - tb_weka Campo Tipo Descrição D1 Numércico Média final da disciplina de Álgebra D2 Numérico Média final da disciplina de Análise de Sistemas D3 Numérico Média final da disciplina de Arquitetura de Computadores D4 Numérico Média final da disciplina de Banco de Dados D5 Numérico Média final da disciplina de Cálculo Diferencial e Integral D6 Numérico Média final da disciplina de Conceitos de Inteligência Artificial D7 Numérico Média final da disciplina de Contabilidade e Economia para Computação D8 Numérico Média final da disciplina de Direito e Ética em Informática D9 Numérico Média final da disciplina de Eletricidade e Lógica Digital D10 Numérico Média final da disciplina de Empreendedorismo em Informática D11 Numérico Média final da disciplina de Engenharia de Software D12 Numérico Média final da disciplina de Inglês Instrumental D13 Numérico Média final da disciplina de Introdução à Computação

36 23 D14 Numérico Média final da disciplina de Linguagem e Técnicas de Programação D15 Numérico Média final da disciplina de Metodologia da Pesquisa Científica D16 Numérico Média final da disciplina de Novas Aplicações Em Sistemas de Informação D17 Numérico Média final da disciplina de O Profissional da Informática e a Sociedade D18 Numérico Média final da disciplina de Organização, Sistemas e Métodos D19 Numérico Média final da disciplina de Planejamento e Gestão de Sistemas de Informação D20 Numérico Média final da disciplina de Princípios de Sistemas de Informação e Teoria da Computação D21 Numérico Média final da disciplina de Probabilidade e Estatística D22 Numérico Média final da disciplina de Programação I D23 Numérico Média final da disciplina de Programação II D24 Numérico Média final da disciplina de Projeto de Graduação I D25 Numérico Média final da disciplina de Projeto de Graduação II D26 Numérico Média final da disciplina de Redes de Computadores Pleno Texto, S/N Indica se o aluno concluiu a universidade

37 24 no tempo mínimo(4 anos, sem reprovação) Fonte: O autor Mineração de Dados Como descrito anteriormente, para a demonstração do algorítmo de Mineração de Dados será utilizado o WEKA, mas o WEKA não é capaz de aplicar o algorítmo diretamente sobre uma base de dados do Microsoft Access, como é o caso da base que estamos utilizando. Portanto a tabela tb_weka precisa ser exportada para um arquivo no formato ARFF para que assim possa ser feita a leitura através do WEKA e o algorítmo seja aplicado O formato de arquivo ARFF O formato de arquivo ARFF (Attribute-Relation File Format), desenvolvido pela Machine Learning Project no Departamento de Ciência da Computação da Universidade de Waikato (mesma desenvolvedora do WEKA) para uso no WEKA, é um arquivo de texto ASCII que descreve uma lista de instâncias compartilhando um conjunto de atributos. dados: Por padrão, todo arquivo ARFF é dividido em 2 partes distintas, o cabeçalho e os Cabeçalho: o cabeçalho do arquivo ARFF contém o nome da relação e a declaração dos atributos. o o O nome da relação é definido na primeira linha do arquivo através da A declaração de atributos deve ser individualmente para cada atributo através da e define o nome e tipo do atributo. Os tipos de dados suportados pelo WEKA são 4, numérico, nominal, string e data: Numérico: os atributos podem ser numéros reais ou inteiros

38 25 Nominal: são definidos através de uma especificação nominal dos valores que o atributo pode assumir. Exemplo: {YES,NO}, {Y,N}, {A,B} String: são atributos que contém texto. Data: são atributos que representam uma data, utilizado o padrão ISO-8601 de formato de data e hora combinadas em uma string yyyy-mmdd't'hh:mm:ss Os dados do arquivo são definidos através da onde cada instância é representada em uma única linha e os atributos são separados por vírgula. Os valores que estiverem ausentes serão representados por um único ponto de interrogação (?). Todos os valores de atributos que possuirem espaços devem estar entre aspas duplas ( ) e para colocar comentários no arquivos utiliza-se a caracter percentagem (%) no início da linha. Assim sendo, o arquivo ARFF gerado ficou da seguinte forma: - Declaração da alunos - Declaração dos D1 D2 D3 D4 D5 D6 D7 D8 D9 real

39 D10 D11 D12 D13 D14 D15 D16 D17 D18 D19 D20 D21 D22 D23 D24 D25 D26 Pleno {S,N} - 6.6,6.7,5.3,6.1,7.25,7.3,7.4,7.1,7,7.5,5.1,7,7.7,7.7,7.2,8.1,7.2,7.9,7.5,9,7,8.15,7.2,7.2,8.1,7.7,S... Este é o exemplo de uma das várias linhas que a contém.

40 Escolha do Algorítmo Para a análise do arquivo ARFF foi escolhido o método de classificação e o algorítmo J48, em decorrência do escopo do trabalho e dos valores que compõem o arquivo ARFF. O método de classificação foi escolhido por atender as propostas feitas no início deste capítulo, ou seja, com o método de classificação pode-se prever se as notas em determinadas disciplinas influenciam podem dizer se o aluno concluirá o curso pleno ou não. O algorítmo J48 foi escolhido devido ao tipo dos dados que serão analisados. Segue abaixo uma explicação do funcionamento do algorítmo O algorítmo J48 constroi uma árvore de decisão. A forma de construção da árvore usa a abordagem top-down, em que o atibuto mais generalizado é considerado a raiz da árvore. A seguir, o próximo nó da árvore será o segundo atributo mais generalizado, e assim por diante até que seja encontrado o nó folha, que representa o atributo alvo Utilizando o WEKA A última versão do WEKA pode ser obtida em lembrando que por ter sido desenvolvido em Java, o WEKA precisa da JVM (Java Virtual Machine) instalada no computador onde será instalado. Atualmente o WEKA utiliza a JVM 1.6 e para evitar problemas durante a execução do programa, sugiro que seja escolhido o download do instalador que já venha com a JVM.

41 28 Figura 9 WEKA Tela Inicial Fonte: O autor Escolha a opção Explorer, e será apresentada a seguinte tela: Figura 10 WEKA Tela Explorer

42 29 Fonte: O autor Selecione a opção Open file... e navegue até a pasta onde se encontra o arquivo ARFF que deseja analisar. Após o arquivo ARFF ser aberto, algumas informações do arquivo já poderão ser observadas, como a quantidade de instâncias, o número de atributos, e informações sobre os próprios atributos individualmente como tipo de dado e os valores que esses atributos assumem. Figura 11 - WEKA - Arquivo ARFF Aberto Fonte: O autor A seguir clique na guia Classify e escolha o algorítmo que será aplicado, neste caso o algorítmo escolhido foi o J48 que se encontra na guia trees.

43 30 Figura 12 - WEKA Tela de Classificação Fonte: O autor

44 31 Figura 13 - WEKA - Escolha do Algorítmo Fonte: O autor O passo seguinte é escolher a opção Use training set em Test options, escolher qual o atributo será o nó folha da árvore e clicar em Start para que o WEKA começa a análise do arquivo ARFF e crie a árvore.

45 32 Figura 14 - WEKA - Execução do Algorítmo Fonte: O autor

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Cruzeiro SP 2008 FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Projeto de trabalho de formatura como requisito

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Automação de Bancada Pneumática

Automação de Bancada Pneumática Instituto Federal Sul-rio-grandense Campus Pelotas - Curso de Engenharia Elétrica Automação de Bancada Pneumática Disciplina: Projeto Integrador III Professor: Renato Allemand Equipe: Vinicius Obadowski,

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

SAM GERENCIAMENTO DE ATIVOS DE SOFTWARE

SAM GERENCIAMENTO DE ATIVOS DE SOFTWARE SAM GERENCIAMENTO DE ATIVOS DE SOFTWARE Modelo de Otimização de SAM Controle, otimize, cresça Em um mercado internacional em constante mudança, as empresas buscam oportunidades de ganhar vantagem competitiva

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

O PROJETO DE PESQUISA. Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza

O PROJETO DE PESQUISA. Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza O PROJETO DE PESQUISA Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza ROTEIRO Escolher um tema de pesquisa Por onde começar? Ler para aprender Estrutura do Projeto de Pesquisa A Definição

Leia mais

CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO

CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO FUNDAÇÃO UNIVERSIDADE DO TOCANTINS CURSO DE GRADUAÇÃO PRESENCIAL SISTEMAS DE INFORMAÇÃO Identificação do Curso Nome do Curso: Sistemas de Informação Titulação: Bacharelado Modalidade de ensino: Presencial

Leia mais

Universidade Tecnológica Federal do Paraná Gerencia de Ensino e Pesquisa Coordenação de Informática Estágio supervisionado curricular.

Universidade Tecnológica Federal do Paraná Gerencia de Ensino e Pesquisa Coordenação de Informática Estágio supervisionado curricular. Universidade Tecnológica Federal do Paraná Gerencia de Ensino e Pesquisa Coordenação de Informática Estágio supervisionado curricular Relatório Final João Pedro Cavasin Estagiário André Luis Schwerz Orientador

Leia mais

A Grande Importância da Mineração de Dados nas Organizações

A Grande Importância da Mineração de Dados nas Organizações A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Conceitos Básicos Introdução Banco de Dados I Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM Dados

Leia mais

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados: MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

RELATÓRIO DO SITE DA DISCIPLINA ENG312 PROJETOS MECÂNICOS I (www.projetosdemaquinas.eng.ufba.br)

RELATÓRIO DO SITE DA DISCIPLINA ENG312 PROJETOS MECÂNICOS I (www.projetosdemaquinas.eng.ufba.br) UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA DEPARTAMENTO DE ENGENHARIA MECÂNICA ENG 312 PROJETOS MECÂNICOS I RELATÓRIO DO SITE DA DISCIPLINA ENG312 PROJETOS MECÂNICOS I (www.projetosdemaquinas.eng.ufba.br)

Leia mais

Prof. Marcelo Machado Cunha www.marcelomachado.com mcelobr@yahoo.com.br

Prof. Marcelo Machado Cunha www.marcelomachado.com mcelobr@yahoo.com.br Prof. Marcelo Machado Cunha www.marcelomachado.com mcelobr@yahoo.com.br Ementa Introdução a Banco de Dados (Conceito, propriedades), Arquivos de dados x Bancos de dados, Profissionais de Banco de dados,

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler Introdução Objetivos da Gestão dos Custos Processos da Gerência de Custos Planejamento dos recursos Estimativa dos

Leia mais

5 Mecanismo de seleção de componentes

5 Mecanismo de seleção de componentes Mecanismo de seleção de componentes 50 5 Mecanismo de seleção de componentes O Kaluana Original, apresentado em detalhes no capítulo 3 deste trabalho, é um middleware que facilita a construção de aplicações

Leia mais

Guia de Atualização PROJURIS WEB 4.5. Manual do Técnico Atualização - ProJuris Web 4.5. Manual do Técnico Atualização - ProJuris Web 4.

Guia de Atualização PROJURIS WEB 4.5. Manual do Técnico Atualização - ProJuris Web 4.5. Manual do Técnico Atualização - ProJuris Web 4. Guia de Atualização PROJURIS WEB 4.5 Por: Fabio Pozzebon Soares Página 1 de 11 Sistema ProJuris é um conjunto de componentes 100% Web, nativamente integrados, e que possuem interface com vários idiomas,

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

I. DO PROCESSO SELETIVO 1.1. O processo seletivo docente será composto de três etapas: homologação da inscrição, prova didática e entrevista.

I. DO PROCESSO SELETIVO 1.1. O processo seletivo docente será composto de três etapas: homologação da inscrição, prova didática e entrevista. Rua do Salete, 50, Barris - Salvador - Bahia. Tel: (71) 2108-8562 / 2108-8503 home page: www.cairu.br - E-mail: presidencia@fvc.br E D I T A L A FVC - Fundação Visconde de Cairu, informa a abertura das

Leia mais

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831

Rational Quality Manager. Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 Rational Quality Manager Nome: Raphael Castellano Campus: AKXE Matrícula: 200601124831 1 Informações Gerais Informações Gerais sobre o RQM http://www-01.ibm.com/software/awdtools/rqm/ Link para o RQM https://rqmtreina.mvrec.local:9443/jazz/web/console

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Pós-Graduação Lato Sensu em Engenharia de Software

Pós-Graduação Lato Sensu em Engenharia de Software FACULDADE DE TECNOLOGIA SENAI FLORIANÓPOLIS DIREÇÃO GERAL DA FACULDADE: JOÃO ROBERTO LORENZETT COORDENAÇÃO DA FACULDADE: PRISCILA FAGUNDES COORDENAÇÃO DO CURSO DE PÓS-GRADUAÇÃO LATO SENSU: JANICE DETERS

Leia mais

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1. O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas e técnicas

Leia mais

Atividades da Engenharia de Software GERENCIAMENTO DA CONFIGURAÇÃO DE SOFTWARE. Atividades da Engenharia de Software. Processo de Desenvolvimento de

Atividades da Engenharia de Software GERENCIAMENTO DA CONFIGURAÇÃO DE SOFTWARE. Atividades da Engenharia de Software. Processo de Desenvolvimento de SCE186-ENGENHARIA DE SOFTWARE Módulo 1 Atividades da Engenharia de GERENCIAMENTO DA CONFIGURAÇÃO DE SOFTWARE Profª Rosely Sanches rsanches@icmc.usp.br 2003 DEFINIÇÃO CONSTRUÇÃO SOFTWARE PRODUTO MANUTENÇÃO

Leia mais

Projeto Pedagógico do Bacharelado em Ciência da Computação. Comissão de Curso e NDE do BCC

Projeto Pedagógico do Bacharelado em Ciência da Computação. Comissão de Curso e NDE do BCC Projeto Pedagógico do Bacharelado em Ciência da Computação Comissão de Curso e NDE do BCC Fevereiro de 2015 Situação Legal do Curso Criação: Resolução CONSU no. 43, de 04/07/2007. Autorização: Portaria

Leia mais

MASTER IN PROJECT MANAGEMENT

MASTER IN PROJECT MANAGEMENT MASTER IN PROJECT MANAGEMENT PROJETOS E COMUNICAÇÃO PROF. RICARDO SCHWACH MBA, PMP, COBIT, ITIL Atividade 1 Que modelos em gestão de projetos estão sendo adotados como referência nas organizações? Como

Leia mais

REGULAMENTO PARA PARTICIPAÇÃO NO CURSO DE FORMAÇÃO E CERTIFICAÇÃO EM GERENCIAMENTO DE PROJETOS

REGULAMENTO PARA PARTICIPAÇÃO NO CURSO DE FORMAÇÃO E CERTIFICAÇÃO EM GERENCIAMENTO DE PROJETOS REGULAMENTO PARA PARTICIPAÇÃO NO CURSO DE FORMAÇÃO E CERTIFICAÇÃO EM GERENCIAMENTO DE PROJETOS 1. APRESENTAÇÃO Este regulamento apresenta as regras e os critérios estabelecidos pelo Núcleo de Gestão do

Leia mais

Roteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)?

Roteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)? Roteiro BCC321 - Banco de Dados I Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Conceitos Básicos Banco

Leia mais

MBA EM BUSINESS INTELLIGENCE

MBA EM BUSINESS INTELLIGENCE MBA EM BUSINESS INTELLIGENCE Como a sua empresa estrutura informações estratégicas? Como as decisões são tomadas? São considerados, dados, informações e tendências, de macroambientes? O quanto você conhece

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Criação de um site sobre Comunicação

Criação de um site sobre Comunicação Luciano Conceição Martins Criação de um site sobre Comunicação UNICAMP Universidade Estadual de Campinas Introdução: Um site é um conjunto de arquivos feitos através de códigos de programação. E, estes

Leia mais

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software PROCESSO DE DESENVOLVIMENTO DE SOFTWARE Introdução Modelos de Processo de Desenvolvimento de Software Os modelos de processos de desenvolvimento de software surgiram pela necessidade de dar resposta às

Leia mais

CENTRO DE PÓS-GRADUAÇÃO E PESQUISA VISCONDE DE CAIRU CEPPEV CURSO: GESTÃO DE DATACENTER E COMPUTAÇÃO EM NUVEM 2013.2

CENTRO DE PÓS-GRADUAÇÃO E PESQUISA VISCONDE DE CAIRU CEPPEV CURSO: GESTÃO DE DATACENTER E COMPUTAÇÃO EM NUVEM 2013.2 NÚMERO DE VAGAS: 25 (Vinte e Cinco) Vagas. PREVISÃO DE INÍCIO DAS AULAS 01 de Novembro de 2013 CENTRO DE PÓS-GRADUAÇÃO E PESQUISA VISCONDE DE CAIRU CEPPEV APRESENTAÇÃO / JUSTIFICATIVA A Fundação Visconde

Leia mais

15 Computador, projeto e manufatura

15 Computador, projeto e manufatura A U A UL LA Computador, projeto e manufatura Um problema Depois de pronto o desenho de uma peça ou objeto, de que maneira ele é utilizado na fabricação? Parte da resposta está na Aula 2, que aborda as

Leia mais

Capítulo 5. 5.1 Laudon, Cap. 5

Capítulo 5. 5.1 Laudon, Cap. 5 Capítulo 5 Fundamentos da Inteligência de Negócios: Gerenciamento da Informação e de Bancos de Dados 5.1 Laudon, Cap. 5 OBJETIVOS DE ESTUDO Descrever como um banco de dados relacional organiza os dados

Leia mais

Engenharia de Software II: Criando a Declaração de Escopo. Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br

Engenharia de Software II: Criando a Declaração de Escopo. Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br Engenharia de Software II: Criando a Declaração de Escopo Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br Sumário Desenvolvendo o Plano de Gerenciamento do Projeto. Coletando Requisitos. Declarando

Leia mais

REGULAMENTO PARA PARTICIPAÇÃO NO CURSO DE FORMAÇÃO E CERTIFICAÇÃO EM GERENCIAMENTO DE PROJETOS

REGULAMENTO PARA PARTICIPAÇÃO NO CURSO DE FORMAÇÃO E CERTIFICAÇÃO EM GERENCIAMENTO DE PROJETOS REGULAMENTO PARA PARTICIPAÇÃO NO CURSO DE FORMAÇÃO E CERTIFICAÇÃO EM GERENCIAMENTO DE PROJETOS 1. APRESENTAÇÃO Este regulamento apresenta as regras e os critérios estabelecidos pelo Núcleo de Gestão do

Leia mais

FACULDADE DE CIÊNCIAS SOCIAIS APLICADAS E COMUNICAÇÃO REGULAMENTO DAS ATIVIDADES COMPLEMENTARES CURSO DE DESIGN DE MODA

FACULDADE DE CIÊNCIAS SOCIAIS APLICADAS E COMUNICAÇÃO REGULAMENTO DAS ATIVIDADES COMPLEMENTARES CURSO DE DESIGN DE MODA FACULDADE DE CIÊNCIAS SOCIAIS APLICADAS E COMUNICAÇÃO REGULAMENTO DAS ATIVIDADES COMPLEMENTARES CURSO DE DESIGN DE MODA 1. Atividades Complementares Atividades Complementares são atividades desenvolvidas

Leia mais

UniFOA Centro Universitário de Volta Redonda Prof. Érick de S. Carvalho LabBD2Aula01A 1

UniFOA Centro Universitário de Volta Redonda Prof. Érick de S. Carvalho LabBD2Aula01A 1 Aula 01 (Aula Inicial) Esta é a primeira aula do semestre e o primeiro contato entre: os alunos, o professor e a disciplina. Vamos conhecer o Professor, sua experiência e capacitação em lecionar esta disciplina;

Leia mais

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS

EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS EMENTAS DO CURSO SUPERIOR DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS INTRODUÇÃO À COMPUTAÇÃO 60 h 1º Evolução histórica dos computadores. Aspectos de hardware: conceitos básicos de CPU, memórias,

Leia mais

Manual de Pedido de Matrícula em Disciplinas pelo Q-Acadêmico WEB

Manual de Pedido de Matrícula em Disciplinas pelo Q-Acadêmico WEB Manual de Pedido de Matrícula em Disciplinas pelo Q-Acadêmico WEB Área Responsável Implantação Preparado por: Leonardo Moulin Franco 27 de maio de 2009 Revisão 00 TABELA DE REVISÃO DESTE MANUAL REVISÃO

Leia mais

ISSN 2238-9113 ÁREA TEMÁTICA: (marque uma das opções)

ISSN 2238-9113 ÁREA TEMÁTICA: (marque uma das opções) 13. CONEX Apresentação Oral Resumo Expandido 1 ISSN 2238-9113 ÁREA TEMÁTICA: (marque uma das opções) ( ) COMUNICAÇÃO ( ) CULTURA ( ) DIREITOS HUMANOS E JUSTIÇA ( ) EDUCAÇÃO ( ) MEIO AMBIENTE ( ) SAÚDE

Leia mais

UNIVERSIDADE DO EXTREMO SUL CATARINENSE UNESC CURSO DE GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS LUIZ PAULO RONCHI FREITAS

UNIVERSIDADE DO EXTREMO SUL CATARINENSE UNESC CURSO DE GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS LUIZ PAULO RONCHI FREITAS 0 UNIVERSIDADE DO EXTREMO SUL CATARINENSE UNESC CURSO DE GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS LUIZ PAULO RONCHI FREITAS AS FUNÇÕES DA CONTROLADORIA E O PERFIL DO CONTROLLER NAS EMPRESAS INTEGRANTES DOS PRINCIPAIS

Leia mais

INTRODUÇÃO AO AMBIENTE MOODLE DA UFPA. Guia rápido

INTRODUÇÃO AO AMBIENTE MOODLE DA UFPA. Guia rápido INTRODUÇÃO AO AMBIENTE MOODLE DA UFPA Guia rápido A PLATAFORMA MOODLE Moodle (Modular Object Oriented Distance LEarning) é um Sistema para Gerenciamento de Cursos (SGC). Trata-se de um programa para computador

Leia mais

Algoritmos e Programação I

Algoritmos e Programação I Algoritmos e Programação I Introdução a Computação Prof. Fernando Maia da Mota mota.fernandomaia@gmail.com CPCX/UFMS Fernando Maia da Mota 1 Computadores são dispositivos que só sabem fazer um tipo de

Leia mais

FACULDADE DE TALENTOS HUMANOS

FACULDADE DE TALENTOS HUMANOS FACULDADE DE TALENTOS HUMANOS PROJETO PEDAGÓGICO DO CURSO DE SISTEMAS DE INFORMAÇÃO UBERABA MG INSTITUTO EDUCACIONAL GUILHERME DORÇA PRESIDENTE: LUIZ HUMBERTO DORÇA FACULDADE DE TALENTOS HUMANOS DIRETOR

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

Palavras-Chaves: Arquitetura, Modelagem Orientada a Objetos, UML.

Palavras-Chaves: Arquitetura, Modelagem Orientada a Objetos, UML. MODELAGEM ORIENTADA A OBJETOS APLICADA À ANÁLISE E AO PROJETO DE SISTEMA DE VENDAS ALTEMIR FERNANDES DE ARAÚJO Discente da AEMS Faculdades Integradas de Três Lagoas ANDRE LUIZ DA CUNHA DIAS Discente da

Leia mais

O Curso Superior de Tecnologia em Redes de Computadores possui flexibilidade para atender dois tipos de certificações intermediárias, que são:

O Curso Superior de Tecnologia em Redes de Computadores possui flexibilidade para atender dois tipos de certificações intermediárias, que são: 1) Formas de participação do Corpo Discente: O Colegiado do Curso é um órgão consultivo, deliberativo e normativo, onde é possível a participação do corpo discente nas decisões que competem a exposição

Leia mais

Instituto de Educação Tecnológica Pós-graduação Gestão e Tecnologia da Informação - Turma 25 20/03/2015. Big Data Analytics:

Instituto de Educação Tecnológica Pós-graduação Gestão e Tecnologia da Informação - Turma 25 20/03/2015. Big Data Analytics: Instituto de Educação Tecnológica Pós-graduação Gestão e Tecnologia da Informação - Turma 25 20/03/2015 Big Data Analytics: Como melhorar a experiência do seu cliente Anderson Adriano de Freitas RESUMO

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

Glossário. Anúncios no Facebook

Glossário. Anúncios no Facebook Glossário Anúncios no Facebook Ações O número de vezes que as pessoas curtiram sua Página, curtiram publicações em sua Página, comentaram, @ mencionaram, fizeram o check-in em um local, marcaram sua marca

Leia mais

Nosso Planeta Mobile: Brasil

Nosso Planeta Mobile: Brasil Nosso Planeta Mobile: Brasil Como entender o usuário de celular Maio de 2012 1 Resumo executivo Os smartphones se tornaram indispensáveis para nosso cotidiano. A difusão dos smartphones atinge 14% da população,

Leia mais

PRÓ-REITORIA DE EXTENSÃO, PESQUISA E INOVAÇÃO DIRETORIA DE PESQUISA E INOVAÇÃO Proposta de Projeto de Pesquisa

PRÓ-REITORIA DE EXTENSÃO, PESQUISA E INOVAÇÃO DIRETORIA DE PESQUISA E INOVAÇÃO Proposta de Projeto de Pesquisa PRÓ-REITORIA DE EXTENSÃO, PESQUISA E INOVAÇÃO DIRETORIA DE PESQUISA E INOVAÇÃO Proposta de Projeto de Pesquisa IDENTIFICAÇÃO DO PROJETO Título do Projeto de Pesquisa: School Blocks Sistema de Gestão Acadêmica

Leia mais

Criação de Consultas e Relatórios no Access CRIAÇÃO DE CONSULTAS E RELATÓRIOS NO ACCESS

Criação de Consultas e Relatórios no Access CRIAÇÃO DE CONSULTAS E RELATÓRIOS NO ACCESS Criação de Consultas e Relatórios no Access CRIAÇÃO DE CONSULTAS E RELATÓRIOS NO ACCESS Sumário Conceitos / Autores chave... 3 1. Introdução... 4 2. Consultas... 5 3. Relatórios... 8 4. Conclusões... 11

Leia mais

Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software

Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software. Requisitos de Software INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO NORTE Curso Técnico em Informática ENGENHARIA DE SOFTWARE Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br Clayton Maciel Costa

Leia mais

Unidade II GERENCIAMENTO DE SISTEMAS. Prof. Roberto Marcello

Unidade II GERENCIAMENTO DE SISTEMAS. Prof. Roberto Marcello Unidade II GERENCIAMENTO DE SISTEMAS DE INFORMAÇÃO Prof. Roberto Marcello SI Sistemas de gestão A Gestão dos Sistemas Integrados é uma forma organizada e sistemática de buscar a melhoria de resultados.

Leia mais

Identificação rápida de gargalos Uma forma mais eficiente de realizar testes de carga. Um artigo técnico da Oracle Junho de 2009

Identificação rápida de gargalos Uma forma mais eficiente de realizar testes de carga. Um artigo técnico da Oracle Junho de 2009 Identificação rápida de gargalos Uma forma mais eficiente de realizar testes de carga Um artigo técnico da Oracle Junho de 2009 Identificação rápida de gargalos Uma forma mais eficiente de realizar testes

Leia mais

INTRODUÇÃO AO MICROSOFT DYNAMICS AX 4.0 FINANCEIRO I

INTRODUÇÃO AO MICROSOFT DYNAMICS AX 4.0 FINANCEIRO I Introdução INTRODUÇÃO AO MICROSOFT DYNAMICS AX 4.0 FINANCEIRO I E-Learning O treinamento é um componente vital para a retenção do valor de investimento do seu Microsoft Dynamics. Um treinamento de qualidade,

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Manual Q-Acadêmico 2.0 Módulo Web - Aluno

Manual Q-Acadêmico 2.0 Módulo Web - Aluno Manual Q-Acadêmico 2.0 Módulo Web - Aluno Índice 1 Acessando o sistema via internet...3 2 Funcionalidades...6 2.1 Horário Individual...7 2.2 Calendário Acadêmico...8 2.3 Biblioteca...9 2.3.1 Consultar

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Módulo I - Aula 3 Tipos de Sistemas

Módulo I - Aula 3 Tipos de Sistemas Módulo I - Aula 3 Tipos de Sistemas Agora que você já conheceu algumas características dos Sistemas de Informação, nesta aula você vai aprender um pouco sobre tipos de sistemas. Você conhecerá a integração

Leia mais

Data Warehouse - DW ADM. MARTÍN GLASS CRA/MT 4742

Data Warehouse - DW ADM. MARTÍN GLASS CRA/MT 4742 Data Warehouse - DW Data Warehouse (Armazém de Dados) é um depósito integrado de informações, disponíveis para análise e para a construção de filtros de busca; Centraliza informações localizadas em diferentes

Leia mais

COLETA DE INFORMAÇÕES E PREVISÃO DE DEMANDA

COLETA DE INFORMAÇÕES E PREVISÃO DE DEMANDA COLETA DE INFORMAÇÕES E PREVISÃO DE DEMANDA 1) Quais são os componentes de um moderno sistema de informações de marketing? 2) Como as empresas podem coletar informações de marketing? 3) O que constitui

Leia mais

REGULAMENTO PARA PARTICIPAÇÃO NO CURSO DE FORMAÇÃO E CERTIFICAÇÃO TÉCNICA EM BANCO DE DADOS

REGULAMENTO PARA PARTICIPAÇÃO NO CURSO DE FORMAÇÃO E CERTIFICAÇÃO TÉCNICA EM BANCO DE DADOS REGULAMENTO PARA PARTICIPAÇÃO NO CURSO DE FORMAÇÃO E CERTIFICAÇÃO TÉCNICA EM BANCO DE DADOS 1. APRESENTAÇÃO Este regulamento apresenta as regras e os critérios estabelecidos pelo Núcleo de Gestão do Porto

Leia mais

Gestão de Relacionamento com o Cliente CRM

Gestão de Relacionamento com o Cliente CRM Gestão de Relacionamento com o Cliente CRM Fábio Pires 1, Wyllian Fressatti 1 Universidade Paranaense (Unipar) Paranavaí PR Brasil pires_fabin@hotmail.com wyllian@unipar.br RESUMO. O projeto destaca-se

Leia mais

4. PMBOK - Project Management Body Of Knowledge

4. PMBOK - Project Management Body Of Knowledge 58 4. PMBOK - Project Management Body Of Knowledge No Brasil, as metodologias mais difundidas são, além do QL, o método Zopp, o Marco Lógico do Banco Interamericano de Desenvolvimento (BID) e o Mapp da

Leia mais

MANUAL PARA ELABORAÇÃO DE PRÉ-PROJETOS DE MONOGRAFIA DO CURSO DE DIREITO/FAJ

MANUAL PARA ELABORAÇÃO DE PRÉ-PROJETOS DE MONOGRAFIA DO CURSO DE DIREITO/FAJ Faculdade de Jussara FAJ Curso de Direito Coordenação de Trabalho de Conclusão de Curso MANUAL PARA ELABORAÇÃO DE PRÉ-PROJETOS DE MONOGRAFIA DO CURSO DE DIREITO/FAJ Jussara 2013 APRESENTAÇÃO Este manual

Leia mais

Cláudia Araújo Coordenadora Diego Macêdo Programador Marcelo Rodrigues Suporte

Cláudia Araújo Coordenadora Diego Macêdo Programador Marcelo Rodrigues Suporte BCON Sistema de Controle de Vendas e Estoque Declaração de escopo Versão 1.0 Histórico de Revisão Elaborado por: Filipe de Almeida do Amaral Versão 1.0 Aprovado por: Marcelo Persegona 22/03/2011 Time da

Leia mais

Instruções de Instalação do IBM SPSS Modeler (Licença de Usuário Autorizado)

Instruções de Instalação do IBM SPSS Modeler (Licença de Usuário Autorizado) Instruções de Instalação do IBM SPSS Modeler (Licença de Usuário Autorizado) Índice Instruções de Instalação....... 1 Requisitos do sistema........... 1 Código de autorização.......... 1 Instalando...............

Leia mais

Curso: Bacharelado em Informática. Instituto de Ciências Matemáticas e de Computação

Curso: Bacharelado em Informática. Instituto de Ciências Matemáticas e de Computação Curso: Bacharelado em Informática Instituto de Ciências Matemáticas e de Computação Informações Básicas do Currículo Duração Ideal 8 semestres Mínima 6 semestres Máxima 14 semestres Carga Horária Aula

Leia mais

FORMAÇÃO SÓLIDA E BENEFÍCIOS PARA VOCÊ

FORMAÇÃO SÓLIDA E BENEFÍCIOS PARA VOCÊ A FUNCEX E O ENSINO A DISTÂNCIA Milhões de pessoas aderiram ao Ensino a Distância no Brasil, e a Funcex, acompanhando esta tendência, desenvolveu sua plataforma de ensino para disponibilizar os treinamentos

Leia mais