UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO

Tamanho: px
Começar a partir da página:

Download "UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO"

Transcrição

1 UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO MINERAÇÃO DE DADOS PARA AVALIAÇÃO DO PERFIL DE USUÁRIOS DO SISTEMA DE INFORMAÇÃO DA ACADEMIA DA UNIVALI Área de Inteligência Artificial por Marlon Kleinschmidt Benjamin Grando Moreira, Bel. Orientador Itajaí (SC), dezembro de 2007

2 UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO MINERAÇÃO DE DADOS PARA AVALIAÇÃO DO PERFIL DE USUÁRIOS DO SISTEMA DE INFORMAÇÃO DA ACADEMIA DA UNIVALI Área de Inteligência Artificial por Marlon Kleinschmidt Relatório apresentado à Banca Examinadora do Trabalho de Conclusão do Curso de Ciência da Computação para análise e aprovação. Orientador: Benjamin Grando Moreira, Bel. Itajaí (SC), dezembro de 2007

3 SUMÁRIO LISTA DE ABREVIATURAS...iv LISTA DE FIGURAS...v LISTA DE TABELAS...vi RESUMO...vii ABSTRACT...viii 1 INTRODUÇÃO PROBLEMATIZAÇÃO Formulação do Problema Solução Proposta OBJETIVOS Objetivo Geral Objetivos Específicos METODOLOGIA ESTRUTURA DO TRABALHO FUNDAMENTAÇÃO TEÓRICA A ACADEMIA DE MUSCULAÇÃO DA UNIVALI O Sistema de Informação desenvolvido para Academia INTELIGÊNCIA ARTIFICIAL DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS Compreensão do Domínio de Aplicação Data Warehouse Pré-Processamento Mineração de Dados Pós-Processamento SOLUÇÕES SIMILARES A IA entrando na quadra de vôlei: Scout inteligente A informática e suas aplicações em educação física FERRAMENTAS DE MINERAÇÃO DE DADOS Análise das ferramentas de mineração de dados Weka PROJETO CARACTERIZAÇÃO DO DOMÍNIO DA APLICAÇÃO NORMALIZAÇÃO DOS DADOS FERRAMENTA AUXILIAR PARA CADASTRO DE ALUNOS Normalização dos dados da aplicação auxiliar FUNCIONAMENTO DA MD NAS APLICAÇÕES MODELAGEM DO SISTEMA ii

4 3.5.1 Levantamento de Requisitos Projeto do Sistema IMPLEMENTAÇÃO DO SISTEMA Problemas encontrados TESTES E VALIDAÇÃO DO SISTEMA CONCLUSÕES REFERÊNCIAS BIBLIOGRÁFICAS...63 A MODELAGEM DO SISTEMA...67 A.1 CASOS DE USO A.1.1 Pacote 01: Controle de acesso A.1.2 Pacote 02: Operações iii

5 LISTA DE ABREVIATURAS BD DCBD DW IA KDD MD RBC SIAMU TCC UML UNIVALI Banco de Dados Descoberta de Conhecimento em Banco de Dados Data Warehouse Inteligência Artificial Knowledge Discovery in Databases Mineração de Dados Raciocínio Baseado em Casos Sistema de Informação da Academia de Musculação da UNIVALI Trabalho de Conclusão de Curso Unified Modelling Language Universidade do Vale do Itajaí iv

6 LISTA DE FIGURAS Figura 1. Tela principal...10 Figura 2. Tela de Avaliação de Alunos...11 Figura 3. Tela de Ficha de Programação Muscular...12 Figura 4. Taxonomia do processo de KDD...14 Figura 5. Visão simplificada de uma arquitetura de DW...18 Figura 6. MD utiliza recursos de diferentes áreas...19 Figura 7. Regras de associação geradas pelo algoritmo apriori Figura 8. Regras de classificação geradas pelo algoritmo NNge...25 Figura 9. Aplicação Hipermídia...30 Figura 10. Arquivo no formato ARFF...35 Figura 11. Exemplo do arquivo ARFF utilizado...37 Figura 12. Resultado da classificação com o algoritmo J Figura 13. Adicionando o arquivo weka.jar...39 Figura 14. Código que executa o algoritmo classificador J Figura 15. Resultado da classificação com o algoritmo J Figura 16. Estrutura do DW criado Figura 17. Tela de cadastro da ferramenta auxiliar, horário Figura 18. Tela de cadastro da ferramenta auxiliar, informações gerais...47 Figura 19. Tela de cadastro da ferramenta auxiliar, prescrição Figura 20. Estrutura do DW auxiliar criado...49 Figura 21. Tela de login Figura 22. Tela de mensagem padrão...50 Figura 23. Tela de mineração de dados...51 Figura 24. Tela de visualização do conhecimento Figura 25. Tela de mineração de dados auxiliar...53 Figura 26. Execução do algoritmo J Figura 27. Geração do arquivo apriori.bat Figura 28. Execução do arquivo apriori.bat Figura 29. Diagrama de Pacotes dos Casos de Uso Figura 30. Casos de Uso do Pacote Controle de Acesso...67 Figura 31. Casos de Uso do Pacote Operações v

7 LISTA DE TABELAS Tabela 1. Algumas tarefas de KDD e suas técnicas de mineração de dados...22 Tabela 2. Entrada de dados para a descoberta de regras de associação Tabela 3. Entrada de dados para a tarefa de classificação Tabela 4. Técnicas de mineração de dados Tabela 5. Comparação entre as ferramentas de mineração de dados Tabela 6. Normalização dos dados...44 vi

8 RESUMO KLEINSCHMIDT, Marlon. Mineração de dados para avaliação do perfil de usuários do Sistema de Informação da Academia da UNIVALI. Itajaí, f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) Centro de Ciências Tecnológicas da Terra e do Mar, Universidade do Vale do Itajaí, Itajaí, A Academia de musculação da UNIVALI possui um Sistema de Informação baseado em Sistemas Especialista e Raciocínio Baseados em Casos, com objetivo de auxiliar os professores na escolha da programação da atividade física a ser seguida por um aluno. Porém, o sistema não está utilizando com maior aproveitamento o grande número de dados produzidos e armazenados, limitando-se em buscar informações para gerar a programação da atividade física. Novas tecnologias envolvendo recursos de Inteligência Artificial, entre elas, a Mineração de Dados, permitem a descoberta de conhecimento em grandes bases de dados e extrair informações que auxiliam na tomada de decisão que, de outra maneira permaneceriam escondidas. O presente TCC propõe demonstrar a aplicação da técnica de mineração de dados, usando como estudo de caso a base de dados do Sistema de Informação da Academia da UNIVALI, com a utilização de algoritmos de mineração de dados, para uma possível descoberta de novas correlações, padrões e tendências significativas por meio da análise dos dados armazenados. Esse trabalho se concentrará em três tarefas da Mineração de Dados que são: regras de associação, classificação e agrupamento, com objetivo de descobrir alguma informação útil nos dados, procurando encontrar alguma particularidade que possa melhorar o atendimento dos atletas, ou encontrar alguma outra informação relevante. Palavras-chave: Descoberta de Conhecimento. Mineração de Dados.Weka. vii

9 ABSTRACT The body-building gym of the UNIVALI possesss a System of Information based on Systems Based Specialist and Reasoning in Cases, with objective of assisting the professors in the choice of the programming of the physical activity to be followed by a pupil. However, the system is not using with bigger exploitation the great number of produced and stored data, limiting itself in searching information to generate the programming of the physical activity. New technologies involving resources of Artificial Intelligence, between them, the data mining, allow the discovery of knowledge in great databases and to extract information that assist in the decision taking that, in another way would remain hidden. Gift TCC considers to demonstrate the application of the technique of mining of data, using as case study the database of the System of Information of the Academy of the UNIVALI, with the use of algorithms of data mining, for a possible one discovered of new correlations, standards and significant trends by means of the analysis of the stored data. This work will be concentrated in three tasks of the data mining that are: rules of association, classification and grouping, with objective to discover some useful information in the data, looking for to find some particularitity that can improve the attendance of the athletes, or to find some another excellent information. Keywords: Knowledge Discovery in Databases. Data Mining.Weka. viii

10 1 INTRODUÇÃO Nos últimos anos, pôde-se notar um grande aumento no armazenamento de dados em meios magnéticos. Esses dados produzidos e armazenados em grande escala ficam inviáveis de serem analisados por especialistas através de métodos tradicionais, tais como planilhas de cálculos e relatórios informativos operacionais, onde o especialista testa sua hipótese contra a base de dados. Entretanto, um grande armazenamento de dados equivale a um maior potencial de informação (AURÉLIO, VELLASCO & LOPES, 1999). Atualmente, as organizações aumentaram o investimento em equipamentos e aplicativos para aperfeiçoar o armazenamento, gerenciamento e compreensão dos seus dados. As bases de dados não são mais interpretadas apenas como um local de armazenamento de informações, e sim como um importante patrimônio da organização (SEN & JACOB, 1998 apud OLIVEIRA, 2000, p.1). Durante anos, métodos manuais foram utilizados para transformar dados em conhecimento. Entretanto, a utilização desses métodos tem se tornado muito caro e inviáveis quando aplicados a grandes bases de dados (FAYYAD, PIATETSKY-CHAPIRO, & SMYTH, 1996a apud DOMINGUES, 2004, p.1). Devido aos problemas com os métodos manuais, surgiu a necessidade em desenvolver processos de análise automática, como o Processo de Extração do Conhecimento em Bases de Dados ou Mineração de Dados (MD). Esse processo de natureza iterativa, e interativa, tem despontado por seu desempenho em vários domínios, por extrair padrões válidos, novos e com grande utilidade na tomada de decisão (ibidem). 1.1 PROBLEMATIZAÇÃO Este trabalho propõe aplicar tarefas de Mineração de Dados, para extrair informações dos dados armazenados pelo Sistema de Informação da Academia da UNIVALI, desenvolvido por Balbinotti (2006). A partir disto, os dados serão transformados em conhecimento, encontrando possíveis padrões nos dados através da utilização de algoritmos de Mineração de Dados, possibilitando um melhor aproveitamento dos dados armazenados que, de outra maneira, permaneceria escondido na base de dados.

11 Para Carvalho (2001), Mineração de Dados é a utilização de técnicas automáticas de exploração de grandes quantidades de dados de forma a descobrir novos padrões e relações que, devido ao volume de dados, não seriam facilmente descobertos a olho nu pelo ser humano Formulação do Problema A UNIVALI instalou no ginásio de esportes uma academia de musculação para atender os alunos, professores e funcionários da UNIVALI. Dois professores são responsáveis pelo atendimento e acompanhamento dos alunos. Inicialmente, as informações referentes aos alunos eram coletadas a partir da aplicação de um questionário. As informações coletadas eram preenchidas manualmente em fichas de cartolina, que posteriormente eram armazenadas em um fichário (BALBINOTTI, 2006). Para gerar a prescrição da atividade física, ou seja, a lista de exercícios que o aluno deve seguir, o profissional de Educação Física tinha que analisar as informações contidas nas fichas e decidir quais aparelhos utilizar, suas repetições, pesos e intervalos para cada aluno. O maior problema encontrado pelos professores da academia era analisar essas fichas, devido a pouca informação contida nestas fichas. Outra dificuldade encontrada era o acompanhamento de alguns alunos, devido à inexistência de uma ferramenta que auxiliasse o profissional de Educação Física na analise do crescimento e desenvolvimento específico de cada aluno. Mediante tal situação, uma solução foi proposta por Balbinotti (2006), que desenvolveu uma ferramenta baseada em Sistemas Especialistas e Raciocínio Baseado em Casos (RBC) para auxiliar os profissionais de Educação Física na prática desportiva na UNIVALI, auxiliando na tomada de decisão na hora da escolha do programa de exercícios. RBC consiste em resolver um novo problema com base na adaptação de soluções de problemas similares já conhecidas (WANGENHEIM & WANGENHEIM, 2003). Balbinotti (2006) utilizou RBC para auxiliar na escolha do programa de exercícios do aluno. Entretanto, identificou-se uma limitação na solução proposta, em que o foco principal é gerar uma lista de exercícios para auxiliar na escolha da programação da atividade física a ser seguida por um aluno, após identificar um grau de similaridade com casos ocorridos anteriormente. Com base nessas informações, pode-se concluir que o sistema não está utilizando com maior 2

12 aproveitamento o grande número de dados e informações armazenadas, motivando o desenvolvimento de uma nova alternativa para o problema Solução Proposta A proposta deste projeto é demonstrar a aplicação da técnica de mineração de dados, usando como estudo de caso a base de dados do Sistema de Informação da academia da UNIVALI, com a utilização de algoritmos de mineração de dados, para uma possível descoberta de novas correlações, padrões e tendências significativas por meio da análise dos dados armazenados. Esse trabalho se concentrará em três tarefas da mineração de dados que são: regras de associação, classificação e agrupamento. Regras de associação procuram determinar que fatos ocorram simultaneamente com probabilidade razoável ou que itens estão presentes juntos com certa chance (CARVALHO, 2001). Para Baptista e Carvalho (2003), regras de associações procuram identificar afinidades entre registros de um subconjunto de dados. Sendo essas afinidades/associações expressas na forma de regras. Segundo Aurélio et al. (1999), a classificação é a tarefa mais estudada em KDD e tem como objetivo descobrir um conhecimento que possa ser utilizado para prever a classe de um registro. Silva (2003) diz que a classificação busca examinar um conjunto de registros rotulados e elaborar descrições das características dos registros em cada uma das classes. Para Carvalho (2001), a classificação é uma das técnicas mais utilizadas no data mining simplesmente porque é uma das tarefas cognitivas humanas mais realizadas no auxilio à compreensão do ambiente em que vivemos. Por mais semelhante que algo possa ser, nada é exatamente igual. Isso faz com que seja preciso diminuir as exigências de igualdade e permitir que detalhes sejam desprezados e observar apenas características principais. Já o agrupamento é uma tarefa que tem como objetivo segmentar os dados formando grupos homogêneos. Conforme Carvalho (2001), agrupar é classificar uma massa de dados em classes desconhecidas. Para Silva (2003), o agrupamento é aplicado quando ainda não é conhecida nenhuma classe e sua função é produzir uma segmentação do conjunto de registros de entrada de acordo com algum critério. 3

13 Com a utilização dessas três tarefas de mineração de dados, objetiva-se encontrar alguma informação útil nos dados, procurando encontrar alguma particularidade que possa melhorar o atendimento dos atletas, ou encontrar alguma outra informação relevante, estudo que será alvo ao longo da primeira etapa do Trabalho de Conclusão de Curso (TCC). O desenvolvimento deste projeto se justifica como um TCC para o Curso de Ciência da Computação, pois se trata do processo de extrair o conhecimento de um grande volume de dados, identificando padrões e tendências significativas por meio da análise dos dados armazenados que, de outra maneira, permaneceria escondido na base de dados. Esse trabalho aplica conhecimentos adquiridos no decorrer do curso, principalmente os relacionados a banco de dados e Inteligência Artificial. 1.2 OBJETIVOS Objetivo Geral Desenvolvimento de uma aplicação que utilize mineração de dados para descoberta de conhecimento contido na base de dados do Sistema de Informação da academia da UNIVALI Objetivos Específicos Os objetivos específicos deste projeto de pesquisa são: Pesquisar e analisar soluções similares; Adquirir conhecimento sobre mineração de dados; Pesquisar sobre ferramentas de mineração de dados; Determinar as variáveis de interesse para as tarefas de mineração de dados; Determinar os requisitos exigidos para o sistema; Realizar a modelagem conceitual do sistema; Implementar o sistema; Testar e validar a implementação do sistema; e Documentar o desenvolvimento e os resultados do sistema. 4

14 1.3 METODOLOGIA O presente TCC consiste no desenvolvimento de uma aplicação que utilize mineração de dados para descoberta de conhecimento contido na base de dados do Sistema de Informação da academia da UNIVALI. Para executar este projeto de pesquisa foram estipuladas 5 etapas. As duas primeiras etapas e parte da quinta etapa foram executadas no TCCI, que consiste na análise da tecnologia envolvida, modelagem do sistema e documentação. As demais etapas foram executadas no TCCII, elas compreendem o desenvolvimento, validação e documentação do sistema. A metodologia para executar as atividades contidas nas etapas é apresentada a seguir. Inicialmente foi necessário fazer leituras e levantamento de conceitos sobre a descoberta de conhecimento em bases de dados e mineração de dados, para adquirir um maior conhecimento sobre o assunto abordado neste projeto. A pesquisa foi feita através de livros, textos selecionados em sites e principalmente através de monografias e dissertações, que também serviram para a revisão bibliográfica deste trabalho. Na primeira etapa também foram pesquisados trabalhos acadêmicos de desenvolvimento de aplicações semelhantes, para depois identificar a tecnologia necessária à implementação do sistema. No início do TCCI já se tinha conhecimento da ferramenta de mineração de dados Weka, contudo, foram pesquisadas outras ferramentas para buscar características semelhantes tais como: possibilidade da utilização de recursos via API e ser disponibilizada gratuitamente. Porém não foi encontrada nenhuma outra ferramenta com essas características, sendo assim, adotou-se a ferramenta Weka para dar suporte a mineração de dados neste projeto. Testes referentes à integração com esta ferramenta foram realizados, que podem ser verificados no capítulo de Fundamentação Teórica. Após analisar a base de dados do Sistema de Informação proposto para a academia da UNIVALI, foram estipuladas as variáveis de interesse para a realização das tarefas de mineração de dados. Já na segunda etapa, foi feita a análise e projeto do sistema. Foram feitas as definições e documentação do sistema a ser desenvolvido, foram definidos os requisitos funcionais e não funcionais, diagrama de casos de uso, também foi definida a interface com o usuário, utilizando a 5

15 metodologia da notação Unified Modelling Language (UML) para modelar o sistema, através da ferramenta Enterprise Architect. A etapa de documentação contemplou todos os processos referentes às etapas: (i) leitura e levantamento de conceitos e (ii) análise e projeto, seguindo as normas exigidas pela Coordenação de TCC. Esta etapa foi concluída no TCCII. 1.4 ESTRUTURA DO TRABALHO Este trabalho está dividido em quatro capítulos: Introdução, Fundamentação Teórica, Desenvolvimento e Conclusões. O Capítulo 1, Introdução, apresentou uma visão geral do trabalho, estabelecendo os objetivos, descrevendo a metodologia de desenvolvimento e a estrutura da pesquisa. No Capítulo 2, Fundamentação Teórica, é apresentada toda teoria contida neste trabalho. Este capítulo está dividido em seis sessões: A Academia de Musculação da UNIVALI: apresenta uma visão geral sobre a academia, a descrição sobre o Sistema de Informação que foi desenvolvido para academia e seu funcionamento; Inteligência Artificial: uma breve descrição sobre Inteligência Artificial; Descoberta de conhecimento em bases de dados: apresenta as características dessa área da Inteligência Artificial; Mineração de Dados: descrição de conceitos tais como: definições, características, dentre outros; Soluções Similares: apresenta soluções similares pesquisadas; e Ferramentas de mineração de dados: apresenta as características de algumas ferramentas pesquisadas. O Capítulo 3 apresenta o desenvolvimento do projeto, a modelagem do sistema bem como os detalhes técnicos necessários para a implementação do sistema. 6

16 No Capítulo 4, Conclusões, é apresentada a conclusão deste projeto, descreve sobre os resultados obtidos, problemas encontrados, objetivos conquistados, dentre outros. 7

17 2 FUNDAMENTAÇÃO TEÓRICA Este capítulo aborda os conceitos necessários ao desenvolvimento do sistema, tais como: descoberta de conhecimento em bases de dados, mineração de dados e ferramentas de mineração de dados. Esse TCC é fundamentado em livros e principalmente em monografias e dissertações. 2.1 A ACADEMIA DE MUSCULAÇÃO DA UNIVALI A UNIVALI possui uma academia de musculação, que foi instalada no ginásio de esportes, em uma sala equipada com 35 aparelhos para a prática desportiva, possui uma televisão, um microcomputador PC e um aparelho de som, dois professores são responsáveis em atender os alunos, com diferentes faixas etárias e objetivos distintos. São atendidos alunos, professores e funcionários da UNIVALI, bem como os alunos do Colégio de Aplicação da UNIVALI (CAU). O atendimento da academia de musculação é oferecido de segunda a sexta-feira durante todo o ano letivo, sendo que no período de férias a academia é fechada. Os horários disponíveis para a prática desportiva iniciam ás 06h50min e encerram ás 21h20min. A princípio, o cadastro das informações dos alunos da academia de musculação da UNIVALI, era efetuado após a aplicação de um questionário em que o aluno respondia questões específicas como: objetivo, nível de atividade física, e questões abrangentes como: nome, endereço, etc. As informações coletadas eram preenchidas manualmente em fichas de cartolina, que se diferenciavam pelas cores: azul para os homens e rosa para as mulheres. Essas informações eram armazenadas em um fichário (BALBINOTTI, 2006). O profissional de Educação Física tinha que analisar as informações contidas nestas fichas e tomar uma decisão sobre o tipo de aparelho necessário, suas repetições, pesos e intervalos para tal pessoa. Muitas vezes a análise não era bem sucedida devido a pouca informação contida nesta ficha. Outra preocupação era o acompanhamento de alguns atletas, pois ficava difícil para o profissional de Educação Física analisar o crescimento e desenvolvimento específico do atleta por não ter ferramentas que auxiliassem em seu trabalho.

18 2.1.1 O Sistema de Informação desenvolvido para Academia Devido à necessidade do acompanhamento de alguns atletas, uma solução foi proposta por Balbinotti (2006), foi desenvolvida uma ferramenta baseada em Sistemas Especialistas e Raciocínio Baseado em Casos para auxiliar os profissionais de Educação Física na prática desportiva na UNIVALI, auxiliando na tomada de decisão na hora da escolha do programa de exercícios. Para Fernandes (2003), o processo característico do RBC, Raciocínio Baseado em Casos, consiste em identificar o problema atual, buscar a experiência mais semelhante na memória e aplicar o conhecimento desta experiência passada no problema atual. RBC consiste em resolver um novo problema com base na adaptação de soluções de problemas similares já conhecidas (WANGENHEIM e WANGENHEIM, 2003). Balbinotti (2006) utilizou RBC para auxiliar na escolha do programa de exercícios do aluno. O Sistema de Informação foi desenvolvido principalmente para gerar uma lista de exercícios para auxiliar na escolha da programação da atividade física a ser seguida por um aluno, após identificar um grau de similaridade com casos ocorridos anteriormente Funcionamento do Sistema de Informação A prescrição da atividade física é gerada pelo sistema após efetuar duas etapas, o cadastramento do aluno e posteriormente a etapa de avaliação física do aluno. Basicamente a prescrição da atividade física é gerada após um aluno informar qual é seu objetivo em ingressar na academia, em seguida é efetuado o cadastro do aluno e cadastro de avaliação física, o sistema percorre a base de casos, procurando registros com maior similaridade retornando uma lista de exercícios (BALBINOTTI, 2006). Após o usuário estar autenticado no sistema, é apresentada a tela principal, com todas as opções disponíveis para aquele usuário como mostra a Figura 1. 9

19 Figura 1. Tela principal Fonte: Balbinotti (2006). Logo após, o usuário seleciona no menu a opção ATUALIZAÇÕES/ALUNOS, e efetua o cadastro do aluno. Na etapa de cadastramento do aluno são coletadas informações como: nome, endereço, sexo, idade, objetivo do aluno, etc. Após efetuar o cadastramento do aluno é necessário fazer a avaliação física do aluno (ibidem). O usuário seleciona no menu a opção TRANSAÇÕES/AVALIAÇÃO FÍSICA e o sistema apresenta a tela de avaliação de alunos como mostra a Figura 2: 10

20 Figura 2. Tela de Avaliação de Alunos Fonte: Balbinotti (2006). A etapa de avaliação física é dividida em sete etapas, que são: Cadastro de Anamnese de Risco: etapa onde o usuário responde questões sobre antecedentes familiares com problema cardíaco, se pratica alguma atividade física, se a pessoa foi ou é fumante, se tem a pressão arterial dentro do limite, dentre outras; Cadastro de Anamnese Clínica: armazena informações sobre aspecto cardiorespiratório, se fez cirurgias recentes, se utiliza algum medicamento, se possui reações alérgicas, dentre outras; Cadastro de Antropometria: são cadastradas as medidas corporais do aluno, por exemplo: altura, circunferência, envergaduras e dobras; Cadastro do índice de massa corporal: verifica se o aluno esta obeso, acima do peso, peso normal ou abaixo do peso; Cadastro do Índice de atividade física: o índice é gerado após informar se o aluno pratica alguma atividade física, qual a intensidade, duração e freqüência; Cadastro da Pressão arterial: após informar a pressão Diastólica e Sistólica o sistema retorna se o aluno tem pressão normal ou se sofre de hipertensão; e Cadastro de aspecto hemodinâmico: após aplicação do teste de caminhada na esteira 2400m e o teste de corrida 1200m, são coletadas as informação sobre o tempo gasto para realizar os testes. A partir disto é calculado e cadastrado o volume de oxigênio do aluno. 11

21 Após o usuário ter efetuado o cadastro do aluno e a avaliação física do aluno o sistema habilita o botão com a opção programação, o usuário seleciona a opção programação, depois disto o sistema apresenta a tela de ficha de programação, com uma lista de sugestões de atividade física onde o usuário pode aceitar alguma sugestão ou adicionar uma nova lista de exercícios, como mostra a Figura 3 (ibidem). Figura 3. Tela de Ficha de Programação Muscular Fonte: Balbinotti (2006). Caso o usuário decida adicionar uma nova lista de exercícios físicos, esta será adiciona ao banco de dados alimentando a base de casos para uma futura busca por similaridade a partir da entrada de dados de um novo aluno (ibidem). 12

22 2.2 INTELIGÊNCIA ARTIFICIAL O presente TCC visa desenvolver uma aplicação que utilize a técnica de Mineração de Dados (MD). Para isso, identificou-se que a MD é uma área das várias áreas contidas na Inteligência Artificial (IA), e também uma maneira de se utilizar a IA. A IA busca prover máquinas com a capacidade de realizar algumas atividades mentais do ser humano (NASCIMENTO JR & YONEYAMA, 2000). Para Feigenbaum (1992, apud FERNANDES, 2003), IA é uma área da ciência da computação destinada ao desenvolvimento de sistemas computacionais inteligentes, com características que se assemelham com as do ser humano, tais como: a compreensão da linguagem, aprendizado, raciocínio, tomada de decisão, dentre outras. 2.3 DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS Descoberta de conhecimento em bases de dados é o processo não trivial de identificar em dados padrões que sejam válidos, novos (ainda não identificados), potencialmente úteis e compreensíveis, visando melhorar o entendimento de um problema ou um procedimento de tomada de decisão (FAYYAD et al apud SILVA 2004). A técnica de descobrir padrões úteis em dados não processados recebeu diversos nomes, dentre eles Knowledge Discovery in Database (KDD, ou em português, Descoberta de Conhecimento em Bases de Dados), Data Mining (DM, ou em português, Mineração de Dados), extração de conhecimento, descoberta de informação, processamento de padrões de dados. O termo KDD foi criado em 1989 para referenciar o processo de descoberta de conhecimento em dados e, principalmente, a etapa de mineração de dados, esta que transforma dados em informação (MANNILA 1997 apud PIETRO, 2006). Segundo Collazos e Barreto (2003), o KDD é uma técnica que possibilita analisar grandes conjuntos de dados, utilizando métodos aproximados. A metodologia do KDD constitui-se em duas etapas fundamentais, o armazém de dados e a MD. Primeiro faz-se necessário criar uma base de dados organizada e com suficientes dados sobre o assunto a analisar, em seguida utilizar métodos aproximados que permitem minerar os dados, para a descoberta das relações contidas em tais dados. 13

23 Para Pacheco et al. (1999), o processo de KDD é composto por cinco etapas: o Data Warehounsing (DW), o Pré-processamento, o Enriquecimento, a Mineração de Dados e o Pósprocessamento. A Figura 4 mostra uma visão sistemática do processo de KDD, de forma hierárquica, onde as fases e principais tarefas do processo de KDD, tais como: tarefas e algoritmos empregados; fases; e etapas do pré-processamento (AURÉLIO et al. 1999). Figura 4. Taxonomia do processo de KDD Fonte: Adaptado de Aurélio, et al. (1999). Para Suliman Jr. e Souza (1997) as fases que fazem parte do processo de DCBD são: Desenvolver a compreensão do domínio da aplicação, o conhecimento anterior relevante e os objetivos do usuário final; Criar um conjunto alvo de dados em que a prospecção deverá ser efetuada; Realizar a redução e projeção de dados, reduzindo o número efetivo de variáveis consideradas ou encontrar representações não variáveis para os referidos dados; Escolher as tarefas de MD: decidindo se o objetivo do processo de DCBD é a classificação, associação, agrupamento ou outro; 14

24 Escolher os algoritmos de MD, selecionando métodos para o uso na busca de padrões nos dados; Mineração de dados; Interpretações dos padrões obtidos; e Consolidação do conhecimento. Conforme afirma Aurélio et al. (1999), a utilização da técnica de KDD em sistemas de análise está relacionada a várias aplicações: marketing, análises corporativas, medicina, biologia, entre outras. Existem diversa tarefas de KDD, cada uma está diretamente relacionada ao domínio da aplicação e interesse do usuário. Cada tarefa de KDD extrai um tipo diferente de conhecimento do banco de dados, com isso, necessita de um algoritmo diferente para cada tarefa Compreensão do Domínio de Aplicação Um fator importante no processo de DCBD é o entendimento do domínio da aplicação, de onde será extraído o conhecimento necessário para apoiar a tomada de decisão. Para isso, surge a necessidade de identificar quais são os objetivos e requisitos necessários para que seja possível extrair e incorporar o conhecimento adquirido. Segundo Oliveira (2000) não existe um procedimento padrão que estabeleça um domínio de aplicação, pois cada caso tem suas características e particularidades próprias. Entretanto, alguns aspectos relevantes podem servir de suporte a identificação do domínio da aplicação, como: Definição dos objetivos e dos requisitos da extração de conhecimento; Identificação das possíveis fontes de dados; Pesquisa do conhecimento prévio existente; Modo de distribuição do conhecimento extraído; Utilização do conhecimento extraído num sistema de tomada de decisão; e Estudo de viabilidade e custos da aplicação do processo. Após a definição do domínio da aplicação, deve-se selecionar e preparar os dados para serem analisados posteriormente. 15

25 2.3.2 Data Warehouse Um Data Warehouse é banco de dados elaborado com a finalidade de dar suporte ao processo decisório, onde os dados que o povoarão são obtidos através dos bancos de dados dos aplicativos operacionais disponíveis. Segundo Inmon (1997), um DW é um conjunto de dados baseado em assuntos, integrado, não volátil, e variável em relação ao tempo, que tem por objetivo dar suporte aos processos de tomada de decisão gerenciais. Para Aurélio et al. (1999), um DW pode ser definido como um repositório integrado, orientado para análise, histórico, com dados apenas para leitura, destinados apenas para ser utilizado como base para suporte a decisão e sistema KDD. A tecnologia de DW surgiu com o objetivo de suprir as carências nos sistemas tradicionais, quanto à exploração e análise dos dados, integrando e consolidando dados de diferentes acervos (DEBATIN, 2003). O DW é uma arquitetura que organiza, totaliza e armazena os dados permitindo traçar estratégias baseadas nos assuntos da empresa de maneira confiável dando suporte ao nível gerencial nas tomadas de decisão. O objetivo de um DW é fornecer uma "imagem única da realidade do negócio". De uma forma geral, sistemas de DW compreendem um conjunto de programas que extraem dados do ambiente de dados operacionais da empresa, um banco de dados que os mantém, e sistemas que fornecem estes dados aos seus usuários Características do Data Warehouse Dentre as principais características do Data Warehouse pode-se citar a orientação por assunto, a integração dos dados, a variabilidade no tempo e não volatilidade. Orientação por Assunto Segundo Machado (2001), orientação por assunto significa que um DW armazena as informações por assuntos de interesse da empresa que são mais importantes, em contraste com os sistemas operacionais que são orientados a processos desenvolvidos para manter as transações realizadas diariamente. 16

26 Integrado Segundo Colaço Júnior (2004) o DW deve consolidar dados de diversas origens, o que geralmente envolve diversas codificações. Os dados devem ser perfeitamente integrados para que, quando forem armazenados assumam uma única convenção. Variante no tempo Os dados contidos em um sistema de DW são temporais, e referem-se a períodos de tempos bem definidos, e isto auxilia na análise e na confirmação de acontecimentos sazonais dentro de uma determinada atividade ou setor de um negócio. Para Aurélio, Vellasco e Lopes (1999), o horizonte de tempo válido para o DW é significantemente maior do que o dos sistemas operacionais. Um horizonte de tempo de 60 a 90 dias é normal para os sistemas operacionais; um horizonte de tempo de 5 a 10 anos é normal para o DW. Não Volátil Segundo Inmon (1997), as operações de atualização, modificação, exclusão de dados são realizadas nos bancos de dados operacionais. Estas funções são efetuadas regularmente de acordo com as necessidades dos usuários. No DW o processo de armazenamento dos dados é diferente. O DW possui duas operações básicas que consiste em carregar e acessar os dados. No nível do DW os dados não sofrem alterações ou são excluídos, para cada alteração é inserido um novo registro com os mesmos dados e contendo a alteração Arquitetura do Data Warehouse Segundo Debatin (2003), a arquitetura do DW é baseada em um sistema de banco de dados relacional. Quando um dado é inserido em um DW, ele é transformado em uma estrutura integrada. O processo pode envolver filtragem e compactação de dados. A Figura 5 mostra uma visão simplificada de uma arquitetura de DW. 17

27 Figura 5. Visão simplificada de uma arquitetura de DW Fonte: Adaptado de Costa e Anciães (2003). Um DW deve ser capaz de responder a consultas avançadas de maneira rápida, sem deixar de mostrar detalhes relevantes à resposta. Para isso ele deve possuir uma arquitetura que lhe permita coletar, manipular e apresentar os dados de forma eficiente e rápida. O estudo de uma arquitetura permite compreender como o DW faz para armazenar, integrar, comunicar, processar e apresentar os dados que os usuários utilizarão em suas decisões. Um DW pode variar sua arquitetura conforme o tipo de assunto abordado, pois as necessidades variam de empresa para empresa (COLAÇO JÚNIOR, 2004) Pré-Processamento Segundo Pacheco et al. (1999), a etapa de pré-processamento é responsável por consolidar as informações relevantes para o algoritmo minerador, com objetivo de reduzir a complexidade do problema. O processo de tratamento dos dados pode ser dividido em três etapas: Limpeza dos dados: etapa responsável por realizar a consistência dos dados, a correção de possíveis erros e o preenchimento e eliminação de valores nulos e redundantes. Conforme afirma Aurélio et al. (1999), a execução dessa fase corrige a base de dados eliminando consultas desnecessárias que seriam executadas pelo algoritmo minerador e que afetariam o seu processamento; Seleção dos dados: etapa que irá definir ou escolher apenas os atributos relevantes do conjunto de atributos existentes na base de dados; e 18

28 Codificação dos dados: etapa que divide os valores contínuos dos atributos em uma lista de intervalos representados por um código, convertendo valores quantitativos em valores categóricos. Para Aurélio et al. (1999), em alguns casos a transformação de um valor em um equivalente pode facilitar a MD a encontrar seu objetivo com melhor qualidade de resultados Mineração de Dados A Mineração de Dados (MD) é uma área multidisciplinar que incorpora técnicas utilizadas em diversas áreas como IA (especialmente a aprendizagem de máquina), Banco de Dados (recursos para manipular grandes volumes de dados) e Estatística (comumente na avaliação e validação dos dados), conforme é mostrado na Figura 6. Figura 6. MD utiliza recursos de diferentes áreas Fonte: Silva (2003). A área de IA têm propiciado aos pesquisadores a possibilidade de utilizar diferentes técnicas para reconhecimento e extração de padrões. Essa extração está acompanhada de técnicas de manipulação de dados e análises posteriores. Todas essas diferentes técnicas compõem o processo de MD. A Descoberta de Conhecimento de Base de Dados (DCBD) é uma tecnologia que possui ferramentas poderosas para a descoberta eficiente de informações valorosas em grandes bancos de dados, com objetivo de auxiliar no suporte a decisão. MD é uma das ferramentas de DCBD mais 19

29 utilizadas, podendo ser considerada um passo dentro do processo de DCBD (FAYYAD et al., 1996b apud SILVA 2003). Para Dias (2002), os principais objetivos da MD são descobrir relacionamento entre os dados e fornecer subsídios para que possa ser feita uma previsão de tendências futuras baseadas no passado. Segundo Silveira (2004), a MD consiste em obter informações através de uma base de dados existente, usando seus atributos para extrair informações que não são óbvias e que precisam ser trabalhadas para serem úteis na tomada de decisão, através da utilização de algoritmos para identificar padrões nos dados analisados. Carvalho (2001) define a mineração de dados como a utilização de técnicas automáticas de exploração de grandes quantidades de dados de forma a descobrir novos padrões e relações que, devido ao volume de dados, não seriam facilmente descobertos a olho num pelo ser humano. Machado (2000), afirma que as técnicas de MD permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Este tipo de ferramenta utiliza-se das mais modernas técnicas de computação, como redes neurais, algoritmos genéricos e lógica nebulosa. MD tem sido definida como a extração não trivial da informação importante, implícita, previamente desconhecida, de dados. Ela usa o aprendizado de máquina, técnicas estatísticas e de visualização para descobrir e apresentar o conhecimento em uma forma facilmente compreensível pelos humanos. A MD tem se mostrado importante em um grande número de aplicações, por exemplo, na área de segurança para detectar fraudes em cartões de créditos, análises financeiras e de investimentos, detecção e predição de erros em grandes empresas, análise de informações, limpeza em bases de dados, marketing e melhoria no processo industrial. Como a extração do conhecimento útil e compreensível não se faz apenas com a manipulação de um conjunto de dados, a MD é um processo centrado na interação entre diferentes usuários, que geralmente são divididos em três classes: Especialista do domínio: usuário que deve possuir amplo conhecimento do domínio da aplicação e fornecer apoio à execução do processo; 20

30 Analista: usuário especialista no processo de MD e responsável por sua execução. Esse usuário deve ter domínio sobre o processo de DCBD; e Usuário Final: representa os usuários que utilizam o conhecimento extraído no processo de MD como apoio a tomada de decisão. A MD pode ser classificada em dois tipos: Descoberta direta onde fica explícito o que se deseja encontrar no banco de dados e Descoberta indireta, onde se faz uma espécie de busca aleatória, tentando identificar algum relacionamento entre os dados que representem algum conhecimento útil. A MD tem como objetivos a previsão e descrição de modelos. A previsão pode ser obtida através da utilização de variáveis contidas no banco de dados para prever valores desconhecidos ou futuros. A descrição envolve a descoberta de padrões interpretáveis pelos humanos. Dentro do processo de DCBD descrever modelos possui maior importância que prever os mesmos. A previsão e a descrição dos modelos são conseguidas selecionando as tarefas, algoritmos e técnicas de extração de dados (FAYYAD et al., 1996b apud SILVA 2003). Os algoritmos e as técnicas usados para se criar modelos a partir de dados, normalmente, provém de áreas como Aprendizado de Máquina, Reconhecimento de Padrões e Estatística. Estas técnicas, muitas vezes, podem ser combinadas para se obter melhores resultados (SILVA 2003). Conforme afirma Pacheco et al. (1999), as tarefas de DCBD que funcionam como bases das técnicas de MD são: Classificação, Associação e Agrupamento. Estas tarefas podem utilizar técnicas de MD baseadas em RBC, Redes Neurais Artificiais, Árvores de Decisão, Estatística, Computação Evolucionária, entre outras. Existem outras tarefas de DCBD utilizadas com menor escala, tais como: as consultas, a descoberta de dependência e a regressão. A Tabela 1 mostra as principais tarefas de DCBD e as técnicas mais utilizadas para MD. 21

31 Tabela 1. Algumas tarefas de KDD e suas técnicas de mineração de dados Tarefas de KDD Técnicas Associação Classificação Estatística e Teoria dos Conjuntos Algoritmos Genéricos, Redes Neurais e Árvores de decisão Clustering ou Agrupamento Redes Neurais e estatísticas Previsão de séries temporais Redes Neurais, Lógica Nebulosa e Estatística Fonte: Adaptado de Aurélio et al. (1999). Existem diversa tarefas de DCBD, cada uma está diretamente relacionada ao domínio da aplicação e interesse do usuário. Cada tarefa de DCBD extrai um tipo diferente de conhecimento do banco de dados, com isso, necessita de um algoritmo diferente para cada tarefa Tarefas da DCBD Com o crescimento dos sistemas de MD desenvolvidos para os mais diferentes domínios, a variedade de tarefas para MD vem se tornando cada vez mais diversificada. Essas tarefas podem extrair diferentes tipos de conhecimento, sendo que, inicialmente faz-se necessário decidir qual o tipo de conhecimento que o algoritmo deve extrair no processo de MD. Regras de Associação A tarefa de associação permite relacionar a ocorrência de um determinado conjunto de itens com a ocorrência de outro conjunto de itens. Para Carvalho (2001), regras de associação procuram determinar que fatos ocorram simultaneamente com probabilidade razoável ou que itens estão presentes juntos com certa chance. Segundo Baptista e Carvalho (2003), regras de associações procuram identificar afinidades entre registros de um subconjunto de dados. Sendo essas afinidades/associações expressas na forma de regras. Uma regra de associação caracteriza o quanto a presença de um conjunto de itens nos registros de uma base de dados implica na presença de algum outro conjunto distinto de itens nos mesmos registros (AGRAVAL & SRIKANT, 1994 apud DOMINGUES, 2004). 22

32 Uma regra de associação é uma regra do tipo X Y, onde X e Y são conjuntos de itens, e a interseção deles X Y é o conjunto vazio. Cada regra de associação é associada a um fator suporte superior FSup, e a um fator de confidência FConf. O FSup é defenido como, FSup = X U Y / N, ou seja, esta fórmula representa a razão do número de tuplas que satisfazem ambos X e Y sobre o número total de tuplas, representado por N. FConf é definido como, FConf = X U Y / X, o fator de confiança é obtido pela razão do número de tuplas que satisfazem ambos X e Y sobre o número de tuplas que satisfazem X (AURÉLIO, et al. 1999). Para facilitar o entendimento das regras de associação, pode-se exemplificar com o modelo abaixo representado pela Tabela 2, que mostra uma tabela com os dados de entrada e algumas regras de associação descobertas após a análise da base de dados. Tabela 2. Entrada de dados para a descoberta de regras de associação. MASCULINO FEMININO HIPERTROFIA ESTÉTICA PESO NORMAL ACIMA DO PESO Sim Não Sim Sim Sim Não Não Sim Não Sim Não Sim Não Sim Não Não Sim Não Sim Não Sim Não Não Sim Sim Não Sim Não Sim Não Sim Não Sim Sim Sim Não Não Sim Sim Não Não Sim Não Sim Não Sim Sim Não Sim Não Sim Não Sim Não Não Sim Sim Sim Não Sim Sim Não Sim Não Não Sim Não Sim Sim Sim Não Sim Não Sim Sim Não Sim Não Sim Não Não Não Sim Não Não Sim Não Sim Não Sim Sim Não Sim Sim Sim Não 23

33 Após processar os dados da Tabela 2 utilizando a ferramenta de MD Weka, com o algoritmo apriori, algumas regras de associação foram geradas como mostra a Figura 7. Figura 7. Regras de associação geradas pelo algoritmo apriori. Classificação Segundo Aurélio et al. (1999), a classificação é a tarefa mais estudada em KDD e tem como objetivo descobrir um conhecimento que possa ser utilizado para prever a classe de um registro. Para Carvalho (2001), a classificação é uma das técnicas mais utilizadas no data mining simplesmente porque é uma das tarefas cognitivas humanas mais realizadas no auxilio à compreensão do ambiente em que vivemos. Já para Baptista e Carvalho (2003), a classificação trata-se de uma técnica que consiste na aplicação de um conjunto de exemplos pré-classificados, para desenvolver um modelo capaz de classificar uma população maior de registros. Conforme afirma Romão (2002), o objetivo da tarefa de classificação é descobrir um relacionamento entre um atributo meta, pré-definido, e um conjunto de atributos previsores. A Tabela 3 será utilizada como exemplo para mostrar algumas regras de classificação que podem ser descobertas após a aplicação de um algoritmo de classificação. 24

34 Tabela 3. Entrada de dados para a tarefa de classificação. SEXO OBJETIVO IDADE ACIMA DO PESO Masculino Hipertrofia 25 Sim Masculino Estética 21 Sim Feminino Hipertrofia 23 Sim Feminino Estética 34 Sim Feminino Hipertrofia 30 Não Masculino Estética 21 Não Masculino Hipertrofia 20 Não Feminino Condicionamento 18 Não Feminino Hipertrofia 34 Não Masculino Condicionamento 55 Não Após processar os dados da Tabela 3 utilizando a ferramenta de MD Weka, com o algoritmo classificador NNge, algumas regras de classificação foram geradas como mostra a Figura 8. Figura 8. Regras de classificação geradas pelo algoritmo NNge. Regras do tipo SE... ENTÃO..., constituem uma forma de representação simbólica e possuem o seguinte formato: SE <antecedente> ENTÃO <conseqüente>. O antecedente é formado por expressões condicionais envolvendo atributos do domínio da aplicação existentes no banco de dados. Já o conseqüente, é composto por uma expressão que evidencia algum valor para um atributo meta, descoberto em função dos valores contidos nos atributos que compõem o antecedente (ROMÃO, 2002). 25

35 As regras de classificação podem ser interpretadas como: SE os atributos preditivos de uma tupla satisfazem as condições no antecedente da regra, ENTÃO a tupla tem a classe indicada no conseqüente da regra. Para Pereira (2004), as árvores de decisão são consideradas pela comunidade científica como uma importante técnica para implementar a tarefa de Classificação, devido a sua representação simples e intuitiva, fácil de ser compreendida. Agrupamento A principal característica desta tarefa é descobrir grupos utilizando a similaridade dos valores de seus atributos como fator de decisão. Para Carvalho (2001), o agrupamento é um método que tenta baseado em medidas de semelhança, definir quantas e quais classes existem em um conjunto de entidades. O agrupamento é uma tarefa que tem como objetivo segmentar os dados formando grupos homogêneos. Conforme afirma Carvalho (2001), agrupar é classificar uma massa de dados em classes desconhecidas. Para Silva (2003), o agrupamento é aplicado quando ainda não é conhecida nenhuma classe e sua função é produzir uma segmentação do conjunto de registros de entrada de acordo com algum critério. Segundo Pacheco et al. (1999) a utilização do agrupamento tem como meta principal criar classes através de partições do banco de dados em conjunto com tuplas. Essa partição é feita agrupando tuplas com valores de atributos semelhantes em uma mesma classe. Após a criação destas classes, é possível aplicar algoritmos de classificação para produzir regras para as mesmas. Conforme Aurélio, et al. (1999), um bom agrupamento caracteriza-se pela produção de segmentos de alta qualidade, onde a similaridade intra-classe é alta e a inter-classe é baixa. Para Romão (2002), através da tarefa de agrupamento pode-se dividir os dados em subconjuntos homogêneos fáceis de descrever e visualizar. Estes dados podem ser exibidos para o usuário em vez de tentar mostrar todos os dados, o que usualmente resultaria na perda de padrões embutidos (FAYYAD, 1997 apud ROMÃO, 2002). Schenatz (2005) citou a possibilidade da utilização da tarefa de agrupamento, por exemplo, em um banco de dados escolar, relacionando alunos e disciplinas. Uma regra do tipo 85% dos alunos inscritos em Programação I também estão inscritos em Teoria da Computação pode ser 26

36 usada pela direção ou secretaria no planejamento do currículo anual, ou alocar recursos como sala de aula e professores Técnicas de Mineração de Dados De acordo com as tarefas a serem executadas e as classes de problemas em questão, existem diferentes técnicas de mineração e algoritmos que possibilitam a busca por padrões escondidos nos dados. Possuir certo conhecimento sobre essas técnicas, facilita no momento da escolha de uma delas de acordo com os problemas apresentados (SILVEIRA, 2003). A Tabela 4 apresenta as principais técnicas de mineração de dados, bem como suas descrições, tarefas e exemplos de algoritmos utilizados. Tabela 4. Técnicas de mineração de dados. Técnica Descrição Tarefas Exemplos Descoberta de Estabelece uma correlação estatística entre Associação Apriori, Regras de atributos de dados e conjuntos de dados AprioriTid, AIS. Associação Árvores de Hierarquização dos dados, baseada em Classificação CART, CHAID, decisão estágios de decisão (nós) e na separação de Regressão C5.0. classes e subconjuntos Raciocínio Baseado no método do vizinho mais Classificação BIRCH, baseado em próximo, combina e compara atributos Segmentação CLARANS. Casos para estabelecer hierarquia de semelhança Algoritmos Métodos gerais de busca e otimização, Classificação, Algoritmo Genéricos inspirados na Teoria da Evolução, onde a Segmentação Genético Simples, cada nova geração, soluções melhores têm Genitor, CHC. mais chance de terem descendentes Redes Neurais Modelos inspirados na fisiologia do Classificação, Perceptron, Rede cérebro, onde o conhecimento é fruto do Segmentação. MLP, Rede Time mapa das conexões neuronais e dos pesos Delay. dessas conexões Fonte: Adaptado de Dias (2002). 27

37 2.3.5 Pós-Processamento O pós-processamento é utilizado principalmente para avaliar o processo de descoberta, melhorar a compreensão e/ou selecionar conhecimento descoberto que seja mais relevante. Para Pacheco et al. (1999), esta fase envolve a interpretação do conhecimento descoberto, ou algum processamento deste conhecimento. O objetivo principal desta fase é melhorar a compreensão do conhecimento descoberto pelo algoritmo minerador através da análise dos dados por um especialista. Muitas vezes a mineração não traz resultados satisfatórios, sendo necessário uma outra etapa de Enriquecimento, esta que consegue agregar mais informações de forma que essas contribuam no processo de descoberta de conhecimento (PACHECO et al. 1999). Segundo Silva (2003) a etapa de pós-processamento é iniciada com a avaliação dos padrões realmente interessantes, que representem conhecimento útil, seguido da apresentação do conhecimento extraído para o usuário final, através de técnicas de visualização e representação do conhecimento. 2.4 SOLUÇÕES SIMILARES Esta seção tem o objetivo de apresentar soluções similares à proposta neste TCC desenvolvidas em trabalhos acadêmicos. Porém, não foram encontradas soluções similares específicas à proposta deste trabalho, somente soluções que utilizaram técnicas de IA no desenvolvimento de softwares para apoio a prática desportiva em geral. A seguir serão apresentadas duas propostas A IA entrando na quadra de vôlei: Scout inteligente O Scout Inteligente é um projeto de software que tem como objetivo principal o monitoramento de jogo de vôlei, através da utilização de técnicas de IA, que combinam agentes inteligentes e mineração de dados para auxiliar os técnicos na tomada de decisão. Existem vários softwares estatísticos que auxiliam nesta tarefa, tais como o Data Volley e o Scout Técnico, porém, são sistemas estatísticos de captura, cruzamento de dados e emissão de relatórios que não levam em consideração o histórico do jogador de toda uma temporada e o contexto de uma partida de vôlei (ZAMBERLAM et al. 2005). 28

38 A proposta do Scout Inteligente é utilizar um agente inteligente para fazer o papel de tutor da comissão técnica, interagindo com ela e com a base de dados criada, contendo informações semânticas e imagens/vídeos dos seus atletas e da equipe adversária ao longo de várias temporadas. Os vídeos dos jogos contendo as jogadas da equipe adversária, antes armazenados no banco, passarão por um processo de etiquetação semântica, em que serão informados atletas e seus posicionamentos, jogadas e finalizações. Podendo assim, serem utilizados não somente antes de um jogo, mas durante uma partida (ibidem). O papel do agente é de um auxiliar técnico com crenças, desejos e intenções. As crenças são informações do jogo em curso e de outros jogos armazenados na base de dados (como um histórico), contendo todas as situações de um jogo, como ataque, defesa, posicionamento dos jogadores. Os desejos são os estados do jogo a serem atingidos, situações mineradas da base de dados, decorrente da análise semântica descrita nas jogadas da equipe adversária mais os dados estatísticos da própria equipe. Finalmente, as intenções são representadas pelo planejamento e pela realização de ações em forma de jogadas efetivas a serem executadas pela própria equipe, previamente executadas por esse agente (ibidem). Dessa forma, será possível traçar táticas e estratégias simuladas previamente pelo agente auxiliar, o qual realizou inferências do ambiente (jogo) com base no resultado de um processo de mineração (ibidem) A informática e suas aplicações em educação física Este projeto de pesquisa propôs a confecção de uma ferramenta baseada em hipermídia voltada ao público de Educação Física. Com objetivo de agilizar e qualificar a prestação de serviços ao público em geral, bem como criar atendimentos mais personalizados (BERG et al. 2004). Foi desenvolvido tutorial envolvendo o tópico de saltos, compreendendo: aspectos fisiológicos nas faixas etárias de iniciação, uso de materiais alternativos nas aulas de atletismo, lesões mais freqüentes, materiais e regras (ibidem). O aplicativo utilizou multimídia interativa, possibilitando a interatividade com o usuário, e obtendo-se afinal uma aplicação hipermídia, como mostra a Figura 9. 29

39 Figura 9. Aplicação Hipermídia Fonte: Berg, Amaral, Streibel (2004). 2.5 FERRAMENTAS DE MINERAÇÃO DE DADOS Segundo Goebel & Gruenwald (1999 apud DIAS 2002), atualmente grande parte das ferramentas disponíveis são ferramentas derivadas da IA ou da comunidade de estatística. Muitas vezes, essas ferramentas não processam os dados diretamente na base de dados, necessitando a exportação e importação de dados, pré-processamento e pós-processamento dos dados e transformação dos dados, gastando um tempo razoável com a manipulação dos mesmos. Para escolher uma ferramenta de descoberta de conhecimento, devem ser observadas as seguintes características (ibidem): Facilidade de acesso em diferentes fontes de dados; A possibilidade de incluir modelos de dados orientados a objetos ou modelos não padronizados; O poder de processamento relacionado ao número máximo de tabelas/tuplas/atributos; A capacidade de processamento relacionado ao tamanho do banco de dados; Os diferentes tipos de atributos que a ferramenta pode manipular; e Tipo de linguagem de consulta. 30

40 Um esquema de classificação de características pode ser utilizado para analisar as ferramentas de descoberta de conhecimento e de mineração de dados. As características podem ser divididas em três grupos chamados características gerais, conectividade de banco de dados e características de mineração de dados (ibidem). As características citadas acima foram analisadas para a escolha da ferramenta a ser utilizada neste projeto, porém, optou-se pelo Weka devido principalmente a possibilidade da utilização de recursos via API e da ferramenta ser distribuída gratuitamente, características que não foram encontradas nas outras ferramentas pesquisadas Análise das ferramentas de mineração de dados No início do TCCI já se tinha conhecimento da ferramenta de mineração de dados Weka, uma ferramenta gratuita, com possibilidade de utilização de recursos via API, que possui código aberto e orientado a objetos. Entretanto, foram pesquisadas outras ferramentas de MD procurando encontrar características semelhantes à ferramenta Weka, mas não foram encontradas. Dentre as ferramentas pesquisadas, foram descritas duas ferramentas que mais se destacaram, Clementine e Enterprise Miner, com um quadro comparativo entre seus recursos. Após analisar as características das ferramentas apresentadas anteriormente, tais como: tarefas de mineração, algoritmos disponibilizados, conectividade com banco de dados, capacidade de manipulação com grandes quantidades de dados, possibilidade de manipular diferentes tipos de dados, utilização de recursos via API e o custo de aquisição da ferramenta, foi definida a ferramenta de mineração de dados para dar suporte a este projeto. A ferramenta Weka foi à escolhida, devido principalmente a possibilidade da utilização de recursos via API e da ferramenta ser distribuída gratuitamente, características que as outras ferramentas citadas não possuíam, e também pelo fato da ferramenta Weka ser citada por diversos autores como uma excelente ferramenta para dar suporte à mineração de dados. Entretanto, não se pode afirmar qual é a melhor ferramenta a ser utilizada, cada ferramenta possui características diferentes, possuindo pontos positivos e negativos, a escolha de uma ferramenta está diretamente relacionada aos objetivos que se pretende alcançar, no caso desse trabalho, a opção foi o Weka. 31

41 neste projeto. A Tabela 5 mostra de maneira resumida uma comparação entre as ferramentas apresentadas Tabela 5. Comparação entre as ferramentas de mineração de dados. Utilização de recursos via API Ferramenta Gratuita Clementine Não Não Enterprise Miner Não Não Weka Sim Sim As ferramentas Clementine e Enterprise Miner serão descritas nas seções e , respectivamente. A ferramenta Weka será descrita, bem como exemplificada a utilização de sua API, na seção Clementine O Clementine é uma ferramenta que possui uma interface gráfica que suporta a implementação das tarefas de mineração de dados. É possível a navegação por ícones que por sua vez representam as tarefas, o usuário percorre todo o processo de DCBD. O usuário pode arrastar esses ícones para a área de trabalho do Clementine criando uma seqüência de funções a serem executadas (CLEMENTINE, 2007). A ferramenta Clementine possibilita a utilização de tarefas de Classificação, Previsão, Clustering, Associação, Regressão. Outra característica marcante é a possibilidade de utilização das técnicas de Descoberta de regras de Associação (Apriori), Árvores de Decisão (C5.0, C&RT), Redes Neuronais (Kohonen, MLP, RBFN). A ferramenta suporta as plataformas HP/UX, IBM AIX, Sun Solaris, Windows (ibidem). Dentre os pontos positivos e negativos da ferramenta Clementine pode-se citar: Pontos positivos: O Clementine permite operar sobre grandes conjuntos de dados através de um modelo Cliente-Servidor. Pontos Negativos: A Ferramenta não é gratuita. 32

42 Enterprise Miner O Enterprise Miner implementa todo o processo DCBD recorrendo a um modelo próprio ao qual o SAS Institute denominou SEMMA Selecionar (Sample), Explorar (Explore), Modificar (Modify), Modelar (Model) e Avaliar (Assess) (SAS, 2007). A seleção dos dados é feita com a criação de tabelas. Estas devem possuir uma quantidade de dados suficientes e significativos, porém, as tabelas não podem ter um tamanho muito grande, o que tornaria lento o processo de descoberta. O Enterprise Miner possui um conjunto de ferramentas de análise que podem ser combinadas, possibilitando a criação e comparação de vários modelos. Possui também funcionalidades de pré-processamento dos dados, transformação de variáveis, amostragem e agrupamento dos dados, teste e validação. As suas ferramentas de visualização permitem uma fácil interpretação dos resultados extraídos (MATOS, 2004). A ferramenta Enterprise Miner possibilita a utilização das tarefas de Classificação, Previsão, Clustering, Associação, Regressão. Provê técnicas de Árvores de Decisão (CART, CHAID), Redes Neuronais (Kohonen, SOM, RBFN), Case-Based Reasoning. A ferramenta suporta as plataformas Cliente Windows; Servidor Unix, Windows (ibidem). Dentre os pontos positivos e negativos do Enterprise Miner pode-se citar: Pontos Positivos: Quantidade de tarefas e técnicas disponibilizadas. Pontos negativos: A Ferramenta não é gratuita Weka O Weka é uma ferramenta de DCBD que contempla uma série de algoritmos de preparação de dados, de aprendizagem de máquina (mineração) e de validação de resultados. Weka foi desenvolvido na Universidade de Waikato na Nova Zelândia, sendo escrito em Java e possuindo código aberto. O sistema possui uma interface gráfica amigável e seus algoritmos fornecem relatórios com dados analíticos e estatísticos do domínio minerado. A maioria de seus recursos podem ser utilizados através de sua interface gráfica, sendo que os demais, podem ser utilizados através de API s (SILVA, 2004). 33

43 O Weka foi implementado na linguagem Java, sua principal característica é a portabilidade, desta forma pode rodar em diversas plataformas, aproveitando também os benefícios de uma linguagem orientada a objetos, tais como: modularidade, polimorfismo, encapsulamento, reutilização de código dentre outros, além disso, é um software de domínio público estando disponível em Alguns métodos de classificação disponíveis no pacote Weka: Árvore de decisão induzida; Regras de aprendizagem; Naive Bayes; Tabelas de decisão; Regressão local de pesos; Aprendizado baseado em instância; Regressão lógica; Perceptron; e Perceptron multicamada. Alguns métodos para predição numérica: Regressão linear; Geradores de árvores modelo; Regressão local de pesos; Aprendizado baseado em instância; Tabelas de decisão; e Perceptron multicamadas. 34

44 O arquivo ARFF Segundo Silva (2004) o Weka possui um formato de arquivo próprio, o ARFF, deve-se descrever o domínio do atributo, pois o mesmo não pode ser obtido automaticamente pelo seu valor. Antes de utilizar algum algoritmo do pacote Weka, os dados devem ser convertidos para o formato ARFF que é constituído por três partes: Relação: a primeira linha do arquivo, que deve ser igual seguida de uma palavra-chave de identificação da relação; Atributos: um conjunto de linhas onde cada uma inicia seguida do nome do atributo e seguida do seu tipo, que podem ser nominais ou numéricos; e Dados: depois de uma linha Cada linha deve corresponder a uma instancia e deve ter valores separados por vírgula correspondentes dos atributos da seção atributos. A Figura 10 mostra um exemplo do formato do arquivo ARFF. Figura 10. Arquivo no formato ARFF Fonte: Adaptado de Silva (2004). Dentre os pontos positivos e negativos do Weka pode-se citar: Pontos positivos: Portabilidade, o weka possui código aberto e é gratuito. Também é possível a utilização de seus recursos via API s. 35

45 Pontos Negativos: Uma limitação da ferramenta é sua escalabilidade, e também limita o volume de dados a ser manipulado à dimensão de memória principal Testes de integração com a ferramenta Weka Após analisar algumas ferramentas de mineração de dados, foi escolhida a ferramenta Weka para dar suporte a MD neste TCC. Devido as suas características, tais como: portabilidade, contempla vários algoritmos de MD, possui o código aberto, linguagem orientada a objetos, seu ambiente provê o desenvolvimento de aplicações e script e é uma ferramenta gratuita. A integração da ferramenta Weka com a linguagem de programação Java, necessita de alguns requisitos, como: Ter o ambiente de desenvolvimento Java (J2SE, Java 2 Standard Edition) instalado, não basta ter somente a máquina virtual (J2SE Runtime Environment); e Ter a ferramenta Weka devidamente instalada. A princípio o teste de integração foi realizado com o ambiente de desenvolvimento Eclipse, em sua versão 3.1., porem, após analisar o ambiente de desenvolvimento NetBeans 5.0, evidenciouse que é mais simples a integração com a ferramenta Weka, pois não é necessário configurar variáveis de ambiente como acontecia com o Eclipse. A seguir serão mostrados os dois testes de integração, com o Eclipse e com o NetBeans respectivamente. O arquivo.arff utilizado para ambos os casos foi o arquivo weather.arff, um exemplo de arquivo que vem junto com o pacote Weka, sua estrutura pode ser visualizada na Figura

46 Figura 11. Exemplo do arquivo ARFF utilizado Integração com a IDE Eclipse Para a execução deste teste o ambiente de desenvolvimento utilizado foi o Eclipse, em sua versão 3.1. Inicialmente é necessário fazer algumas configurações no ambiente de desenvolvimento (Eclipse), para que o pacote Weka possa ser incluído nas classes do projeto teste, deve-se adicionar o arquivo weka.jar no inicio do projeto, configurando as variáveis de ambiente. Foi desenvolvida uma pequena aplicação teste, que compreendeu a execução de alguns passos, o funcionamento da aplicação teste é descrito a seguir. Inicialmente o programa apresenta uma tela com a opção de selecionar um arquivo para minerar, o usuário clica na opção selecionar e escolhe um arquivo no formato.arff e confirma, logo após o programa habilita um botão com a opção minerar, o usuário clica no botão minerar e o programa chama a classe do weka, processa o arquivo e apresenta o resultado em uma caixa de texto. Para este teste de integração foi utilizado o arquivo weather.arff, e o algoritmo foi o J48. A seguir o trecho de código da aplicação teste que executa o algoritmo J48. java cp /c/ weka-3-4/weka.jar weka.classifiers.trees.j48 -t /c/ weka-3-4/data/ weather.arff 37

47 Este código deve estar escrito em uma única linha. A opção cp foi utilizado para indicar o uso de um pacote adicional para a máquina vitual Java, este deve ser composto pelo caminho completo para localizar o arquivo weka.jar, neste caso o pacote Weka foi instalado em c/ weka-3-4/weka.jar. O nome da classe do algoritmo classificador é weka.classifiers.trees.j48. A opção t indica o nome do arquivo utilizado para ser executado o algoritmo minerador, no caso -t /c/ weka-3-4/data/ weather.arff. Após a execução do trecho de código apresentado, o seguinte resultado foi obtido como mostra a Figura 12. Figura 12. Resultado da classificação com o algoritmo J Integração com a IDE NetBeans Para a execução deste teste o ambiente de desenvolvimento utilizado foi a IDE NetBeans, em sua versão 5.0. Inicialmente é necessário criar um novo projeto dentro do NetBeans e dar um nome, por exemplo TesteWeka, após nomear o projeto, é necessário adicionar o arquivo weka.jar na pasta Libraries do projeto, para que o pacote Weka possa ser incluído nas classes do projeto teste, como mostra a Figura

48 Figura 13. Adicionando o arquivo weka.jar Foi desenvolvida uma pequena aplicação teste, o funcionamento da aplicação teste é descrito a seguir. O arquivo utilizado foi o weather.arff, e o algoritmo foi o J48. Inicialmente o sistema teste apresenta uma tela com a opção de minerar, então o usuário clica no botão minerar, é a partir disto que é acionado o comando que executa a integração com a ferramenta Weka, onde o algoritmo classificador J48 processa o arquivo weather.arff. A seguir a Figura 14 mostra o trecho de código da aplicação teste que executa o algoritmo J48. Para que o código funcione corretamente, é necessário copiar o arquivo weather.arff, que no caso se encontra em C:\Arquivos de programas\weka-3-4\data, para a pasta onde está o projeto teste, no caso C:\Documents and Settings\TesteWeka. 39

49 Figura 14. Código que executa o algoritmo classificador J48. Após a execução do trecho de código apresentado na Figura 15, o resultado do processamento do algoritmo minerador J48 é mostrado na tela para o usuário, o resultado obtido é ilustrado na Figura15. Figura 15. Resultado da classificação com o algoritmo J48. 40

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

15 Computador, projeto e manufatura

15 Computador, projeto e manufatura A U A UL LA Computador, projeto e manufatura Um problema Depois de pronto o desenho de uma peça ou objeto, de que maneira ele é utilizado na fabricação? Parte da resposta está na Aula 2, que aborda as

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas e técnicas

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Universidade Federal Rural de Pernambuco. Bacharelado em Sistemas de Informação. Disciplina: Análise e Projeto de Sistemas de Informação

Universidade Federal Rural de Pernambuco. Bacharelado em Sistemas de Informação. Disciplina: Análise e Projeto de Sistemas de Informação Universidade Federal Rural de Pernambuco Bacharelado em Sistemas de Informação Disciplina: Análise e Projeto de Sistemas de Informação Docente: Rodrigo Aluna: Thays Melo de Moraes Diagramas do Projeto

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO Santa Maria, 10 de Outubro de 2013. Revisão aula anterior Documento de Requisitos Estrutura Padrões Template Descoberta

Leia mais

A Grande Importância da Mineração de Dados nas Organizações

A Grande Importância da Mineração de Dados nas Organizações A Grande Importância da Mineração de Dados nas Organizações Amarildo Aparecido Ferreira Junior¹, Késsia Rita da Costa Marchi¹, Jaime Willian Dias¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil

Leia mais

Ferramenta: Spider-CL. Manual do Usuário. Versão da Ferramenta: 1.1. www.ufpa.br/spider

Ferramenta: Spider-CL. Manual do Usuário. Versão da Ferramenta: 1.1. www.ufpa.br/spider Ferramenta: Spider-CL Manual do Usuário Versão da Ferramenta: 1.1 www.ufpa.br/spider Histórico de Revisões Data Versão Descrição Autor 14/07/2009 1.0 15/07/2009 1.1 16/07/2009 1.2 20/05/2010 1.3 Preenchimento

Leia mais

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br Sistema Tipos de sistemas de informação Everson Santos Araujo everson@everson.com.br Um sistema pode ser definido como um complexo de elementos em interação (Ludwig Von Bertalanffy) sistema é um conjunto

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software PROCESSO DE DESENVOLVIMENTO DE SOFTWARE Introdução Modelos de Processo de Desenvolvimento de Software Os modelos de processos de desenvolvimento de software surgiram pela necessidade de dar resposta às

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi Metodologias de Desenvolvimento de Sistemas Analise de Sistemas I UNIPAC Rodrigo Videschi Histórico Uso de Metodologias Histórico Uso de Metodologias Era da Pré-Metodologia 1960-1970 Era da Metodologia

Leia mais

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares Universidade de Brasília Departamento de Ciência da Informação e Documentação Prof a.:lillian Alvares Fóruns óu s/ Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias

Leia mais

O PROJETO DE PESQUISA. Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza

O PROJETO DE PESQUISA. Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza O PROJETO DE PESQUISA Prof. Angelo Augusto Frozza, M.Sc. http://about.me/tilfrozza ROTEIRO Escolher um tema de pesquisa Por onde começar? Ler para aprender Estrutura do Projeto de Pesquisa A Definição

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL

Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Empresa de Informática e Informação do Município de Belo Horizonte S/A PRODABEL Diretoria de Sistema - DS Superintendência de Arquitetura de Sistemas - SAS Gerência de Arquitetura de Informação - GAAS

Leia mais

ROTEIRO PARA TREINAMENTO DO SAGRES DIÁRIO Guia do Docente

ROTEIRO PARA TREINAMENTO DO SAGRES DIÁRIO Guia do Docente Conceito ROTEIRO PARA TREINAMENTO DO SAGRES DIÁRIO Guia do Docente O Sagres Diário é uma ferramenta que disponibiliza rotinas que facilitam a comunicação entre a comunidade Docente e Discente de uma instituição,

Leia mais

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD)

MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) AULA 07 MATERIAL DIDÁTICO: APLICAÇÕES EMPRESARIAIS SISTEMA DE APOIO À DECISÃO (SAD) JAMES A. O BRIEN MÓDULO 01 Páginas 286 à 294 1 AULA 07 SISTEMAS DE APOIO ÀS DECISÕES 2 Sistemas de Apoio à Decisão (SAD)

Leia mais

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web Resumo. Desenvolvimento de um software de gerenciamento de projetos para utilização na Web Autor: Danilo Humberto Dias Santos Orientador: Walteno Martins Parreira Júnior Bacharelado em Engenharia da Computação

Leia mais

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd. Apresentação Este curso tem como objetivo, oferecer uma noção geral sobre a construção de sistemas de banco de dados. Para isto, é necessário estudar modelos para a construção de projetos lógicos de bancos

Leia mais

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Data Warehouse. Debora Marrach Renata Miwa Tsuruda Debora Marrach Renata Miwa Tsuruda Agenda Introdução Contexto corporativo Agenda Introdução Contexto corporativo Introdução O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos

Leia mais

ARCO - Associação Recreativa dos Correios. Sistema para Gerenciamento de Associações Recreativas Plano de Desenvolvimento de Software Versão <1.

ARCO - Associação Recreativa dos Correios. Sistema para Gerenciamento de Associações Recreativas Plano de Desenvolvimento de Software Versão <1. ARCO - Associação Recreativa dos Correios Sistema para Gerenciamento de Associações Recreativas Versão Histórico da Revisão Data Versão Descrição Autor Página

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares Universidade de Brasília Faculdade de Ciência da Informação Profa. Lillian Alvares Fóruns / Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias e experiências que

Leia mais

Data Warehousing Visão Geral do Processo

Data Warehousing Visão Geral do Processo Data Warehousing Visão Geral do Processo Organizações continuamente coletam dados, informações e conhecimento em níveis cada vez maiores,, e os armazenam em sistemas informatizados O número de usuários

Leia mais

4 DIGITAR, CONSULTAR E ALTERAR DADOS DIGITAR DADOS

4 DIGITAR, CONSULTAR E ALTERAR DADOS DIGITAR DADOS Sphinx APRENDIZ - p.94 4 DIGITAR, CONSULTAR E ALTERAR DADOS DIGITAR DADOS Depois de o questionário estar pronto, seus formulários definidos e as respostas coletadas ou prontas a coletar/importar, é possível

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

Plano de Ensino. Apresentação da Unidade Curricular

Plano de Ensino. Apresentação da Unidade Curricular Plano de Ensino Plano de Ensino Apresentação da Unidade Curricular o Funcionamento, arquitetura e conceitos fundamentais dos bancos de dados relacionais e objeto relacionais. Utilização de linguagem DDL

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES Janaína Schwarzrock jana_100ideia@hotmail.com Prof. Leonardo W. Sommariva RESUMO: Este artigo trata da importância da informação na hora da tomada de decisão,

Leia mais

Requisitos de Software

Requisitos de Software Requisitos de Software Prof. José Honorato F.N. Prof. José Honorato F.N. honoratonunes@gmail.com Requisitos de Software Software é o conjunto dos programas e dos meios não materiais que possibilitam o

Leia mais

Palavras-Chaves: estoque, modelagem, requisitos, UML, vendas.

Palavras-Chaves: estoque, modelagem, requisitos, UML, vendas. UTILIZAÇÃO DA UML NO DESENVOLVIMENTO DE SISTEMA DE CONTROLE DE VENDAS E ESTOQUE GILBERTO FRANCISCO PACHECO DOS SANTOS Discente da AEMS Faculdades Integradas de Três Lagoas JACKSON LUIZ ARROSTI Discente

Leia mais

Como conduzir com sucesso um projeto de melhoria da qualidade

Como conduzir com sucesso um projeto de melhoria da qualidade Como conduzir com sucesso um projeto de melhoria da qualidade Maria Luiza Guerra de Toledo Coordenar e conduzir um projeto de melhoria da qualidade, seja ele baseado no Seis Sigma, Lean, ou outra metodologia

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

CONCURSO PÚBLICO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI ANALISTA DE GESTÃO RESPOSTAS ESPERADAS PRELIMINARES

CONCURSO PÚBLICO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI ANALISTA DE GESTÃO RESPOSTAS ESPERADAS PRELIMINARES CELG DISTRIBUIÇÃO S.A EDITAL N. 1/2014 CONCURSO PÚBLICO ANALISTA DE GESTÃO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI RESPOSTAS ESPERADAS PRELIMINARES O Centro de Seleção da Universidade Federal de Goiás

Leia mais

Conceitos de Banco de Dados

Conceitos de Banco de Dados Conceitos de Banco de Dados Autor: Luiz Antonio Junior 1 INTRODUÇÃO Objetivos Introduzir conceitos básicos de Modelo de dados Introduzir conceitos básicos de Banco de dados Capacitar o aluno a construir

Leia mais

DESENVOLVIMENTO DE INTERFACE WEB MULTIUSUÁRIO PARA SISTEMA DE GERAÇÃO AUTOMÁTICA DE QUADROS DE HORÁRIOS ESCOLARES. Trabalho de Graduação

DESENVOLVIMENTO DE INTERFACE WEB MULTIUSUÁRIO PARA SISTEMA DE GERAÇÃO AUTOMÁTICA DE QUADROS DE HORÁRIOS ESCOLARES. Trabalho de Graduação DESENVOLVIMENTO DE INTERFACE WEB MULTIUSUÁRIO PARA SISTEMA DE GERAÇÃO AUTOMÁTICA DE QUADROS DE HORÁRIOS ESCOLARES Trabalho de Graduação Orientando: Vinicius Stein Dani vsdani@inf.ufsm.br Orientadora: Giliane

Leia mais

Banco do Brasil S.A. Consulta ao Mercado - RFP - Request for Proposa Aquisição de Ferramenta de Gestão de Limites Dúvida de Fornecedor

Banco do Brasil S.A. Consulta ao Mercado - RFP - Request for Proposa Aquisição de Ferramenta de Gestão de Limites Dúvida de Fornecedor 1. Em relação ao módulo para Atribuição de Limites, entendemos que Banco do Brasil busca uma solução para o processo de originação/concessão de crédito. Frente a essa necessidade, o Banco do Brasil busca

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

Interatividade aliada a Análise de Negócios

Interatividade aliada a Análise de Negócios Interatividade aliada a Análise de Negócios Na era digital, a quase totalidade das organizações necessita da análise de seus negócios de forma ágil e segura - relatórios interativos, análise de gráficos,

Leia mais

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de

Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de 1 Identificar as mudanças que acontecem na forma e no uso de apoio à decisão em empreendimentos de e-business. Identificar o papel e alternativas de relatórios dos sistemas de informação gerencial. Descrever

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI

Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI Requisitos de business intelligence para TI: O que todo gerente de TI deve saber sobre as necessidades reais de usuários comerciais para BI Janeiro de 2011 p2 Usuários comerciais e organizações precisam

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares

Universidade de Brasília. Faculdade de Ciência da Informação. Prof a Lillian Alvares Universidade de Brasília Faculdade de Ciência da Informação Prof a Lillian Alvares Fóruns Comunidades de Prática Mapeamento do Conhecimento Portal Intranet Extranet Banco de Competências Memória Organizacional

Leia mais

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR 6LPXODomR GH6LVWHPDV )HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR #5,6. Simulador voltado para análise de risco financeiro 3RQWRV IRUWHV Fácil de usar. Funciona integrado a ferramentas já bastante conhecidas,

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

Guia de Uso. O Pro-Treino tem uma divisão clara de funções, apresentada a seguir: E três tipos de usuários que executam as funções descritas acima:

Guia de Uso. O Pro-Treino tem uma divisão clara de funções, apresentada a seguir: E três tipos de usuários que executam as funções descritas acima: Sumário 1. Introdução... 2 2. Conceitos básicos... 2 2.1. Fluxo do sistema... 3 2.2. Acesso ao sistema... 4 2.2.1. Login... 4 2.2.2. Logoff... 4 2.2.3. Esqueci minha senha... 5 2.3. Conhecendo o Sistema...

Leia mais

PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO

PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO PROPOSTA DE UM MODELO DE SISTEMA HIPERMÍDIA PARA APRESENTAÇÃO DO CURSO DE CIÊNCIA DA COMPUTAÇÃO Fabiana Pacheco Lopes 1 1 Universidade Presidente Antônio Carlos (UNIPAC) fabipl_21@yahoo.com.br Resumo.Este

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

A CONSTRUÇÃO DE ESPAÇOS E MATERIAIS DIGITAIS PARA A EDUCAÇÃO MATEMÁTICA: O USO DO SMARTPHONE NO ENSINO DA GEOMETRIA

A CONSTRUÇÃO DE ESPAÇOS E MATERIAIS DIGITAIS PARA A EDUCAÇÃO MATEMÁTICA: O USO DO SMARTPHONE NO ENSINO DA GEOMETRIA A CONSTRUÇÃO DE ESPAÇOS E MATERIAIS DIGITAIS PARA A EDUCAÇÃO MATEMÁTICA: O USO DO SMARTPHONE NO ENSINO DA GEOMETRIA Autores : Agata RHENIUS, Melissa MEIER. Identificação autores: Bolsista IFC-Campus Camboriú;

Leia mais

Codificar Sistemas Tecnológicos

Codificar Sistemas Tecnológicos Codificar Sistemas Tecnológicos Especificação dos Requisitos do Software Sistema de gestão para a Empresa Cliente SlimSys Autor: Equipe Codificar Belo Horizonte MG Especificação dos Requisitos do Software

Leia mais

GARANTIA DA QUALIDADE DE SOFTWARE

GARANTIA DA QUALIDADE DE SOFTWARE GARANTIA DA QUALIDADE DE SOFTWARE Fonte: http://www.testexpert.com.br/?q=node/669 1 GARANTIA DA QUALIDADE DE SOFTWARE Segundo a NBR ISO 9000:2005, qualidade é o grau no qual um conjunto de características

Leia mais

Qualidade de Processo de Software Normas ISO 12207 e 15504

Qualidade de Processo de Software Normas ISO 12207 e 15504 Especialização em Gerência de Projetos de Software Qualidade de Processo de Software Normas ISO 12207 e 15504 Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br Qualidade de Software 2009 Instituto

Leia mais

TRABALHO DE DIPLOMAÇÃO Regime Modular ORIENTAÇÕES SOBRE O ROTEIRO DO PROJETO FINAL DE SISTEMAS DE INFORMAÇÕES

TRABALHO DE DIPLOMAÇÃO Regime Modular ORIENTAÇÕES SOBRE O ROTEIRO DO PROJETO FINAL DE SISTEMAS DE INFORMAÇÕES TRABALHO DE DIPLOMAÇÃO Regime Modular ORIENTAÇÕES SOBRE O ROTEIRO DO PROJETO FINAL DE SISTEMAS DE INFORMAÇÕES [Observação: O template a seguir é utilizado como roteiro para projeto de sistemas orientado

Leia mais

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o

No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o DATABASE MARKETING No mundo atual, globalizado e competitivo, as organizações têm buscado cada vez mais, meios de se destacar no mercado. Uma estratégia para o empresário obter sucesso em seu negócio é

Leia mais

Ferramenta de Testes de Programas para Auxílio na Aprendizagem de Programação

Ferramenta de Testes de Programas para Auxílio na Aprendizagem de Programação Ferramenta de Testes de Programas para Auxílio na Aprendizagem de Programação Denise Santiago (FURB) denise@senior.com.br Maurício Capobianco Lopes (FURB) mclopes@furb.br Resumo. Este artigo apresenta

Leia mais

Manual da Turma Virtual: MATERIAIS. Para acessar a turma virtual com o perfil Docente, siga o caminho indicado abaixo:

Manual da Turma Virtual: MATERIAIS. Para acessar a turma virtual com o perfil Docente, siga o caminho indicado abaixo: Manual da Turma Virtual: MATERIAIS Para acessar a turma virtual com o perfil Docente, siga o caminho indicado abaixo: MENU TURMA VIRTUAL MENU MATERIAIS CONTEÚDO/PÁGINA WEB Esta operação possibilita que

Leia mais

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr.

Aula 15. Tópicos Especiais I Sistemas de Informação. Prof. Dr. Dilermando Piva Jr. 15 Aula 15 Tópicos Especiais I Sistemas de Informação Prof. Dr. Dilermando Piva Jr. Site Disciplina: http://fundti.blogspot.com.br/ Conceitos básicos sobre Sistemas de Informação Conceitos sobre Sistemas

Leia mais

Módulo 15 Resumo. Módulo I Cultura da Informação

Módulo 15 Resumo. Módulo I Cultura da Informação Módulo 15 Resumo Neste módulo vamos dar uma explanação geral sobre os pontos que foram trabalhados ao longo desta disciplina. Os pontos abordados nesta disciplina foram: Fundamentos teóricos de sistemas

Leia mais

Processos Gerenciais

Processos Gerenciais UNIVERSIDADE PAULISTA CURSO SUPERIOR DE TECNOLOGIA Projeto Integrado Multidisciplinar III e IV Processos Gerenciais Manual de orientações - PIM Curso Superior de Tecnologia em Processos Gerenciais. 1.

Leia mais

PLANO DE ENSINO PRÉ-REQUISITOS: ENS

PLANO DE ENSINO PRÉ-REQUISITOS: ENS UNIVERSIDADE DO ESTADO DE SANTA CATARINA UDESC CENTRO DE EDUCAÇÃO SUPERIOR DO ALTO VALE DO ITAJAÍ CEAVI PLANO DE ENSINO DEPARTAMENTO: DSI Departamento de Sistema de Informação DISCIPLINA: Data Warehouse

Leia mais

CRM. Customer Relationship Management

CRM. Customer Relationship Management CRM Customer Relationship Management CRM Uma estratégia de negócio para gerenciar e otimizar o relacionamento com o cliente a longo prazo Mercado CRM Uma ferramenta de CRM é um conjunto de processos e

Leia mais

Programa de Capacitação em Gestão do PPA Curso PPA: Elaboração e Gestão Ciclo Básico. Elaboração de Planos Gerenciais dos Programas do PPA

Programa de Capacitação em Gestão do PPA Curso PPA: Elaboração e Gestão Ciclo Básico. Elaboração de Planos Gerenciais dos Programas do PPA Programa de Capacitação em Gestão do PPA Curso PPA: Elaboração e Gestão Ciclo Básico Elaboração de Planos Gerenciais dos Programas do PPA Brasília, abril/2006 APRESENTAÇÃO O presente manual tem por objetivo

Leia mais

Análise e Projeto Orientados por Objetos

Análise e Projeto Orientados por Objetos Análise e Projeto Orientados por Objetos Aula 02 Análise e Projeto OO Edirlei Soares de Lima Análise A análise modela o problema e consiste das atividades necessárias para entender

Leia mais

Manual de Utilização das Funções Básicas do Sistema ClinicWeb

Manual de Utilização das Funções Básicas do Sistema ClinicWeb Manual de Utilização das Funções Básicas do Sistema ClinicWeb Dezembro/2012 2 Manual de Utilização das Funções Básicas do Sistema ClinicWeb Sumário de Informações do Documento Título do Documento: Resumo:

Leia mais

FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo

FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo FURB - Universidade Regional de Blumenau TCC - Trabalho de Conclusão de Curso Acadêmico: Fernando Antonio de Lima Orientador: Oscar Dalfovo Roteiro Introdução Sistemas de Informação - SI Executive Information

Leia mais

O GEM é um software 100% Web, ou seja, você poderá acessar de qualquer local através da Internet.

O GEM é um software 100% Web, ou seja, você poderá acessar de qualquer local através da Internet. Olá! Você está recebendo as informações iniciais para utilizar o GEM (Software para Gestão Educacional) para gerenciar suas unidades escolares. O GEM é um software 100% Web, ou seja, você poderá acessar

Leia mais

Palavras-Chaves: engenharia de requisitos, modelagem, UML.

Palavras-Chaves: engenharia de requisitos, modelagem, UML. APLICAÇÃO DA ENGENHARIA DE REQUISITOS PARA COMPREENSÃO DE DOMÍNIO DO PROBLEMA PARA SISTEMA DE CONTROLE COMERCIAL LEONARDO DE PAULA SANCHES Discente da AEMS Faculdades Integradas de Três Lagoas RENAN HENRIQUE

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com.

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com. Sistemas da Informação Banco de Dados I Edson Thizon (edson@esucri.com.br) 2008 Apresentação (mini-currículo) Formação Acadêmica Mestrando em Ciência da Computação (UFSC/ ) Créditos Concluídos. Bacharel

Leia mais

Instituto de Ciências Matemáticas e de Computação. MANUAL DE USO Sistema de Reserva de Salas INTRANET - ICMC-USP

Instituto de Ciências Matemáticas e de Computação. MANUAL DE USO Sistema de Reserva de Salas INTRANET - ICMC-USP Instituto de Ciências Matemáticas e de Computação ISSN - 0103-2569 MANUAL DE USO Sistema de Reserva de Salas INTRANET - ICMC-USP André Pimenta Freire Renata Pontin de M. Fortes N 0 213 RELATÓRIOS TÉCNICOS

Leia mais

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE

LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE LEVANTAMENTO DE REQUISITOS SEGUNDO O MÉTODO VOLERE RESUMO Fazer um bom levantamento e especificação de requisitos é algo primordial para quem trabalha com desenvolvimento de sistemas. Esse levantamento

Leia mais

Aprendendo a Interpretar Dados Financeiros de uma Empresa Usando Estatística de Forma Simples e Prática

Aprendendo a Interpretar Dados Financeiros de uma Empresa Usando Estatística de Forma Simples e Prática Aprendendo a Interpretar Dados Financeiros de uma Empresa Usando Estatística de Forma Simples e Prática Ederson Luis Posselt (edersonlp@yahoo.com.br) Eduardo Urnau (dudaurnau@gmail.com) Eloy Metz (eloy@softersul.com.br)

Leia mais