UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO

Tamanho: px
Começar a partir da página:

Download "UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO"

Transcrição

1 UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO MINERAÇÃO DE DADOS PARA AVALIAÇÃO DO PERFIL DE USUÁRIOS DO SISTEMA DE INFORMAÇÃO DA ACADEMIA DA UNIVALI Área de Inteligência Artificial por Marlon Kleinschmidt Benjamin Grando Moreira, Bel. Orientador Itajaí (SC), dezembro de 2007

2 UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO MINERAÇÃO DE DADOS PARA AVALIAÇÃO DO PERFIL DE USUÁRIOS DO SISTEMA DE INFORMAÇÃO DA ACADEMIA DA UNIVALI Área de Inteligência Artificial por Marlon Kleinschmidt Relatório apresentado à Banca Examinadora do Trabalho de Conclusão do Curso de Ciência da Computação para análise e aprovação. Orientador: Benjamin Grando Moreira, Bel. Itajaí (SC), dezembro de 2007

3 SUMÁRIO LISTA DE ABREVIATURAS...iv LISTA DE FIGURAS...v LISTA DE TABELAS...vi RESUMO...vii ABSTRACT...viii 1 INTRODUÇÃO PROBLEMATIZAÇÃO Formulação do Problema Solução Proposta OBJETIVOS Objetivo Geral Objetivos Específicos METODOLOGIA ESTRUTURA DO TRABALHO FUNDAMENTAÇÃO TEÓRICA A ACADEMIA DE MUSCULAÇÃO DA UNIVALI O Sistema de Informação desenvolvido para Academia INTELIGÊNCIA ARTIFICIAL DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS Compreensão do Domínio de Aplicação Data Warehouse Pré-Processamento Mineração de Dados Pós-Processamento SOLUÇÕES SIMILARES A IA entrando na quadra de vôlei: Scout inteligente A informática e suas aplicações em educação física FERRAMENTAS DE MINERAÇÃO DE DADOS Análise das ferramentas de mineração de dados Weka PROJETO CARACTERIZAÇÃO DO DOMÍNIO DA APLICAÇÃO NORMALIZAÇÃO DOS DADOS FERRAMENTA AUXILIAR PARA CADASTRO DE ALUNOS Normalização dos dados da aplicação auxiliar FUNCIONAMENTO DA MD NAS APLICAÇÕES MODELAGEM DO SISTEMA ii

4 3.5.1 Levantamento de Requisitos Projeto do Sistema IMPLEMENTAÇÃO DO SISTEMA Problemas encontrados TESTES E VALIDAÇÃO DO SISTEMA CONCLUSÕES REFERÊNCIAS BIBLIOGRÁFICAS...63 A MODELAGEM DO SISTEMA...67 A.1 CASOS DE USO A.1.1 Pacote 01: Controle de acesso A.1.2 Pacote 02: Operações iii

5 LISTA DE ABREVIATURAS BD DCBD DW IA KDD MD RBC SIAMU TCC UML UNIVALI Banco de Dados Descoberta de Conhecimento em Banco de Dados Data Warehouse Inteligência Artificial Knowledge Discovery in Databases Mineração de Dados Raciocínio Baseado em Casos Sistema de Informação da Academia de Musculação da UNIVALI Trabalho de Conclusão de Curso Unified Modelling Language Universidade do Vale do Itajaí iv

6 LISTA DE FIGURAS Figura 1. Tela principal...10 Figura 2. Tela de Avaliação de Alunos...11 Figura 3. Tela de Ficha de Programação Muscular...12 Figura 4. Taxonomia do processo de KDD...14 Figura 5. Visão simplificada de uma arquitetura de DW...18 Figura 6. MD utiliza recursos de diferentes áreas...19 Figura 7. Regras de associação geradas pelo algoritmo apriori Figura 8. Regras de classificação geradas pelo algoritmo NNge...25 Figura 9. Aplicação Hipermídia...30 Figura 10. Arquivo no formato ARFF...35 Figura 11. Exemplo do arquivo ARFF utilizado...37 Figura 12. Resultado da classificação com o algoritmo J Figura 13. Adicionando o arquivo weka.jar...39 Figura 14. Código que executa o algoritmo classificador J Figura 15. Resultado da classificação com o algoritmo J Figura 16. Estrutura do DW criado Figura 17. Tela de cadastro da ferramenta auxiliar, horário Figura 18. Tela de cadastro da ferramenta auxiliar, informações gerais...47 Figura 19. Tela de cadastro da ferramenta auxiliar, prescrição Figura 20. Estrutura do DW auxiliar criado...49 Figura 21. Tela de login Figura 22. Tela de mensagem padrão...50 Figura 23. Tela de mineração de dados...51 Figura 24. Tela de visualização do conhecimento Figura 25. Tela de mineração de dados auxiliar...53 Figura 26. Execução do algoritmo J Figura 27. Geração do arquivo apriori.bat Figura 28. Execução do arquivo apriori.bat Figura 29. Diagrama de Pacotes dos Casos de Uso Figura 30. Casos de Uso do Pacote Controle de Acesso...67 Figura 31. Casos de Uso do Pacote Operações v

7 LISTA DE TABELAS Tabela 1. Algumas tarefas de KDD e suas técnicas de mineração de dados...22 Tabela 2. Entrada de dados para a descoberta de regras de associação Tabela 3. Entrada de dados para a tarefa de classificação Tabela 4. Técnicas de mineração de dados Tabela 5. Comparação entre as ferramentas de mineração de dados Tabela 6. Normalização dos dados...44 vi

8 RESUMO KLEINSCHMIDT, Marlon. Mineração de dados para avaliação do perfil de usuários do Sistema de Informação da Academia da UNIVALI. Itajaí, f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) Centro de Ciências Tecnológicas da Terra e do Mar, Universidade do Vale do Itajaí, Itajaí, A Academia de musculação da UNIVALI possui um Sistema de Informação baseado em Sistemas Especialista e Raciocínio Baseados em Casos, com objetivo de auxiliar os professores na escolha da programação da atividade física a ser seguida por um aluno. Porém, o sistema não está utilizando com maior aproveitamento o grande número de dados produzidos e armazenados, limitando-se em buscar informações para gerar a programação da atividade física. Novas tecnologias envolvendo recursos de Inteligência Artificial, entre elas, a Mineração de Dados, permitem a descoberta de conhecimento em grandes bases de dados e extrair informações que auxiliam na tomada de decisão que, de outra maneira permaneceriam escondidas. O presente TCC propõe demonstrar a aplicação da técnica de mineração de dados, usando como estudo de caso a base de dados do Sistema de Informação da Academia da UNIVALI, com a utilização de algoritmos de mineração de dados, para uma possível descoberta de novas correlações, padrões e tendências significativas por meio da análise dos dados armazenados. Esse trabalho se concentrará em três tarefas da Mineração de Dados que são: regras de associação, classificação e agrupamento, com objetivo de descobrir alguma informação útil nos dados, procurando encontrar alguma particularidade que possa melhorar o atendimento dos atletas, ou encontrar alguma outra informação relevante. Palavras-chave: Descoberta de Conhecimento. Mineração de Dados.Weka. vii

9 ABSTRACT The body-building gym of the UNIVALI possesss a System of Information based on Systems Based Specialist and Reasoning in Cases, with objective of assisting the professors in the choice of the programming of the physical activity to be followed by a pupil. However, the system is not using with bigger exploitation the great number of produced and stored data, limiting itself in searching information to generate the programming of the physical activity. New technologies involving resources of Artificial Intelligence, between them, the data mining, allow the discovery of knowledge in great databases and to extract information that assist in the decision taking that, in another way would remain hidden. Gift TCC considers to demonstrate the application of the technique of mining of data, using as case study the database of the System of Information of the Academy of the UNIVALI, with the use of algorithms of data mining, for a possible one discovered of new correlations, standards and significant trends by means of the analysis of the stored data. This work will be concentrated in three tasks of the data mining that are: rules of association, classification and grouping, with objective to discover some useful information in the data, looking for to find some particularitity that can improve the attendance of the athletes, or to find some another excellent information. Keywords: Knowledge Discovery in Databases. Data Mining.Weka. viii

10 1 INTRODUÇÃO Nos últimos anos, pôde-se notar um grande aumento no armazenamento de dados em meios magnéticos. Esses dados produzidos e armazenados em grande escala ficam inviáveis de serem analisados por especialistas através de métodos tradicionais, tais como planilhas de cálculos e relatórios informativos operacionais, onde o especialista testa sua hipótese contra a base de dados. Entretanto, um grande armazenamento de dados equivale a um maior potencial de informação (AURÉLIO, VELLASCO & LOPES, 1999). Atualmente, as organizações aumentaram o investimento em equipamentos e aplicativos para aperfeiçoar o armazenamento, gerenciamento e compreensão dos seus dados. As bases de dados não são mais interpretadas apenas como um local de armazenamento de informações, e sim como um importante patrimônio da organização (SEN & JACOB, 1998 apud OLIVEIRA, 2000, p.1). Durante anos, métodos manuais foram utilizados para transformar dados em conhecimento. Entretanto, a utilização desses métodos tem se tornado muito caro e inviáveis quando aplicados a grandes bases de dados (FAYYAD, PIATETSKY-CHAPIRO, & SMYTH, 1996a apud DOMINGUES, 2004, p.1). Devido aos problemas com os métodos manuais, surgiu a necessidade em desenvolver processos de análise automática, como o Processo de Extração do Conhecimento em Bases de Dados ou Mineração de Dados (MD). Esse processo de natureza iterativa, e interativa, tem despontado por seu desempenho em vários domínios, por extrair padrões válidos, novos e com grande utilidade na tomada de decisão (ibidem). 1.1 PROBLEMATIZAÇÃO Este trabalho propõe aplicar tarefas de Mineração de Dados, para extrair informações dos dados armazenados pelo Sistema de Informação da Academia da UNIVALI, desenvolvido por Balbinotti (2006). A partir disto, os dados serão transformados em conhecimento, encontrando possíveis padrões nos dados através da utilização de algoritmos de Mineração de Dados, possibilitando um melhor aproveitamento dos dados armazenados que, de outra maneira, permaneceria escondido na base de dados.

11 Para Carvalho (2001), Mineração de Dados é a utilização de técnicas automáticas de exploração de grandes quantidades de dados de forma a descobrir novos padrões e relações que, devido ao volume de dados, não seriam facilmente descobertos a olho nu pelo ser humano Formulação do Problema A UNIVALI instalou no ginásio de esportes uma academia de musculação para atender os alunos, professores e funcionários da UNIVALI. Dois professores são responsáveis pelo atendimento e acompanhamento dos alunos. Inicialmente, as informações referentes aos alunos eram coletadas a partir da aplicação de um questionário. As informações coletadas eram preenchidas manualmente em fichas de cartolina, que posteriormente eram armazenadas em um fichário (BALBINOTTI, 2006). Para gerar a prescrição da atividade física, ou seja, a lista de exercícios que o aluno deve seguir, o profissional de Educação Física tinha que analisar as informações contidas nas fichas e decidir quais aparelhos utilizar, suas repetições, pesos e intervalos para cada aluno. O maior problema encontrado pelos professores da academia era analisar essas fichas, devido a pouca informação contida nestas fichas. Outra dificuldade encontrada era o acompanhamento de alguns alunos, devido à inexistência de uma ferramenta que auxiliasse o profissional de Educação Física na analise do crescimento e desenvolvimento específico de cada aluno. Mediante tal situação, uma solução foi proposta por Balbinotti (2006), que desenvolveu uma ferramenta baseada em Sistemas Especialistas e Raciocínio Baseado em Casos (RBC) para auxiliar os profissionais de Educação Física na prática desportiva na UNIVALI, auxiliando na tomada de decisão na hora da escolha do programa de exercícios. RBC consiste em resolver um novo problema com base na adaptação de soluções de problemas similares já conhecidas (WANGENHEIM & WANGENHEIM, 2003). Balbinotti (2006) utilizou RBC para auxiliar na escolha do programa de exercícios do aluno. Entretanto, identificou-se uma limitação na solução proposta, em que o foco principal é gerar uma lista de exercícios para auxiliar na escolha da programação da atividade física a ser seguida por um aluno, após identificar um grau de similaridade com casos ocorridos anteriormente. Com base nessas informações, pode-se concluir que o sistema não está utilizando com maior 2

12 aproveitamento o grande número de dados e informações armazenadas, motivando o desenvolvimento de uma nova alternativa para o problema Solução Proposta A proposta deste projeto é demonstrar a aplicação da técnica de mineração de dados, usando como estudo de caso a base de dados do Sistema de Informação da academia da UNIVALI, com a utilização de algoritmos de mineração de dados, para uma possível descoberta de novas correlações, padrões e tendências significativas por meio da análise dos dados armazenados. Esse trabalho se concentrará em três tarefas da mineração de dados que são: regras de associação, classificação e agrupamento. Regras de associação procuram determinar que fatos ocorram simultaneamente com probabilidade razoável ou que itens estão presentes juntos com certa chance (CARVALHO, 2001). Para Baptista e Carvalho (2003), regras de associações procuram identificar afinidades entre registros de um subconjunto de dados. Sendo essas afinidades/associações expressas na forma de regras. Segundo Aurélio et al. (1999), a classificação é a tarefa mais estudada em KDD e tem como objetivo descobrir um conhecimento que possa ser utilizado para prever a classe de um registro. Silva (2003) diz que a classificação busca examinar um conjunto de registros rotulados e elaborar descrições das características dos registros em cada uma das classes. Para Carvalho (2001), a classificação é uma das técnicas mais utilizadas no data mining simplesmente porque é uma das tarefas cognitivas humanas mais realizadas no auxilio à compreensão do ambiente em que vivemos. Por mais semelhante que algo possa ser, nada é exatamente igual. Isso faz com que seja preciso diminuir as exigências de igualdade e permitir que detalhes sejam desprezados e observar apenas características principais. Já o agrupamento é uma tarefa que tem como objetivo segmentar os dados formando grupos homogêneos. Conforme Carvalho (2001), agrupar é classificar uma massa de dados em classes desconhecidas. Para Silva (2003), o agrupamento é aplicado quando ainda não é conhecida nenhuma classe e sua função é produzir uma segmentação do conjunto de registros de entrada de acordo com algum critério. 3

13 Com a utilização dessas três tarefas de mineração de dados, objetiva-se encontrar alguma informação útil nos dados, procurando encontrar alguma particularidade que possa melhorar o atendimento dos atletas, ou encontrar alguma outra informação relevante, estudo que será alvo ao longo da primeira etapa do Trabalho de Conclusão de Curso (TCC). O desenvolvimento deste projeto se justifica como um TCC para o Curso de Ciência da Computação, pois se trata do processo de extrair o conhecimento de um grande volume de dados, identificando padrões e tendências significativas por meio da análise dos dados armazenados que, de outra maneira, permaneceria escondido na base de dados. Esse trabalho aplica conhecimentos adquiridos no decorrer do curso, principalmente os relacionados a banco de dados e Inteligência Artificial. 1.2 OBJETIVOS Objetivo Geral Desenvolvimento de uma aplicação que utilize mineração de dados para descoberta de conhecimento contido na base de dados do Sistema de Informação da academia da UNIVALI Objetivos Específicos Os objetivos específicos deste projeto de pesquisa são: Pesquisar e analisar soluções similares; Adquirir conhecimento sobre mineração de dados; Pesquisar sobre ferramentas de mineração de dados; Determinar as variáveis de interesse para as tarefas de mineração de dados; Determinar os requisitos exigidos para o sistema; Realizar a modelagem conceitual do sistema; Implementar o sistema; Testar e validar a implementação do sistema; e Documentar o desenvolvimento e os resultados do sistema. 4

14 1.3 METODOLOGIA O presente TCC consiste no desenvolvimento de uma aplicação que utilize mineração de dados para descoberta de conhecimento contido na base de dados do Sistema de Informação da academia da UNIVALI. Para executar este projeto de pesquisa foram estipuladas 5 etapas. As duas primeiras etapas e parte da quinta etapa foram executadas no TCCI, que consiste na análise da tecnologia envolvida, modelagem do sistema e documentação. As demais etapas foram executadas no TCCII, elas compreendem o desenvolvimento, validação e documentação do sistema. A metodologia para executar as atividades contidas nas etapas é apresentada a seguir. Inicialmente foi necessário fazer leituras e levantamento de conceitos sobre a descoberta de conhecimento em bases de dados e mineração de dados, para adquirir um maior conhecimento sobre o assunto abordado neste projeto. A pesquisa foi feita através de livros, textos selecionados em sites e principalmente através de monografias e dissertações, que também serviram para a revisão bibliográfica deste trabalho. Na primeira etapa também foram pesquisados trabalhos acadêmicos de desenvolvimento de aplicações semelhantes, para depois identificar a tecnologia necessária à implementação do sistema. No início do TCCI já se tinha conhecimento da ferramenta de mineração de dados Weka, contudo, foram pesquisadas outras ferramentas para buscar características semelhantes tais como: possibilidade da utilização de recursos via API e ser disponibilizada gratuitamente. Porém não foi encontrada nenhuma outra ferramenta com essas características, sendo assim, adotou-se a ferramenta Weka para dar suporte a mineração de dados neste projeto. Testes referentes à integração com esta ferramenta foram realizados, que podem ser verificados no capítulo de Fundamentação Teórica. Após analisar a base de dados do Sistema de Informação proposto para a academia da UNIVALI, foram estipuladas as variáveis de interesse para a realização das tarefas de mineração de dados. Já na segunda etapa, foi feita a análise e projeto do sistema. Foram feitas as definições e documentação do sistema a ser desenvolvido, foram definidos os requisitos funcionais e não funcionais, diagrama de casos de uso, também foi definida a interface com o usuário, utilizando a 5

15 metodologia da notação Unified Modelling Language (UML) para modelar o sistema, através da ferramenta Enterprise Architect. A etapa de documentação contemplou todos os processos referentes às etapas: (i) leitura e levantamento de conceitos e (ii) análise e projeto, seguindo as normas exigidas pela Coordenação de TCC. Esta etapa foi concluída no TCCII. 1.4 ESTRUTURA DO TRABALHO Este trabalho está dividido em quatro capítulos: Introdução, Fundamentação Teórica, Desenvolvimento e Conclusões. O Capítulo 1, Introdução, apresentou uma visão geral do trabalho, estabelecendo os objetivos, descrevendo a metodologia de desenvolvimento e a estrutura da pesquisa. No Capítulo 2, Fundamentação Teórica, é apresentada toda teoria contida neste trabalho. Este capítulo está dividido em seis sessões: A Academia de Musculação da UNIVALI: apresenta uma visão geral sobre a academia, a descrição sobre o Sistema de Informação que foi desenvolvido para academia e seu funcionamento; Inteligência Artificial: uma breve descrição sobre Inteligência Artificial; Descoberta de conhecimento em bases de dados: apresenta as características dessa área da Inteligência Artificial; Mineração de Dados: descrição de conceitos tais como: definições, características, dentre outros; Soluções Similares: apresenta soluções similares pesquisadas; e Ferramentas de mineração de dados: apresenta as características de algumas ferramentas pesquisadas. O Capítulo 3 apresenta o desenvolvimento do projeto, a modelagem do sistema bem como os detalhes técnicos necessários para a implementação do sistema. 6

16 No Capítulo 4, Conclusões, é apresentada a conclusão deste projeto, descreve sobre os resultados obtidos, problemas encontrados, objetivos conquistados, dentre outros. 7

17 2 FUNDAMENTAÇÃO TEÓRICA Este capítulo aborda os conceitos necessários ao desenvolvimento do sistema, tais como: descoberta de conhecimento em bases de dados, mineração de dados e ferramentas de mineração de dados. Esse TCC é fundamentado em livros e principalmente em monografias e dissertações. 2.1 A ACADEMIA DE MUSCULAÇÃO DA UNIVALI A UNIVALI possui uma academia de musculação, que foi instalada no ginásio de esportes, em uma sala equipada com 35 aparelhos para a prática desportiva, possui uma televisão, um microcomputador PC e um aparelho de som, dois professores são responsáveis em atender os alunos, com diferentes faixas etárias e objetivos distintos. São atendidos alunos, professores e funcionários da UNIVALI, bem como os alunos do Colégio de Aplicação da UNIVALI (CAU). O atendimento da academia de musculação é oferecido de segunda a sexta-feira durante todo o ano letivo, sendo que no período de férias a academia é fechada. Os horários disponíveis para a prática desportiva iniciam ás 06h50min e encerram ás 21h20min. A princípio, o cadastro das informações dos alunos da academia de musculação da UNIVALI, era efetuado após a aplicação de um questionário em que o aluno respondia questões específicas como: objetivo, nível de atividade física, e questões abrangentes como: nome, endereço, etc. As informações coletadas eram preenchidas manualmente em fichas de cartolina, que se diferenciavam pelas cores: azul para os homens e rosa para as mulheres. Essas informações eram armazenadas em um fichário (BALBINOTTI, 2006). O profissional de Educação Física tinha que analisar as informações contidas nestas fichas e tomar uma decisão sobre o tipo de aparelho necessário, suas repetições, pesos e intervalos para tal pessoa. Muitas vezes a análise não era bem sucedida devido a pouca informação contida nesta ficha. Outra preocupação era o acompanhamento de alguns atletas, pois ficava difícil para o profissional de Educação Física analisar o crescimento e desenvolvimento específico do atleta por não ter ferramentas que auxiliassem em seu trabalho.

18 2.1.1 O Sistema de Informação desenvolvido para Academia Devido à necessidade do acompanhamento de alguns atletas, uma solução foi proposta por Balbinotti (2006), foi desenvolvida uma ferramenta baseada em Sistemas Especialistas e Raciocínio Baseado em Casos para auxiliar os profissionais de Educação Física na prática desportiva na UNIVALI, auxiliando na tomada de decisão na hora da escolha do programa de exercícios. Para Fernandes (2003), o processo característico do RBC, Raciocínio Baseado em Casos, consiste em identificar o problema atual, buscar a experiência mais semelhante na memória e aplicar o conhecimento desta experiência passada no problema atual. RBC consiste em resolver um novo problema com base na adaptação de soluções de problemas similares já conhecidas (WANGENHEIM e WANGENHEIM, 2003). Balbinotti (2006) utilizou RBC para auxiliar na escolha do programa de exercícios do aluno. O Sistema de Informação foi desenvolvido principalmente para gerar uma lista de exercícios para auxiliar na escolha da programação da atividade física a ser seguida por um aluno, após identificar um grau de similaridade com casos ocorridos anteriormente Funcionamento do Sistema de Informação A prescrição da atividade física é gerada pelo sistema após efetuar duas etapas, o cadastramento do aluno e posteriormente a etapa de avaliação física do aluno. Basicamente a prescrição da atividade física é gerada após um aluno informar qual é seu objetivo em ingressar na academia, em seguida é efetuado o cadastro do aluno e cadastro de avaliação física, o sistema percorre a base de casos, procurando registros com maior similaridade retornando uma lista de exercícios (BALBINOTTI, 2006). Após o usuário estar autenticado no sistema, é apresentada a tela principal, com todas as opções disponíveis para aquele usuário como mostra a Figura 1. 9

19 Figura 1. Tela principal Fonte: Balbinotti (2006). Logo após, o usuário seleciona no menu a opção ATUALIZAÇÕES/ALUNOS, e efetua o cadastro do aluno. Na etapa de cadastramento do aluno são coletadas informações como: nome, endereço, sexo, idade, objetivo do aluno, etc. Após efetuar o cadastramento do aluno é necessário fazer a avaliação física do aluno (ibidem). O usuário seleciona no menu a opção TRANSAÇÕES/AVALIAÇÃO FÍSICA e o sistema apresenta a tela de avaliação de alunos como mostra a Figura 2: 10

20 Figura 2. Tela de Avaliação de Alunos Fonte: Balbinotti (2006). A etapa de avaliação física é dividida em sete etapas, que são: Cadastro de Anamnese de Risco: etapa onde o usuário responde questões sobre antecedentes familiares com problema cardíaco, se pratica alguma atividade física, se a pessoa foi ou é fumante, se tem a pressão arterial dentro do limite, dentre outras; Cadastro de Anamnese Clínica: armazena informações sobre aspecto cardiorespiratório, se fez cirurgias recentes, se utiliza algum medicamento, se possui reações alérgicas, dentre outras; Cadastro de Antropometria: são cadastradas as medidas corporais do aluno, por exemplo: altura, circunferência, envergaduras e dobras; Cadastro do índice de massa corporal: verifica se o aluno esta obeso, acima do peso, peso normal ou abaixo do peso; Cadastro do Índice de atividade física: o índice é gerado após informar se o aluno pratica alguma atividade física, qual a intensidade, duração e freqüência; Cadastro da Pressão arterial: após informar a pressão Diastólica e Sistólica o sistema retorna se o aluno tem pressão normal ou se sofre de hipertensão; e Cadastro de aspecto hemodinâmico: após aplicação do teste de caminhada na esteira 2400m e o teste de corrida 1200m, são coletadas as informação sobre o tempo gasto para realizar os testes. A partir disto é calculado e cadastrado o volume de oxigênio do aluno. 11

21 Após o usuário ter efetuado o cadastro do aluno e a avaliação física do aluno o sistema habilita o botão com a opção programação, o usuário seleciona a opção programação, depois disto o sistema apresenta a tela de ficha de programação, com uma lista de sugestões de atividade física onde o usuário pode aceitar alguma sugestão ou adicionar uma nova lista de exercícios, como mostra a Figura 3 (ibidem). Figura 3. Tela de Ficha de Programação Muscular Fonte: Balbinotti (2006). Caso o usuário decida adicionar uma nova lista de exercícios físicos, esta será adiciona ao banco de dados alimentando a base de casos para uma futura busca por similaridade a partir da entrada de dados de um novo aluno (ibidem). 12

22 2.2 INTELIGÊNCIA ARTIFICIAL O presente TCC visa desenvolver uma aplicação que utilize a técnica de Mineração de Dados (MD). Para isso, identificou-se que a MD é uma área das várias áreas contidas na Inteligência Artificial (IA), e também uma maneira de se utilizar a IA. A IA busca prover máquinas com a capacidade de realizar algumas atividades mentais do ser humano (NASCIMENTO JR & YONEYAMA, 2000). Para Feigenbaum (1992, apud FERNANDES, 2003), IA é uma área da ciência da computação destinada ao desenvolvimento de sistemas computacionais inteligentes, com características que se assemelham com as do ser humano, tais como: a compreensão da linguagem, aprendizado, raciocínio, tomada de decisão, dentre outras. 2.3 DESCOBERTA DE CONHECIMENTO EM BASES DE DADOS Descoberta de conhecimento em bases de dados é o processo não trivial de identificar em dados padrões que sejam válidos, novos (ainda não identificados), potencialmente úteis e compreensíveis, visando melhorar o entendimento de um problema ou um procedimento de tomada de decisão (FAYYAD et al apud SILVA 2004). A técnica de descobrir padrões úteis em dados não processados recebeu diversos nomes, dentre eles Knowledge Discovery in Database (KDD, ou em português, Descoberta de Conhecimento em Bases de Dados), Data Mining (DM, ou em português, Mineração de Dados), extração de conhecimento, descoberta de informação, processamento de padrões de dados. O termo KDD foi criado em 1989 para referenciar o processo de descoberta de conhecimento em dados e, principalmente, a etapa de mineração de dados, esta que transforma dados em informação (MANNILA 1997 apud PIETRO, 2006). Segundo Collazos e Barreto (2003), o KDD é uma técnica que possibilita analisar grandes conjuntos de dados, utilizando métodos aproximados. A metodologia do KDD constitui-se em duas etapas fundamentais, o armazém de dados e a MD. Primeiro faz-se necessário criar uma base de dados organizada e com suficientes dados sobre o assunto a analisar, em seguida utilizar métodos aproximados que permitem minerar os dados, para a descoberta das relações contidas em tais dados. 13

23 Para Pacheco et al. (1999), o processo de KDD é composto por cinco etapas: o Data Warehounsing (DW), o Pré-processamento, o Enriquecimento, a Mineração de Dados e o Pósprocessamento. A Figura 4 mostra uma visão sistemática do processo de KDD, de forma hierárquica, onde as fases e principais tarefas do processo de KDD, tais como: tarefas e algoritmos empregados; fases; e etapas do pré-processamento (AURÉLIO et al. 1999). Figura 4. Taxonomia do processo de KDD Fonte: Adaptado de Aurélio, et al. (1999). Para Suliman Jr. e Souza (1997) as fases que fazem parte do processo de DCBD são: Desenvolver a compreensão do domínio da aplicação, o conhecimento anterior relevante e os objetivos do usuário final; Criar um conjunto alvo de dados em que a prospecção deverá ser efetuada; Realizar a redução e projeção de dados, reduzindo o número efetivo de variáveis consideradas ou encontrar representações não variáveis para os referidos dados; Escolher as tarefas de MD: decidindo se o objetivo do processo de DCBD é a classificação, associação, agrupamento ou outro; 14

24 Escolher os algoritmos de MD, selecionando métodos para o uso na busca de padrões nos dados; Mineração de dados; Interpretações dos padrões obtidos; e Consolidação do conhecimento. Conforme afirma Aurélio et al. (1999), a utilização da técnica de KDD em sistemas de análise está relacionada a várias aplicações: marketing, análises corporativas, medicina, biologia, entre outras. Existem diversa tarefas de KDD, cada uma está diretamente relacionada ao domínio da aplicação e interesse do usuário. Cada tarefa de KDD extrai um tipo diferente de conhecimento do banco de dados, com isso, necessita de um algoritmo diferente para cada tarefa Compreensão do Domínio de Aplicação Um fator importante no processo de DCBD é o entendimento do domínio da aplicação, de onde será extraído o conhecimento necessário para apoiar a tomada de decisão. Para isso, surge a necessidade de identificar quais são os objetivos e requisitos necessários para que seja possível extrair e incorporar o conhecimento adquirido. Segundo Oliveira (2000) não existe um procedimento padrão que estabeleça um domínio de aplicação, pois cada caso tem suas características e particularidades próprias. Entretanto, alguns aspectos relevantes podem servir de suporte a identificação do domínio da aplicação, como: Definição dos objetivos e dos requisitos da extração de conhecimento; Identificação das possíveis fontes de dados; Pesquisa do conhecimento prévio existente; Modo de distribuição do conhecimento extraído; Utilização do conhecimento extraído num sistema de tomada de decisão; e Estudo de viabilidade e custos da aplicação do processo. Após a definição do domínio da aplicação, deve-se selecionar e preparar os dados para serem analisados posteriormente. 15

25 2.3.2 Data Warehouse Um Data Warehouse é banco de dados elaborado com a finalidade de dar suporte ao processo decisório, onde os dados que o povoarão são obtidos através dos bancos de dados dos aplicativos operacionais disponíveis. Segundo Inmon (1997), um DW é um conjunto de dados baseado em assuntos, integrado, não volátil, e variável em relação ao tempo, que tem por objetivo dar suporte aos processos de tomada de decisão gerenciais. Para Aurélio et al. (1999), um DW pode ser definido como um repositório integrado, orientado para análise, histórico, com dados apenas para leitura, destinados apenas para ser utilizado como base para suporte a decisão e sistema KDD. A tecnologia de DW surgiu com o objetivo de suprir as carências nos sistemas tradicionais, quanto à exploração e análise dos dados, integrando e consolidando dados de diferentes acervos (DEBATIN, 2003). O DW é uma arquitetura que organiza, totaliza e armazena os dados permitindo traçar estratégias baseadas nos assuntos da empresa de maneira confiável dando suporte ao nível gerencial nas tomadas de decisão. O objetivo de um DW é fornecer uma "imagem única da realidade do negócio". De uma forma geral, sistemas de DW compreendem um conjunto de programas que extraem dados do ambiente de dados operacionais da empresa, um banco de dados que os mantém, e sistemas que fornecem estes dados aos seus usuários Características do Data Warehouse Dentre as principais características do Data Warehouse pode-se citar a orientação por assunto, a integração dos dados, a variabilidade no tempo e não volatilidade. Orientação por Assunto Segundo Machado (2001), orientação por assunto significa que um DW armazena as informações por assuntos de interesse da empresa que são mais importantes, em contraste com os sistemas operacionais que são orientados a processos desenvolvidos para manter as transações realizadas diariamente. 16

26 Integrado Segundo Colaço Júnior (2004) o DW deve consolidar dados de diversas origens, o que geralmente envolve diversas codificações. Os dados devem ser perfeitamente integrados para que, quando forem armazenados assumam uma única convenção. Variante no tempo Os dados contidos em um sistema de DW são temporais, e referem-se a períodos de tempos bem definidos, e isto auxilia na análise e na confirmação de acontecimentos sazonais dentro de uma determinada atividade ou setor de um negócio. Para Aurélio, Vellasco e Lopes (1999), o horizonte de tempo válido para o DW é significantemente maior do que o dos sistemas operacionais. Um horizonte de tempo de 60 a 90 dias é normal para os sistemas operacionais; um horizonte de tempo de 5 a 10 anos é normal para o DW. Não Volátil Segundo Inmon (1997), as operações de atualização, modificação, exclusão de dados são realizadas nos bancos de dados operacionais. Estas funções são efetuadas regularmente de acordo com as necessidades dos usuários. No DW o processo de armazenamento dos dados é diferente. O DW possui duas operações básicas que consiste em carregar e acessar os dados. No nível do DW os dados não sofrem alterações ou são excluídos, para cada alteração é inserido um novo registro com os mesmos dados e contendo a alteração Arquitetura do Data Warehouse Segundo Debatin (2003), a arquitetura do DW é baseada em um sistema de banco de dados relacional. Quando um dado é inserido em um DW, ele é transformado em uma estrutura integrada. O processo pode envolver filtragem e compactação de dados. A Figura 5 mostra uma visão simplificada de uma arquitetura de DW. 17

27 Figura 5. Visão simplificada de uma arquitetura de DW Fonte: Adaptado de Costa e Anciães (2003). Um DW deve ser capaz de responder a consultas avançadas de maneira rápida, sem deixar de mostrar detalhes relevantes à resposta. Para isso ele deve possuir uma arquitetura que lhe permita coletar, manipular e apresentar os dados de forma eficiente e rápida. O estudo de uma arquitetura permite compreender como o DW faz para armazenar, integrar, comunicar, processar e apresentar os dados que os usuários utilizarão em suas decisões. Um DW pode variar sua arquitetura conforme o tipo de assunto abordado, pois as necessidades variam de empresa para empresa (COLAÇO JÚNIOR, 2004) Pré-Processamento Segundo Pacheco et al. (1999), a etapa de pré-processamento é responsável por consolidar as informações relevantes para o algoritmo minerador, com objetivo de reduzir a complexidade do problema. O processo de tratamento dos dados pode ser dividido em três etapas: Limpeza dos dados: etapa responsável por realizar a consistência dos dados, a correção de possíveis erros e o preenchimento e eliminação de valores nulos e redundantes. Conforme afirma Aurélio et al. (1999), a execução dessa fase corrige a base de dados eliminando consultas desnecessárias que seriam executadas pelo algoritmo minerador e que afetariam o seu processamento; Seleção dos dados: etapa que irá definir ou escolher apenas os atributos relevantes do conjunto de atributos existentes na base de dados; e 18

28 Codificação dos dados: etapa que divide os valores contínuos dos atributos em uma lista de intervalos representados por um código, convertendo valores quantitativos em valores categóricos. Para Aurélio et al. (1999), em alguns casos a transformação de um valor em um equivalente pode facilitar a MD a encontrar seu objetivo com melhor qualidade de resultados Mineração de Dados A Mineração de Dados (MD) é uma área multidisciplinar que incorpora técnicas utilizadas em diversas áreas como IA (especialmente a aprendizagem de máquina), Banco de Dados (recursos para manipular grandes volumes de dados) e Estatística (comumente na avaliação e validação dos dados), conforme é mostrado na Figura 6. Figura 6. MD utiliza recursos de diferentes áreas Fonte: Silva (2003). A área de IA têm propiciado aos pesquisadores a possibilidade de utilizar diferentes técnicas para reconhecimento e extração de padrões. Essa extração está acompanhada de técnicas de manipulação de dados e análises posteriores. Todas essas diferentes técnicas compõem o processo de MD. A Descoberta de Conhecimento de Base de Dados (DCBD) é uma tecnologia que possui ferramentas poderosas para a descoberta eficiente de informações valorosas em grandes bancos de dados, com objetivo de auxiliar no suporte a decisão. MD é uma das ferramentas de DCBD mais 19

29 utilizadas, podendo ser considerada um passo dentro do processo de DCBD (FAYYAD et al., 1996b apud SILVA 2003). Para Dias (2002), os principais objetivos da MD são descobrir relacionamento entre os dados e fornecer subsídios para que possa ser feita uma previsão de tendências futuras baseadas no passado. Segundo Silveira (2004), a MD consiste em obter informações através de uma base de dados existente, usando seus atributos para extrair informações que não são óbvias e que precisam ser trabalhadas para serem úteis na tomada de decisão, através da utilização de algoritmos para identificar padrões nos dados analisados. Carvalho (2001) define a mineração de dados como a utilização de técnicas automáticas de exploração de grandes quantidades de dados de forma a descobrir novos padrões e relações que, devido ao volume de dados, não seriam facilmente descobertos a olho num pelo ser humano. Machado (2000), afirma que as técnicas de MD permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados. Este tipo de ferramenta utiliza-se das mais modernas técnicas de computação, como redes neurais, algoritmos genéricos e lógica nebulosa. MD tem sido definida como a extração não trivial da informação importante, implícita, previamente desconhecida, de dados. Ela usa o aprendizado de máquina, técnicas estatísticas e de visualização para descobrir e apresentar o conhecimento em uma forma facilmente compreensível pelos humanos. A MD tem se mostrado importante em um grande número de aplicações, por exemplo, na área de segurança para detectar fraudes em cartões de créditos, análises financeiras e de investimentos, detecção e predição de erros em grandes empresas, análise de informações, limpeza em bases de dados, marketing e melhoria no processo industrial. Como a extração do conhecimento útil e compreensível não se faz apenas com a manipulação de um conjunto de dados, a MD é um processo centrado na interação entre diferentes usuários, que geralmente são divididos em três classes: Especialista do domínio: usuário que deve possuir amplo conhecimento do domínio da aplicação e fornecer apoio à execução do processo; 20

30 Analista: usuário especialista no processo de MD e responsável por sua execução. Esse usuário deve ter domínio sobre o processo de DCBD; e Usuário Final: representa os usuários que utilizam o conhecimento extraído no processo de MD como apoio a tomada de decisão. A MD pode ser classificada em dois tipos: Descoberta direta onde fica explícito o que se deseja encontrar no banco de dados e Descoberta indireta, onde se faz uma espécie de busca aleatória, tentando identificar algum relacionamento entre os dados que representem algum conhecimento útil. A MD tem como objetivos a previsão e descrição de modelos. A previsão pode ser obtida através da utilização de variáveis contidas no banco de dados para prever valores desconhecidos ou futuros. A descrição envolve a descoberta de padrões interpretáveis pelos humanos. Dentro do processo de DCBD descrever modelos possui maior importância que prever os mesmos. A previsão e a descrição dos modelos são conseguidas selecionando as tarefas, algoritmos e técnicas de extração de dados (FAYYAD et al., 1996b apud SILVA 2003). Os algoritmos e as técnicas usados para se criar modelos a partir de dados, normalmente, provém de áreas como Aprendizado de Máquina, Reconhecimento de Padrões e Estatística. Estas técnicas, muitas vezes, podem ser combinadas para se obter melhores resultados (SILVA 2003). Conforme afirma Pacheco et al. (1999), as tarefas de DCBD que funcionam como bases das técnicas de MD são: Classificação, Associação e Agrupamento. Estas tarefas podem utilizar técnicas de MD baseadas em RBC, Redes Neurais Artificiais, Árvores de Decisão, Estatística, Computação Evolucionária, entre outras. Existem outras tarefas de DCBD utilizadas com menor escala, tais como: as consultas, a descoberta de dependência e a regressão. A Tabela 1 mostra as principais tarefas de DCBD e as técnicas mais utilizadas para MD. 21

31 Tabela 1. Algumas tarefas de KDD e suas técnicas de mineração de dados Tarefas de KDD Técnicas Associação Classificação Estatística e Teoria dos Conjuntos Algoritmos Genéricos, Redes Neurais e Árvores de decisão Clustering ou Agrupamento Redes Neurais e estatísticas Previsão de séries temporais Redes Neurais, Lógica Nebulosa e Estatística Fonte: Adaptado de Aurélio et al. (1999). Existem diversa tarefas de DCBD, cada uma está diretamente relacionada ao domínio da aplicação e interesse do usuário. Cada tarefa de DCBD extrai um tipo diferente de conhecimento do banco de dados, com isso, necessita de um algoritmo diferente para cada tarefa Tarefas da DCBD Com o crescimento dos sistemas de MD desenvolvidos para os mais diferentes domínios, a variedade de tarefas para MD vem se tornando cada vez mais diversificada. Essas tarefas podem extrair diferentes tipos de conhecimento, sendo que, inicialmente faz-se necessário decidir qual o tipo de conhecimento que o algoritmo deve extrair no processo de MD. Regras de Associação A tarefa de associação permite relacionar a ocorrência de um determinado conjunto de itens com a ocorrência de outro conjunto de itens. Para Carvalho (2001), regras de associação procuram determinar que fatos ocorram simultaneamente com probabilidade razoável ou que itens estão presentes juntos com certa chance. Segundo Baptista e Carvalho (2003), regras de associações procuram identificar afinidades entre registros de um subconjunto de dados. Sendo essas afinidades/associações expressas na forma de regras. Uma regra de associação caracteriza o quanto a presença de um conjunto de itens nos registros de uma base de dados implica na presença de algum outro conjunto distinto de itens nos mesmos registros (AGRAVAL & SRIKANT, 1994 apud DOMINGUES, 2004). 22

32 Uma regra de associação é uma regra do tipo X Y, onde X e Y são conjuntos de itens, e a interseção deles X Y é o conjunto vazio. Cada regra de associação é associada a um fator suporte superior FSup, e a um fator de confidência FConf. O FSup é defenido como, FSup = X U Y / N, ou seja, esta fórmula representa a razão do número de tuplas que satisfazem ambos X e Y sobre o número total de tuplas, representado por N. FConf é definido como, FConf = X U Y / X, o fator de confiança é obtido pela razão do número de tuplas que satisfazem ambos X e Y sobre o número de tuplas que satisfazem X (AURÉLIO, et al. 1999). Para facilitar o entendimento das regras de associação, pode-se exemplificar com o modelo abaixo representado pela Tabela 2, que mostra uma tabela com os dados de entrada e algumas regras de associação descobertas após a análise da base de dados. Tabela 2. Entrada de dados para a descoberta de regras de associação. MASCULINO FEMININO HIPERTROFIA ESTÉTICA PESO NORMAL ACIMA DO PESO Sim Não Sim Sim Sim Não Não Sim Não Sim Não Sim Não Sim Não Não Sim Não Sim Não Sim Não Não Sim Sim Não Sim Não Sim Não Sim Não Sim Sim Sim Não Não Sim Sim Não Não Sim Não Sim Não Sim Sim Não Sim Não Sim Não Sim Não Não Sim Sim Sim Não Sim Sim Não Sim Não Não Sim Não Sim Sim Sim Não Sim Não Sim Sim Não Sim Não Sim Não Não Não Sim Não Não Sim Não Sim Não Sim Sim Não Sim Sim Sim Não 23

33 Após processar os dados da Tabela 2 utilizando a ferramenta de MD Weka, com o algoritmo apriori, algumas regras de associação foram geradas como mostra a Figura 7. Figura 7. Regras de associação geradas pelo algoritmo apriori. Classificação Segundo Aurélio et al. (1999), a classificação é a tarefa mais estudada em KDD e tem como objetivo descobrir um conhecimento que possa ser utilizado para prever a classe de um registro. Para Carvalho (2001), a classificação é uma das técnicas mais utilizadas no data mining simplesmente porque é uma das tarefas cognitivas humanas mais realizadas no auxilio à compreensão do ambiente em que vivemos. Já para Baptista e Carvalho (2003), a classificação trata-se de uma técnica que consiste na aplicação de um conjunto de exemplos pré-classificados, para desenvolver um modelo capaz de classificar uma população maior de registros. Conforme afirma Romão (2002), o objetivo da tarefa de classificação é descobrir um relacionamento entre um atributo meta, pré-definido, e um conjunto de atributos previsores. A Tabela 3 será utilizada como exemplo para mostrar algumas regras de classificação que podem ser descobertas após a aplicação de um algoritmo de classificação. 24

34 Tabela 3. Entrada de dados para a tarefa de classificação. SEXO OBJETIVO IDADE ACIMA DO PESO Masculino Hipertrofia 25 Sim Masculino Estética 21 Sim Feminino Hipertrofia 23 Sim Feminino Estética 34 Sim Feminino Hipertrofia 30 Não Masculino Estética 21 Não Masculino Hipertrofia 20 Não Feminino Condicionamento 18 Não Feminino Hipertrofia 34 Não Masculino Condicionamento 55 Não Após processar os dados da Tabela 3 utilizando a ferramenta de MD Weka, com o algoritmo classificador NNge, algumas regras de classificação foram geradas como mostra a Figura 8. Figura 8. Regras de classificação geradas pelo algoritmo NNge. Regras do tipo SE... ENTÃO..., constituem uma forma de representação simbólica e possuem o seguinte formato: SE <antecedente> ENTÃO <conseqüente>. O antecedente é formado por expressões condicionais envolvendo atributos do domínio da aplicação existentes no banco de dados. Já o conseqüente, é composto por uma expressão que evidencia algum valor para um atributo meta, descoberto em função dos valores contidos nos atributos que compõem o antecedente (ROMÃO, 2002). 25

35 As regras de classificação podem ser interpretadas como: SE os atributos preditivos de uma tupla satisfazem as condições no antecedente da regra, ENTÃO a tupla tem a classe indicada no conseqüente da regra. Para Pereira (2004), as árvores de decisão são consideradas pela comunidade científica como uma importante técnica para implementar a tarefa de Classificação, devido a sua representação simples e intuitiva, fácil de ser compreendida. Agrupamento A principal característica desta tarefa é descobrir grupos utilizando a similaridade dos valores de seus atributos como fator de decisão. Para Carvalho (2001), o agrupamento é um método que tenta baseado em medidas de semelhança, definir quantas e quais classes existem em um conjunto de entidades. O agrupamento é uma tarefa que tem como objetivo segmentar os dados formando grupos homogêneos. Conforme afirma Carvalho (2001), agrupar é classificar uma massa de dados em classes desconhecidas. Para Silva (2003), o agrupamento é aplicado quando ainda não é conhecida nenhuma classe e sua função é produzir uma segmentação do conjunto de registros de entrada de acordo com algum critério. Segundo Pacheco et al. (1999) a utilização do agrupamento tem como meta principal criar classes através de partições do banco de dados em conjunto com tuplas. Essa partição é feita agrupando tuplas com valores de atributos semelhantes em uma mesma classe. Após a criação destas classes, é possível aplicar algoritmos de classificação para produzir regras para as mesmas. Conforme Aurélio, et al. (1999), um bom agrupamento caracteriza-se pela produção de segmentos de alta qualidade, onde a similaridade intra-classe é alta e a inter-classe é baixa. Para Romão (2002), através da tarefa de agrupamento pode-se dividir os dados em subconjuntos homogêneos fáceis de descrever e visualizar. Estes dados podem ser exibidos para o usuário em vez de tentar mostrar todos os dados, o que usualmente resultaria na perda de padrões embutidos (FAYYAD, 1997 apud ROMÃO, 2002). Schenatz (2005) citou a possibilidade da utilização da tarefa de agrupamento, por exemplo, em um banco de dados escolar, relacionando alunos e disciplinas. Uma regra do tipo 85% dos alunos inscritos em Programação I também estão inscritos em Teoria da Computação pode ser 26

36 usada pela direção ou secretaria no planejamento do currículo anual, ou alocar recursos como sala de aula e professores Técnicas de Mineração de Dados De acordo com as tarefas a serem executadas e as classes de problemas em questão, existem diferentes técnicas de mineração e algoritmos que possibilitam a busca por padrões escondidos nos dados. Possuir certo conhecimento sobre essas técnicas, facilita no momento da escolha de uma delas de acordo com os problemas apresentados (SILVEIRA, 2003). A Tabela 4 apresenta as principais técnicas de mineração de dados, bem como suas descrições, tarefas e exemplos de algoritmos utilizados. Tabela 4. Técnicas de mineração de dados. Técnica Descrição Tarefas Exemplos Descoberta de Estabelece uma correlação estatística entre Associação Apriori, Regras de atributos de dados e conjuntos de dados AprioriTid, AIS. Associação Árvores de Hierarquização dos dados, baseada em Classificação CART, CHAID, decisão estágios de decisão (nós) e na separação de Regressão C5.0. classes e subconjuntos Raciocínio Baseado no método do vizinho mais Classificação BIRCH, baseado em próximo, combina e compara atributos Segmentação CLARANS. Casos para estabelecer hierarquia de semelhança Algoritmos Métodos gerais de busca e otimização, Classificação, Algoritmo Genéricos inspirados na Teoria da Evolução, onde a Segmentação Genético Simples, cada nova geração, soluções melhores têm Genitor, CHC. mais chance de terem descendentes Redes Neurais Modelos inspirados na fisiologia do Classificação, Perceptron, Rede cérebro, onde o conhecimento é fruto do Segmentação. MLP, Rede Time mapa das conexões neuronais e dos pesos Delay. dessas conexões Fonte: Adaptado de Dias (2002). 27

37 2.3.5 Pós-Processamento O pós-processamento é utilizado principalmente para avaliar o processo de descoberta, melhorar a compreensão e/ou selecionar conhecimento descoberto que seja mais relevante. Para Pacheco et al. (1999), esta fase envolve a interpretação do conhecimento descoberto, ou algum processamento deste conhecimento. O objetivo principal desta fase é melhorar a compreensão do conhecimento descoberto pelo algoritmo minerador através da análise dos dados por um especialista. Muitas vezes a mineração não traz resultados satisfatórios, sendo necessário uma outra etapa de Enriquecimento, esta que consegue agregar mais informações de forma que essas contribuam no processo de descoberta de conhecimento (PACHECO et al. 1999). Segundo Silva (2003) a etapa de pós-processamento é iniciada com a avaliação dos padrões realmente interessantes, que representem conhecimento útil, seguido da apresentação do conhecimento extraído para o usuário final, através de técnicas de visualização e representação do conhecimento. 2.4 SOLUÇÕES SIMILARES Esta seção tem o objetivo de apresentar soluções similares à proposta neste TCC desenvolvidas em trabalhos acadêmicos. Porém, não foram encontradas soluções similares específicas à proposta deste trabalho, somente soluções que utilizaram técnicas de IA no desenvolvimento de softwares para apoio a prática desportiva em geral. A seguir serão apresentadas duas propostas A IA entrando na quadra de vôlei: Scout inteligente O Scout Inteligente é um projeto de software que tem como objetivo principal o monitoramento de jogo de vôlei, através da utilização de técnicas de IA, que combinam agentes inteligentes e mineração de dados para auxiliar os técnicos na tomada de decisão. Existem vários softwares estatísticos que auxiliam nesta tarefa, tais como o Data Volley e o Scout Técnico, porém, são sistemas estatísticos de captura, cruzamento de dados e emissão de relatórios que não levam em consideração o histórico do jogador de toda uma temporada e o contexto de uma partida de vôlei (ZAMBERLAM et al. 2005). 28

38 A proposta do Scout Inteligente é utilizar um agente inteligente para fazer o papel de tutor da comissão técnica, interagindo com ela e com a base de dados criada, contendo informações semânticas e imagens/vídeos dos seus atletas e da equipe adversária ao longo de várias temporadas. Os vídeos dos jogos contendo as jogadas da equipe adversária, antes armazenados no banco, passarão por um processo de etiquetação semântica, em que serão informados atletas e seus posicionamentos, jogadas e finalizações. Podendo assim, serem utilizados não somente antes de um jogo, mas durante uma partida (ibidem). O papel do agente é de um auxiliar técnico com crenças, desejos e intenções. As crenças são informações do jogo em curso e de outros jogos armazenados na base de dados (como um histórico), contendo todas as situações de um jogo, como ataque, defesa, posicionamento dos jogadores. Os desejos são os estados do jogo a serem atingidos, situações mineradas da base de dados, decorrente da análise semântica descrita nas jogadas da equipe adversária mais os dados estatísticos da própria equipe. Finalmente, as intenções são representadas pelo planejamento e pela realização de ações em forma de jogadas efetivas a serem executadas pela própria equipe, previamente executadas por esse agente (ibidem). Dessa forma, será possível traçar táticas e estratégias simuladas previamente pelo agente auxiliar, o qual realizou inferências do ambiente (jogo) com base no resultado de um processo de mineração (ibidem) A informática e suas aplicações em educação física Este projeto de pesquisa propôs a confecção de uma ferramenta baseada em hipermídia voltada ao público de Educação Física. Com objetivo de agilizar e qualificar a prestação de serviços ao público em geral, bem como criar atendimentos mais personalizados (BERG et al. 2004). Foi desenvolvido tutorial envolvendo o tópico de saltos, compreendendo: aspectos fisiológicos nas faixas etárias de iniciação, uso de materiais alternativos nas aulas de atletismo, lesões mais freqüentes, materiais e regras (ibidem). O aplicativo utilizou multimídia interativa, possibilitando a interatividade com o usuário, e obtendo-se afinal uma aplicação hipermídia, como mostra a Figura 9. 29

39 Figura 9. Aplicação Hipermídia Fonte: Berg, Amaral, Streibel (2004). 2.5 FERRAMENTAS DE MINERAÇÃO DE DADOS Segundo Goebel & Gruenwald (1999 apud DIAS 2002), atualmente grande parte das ferramentas disponíveis são ferramentas derivadas da IA ou da comunidade de estatística. Muitas vezes, essas ferramentas não processam os dados diretamente na base de dados, necessitando a exportação e importação de dados, pré-processamento e pós-processamento dos dados e transformação dos dados, gastando um tempo razoável com a manipulação dos mesmos. Para escolher uma ferramenta de descoberta de conhecimento, devem ser observadas as seguintes características (ibidem): Facilidade de acesso em diferentes fontes de dados; A possibilidade de incluir modelos de dados orientados a objetos ou modelos não padronizados; O poder de processamento relacionado ao número máximo de tabelas/tuplas/atributos; A capacidade de processamento relacionado ao tamanho do banco de dados; Os diferentes tipos de atributos que a ferramenta pode manipular; e Tipo de linguagem de consulta. 30

40 Um esquema de classificação de características pode ser utilizado para analisar as ferramentas de descoberta de conhecimento e de mineração de dados. As características podem ser divididas em três grupos chamados características gerais, conectividade de banco de dados e características de mineração de dados (ibidem). As características citadas acima foram analisadas para a escolha da ferramenta a ser utilizada neste projeto, porém, optou-se pelo Weka devido principalmente a possibilidade da utilização de recursos via API e da ferramenta ser distribuída gratuitamente, características que não foram encontradas nas outras ferramentas pesquisadas Análise das ferramentas de mineração de dados No início do TCCI já se tinha conhecimento da ferramenta de mineração de dados Weka, uma ferramenta gratuita, com possibilidade de utilização de recursos via API, que possui código aberto e orientado a objetos. Entretanto, foram pesquisadas outras ferramentas de MD procurando encontrar características semelhantes à ferramenta Weka, mas não foram encontradas. Dentre as ferramentas pesquisadas, foram descritas duas ferramentas que mais se destacaram, Clementine e Enterprise Miner, com um quadro comparativo entre seus recursos. Após analisar as características das ferramentas apresentadas anteriormente, tais como: tarefas de mineração, algoritmos disponibilizados, conectividade com banco de dados, capacidade de manipulação com grandes quantidades de dados, possibilidade de manipular diferentes tipos de dados, utilização de recursos via API e o custo de aquisição da ferramenta, foi definida a ferramenta de mineração de dados para dar suporte a este projeto. A ferramenta Weka foi à escolhida, devido principalmente a possibilidade da utilização de recursos via API e da ferramenta ser distribuída gratuitamente, características que as outras ferramentas citadas não possuíam, e também pelo fato da ferramenta Weka ser citada por diversos autores como uma excelente ferramenta para dar suporte à mineração de dados. Entretanto, não se pode afirmar qual é a melhor ferramenta a ser utilizada, cada ferramenta possui características diferentes, possuindo pontos positivos e negativos, a escolha de uma ferramenta está diretamente relacionada aos objetivos que se pretende alcançar, no caso desse trabalho, a opção foi o Weka. 31

41 neste projeto. A Tabela 5 mostra de maneira resumida uma comparação entre as ferramentas apresentadas Tabela 5. Comparação entre as ferramentas de mineração de dados. Utilização de recursos via API Ferramenta Gratuita Clementine Não Não Enterprise Miner Não Não Weka Sim Sim As ferramentas Clementine e Enterprise Miner serão descritas nas seções e , respectivamente. A ferramenta Weka será descrita, bem como exemplificada a utilização de sua API, na seção Clementine O Clementine é uma ferramenta que possui uma interface gráfica que suporta a implementação das tarefas de mineração de dados. É possível a navegação por ícones que por sua vez representam as tarefas, o usuário percorre todo o processo de DCBD. O usuário pode arrastar esses ícones para a área de trabalho do Clementine criando uma seqüência de funções a serem executadas (CLEMENTINE, 2007). A ferramenta Clementine possibilita a utilização de tarefas de Classificação, Previsão, Clustering, Associação, Regressão. Outra característica marcante é a possibilidade de utilização das técnicas de Descoberta de regras de Associação (Apriori), Árvores de Decisão (C5.0, C&RT), Redes Neuronais (Kohonen, MLP, RBFN). A ferramenta suporta as plataformas HP/UX, IBM AIX, Sun Solaris, Windows (ibidem). Dentre os pontos positivos e negativos da ferramenta Clementine pode-se citar: Pontos positivos: O Clementine permite operar sobre grandes conjuntos de dados através de um modelo Cliente-Servidor. Pontos Negativos: A Ferramenta não é gratuita. 32

42 Enterprise Miner O Enterprise Miner implementa todo o processo DCBD recorrendo a um modelo próprio ao qual o SAS Institute denominou SEMMA Selecionar (Sample), Explorar (Explore), Modificar (Modify), Modelar (Model) e Avaliar (Assess) (SAS, 2007). A seleção dos dados é feita com a criação de tabelas. Estas devem possuir uma quantidade de dados suficientes e significativos, porém, as tabelas não podem ter um tamanho muito grande, o que tornaria lento o processo de descoberta. O Enterprise Miner possui um conjunto de ferramentas de análise que podem ser combinadas, possibilitando a criação e comparação de vários modelos. Possui também funcionalidades de pré-processamento dos dados, transformação de variáveis, amostragem e agrupamento dos dados, teste e validação. As suas ferramentas de visualização permitem uma fácil interpretação dos resultados extraídos (MATOS, 2004). A ferramenta Enterprise Miner possibilita a utilização das tarefas de Classificação, Previsão, Clustering, Associação, Regressão. Provê técnicas de Árvores de Decisão (CART, CHAID), Redes Neuronais (Kohonen, SOM, RBFN), Case-Based Reasoning. A ferramenta suporta as plataformas Cliente Windows; Servidor Unix, Windows (ibidem). Dentre os pontos positivos e negativos do Enterprise Miner pode-se citar: Pontos Positivos: Quantidade de tarefas e técnicas disponibilizadas. Pontos negativos: A Ferramenta não é gratuita Weka O Weka é uma ferramenta de DCBD que contempla uma série de algoritmos de preparação de dados, de aprendizagem de máquina (mineração) e de validação de resultados. Weka foi desenvolvido na Universidade de Waikato na Nova Zelândia, sendo escrito em Java e possuindo código aberto. O sistema possui uma interface gráfica amigável e seus algoritmos fornecem relatórios com dados analíticos e estatísticos do domínio minerado. A maioria de seus recursos podem ser utilizados através de sua interface gráfica, sendo que os demais, podem ser utilizados através de API s (SILVA, 2004). 33

43 O Weka foi implementado na linguagem Java, sua principal característica é a portabilidade, desta forma pode rodar em diversas plataformas, aproveitando também os benefícios de uma linguagem orientada a objetos, tais como: modularidade, polimorfismo, encapsulamento, reutilização de código dentre outros, além disso, é um software de domínio público estando disponível em Alguns métodos de classificação disponíveis no pacote Weka: Árvore de decisão induzida; Regras de aprendizagem; Naive Bayes; Tabelas de decisão; Regressão local de pesos; Aprendizado baseado em instância; Regressão lógica; Perceptron; e Perceptron multicamada. Alguns métodos para predição numérica: Regressão linear; Geradores de árvores modelo; Regressão local de pesos; Aprendizado baseado em instância; Tabelas de decisão; e Perceptron multicamadas. 34

44 O arquivo ARFF Segundo Silva (2004) o Weka possui um formato de arquivo próprio, o ARFF, deve-se descrever o domínio do atributo, pois o mesmo não pode ser obtido automaticamente pelo seu valor. Antes de utilizar algum algoritmo do pacote Weka, os dados devem ser convertidos para o formato ARFF que é constituído por três partes: Relação: a primeira linha do arquivo, que deve ser igual seguida de uma palavra-chave de identificação da relação; Atributos: um conjunto de linhas onde cada uma inicia seguida do nome do atributo e seguida do seu tipo, que podem ser nominais ou numéricos; e Dados: depois de uma linha Cada linha deve corresponder a uma instancia e deve ter valores separados por vírgula correspondentes dos atributos da seção atributos. A Figura 10 mostra um exemplo do formato do arquivo ARFF. Figura 10. Arquivo no formato ARFF Fonte: Adaptado de Silva (2004). Dentre os pontos positivos e negativos do Weka pode-se citar: Pontos positivos: Portabilidade, o weka possui código aberto e é gratuito. Também é possível a utilização de seus recursos via API s. 35

45 Pontos Negativos: Uma limitação da ferramenta é sua escalabilidade, e também limita o volume de dados a ser manipulado à dimensão de memória principal Testes de integração com a ferramenta Weka Após analisar algumas ferramentas de mineração de dados, foi escolhida a ferramenta Weka para dar suporte a MD neste TCC. Devido as suas características, tais como: portabilidade, contempla vários algoritmos de MD, possui o código aberto, linguagem orientada a objetos, seu ambiente provê o desenvolvimento de aplicações e script e é uma ferramenta gratuita. A integração da ferramenta Weka com a linguagem de programação Java, necessita de alguns requisitos, como: Ter o ambiente de desenvolvimento Java (J2SE, Java 2 Standard Edition) instalado, não basta ter somente a máquina virtual (J2SE Runtime Environment); e Ter a ferramenta Weka devidamente instalada. A princípio o teste de integração foi realizado com o ambiente de desenvolvimento Eclipse, em sua versão 3.1., porem, após analisar o ambiente de desenvolvimento NetBeans 5.0, evidenciouse que é mais simples a integração com a ferramenta Weka, pois não é necessário configurar variáveis de ambiente como acontecia com o Eclipse. A seguir serão mostrados os dois testes de integração, com o Eclipse e com o NetBeans respectivamente. O arquivo.arff utilizado para ambos os casos foi o arquivo weather.arff, um exemplo de arquivo que vem junto com o pacote Weka, sua estrutura pode ser visualizada na Figura

46 Figura 11. Exemplo do arquivo ARFF utilizado Integração com a IDE Eclipse Para a execução deste teste o ambiente de desenvolvimento utilizado foi o Eclipse, em sua versão 3.1. Inicialmente é necessário fazer algumas configurações no ambiente de desenvolvimento (Eclipse), para que o pacote Weka possa ser incluído nas classes do projeto teste, deve-se adicionar o arquivo weka.jar no inicio do projeto, configurando as variáveis de ambiente. Foi desenvolvida uma pequena aplicação teste, que compreendeu a execução de alguns passos, o funcionamento da aplicação teste é descrito a seguir. Inicialmente o programa apresenta uma tela com a opção de selecionar um arquivo para minerar, o usuário clica na opção selecionar e escolhe um arquivo no formato.arff e confirma, logo após o programa habilita um botão com a opção minerar, o usuário clica no botão minerar e o programa chama a classe do weka, processa o arquivo e apresenta o resultado em uma caixa de texto. Para este teste de integração foi utilizado o arquivo weather.arff, e o algoritmo foi o J48. A seguir o trecho de código da aplicação teste que executa o algoritmo J48. java cp /c/ weka-3-4/weka.jar weka.classifiers.trees.j48 -t /c/ weka-3-4/data/ weather.arff 37

47 Este código deve estar escrito em uma única linha. A opção cp foi utilizado para indicar o uso de um pacote adicional para a máquina vitual Java, este deve ser composto pelo caminho completo para localizar o arquivo weka.jar, neste caso o pacote Weka foi instalado em c/ weka-3-4/weka.jar. O nome da classe do algoritmo classificador é weka.classifiers.trees.j48. A opção t indica o nome do arquivo utilizado para ser executado o algoritmo minerador, no caso -t /c/ weka-3-4/data/ weather.arff. Após a execução do trecho de código apresentado, o seguinte resultado foi obtido como mostra a Figura 12. Figura 12. Resultado da classificação com o algoritmo J Integração com a IDE NetBeans Para a execução deste teste o ambiente de desenvolvimento utilizado foi a IDE NetBeans, em sua versão 5.0. Inicialmente é necessário criar um novo projeto dentro do NetBeans e dar um nome, por exemplo TesteWeka, após nomear o projeto, é necessário adicionar o arquivo weka.jar na pasta Libraries do projeto, para que o pacote Weka possa ser incluído nas classes do projeto teste, como mostra a Figura

48 Figura 13. Adicionando o arquivo weka.jar Foi desenvolvida uma pequena aplicação teste, o funcionamento da aplicação teste é descrito a seguir. O arquivo utilizado foi o weather.arff, e o algoritmo foi o J48. Inicialmente o sistema teste apresenta uma tela com a opção de minerar, então o usuário clica no botão minerar, é a partir disto que é acionado o comando que executa a integração com a ferramenta Weka, onde o algoritmo classificador J48 processa o arquivo weather.arff. A seguir a Figura 14 mostra o trecho de código da aplicação teste que executa o algoritmo J48. Para que o código funcione corretamente, é necessário copiar o arquivo weather.arff, que no caso se encontra em C:\Arquivos de programas\weka-3-4\data, para a pasta onde está o projeto teste, no caso C:\Documents and Settings\TesteWeka. 39

49 Figura 14. Código que executa o algoritmo classificador J48. Após a execução do trecho de código apresentado na Figura 15, o resultado do processamento do algoritmo minerador J48 é mostrado na tela para o usuário, o resultado obtido é ilustrado na Figura15. Figura 15. Resultado da classificação com o algoritmo J48. 40

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

SISTEMAS DE APOIO À DECISÃO SAD

SISTEMAS DE APOIO À DECISÃO SAD SISTEMAS DE APOIO À DECISÃO SAD Conceitos introdutórios Decisão Escolha feita entre duas ou mais alternativas. Tomada de decisão típica em organizações: Solução de problemas Exploração de oportunidades

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO:

FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: FACULDADE DE CIÊNCIAS SOCIAIS E TECNOLÓGICAS FACITEC CURSO: Bacharelado em Sistemas de Informação DISCIPLINA: Fundamentos de Sistemas de Informação PROFESSOR: Paulo de Tarso Costa de Sousa TURMA: BSI 2B

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

BUSINESS INTELLIGENCE -Inteligência nos Negócios-

BUSINESS INTELLIGENCE -Inteligência nos Negócios- UNIVERSIDADE SÃO FRANCISCO CENTRO DE CIÊNCIAS JURÍDICAS, HUMANAS E SOCIAIS BUSINESS INTELLIGENCE -Inteligência nos Negócios- Curso: Administração Hab. Sistemas de Informações Disciplina: Gestão de Tecnologia

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso

5 Estudo de Caso. 5.1. Material selecionado para o estudo de caso 5 Estudo de Caso De modo a ilustrar a estruturação e representação de conteúdos educacionais segundo a proposta apresentada nesta tese, neste capítulo apresentamos um estudo de caso que apresenta, para

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS

Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Tarefas e Técnicas de Mineração de Dados TAREFAS E TÉCNICAS DE MINERAÇÃO DE DADOS Sumário Conceitos / Autores chave... 3 1. Introdução... 3 2. Tarefas desempenhadas por Técnicas de 4 Mineração de Dados...

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Modelagem de Sistemas de Informação

Modelagem de Sistemas de Informação Modelagem de Sistemas de Informação Professora conteudista: Gislaine Stachissini Sumário Modelagem de Sistemas de Informação Unidade I 1 SISTEMAS DE INFORMAÇÃO...1 1.1 Conceitos...2 1.2 Objetivo...3 1.3

Leia mais

Microsoft Innovation Center

Microsoft Innovation Center Microsoft Innovation Center Mineração de Dados (Data Mining) André Montevecchi andre@montevecchi.com.br Introdução Objetivo BI e Mineração de Dados Aplicações Exemplos e Cases Algoritmos para Mineração

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas e técnicas

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

SISTEMAS INTELIGENTES DE APOIO À DECISÃO

SISTEMAS INTELIGENTES DE APOIO À DECISÃO SISTEMAS INTELIGENTES DE APOIO À DECISÃO As organizações estão ampliando significativamente suas tentativas para auxiliar a inteligência e a produtividade de seus trabalhadores do conhecimento com ferramentas

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

srbo@ufpa.br www.ufpa.br/srbo

srbo@ufpa.br www.ufpa.br/srbo CBSI Curso de Bacharelado em Sistemas de Informação BI Prof. Dr. Sandro Ronaldo Bezerra Oliveira srbo@ufpa.br www.ufpa.br/srbo Tópicos Especiais em Sistemas de Informação Faculdade de Computação Instituto

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI)

Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Programa do Curso de Pós-Graduação Lato Sensu MBA em Business Intelligence (BI) Apresentação O programa de Pós-graduação Lato Sensu em Business Intelligence Inteligência Competitiva tem por fornecer conhecimento

Leia mais

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas 22 - Encontro Anual de Tecnologia da Informação Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas Elisa Maria Vissotto1, Adriane Barbosa Camargo2 1 Universidade Regional Integrada

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Módulo 6: Inteligência Artificial

Módulo 6: Inteligência Artificial Módulo 6: Inteligência Artificial Assuntos: 6.1. Aplicações da IA 6.2. Sistemas Especialistas 6.1. Aplicações da Inteligência Artificial As organizações estão ampliando significativamente suas tentativas

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

Business Intelligence e ferramentas de suporte

Business Intelligence e ferramentas de suporte O modelo apresentado na figura procura enfatizar dois aspectos: o primeiro é sobre os aplicativos que cobrem os sistemas que são executados baseados no conhecimento do negócio; sendo assim, o SCM faz o

Leia mais

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence

Resumo dos principais conceitos. Resumo dos principais conceitos. Business Intelligence. Business Intelligence É um conjunto de conceitos e metodologias que, fazem uso de acontecimentos e sistemas e apoiam a tomada de decisões. Utilização de várias fontes de informação para se definir estratégias de competividade

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

CURSO DE SISTEMAS DE INFORMAÇÃO

CURSO DE SISTEMAS DE INFORMAÇÃO 1 CURSO DE SISTEMAS DE INFORMAÇÃO EMENTÁRIO DAS DISCIPLINAS 2011.1 BRUSQUE (SC) 2015 2 SUMÁRIO 1ª FASE... 4 01 ARQUITETURA DE COMPUTADORES... 4 02 FILOSOFIA... 4 03 FUNDAMENTOS MATEMÁTICOS PARA COMPUTAÇÃO...

Leia mais

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE

CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE CONSIDERAÇÕES SOBRE ATIVIDADES DE IDENTIFICAÇÃO, LOCALIZAÇÃO E TRATAMENTO DE DADOS NA CONSTRUÇÃO DE UM DATA WAREHOUSE Fabio Favaretto Professor adjunto - Programa de Pós Graduação em Engenharia de Produção

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO

UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO UNIVERSIDADE FEDERAL DE MINAS GERAIS BACHARELADO EM SISTEMAS DE INFORMAÇÃO Proposta de Formação Complementar: BUSINESS INTELLIGENCE E SUA APLICAÇÃO À GESTÃO Aluno: Yussif Tadeu de Barcelos Solange Teixeira

Leia mais

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br

Sistema. Atividades. Sistema de informações. Tipos de sistemas de informação. Everson Santos Araujo everson@everson.com.br Sistema Tipos de sistemas de informação Everson Santos Araujo everson@everson.com.br Um sistema pode ser definido como um complexo de elementos em interação (Ludwig Von Bertalanffy) sistema é um conjunto

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Palavras-Chaves: estoque, modelagem, requisitos, UML, vendas.

Palavras-Chaves: estoque, modelagem, requisitos, UML, vendas. UTILIZAÇÃO DA UML NO DESENVOLVIMENTO DE SISTEMA DE CONTROLE DE VENDAS E ESTOQUE GILBERTO FRANCISCO PACHECO DOS SANTOS Discente da AEMS Faculdades Integradas de Três Lagoas JACKSON LUIZ ARROSTI Discente

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 10 PROFª BRUNO CALEGARO Santa Maria, 10 de Outubro de 2013. Revisão aula anterior Documento de Requisitos Estrutura Padrões Template Descoberta

Leia mais

Documentação de um Produto de Software

Documentação de um Produto de Software Documentação de um Produto de Software Versão 3.0 Autora: Profª Ana Paula Gonçalves Serra Revisor: Prof. Fernando Giorno 2005 ÍNDICE DETALHADO PREFÁCIO... 4 1. INTRODUÇÃO AO DOCUMENTO... 6 1.1. TEMA...

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

Engenharia de Software

Engenharia de Software Engenharia de Software Requisitos de Software Prof. MSc. Edilberto Silva prof.edilberto.silva@gmail.com http://www.edilms.eti.br Requisito O que é um REQUISITO? Em software: É a CARACTERIZAÇÃO do que o

Leia mais

Aplicação de uma FAQ Baseada em RBC para Suporte a Usuários de um Sistema Web

Aplicação de uma FAQ Baseada em RBC para Suporte a Usuários de um Sistema Web Aplicação de uma FAQ Baseada em RBC para Suporte a Usuários de um Sistema Web Richard Marthendal Guckert 1, Daniela Souza Moreira 2, Anita Maria da Rocha Fernandes 1, 2 1 Curso de Ciência da Computação

Leia mais

Palavras-Chaves: engenharia de requisitos, modelagem, UML.

Palavras-Chaves: engenharia de requisitos, modelagem, UML. APLICAÇÃO DA ENGENHARIA DE REQUISITOS PARA COMPREENSÃO DE DOMÍNIO DO PROBLEMA PARA SISTEMA DE CONTROLE COMERCIAL LEONARDO DE PAULA SANCHES Discente da AEMS Faculdades Integradas de Três Lagoas RENAN HENRIQUE

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

Universidade de Caxias do Sul Centro de Ciências Exatas e Tecnologia Departamento de Informática Curso de Bacharelado em Ciência da Computação

Universidade de Caxias do Sul Centro de Ciências Exatas e Tecnologia Departamento de Informática Curso de Bacharelado em Ciência da Computação Universidade de Caxias do Sul Centro de Ciências Exatas e Tecnologia Departamento de Informática Curso de Bacharelado em Ciência da Computação APLICAÇÃO DE REDES NEURAIS ARTIFICIAIS À MINERAÇÃO DE DADOS

Leia mais

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de MINERAÇÃO DE DADOS MINERAÇÃO DE DADOS O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de dados. A mineração de dados é formada por um conjunto de ferramentas e técnicas

Leia mais

IC Inteligência Computacional Redes Neurais. Redes Neurais

IC Inteligência Computacional Redes Neurais. Redes Neurais Universidade Federal do Rio de Janeiro PÓS-GRADUAÇÃO / 2008-2 IC Inteligência Computacional Redes Neurais www.labic.nce.ufrj.br Antonio G. Thomé thome@nce.ufrj.br Redes Neurais São modelos computacionais

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Data mining na descoberta de padrões de sintomas com foco no auxílio ao diagnóstico médico

Data mining na descoberta de padrões de sintomas com foco no auxílio ao diagnóstico médico Data mining na descoberta de padrões de sintomas com foco no auxílio ao diagnóstico médico Alexander Rivas de Melo Junior 1, Márcio Palheta Piedade 1 1 Ciência da Computação Centro de Ensino Superior FUCAPI

Leia mais

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares

Universidade de Brasília. Departamento de Ciência da Informação e Documentação. Prof a.:lillian Alvares Universidade de Brasília Departamento de Ciência da Informação e Documentação Prof a.:lillian Alvares Fóruns óu s/ Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias

Leia mais

Codificar Sistemas Tecnológicos

Codificar Sistemas Tecnológicos Codificar Sistemas Tecnológicos Especificação dos Requisitos do Software Sistema de gestão para a Empresa Cliente SlimSys Autor: Equipe Codificar Belo Horizonte MG Especificação dos Requisitos do Software

Leia mais

Pós-Graduação em Engenharia Elétrica Inteligência Artificial

Pós-Graduação em Engenharia Elétrica Inteligência Artificial Pós-Graduação em Engenharia Elétrica Inteligência Artificial João Marques Salomão Rodrigo Varejão Andreão Inteligência Artificial Definição (Fonte: AAAI ): "the scientific understanding of the mechanisms

Leia mais

Universidade de Brasília Departamento de Ciência da Informação e Documentação Profa.:Lillian Alvares

Universidade de Brasília Departamento de Ciência da Informação e Documentação Profa.:Lillian Alvares Universidade de Brasília Departamento de Ciência da Informação e Documentação Profa.:Lillian Alvares Comunidades de Prática Grupos informais e interdisciplinares de pessoas unidas em torno de um interesse

Leia mais

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009.

Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. REFERÊNCIAS o o Business Intelligence Um enfoque gerencial para a Inteligência do Negócio.Efrain Turban e outros.tradução. Bookman, 2009. Competição Analítica - Vencendo Através da Nova Ciência Davenport,

Leia mais

SAD orientado a DADOS

SAD orientado a DADOS Universidade do Contestado Campus Concórdia Curso de Sistemas de Informação Prof.: Maico Petry SAD orientado a DADOS DISCIPLINA: Sistemas de Apoio a Decisão SAD orientado a dados Utilizam grandes repositórios

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS Acerca dos conceitos básicos de gerenciamento de projetos e considerando o PMBOK, julgue os itens a seguir. 51 No gerenciamento de um projeto, deve-se utilizar não apenas as ferramentas

Leia mais

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis Gabriel Galvão da Gama 1 ; Reginaldo Rubens da Silva 2 ; Angelo Augusto Frozza 3 RESUMO Este artigo descreve um projeto

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

Planejamento operacional e sistemas automatizados de gestão de recursos organizacionais. Prof. Gilberto Porto porto@gilbertoporto.com.

Planejamento operacional e sistemas automatizados de gestão de recursos organizacionais. Prof. Gilberto Porto porto@gilbertoporto.com. Planejamento operacional e sistemas automatizados de gestão de recursos organizacionais Prof. Gilberto Porto porto@gilbertoporto.com.br Sistemas de Informação SE SSD/ SAE Estratégico Tipos de decisão Não

Leia mais

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha

Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini Ralha WCGE II Workshop de Computação Aplicada em Governo Eletrônico Utilização de Técnicas de Mineração de Dados como Auxílio na Detecção de Cartéis em Licitações Carlos Vinícius Sarmento Silva Célia Ghedini

Leia mais

Tradução livre do PMBOK 2000, V 1.0, disponibilizada através da Internet pelo PMI MG em abril de 2001

Tradução livre do PMBOK 2000, V 1.0, disponibilizada através da Internet pelo PMI MG em abril de 2001 Capítulo 8 Gerenciamento da Qualidade do Projeto O Gerenciamento da Qualidade do Projeto inclui os processos necessários para garantir que o projeto irá satisfazer as necessidades para as quais ele foi

Leia mais

Alternativas de Integração de Dados Gerenciando Valor e Qualidade

Alternativas de Integração de Dados Gerenciando Valor e Qualidade Soluções para Possibilitar Relacionamentos Duradouros com Clientes Alternativas de Integração de Dados Gerenciando Valor e Qualidade Utilizando uma abordagem regulada para incorporar serviços de qualidade

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Universidade Federal Rural de Pernambuco. Bacharelado em Sistemas de Informação. Disciplina: Análise e Projeto de Sistemas de Informação

Universidade Federal Rural de Pernambuco. Bacharelado em Sistemas de Informação. Disciplina: Análise e Projeto de Sistemas de Informação Universidade Federal Rural de Pernambuco Bacharelado em Sistemas de Informação Disciplina: Análise e Projeto de Sistemas de Informação Docente: Rodrigo Aluna: Thays Melo de Moraes Diagramas do Projeto

Leia mais

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares

Universidade de Brasília. Faculdade de Ciência da Informação. Profa. Lillian Alvares Universidade de Brasília Faculdade de Ciência da Informação Profa. Lillian Alvares Fóruns / Listas de discussão Espaços para discutir, homogeneizar e compartilhar informações, idéias e experiências que

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados

Algoritmos Genéticos em Mineração de Dados. Descoberta de Conhecimento. Descoberta do Conhecimento em Bancos de Dados Algoritmos Genéticos em Mineração de Dados Descoberta de Conhecimento Descoberta do Conhecimento em Bancos de Dados Processo interativo e iterativo para identificar padrões válidos, novos, potencialmente

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1

Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 Laudon & Laudon Essentials of MIS, 5th Edition. Pg. 1.1 SISTEMA DE APOIO À DECISÃO Grupo: Denilson Neves Diego Antônio Nelson Santiago Sabrina Dantas CONCEITO É UM SISTEMA QUE AUXILIA O PROCESSO DE DECISÃO

Leia mais

http://www.publicare.com.br/site/5,1,26,5480.asp

http://www.publicare.com.br/site/5,1,26,5480.asp Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário

Leia mais

Padrões de Contagem de Pontos de Função

Padrões de Contagem de Pontos de Função Padrões de Contagem de Pontos de Função Contexto Versão: 1.0.0 Objetivo O propósito deste documento é apresentar os padrões estabelecidos para utilização da técnica de Análise de Pontos de Função no ambiente

Leia mais

Algumas propriedades dos objetos:

Algumas propriedades dos objetos: Orientação a Objetos Vivemos num mundo de objetos. Esses objetos existem na natureza, nas entidades feitas pelo homem, nos negócios e nos produtos que usamos. Eles podem ser categorizados, descritos, organizados,

Leia mais

MINERAÇÃO DE DADOS. Mineração de Dados

MINERAÇÃO DE DADOS. Mineração de Dados MINERAÇÃO DE DADOS Mineração de Dados Sumário Conceitos / Autores chave... 3 1. Introdução... 4 2. Conceitos de Mineração de Dados... 5 3. Aplicações de Mineração de Dados... 7 4. Ferramentas de Mineração

Leia mais

INSTITUTO VIANNA JÚNIOR LTDA FACULADE DE CIENCIAS ECONOMICAS VIANNA JUNIOR DATA MINING - EXTRAÇÃO E EXPLORAÇÃO DE CONHECIMENTO.

INSTITUTO VIANNA JÚNIOR LTDA FACULADE DE CIENCIAS ECONOMICAS VIANNA JUNIOR DATA MINING - EXTRAÇÃO E EXPLORAÇÃO DE CONHECIMENTO. INSTITUTO VIANNA JÚNIOR LTDA FACULADE DE CIENCIAS ECONOMICAS VIANNA JUNIOR DATA MINING - EXTRAÇÃO E EXPLORAÇÃO DE CONHECIMENTO. Lúcia Helena de Magalhães 1 Márcio Aarestrup Arbex 2 Resumo Este artigo tem

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL FACULDADE DE INFORMÁTICA EDITOR DE HELP MANUAL DO USUÁRIO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL FACULDADE DE INFORMÁTICA EDITOR DE HELP MANUAL DO USUÁRIO PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL FACULDADE DE INFORMÁTICA EDITOR DE HELP MANUAL DO USUÁRIO ANA PAULA CARVALHO LORENZONI MICHELINE PARIZOTTO PROFESSORA. MILENE SELBACH SILVEIRA ORIENTADORA

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO

UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO UNIVERSIDADE DO VALE DO ITAJAÍ CENTRO DE CIÊNCIAS TECNOLÓGICAS DA TERRA E DO MAR CURSO DE CIÊNCIA DA COMPUTAÇÃO FERRAMENTAS PARA ESTIMAR VALORES FALTANTES EM UMA BASE DE DADOS NA ETAPA DE PRÉ-PROCESSAMENTO

Leia mais

CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD)

CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD) 1 CAPÍTULO 7. SISTEMAS DE APOIO À DECISÃO (SAD) SISTEMAS DE SUPORTE À DECISÃO (SSD) A necessidade dos SAD surgiu em decorrência de diversos fatores, como, por exemplo: Competição cada vez maior entre as

Leia mais

Engenharia de Software I

Engenharia de Software I Engenharia de Software I Rogério Eduardo Garcia (rogerio@fct.unesp.br) Bacharelado em Ciência da Computação Aula 05 Material preparado por Fernanda Madeiral Delfim Tópicos Aula 5 Contextualização UML Astah

Leia mais