TÂNIA DOS SANTOS LIMA ESTUDO COMPARATIVO DOS ALGORITMOS DE CLASSIFICAÇÃO DA FERRAMENTA WEKA

Tamanho: px
Começar a partir da página:

Download "TÂNIA DOS SANTOS LIMA ESTUDO COMPARATIVO DOS ALGORITMOS DE CLASSIFICAÇÃO DA FERRAMENTA WEKA"

Transcrição

1 TÂNIA DOS SANTOS LIMA ESTUDO COMPARATIVO DOS ALGORITMOS DE CLASSIFICAÇÃO DA FERRAMENTA WEKA Palmas - TO 2005

2 TÂNIA DOS SANTOS LIMA ESTUDO COMPARATIVO DOS ALGORITMOS DE CLASSIFICAÇÃO DA FERRAMENTA WEKA Trabalho de Conclusão de Curso apresentado como requisito parcial de disciplina Estágio Supervisionado em Sistemas de Informação, orientado pela Profª. Thereza Patrícia Pereira Padilha. Palmas - TO 2005

3 iii TÂNIA DOS SANTOS LIMA ESTUDO COMPARATIVO DOS ALGORITMOS DE CLASSIFICAÇÃO DA FERRAMENTA WEKA Trabalho de Conclusão de Curso apresentado como requisito parcial de disciplina Estágio Supervisionado em Sistemas de Informação, orientado pela Profª. Thereza Patrícia Pereira Padilha. Aprovado em de 2005 BANCA EXAMINADORA Profª. Thereza Patrícia Padilha Pereira Centro Universitário Luterano de Palmas Prof. Fernando Luiz de Oliveira Centro Universitário Luterano de Palmas Profª. Madianita Bogo Centro Universitário Luterano de Palmas Palmas-TO 2005

4 iv SUMÁRIO 1 INTRODUÇÃO REVISÃO DA LITERATURA APRENDIZADO DE MÁQUINA APLICAÇÕES DE APRENDIZADO DE MÁQUINA PROCESSO KDD Fases do Processo KDD MINERAÇÃO DE DADOS Associação Agrupamento ou clustering Classificação FERRAMENTA WEKA Ambiente da Ferramenta WEKA ALGORITMOS DE CLASSIFICAÇÃO POR REGRAS DA FERRAMENTA WEKA MATERIAL E MÉTODOS LOCAL E PERÍODO MATERIAIS Hardware Software licenciando e gratuito Fontes bibliográficas Metodologia RESULTADOS E DISCUSSÃO CONJUNTOS DE DADOS RESULTADOS DOS EXPERIMENTOS REALIZADOS UTILIZANDO OS ALGORITMOS DE CLASSIFICAÇÃO DE REGRAS DE DECISÃO Regras geradas pelos algoritmos Instâncias classificadas corretamente e incorretamente Matriz de confusão e tempo de execução CONSIDERAÇÕES FINAIS REFERÊNCIAS BIBLIOGRÁFICAS...72

5 v LISTA DE FIGURAS Figura 1. Etapas do Processo de Descoberta de Conhecimento em Base de Dados. (REZENDE, 2003)...15 Figura 2. Agrupamento hipotético do perfil das mulheres...18 Figura 3. Tela inicial da ferramenta WEKA...20 Figura 4. Execução do Simple CLI em linha de comando...20 Figura 5. Arquivo sem formatação do ARFF Figura 6. Arquivo com formatação ARFF...23 Figura 7. Tela do Explorer WEKA Figura 8. Tela principal do Classify Figura 9. Opção para escolha do algoritmo classificador...25 Figura 10. Opções de saída dos dados processados...27 Figura 11. Resultado do classificador Figura 12. Árvore de Decisão do Conjunto de Dados iris...43 Figura 13. Regras geradas a partir do algoritmo OneR....53

6 vi LISTA DE GRÁFICOS Gráfico 1. Conjunto de íris (treinamento)...34 Gráfico 2. Conjunto de íris (teste)...35 Gráfico 3. Conjunto de titanic (treinamento)...36 Gráfico 4. Conjunto de titanic (teste)...36 Gráfico 5. Conjunto de bandeiras (treinamento) Gráfico 6. Conjunto de bandeiras (teste)...39 Gráfico 7. Comparação dos conjuntos de dados utilizando o algoritmo j48.part Gráfico 8. Comparação dos conjuntos de dados utilizando o algoritmo OneR, MBS igual a Gráfico 9. Comparação dos conjuntos de dados utilizando o algoritmo OneR, MBS igual a

7 vii LISTA DE TABELAS Tabela 1: Algoritmo de classificação por técnica...25 Tabela 2: Forma genérica de uma tabela de decisão (BORGES, 2005) Tabela 3: Atributos, tipo e valores do conjunto de dados iris...34 Tabela 4: Atributos, tipos e valores dos conjuntos de dados titanic Tabela 5: Atributos, tipos e valores do conjunto de dados bandeira Tabela 6: Experimentos utilizando o algoritmo j48.part Tabela 7: Regras de Decisão - Conjunto de Dados Iris Tabela 8: Comparação das instâncias que geraram as regras Tabela 9: Regras de decisão - Conjunto de dados Titanic...45 Tabela 10: Experimentos utilizando o algoritmo OneR Tabela 11: Experimentos utilizando o algoritmo DecisionTable Tabela 12: Classificação das instâncias a partir do algoritmo j48.part...58 Tabela 13: Classificação das instâncias a partir do algoritmo OneR, MBS igual a Tabela 14: Classificação das instâncias a partir do algoritmo Oner, MBS igual a Tabela 15: Classificação das instâncias a partir dos algoritmos DecisionTable, CV igual a Tabela 16: Classificação das instâncias a partir dos algoritmos DecisionTable, CV igual a Tabela 17: Matriz de confusão do j48.part utilizando os conjuntos de dados íris, titanic e bandeiras Tabela 18: Tempo de execução do algoritmo j48.part Tabela 19: Matriz de confusão do OneR utilizando os conjuntos de dados íris, titanic e bandeiras, MBS igual a Tabela 20: Matriz de confusão do OneR utilizando os conjuntos de dados íris, titanic e bandeiras, MBS igual a Tabela 21: Matriz de confusão do DecisionTable utilizando os conjuntos de dados íris, titanic e bandeiras, CV igual a Tabela 22: Matriz de confusão do DecisionTable utilizando os conjuntos de dados íris, titanic e bandeiras, CV igual a

8 viii LISTA DE ABREVIATURAS BS CV IA ICC ICI KDD MBS MD WEKA binarysplits crossval Inteligência Artificial Instâncias classificadas corretamente Instâncias classificadas incorretamente Knowledge discovery in database minbucketsize Mineração de Dados Waikato Environment for Knowledge Analysis

9 ix RESUMO A área de descoberta de conhecimento a partir dos dados tem sido bastante explorada em empresas devido aos vários benefícios que são obtidos, tais como a identificação de perfil de consumidores. Para isso, é necessária a aplicação de um ou mais algoritmos de mineração de dados. A ferramenta WEKA contém um conjunto de algoritmos de mineração que possibilita a descoberta do conhecimento de forma automática. Este trabalho visa apresentar o estudo sobre três algoritmos de mineração, sob o paradigma de regras de produção, e investigar o seu comportamento usando três conjuntos de dados disponíveis na web. Palavras-chave: Processo de descoberta de conhecimento, ferramenta WEKA, algoritmos de mineração.

10 x ABSTRACT The area of discovery of knowledge from the data has been sufficiently explored in companies due to the some benefits that are gotten, such as the identification of profile of consumers. For this, the application of one or more algorithms of mining of data is necessary. Tool WEKA contains a set of mining algorithms that make possible the discovery of the knowledge of automatic form. This work aims at to present the study on three algorithms of mining, under the paradigm of production rules, and to investigate its behavior using three available data sets in web. Keywords: Knowledge discovery in database, Machine Learning, Data mining.

11 11 1 INTRODUÇÃO Num processo de tomada de decisão, a informação tem um papel significante para o processo de descoberta de conhecimento a partir de banco de dados. A descoberta de conhecimento em banco de dados (Knowledge Discovery in Database - KDD) é uma área da Inteligência Artificial (IA) que visa analisar informações de forma automática e extrair delas conhecimentos (padrões). Uma informação pode ser vista como um dado tratado e útil por auxiliar no processo de tomada de decisões nas empresas, por exemplo. O KDD é uma tecnologia computacional com finalidade de descoberta de padrões, ou seja, obtenção do conhecimento a partir de um conjunto de dados transformados (FAYYAD et all., 1996) (LIEBSTEIN, 2005) (COELHO, 2005). Essa técnica é composta por quatro etapas para extração das informações, tais como: pré-processamento, transformação, mineração de dados e pós-processamento. Na etapa de pré-processamento, os dados são selecionados e analisados para serem transformados. A transformação é o tratamento dos dados oriundo de bases de dados, pois, estes podem ter valores inconsistentes. Após a transformação, passam pelo processo de mineração no qual é obtido o conhecimento. MD é um passo do processo KDD que explora as informações de uma base com finalidade de obter o conhecimento através de seus algoritmos ou sistemas de aprendizagem de máquina (DIAS, 2002). Os sistemas de aprendizagem de máquina têm como propósito fazer descobrimento de novos conhecimentos automaticamente (PILA, 2001). A ferramenta WEKA (Waikato Environment for Knowledge Analysis), por exemplo, é uma ferramenta que, no seu ambiente, incorpora um conjunto de algoritmos de aprendizado de máquina na qual possibilita a extração do conhecimento (WEKA, 2005). Esta ferramenta tem obtido bastante sucesso na comunidade dos pesquisadores de IA por disponibilizar um conjunto de recursos para a execução do processo KDD. Sendo assim, é possível observar, notoriamente através de artigos científicos, dissertações e teses, que existe um grande interesse, pela comunidade, na investigação dos algoritmos de aprendizagem de máquina disponibilizadas na ferramenta WEKA. O pós-processamento é um processo que avalia os dados explorados, o conhecimento, através dos algoritmos de MD. A avaliação é para descobrir se os conhecimentos obtidos são relevantes na tomada de decisões. Este trabalho tem como objetivo estudar os recursos disponíveis e o funcionamento de três algoritmos de classificação da ferramenta WEKA, que são One-R, J48.PART e

12 12 DecisionTable, para identificar seus desempenhos utilizando conjuntos de dados hipotéticos. Para isso, serão realizados diversos experimentos com os algoritmos citados, alterando inclusive os valores dos parâmetros disponíveis em cada algoritmo. O presente trabalho encontra-se estruturado da seguinte forma: o capítulo 2 abordará as definições fundamentais da aprendizagem de máquina e as suas aplicações, do processo de descoberta de conhecimento em banco de dados, mineração de dados e sobre a ferramenta WEKA. São descritos um histórico da ferramenta WEKA, o ambiente, seus algoritmos de classificação e o tipo de entrada para a execução dos algoritmos. No capítulo 3 abordam-se as metodologias usadas para o desenvolvimento do trabalho, bem como o local, o período e os materiais. O capítulo 4 apresenta os resultados e discussões sobre o estudo comparativo dos algoritmos de classificação definidos utilizando três conjuntos de dados. No capítulo 5 serão apresentadas as conclusões sobre o trabalho realizado através do estudo dos algoritmos de classificação do WEKA. Por fim, o capítulo 6 expõe as referências bibliográficas.

13 13 2 REVISÃO DA LITERATURA Neste capítulo são descritos na seção 2.1 os conceitos de sistemas de aprendizagem de máquina; na seção 2.2 são descritas as aplicações dos sistemas de aprendizado de máquina; na seção 2.3 são apresentadas algumas definições do processo de descoberta de conhecimento em base de dados, e na subseção as fases do processo KDD. A seção 2.4 apresenta os conceitos da Mineração de Dados (Data Mining-DM) e, em seguida, as suas principais tarefas; na seção 2.5 a descrição geral da ferramenta WEKA com enfoque na tarefa de classificação e o tipo do arquivo suportado, o formato ARFF na subseção ; na seção 2.6 são descritos sobre os algoritmos de classificação da ferramenta WEKA. 2.1 Aprendizado de Máquina O aprendizado de máquina é uma forma implementada capaz de extrair novos conhecimentos de maneira automática. Normalmente são regras que ajudam no processo de tomada de decisão. Para Rezende (2003), AM é visto como um sistema que, a partir de um conjunto de dados, é possível obter conhecimentos e analisá-los. Para implementar um sistema de aprendizado de máquina devem ser considerados os requisitos da aprendizagem como, por exemplo, a aprendizagem dedutiva e indutiva. Neste trabalho será focada a aprendizagem indutiva, pois os algoritmos de regras de decisão, na classificação de dados hipotéticos da ferramenta WEKA, são indutivos (HONORATO, 2005) (WEKA, 2005). A aprendizagem indutiva, segundo Colman et. all. (2002), permite a obtenção do conhecimento a partir de uma base de dados composta por fatos. Os fatos são as hipóteses na qual se pretende chegar a uma conclusão. Nos sistemas baseados em aprendizagem de máquina indutivos, Batista (2003) o descreve como um sistema que se fundamenta nas práticas realizadas anteriormente para encontrar o conhecimento ou padrões, o qual toma decisões com base nestas práticas. Com a necessidade, não só de organizar os dados em registros computacionais e realizar as operações básicas de consultas e inserção a fim de manter um controle dentro da organização, as técnicas de mineração de dados, fases do processo KDD dentro da área de aprendizagem de máquina, possibilita por meio das informações ou dos dados processados, a obtenção de conhecimentos que equivalem a valores que auxiliam na tomada de decisões.

14 Aplicações de Aprendizado de Máquina A aprendizagem de máquina pode ser utilizada em algumas áreas em que se pretende encontrar padrões, tais como ciências médicas, biológicas, determinação de tendências de marketing, entre outras. Segundo Sousa (2004), o uso de algoritmos de aprendizagem de máquina na área de descoberta de farmácos ajuda na redução de tempo ao realizar as pesquisas sobre as moléculas que são adequadas de uma determinada proteína, de maneira automática. As moléculas mutantes de hemoglobina são investigadas para simular as mutações. Esses sistemas de aprendizagem de máquina podem ser utilizados também na área da geografia, os quais permitem encontrar ocorrências de desmoronamento devido às chuvas intensas. Para Souza (2004), o armazenamento dos dados sobre as chuvas intensas na cidade do Rio de Janeiro possibilita encontrar e visualizar a análise sobre o escoamento para prevenir as pessoas que moram nas encostas dos morros. Outro exemplo de utilização seria o Sistema de Avaliação de Ensino Institucional, que tem como propósito avaliar o curso através das opiniões obtidas de professores e alunos a respeito do desempenho das aulas ministradas, do comportamento dos professores e com relação à estrutura dos cursos oferecidos pela universidade. Com estas informações adquiridas a partir das opiniões dos alunos e professores, foi possível encontrar novos conhecimentos, os quais podem ser visualizados em forma de relatório (LACERDA et. all., 2004). Esses novos conhecimentos equivalem a informações que podem auxiliar a direção de uma universidade, por exemplo, na sua forma de aplicação da educação, estrutura física, corpo docente, entre outros aspectos. 2.3 Processo KDD Anterior ao surgimento das ferramentas analíticas como a OLAP (on-line analytical processing), por exemplo, que realizam o processamento analítico dos dados, segundo Silva (2002a), os bancos de dados convencionais permitiam que fossem feitas apenas as operações tradicionais como consulta, inserção, atualização e exclusão dos dados na base, os quais tinham como saídas às informações que não poderiam ajudar um gerente a tomar uma decisão estratégica através das mesmas.

15 15 Com o passar do tempo, crescia a necessidade de usar uma ferramenta para analisar uma base de dados e apresentar informações que pudessem ajudar na tomada de decisão. Para realizar um processo de análise é preciso percorrer algumas fases, pois os dados não tratados podem acarretar informações incorretas. As informações obtidas por meio de análises são denominadas de conhecimento. Para atingir o objetivo do KDD, foi criado e formalizado um conjunto de fases que devem ser executadas, sendo denominado de processo descoberta de conhecimento em base de dados. O processo de descoberta de conhecimento em base de dados (KDD) é uma técnica criada para extrair conhecimento de dados processados (LIEBSTEIN, 2005) (GOMES, 2002). O KDD é um processo complexo que encontra e apresenta informações relevantes para a tomada de decisão e determina como é adquirido um novo conhecimento Fases do Processo KDD Segundo Fayyad et all. (1996), o processo KDD consiste em várias fases: seleção, préprocessamento, transformação, mineração de dados (data mining) e interpretação/ análise dos dados processados. Neste trabalho será dado um maior enfoque na fase de mineração de dados, pois serão estudados e utilizados algoritmos de MD da ferramenta WEKA. Figura 1. Etapas do Processo de Descoberta de Conhecimento em Base de Dados. (REZENDE, 2003)

16 16 A figura 1 demonstra as fases do processo de descoberta de conhecimento, que inicia com o conhecimento do domínio, em que são identificadas as bases de dados que servirão como subsídios na obtenção do conhecimento. A seleção dos dados é a primeira etapa do processo KDD que tem como propósito buscar nas diversas fontes os dados que possuem relevâncias para exploração, os quais podem estar em vários formatos, uma vez que as organizações podem possuir bancos de dados com tecnologias diferentes. Um outro fator importante na seleção é escolher os dados para satisfazer o que deve ser atingido como, por exemplo, na área do marketing, que são selecionados os dados que possam ajudar a obter uma possível estratégia, a fim de conhecer o perfil dos clientes. Na área médica, por sua vez, pode-se tentar descobrir as possíveis doenças que os pacientes têm. Uma escolha errada dos dados pode levar as informações errôneas, o que prejudica a tomada de decisão (BATISTA, 2003). No pré-processamento é feita integração dos dados, eliminação de dados redundantes ou faltantes e a transformação para que os dados processados assumam um único formato. Após o processamento dos dados, são realizadas minerações de dados, para a extração de padrões e posteriores análises com a finalidade de se tomar decisões com o conhecimento obtido (REZENDE, 2003). Essa fase busca melhorar os dados selecionados, pois os mesmos podem ter informações que não poderão ajudar na descoberta de conhecimento. Para Berson (1997), os dados devem passar pelos processos de limpeza, integração para que posteriormente sejam transformados. A transformação dos dados é a fase após o pré-processamento que consiste em converter os dados, que possuem formatos diferentes, em formatos que possam ser entendidos pelo algoritmo de mineração de dados como, por exemplo, o ARFF (formato da ferramenta WEKA). Os dados são padronizados em um único formato para que algoritmo os entenda (SILVA, 2000). A mineração de dados é uma fase que reúne um conjunto de técnicas capazes de retirar dos dados tratados novos conhecimentos (REZENDE, 2003). A etapa de mineração de dados será descrita com mais detalhadamente na seção 2.4. A interpretação/análise é feita após a mineração dos dados, buscando estimar os resultados encontrados pelo algoritmo minerador a partir de conjunto de dados. 2.4 Mineração de Dados

17 17 Mineração de dados é um método que possibilita aos usuários obterem os conhecimentos de grandes bancos de dados (FAYYAD et. all., 1996). Para analisar as informações é necessário usar alguns procedimentos técnicos da mineração dos dados que podem determinar algumas características, tais como perfil, tendências, marketing, etc. A obtenção do conhecimento das informações que estão armazenadas nas bases é feita com a extração dos dados, na qual são usados os algoritmos de mineração. Ramos (1999), Fayyad et. all. (1996) e Gurovitz (1996) descrevem duas funcionalidades relevantes da mineração de dados, a descoberta do conhecimento e a previsão. A descoberta do conhecimento é a busca pelas informações importantes para a tomada de decisão, que não provêm de bases de dados operacionais, as quais podem ser realizadas apenas as operações tais como, inserção, alteração, atualização e exclusão de valores para os atributos e não podem suportar esse tipo de análise. Para o caso proposto, serão utilizados conjuntos de dados que passaram pelas fases de processamento e transformação por estarem aptos para este tipo de análise, ou seja, mineração de dados. A previsão contribui para o conhecimento das informações, auxiliando o gerente a definir as possibilidades de ocorrência de ações capazes de determinar comportamentos e perfis de clientes. As análises e previsões minimizam esforços como o tempo que seria gasto para determinar esses comportamentos ou erros que são prejudiciais ao tomar decisões. Existem várias ferramentas que consiste em um conjunto de algoritmos que realizam a tarefa da fase de mineração de dados, tais como MLC++ e WEKA. O MLC++ é uma ferramenta de mineração de dados, baseada em aprendizagem de máquina, que foi desenvolvida na linguagem C++, para extração de novos conhecimentos, e fornece como resultados para análise taxas de precisão, de aprendizado e a matriz de confusão (REZENDE, 2003). O WEKA será abordado na subseção 2.5 com maior ênfase por ser a ferramenta usada na mineração de dados deste trabalho. Segundo Berson (1997) e Ramos (1999), a mineração de dados pode ser realizada de acordo com algumas tarefas de mineração, tais como: associação, agrupamento e classificação. A seguir será apresentada uma breve descrição de cada uma dessas tarefas Associação Segundo Brusso (2000), as regras de associação são derivadas dos relacionamentos entre os dados processados, associações de condição e resultados. Na associação busca-se

18 18 encontrar a relação que existe entre os valores do conjunto de dados analisado. As relações encontradas ajudarão no processo de tomada de decisão. Um exemplo de regra de associação, para estimar a porcentagem e saber se houve um aumento nas vendas, são feitas associações do cliente do sexo masculino e do produto que comprado, que são fraldas, pode se inferir que a pessoa do sexo masculino também compra cervejas. Segundo Brusso (2000), é feito um cálculo da porcentagem da associação para encontrar a freqüência da compra de fraldas pelo do cliente do sexo masculino que também compra cervejas, então com isso realizar promoções e colocar os produtos um próximo ao outro para aumentar as vendas Agrupamento ou clustering No agrupamento criam-se conjuntos que possuem características semelhantes, com o intuito de agrupar os atributos dos dados processados. Esse conjunto ou classe pode determinar comportamentos de usuários. As similaridades do conjunto de dados é que determina um novo conjunto ou classe (RAMOS, 1999). A Figura 2 demonstra um tipo de agrupamento hipotético do perfil das mulheres, determinado através das coordenadas, quantidade de filhos e escolaridade. Figura 2. Agrupamento hipotético do perfil das mulheres. Como pode ser verificado na figura 2, as mulheres que têm apenas o ginásio ou ensino médio possuem em média de 3 a 5 filhos. O agrupamento é do perfil das mulheres que possuem essa escolaridade e a respectiva quantidade de filhos.

19 Classificação A classificação é uma tarefa da mineração de dados que consiste em avaliar os dados processados, classificando-os de acordo com as suas características. Para classificar, criam-se classes caracterizadas, e os dados processados são relacionados a essa classe por meio das peculiaridades (SILVA, 2000). Ao utilizar os algoritmos de classificação, podem-se definir os relacionamentos contidos entre os atributos dos dados processados, os quais poderão determinar uma previsão. Existem diferenças entre a associação e a classificação. Na associação é feita uma relação entre as hipóteses e a sua ocorrência para encontrar um conhecimento. Na classificação cria-se uma classe a partir das características das hipóteses (BRUSSO, 2000). Por exemplo, se os alunos acessam o sistema e têm senha de administrador de pelo menos uma máquina, então estão cursando o sétimo período. Pode-se prever e definir que é um aluno estagiário pela relação dos atributos. Com essas hipóteses é possível criar uma classe de perfil dos usuários. 2.5 Ferramenta WEKA A ferramenta WEKA foi desenvolvida pelos pesquisadores da universidade de Waikato na Nova Zelândia no ano de É uma ferramenta de mineração de dados implementada em Java que oferece suporte para vários sistemas operacionais (Windows e Linux). WEKA é um software livre por ser uma ferramenta que possui o código aberto e tem fins acadêmicos, estando disponível na pagina do próprio WEKA para ser utilizado por qualquer usuário (KIRKBY, 2004) Ambiente da Ferramenta WEKA A tela principal da ferramenta é o WEKA GUI Chooser e dispõe dos botões, Simple CLI, Explorer e Experimenter, conforme pode ser vista na Figura 3. O ambiente para

20 20 realização de análises é o Explorer. O Simple CLI serve apenas para mostrar como são executados os algoritmos do WEKA por linha de comando. A figura 4 mostra como ocorre a execução por linha de comando (KIRKBY, 2004) (WEKA, 2005). Figura 3. Tela inicial da ferramenta WEKA. Figura 4. Execução do Simple CLI em linha de comando. Para ser usado o ambiente gráfico WEKA Knowledge Explorer da ferramenta precisase clicar no botão Explorer localizado na tela inicial. Esse é constituído pelas abas de Preprocess, Classify, Cluster, Associate, Selected attributes e Visualize. A aba do Classify terá maior ênfase de explanação deste trabalho, porque este é destinado a fazer o comparativo dos algoritmos de classificação. Cada uma dessas abas do Explorer tem as suas funcionalidades e ficam ativas após a seleção de um conjunto de dados na aba do préprocessamento (KIRKBY, 2004) (WEKA, 2005). No pré-processamento (Preprocess), pode ser aberto um arquivo que tem o formato ARFF, suportado pela ferramenta WEKA. O arquivo com a extensão ARFF será comentado na

21 21 subseção A partir dos dados carregados no Preprocess é possível realizar a tarefa de mineração, com os algoritmos da aba do Classify, para encontrar o conhecimento, o que terá mais enfoque de explicação (KIRKBY, 2004) (WEKA, 2005). A mineração só poderá ser feita se os dados estiverem pré-processados e transformados, conforme citado na subseção A subseção expõe os passos para a transformação de um conjunto de dados préprocessado. Agrupamento (Cluster) utiliza os algoritmos para encontrarem dados que tenham semelhança, formando grupos ou perfis (WEKA, 2005). A associação (Associate) serve para agregar as regras encontradas, descobrimento das regras de associação, a partir da utilização de algoritmos é feita à associação dos valores dos atributos. Para selecionar e definir a relevância dos atributos utiliza-se a Seleção de Atributos (Select Attributes). Por fim, a visualização do conhecimento, com a definição de instâncias do arquivo ARFF que representam as coordenadas x e y, dá-se através do visualizador (Visualize) (WEKA, 2005). A Fig. 7 mostra a tela do Explorer WEKA, com a aba do Preprocess selecionada. Figura 7. Tela do Explorer WEKA Arquivo ARFF

22 22 Para analisar os dados processados por meio da ferramenta WEKA é necessário transformar os dados do banco de dados em um arquivo que esteja com a extensão *.arff (Attribute Relation File Format). Primeiro é preciso exportar os dados da base para o formato com delimitações, separados por vírgulas (o próprio sistema de gerenciamento de banco de dados possibilita essa exportação) e ser salvo com a extensão CSV. Após ter sido exportado e salvo como CSV, o arquivo é aberto como texto simples e novamente salvo com a extensão ARFF. Para transformar no formato ARFF é necessário seguir os seguintes passos: 1. Abrir o arquivo com as delimitações em um editor de textos; 2. Adicionar um nome para o conjunto de dados Forma <nome_do_conjunto>. Por DiabeteMellitus. 3. Em uma nova linha inserir os nomes dos atributos do conjunto de dados depois Exemplo da forma <nome_do_atributo> o próximo atributo deve estar em outra linha. O atributo tem o seu tipo numéricos representados por numeric ou real, ou nominais. Se possuir valores nominais como sim, não, F ou M devem ser apresentados dentro de chaves sexo {F,M} os valores dentro das chaves, automaticamente vão ser reconhecidos como os valores de cada atributo. Caso exista atributo que não possua valor, este deve ser substituído por? interrogação; 4. Acrescentar para que o algoritmo minerador entenda que vem logo após são os dados processados para a predição. 5. É opcional usar comentários dentro do arquivo, mas se necessário deve estar entre os símbolos % porcentagem. Exemplo: %<comentário> %; 6. Salvar o arquivo: escolher a opção Salvar como..., selecionar em Salvar como tipo: Texto sem formatação. Por fim, inserir um nome para o arquivo como: <nome_do_arquivo>.arff e o arquivo já estará pronto para ser analisado. Conforme mostra a figura 5, o arquivo não está formatação que a ferramenta precisa, pois foram apenas exportados de uma base de dados. Este arquivo está aberto como texto simples. Na figura 6 é apresentado o conjunto que foi formatado seguindo os passos de formatação.

23 23 Figura 5. Arquivo sem formatação do ARFF. Figura 6. Arquivo com formatação ARFF Classificação (Classify) A Figura 8 (1) mostra a tela principal do Classify a qual permite que o usuário possa classificar os dados processados na predição (WEKA, 2005). Esta aba contém o campo classificador (Classifier), indicado pelo número 2, onde pode ser definido o algoritmo de classificação que será utilizado. O Test Options (3) apresenta as opções que definem como será feito o teste e tipo de saída após a mineração de dados (4). A Figura 8 (5) mostra o local onde pode ser selecionado o atributo da predição. O botão Start (6) inicia a execução da tarefa de mineração. Caso a tarefa de mineração esteja sendo executada, poderá ser parada no botão, Stop (7). O Result list

24 24 (8) mostra a lista com os tipos dos algoritmos usados na tarefa de mineração, que podem ser selecionados posteriormente para visualizar o resultado no Classifier output (12). Cada vez que é utilizado um algoritmo na tarefa de mineração também é mostrado um texto de Log (9) e o Status (10) Figura 8. Tela principal do Classify. O Classifier, do classificador Classify da ferramenta WEKA é a parte que dispõe os vários tipos de algoritmos de classificação. Os algoritmos de classificação implementados na ferramenta WEKA utilizam as técnicas de aprendizagem de máquina tais como regras, árvore de decisão, bayesianos, redes neurais, aprendizado lazy (preguiçoso) e aprendizado meta. Para a mineração pode ser escolhido apenas um algoritmo por vez (WEKA, 2005). A lista dos algoritmos de classificação pode ser vista ao clicar na opção GenericObjectEditions (1), conforme figura 9.

25 25 1 Figura 9. Opção para escolha do algoritmo classificador. A tabela 1 apresenta as técnicas de classificação utilizada na ferramenta WEKA, com os respectivos algoritmos. Técnica de classificação Algoritmo(s) Bayes (probabilístico) NaiveBayes, NaiveBayesSimple Function (Técnica de regressão linear e logística) LinearRegression, Logistic, SMO, VotedPerceptron Lazy (Técnica baseada em instâncias) IB1, IBk, KStar Meta (Regressão por discretização) AdaBoostM1, AdditiveRegression, AttributeSelectedClassifier, Bagging, ClassificationViaRegression, CostSenitiveClassifier, CVParameterSelection, FilteredClassifier, MetaCost, MultiClassClassifier, MultiScheme, RegressionByDiscretization, Stacking, ThresholdSelector Misc (Técnica de discretização) Hiperpipes, VFI Rules (Regras de decisão) j48.part, DecisionTable, OneR Trees (Árvores de decisão) ADTree, DecisionStump, Id3, j48.j4 Tabela 1: Algoritmo de classificação por técnica. Na seção 2.6 serão explicados, com destaque, os algoritmos de classificação por regras, pois serão utilizados na predição do conjunto de dados. Os algoritmos usados são, j48.part, DecisionTable e OneR. Estes algoritmos foram escolhidos para realizar a tarefa de mineração de dados por fornecer clareza nos resultados, facilitando compreensão, pois a maneira de interpretação do conhecimento gerado é simples. As regras geradas possuem simplicidade por serem apresentadas em forma de condições (REZENDE, 2003). Por exemplo, se o paciente se sente bem é igual a sim então este paciente está classificado na classe saudável (REZENDE, 2003). A funcionalidade de testes do classificador do WEKA está no Test Options, do item 3 na figura 8, com as alternativas Use training set, Supplied test set, Cross-validation,

26 26 Percentage split, que podem ser definida a partir da seleção de apenas uma alternativa (KIRKBY, 2004). O User training set é uma opção que usa, para realização de teste, o mesmo conjunto de treinamento utilizado para predição, que provem da seleção feita na aba anterior do Preprocess (KIRKBY, 2004). O teste pode ser feito também com um outro conjunto de dados como, o conjunto de teste, o qual poderá ser selecionado em Supplied test set através do botão Set, permitindo escolher, também, um outro arquivo para o teste. Então, se faz os testes com o conjunto clicando-se no botão Start (KIRKBY, 2004). Existe outra opção para fazer o teste, o Cross-validation, em que o conjunto de dados pode se dividido em partes, uma para o teste e a quantidade restante para o treinamento. O conjunto de treinamentos pode ser definido na caixa de texto folds (KIRKBY, 2004). A última opção de testes é o Percentage split, nela pode-se definir a porcentagem que será usada para o treinamento e o restante para o teste (KIRKBY, 2004). O botão More Options é a opção de configuração para a saída dos dados processados que foram minerados (1). Para a saída existem as seguintes opções, Output model, Output perclass stats, Output entropy evaluation measures, Output confusion matrix e o Store predictions for visualization, no item 2 da figura 8. No Output model é mostrado todo o conjunto de dados que foi classificado. Output per-class stats exibe a estatística da precisão, a medida e classe. Output entropy evaluation measures mostra a avaliação das medidas de entropia. Output confusion matrix mostra como saída a matriz de confusão contendo nela a quantificação das instâncias. No Store predictions for visualization apresenta a predição de classificador a partir do Result list. O Cost-sensitive evaluation permite que seja definido um custo para a predição, deve ser informado o valor ao clicar no botão Set para que seja mostrada a análise dos erros, por fim fazer a executar da mineração clicando no botão Start (KIRKBY, 2004) (WEKA, 2005). Fig. 10 apresenta a tela com as opções para saída dos dados processados.

27 Figura 10. Opções de saída dos dados processados. O resultado da classificação pode ser visualizado no Classifier output, conforme mostra no item 1 da Fig Figura 11. Resultado do classificador.

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA

INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA INTRODUÇÃO A MINERAÇÃO DE DADOS UTILIZANDO O WEKA Marcelo DAMASCENO(1) (1) Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte/Campus Macau, Rua das Margaridas, 300, COHAB, Macau-RN,

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012

Data Mining Software Weka. Software Weka. Software Weka 30/10/2012 Data Mining Software Weka Prof. Luiz Antonio do Nascimento Software Weka Ferramenta para mineração de dados. Weka é um Software livre desenvolvido em Java. Weka é um É um pássaro típico da Nova Zelândia.

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

Mineração de dados: um estudo de caso de concessão de crédito explorando o software Weka

Mineração de dados: um estudo de caso de concessão de crédito explorando o software Weka Mineração de dados: um estudo de caso de concessão de crédito explorando o software Weka Andreia Smiderle, Alessandra Marchiori de Oliveira Depto de Sistemas de Informação, Faculdade MATER DEI, 85501-030,

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

WEKA: The bird. Ferramenta Weka Waikato Environment for Knowledge Analysis. Ambiente WEKA. Explorer. Explorer. Explorer

WEKA: The bird. Ferramenta Weka Waikato Environment for Knowledge Analysis. Ambiente WEKA. Explorer. Explorer. Explorer II Semana de Tecnologia da Informação IFBA Campus Vitória da Conquista 27 a 30 de maio de 2014 WEKA: The bird Ferramenta Weka Waikato Environment for Knowledge Analysis Prof. MSc Pablo Freire Matos Informática

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan

Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan Faculdade INED Curso Superior de Tecnologia em Banco de Dados Disciplina: Projeto de Banco de Dados Relacional II Prof.: Fernando Hadad Zaidan 1 Unidade 4.5 2 1 BI BUSINESS INTELLIGENCE BI CARLOS BARBIERI

Leia mais

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP

Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Aprendizado de classificadores das ementas da Jurisprudência do Tribunal Regional do Trabalho da 2ª. Região - SP Thiago Ferauche, Maurício Amaral de Almeida Laboratório de Pesquisa em Ciência de Serviços

Leia mais

Solução de gerenciamento de sistemas Dell KACE K1000 Versão 5.5. Guia de gerenciamento de ativos. Julho de 2013

Solução de gerenciamento de sistemas Dell KACE K1000 Versão 5.5. Guia de gerenciamento de ativos. Julho de 2013 Solução de gerenciamento de sistemas Dell KACE K1000 Versão 5.5 Guia de gerenciamento de ativos Julho de 2013 2004-2013 Dell, Inc. Todos os direitos reservados. Qualquer forma de reprodução deste material

Leia mais

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Mineração de Dados. Sylvio Barbon Junior barbon@uel.br. 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados Sylvio Barbon Junior barbon@uel.br 26 de junho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa I Etapa II Inteligência de Negócios Visão

Leia mais

Ferramenta: Spider-CL. Manual do Usuário. Versão da Ferramenta: 1.1. www.ufpa.br/spider

Ferramenta: Spider-CL. Manual do Usuário. Versão da Ferramenta: 1.1. www.ufpa.br/spider Ferramenta: Spider-CL Manual do Usuário Versão da Ferramenta: 1.1 www.ufpa.br/spider Histórico de Revisões Data Versão Descrição Autor 14/07/2009 1.0 15/07/2009 1.1 16/07/2009 1.2 20/05/2010 1.3 Preenchimento

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

Indução de Árvores de Decisão para a Inferência de Redes Gênicas

Indução de Árvores de Decisão para a Inferência de Redes Gênicas PR UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Ministério da Educação Universidade Tecnológica Federal do Paraná Pró-Reitoria de Pesquisa e Pós-Graduação Relatório Final de Atividades Indução de Árvores

Leia mais

Manual do Teclado de Satisfação Online Web Opinião Versão 1.0.5

Manual do Teclado de Satisfação Online Web Opinião Versão 1.0.5 Manual do Teclado de Satisfação Online Web Opinião Versão 1.0.5 09 de julho de 2015 Departamento de Engenharia de Produto (DENP) SEAT Sistemas Eletrônicos de Atendimento 1. Introdução O Teclado de Satisfação

Leia mais

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES

MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES MINERAÇÃO DE DADOS PARA DETECÇÃO DE SPAMs EM REDES DE COMPUTADORES Kelton Costa; Patricia Ribeiro; Atair Camargo; Victor Rossi; Henrique Martins; Miguel Neves; Ricardo Fontes. kelton.costa@gmail.com; patriciabellin@yahoo.com.br;

Leia mais

Manual de Operação do Mercanet HelpDesk

Manual de Operação do Mercanet HelpDesk Manual de Operação do Mercanet HelpDesk Preparada por: Jaime Fenner Revisada por: Kelen Turmina Versão Documento: 02 Data: 12 de Maio de 2009 Sumário Executivo Este documento visa divulgar todas as funcionalidades

Leia mais

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD RESUMO Thereza P. P. Padilha Fabiano Fagundes Conceição Previero Laboratório de Solos

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

TUTORIAL. TP - Versão 3.1

TUTORIAL. TP - Versão 3.1 TUTORIAL TP - Versão 3.1 Criação: Andréia Rauber 1, Anabela Rato 2, Denise Kluge 3 e Giane Santos 4 Desenvolvimento: Marcos Figueiredo 5 O TP (Teste/Treinamento de Percepção) é um aplicativo de software

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

Marcio Cataldi 1, Carla da C. Lopes Achão 2, Bruno Goulart de Freitas Machado 1, Simone Borim da Silva 1 e Luiz Guilherme Ferreira Guilhon 1

Marcio Cataldi 1, Carla da C. Lopes Achão 2, Bruno Goulart de Freitas Machado 1, Simone Borim da Silva 1 e Luiz Guilherme Ferreira Guilhon 1 Aplicação das técnicas de Mineração de Dados como complemento às previsões estocásticas univariadas de vazão natural: estudo de caso para a bacia do rio Iguaçu Marcio Cataldi 1, Carla da C. Lopes Achão

Leia mais

Treinamento Auditor Fiscal. Instrutor: Jaime Naves Gestora: Adriana Nunes

Treinamento Auditor Fiscal. Instrutor: Jaime Naves Gestora: Adriana Nunes Treinamento Auditor Fiscal Instrutor: Jaime Naves Gestora: Adriana Nunes Conceito: O Auditor Fiscal WEB é uma solução que permite a usuários de qualquer segmento empresarial realizar auditorias sobre os

Leia mais

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado

Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Gestão do Conhecimento: Extração de Informações do Banco de Dados de um Supermercado Alessandro Ferreira Brito 1, Rodrigo Augusto R. S. Baluz 1, Jean Carlo Galvão Mourão 1, Francisco das Chagas Rocha 2

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

Exemplo de Aplicação do DataMinig

Exemplo de Aplicação do DataMinig Exemplo de Aplicação do DataMinig Felipe E. Barletta Mendes 19 de fevereiro de 2008 INTRODUÇÃO AO DATA MINING A mineração de dados (Data Mining) está inserida em um processo maior denominado Descoberta

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP

MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP MINERAÇÃO DE DADOS APLICADA PARA LEVANTAMENTO DO PERFIL DOS ALUNOS DOS CURSOS TÉCNICOS OFERECIDOS PELO CAMPUS CAMPOS DO JORDÃO DO IFSP 1 Data de entrega dos originais à redação em 15/03/2013 e recebido

Leia mais

sdescoberta DE CONHECIMENTO APLICADO A DADOS ELEITORAIS

sdescoberta DE CONHECIMENTO APLICADO A DADOS ELEITORAIS sdescoberta DE CONHECIMENTO APLICADO A DADOS ELEITORAIS Claudio Tavares Especialista em Banco de Dados, Unicenp. E-mail: cláudio.tavares@renault.com Daniel Bozza Especialista em Banco de Dados, Unicenp.

Leia mais

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS

AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS AVALIAÇÃO COMPARATIVA DE ALGORITMOS PARA SISTEMAS DE RECOMENDAÇÃO EM MÚLTIPLOS DOMÍNIOS: MODELOS INTERPRETÁVEIS APLICADOS A DADOS EDUCACIONAIS Hugo Marques Casarini Faculdade de Engenharia de Computação

Leia mais

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de

O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de MINERAÇÃO DE DADOS MINERAÇÃO DE DADOS O objetivo da Mineração de Dados é extrair ou minerar conhecimento de grandes volumes de dados. A mineração de dados é formada por um conjunto de ferramentas e técnicas

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Manual Básico do Usuário GP-Web Gestão de projetos

Manual Básico do Usuário GP-Web Gestão de projetos Manual Básico do Usuário GP-Web Gestão de projetos Departamento de Planejamento Pró-reitoria de Planejamento e Finanças Universidade Federal de Santa Catarina 1 Sumário O que é um projeto?... 4 O que é

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais

TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR O TEMPO DA MINERAÇÃO DE DADOS: Uma análise de Tipos de Coberturas Florestais UNIVERSIDADE ESTADUAL DE PONTA GROSSA PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO APLICADA CRISTIAN COSMOSKI RANGEL DE ABREU TÉCNICAS DE COMPUTAÇÃO PARALELA PARA MELHORAR

Leia mais

PROJETO DA DISCIPLINA. PES II Processo de Engenharia de Software II

PROJETO DA DISCIPLINA. PES II Processo de Engenharia de Software II UNIOESTE - Universidade Estadual do Oeste do Paraná CCET - Centro de Ciências Exatas e Tecnológicas Colegiado de Informática Curso de Bacharelado em Informática PROJETO DA DISCIPLINA PES II Processo de

Leia mais

PROJETO DA DISCIPLINA. PES II Processo de Engenharia de Software II

PROJETO DA DISCIPLINA. PES II Processo de Engenharia de Software II UNIOESTE - Universidade Estadual do Oeste do Paraná CCET - Centro de Ciências Exatas e Tecnológicas Colegiado de Informática Curso de Bacharelado em Informática PROJETO DA DISCIPLINA PES II Processo de

Leia mais

Software de análise de dados. Versão Sete. Melhorias

Software de análise de dados. Versão Sete. Melhorias Software de análise de dados Versão Sete Melhorias Software de análise de dados O IDEA Versão Sete apresenta centenas de novas melhorias e funcionalidades desenvolvidas para ajudá-lo a usar melhor o produto,

Leia mais

Manual do Visualizador NF e KEY BEST

Manual do Visualizador NF e KEY BEST Manual do Visualizador NF e KEY BEST Versão 1.0 Maio/2011 INDICE SOBRE O VISUALIZADOR...................................................... 02 RISCOS POSSÍVEIS PARA O EMITENTE DA NOTA FISCAL ELETRÔNICA.................

Leia mais

Manual do Usuário ZKPatrol1.0

Manual do Usuário ZKPatrol1.0 Manual do Usuário ZKPatrol1.0 SOFTWARE Sumário 1 Introdução de Funções... 3 1.2 Operação Básica... 4 1.3 Seleção de idioma... 4 2 Gerenciamento do Sistema... 5 2.1 Entrar no sistema... 5 2.2 Sair do Sistema...

Leia mais

Manual do e-dimed 4.0

Manual do e-dimed 4.0 Manual do e-dimed 4.0 Instalação e Configuração - Módulo Cliente Após a instalação do e-dimed ser efetuada, clique no atalho criado no desktop do computador. Será exibida a janela abaixo: A instalação

Leia mais

Considerações sobre Conhecimento Incerto e Redes Bayesianas

Considerações sobre Conhecimento Incerto e Redes Bayesianas Considerações sobre Conhecimento Incerto e Redes Bayesianas Felipe S. Gurgel 1, Maiquel de Brito 1 1 Universidade Federal de Santa Catarina - UFSC Departamento de Automação e Sistemas - DAS UFSC/CTC/DAS

Leia mais

APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1.

APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1. APLICAÇÃO DE DATA MINING NA IDENTIFICAÇÃO DE PADRÕES EM CRIANÇAS RESPIRADORAS BUCAIS E NASAIS 1. SQUIZANI, Cleonice Schell 2 ; MORALES, Yuri 2 ; VIEIRA, Sylvio André Garcia 2 1 Trabalho de pesquisa - UNIFRA

Leia mais

M a n u a l d o R e c u r s o Q m o n i t o r

M a n u a l d o R e c u r s o Q m o n i t o r M a n u a l d o R e c u r s o Q m o n i t o r i t i l advanced Todos os direitos reservados à Constat. Uso autorizado mediante licenciamento Qualitor Porto Alegre RS Av. Ceará, 1652 São João 90240-512

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Excel 2010 Modulo II

Excel 2010 Modulo II Excel 2010 Modulo II Sumário Nomeando intervalos de células... 1 Classificação e filtro de dados... 3 Subtotais... 6 Validação e auditoria de dados... 8 Validação e auditoria de dados... 9 Cenários...

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Mestrado em Análise de Dados e Sistemas de Apoio à Decisão. Faculdade de Economia. Universidade de Porto. Extracção de Conhecimento de Dados I

Mestrado em Análise de Dados e Sistemas de Apoio à Decisão. Faculdade de Economia. Universidade de Porto. Extracção de Conhecimento de Dados I Mestrado em Análise de Dados e Sistemas de Apoio à Decisão Faculdade de Economia Universidade de Porto Extracção de Conhecimento de Dados I PROBLEMAS DE CLASSIFICAÇÃO Manuel José Ferreira Monteiro Novembro

Leia mais

Manual do Usuário Novembro/2012

Manual do Usuário Novembro/2012 Manual do Usuário Novembro/2012 Sumário 1. Objetivos...3 2. Informações Operacionais...4 3. Configurações Recomendadas...7 4. Preparação do Sistema...8 4.1 Solicitando acesso ao Sisu...8 4.2 Autorização

Leia mais

Data Mining: Ferramenta JAVA

Data Mining: Ferramenta JAVA Data Mining: Ferramenta JAVA JAVA para Data Mining Weka 3: Data Mining Software em Java http://www.cs.waikato.ac.nz/ml/weka/ Coleção de algoritmos para as tarefas de data mining; Free software. WEKA: JAVA

Leia mais

MANUAL DO SISTEMA SIGPLAN - ELABORAÇÃO DA FASE QUALITATIVA DO PPA 2008-2011

MANUAL DO SISTEMA SIGPLAN - ELABORAÇÃO DA FASE QUALITATIVA DO PPA 2008-2011 MANUAL DO SISTEMA SIGPLAN - ELABORAÇÃO DA FASE QUALITATIVA DO PPA 2008-2011 O trabalho faz a diferença. Manaus, maio de 2007. Manual de Operação do Sistema de Informações Gerenciais e de Planejamento -

Leia mais

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina

O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina SEMINC 2001 57 O Processo de KDD Knowledge Discovery in Database para Aplicações na Medicina MARIZA FERRO HUEI DIANA LEE UNIOESTE - Universidade Estadual do Oeste do Paraná CECE Centro de Engenharias e

Leia mais

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados

Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados Fundamentos da inteligência de negócios: gestão da informação e de bancos de dados slide 1 1 Copyright 2011 Pearson Education, Inc. publishing as Prentice Hall Objetivos de estudo Como um banco de dados

Leia mais

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES.

BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Encontro de Ensino, Pesquisa e Extensão, Presidente Prudente, 22 a 25 de outubro, 2012 88 BUSINESS INTELLIGENCE, O ELEMENTO CHAVE PARA O SUCESSO DAS ORGANIZAÇÕES. Andrios Robert Silva Pereira, Renato Zanutto

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação E o que fazer depois de ter os dados organizados? Ideias base Aprender com o passado Inferir

Leia mais

A Utilização de Software Livre na Análise de QoS em Redes IP Utilizando Mineração de Dados

A Utilização de Software Livre na Análise de QoS em Redes IP Utilizando Mineração de Dados A Utilização de Software Livre na Análise de QoS em Redes IP Utilizando Mineração de Dados Maxwel Macedo Dias 1, Edson M.L.S. Ramos 2, Luiz Silva Filho 3, Roberto C. Betini 3 1 Faculdade de Informática

Leia mais

Conheça o Projeto. Apresentação. Finalidade. Objetivo

Conheça o Projeto. Apresentação. Finalidade. Objetivo Manual do Usuário Índice Conheça o Projeto...3 Apresentação...3 Finalidade...3 Objetivo...3 Histórico...4 Usando o Portal...5 Efetuando o cadastro na biblioteca digital...5 Logando na Biblioteca Digital...6

Leia mais

Classificação Automática dos Usuários da Rede Social Acadêmica Scientia.Net

Classificação Automática dos Usuários da Rede Social Acadêmica Scientia.Net Classificação Automática dos Usuários da Rede Social Acadêmica Scientia.Net Vinícius Ponte Machado 1, Bruno Vicente Alves de Lima 2, Heloína Alves Arnaldo 3, Sanches Wendyl Ibiapina Araújo 4 Departamento

Leia mais

Extensão ez Open Document Format (ezodf) Documentação. versão 2.0. experts em Gestão de Conteúdo

Extensão ez Open Document Format (ezodf) Documentação. versão 2.0. experts em Gestão de Conteúdo Extensão ez Open Document Format (ezodf) Documentação versão 2.0 Conteúdo 1. Introdução... 3 2 1.1 Público alvo... 3 1.2 Convenções... 3 1.3 Mais recursos... 3 1.4 Entrando em contato com a ez... 4 1.5

Leia mais

Padronização de Processos: BI e KDD

Padronização de Processos: BI e KDD 47 Padronização de Processos: BI e KDD Nara Martini Bigolin Departamento da Tecnologia da Informação -Universidade Federal de Santa Maria 98400-000 Frederico Westphalen RS Brazil nara.bigolin@ufsm.br Abstract:

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados

O Processo de KDD. Data Mining SUMÁRIO - AULA1. O processo de KDD. Interpretação e Avaliação. Seleção e Pré-processamento. Consolidação de dados SUMÁRIO - AULA1 O Processo de KDD O processo de KDD Interpretação e Avaliação Consolidação de dados Seleção e Pré-processamento Warehouse Data Mining Dados Preparados p(x)=0.02 Padrões & Modelos Conhecimento

Leia mais

DIF-e - MANUAL DE ORIENTAÇÃO AO CONTRIBUINTE

DIF-e - MANUAL DE ORIENTAÇÃO AO CONTRIBUINTE Página 1 de REVISÃO DATA VERSÃO DO HISTÓRICO DAS ALTERAÇÕES SISTEMA 00 1.0 Emissão inicial. Página 2 de Sumário 1. Introdução... 4 2. Modelo Conceitual... 4 3. Programa Cliente... 5 3.1 Telas de Configuração...

Leia mais

Conectando Bancos de Dados Microsoft Access no BrOffice.org Base. fornecido pelo Projeto de Documentação do BrOffice.org

Conectando Bancos de Dados Microsoft Access no BrOffice.org Base. fornecido pelo Projeto de Documentação do BrOffice.org Conectando Bancos de Dados Microsoft Access no BrOffice.org Base fornecido pelo Projeto de Documentação do BrOffice.org Índice 1 Introdução...2 1.1 Versão... 2 1.2 Licenciamento...2 1.3 Mensagem do Projeto

Leia mais

MANUAL PARA INCLUSÃO DIGITAL- ANDRAGOGIA

MANUAL PARA INCLUSÃO DIGITAL- ANDRAGOGIA Inclusão Digital - Software - Sistema Operacional (SO) Introdução O objetivo dessa cartilha é informar o usuário das características básicas dos softwares, do Sistema Operacional utilizados em um computador.

Leia mais

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas

Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas 22 - Encontro Anual de Tecnologia da Informação Aplicativo de Mineração de Dados Aplicado em Bases de Dados Acadêmicas Elisa Maria Vissotto1, Adriane Barbosa Camargo2 1 Universidade Regional Integrada

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

GUIA DE AUXÍLIO PARA GERENCIAMENTO DE PROJETOS METODOLOGIA IFES

GUIA DE AUXÍLIO PARA GERENCIAMENTO DE PROJETOS METODOLOGIA IFES GUIA DE AUXÍLIO PARA GERENCIAMENTO DE PROJETOS METODOLOGIA IFES SUMÁRIO 1. PREENCHIMENTO DA PLANILHA DE GERENCIAMENTO DE PROJETOS...3 1.1 Menu...3 1.2 Termo de Abertura...4 1.3 Plano do Projeto...5 1.4

Leia mais

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis O objetivo deste texto é apresentar os principais procedimentos

Leia mais

Professor: Disciplina:

Professor: Disciplina: Professor: Curso: Esp. Marcos Morais de Sousa marcosmoraisdesousa@gmail.com Sistemas de informação Disciplina: Introdução a SI Noções de sistemas de informação Turma: 01º semestre Prof. Esp. Marcos Morais

Leia mais

Aplicação de Técnicas de Mineração de Dados no Processo de Aprendizagem na Educação a Distância

Aplicação de Técnicas de Mineração de Dados no Processo de Aprendizagem na Educação a Distância Aplicação de Técnicas de Mineração de Dados no Processo de Aprendizagem na Educação a Distância Maxwel Macedo Dias 1, Luiz Alberto da Silva Filho 2, Adriano Del Pino Lino 1, Eloi Luiz Favero 2, Edson Marcos

Leia mais

SISTEMA DE GESTÃO DE RECURSOS HUMANOS

SISTEMA DE GESTÃO DE RECURSOS HUMANOS SISTEMA DE GESTÃO DE RECURSOS HUMANOS MANUAL DE PROCEDIMENTOS V PORTAL WEB Revisão: 07 Versão: 7.9.109 JM Soft Informática Março, 2015 SUMÁRIO 1 AVALIAÇÕES... 9 2 PLANO DE DESENVOLVIMENTO INDIVIDUAL...

Leia mais

Introdução a Datamining (previsão e agrupamento)

Introdução a Datamining (previsão e agrupamento) E o que fazer depois de ter os dados organizados? Introdução a Datamining (previsão e agrupamento) Victor Lobo Mestrado em Estatística e Gestão de Informação Ideias base Aprender com o passado Inferir

Leia mais

Treinamento GVcollege Módulo Administrador de Programas e Sistemas

Treinamento GVcollege Módulo Administrador de Programas e Sistemas Treinamento GVcollege Módulo Administrador de Programas e Sistemas AVISO O conteúdo deste documento é de propriedade intelectual exclusiva da GVDASA Sistemas e está sujeito a alterações sem aviso prévio.

Leia mais

Administração de Sistemas de Informação Gerenciais UNIDADE IV: Fundamentos da Inteligência de Negócios: Gestão da Informação e de Banco de Dados Um banco de dados é um conjunto de arquivos relacionados

Leia mais

Interface Homem- Computador

Interface Homem- Computador Interface Homem- Computador (IHC) Profª. Leticia Lopes Leite Software Educacional I Interface Deve ser entendida como sendo a parte de um sistema computacional com a qual uma pessoa entra em contato física,

Leia mais

Data Warehouse Mineração de Dados

Data Warehouse Mineração de Dados Data Warehouse Mineração de Dados Profa. Roberta Macêdo M. Gouveia robertammg@gmail.com 1 18/12/2014 Data Warehouse Data Mining Big Data A mina de ouro debaixo dos bits 2 Data Warehouse: A Memória da Empresa

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Algoritmos Indutores de Árvores de

Algoritmos Indutores de Árvores de Algoritmos Indutores de Árvores de Decisão Fabrício J. Barth Sistemas Inteligentes Análise e Desenvolvimento de Sistemas Faculdades de Tecnologia Bandeirantes Abril de 2013 Problema: Diagnóstico para uso

Leia mais

4 Implementação e Resultados Experimentais

4 Implementação e Resultados Experimentais 4 Implementação e Resultados Experimentais Com o objetivo de fazer a criação automática de visões materializadas, ou seja, prover uma solução on-the-fly para o problema de seleção de visões materializadas,

Leia mais

MetrixND. especificações. MetrixND - Ferramenta de previsão de energia elétrica

MetrixND. especificações. MetrixND - Ferramenta de previsão de energia elétrica MetrixND especificações MetrixND - Ferramenta de previsão de energia elétrica Visão geral O MetrixND da Itron é uma ferramenta de modelagem flexível, bastante usada pelos principais serviços de previsão

Leia mais

Universidade de São Paulo/Faculdade de Saúde Pública Curso de Saúde Pública Disciplina: HEP 147 Informática I. Aula Excel

Universidade de São Paulo/Faculdade de Saúde Pública Curso de Saúde Pública Disciplina: HEP 147 Informática I. Aula Excel Universidade de São Paulo/Faculdade de Saúde Pública Curso de Saúde Pública Disciplina: HEP 147 Informática I Aula Excel O que é o Excel? O Excel é um aplicativo Windows - uma planilha eletrônica - que

Leia mais

Status Enterprise Guia do Usuário. Parte 11 Utilidades e Ferramentas

Status Enterprise Guia do Usuário. Parte 11 Utilidades e Ferramentas Guia do Usuário Parte 11 Utilidades e Ferramentas Conteúdos 1 RESUMEN 2 SIMULADOR DE DADOS... 4 2.1 Introducção... 4 2.2 Usando el Simulador de Dados... 4 3 FERRAMENTA DE BANCOS DE DADOS... 5 3.1 Acerca

Leia mais