ACOMPANHAMENTO TEMPORAL DE AGRUPAMENTOS DE SÉRIES TEMPORAIS BASEADO EM CARACTERÍSTICAS

Tamanho: px
Começar a partir da página:

Download "ACOMPANHAMENTO TEMPORAL DE AGRUPAMENTOS DE SÉRIES TEMPORAIS BASEADO EM CARACTERÍSTICAS"

Transcrição

1 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS Programa de Pós-Graduação em Informática ACOMPANHAMENTO TEMPORAL DE AGRUPAMENTOS DE SÉRIES TEMPORAIS BASEADO EM CARACTERÍSTICAS Ana Paula Serra Belo Horizonte 2011

2 Ana Paula Serra ACOMPANHAMENTO TEMPORAL DE AGRUPAMENTOS DE SÉRIES TEMPORAIS BASEADO EM CARACTERÍSTICAS Dissertação apresentada ao Programa de Pós-Graduação em Informática como requisito parcial para qualicação ao Grau de Mestre em Informática pela Pontifícia Universidade Católica de Minas Gerais. Orientador: Luis Enrique Zárate Belo Horizonte 2011

3 FICHA CATALOGRÁFICA Elaborado pela Biblioteca da Pontifícia Universidade Católica de Minas Gerais B422c Serra, Ana Paula Acompanhamento temporal de agrupamentos de séries temporais baseado em características / Ana Paula Serra. Belo Horizonte, f. : Il. Orientador: Luis Enrique Zárate Dissertação (Mestrado) Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-Graduação em Informática 1. Análise de séries temporais. 2. Bando de dadostemporais. 3. Processamento de dados. I. Zárate, Luis Enrique. II. Pontifícia Universidade Católica de Minas Gerais. Programa de Pós- Graduação em Informática. III. Título. CDU:

4

5 Dedico este trabalho ao meu pai que abriu mão de seus sonhos e de regalias para me propiciar as melhores oportunidades de ensino e educação. Com isto conseguiu enraizar em mim a grande importância da busca pelo conhecimento na vida e formação de um ser humano.

6 AGRADECIMENTOS A Deus por me amparar nos momentos difíceis, me dar força interior para superar as diculdades, mostrar os caminho nas horas incertas e me suprir em todas as minhas necessidades. Ao meu orientador Luis Enrique Zárate, por acreditar em mim, me mostrar o caminho da ciência, por ser exemplo de prossional dedicado à arte de lecionar. À minha família a qual amo muito, meu esposo Alexandre e meus lhos Gabriel e Rodrigo, pelo carinho, paciência e incentivo. Aos meus pais Ana e José Raimundo por enfrentar com coragem e perseverança as diculdades na criação e educação dos lhos. À minha segunda família Ana Carolina, Valentina, Matheus e Juliano pelo companheirismo e alegrias vividas juntos. Aos amigos que zeram parte desses momentos sempre me ajudando e incentivando. Aos funcionários do mestrado em informática da PUC-Minas, especialmente à Giovana pelo incentivo, boa vontade e gentileza dispensados. A todos os professores do mestrado pelo convívio e aprendizado.

7 O bater de asas de uma simples borboleta pode inuenciar o curso natural das coisas e, assim, talvez provocar um tufão do outro lado do mundo. Edward Norton Lorenz

8 RESUMO Neste estudo foi proposta uma metodologia de caracterização de séries temporais em BDST, para aplicação de análise de agrupamentos. Na caracterização das séries temporais foram utilizados os componentes de nível e tendência calculados através do modelo de suavização de Holt-Winters. Quanto às técnicas de agrupamento foram utilizadas as técnicas AGNES (Agrupamento Hierárquico Aglomerativo) e PAM (Agrupamento por Partição). Para aplicação dos experimentos uma BDST sintética foi gerada através da execução de um algoritmo desenvolvido no programa R. A metodologia permite responder questões como: os motivos de mudanças de registros/objetos entre grupos através dos atributos que mais inuenciam mudanças signicativas nas medidas de similaridade; os motivos levam ao surgimento ou extinção de grupos de uma janela temporal para outra e o tempo de validade do conhecimento. Palavras-chave: Mineração de dados temporal. Séries temporais. Base de dados de séries temporais. Caracterização de séries temporais. Janelas de tempo.

9 ABSTRACT This study proposed a methodology for characterization of time series in BDST for application of cluster analysis. The characterization of the time series were used for level and trend components calculated using the model of Holt-Winters smoothing. The techniques of clustering techniques were used AGNES (Agglomerative Hierarchical Clustering) and PAM (Partition-Group). For the purposes of the experiments was a synthetic BDST generated by an algorithm developed in the program R. The methodology allows answering questions such as: the reasons for changes in records / objects between groups through the attributes that most inuence signicant changes in measures of similarity, the reasons leading to the emergence or extinction of groups of one window to another time and expiration time knowledge. Keywords: Temporal data mining. Time series. Database of time series. Characterization of time series. Time windows.

10 LISTA DE FIGURAS FIGURA 1 Exemplo 1 de acompanhamento de agrupamentos FIGURA 2 Exemplo 2 de acompanhamento de agrupamentos FIGURA 3 Exemplo de denição de janelas de tempo FIGURA 4 Esquema da metodologia proposta FIGURA 5 Arquitetura do gerador FIGURA 6 Banner e dendograma da Janela FIGURA 7 Grácos do agrupamento PAM para a Janela FIGURA 8 Grácos das amplitudes das siluetas médias FIGURA 9 Grácos das amplitudes das siluetas médias

11 LISTA DE TABELAS TABELA 1 Parâmetros de entrada para geração e segmentação da BDST TABELA 2 Simulação 1 (janela tamanho 12) TABELA 3 Simulação 2 (janela tamanho 6) TABELA 4 Amostra da movimentação dos objetos entre janelas TABELA 5 Medidas descritivas dos grupos por janela de tempo TABELA 6 Comparação do agrupamento na aplicação das técnicas AGNES (limiar = média dos Height s + 1 desvio padrão) e PAM. Média das diferenças= TABELA 7 Comparação do agrupamento na aplicação das técnicas AGNES (limiar = média dos Height s + 2 desvios padrões) e PAM. Média das diferenças=

12 SUMÁRIO 1 INTRODUÇÃO Considerações iniciais O problema da manipulação de dados temporais Identicação e caracterização do problema Motivação Objetivos Justicativa Principais contribuições do Trabalho Organização do trabalho REVISÃO BIBLIOGRÁFICA Mineração de dados temporais - MDT METODOLOGIA PARA CARACTERIZAÇÃO DE SÉRIES TEMPO- RAIS EM BDST Denição formal de uma BDST Denição da amplitude da janela temporal Escolha do modelo da série temporal Caracterização das séries temporais da BDST Escolha da técnica de agrupamentos Visão geral da metodologia SIMULAÇÕES E EXPERIMENTOS Gerador da BDST multivariada sintética Geração e experimentos da BDST Segmentação da BDST em tamanhos de janelas pré-estabelecidos para teste Extração de características das séries Escolha do tamanho de janela ideal Acompanhamento da movimentação de objetos entre grupos Acompanhamento evolutivo dos agrupamento

13 5 CONCLUSÕES REFERÊNCIAS ANEXO A -- ALGORITMOS DESENVOLVIDOS EM R

14 11 1 INTRODUÇÃO 1.1 Considerações iniciais O uso de mineração de dados (data mining) tem avançado em diversas áreas de conhecimento, tanto no meio acadêmico quanto na indústria. Esta atividade tornou-se essencial em áreas como: marketing, nanças, telecomunicações, saúde, comércio, dentre outras. Descobrir a partir de bases de dados o conhecimento que ainda não é óbvio proporciona um efetivo suporte à tomada de decisão, auxiliando na solução de problemas e otimização de processos. No mundo dos negócios, ter acesso a esse conhecimento direciona o planejamento de estratégias acompanhando o mercado sem perder a chance de se antecipar aos desejos e anseios do consumidor. A mineração de dados é denida como uma das atividades que fazem parte do processo de Descoberta de Conhecimento em Banco de Dados (KDD - Knowledge Discovery Database), o qual se inicia a partir da denição e entendimento de um domínio de problema, e através da descoberta de conhecimento útil objetiva atender expectativas do usuário (FAYYAD et al., 1996). Para isso, são coletados dados históricos acerca do domínio do problema e realizado um pré-processamento para posterior aplicação das técnicas de mineração de dados e interpretação do conhecimento extraído O problema da manipulação de dados temporais Nos últimos anos tem-se observado um acelerado crescimento na capacidade de armazenamento de dados e este aumento tem permitido o registro de informações por longos períodos de tempo. Esta situação introduz um caráter temporal aos dados, e com isso passa-se a manipular gigantescos volumes de dados com históricos que podem ser explorados para melhor entendimento do domínio do problema. Dentro deste contexto houve uma extensão da mineração de dados convencional para a Mineração de Dados Temporal (MDT) que na sua essência consiste na mineração de base de dados contendo dados seqüenciais. Segundo Roddick et al. (2002), a MDT trouxe a capacidade de minerar atividades e trajetórias mais do que simplesmente estados denidos ou instantes de tempo. A MDT torna o conhecimento extraído mais completo. Note que a base de dados de sequências tratada na MDT pode ser indexada por um índice ou por algum atributo ordenável, que não precisa ser necessariamente o tempo, como por exemplo podemos citar dados sequênciais de texto, sequências genéticas, sequências de

15 12 proteínas, dentre outras Identicação e caracterização do problema De acordo com o que foi exposto até o momento vimos que surge a necessidade de algoritmos/técnicas, procedimentos e métodos para mineração de dados, capazes de lidar com informações temporais. Os algoritmos convencionais de mineração de dados precisam de adaptações para tratar bases de dados temporais, ou os dados temporais precisam ser pré-processados e convertidos em valores pontuais, congelados ou sumarizados para um instante de tempo `t', antes da aplicação das técnicas convencionais de mineração de dados. Quando técnicas de agrupamento são aplicadas sobre BDST o principal aspecto a ser considerado é a caracterização das séries e, portanto, é preciso extrair características que representem a essência de uma série. As melhores medidas de caracterização de uma série são extraídas de estruturas presentes em um modelo generalizado de uma série temporal, que é formado basicamente pelas seguintes componentes: nível, tendência, sazonalidade e periodicidade. Para apresentar o método proposto, a Figura 1 ilustra a proposta do nosso trabalho. Suponha uma BDST multivariada contendo registros que possuam atributos expressos em séries temporais. Então caracteriza-se estas séries extraindo os componentes de média e tendências e aplicando-se posteriormente a técnica de agrupamento para dois intervalos de tempo, Janela 1 e Janela 2. Cada ponto no gráco representa um registro da nossa base de dados visualizados através dos dois primeiros componentes principais. Observando os grácos da Figura 1 percebe-se que da Janela 1 para a Janela 2 houve uma movimentação de objetos entre grupos. Percebe-se que também houve mudanças nas formas dos grupos (tamanho e posição). Analisar o que motiva a evolução dos agrupamentos ao longo do tempo pode gerar conhecimento útil dentro do domínio do problema que está sendo estudado. Na Figura 2 mostra a situação onde há uma movimentação de objetos entre grupos de uma janela para outra e a formação de um novo grupo. Isto signica que os padrões descobertos para a janela 1 tiveram somente validade dentro do intervalo de tempo da janela 1. Esta situação remete a um novo problema que trata sobre a duração do conhecimento extraído. Neste caso a escolha de um tamanho de janela que permita observar mudanças nos padrões descobertos num primeiro momento é crucial para determinação da regularidade nas mudanças temporais dos padrões descobertos. Devido à carência de base de dados reais completas e abrangentes que permitam análise da nossa proposta, foi necessário partir para a construção de um gerador de BDST multivariada sintética.

16 13 Figura 1: Exemplo 1 de acompanhamento de agrupamentos em duas janelas de tempo. Fonte: Elaborada pela autora. Através de roteiros, é possível denir o número de atributos da base de dados, o número de pontos de observação no tempo e o número de registros a serem considerados. Para geração da base sintética foi utilizado o ambiente R (R Development Core Team, 2006). Figura 2: Exemplo 2 de acompanhamento de agrupamentos em duas janelas de tempo. Fonte: Elaborada pela autora. 1.2 Motivação Em trabalhos de mineração de séries temporais utilizando técnicas de agrupamento, percebe-se a ênfase dada na discussão da melhor maneira de calcular medidas de simi-

17 14 laridades/dissimilaridades (LIAO, 2005). Abordagens que generalizem esta questão ainda estão em discussão, e a conclusão que a maioria dos estudos chega é de que esta escolha depende do domínio e estrutura da base de dados (LIAO, 2005). O presente estudo contribui nesta direção apresentado uma metodologia para agrupamento de séries temporais por janelas através da caracterização das séries, baseada nas componentes estruturais de um modelo generalizado. A similaridade será medida baseada nas características (nível e tendência) extraídas de cada série. Com isto, é possível entender a dinâmica de movimentação dos grupos e objetos ao longo do tempo, buscando subsídios para explicação e previsão de fenômenos. 1.3 Objetivos Propor uma metodologia para acompanhamento dos agrupamentos de características extraídas de uma BDST multivariável, entre janelas de tempo. A metodologia proposta seguirá as seguintes etapas: a) Escolha do modelo para representação da série temporal; b) Extração de características das séries temporais; c) Desenvolvimento de um gerador de BDST. A metodologia proposta neste estudo pode ajudar a responder questões como: a) Quais são os motivos de mudanças de registros/objetos entre grupos? Quais são os atributos que mais inuenciam mudanças signicativas nas medidas de similaridade? b) Quais motivos levam ao surgimento ou extinção de grupos de uma janela temporal para outra? c) Qual o tempo de validade do conhecimento? Ou seja, até quando um padrão extraído da análise de agrupamento é válido. 1.4 Justicativa Como pode ser observado através da extensa literatura, a discussão sobre metodologias para manipulação de dados temporais é uma área de pesquisa com história e com forte tendência de crescimento (Liu et al. (2001); Laxman e Sastry (2006); Wang, Wirth e Wang (2007); Tsumoto e Hirano (2008); Böttcher et al. (2009)).

18 Principais contribuições do Trabalho Ao nal do trabalho a expectativa é que uma metodologia para agrupamento temporal de BDST baseado na caracterização das séries temporais seja desenvolvida para dar suporte na busca de respostas às questões citadas acima, e que seja um direcionamento para estudos futuros na área de MDT. 1.6 Organização do trabalho Este trabalho está dividido da seguinte forma: No capítulo 2 a revisão bibliográca é apresentada; No capítulo 3 será apresentada a metodologia para caracterização de séries temporais em BDST; No capítulo 4 são mostrados e discutidos resultados de experimentos e no capítulo 5 comentários nais e conclusões são apresentados.

19 16 2 REVISÃO BIBLIOGRÁFICA 2.1 Mineração de dados temporais - MDT Uma abordagem para MDT surgiu de uma extensão do trabalho apresentado em Agrawal, Imielinski e Swami (1993), no qual foi proposto o algoritmo Apriori, que descobre associações entre itens de compra, mas que inicialmente não foi considerado nenhum tipo de ordenação nos dados. A extensão do algoritmo Apriori que considera a ordenação dos itens foi proposta em Agrawal e Srikant (1995), com o nome de mineração de sequências. Um segundo trabalho para identicar padrões temporais em dados sequenciais foi proposto por Mannila, Toivonen e Verkamo (1997) para descoberta de episódios (eventos) frequentes. A proposta foi aplicada na área de telecomunicações sobre base de dados contendo uxos de sinais de seqüências de alarmes, onde pode ser observado que os estados dessa rede seguem um comportamento dinâmico temporal. O objetivo era melhorar o entendimento das relações entre diferentes tipos de alarmes, ou seja, ser possível de prever um congestionamento e melhorar a eciência do gerenciamento deste tipo de rede. Com o crescente interesse da comunidade cientíca no reconhecimento do valor temporal dos dados, surgiram diversos trabalhos de MDT tratando não somente a ordenação seqüencial dos dados, mas o valor temporal propriamente dito contido nos históricos. Dentre os estudos iniciais de manipulação de históricos ou séries temporais, o trabalho de Last et al. (2001) destaca-se como uma importante contribuição, ao apresentar uma metodologia para aplicação de mineração de dados sobre séries temporais. Esta metodologia sugere que as etapas convencionais de um processo de mineração de dados, aplicadas a uma base contendo dados coletados para um determinado instante ou intervalo de tempo, chamado por vários autores como base de dados estática, fossem reestruturadas para a mineração de dados em uma BDST (Base de Dados de Séries Temporais). O processo inclui as etapas de limpeza, ltragem de séries temporais e identicação dos atributos mais relevantes para extração de regras de associação que possam ser usados para predizer o comportamento das séries temporais. Esta metodologia foi aplicada em dois tipos de domínio, mercado de ações e metereologia. Apesar do foco desse trabalho ser a aplicação da técnica de regras de associação em uma BDST, este estabelece uma conceituação de como minerar séries temporais aproveitando da teoria da análise estatística. O trabalho de Lin, Orgun e Williams (2002) traz uma visão simplicada do processo de MDT e alguns fundamentos para manipular dados temporais. Os autores discutem

20 17 sobre os dois problemas fundamentais da MDT, que é o cálculo de similaridades entre séries temporais e a identicação de periodicidades nos históricos de dados. Ao nal foi lançado o desao pela busca de uma teoria geral para MDT que representaria um marco nesta área, visto que os trabalhos, até então, não possuíam uma fundamentação teórica consolidada. Em Last, Kandel e Bunke (2004), os autores apresentaram um livro importante para estruturação da área contendo um apanhado de artigos relevantes que apresentam propostas para os maiores desaos da MDT. A partir deste trabalho surgiram novas categorizações, onde pesquisadores acabaram induzindo o aparecimento de subáreas dentro da MDT. Desde então a comunidade cientíca se organiza por estas subáreas, unindo forças, empenho na busca pela consolidação e globalização das teorias da MDT. Baseado na literatura, Roddick et al. (2002) propuseram uma taxonomia para MDT considerando três dimensões: a) o tipo de dado; b) a ordenação nos dados e c) o paradigma de mineração utilizado. Quanto ao tipo de dado foram consideradas três divisões: abordagens que lidam com valores escalares, com eventos e com resultados de mineração. Este último também chamado de mineração de alta ordem (RODDICK et al., 2008), considerado pelos autores como um desao da MDT. Para a dimensão correspondente à ordenação dos dados foram denidas duas divisões: métodos que reetem a ordenação, isto é, análise de sequências, e aqueles que ignoram a ordenação dos fatos/eventos. Para a dimensão paradigma de mineração foram criadas duas divisões: trabalhos para descoberta de regras de associação temporal e trabalhos de classicação. Para os autores a classicação pode ser supervisionada e não-supervisionada. Esta última correspondente à técnica de agrupamentos. Além dos desaos na MDT, de encontrar formas ecientes de armazenamento e representação das séries temporais, e da formalização de aplicações para classicação e agrupamento, os autores apontam que outro grande desao da área de MDT está inserido no contexto de comparar séries temporais e descobrir similaridades entre elas. Levando em consideração a taxonomia apresentada por Roddick et al. (2002) o presente trabalho está inserido na categoria do paradigma de mineração 'classicação', e pelo tipo de dado 'resultado de mineração'. Neste trabalho o foco principal é propor uma metodologia que permita o acompanhamento evolutivo de modelos de agrupamentos e seus objetos, após a aplicação de uma classicação não-supervisionada sobre BDST a partir da caracterização das séries temporais que compõem a base. Dentro do contexto do nosso trabalho, a mais importante contribuição é apresentada por Liao (2005). O autor fez uma revisão de metodologias aplicadas na análise de

21 18 agrupamentos sobre séries temporais. A maioria dos estudos apresentados está restrito às séries temporais univariadas, e a distinção entre estes está em como é calculada a medida de similaridade/dissimilaridade entre as séries, o que depende do tipo e das características da BDST. Isso indica que o aspecto mais importante na aplicação de técnicas de agrupamento, sobre séries temporais, está em compreender as características especícas do domínio e a estruturação dos dados para então encontrar uma apropriada medida de similaridade nesse contexto. As abordagens levantadas por Liao (2005) foram organizados em três categorias: 1) análise de agrupamentos aplicada diretamente sobre a BDST, com algumas modicações nos algoritmos de mineração de dados convencionais; 2) análise de agrupamentos sobre características extraídas das séries temporais; e 3) análise de agrupamentos baseada em modelos construídos a partir da BDST. Na primeira categoria tem-se a proposta de manipular diretamente os dados originais, o que acarreta em um custo computacional muito alto na aplicação das técnicas de MDT. Na terceira categoria a proposta foi utilizar informações de modelos (coecientes, resíduos, etc), o que não é muito consistente já que estes coecientes não tem relação direta com o domínio do problema. Muitos coecientes são meramente ajustes dos modelos para os dados históricos. Dentre as três categorias a segunda, que abrange as aplicações de análise de agrupamentos baseada em características extraídas das séries temporais, são as mais interessantes, pois com a síntese dos dados ganha-se no custo computacional e se bem escolhidas, estas características extraídas podem representar corretamente a informação contida na BDST. Outras formas de lidar com o problema do custo computacional no processamento de uma BDST consistem no uso de técnicas para redução da dimensionalidade. Entre os principais trabalhos podemos citar: Megalooikonomou, Li e Wang (2004); Chu, Tseng e Liang (2008) e Al-Naymat e Taheri (). O trabalho de Megalooikonomou, Li e Wang (2004) propõe uma técnica de redução de dimensionalidade na análise de séries temporais que utiliza a técnica de quantização vetorial para encontrar o código mais próximo (baseado numa medida de distância) da sequência-chave para representar cada segmento. O autor compara os resultado obtidos com a utilização de Análise de Componentes Principais (ACP) onde cada segmento é representado por um valor escalar constante. Nas simulações geralmente a técnica proposta apresenta um desempenho melhor que a técnica de ACP. O trabalho de Chu, Tseng e Liang (2008) propõe um algoritmo chamado THUI (Temporal High Utility Itemsets)- Minepara minerar alto uxo de dados com eciência e efetividade, baseando-se na escolha de alguns registros candidatos que generali-

22 19 zem um grupo semelhante. Sobre várias condições, os experimentos utilizando o THUI- Minemostra uma signicativa melhora de desempenho em relação a outros algoritmos existentes. E o último trabalho citado (AL-NAYMAT; TAHERI, ), mostra os efeitos da redução de dimensionalidade no cálculo de similaridades entre séries temporais. São feitos comparativos da precisão de três métodos de redução de dimencionalidade, Random Projection (RP), Down sampling (DS)e Averaging (Avg), ma utilização de duas medidas de similaridade Dynamic Time Warping (DTW)e Distância Euclidiana. As simulações mostram que é possível manter uma alta precisão na busca de similaridades entre séries temporais, mesmo com uma signicativa redução da dimensionalidade. Neste capítulo foi apresentado um histórico com a evolução da área MDT cuja origem surgiu na análise de sequências até chegar à exploração de todo valor temporal contido nos dados. Dentro deste contexto surgiram propostas de categorização dos trabalhos da área de MDT em geral como também especicamente da subárea que trata somente da análise de agrupamentos de séries temporais. Atualmente é nesta subárea que estão inseridos os maiores desaos da MDT e onde vem surgindo um volume grande de trabalhos publicados.

23 20 3 METODOLOGIA PARA CARACTERIZAÇÃO DE SÉRIES TEMPORAIS EM BDST 3.1 Denição formal de uma BDST A presente seção trata da caracterização de séries temporais em uma BDST multivariada, que serão subdivididas em janelas de tempo pré-denidas para posterior aplicação da análise de agrupamentos. Este trabalho considera que a BDST está formada por séries temporais cujos dados são coletados nos mesmos períodos de tempo podendo ser regulares ou irregulares. A base de dados temporal multivariada considerada nesse estudo pode ser expressa da seguinte forma de acordo com a equação 1: Z t 11 Z t 12 Z t 1M Z t 21 Z t 22 Z t 2M [Z] = onde, i = 1,..., N, j = 1,..., M. (1) Z t N1 Z t N2 Z t NM com Z t ij = {Z 1 ij, Z 2 ij,..., Z T ij e onde N representa o número de indivíduos (ou exemplos) e M o número de atributos. Cada elemento de [Z] corresponde a uma observação do exemplo i para o atributo j e cada valor de t = 1,..., T corresponde aos períodos de observação da série. Note que, o número de elementos da base de dados Z é dado por NxMxT. A abordagem proposta nesse trabalho consiste em dividir as séries Z t ij em janelas de tempo w h do conjunto de janelas W = {w 1, w 2,..., w H }, para então caracterizá-las e aplicar técnicas de agrupamentos para acompanhamento evolutivo dos grupos. Cada série Z t ij será dividida em janelas de tempo que podem ser de amplitude iguais ou diferentes. Dentro do intervalo original da série, t = 1,..., T, haverá pontos de corte denidos pelo conjunto de janelas W. As características a serem extraídas destas séries para composição do vetor de características que as represente será determinado para cada janela w h. Dessa forma Z ijh corresponde ao vetor de características de cada série Z t ij, onde h representa a janela temporal w h. O conjunto destes vetores Z ijh irá compor os dados de entrada para a aplicação de técnicas de agrupamentos. A técnica de agrupamento será aplicada ao conjunto de vetores para as `H' janelas o que permite acompanhar a evolução dos grupos.

24 21 Pelo exposto acima quatro procedimentos precisam ser adotados: 1) Denição da amplitude da janela temporal; 2) Escolha do modelo de série temporal; 3) Caracterização das séries temporais da BDST; e 4) Escolha da técnica de agrupamentos. 3.2 Denição da amplitude da janela temporal A forma de determinação da amplitude das janelas w h pode variar de acordo com a variação dos dados, o domínio do problema e a disponibilidade de informações a respeito do banco de dados em análise. Tendo em vista que o objetivo desta fase de subdivisão da BDST em janelas é a busca por pontos de corte no tempo, onde há mudanças importantes que são de interesse para a análise, ter informações acerca do contexto pode dar uma noção da periodicidade das variações e, portanto, da amplitude das janelas. Para ilustrar uma idéia de possível escolha da amplitude das janelas, através da variação dos dados, observemos uma BDST contendo as séries série-1, série-2, série- 3 e série-4, ver Figura 3. Um critério para escolha da amplitude da janela w h pode ser estabelecido a partir da identicação das séries de atributos categóricos com menor variabilidade no tempo. E dentre estas séries categóricas escolher aquela que mais varia, pensando que dados categóricos (como por exemplo atributos de perl) quando variam provavelmente acarretará em mudanças nos outros atributos mais variantes no tempo. No exemplo da Figura 3 as séries categórias seriam série-3e série-4, sendo que, dentre as duas a que mais varia é a série-3que será a escolhida para denir a amplitude das janelas. Figura 3: Exemplo de denição de janelas de tempo. Fonte: Elaborada pela autora. Uma outra forma de escolher as janelas de tempo através da análise do domínio do problema e da disponibilidade de informações a respeito da base de dados pode se dar pela xação de uma amplitude para todas as janelas, coerentes com o contexto. Como por exemplo, no caso de uma BDST com valores mensais por um período maior que dois anos, é coerente a escolha de janelas semestrais, que comumente é considerado um período suciente para que ocorram variações signicativas. No caso de haver disponibilidade de

25 22 informações a respeito do domínio, que indiquem uma melhor subdivisão destas séries de acordo com seus períodos de mudança, isto levará a uma melhor exploração da base de dados. 3.3 Escolha do modelo da série temporal Na área de análise de séries temporais existem vários tipos de modelos que descrevem o comportamento de uma série temporal. A escolha do melhor modelo varia com os objetivos, as propriedades dos dados e a quantidade de séries a serem manipuladas. Basicamente, estes modelos se dividem em duas categorias segundo o número de parâmetros envolvidos: (i) modelos paramétricos que possuem um número nito de parâmetros, e a análise é feita no domínio temporal e (ii) modelos não-paramétricos que envolvem um número innito de parâmetros e analisam a série no domínio das freqüências. Os modelos não-paramétricos são mais utilizados na investigação dos mecanismos geradores da série temporal, sendo muito útil na identicação de periodicidades relevantes nos dados. Enquanto isso os modelos paramétricos são os mais adequados para caracterizar e fazer previsões de uma série temporal (MORETTIN; TOLOI, 2006). Dentro da categoria de modelos paramétricos os mais utilizados são os modelos de erro (ou de regressão), os modelos ARIMA (Box e Jenkins), os modelos de suavização exponencial, os modelos estruturais e os modelos não-lineares. Com exceção dos modelos de suavização exponencial, todos os outros partem do princípio de que uma série temporal tem a forma geral dada por Z t = f t + a t, composta por uma função do tempo f t somada a um ruído a t. A variação nas metodologias está nas suposições que se faz sobre os dados que implicam na denição de f t. Como por exemplo, suposições sobre as distribuições de probabilidade dos dados ou/e existência de independência entre as observações. Estas suposições acabam introduzindo limitações na validade dos modelos. Por outro lado, os modelos de suavização exponencial não fazem nenhum tipo de suposição sobre os dados que compõem a série. Estes se baseiam somente na ideia de que os dados do passado formam o padrão de comportamento da série, e este padrão é descoberto por meio da suavização da aleatoriedade da série. Isto signica que, se for possível retirar toda a interferência dos ruídos aleatórios da série temporal, será possível observar o padrão básico inserido nos dados. Um dos modelos de suavização mais completos e muito utilizado na prática (JR; DIAZ-SAIZ, 2008) é o de Holt-Winters (WINTERS, 1960), que associa a cada componente do padrão da série (nível (µ t ), tendência (T t ) e sazonalidade (F t )) uma constante de suavização. O modelo de Holt-Winters é de fácil entendimento, possui custo computacional

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro

Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro Uma aplicação de Inteligência Computacional e Estatística Clássica na Previsão do Mercado de Seguros de Automóveis Brasileiro Tiago Mendes Dantas t.mendesdantas@gmail.com Departamento de Engenharia Elétrica,

Leia mais

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA

APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA APLICAÇÃO DE MINERAÇÃO DE DADOS PARA O LEVANTAMENTO DE PERFIS: ESTUDO DE CASO EM UMA INSTITUIÇÃO DE ENSINO SUPERIOR PRIVADA Lizianne Priscila Marques SOUTO 1 1 Faculdade de Ciências Sociais e Aplicadas

Leia mais

4 Gráficos de controle

4 Gráficos de controle 4 Gráficos de controle O gráfico de controle é uma ferramenta poderosa do Controle Estatístico de Processo (CEP) para examinar a variabilidade em dados orientados no tempo. O CEP é composto por um conjunto

Leia mais

Prof. Msc. Paulo Muniz de Ávila

Prof. Msc. Paulo Muniz de Ávila Prof. Msc. Paulo Muniz de Ávila O que é Data Mining? Mineração de dados (descoberta de conhecimento em bases de dados): Extração de informação interessante (não-trivial, implícita, previamente desconhecida

Leia mais

3 Metodologia para Segmentação do Mercado Bancário

3 Metodologia para Segmentação do Mercado Bancário 3 Metodologia para Segmentação do Mercado Bancário Este capítulo descreve a metodologia proposta nesta dissertação para a segmentação do mercado bancário a partir da abordagem post-hoc, servindo-se de

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER

SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI LEARNING SYSTEMS FOR IDENTIFICATION OF PEQUI FRUIT SEEDS NUMBER SISTEMAS DE APRENDIZADO PARA A IDENTIFICAÇÃO DO NÚMERO DE CAROÇOS DO FRUTO PEQUI Fernando Luiz de Oliveira 1 Thereza Patrícia. P. Padilha 1 Conceição A. Previero 2 Leandro Maciel Almeida 1 RESUMO O processo

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

PREVISÃO DE VENDAS DE CERVEJA PARA UMA INDÚSTRIA DE RIBEIRÃO PRETO

PREVISÃO DE VENDAS DE CERVEJA PARA UMA INDÚSTRIA DE RIBEIRÃO PRETO PREVISÃO DE VENDAS DE CERVEJA PARA UMA INDÚSTRIA DE RIBEIRÃO PRETO José Gilberto S. Rinaldi (UNESP/Presidente Prudente) Randal Farago (Faculdades Integradas FAFIBE) Resumo: Este trabalho aborda técnicas

Leia mais

Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining

Pós-Graduação Lato Sensu Especialização em Análise de Dados e Data Mining Pós-Graduação "Lato Sensu" Especialização em Análise de Dados e Data Mining Inscrições Abertas Início das Aulas: 24/03/2015 Dias e horários das aulas: Terça-Feira 19h00 às 22h45 Semanal Quinta-Feira 19h00

Leia mais

6 Construção de Cenários

6 Construção de Cenários 6 Construção de Cenários Neste capítulo será mostrada a metodologia utilizada para mensuração dos parâmetros estocásticos (ou incertos) e construção dos cenários com respectivas probabilidades de ocorrência.

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Uma proposta de gráfico de controle EWMA com dados sazonais

Uma proposta de gráfico de controle EWMA com dados sazonais Uma proposta de gráfico de controle EWMA com dados sazonais Leandro Callegari Coelho (UFSC) leandroah@hotmail.com Robert Wayne Samohyl (UFSC) samohyl@yahoo.com Resumo: A importância do controle estatístico

Leia mais

4 Avaliação Econômica

4 Avaliação Econômica 4 Avaliação Econômica Este capítulo tem o objetivo de descrever a segunda etapa da metodologia, correspondente a avaliação econômica das entidades de reservas. A avaliação econômica é realizada a partir

Leia mais

4 Arquitetura básica de um analisador de elementos de redes

4 Arquitetura básica de um analisador de elementos de redes 4 Arquitetura básica de um analisador de elementos de redes Neste capítulo é apresentado o desenvolvimento de um dispositivo analisador de redes e de elementos de redes, utilizando tecnologia FPGA. Conforme

Leia mais

A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA

A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA João Cirilo da Silva Neto jcirilo@araxa.cefetmg.br. CEFET-MG-Centro Federal de Educação Tecnológica de Minas Gerais-Campus IV, Araxá Av. Ministro Olavo Drumonnd,

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Encontrar grupos de objetos tal que objetos em um grupo são similares (ou relacionados) uns aos outros e diferentes de (ou não relacionados) a objetos em outros grupos Compreensão Agrupa documentos relacionados

Leia mais

Previsão de demanda em uma empresa farmacêutica de manipulação

Previsão de demanda em uma empresa farmacêutica de manipulação Previsão de demanda em uma empresa farmacêutica de manipulação Ana Flávia Brito Rodrigues (Anafla94@hotmail.com / UEPA) Larissa Pinto Marques Queiroz (Larissa_qz@yahoo.com.br / UEPA) Luna Paranhos Ferreira

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Data Mining: Conceitos e Técnicas

Data Mining: Conceitos e Técnicas Data Mining: Conceitos e Técnicas DM, DW e OLAP Data Warehousing e OLAP para Data Mining O que é data warehouse? De data warehousing para data mining Data Warehousing e OLAP para Data Mining Data Warehouse:

Leia mais

Clustering: K-means and Aglomerative

Clustering: K-means and Aglomerative Universidade Federal de Pernambuco UFPE Centro de Informática Cin Pós-graduação em Ciência da Computação U F P E Clustering: K-means and Aglomerative Equipe: Hugo, Jeandro, Rhudney e Tiago Professores:

Leia mais

1 Tipos de dados em Análise de Clusters

1 Tipos de dados em Análise de Clusters Curso de Data Mining Sandra de Amo Aula 13 - Análise de Clusters - Introdução Análise de Clusters é o processo de agrupar um conjunto de objetos físicos ou abstratos em classes de objetos similares Um

Leia mais

3 Estado da arte em classificação de imagens de alta resolução

3 Estado da arte em classificação de imagens de alta resolução 37 3 Estado da arte em classificação de imagens de alta resolução Com a recente disponibilidade de imagens de alta resolução produzidas por sensores orbitais como IKONOS e QUICKBIRD se tornou-se possível

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS Luciene Bianca Alves ITA Instituto Tecnológico de Aeronáutica Praça Marechal Eduardo Gomes, 50 Vila das Acácias

Leia mais

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis O objetivo deste texto é apresentar os principais procedimentos

Leia mais

MINERAÇÃO DE DADOS PARA PADRÕES DE SEQUENCIA

MINERAÇÃO DE DADOS PARA PADRÕES DE SEQUENCIA Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM MINERAÇÃO DE DADOS PARA PADRÕES DE SEQUENCIA Aluna: Cecília Henriques Devêza

Leia mais

3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS

3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS 3 ALGORITMOS GENÉTICOS : CONCEITOS BÁSICOS E EXTENSÕES VINCULADAS AO PROBLEMA DE MINIMIZAÇÃO DE PERDAS 3.1 - Conceitos Básicos Entendemos como algoritmo um conjunto predeterminado e bem definido de regras

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Algoritmo k Means Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) 2 Problema do Agrupamento Seja x = (x 1, x 2,,

Leia mais

A Estatística e o Mercado de Seguros

A Estatística e o Mercado de Seguros A Estatística e o Mercado de Seguros Semana de Estatística (SEMANEST) Vitor A. Ozaki Curitiba - 2007 Outline Apresentação Pessoal / Profissional Formação Acadêmica Histórico Profissional Carreira Profissional

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Análise de componentes principais (PCA)

Análise de componentes principais (PCA) Análise de componentes principais (PCA) Redução de dados Sumarizar os dados que contém muitas variáveis (p) por um conjunto menor de (k) variáveis compostas derivadas a partir do conjunto original. p k

Leia mais

Flavia Medeiros dos Anjos. Reorganização e Compressão de Dados Sísmicos DISSERTAÇÃO DE MESTRADO

Flavia Medeiros dos Anjos. Reorganização e Compressão de Dados Sísmicos DISSERTAÇÃO DE MESTRADO Flavia Medeiros dos Anjos Reorganização e Compressão de Dados Sísmicos DISSERTAÇÃO DE MESTRADO DEPARTAMENTO DE INFORMÁTICA Programa de Pós-Graduação em Informática Rio de Janeiro, agosto de 2007 Flavia

Leia mais

Sumário. Parte l. 1. Introdução à pesquisa qualitativa e quantitativa em marketing 1 1.1 Pesquisa qualitativa 1 1.2 Pesquisa quantitativa 3

Sumário. Parte l. 1. Introdução à pesquisa qualitativa e quantitativa em marketing 1 1.1 Pesquisa qualitativa 1 1.2 Pesquisa quantitativa 3 Sumário Parte l 1. Introdução à pesquisa qualitativa e quantitativa em marketing 1 1.1 Pesquisa qualitativa 1 1.2 Pesquisa quantitativa 3 2. Entrevistas 5 2.1 Tipos de entrevistas 8 2.2 Preparação e condução

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS

DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS DWARF DATAMINER: UMA FERRAMENTA GENÉRICA PARA MINERAÇÃO DE DADOS Tácio Dias Palhão Mendes Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica da FAPEMIG taciomendes@yahoo.com.br Prof.

Leia mais

Técnicas de Clustering: Algoritmos K-means e Aglomerative

Técnicas de Clustering: Algoritmos K-means e Aglomerative Técnicas de Clustering: Algoritmos K-means e Aglomerative Danilo Oliveira, Matheus Torquato Centro de Informática Universidade Federal de Pernambuco 9 de outubro de 2012 Danilo Oliveira, Matheus Torquato

Leia mais

Engenharia da Produção Projeto de Produto, QFD, FMEA e DoE DoE Dr. Egon Walter Wildauer

Engenharia da Produção Projeto de Produto, QFD, FMEA e DoE DoE Dr. Egon Walter Wildauer Tema DoE Projeto Curso Disciplina Tema Professor Pós-graduação Engenharia da Produção Projeto de Produto, QFD, FMEA e DoE DoE Dr. Egon Walter Wildauer Introdução O DoE Design of Experiments é uma ferramenta

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

ESTUDO DE PREVISÃO DE DEMANDA PARA EMPRESA DE EQUIPAMENTOS MÉDICOS DE DIAGNÓSTICO

ESTUDO DE PREVISÃO DE DEMANDA PARA EMPRESA DE EQUIPAMENTOS MÉDICOS DE DIAGNÓSTICO ESTUDO DE PREVISÃO DE DEMANDA PARA EMPRESA DE EQUIPAMENTOS MÉDICOS DE DIAGNÓSTICO Andréa Crispim Lima dekatop@gmail.com Manoela Alves Vasconcelos manoelavasconcelos@hotmail.com Resumo: A previsão de demanda

Leia mais

AVALIAÇÃO QUALITATIVA DE COST DRIVERS PELO MÉTODO AHP

AVALIAÇÃO QUALITATIVA DE COST DRIVERS PELO MÉTODO AHP AVALIAÇÃO QUALITATIVA DE COST DRIVERS PELO MÉTODO AHP Edson de Oliveira Pamplona, Dr. Escola Federal de Engenharia de Itajubá Av. BPS, 1303 Itajubá, MG CEP: 37500-000 e-mail: pamplona@iem.efei.br Prof.

Leia mais

UTILIZAÇÃO DO MÉTODO DE HOLT WINTERS PARA A PREVISÃO AGREGADA DE SANDÁLIAS FABRICADAS A PARTIR DE PNEUS INSERVÍVEIS

UTILIZAÇÃO DO MÉTODO DE HOLT WINTERS PARA A PREVISÃO AGREGADA DE SANDÁLIAS FABRICADAS A PARTIR DE PNEUS INSERVÍVEIS XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO. UTILIZAÇÃO DO MÉTODO DE HOLT WINTERS PARA A PREVISÃO AGREGADA DE SANDÁLIAS FABRICADAS A PARTIR DE PNEUS INSERVÍVEIS Tulio Franco de Souza (UEPA) tfsengprod@yahoo.com.br

Leia mais

http://www.publicare.com.br/site/5,1,26,5480.asp

http://www.publicare.com.br/site/5,1,26,5480.asp Página 1 de 7 Terça-feira, 26 de Agosto de 2008 ok Home Direto da redação Última edição Edições anteriores Vitrine Cross-Docking Assine a Tecnologística Anuncie Cadastre-se Agenda Cursos de logística Dicionário

Leia mais

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining

4. Que tipos de padrões podem ser minerados. 5. Critérios de classificação de sistemas de Data Mining. 6. Tópicos importantes de estudo em Data Mining Curso de Data Mining - Aula 1 1. Como surgiu 2. O que é 3. Em que tipo de dados pode ser aplicado 4. Que tipos de padrões podem ser minerados 5. Critérios de classificação de sistemas de Data Mining 6.

Leia mais

UNIVERSIDADE PRESBITERIANA MACKENZIE

UNIVERSIDADE PRESBITERIANA MACKENZIE UNIVERSIDADE PRESBITERIANA MACKENZIE MARCELO VIANA DONI ANÁLISE DE CLUSTER: MÉTODOS HIERÁRQUICOS E DE PARTICIONAMENTO São Paulo 4 MARCELO VIANA DONI ANÁLISE DE CLUSTER: MÉTODOS HIERÁRQUICOS E DE PARTICIONAMENTO

Leia mais

CBPF Centro Brasileiro de Pesquisas Físicas. Nota Técnica

CBPF Centro Brasileiro de Pesquisas Físicas. Nota Técnica CBPF Centro Brasileiro de Pesquisas Físicas Nota Técnica Aplicação de Física Médica em imagens de Tomografia de Crânio e Tórax Autores: Dário Oliveira - dario@cbpf.br Marcelo Albuquerque - marcelo@cbpf.br

Leia mais

Projeto de Redes Neurais e MATLAB

Projeto de Redes Neurais e MATLAB Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação

Leia mais

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014 PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA 09/abril de 2014 Considerações Estatísticas para Planejamento e Publicação 1 Circularidade do Método

Leia mais

Introdução. Capítulo 1

Introdução. Capítulo 1 Capítulo 1 Introdução Em computação, muitos problemas são resolvidos por meio da escrita de um algoritmo que especifica, passo a passo, como resolver um problema. No entanto, não é fácil escrever um programa

Leia mais

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

CAPÍTULO 1 INTRODUÇÃO 1.1 INTRODUÇÃO

CAPÍTULO 1 INTRODUÇÃO 1.1 INTRODUÇÃO CAPÍTULO 1 INTRODUÇÃO 1.1 INTRODUÇÃO Em quase todas as nossas atividades diárias precisamos enfrentar filas para atender as nossas necessidades. Aguardamos em fila na padaria, nos bancos, quando trafegamos

Leia mais

NECESSIDADES DE PREVISÃO DA CADEIA DE SUPRIMENTOS. Mayara Condé Rocha Murça TRA-53 Logística e Transportes

NECESSIDADES DE PREVISÃO DA CADEIA DE SUPRIMENTOS. Mayara Condé Rocha Murça TRA-53 Logística e Transportes NECESSIDADES DE PREVISÃO DA CADEIA DE SUPRIMENTOS Mayara Condé Rocha Murça TRA-53 Logística e Transportes Setembro/2013 Introdução Estimativas acuradas do volume de produtos e serviços processados pela

Leia mais

5 Extraindo listas de produtos em sites de comércio eletrônico

5 Extraindo listas de produtos em sites de comércio eletrônico 5 Extraindo listas de produtos em sites de comércio eletrônico Existem diversos trabalhos direcionadas à detecção de listas e tabelas na literatura como (Liu et. al., 2003, Tengli et. al., 2004, Krüpl

Leia mais

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining

Gestão da Informação. Gestão da Informação. AULA 3 Data Mining Gestão da Informação AULA 3 Data Mining Prof. Edilberto M. Silva Gestão da Informação Agenda Unidade I - DM (Data Mining) Definição Objetivos Exemplos de Uso Técnicas Tarefas Unidade II DM Prático Exemplo

Leia mais

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis

PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis PLATAFORMA URBANMOB Aplicativo para captura de trajetórias urbanas de objetos móveis Gabriel Galvão da Gama 1 ; Reginaldo Rubens da Silva 2 ; Angelo Augusto Frozza 3 RESUMO Este artigo descreve um projeto

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

EXTRAÇÃO DE CONHECIMENTO DA PLATAFORMA LATTES UTILIZANDO TÉCNICAS DE MINERAÇÃO DE DADOS: ESTUDO DE CASO POLI/UPE

EXTRAÇÃO DE CONHECIMENTO DA PLATAFORMA LATTES UTILIZANDO TÉCNICAS DE MINERAÇÃO DE DADOS: ESTUDO DE CASO POLI/UPE . EXTRAÇÃO DE CONHECIMENTO DA PLATAFORMA LATTES UTILIZANDO TÉCNICAS DE MINERAÇÃO DE DADOS: ESTUDO DE CASO POLI/UPE Trabalho de Conclusão de Curso Engenharia da Computação Aluno: Bruno Carlos Sales de Morais

Leia mais

5. EXPERIÊNCIAS E ANÁLISE DOS RESULTADOS. 5.1 - Os Programas de Avaliação

5. EXPERIÊNCIAS E ANÁLISE DOS RESULTADOS. 5.1 - Os Programas de Avaliação 36 5. EXPERIÊNCIAS E ANÁLISE DOS RESULTADOS 5.1 - Os Programas de Avaliação Programas de avaliação convencionais foram utilizados para análise de diversas configurações da arquitetura. Estes programas

Leia mais

Extração de Conhecimento a partir dos Sistemas de Informação

Extração de Conhecimento a partir dos Sistemas de Informação Extração de Conhecimento a partir dos Sistemas de Informação Gisele Faffe Pellegrini & Katia Collazos Grupo de Pesquisa em Eng. Biomédica Universidade Federal de Santa Catarina Jorge Muniz Barreto Prof.

Leia mais

SISTEMÁTICA PARA SELEÇÃO DE TÉCNICAS ESTATÍSTICAS APLICADA AO DESENVOLVIMENTO DE PRODUTOS

SISTEMÁTICA PARA SELEÇÃO DE TÉCNICAS ESTATÍSTICAS APLICADA AO DESENVOLVIMENTO DE PRODUTOS SISTEMÁTICA PARA SELEÇÃO DE TÉCNICAS ESTATÍSTICAS APLICADA AO DESENVOLVIMENTO DE PRODUTOS Creusa Sayuri Tahara Amaral Grupo ei2 NUMA EESC USP São Carlos Agenda Introdução Metodologia Seis sigma Design

Leia mais

Complemento IV Introdução aos Algoritmos Genéticos

Complemento IV Introdução aos Algoritmos Genéticos Complemento IV Introdução aos Algoritmos Genéticos Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações e

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

Otimização de Recuperação de Informação usando Algoritmos Genéticos

Otimização de Recuperação de Informação usando Algoritmos Genéticos Otimização de Recuperação de Informação usando Algoritmos Genéticos Neide de Oliveira Gomes, M. Sc., nog@inpi.gov.br Prof. Marco Aurélio C. Pacheco, PhD Programa de Doutorado na área de Métodos de Apoio

Leia mais

Mineração de Dados: Introdução e Aplicações

Mineração de Dados: Introdução e Aplicações Mineração de Dados: Introdução e Aplicações Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br Apresentação Luiz Merschmann Engenheiro

Leia mais

Classificação dos candidatos ao vestibular da FECILCAM via técnicas estatísticas multivariadas

Classificação dos candidatos ao vestibular da FECILCAM via técnicas estatísticas multivariadas Anais do CNMAC v. ISSN 1984-80X Classificação dos candidatos ao vestibular da FECILCAM via técnicas estatísticas multivariadas Tatiane C. da Silva Faculdade Estadual de Ciências e Letras de Campo Mourão

Leia mais

5 Estudo de caso: índice de cobrabilidade

5 Estudo de caso: índice de cobrabilidade 5 Estudo de caso: índice de cobrabilidade Neste capítulo, as metodologias abordadas nos capítulos 3 e 4 serão adaptadas e aplicadas ao contexto descrito no capítulo 1 (mensurar as variáveis que compõem

Leia mais

δ kt X kt β αp kt +ωfies kt +λfies kt p kt +ǫ kt (7-1) U ikt = δ kt +ε ikt (7-2)

δ kt X kt β αp kt +ωfies kt +λfies kt p kt +ǫ kt (7-1) U ikt = δ kt +ε ikt (7-2) 7 Forma Estrutural Nas seções anteriores, utilizamos uma abordagem em forma reduzida para investigar a existência de uma relação causal entre relaxamento de crédito estudantil e encargos escolares. Os

Leia mais

http://www.de.ufpb.br/~luiz/

http://www.de.ufpb.br/~luiz/ UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS Departamento de Estatística Luiz Medeiros http://www.de.ufpb.br/~luiz/ Vimos que é possível sintetizar os dados sob a forma de distribuições de frequências

Leia mais

3 Método de Monte Carlo

3 Método de Monte Carlo 25 3 Método de Monte Carlo 3.1 Definição Em 1946 o matemático Stanislaw Ulam durante um jogo de paciência tentou calcular as probabilidades de sucesso de uma determinada jogada utilizando a tradicional

Leia mais

BROMBERGER, Dalton (UTFPR) daltonbbr@yahoo.com.br. KUMMER, Aulison André (UTFPR) aulisonk@yahoo.com.br. PONTES, Herus³ (UTFPR) herus@utfpr.edu.

BROMBERGER, Dalton (UTFPR) daltonbbr@yahoo.com.br. KUMMER, Aulison André (UTFPR) aulisonk@yahoo.com.br. PONTES, Herus³ (UTFPR) herus@utfpr.edu. APLICAÇÃO DAS TÉCNICAS DE PREVISÃO DE ESTOQUES NO CONTROLE E PLANEJAMENTO DA PRODUÇÃO DE MATÉRIA- PRIMA EM UMA INDÚSTRIA PRODUTORA DE FRANGOS DE CORTE: UM ESTUDO DE CASO BROMBERGER, Dalton (UTFPR) daltonbbr@yahoo.com.br

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Inferência Estatística. Amostragem Estatística. Características das Amostragens Estatísticas. Tipos de Amostragens Estatísticas

Inferência Estatística. Amostragem Estatística. Características das Amostragens Estatísticas. Tipos de Amostragens Estatísticas Fenômenos Estatísticos Classificam-se em: Fenômenos Coletivos ou de Massa - Não podem ser definidos por uma simples observação (natalidade, mortalidade, preço médio de veículos usados em Curitiba, etc.).

Leia mais

1. Introdução. 1.1 Introdução

1. Introdução. 1.1 Introdução 1. Introdução 1.1 Introdução O interesse crescente dos físicos na análise do comportamento do mercado financeiro, e em particular na análise das séries temporais econômicas deu origem a uma nova área de

Leia mais

Modelo SARIMA: um estudo de caso sobre venda mensal de gasolina

Modelo SARIMA: um estudo de caso sobre venda mensal de gasolina Modelo SARIMA: um estudo de caso sobre venda mensal de gasolina Ana Julia Righetto 1 Luiz Ricardo Nakamura 1 Pedro Henrique Ramos Cerqueira 1 Manoel Ivanildo Silvestre Bezerra 2 Taciana Villela Savian

Leia mais

AULAS 13, 14 E 15 Correlação e Regressão

AULAS 13, 14 E 15 Correlação e Regressão 1 AULAS 13, 14 E 15 Correlação e Regressão Ernesto F. L. Amaral 23, 28 e 30 de setembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Aula anterior Organização e Recuperação de Informação(GSI521) Modelo vetorial- Definição Para o modelo vetorial, o

Leia mais

Renato Maia Silva. Redes Neurais Artificiais aplicadas à Detecção de Intrusão em Redes TCP/IP. Dissertação de Mestrado

Renato Maia Silva. Redes Neurais Artificiais aplicadas à Detecção de Intrusão em Redes TCP/IP. Dissertação de Mestrado Renato Maia Silva Redes Neurais Artificiais aplicadas à Detecção de Intrusão em Redes TCP/IP Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do grau de Mestre pelo

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

MODELAGEM E SIMULAÇÃO

MODELAGEM E SIMULAÇÃO MODELAGEM E SIMULAÇÃO Professor: Dr. Edwin B. Mitacc Meza edwin@engenharia-puro.com.br www.engenharia-puro.com.br/edwin Como Funciona a Simulação Introdução Assim como qualquer programa de computador,

Leia mais

AGRUPAMENTO DE CONJUNTOS DE INSTÂNCIAS: UMA APLICAÇÃO AO ENEM. Victor Marinho Furtado

AGRUPAMENTO DE CONJUNTOS DE INSTÂNCIAS: UMA APLICAÇÃO AO ENEM. Victor Marinho Furtado AGRUPAMENTO DE CONJUNTOS DE INSTÂNCIAS: UMA APLICAÇÃO AO ENEM Victor Marinho Furtado Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia de Sistemas e Computação, COPPE, da Universidade

Leia mais

KDD UMA VISAL GERAL DO PROCESSO

KDD UMA VISAL GERAL DO PROCESSO KDD UMA VISAL GERAL DO PROCESSO por Fernando Sarturi Prass 1 1.Introdução O aumento das transações comerciais por meio eletrônico, em especial as feitas via Internet, possibilitou as empresas armazenar

Leia mais

Mensuração do Desempenho do Gerenciamento de Portfólio de Projetos: Proposta de Modelo Conceitual

Mensuração do Desempenho do Gerenciamento de Portfólio de Projetos: Proposta de Modelo Conceitual Pedro Bruno Barros de Souza Mensuração do Desempenho do Gerenciamento de Portfólio de Projetos: Proposta de Modelo Conceitual Dissertação de Mestrado Dissertação apresentada ao Programa de Pósgraduação

Leia mais

Conceitos de Mineração de Dados na Web

Conceitos de Mineração de Dados na Web Capítulo 2 Conceitos de Mineração de Dados na Web Rafael Santos Resumo Já não é mais possível apresentar a Web como uma novidade, comentando sobre suas características básicas sua pervasividade e ubiqüidade

Leia mais

Vetor Quantização e Aglomeramento (Clustering)

Vetor Quantização e Aglomeramento (Clustering) (Clustering) Introdução Aglomeramento de K-partes Desafios do Aglomeramento Aglomeramento Hierárquico Aglomeramento divisivo (top-down) Aglomeramento inclusivo (bottom-up) Aplicações para o reconhecimento

Leia mais

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr Análise de Regressão Tópicos Avançados em Avaliação de Desempenho Cleber Moura Edson Samuel Jr Agenda Introdução Passos para Realização da Análise Modelos para Análise de Regressão Regressão Linear Simples

Leia mais

Introdução a Química Analítica. Professora Mirian Maya Sakuno

Introdução a Química Analítica. Professora Mirian Maya Sakuno Introdução a Química Analítica Professora Mirian Maya Sakuno Química Analítica ou Química Quantitativa QUÍMICA ANALÍTICA: É a parte da química que estuda os princípios teóricos e práticos das análises

Leia mais

PESQUISA OPERACIONAL. Fabiano F. T. dos Santos. Instituto de Matemática e Estatística

PESQUISA OPERACIONAL. Fabiano F. T. dos Santos. Instituto de Matemática e Estatística PESQUISA OPERACIONAL Fabiano F. T. dos Santos Instituto de Matemática e Estatística Origens da Pesquisa Operacional O termo pesquisa operacional é atribuído a A. P. Rowe, que, em 1938 na Grã-Bretanha,

Leia mais

Mineração de Dados em Grandes Bancos de Dados Geográficos

Mineração de Dados em Grandes Bancos de Dados Geográficos Programa de Ciência e Tecnologia para Gestão de Ecosistemas Ação "Métodos, modelos e geoinformação para a gestão ambiental Mineração de Dados em Grandes Bancos de Dados Geográficos Marcos Corrêa Neves

Leia mais

Balanceamento de Carga

Balanceamento de Carga 40 4. Balanceamento de Carga Pode-se entender por balanceamento de carga uma política a ser adotada para minimizar tanto a ociosidade de utilização de alguns equipamentos quanto a super utilização de outros,

Leia mais

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais.

tipos de métodos, técnicas de inteligência artificial e técnicas de otimização. Por fim, concluise com as considerações finais. 1. Introdução A previsão de vendas é fundamental para as organizações uma vez que permite melhorar o planejamento e a tomada de decisão sobre o futuro da empresa. Contudo toda previsão carrega consigo

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Introdução Aprendizagem de Máquina Alessandro L. Koerich Introdução Desde que os computadores foram inventados temos nos perguntado: Eles são capazes de aprender? Se pudéssemos programá-los para aprender

Leia mais

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO

MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO MINERAÇÃO DE DADOS EDUCACIONAIS: UM ESTUDO DE CASO APLICADO AO PROCESSO SELETIVO DO IFSULDEMINAS CÂMPUS MUZAMBINHO Fernanda Delizete Madeira 1 ; Aracele Garcia de Oliveira Fassbinder 2 INTRODUÇÃO Data

Leia mais

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder Comentário Geral: Prova muito difícil, muito fora dos padrões das provas do TCE administração e Economia, praticamente só caiu teoria. Existem três questões (4, 45 e 47) que devem ser anuladas, por tratarem

Leia mais

4 Aplicativo para Análise de Agrupamentos

4 Aplicativo para Análise de Agrupamentos 65 4 Aplicativo para Análise de Agrupamentos Este capítulo apresenta a modelagem de um aplicativo, denominado Cluster Analysis, dedicado à formação e análise de grupos em bases de dados. O aplicativo desenvolvido

Leia mais

Avaliação de Desempenho de Sistemas Discretos

Avaliação de Desempenho de Sistemas Discretos Avaliação de Desempenho de Sistemas Discretos Parte IV: Simulação Professor: Reinaldo Gomes reinaldo@dsc.ufcg.edu.br Parte 4 Simulação P A R T E Etapas básicas em um estudo de simulação Geração de números

Leia mais