ACOMPANHAMENTO TEMPORAL DE AGRUPAMENTOS DE SÉRIES TEMPORAIS BASEADO EM CARACTERÍSTICAS

Tamanho: px
Começar a partir da página:

Download "ACOMPANHAMENTO TEMPORAL DE AGRUPAMENTOS DE SÉRIES TEMPORAIS BASEADO EM CARACTERÍSTICAS"

Transcrição

1 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS Programa de Pós-Graduação em Informática ACOMPANHAMENTO TEMPORAL DE AGRUPAMENTOS DE SÉRIES TEMPORAIS BASEADO EM CARACTERÍSTICAS Ana Paula Serra Belo Horizonte 2011

2 Ana Paula Serra ACOMPANHAMENTO TEMPORAL DE AGRUPAMENTOS DE SÉRIES TEMPORAIS BASEADO EM CARACTERÍSTICAS Dissertação apresentada ao Programa de Pós-Graduação em Informática como requisito parcial para qualicação ao Grau de Mestre em Informática pela Pontifícia Universidade Católica de Minas Gerais. Orientador: Luis Enrique Zárate Belo Horizonte 2011

3 FICHA CATALOGRÁFICA Elaborado pela Biblioteca da Pontifícia Universidade Católica de Minas Gerais B422c Serra, Ana Paula Acompanhamento temporal de agrupamentos de séries temporais baseado em características / Ana Paula Serra. Belo Horizonte, f. : Il. Orientador: Luis Enrique Zárate Dissertação (Mestrado) Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-Graduação em Informática 1. Análise de séries temporais. 2. Bando de dadostemporais. 3. Processamento de dados. I. Zárate, Luis Enrique. II. Pontifícia Universidade Católica de Minas Gerais. Programa de Pós- Graduação em Informática. III. Título. CDU:

4

5 Dedico este trabalho ao meu pai que abriu mão de seus sonhos e de regalias para me propiciar as melhores oportunidades de ensino e educação. Com isto conseguiu enraizar em mim a grande importância da busca pelo conhecimento na vida e formação de um ser humano.

6 AGRADECIMENTOS A Deus por me amparar nos momentos difíceis, me dar força interior para superar as diculdades, mostrar os caminho nas horas incertas e me suprir em todas as minhas necessidades. Ao meu orientador Luis Enrique Zárate, por acreditar em mim, me mostrar o caminho da ciência, por ser exemplo de prossional dedicado à arte de lecionar. À minha família a qual amo muito, meu esposo Alexandre e meus lhos Gabriel e Rodrigo, pelo carinho, paciência e incentivo. Aos meus pais Ana e José Raimundo por enfrentar com coragem e perseverança as diculdades na criação e educação dos lhos. À minha segunda família Ana Carolina, Valentina, Matheus e Juliano pelo companheirismo e alegrias vividas juntos. Aos amigos que zeram parte desses momentos sempre me ajudando e incentivando. Aos funcionários do mestrado em informática da PUC-Minas, especialmente à Giovana pelo incentivo, boa vontade e gentileza dispensados. A todos os professores do mestrado pelo convívio e aprendizado.

7 O bater de asas de uma simples borboleta pode inuenciar o curso natural das coisas e, assim, talvez provocar um tufão do outro lado do mundo. Edward Norton Lorenz

8 RESUMO Neste estudo foi proposta uma metodologia de caracterização de séries temporais em BDST, para aplicação de análise de agrupamentos. Na caracterização das séries temporais foram utilizados os componentes de nível e tendência calculados através do modelo de suavização de Holt-Winters. Quanto às técnicas de agrupamento foram utilizadas as técnicas AGNES (Agrupamento Hierárquico Aglomerativo) e PAM (Agrupamento por Partição). Para aplicação dos experimentos uma BDST sintética foi gerada através da execução de um algoritmo desenvolvido no programa R. A metodologia permite responder questões como: os motivos de mudanças de registros/objetos entre grupos através dos atributos que mais inuenciam mudanças signicativas nas medidas de similaridade; os motivos levam ao surgimento ou extinção de grupos de uma janela temporal para outra e o tempo de validade do conhecimento. Palavras-chave: Mineração de dados temporal. Séries temporais. Base de dados de séries temporais. Caracterização de séries temporais. Janelas de tempo.

9 ABSTRACT This study proposed a methodology for characterization of time series in BDST for application of cluster analysis. The characterization of the time series were used for level and trend components calculated using the model of Holt-Winters smoothing. The techniques of clustering techniques were used AGNES (Agglomerative Hierarchical Clustering) and PAM (Partition-Group). For the purposes of the experiments was a synthetic BDST generated by an algorithm developed in the program R. The methodology allows answering questions such as: the reasons for changes in records / objects between groups through the attributes that most inuence signicant changes in measures of similarity, the reasons leading to the emergence or extinction of groups of one window to another time and expiration time knowledge. Keywords: Temporal data mining. Time series. Database of time series. Characterization of time series. Time windows.

10 LISTA DE FIGURAS FIGURA 1 Exemplo 1 de acompanhamento de agrupamentos FIGURA 2 Exemplo 2 de acompanhamento de agrupamentos FIGURA 3 Exemplo de denição de janelas de tempo FIGURA 4 Esquema da metodologia proposta FIGURA 5 Arquitetura do gerador FIGURA 6 Banner e dendograma da Janela FIGURA 7 Grácos do agrupamento PAM para a Janela FIGURA 8 Grácos das amplitudes das siluetas médias FIGURA 9 Grácos das amplitudes das siluetas médias

11 LISTA DE TABELAS TABELA 1 Parâmetros de entrada para geração e segmentação da BDST TABELA 2 Simulação 1 (janela tamanho 12) TABELA 3 Simulação 2 (janela tamanho 6) TABELA 4 Amostra da movimentação dos objetos entre janelas TABELA 5 Medidas descritivas dos grupos por janela de tempo TABELA 6 Comparação do agrupamento na aplicação das técnicas AGNES (limiar = média dos Height s + 1 desvio padrão) e PAM. Média das diferenças= TABELA 7 Comparação do agrupamento na aplicação das técnicas AGNES (limiar = média dos Height s + 2 desvios padrões) e PAM. Média das diferenças=

12 SUMÁRIO 1 INTRODUÇÃO Considerações iniciais O problema da manipulação de dados temporais Identicação e caracterização do problema Motivação Objetivos Justicativa Principais contribuições do Trabalho Organização do trabalho REVISÃO BIBLIOGRÁFICA Mineração de dados temporais - MDT METODOLOGIA PARA CARACTERIZAÇÃO DE SÉRIES TEMPO- RAIS EM BDST Denição formal de uma BDST Denição da amplitude da janela temporal Escolha do modelo da série temporal Caracterização das séries temporais da BDST Escolha da técnica de agrupamentos Visão geral da metodologia SIMULAÇÕES E EXPERIMENTOS Gerador da BDST multivariada sintética Geração e experimentos da BDST Segmentação da BDST em tamanhos de janelas pré-estabelecidos para teste Extração de características das séries Escolha do tamanho de janela ideal Acompanhamento da movimentação de objetos entre grupos Acompanhamento evolutivo dos agrupamento

13 5 CONCLUSÕES REFERÊNCIAS ANEXO A -- ALGORITMOS DESENVOLVIDOS EM R

14 11 1 INTRODUÇÃO 1.1 Considerações iniciais O uso de mineração de dados (data mining) tem avançado em diversas áreas de conhecimento, tanto no meio acadêmico quanto na indústria. Esta atividade tornou-se essencial em áreas como: marketing, nanças, telecomunicações, saúde, comércio, dentre outras. Descobrir a partir de bases de dados o conhecimento que ainda não é óbvio proporciona um efetivo suporte à tomada de decisão, auxiliando na solução de problemas e otimização de processos. No mundo dos negócios, ter acesso a esse conhecimento direciona o planejamento de estratégias acompanhando o mercado sem perder a chance de se antecipar aos desejos e anseios do consumidor. A mineração de dados é denida como uma das atividades que fazem parte do processo de Descoberta de Conhecimento em Banco de Dados (KDD - Knowledge Discovery Database), o qual se inicia a partir da denição e entendimento de um domínio de problema, e através da descoberta de conhecimento útil objetiva atender expectativas do usuário (FAYYAD et al., 1996). Para isso, são coletados dados históricos acerca do domínio do problema e realizado um pré-processamento para posterior aplicação das técnicas de mineração de dados e interpretação do conhecimento extraído O problema da manipulação de dados temporais Nos últimos anos tem-se observado um acelerado crescimento na capacidade de armazenamento de dados e este aumento tem permitido o registro de informações por longos períodos de tempo. Esta situação introduz um caráter temporal aos dados, e com isso passa-se a manipular gigantescos volumes de dados com históricos que podem ser explorados para melhor entendimento do domínio do problema. Dentro deste contexto houve uma extensão da mineração de dados convencional para a Mineração de Dados Temporal (MDT) que na sua essência consiste na mineração de base de dados contendo dados seqüenciais. Segundo Roddick et al. (2002), a MDT trouxe a capacidade de minerar atividades e trajetórias mais do que simplesmente estados denidos ou instantes de tempo. A MDT torna o conhecimento extraído mais completo. Note que a base de dados de sequências tratada na MDT pode ser indexada por um índice ou por algum atributo ordenável, que não precisa ser necessariamente o tempo, como por exemplo podemos citar dados sequênciais de texto, sequências genéticas, sequências de

15 12 proteínas, dentre outras Identicação e caracterização do problema De acordo com o que foi exposto até o momento vimos que surge a necessidade de algoritmos/técnicas, procedimentos e métodos para mineração de dados, capazes de lidar com informações temporais. Os algoritmos convencionais de mineração de dados precisam de adaptações para tratar bases de dados temporais, ou os dados temporais precisam ser pré-processados e convertidos em valores pontuais, congelados ou sumarizados para um instante de tempo `t', antes da aplicação das técnicas convencionais de mineração de dados. Quando técnicas de agrupamento são aplicadas sobre BDST o principal aspecto a ser considerado é a caracterização das séries e, portanto, é preciso extrair características que representem a essência de uma série. As melhores medidas de caracterização de uma série são extraídas de estruturas presentes em um modelo generalizado de uma série temporal, que é formado basicamente pelas seguintes componentes: nível, tendência, sazonalidade e periodicidade. Para apresentar o método proposto, a Figura 1 ilustra a proposta do nosso trabalho. Suponha uma BDST multivariada contendo registros que possuam atributos expressos em séries temporais. Então caracteriza-se estas séries extraindo os componentes de média e tendências e aplicando-se posteriormente a técnica de agrupamento para dois intervalos de tempo, Janela 1 e Janela 2. Cada ponto no gráco representa um registro da nossa base de dados visualizados através dos dois primeiros componentes principais. Observando os grácos da Figura 1 percebe-se que da Janela 1 para a Janela 2 houve uma movimentação de objetos entre grupos. Percebe-se que também houve mudanças nas formas dos grupos (tamanho e posição). Analisar o que motiva a evolução dos agrupamentos ao longo do tempo pode gerar conhecimento útil dentro do domínio do problema que está sendo estudado. Na Figura 2 mostra a situação onde há uma movimentação de objetos entre grupos de uma janela para outra e a formação de um novo grupo. Isto signica que os padrões descobertos para a janela 1 tiveram somente validade dentro do intervalo de tempo da janela 1. Esta situação remete a um novo problema que trata sobre a duração do conhecimento extraído. Neste caso a escolha de um tamanho de janela que permita observar mudanças nos padrões descobertos num primeiro momento é crucial para determinação da regularidade nas mudanças temporais dos padrões descobertos. Devido à carência de base de dados reais completas e abrangentes que permitam análise da nossa proposta, foi necessário partir para a construção de um gerador de BDST multivariada sintética.

16 13 Figura 1: Exemplo 1 de acompanhamento de agrupamentos em duas janelas de tempo. Fonte: Elaborada pela autora. Através de roteiros, é possível denir o número de atributos da base de dados, o número de pontos de observação no tempo e o número de registros a serem considerados. Para geração da base sintética foi utilizado o ambiente R (R Development Core Team, 2006). Figura 2: Exemplo 2 de acompanhamento de agrupamentos em duas janelas de tempo. Fonte: Elaborada pela autora. 1.2 Motivação Em trabalhos de mineração de séries temporais utilizando técnicas de agrupamento, percebe-se a ênfase dada na discussão da melhor maneira de calcular medidas de simi-

17 14 laridades/dissimilaridades (LIAO, 2005). Abordagens que generalizem esta questão ainda estão em discussão, e a conclusão que a maioria dos estudos chega é de que esta escolha depende do domínio e estrutura da base de dados (LIAO, 2005). O presente estudo contribui nesta direção apresentado uma metodologia para agrupamento de séries temporais por janelas através da caracterização das séries, baseada nas componentes estruturais de um modelo generalizado. A similaridade será medida baseada nas características (nível e tendência) extraídas de cada série. Com isto, é possível entender a dinâmica de movimentação dos grupos e objetos ao longo do tempo, buscando subsídios para explicação e previsão de fenômenos. 1.3 Objetivos Propor uma metodologia para acompanhamento dos agrupamentos de características extraídas de uma BDST multivariável, entre janelas de tempo. A metodologia proposta seguirá as seguintes etapas: a) Escolha do modelo para representação da série temporal; b) Extração de características das séries temporais; c) Desenvolvimento de um gerador de BDST. A metodologia proposta neste estudo pode ajudar a responder questões como: a) Quais são os motivos de mudanças de registros/objetos entre grupos? Quais são os atributos que mais inuenciam mudanças signicativas nas medidas de similaridade? b) Quais motivos levam ao surgimento ou extinção de grupos de uma janela temporal para outra? c) Qual o tempo de validade do conhecimento? Ou seja, até quando um padrão extraído da análise de agrupamento é válido. 1.4 Justicativa Como pode ser observado através da extensa literatura, a discussão sobre metodologias para manipulação de dados temporais é uma área de pesquisa com história e com forte tendência de crescimento (Liu et al. (2001); Laxman e Sastry (2006); Wang, Wirth e Wang (2007); Tsumoto e Hirano (2008); Böttcher et al. (2009)).

18 Principais contribuições do Trabalho Ao nal do trabalho a expectativa é que uma metodologia para agrupamento temporal de BDST baseado na caracterização das séries temporais seja desenvolvida para dar suporte na busca de respostas às questões citadas acima, e que seja um direcionamento para estudos futuros na área de MDT. 1.6 Organização do trabalho Este trabalho está dividido da seguinte forma: No capítulo 2 a revisão bibliográca é apresentada; No capítulo 3 será apresentada a metodologia para caracterização de séries temporais em BDST; No capítulo 4 são mostrados e discutidos resultados de experimentos e no capítulo 5 comentários nais e conclusões são apresentados.

19 16 2 REVISÃO BIBLIOGRÁFICA 2.1 Mineração de dados temporais - MDT Uma abordagem para MDT surgiu de uma extensão do trabalho apresentado em Agrawal, Imielinski e Swami (1993), no qual foi proposto o algoritmo Apriori, que descobre associações entre itens de compra, mas que inicialmente não foi considerado nenhum tipo de ordenação nos dados. A extensão do algoritmo Apriori que considera a ordenação dos itens foi proposta em Agrawal e Srikant (1995), com o nome de mineração de sequências. Um segundo trabalho para identicar padrões temporais em dados sequenciais foi proposto por Mannila, Toivonen e Verkamo (1997) para descoberta de episódios (eventos) frequentes. A proposta foi aplicada na área de telecomunicações sobre base de dados contendo uxos de sinais de seqüências de alarmes, onde pode ser observado que os estados dessa rede seguem um comportamento dinâmico temporal. O objetivo era melhorar o entendimento das relações entre diferentes tipos de alarmes, ou seja, ser possível de prever um congestionamento e melhorar a eciência do gerenciamento deste tipo de rede. Com o crescente interesse da comunidade cientíca no reconhecimento do valor temporal dos dados, surgiram diversos trabalhos de MDT tratando não somente a ordenação seqüencial dos dados, mas o valor temporal propriamente dito contido nos históricos. Dentre os estudos iniciais de manipulação de históricos ou séries temporais, o trabalho de Last et al. (2001) destaca-se como uma importante contribuição, ao apresentar uma metodologia para aplicação de mineração de dados sobre séries temporais. Esta metodologia sugere que as etapas convencionais de um processo de mineração de dados, aplicadas a uma base contendo dados coletados para um determinado instante ou intervalo de tempo, chamado por vários autores como base de dados estática, fossem reestruturadas para a mineração de dados em uma BDST (Base de Dados de Séries Temporais). O processo inclui as etapas de limpeza, ltragem de séries temporais e identicação dos atributos mais relevantes para extração de regras de associação que possam ser usados para predizer o comportamento das séries temporais. Esta metodologia foi aplicada em dois tipos de domínio, mercado de ações e metereologia. Apesar do foco desse trabalho ser a aplicação da técnica de regras de associação em uma BDST, este estabelece uma conceituação de como minerar séries temporais aproveitando da teoria da análise estatística. O trabalho de Lin, Orgun e Williams (2002) traz uma visão simplicada do processo de MDT e alguns fundamentos para manipular dados temporais. Os autores discutem

20 17 sobre os dois problemas fundamentais da MDT, que é o cálculo de similaridades entre séries temporais e a identicação de periodicidades nos históricos de dados. Ao nal foi lançado o desao pela busca de uma teoria geral para MDT que representaria um marco nesta área, visto que os trabalhos, até então, não possuíam uma fundamentação teórica consolidada. Em Last, Kandel e Bunke (2004), os autores apresentaram um livro importante para estruturação da área contendo um apanhado de artigos relevantes que apresentam propostas para os maiores desaos da MDT. A partir deste trabalho surgiram novas categorizações, onde pesquisadores acabaram induzindo o aparecimento de subáreas dentro da MDT. Desde então a comunidade cientíca se organiza por estas subáreas, unindo forças, empenho na busca pela consolidação e globalização das teorias da MDT. Baseado na literatura, Roddick et al. (2002) propuseram uma taxonomia para MDT considerando três dimensões: a) o tipo de dado; b) a ordenação nos dados e c) o paradigma de mineração utilizado. Quanto ao tipo de dado foram consideradas três divisões: abordagens que lidam com valores escalares, com eventos e com resultados de mineração. Este último também chamado de mineração de alta ordem (RODDICK et al., 2008), considerado pelos autores como um desao da MDT. Para a dimensão correspondente à ordenação dos dados foram denidas duas divisões: métodos que reetem a ordenação, isto é, análise de sequências, e aqueles que ignoram a ordenação dos fatos/eventos. Para a dimensão paradigma de mineração foram criadas duas divisões: trabalhos para descoberta de regras de associação temporal e trabalhos de classicação. Para os autores a classicação pode ser supervisionada e não-supervisionada. Esta última correspondente à técnica de agrupamentos. Além dos desaos na MDT, de encontrar formas ecientes de armazenamento e representação das séries temporais, e da formalização de aplicações para classicação e agrupamento, os autores apontam que outro grande desao da área de MDT está inserido no contexto de comparar séries temporais e descobrir similaridades entre elas. Levando em consideração a taxonomia apresentada por Roddick et al. (2002) o presente trabalho está inserido na categoria do paradigma de mineração 'classicação', e pelo tipo de dado 'resultado de mineração'. Neste trabalho o foco principal é propor uma metodologia que permita o acompanhamento evolutivo de modelos de agrupamentos e seus objetos, após a aplicação de uma classicação não-supervisionada sobre BDST a partir da caracterização das séries temporais que compõem a base. Dentro do contexto do nosso trabalho, a mais importante contribuição é apresentada por Liao (2005). O autor fez uma revisão de metodologias aplicadas na análise de

21 18 agrupamentos sobre séries temporais. A maioria dos estudos apresentados está restrito às séries temporais univariadas, e a distinção entre estes está em como é calculada a medida de similaridade/dissimilaridade entre as séries, o que depende do tipo e das características da BDST. Isso indica que o aspecto mais importante na aplicação de técnicas de agrupamento, sobre séries temporais, está em compreender as características especícas do domínio e a estruturação dos dados para então encontrar uma apropriada medida de similaridade nesse contexto. As abordagens levantadas por Liao (2005) foram organizados em três categorias: 1) análise de agrupamentos aplicada diretamente sobre a BDST, com algumas modicações nos algoritmos de mineração de dados convencionais; 2) análise de agrupamentos sobre características extraídas das séries temporais; e 3) análise de agrupamentos baseada em modelos construídos a partir da BDST. Na primeira categoria tem-se a proposta de manipular diretamente os dados originais, o que acarreta em um custo computacional muito alto na aplicação das técnicas de MDT. Na terceira categoria a proposta foi utilizar informações de modelos (coecientes, resíduos, etc), o que não é muito consistente já que estes coecientes não tem relação direta com o domínio do problema. Muitos coecientes são meramente ajustes dos modelos para os dados históricos. Dentre as três categorias a segunda, que abrange as aplicações de análise de agrupamentos baseada em características extraídas das séries temporais, são as mais interessantes, pois com a síntese dos dados ganha-se no custo computacional e se bem escolhidas, estas características extraídas podem representar corretamente a informação contida na BDST. Outras formas de lidar com o problema do custo computacional no processamento de uma BDST consistem no uso de técnicas para redução da dimensionalidade. Entre os principais trabalhos podemos citar: Megalooikonomou, Li e Wang (2004); Chu, Tseng e Liang (2008) e Al-Naymat e Taheri (). O trabalho de Megalooikonomou, Li e Wang (2004) propõe uma técnica de redução de dimensionalidade na análise de séries temporais que utiliza a técnica de quantização vetorial para encontrar o código mais próximo (baseado numa medida de distância) da sequência-chave para representar cada segmento. O autor compara os resultado obtidos com a utilização de Análise de Componentes Principais (ACP) onde cada segmento é representado por um valor escalar constante. Nas simulações geralmente a técnica proposta apresenta um desempenho melhor que a técnica de ACP. O trabalho de Chu, Tseng e Liang (2008) propõe um algoritmo chamado THUI (Temporal High Utility Itemsets)- Minepara minerar alto uxo de dados com eciência e efetividade, baseando-se na escolha de alguns registros candidatos que generali-

22 19 zem um grupo semelhante. Sobre várias condições, os experimentos utilizando o THUI- Minemostra uma signicativa melhora de desempenho em relação a outros algoritmos existentes. E o último trabalho citado (AL-NAYMAT; TAHERI, ), mostra os efeitos da redução de dimensionalidade no cálculo de similaridades entre séries temporais. São feitos comparativos da precisão de três métodos de redução de dimencionalidade, Random Projection (RP), Down sampling (DS)e Averaging (Avg), ma utilização de duas medidas de similaridade Dynamic Time Warping (DTW)e Distância Euclidiana. As simulações mostram que é possível manter uma alta precisão na busca de similaridades entre séries temporais, mesmo com uma signicativa redução da dimensionalidade. Neste capítulo foi apresentado um histórico com a evolução da área MDT cuja origem surgiu na análise de sequências até chegar à exploração de todo valor temporal contido nos dados. Dentro deste contexto surgiram propostas de categorização dos trabalhos da área de MDT em geral como também especicamente da subárea que trata somente da análise de agrupamentos de séries temporais. Atualmente é nesta subárea que estão inseridos os maiores desaos da MDT e onde vem surgindo um volume grande de trabalhos publicados.

23 20 3 METODOLOGIA PARA CARACTERIZAÇÃO DE SÉRIES TEMPORAIS EM BDST 3.1 Denição formal de uma BDST A presente seção trata da caracterização de séries temporais em uma BDST multivariada, que serão subdivididas em janelas de tempo pré-denidas para posterior aplicação da análise de agrupamentos. Este trabalho considera que a BDST está formada por séries temporais cujos dados são coletados nos mesmos períodos de tempo podendo ser regulares ou irregulares. A base de dados temporal multivariada considerada nesse estudo pode ser expressa da seguinte forma de acordo com a equação 1: Z t 11 Z t 12 Z t 1M Z t 21 Z t 22 Z t 2M [Z] = onde, i = 1,..., N, j = 1,..., M. (1) Z t N1 Z t N2 Z t NM com Z t ij = {Z 1 ij, Z 2 ij,..., Z T ij e onde N representa o número de indivíduos (ou exemplos) e M o número de atributos. Cada elemento de [Z] corresponde a uma observação do exemplo i para o atributo j e cada valor de t = 1,..., T corresponde aos períodos de observação da série. Note que, o número de elementos da base de dados Z é dado por NxMxT. A abordagem proposta nesse trabalho consiste em dividir as séries Z t ij em janelas de tempo w h do conjunto de janelas W = {w 1, w 2,..., w H }, para então caracterizá-las e aplicar técnicas de agrupamentos para acompanhamento evolutivo dos grupos. Cada série Z t ij será dividida em janelas de tempo que podem ser de amplitude iguais ou diferentes. Dentro do intervalo original da série, t = 1,..., T, haverá pontos de corte denidos pelo conjunto de janelas W. As características a serem extraídas destas séries para composição do vetor de características que as represente será determinado para cada janela w h. Dessa forma Z ijh corresponde ao vetor de características de cada série Z t ij, onde h representa a janela temporal w h. O conjunto destes vetores Z ijh irá compor os dados de entrada para a aplicação de técnicas de agrupamentos. A técnica de agrupamento será aplicada ao conjunto de vetores para as `H' janelas o que permite acompanhar a evolução dos grupos.

24 21 Pelo exposto acima quatro procedimentos precisam ser adotados: 1) Denição da amplitude da janela temporal; 2) Escolha do modelo de série temporal; 3) Caracterização das séries temporais da BDST; e 4) Escolha da técnica de agrupamentos. 3.2 Denição da amplitude da janela temporal A forma de determinação da amplitude das janelas w h pode variar de acordo com a variação dos dados, o domínio do problema e a disponibilidade de informações a respeito do banco de dados em análise. Tendo em vista que o objetivo desta fase de subdivisão da BDST em janelas é a busca por pontos de corte no tempo, onde há mudanças importantes que são de interesse para a análise, ter informações acerca do contexto pode dar uma noção da periodicidade das variações e, portanto, da amplitude das janelas. Para ilustrar uma idéia de possível escolha da amplitude das janelas, através da variação dos dados, observemos uma BDST contendo as séries série-1, série-2, série- 3 e série-4, ver Figura 3. Um critério para escolha da amplitude da janela w h pode ser estabelecido a partir da identicação das séries de atributos categóricos com menor variabilidade no tempo. E dentre estas séries categóricas escolher aquela que mais varia, pensando que dados categóricos (como por exemplo atributos de perl) quando variam provavelmente acarretará em mudanças nos outros atributos mais variantes no tempo. No exemplo da Figura 3 as séries categórias seriam série-3e série-4, sendo que, dentre as duas a que mais varia é a série-3que será a escolhida para denir a amplitude das janelas. Figura 3: Exemplo de denição de janelas de tempo. Fonte: Elaborada pela autora. Uma outra forma de escolher as janelas de tempo através da análise do domínio do problema e da disponibilidade de informações a respeito da base de dados pode se dar pela xação de uma amplitude para todas as janelas, coerentes com o contexto. Como por exemplo, no caso de uma BDST com valores mensais por um período maior que dois anos, é coerente a escolha de janelas semestrais, que comumente é considerado um período suciente para que ocorram variações signicativas. No caso de haver disponibilidade de

25 22 informações a respeito do domínio, que indiquem uma melhor subdivisão destas séries de acordo com seus períodos de mudança, isto levará a uma melhor exploração da base de dados. 3.3 Escolha do modelo da série temporal Na área de análise de séries temporais existem vários tipos de modelos que descrevem o comportamento de uma série temporal. A escolha do melhor modelo varia com os objetivos, as propriedades dos dados e a quantidade de séries a serem manipuladas. Basicamente, estes modelos se dividem em duas categorias segundo o número de parâmetros envolvidos: (i) modelos paramétricos que possuem um número nito de parâmetros, e a análise é feita no domínio temporal e (ii) modelos não-paramétricos que envolvem um número innito de parâmetros e analisam a série no domínio das freqüências. Os modelos não-paramétricos são mais utilizados na investigação dos mecanismos geradores da série temporal, sendo muito útil na identicação de periodicidades relevantes nos dados. Enquanto isso os modelos paramétricos são os mais adequados para caracterizar e fazer previsões de uma série temporal (MORETTIN; TOLOI, 2006). Dentro da categoria de modelos paramétricos os mais utilizados são os modelos de erro (ou de regressão), os modelos ARIMA (Box e Jenkins), os modelos de suavização exponencial, os modelos estruturais e os modelos não-lineares. Com exceção dos modelos de suavização exponencial, todos os outros partem do princípio de que uma série temporal tem a forma geral dada por Z t = f t + a t, composta por uma função do tempo f t somada a um ruído a t. A variação nas metodologias está nas suposições que se faz sobre os dados que implicam na denição de f t. Como por exemplo, suposições sobre as distribuições de probabilidade dos dados ou/e existência de independência entre as observações. Estas suposições acabam introduzindo limitações na validade dos modelos. Por outro lado, os modelos de suavização exponencial não fazem nenhum tipo de suposição sobre os dados que compõem a série. Estes se baseiam somente na ideia de que os dados do passado formam o padrão de comportamento da série, e este padrão é descoberto por meio da suavização da aleatoriedade da série. Isto signica que, se for possível retirar toda a interferência dos ruídos aleatórios da série temporal, será possível observar o padrão básico inserido nos dados. Um dos modelos de suavização mais completos e muito utilizado na prática (JR; DIAZ-SAIZ, 2008) é o de Holt-Winters (WINTERS, 1960), que associa a cada componente do padrão da série (nível (µ t ), tendência (T t ) e sazonalidade (F t )) uma constante de suavização. O modelo de Holt-Winters é de fácil entendimento, possui custo computacional

6 Construção de Cenários

6 Construção de Cenários 6 Construção de Cenários Neste capítulo será mostrada a metodologia utilizada para mensuração dos parâmetros estocásticos (ou incertos) e construção dos cenários com respectivas probabilidades de ocorrência.

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática

Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática Pesquisa com Professores de Escolas e com Alunos da Graduação em Matemática Rene Baltazar Introdução Serão abordados, neste trabalho, significados e características de Professor Pesquisador e as conseqüências,

Leia mais

4 Avaliação Econômica

4 Avaliação Econômica 4 Avaliação Econômica Este capítulo tem o objetivo de descrever a segunda etapa da metodologia, correspondente a avaliação econômica das entidades de reservas. A avaliação econômica é realizada a partir

Leia mais

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR 6LPXODomR GH6LVWHPDV )HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR #5,6. Simulador voltado para análise de risco financeiro 3RQWRV IRUWHV Fácil de usar. Funciona integrado a ferramentas já bastante conhecidas,

Leia mais

Módulo 4. Construindo uma solução OLAP

Módulo 4. Construindo uma solução OLAP Módulo 4. Construindo uma solução OLAP Objetivos Diferenciar as diversas formas de armazenamento Compreender o que é e como definir a porcentagem de agregação Conhecer a possibilidade da utilização de

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

ROTEIRO PARA ELABORAÇÃO DE PROJETOS

ROTEIRO PARA ELABORAÇÃO DE PROJETOS APRESENTAÇÃO ROTEIRO PARA ELABORAÇÃO DE PROJETOS Breve histórico da instituição seguido de diagnóstico e indicadores sobre a temática abrangida pelo projeto, especialmente dados que permitam análise da

Leia mais

3 Metodologia para Segmentação do Mercado Bancário

3 Metodologia para Segmentação do Mercado Bancário 3 Metodologia para Segmentação do Mercado Bancário Este capítulo descreve a metodologia proposta nesta dissertação para a segmentação do mercado bancário a partir da abordagem post-hoc, servindo-se de

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software PROCESSO DE DESENVOLVIMENTO DE SOFTWARE Introdução Modelos de Processo de Desenvolvimento de Software Os modelos de processos de desenvolvimento de software surgiram pela necessidade de dar resposta às

Leia mais

PLANEJAMENTO DA MANUFATURA

PLANEJAMENTO DA MANUFATURA 58 FUNDIÇÃO e SERVIÇOS NOV. 2012 PLANEJAMENTO DA MANUFATURA Otimizando o planejamento de fundidos em uma linha de montagem de motores (II) O texto dá continuidade à análise do uso da simulação na otimização

Leia mais

FLUXOGRAMA DA PESQUISA

FLUXOGRAMA DA PESQUISA FLUXOGRAMA DA PESQUISA Desde a preparação até a apresentação de um relatório de pesquisa estão envolvidas diferentes etapas. Algumas delas são concomitantes; outras são interpostas. O fluxo que ora se

Leia mais

3 Classificação. 3.1. Resumo do algoritmo proposto

3 Classificação. 3.1. Resumo do algoritmo proposto 3 Classificação Este capítulo apresenta primeiramente o algoritmo proposto para a classificação de áudio codificado em MPEG-1 Layer 2 em detalhes. Em seguida, são analisadas as inovações apresentadas.

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

GUIA DE REDAÇÃO PARA TRABALHO DE EM974

GUIA DE REDAÇÃO PARA TRABALHO DE EM974 GUIA DE REDAÇÃO PARA TRABALHO DE EM974 CONSIDERAÇÕES GERAIS O objetivo deste documento é informar a estrutura e a informação esperadas num texto de Trabalho de Graduação. O conteúdo do texto deverá ser

Leia mais

Este capítulo é divido em duas seções, a primeira seção descreve a base de

Este capítulo é divido em duas seções, a primeira seção descreve a base de 30 3. Metodologia Este capítulo é divido em duas seções, a primeira seção descreve a base de dados utilizada, identificando a origem das fontes de informação, apresentando de forma detalhada as informações

Leia mais

ISO/IEC 12207: Gerência de Configuração

ISO/IEC 12207: Gerência de Configuração ISO/IEC 12207: Gerência de Configuração Durante o processo de desenvolvimento de um software, é produzida uma grande quantidade de itens de informação que podem ser alterados durante o processo Para que

Leia mais

4 Arquitetura básica de um analisador de elementos de redes

4 Arquitetura básica de um analisador de elementos de redes 4 Arquitetura básica de um analisador de elementos de redes Neste capítulo é apresentado o desenvolvimento de um dispositivo analisador de redes e de elementos de redes, utilizando tecnologia FPGA. Conforme

Leia mais

5. EXPERIÊNCIAS E ANÁLISE DOS RESULTADOS. 5.1 - Os Programas de Avaliação

5. EXPERIÊNCIAS E ANÁLISE DOS RESULTADOS. 5.1 - Os Programas de Avaliação 36 5. EXPERIÊNCIAS E ANÁLISE DOS RESULTADOS 5.1 - Os Programas de Avaliação Programas de avaliação convencionais foram utilizados para análise de diversas configurações da arquitetura. Estes programas

Leia mais

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental

Ajuda ao SciEn-Produção 1. 1. O Artigo Científico da Pesquisa Experimental Ajuda ao SciEn-Produção 1 Este texto de ajuda contém três partes: a parte 1 indica em linhas gerais o que deve ser esclarecido em cada uma das seções da estrutura de um artigo cientifico relatando uma

Leia mais

4 Implementação e Resultados Experimentais

4 Implementação e Resultados Experimentais 4 Implementação e Resultados Experimentais Com o objetivo de fazer a criação automática de visões materializadas, ou seja, prover uma solução on-the-fly para o problema de seleção de visões materializadas,

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

Profissionais de Alta Performance

Profissionais de Alta Performance Profissionais de Alta Performance As transformações pelas quais o mundo passa exigem novos posicionamentos em todas as áreas e em especial na educação. A transferência pura simples de dados ou informações

Leia mais

11 de maio de 2011. Análise do uso dos Resultados _ Proposta Técnica

11 de maio de 2011. Análise do uso dos Resultados _ Proposta Técnica 11 de maio de 2011 Análise do uso dos Resultados _ Proposta Técnica 1 ANÁLISE DOS RESULTADOS DO SPAECE-ALFA E DAS AVALIAÇÕES DO PRÊMIO ESCOLA NOTA DEZ _ 2ª Etapa 1. INTRODUÇÃO Em 1990, o Sistema de Avaliação

Leia mais

PLANEJAMENTO OPERACIONAL - MARKETING E PRODUÇÃO MÓDULO 3 O QUE É PLANEJAMENTO DE VENDAS E OPERAÇÕES?

PLANEJAMENTO OPERACIONAL - MARKETING E PRODUÇÃO MÓDULO 3 O QUE É PLANEJAMENTO DE VENDAS E OPERAÇÕES? PLANEJAMENTO OPERACIONAL - MARKETING E PRODUÇÃO MÓDULO 3 O QUE É PLANEJAMENTO DE VENDAS E OPERAÇÕES? Índice 1. O que é planejamento de...3 1.1. Resultados do planejamento de vendas e operações (PVO)...

Leia mais

ESTUDO DO EFEITO DAS AÇÕES DE MARKETING SOBRE O FATURAMENTO DE UMA INSTITUIÇÃO DE SAÚDE DO SUL DE MINAS GERAIS UTLIZANDO TÉCNICAS DE SÉRIES TEMPORAIS

ESTUDO DO EFEITO DAS AÇÕES DE MARKETING SOBRE O FATURAMENTO DE UMA INSTITUIÇÃO DE SAÚDE DO SUL DE MINAS GERAIS UTLIZANDO TÉCNICAS DE SÉRIES TEMPORAIS ESTUDO DO EFEITO DAS AÇÕES DE MARKETING SOBRE O FATURAMENTO DE UMA INSTITUIÇÃO DE SAÚDE DO SUL DE MINAS GERAIS UTLIZANDO TÉCNICAS DE SÉRIES TEMPORAIS Maria de Lourdes Lima Bragion 1, Nivaldo Bragion 2,

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Modelo de Planejamento de Projeto orientado pelo Escopo

Modelo de Planejamento de Projeto orientado pelo Escopo www.tecnologiadeprojetos.com.br Modelo de Planejamento de Projeto orientado pelo Escopo Extraído do livro Trabalhando com Projetos - Planejamento e Gestão de Projetos Educacionais - Moura, D. G e Barbosa,

Leia mais

1. Introdução. 1.1 Introdução

1. Introdução. 1.1 Introdução 1. Introdução 1.1 Introdução O interesse crescente dos físicos na análise do comportamento do mercado financeiro, e em particular na análise das séries temporais econômicas deu origem a uma nova área de

Leia mais

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO BACHARELADO AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS Orientando: Oliver Mário

Leia mais

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação Multiplexadores Permitem que vários equipamentos compartilhem um único canal de comunicação Transmissor 1 Receptor 1 Transmissor 2 Multiplexador Multiplexador Receptor 2 Transmissor 3 Receptor 3 Economia

Leia mais

PRÓ-MATATEMÁTICA NA FORMAÇÃO DE PROFESSORES

PRÓ-MATATEMÁTICA NA FORMAÇÃO DE PROFESSORES PRÓ-MATATEMÁTICA NA FORMAÇÃO DE PROFESSORES Regina Luzia Corio de Buriasco * UEL reginaburiasco@sercomtel.com.br Magna Natália Marin Pires* UEL magna@onda.com.br Márcia Cristina de Costa Trindade Cyrino*

Leia mais

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi Metodologias de Desenvolvimento de Sistemas Analise de Sistemas I UNIPAC Rodrigo Videschi Histórico Uso de Metodologias Histórico Uso de Metodologias Era da Pré-Metodologia 1960-1970 Era da Metodologia

Leia mais

Ivan Guilhon Mitoso Rocha. As grandezas fundamentais que serão adotadas por nós daqui em frente:

Ivan Guilhon Mitoso Rocha. As grandezas fundamentais que serão adotadas por nós daqui em frente: Rumo ao ITA Física Análise Dimensional Ivan Guilhon Mitoso Rocha A análise dimensional é um assunto básico que estuda as grandezas físicas em geral, com respeito a suas unidades de medida. Como as grandezas

Leia mais

MRP II. Planejamento e Controle da Produção 3 professor Muris Lage Junior

MRP II. Planejamento e Controle da Produção 3 professor Muris Lage Junior MRP II Introdução A lógica de cálculo das necessidades é conhecida há muito tempo Porém só pode ser utilizada na prática em situações mais complexas a partir dos anos 60 A partir de meados da década de

Leia mais

NECESSIDADES DE PREVISÃO DA CADEIA DE SUPRIMENTOS. Mayara Condé Rocha Murça TRA-53 Logística e Transportes

NECESSIDADES DE PREVISÃO DA CADEIA DE SUPRIMENTOS. Mayara Condé Rocha Murça TRA-53 Logística e Transportes NECESSIDADES DE PREVISÃO DA CADEIA DE SUPRIMENTOS Mayara Condé Rocha Murça TRA-53 Logística e Transportes Setembro/2013 Introdução Estimativas acuradas do volume de produtos e serviços processados pela

Leia mais

Estratégia de Manutenção em Oficinas utilizando Caminho Critico

Estratégia de Manutenção em Oficinas utilizando Caminho Critico SEGeT Simpósio de Excelência em Gestão e Tecnologia 1 Estratégia de Manutenção em Oficinas utilizando Caminho Critico RESUMO Entre as estratégias gerenciais em empresas de médio e grande porte existe o

Leia mais

Disciplina: Unidade III: Prof.: E-mail: Período:

Disciplina: Unidade III: Prof.: E-mail: Período: Encontro 08 Disciplina: Sistemas de Banco de Dados Unidade III: Modelagem Lógico de Dados Prof.: Mario Filho E-mail: pro@mariofilho.com.br Período: 5º. SIG - ADM Relembrando... Necessidade de Dados Projeto

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

dissertação. 2 Credibilidade total, em linhas gerais, seria a capacidade de representar o comportamento

dissertação. 2 Credibilidade total, em linhas gerais, seria a capacidade de representar o comportamento 13 1 Introdução Esta dissertação é o estudo de um problema estatístico de classificação que diz respeito à precificação de seguros de automóveis. Devido às particularidades deste ramo, a formação dos contratos,

Leia mais

28/9/2010. Paralelismo no nível de instruções Processadores superescalares

28/9/2010. Paralelismo no nível de instruções Processadores superescalares Arquitetura de Computadores Paralelismo no nível de instruções Processadores superescalares Prof. Marcos Quinet Universidade Federal Fluminense P.U.R.O. Processadores superescalares A partir dos resultados

Leia mais

Governança de TI. ITIL v.2&3. parte 1

Governança de TI. ITIL v.2&3. parte 1 Governança de TI ITIL v.2&3 parte 1 Prof. Luís Fernando Garcia LUIS@GARCIA.PRO.BR ITIL 1 1 ITIL Gerenciamento de Serviços 2 2 Gerenciamento de Serviços Gerenciamento de Serviços 3 3 Gerenciamento de Serviços

Leia mais

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios

FATEC Cruzeiro José da Silva. Ferramenta CRM como estratégia de negócios FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Cruzeiro SP 2008 FATEC Cruzeiro José da Silva Ferramenta CRM como estratégia de negócios Projeto de trabalho de formatura como requisito

Leia mais

PROFESSOR: CRISTIANO MARIOTTI

PROFESSOR: CRISTIANO MARIOTTI PROFESSOR: CRISTIANO MARIOTTI Conjunto de atividades, parcialmente ordenadas, com a finalidade de obter um produto de software; Considerado um dos principais mecanismos para se obter software de qualidade

Leia mais

Correlação e Regressão Linear

Correlação e Regressão Linear Correlação e Regressão Linear A medida de correlação é o tipo de medida que se usa quando se quer saber se duas variáveis possuem algum tipo de relação, de maneira que quando uma varia a outra varia também.

Leia mais

Decidir como medir cada característica. Definir as características de qualidade. Estabelecer padrões de qualidade

Decidir como medir cada característica. Definir as características de qualidade. Estabelecer padrões de qualidade Escola de Engenharia de Lorena - EEL Controle Estatístico de Processos CEP Prof. MSc. Fabrício Maciel Gomes Objetivo de um Processo Produzir um produto que satisfaça totalmente ao cliente. Conceito de

Leia mais

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO QFD: CASA DA QUALIDADE - PASSO A PASSO 1 - INTRODUÇÃO Segundo Akao (1990), QFD é a conversão dos requisitos do consumidor em características de qualidade do produto e o desenvolvimento da qualidade de

Leia mais

AULA 1 INTRODUÇÃO - ENGENHARIA DE SOFTWARE. Prof. Msc. Hélio Esperidião

AULA 1 INTRODUÇÃO - ENGENHARIA DE SOFTWARE. Prof. Msc. Hélio Esperidião AULA 1 INTRODUÇÃO - ENGENHARIA DE SOFTWARE Prof. Msc. Hélio Esperidião O QUE É UM ALGORITMO? É qualquer procedimento computacional bem definido que informa algum valor ou conjunto de valores como entrada

Leia mais

O Plano Financeiro no Plano de Negócios Fabiano Marques

O Plano Financeiro no Plano de Negócios Fabiano Marques O Plano Financeiro no Plano de Negócios Fabiano Marques Seguindo a estrutura proposta em Dornelas (2005), apresentada a seguir, podemos montar um plano de negócios de forma eficaz. É importante frisar

Leia mais

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Data Warehouse. Debora Marrach Renata Miwa Tsuruda Debora Marrach Renata Miwa Tsuruda Agenda Introdução Contexto corporativo Agenda Introdução Contexto corporativo Introdução O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos

Leia mais

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE Mariane Alves Gomes da Silva Eliana Zandonade 1. INTRODUÇÃO Um aspecto fundamental de um levantamento

Leia mais

Abordagem de Processo: conceitos e diretrizes para sua implementação

Abordagem de Processo: conceitos e diretrizes para sua implementação QP Informe Reservado Nº 70 Maio/2007 Abordagem de Processo: conceitos e diretrizes para sua implementação Tradução para o português especialmente preparada para os Associados ao QP. Este guindance paper

Leia mais

Módulo 4 PREVISÃO DE DEMANDA

Módulo 4 PREVISÃO DE DEMANDA Módulo 4 PREVISÃO DE DEMANDA Conceitos Iniciais Prever é a arte e a ciência de predizer eventos futuros, utilizando-se de dados históricos e sua projeção para o futuro, de fatores subjetivos ou intuitivos,

Leia mais

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES

DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES DATA WAREHOUSE NO APOIO À TOMADA DE DECISÕES Janaína Schwarzrock jana_100ideia@hotmail.com Prof. Leonardo W. Sommariva RESUMO: Este artigo trata da importância da informação na hora da tomada de decisão,

Leia mais

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014 PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA 09/abril de 2014 Considerações Estatísticas para Planejamento e Publicação 1 Circularidade do Método

Leia mais

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL

IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES ENTRE PRODUTOS DE UMA BASE DE DADOS REAL Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM IMPLEMENTAÇÃO DE UM ALGORITMO DE PADRÕES DE SEQUÊNCIA PARA DESCOBERTA DE ASSOCIAÇÕES

Leia mais

MODELO CMM MATURIDADE DE SOFTWARE

MODELO CMM MATURIDADE DE SOFTWARE MODELO CMM MATURIDADE DE SOFTWARE O modelo CMM Capability Maturity Model foi produzido pelo SEI (Software Engineering Institute) da Universidade Carnegie Mellon (CMU), em Pittsburgh, EUA, por um grupo

Leia mais

PROJETO DE RECUPERAÇÃO EM MATEMÁTICA Manual do Professor Módulo 2 Números Racionais, Operações e Resolução de Problemas

PROJETO DE RECUPERAÇÃO EM MATEMÁTICA Manual do Professor Módulo 2 Números Racionais, Operações e Resolução de Problemas PROJETO DE RECUPERAÇÃO EM MATEMÁTICA Manual do Professor Módulo 2 Números Racionais, Operações e Resolução de Problemas Prezado(a) Professor(a) Este manual de orientações tem a finalidade de sugerir um

Leia mais

SUMÁRIO. Introdução... 3

SUMÁRIO. Introdução... 3 SUMÁRIO Introdução..................................... 3 1 Consultas por Similaridade e Espaços métricos............. 5 1.1 Consultas por abrangência e consultas aos k-vizinhos mais próximos... 5 1.2

Leia mais

DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO

DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO Universidade Federal de Ouro Preto - UFOP Instituto de Ciências Exatas e Biológicas - ICEB Departamento de Computação - DECOM DESENVOLVIMENTO DE UM REPOSITÓRIO DE DADOS DO FUTEBOL BRASILEIRO Aluno: Rafael

Leia mais

Relatório Trabalho Prático 2 : Colônia de Formigas para Otimização e Agrupamento

Relatório Trabalho Prático 2 : Colônia de Formigas para Otimização e Agrupamento Relatório Trabalho Prático 2 : Colônia de Formigas para Otimização e Agrupamento Ramon Pereira Lopes Rangel Silva Oliveira 31 de outubro de 2011 1 Introdução O presente documento refere-se ao relatório

Leia mais

Feature-Driven Development

Feature-Driven Development FDD Feature-Driven Development Descrição dos Processos Requisitos Concepção e Planejamento Mais forma que conteúdo Desenvolver um Modelo Abrangente Construir a Lista de Features Planejar por

Leia mais

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento

Data Mining. Origem do Data Mining 24/05/2012. Data Mining. Prof Luiz Antonio do Nascimento Data Mining Prof Luiz Antonio do Nascimento Data Mining Ferramenta utilizada para análise de dados para gerar, automaticamente, uma hipótese sobre padrões e anomalias identificadas para poder prever um

Leia mais

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE MÓDULO 6 INTRODUÇÃO À PROBBILIDDE Quando estudamos algum fenômeno através do método estatístico, na maior parte das vezes é preciso estabelecer uma distinção entre o modelo matemático que construímos para

Leia mais

CURSO: LICENCIATURA DA MATEMÁTICA DISCIPLINA: PRÁTICA DE ENSINO 4

CURSO: LICENCIATURA DA MATEMÁTICA DISCIPLINA: PRÁTICA DE ENSINO 4 CAMPUS CARAGUATUBA CURSO: LICENCIATURA DA MATEMÁTICA DISCIPLINA: PRÁTICA DE ENSINO 4 PROFESSOR: ANDRESSA MATTOS SALGADO-SAMPAIO ORIENTAÇÕES PEDAGÓGICAS PARA A PRÁTICA DE ESTÁGIO SUPERVISIONADO NO CURSO

Leia mais

MODELO DE APRESENTAÇÃO DE PROJETO DE PESQUISA

MODELO DE APRESENTAÇÃO DE PROJETO DE PESQUISA MODELO DE APRESENTAÇÃO DE PROJETO DE PESQUISA PÓS-GRADUAÇÃO EM CIÊNCIA E ENGENHARIA DE MATERIAIS Elaborado por Prof. Dr. Rodrigo Sampaio Fernandes Um projeto de pesquisa consiste em um documento no qual

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Dadas a base e a altura de um triangulo, determinar sua área.

Dadas a base e a altura de um triangulo, determinar sua área. Disciplina Lógica de Programação Visual Ana Rita Dutra dos Santos Especialista em Novas Tecnologias aplicadas a Educação Mestranda em Informática aplicada a Educação ana.santos@qi.edu.br Conceitos Preliminares

Leia mais

Pesquisa realizada com os participantes do 12º Seminário Nacional de Gestão de Projetos. Apresentação

Pesquisa realizada com os participantes do 12º Seminário Nacional de Gestão de Projetos. Apresentação Pesquisa realizada com os participantes do de Apresentação O perfil do profissional de Projetos Pesquisa realizada durante o 12 Seminário Nacional de, ocorrido em 2009, traça um importante perfil do profissional

Leia mais

W Projeto. Gerenciamento. Construindo a WBS e gerando o Cronograma. Autor: Antonio Augusto Camargos, PMP 1/12

W Projeto. Gerenciamento. Construindo a WBS e gerando o Cronograma. Autor: Antonio Augusto Camargos, PMP 1/12 W Projeto BS Construindo a WBS e gerando o Cronograma. Gerenciamento Autor: Antonio Augusto Camargos, PMP 1/12 Índice Remissivo Resumo...3 1. Introdução...3 2. Conceituando a WBS (Work Breakdown Structure/Estrutura

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas PONTIFÍCIA UNIVERSIDADE CATÓLICA DE GOIÁS Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas CMP1132 Processo e qualidade de software II Prof. Me. Elias Ferreira Sala: 402 E Quarta-Feira:

Leia mais

Preparando sua empresa para o forecasting:

Preparando sua empresa para o forecasting: Preparando sua empresa para o forecasting: Critérios para escolha de indicadores. Planejamento Performance Dashboard Plano de ação Relatórios Indicadores Embora o forecasting seja uma realidade, muitas

Leia mais

Universidade Federal de Minas Gerais ICEx / DCC

Universidade Federal de Minas Gerais ICEx / DCC Universidade Federal de Minas Gerais ICEx / DCC Belo Horizonte, 15 de dezembro de 2006 Relatório sobre aplicação de Mineração de Dados Mineração de Dados em Bases de Dados de Vestibulares da UFMG Professor:

Leia mais

2.1 Os projetos que demonstrarem resultados (quádrupla meta) serão compartilhados na Convenção Nacional.

2.1 Os projetos que demonstrarem resultados (quádrupla meta) serão compartilhados na Convenção Nacional. O Prêmio Inova+Saúde é uma iniciativa da SEGUROS UNIMED que visa reconhecer as estratégias de melhoria e da qualidade e segurança dos cuidados com a saúde dos pacientes e ao mesmo tempo contribua com a

Leia mais

4 passos para uma Gestão Financeira Eficiente

4 passos para uma Gestão Financeira Eficiente 4 passos para uma Gestão Financeira Eficiente Saiba como melhorar a gestão financeira da sua empresa e manter o fluxo de caixa sob controle Ciclo Financeiro Introdução Uma boa gestão financeira é um dos

Leia mais

Estruturando o modelo de RH: da criação da estratégia de RH ao diagnóstico de sua efetividade

Estruturando o modelo de RH: da criação da estratégia de RH ao diagnóstico de sua efetividade Estruturando o modelo de RH: da criação da estratégia de RH ao diagnóstico de sua efetividade As empresas têm passado por grandes transformações, com isso, o RH também precisa inovar para suportar os negócios

Leia mais

Projeto Você pede, eu registro.

Projeto Você pede, eu registro. Projeto Você pede, eu registro. 1) IDENTIFICAÇÃO 1.1) Título do Projeto: Você pede eu registro. 1.2) Equipe responsável pela coordenação do projeto: Pedro Paulo Braga Bolzani Subsecretario de TI Antonio

Leia mais

Indicamos inicialmente os números de cada item do questionário e, em seguida, apresentamos os dados com os comentários dos alunos.

Indicamos inicialmente os números de cada item do questionário e, em seguida, apresentamos os dados com os comentários dos alunos. Os dados e resultados abaixo se referem ao preenchimento do questionário Das Práticas de Ensino na percepção de estudantes de Licenciaturas da UFSJ por dez estudantes do curso de Licenciatura Plena em

Leia mais

4 Metodologia da Pesquisa

4 Metodologia da Pesquisa 79 4 Metodologia da Pesquisa Este capítulo se preocupa em retratar como se enquadra a pesquisa de campo e como foram desenvolvidas as entrevistas incluindo o universo pesquisado e a forma de analisá-las

Leia mais

5 Estudo de caso: utilizando o sistema para requisição de material

5 Estudo de caso: utilizando o sistema para requisição de material 61 5 Estudo de caso: utilizando o sistema para requisição de material A fim de avaliar as características da arquitetura proposta e a corretude da implementação, realizamos experiências com cenários de

Leia mais

DEMONSTRAÇÕES FINANCEIRAS COMBINADAS

DEMONSTRAÇÕES FINANCEIRAS COMBINADAS 24 DEMONSTRAÇÕES FINANCEIRAS COMBINADAS Os mercados de capitais na Europa e no mundo exigem informações financeiras significativas, confiáveis, relevantes e comparáveis sobre os emitentes de valores mobiliários.

Leia mais

Global T126 e GFS), executando para ambos os horários (00Z e 12Z), utilizando

Global T126 e GFS), executando para ambos os horários (00Z e 12Z), utilizando 51 Figura 13 - Solicitação e resposta do http. 3.2 Método Para criação da nova metodologia de avaliação, foi utilizado trabalhos escritos por RENARD e CLARKE (1965) que dizem que é possível posicionar

Leia mais

A IMPORTÂNCIA DA GESTÃO DE CUSTOS NA ELABORAÇÃO DO PREÇO DE VENDA

A IMPORTÂNCIA DA GESTÃO DE CUSTOS NA ELABORAÇÃO DO PREÇO DE VENDA 553 A IMPORTÂNCIA DA GESTÃO DE CUSTOS NA ELABORAÇÃO DO PREÇO DE VENDA Irene Caires da Silva 1, Tamires Fernanda Costa de Jesus, Tiago Pinheiro 1 Docente da Universidade do Oeste Paulista UNOESTE. 2 Discente

Leia mais

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.

O que é a ciência de dados (data science). Discussão do conceito. Luís Borges Gouveia Universidade Fernando Pessoa Versão 1. O que é a ciência de dados (data science). Discussão do conceito Luís Borges Gouveia Universidade Fernando Pessoa Versão 1.3, Outubro, 2015 Nota prévia Esta apresentação tem por objetivo, proporcionar

Leia mais

ATIVIDADES PRÁTICAS SUPERVISIONADAS

ATIVIDADES PRÁTICAS SUPERVISIONADAS ATIVIDADES PRÁTICAS SUPERVISIONADAS 1ª série Empreendedorismo Administração A atividade prática supervisionada (ATPS) é um método de ensino-aprendizagem desenvolvido por meio de um conjunto de atividades

Leia mais

Data Warehouse. Compras. Caroline B. Perlin

Data Warehouse. Compras. Caroline B. Perlin Data Warehouse Compras Caroline B. Perlin Agenda O processo de compra Requisitos de compras Transações de compra Tabela de fatos Slowly Changing Dimensions (SCD) Técnicas para lidar com SCD Abordagens

Leia mais

APLICACAÇÃO DE METRICAS E INDICADORES NO MODELO DE REFERENCIA CMMI-Dev NIVEL 2

APLICACAÇÃO DE METRICAS E INDICADORES NO MODELO DE REFERENCIA CMMI-Dev NIVEL 2 APLICACAÇÃO DE METRICAS E INDICADORES NO MODELO DE REFERENCIA CMMI-Dev NIVEL 2 Renan J. Borges 1, Késsia R. C. Marchi 1 1 Universidade Paranaense (UNIPAR) Paranavaí, PR Brasil renanjborges@gmail.com, kessia@unipar.br

Leia mais

Aula 2 Revisão 1. Ciclo de Vida. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW

Aula 2 Revisão 1. Ciclo de Vida. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW. Processo de Desenvolvimento de SW Ciclo de Vida Aula 2 Revisão 1 Processo de Desenvolvimento de Software 1 O Processo de desenvolvimento de software é um conjunto de atividades, parcialmente ordenadas, com a finalidade de obter um produto

Leia mais

Desafio Profissional PÓS-GRADUAÇÃO 2012. Gestão de Projetos - Módulo C Prof. Me. Valter Castelhano de Oliveira

Desafio Profissional PÓS-GRADUAÇÃO 2012. Gestão de Projetos - Módulo C Prof. Me. Valter Castelhano de Oliveira Desafio Profissional PÓS-GRADUAÇÃO 12 Gestão de Projetos - Módulo C Prof. Me. Valter Castelhano de Oliveira 1 DESAFIO PROFISSIONAL Disciplinas: Ferramentas de Software para Gestão de Projetos. Gestão de

Leia mais

Mídias sociais como apoio aos negócios B2C

Mídias sociais como apoio aos negócios B2C Mídias sociais como apoio aos negócios B2C A tecnologia e a informação caminham paralelas à globalização. No mercado atual é simples interagir, aproximar pessoas, expandir e aperfeiçoar os negócios dentro

Leia mais

CAPÍTULO 1 - CONTABILIDADE E GESTÃO EMPRESARIAL A CONTROLADORIA

CAPÍTULO 1 - CONTABILIDADE E GESTÃO EMPRESARIAL A CONTROLADORIA CAPÍTULO 1 - CONTABILIDADE E GESTÃO EMPRESARIAL A CONTROLADORIA Constata-se que o novo arranjo da economia mundial provocado pelo processo de globalização tem afetado as empresas a fim de disponibilizar

Leia mais

O que é a estatística?

O que é a estatística? Elementos de Estatística Prof. Dr. Clécio da Silva Ferreira Departamento de Estatística - UFJF O que é a estatística? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os

Leia mais

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo UNIVERSIDADE DE SÃO PAULO Faculdade de Arquitetura e Urbanismo DISTRIBUIÇÃO AMOSTRAL ESTIMAÇÃO AUT 516 Estatística Aplicada a Arquitetura e Urbanismo 2 DISTRIBUIÇÃO AMOSTRAL Na aula anterior analisamos

Leia mais

PROJETO DE PESQUISA. Antonio Joaquim Severino 1. Um projeto de bem elaborado desempenha várias funções:

PROJETO DE PESQUISA. Antonio Joaquim Severino 1. Um projeto de bem elaborado desempenha várias funções: PROJETO DE PESQUISA Antonio Joaquim Severino 1 Um projeto de bem elaborado desempenha várias funções: 1. Define e planeja para o próprio orientando o caminho a ser seguido no desenvolvimento do trabalho

Leia mais