Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Tamanho: px
Começar a partir da página:

Download "Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR"

Transcrição

1

2 Encontrar grupos de objetos tal que objetos em um grupo são similares (ou relacionados) uns aos outros e diferentes de (ou não relacionados) a objetos em outros grupos

3 Compreensão Agrupa documentos relacionados para pesquisa, agrupa genes e proteínas que tenham funcionalidade similar, ou agrupa estoques com flutuações de preço similar Grupos Descobertos Applied-Matl-DOWN,Bay-Network-Down,3-COM-DOWN, Cabletron-Sys-DOWN,CISCO-DOWN,HP-DOWN, DSC-Comm-DOWN,INTEL-DOWN,LSI-Logic-DOWN, Micron-Tech-DOWN,Texas-Inst-Down,Tellabs-Inc-Down, Natl-Semiconduct-DOWN,Oracl-DOWN,SGI-DOWN, Sun-DOWN Apple-Comp-DOWN,Autodesk-DOWN,DEC-DOWN, ADV-Micro-Device-DOWN,Andrew-Corp-DOWN, Computer-Assoc-DOWN,Circuit-City-DOWN, Compaq-DOWN, EMC-Corp-DOWN, Gen-Inst-DOWN, Motorola-DOWN,Microsoft-DOWN,Scientific-Atl-DOWN Fannie-Mae-DOWN,Fed-Home-Loan-DOWN, MBNA-Corp-DOWN,Morgan-Stanley-DOWN Baker-Hughes-UP,Dresser-Inds-UP,Halliburton-HLD-UP, Louisiana-Land-UP,Phillips-Petro-UP,Unocal-UP, Schlumberger-UP Grupo Industrial Technology-DOWN Technology2-DOWN Financial-DOWN Oil-UP Sumarização Reduz o tamanho de grandes bases de dados Agrupando precipitação na Austrália

4 Classificação Supervisionada Tem informação de rótulo da classe Segmentação simples Dividir estudantes em diferentes grupos de registro alfabeticamente, pelo último nome Resultado de uma query Grupos são resultado de uma especificação externa Particionamento de Grafo Alguma relevância e sinergia mútua, mas áreas não são idênticas

5 Quantos grupos? Seis Grupos Dois Grupos Quatro Grupos

6 Um agrupamento é um conjunto de grupos Distinção importante entre conjuntos de grupos hierárquicos e particionais Agrupamento Particional Divide objetos de dados em subconjuntos sem sobreposição (grupos) tal que cada objeto de dados está em exatamente um subconjunto Agrupamento Hierárquico Um conjunto de grupos aninhados organizado como uma árvore hierárquica

7 Pontos Originais Um Agrupamento Particional

8 p p3 p4 p2 p p2 p3 p4 Agrupamento Hierárquico Tradicional Dendrograma Tradicional p p3 p4 p2 p p2 p3 p4 Agrupamento Hierárquico não Tradicional Dendrograma não Tradicional

9 !"# Exclusivo versus não exclusivo Em agrupamentos não exclusivos, pontos podem pertencer a vários grupos. Podem representar várias classes ou pontos de fronteira Fuzzy versus não fuzzy Em agrupamento fuzzy, um ponto pertence a todo grupo com algum peso entre 0 e Soma dos pesos deve ser Agrupamento probabilístico tem características semelhantes Parcial versus completo Em alguns casos, deseja-se agrupar somente alguns dados Heterogêneo versus homogêneo Grupos de tamanho, formato e densidade completamente diferentes

10 Grupos bem separados Grupos baseados em centro Grupos contíguos Grupos baseados em densidade Propriedade ou Conceitual Descrito por uma Função Objetivo

11 $%& Grupos bem separados: Um grupo é um conjunto de pontos tal que qualquer ponto em um grupo está mais próximo (ou é mais similar) de todo ponto no grupo do que de qualquer ponto que não está no grupo. 3 grupos bem separados

12 $% " Baseado em Centro Um grupo é um conjunto de objetos tal que um objeto em um grupo está mais próximo (mais similar) ao centro de um grupo, que ao centro de qualquer outro grupo O centro de um grupo é freqüentemente um centróide, a média de todos os pontos no grupo, ou um medóide, o ponto mais representativo de um grupo 4 grupos baseados em centro

13 $% "' Grupos Contíguos (Vizinho mais Próximo ou Transitivo) Um grupo é um conjunto de pontos tal que um ponto em um grupo está mais próximo (ou é mais similar) a um ou mais pontos no grupo do que a qualquer ponto que não está no grupo. 8 grupos contíguos

14 $%! Baseado em Densidade Um grupo é uma região densa de pontos, que é separada por regiões de baixa densidade, de outras regiões de alta densidade. Usado quando os grupos são irregulares ou entrelaçados, e quando ruído ou outliers estão presentes. 6 grupos baseados em densidade

15 $" Propriedade compartilhada ou Grupos Conceituais Encontrar grupos que partilham alguma propriedade em comum ou representam um conceito em particular. 2 Círculos Sobrepostos

16 $(#) Grupos Definidos por uma Função Objetivo Achar grupos que minimizam ou maximizam função objetivo Enumerar todas formas possíveis de dividir os pontos em grupos e avaliar quão bom cada potencial conjunto de grupos é usando a função objetivo dada. (NP Hard) Pode-se ter objetivos globais ou locais. Algoritmos de agrupamento hierárquico tem em geral objetivos locais Algoritmos particionais em geral tem objetivos globais Uma variação da abordagem por função objetivo global consiste no ajuste dos dados a um modelo parametrizado. Parâmetros para o modelo são determinados a partir dos dados. Modelos de mistura assumem que os dados são uma mistura de um certo número de distribuições estatísticas.

17 $(#)* Mapear o problema de agrupamento em um domínio diferente e resolver um problema relacionado naquele domínio Matriz de Proximidade define um grafo ponderado, em que os nós são os pontos sendo agrupados, e o peso das arestas representa a proximidade entre pontos Agrupamento é equivalente a quebrar o grafo em componentes conectados, um para cada grupo. Busca-se minimizar o peso das arestas entre grupos e maximizar o peso das arestas dentro dos grupos

18 +, "! - Tipo de proximidade ou medida de densidade É uma medida derivada, mas central ao agrupamento Esparsidade Dita o tipo de similaridade Melhora a eficiência Tipo de atributo Dita o tipo de similaridade Tipo de dado Dita o tipo de similaridade Outras características, e.g., auto-correlação Dimensionalidade Ruído e Outliers Tipo de Distribuição

19 K-médio e suas variações Agrupamento Hierárquico Agrupamento baseado em Densidade

20 ./ Abordagem de agrupamento particional Cada grupo é associado com um centróide (ponto central) Cada ponto é assinalado ao grupo com o centróide mais próximo Número de grupos, K, deve ser especificado O algoritmo básico é muito simples

21 ./ 0! Centróides iniciais em geral são escolhidos aleatoriamente Grupos produzidos variam de execução para outra O centróide é (tipicamente) a média dos pontos do grupo Proximidade é medida pela distância Euclidiana, similaridade dos cossenos, correlação, etc. K-médio converge para as medidas de similaridade já indicadas Maioria da convergência acontece nas primeiras iterações Freqüentemente a condição de parada é mudada para Até que relativamente poucos pontos mudam de grupo Complexidade é O( n * K * I * d ) n = número de pontos, K = número de grupos, I = número de iterações, d = número de atributos

22 !!23/ Pontos originais y x y y x Agrupamento ótimo x Agrupamento Sub-ótimo

23 +, - "4 + 3 Iteration y x

24 +, - "4 + 3 Iteração 3 Iteração 2 3 Iteração y y y x x x 3 Iteração 4 3 Iteração 5 3 Iteração y y y x x x

25 ) 3/ Medida mais comum é Sum of Squared Error (SSE) Para cada ponto, o erro é a distância ao grupo mais próximo Para obter SSE, os erros são elevados ao quadrados e somados SSE = K i= x C i dist ( m, x) x é um ponto de dado no grupo C i e m i é o ponto representativo para o grupo C i pode mostrar que m i corresponde ao centro (média) do grupo Dados dois grupos, pode-se escolher aquele com o menor erro Uma forma fácil de reduzir SSE é aumentar k, o número de grupos 2 Um bom agrupamento com k menor pode ter um SSE inferior que um agrupamento pobre com k maior i

26 +, - "4 +* 3 Iteration y x

27 +, - "4 +* 3 Iteração 3 Iteração y y x x 3 Iteração 3 3 Iteração 4 3 Iteração y y y x x x

28 & + Se há k grupos reais então a chance de selecionar um centróide de cada grupo é pequena. Chance é relativamente pequena quando k é grande Se grupos são de mesmo tamanho, n, então Por exemplo, se k = 0, então probabilidade = 0!/0 0 = As vezes os centróides iniciais se reajustam de forma correta, e as vezes não Considere um exemplo de cinco pares de grupos

29 Iteration y x Começando com dois centróides iniciais em um grupo de cada par de grupos

30 Iteration 8 Iteration y 0 y x Iteration x Iteration y 0 y x Começando com dois centróides iniciais em um grupo de cada par de grupos x

31 Iteration y Começando com um par de grupos tendo três centróides iniciais, enquanto outro tem somente um x

32 Iteration 8 Iteration y 0 y Iteration x Iteration x y 0 y x x Começando com um par de grupos tendo três centróides iniciais, enquanto outro tem somente um

33 & "4 + Múltiplas execuções Ajuda, mas a probabilidade não está a favor Amostrar e usar agrupamento hierárquico para determinar centróides iniciais Selecionar mais que k centróides iniciais e então selecionar entre estes centróides iniciais Selecionar os mais largamente separados Pós-processamento K-médio Bi-seccional Não é tão suscetível a problemas de inicialização

34 8 9: Algoritmo básico do k-médio pode levar a grupos vazios Várias estratégias Escolher o ponto que mais contribui para o SSE Escolher um ponto do grupo com o maior SSE Se há vários grupos vazios, o procedimento acima pode ser repetido várias vezes

35 : " (+ No algoritmo K-médio básico, centróides são atualizados após todos os pontos terem sido assinalados a um centróide Uma alternativa é atualizar os centróides após cada assinalamento (abordagem incremental) Cada assinalamento atualiza zero ou dois centróides Mais caro Introduz uma ordem de dependência Nunca chega a um grupo vazio Pode usar pesos para alterar impacto

36 / 4/ Pré-processamento Normalizar dos dados Eliminar outliers Pós-processamento Eliminar pequenos grupos que podem representar outliers Dividir grupos frouxos, i.e., grupos com SSE relativamente alto Unir grupos que estão próximos e que tenham SSE relativamente baixo Pode usar estes passos durante o processo de agrupamento ISODATA

37 ./ %/ Algoritmo K-médio bi-seccional Variante do K-médio que pode produzir um agrupamento particional ou hierárquico

38 -50./ %/

39 ;./ K-médio tem problemas quando os grupos são de diferentes Tamanhos Densidades Formatos não globulares K-médio tem problemas quando os dados contém outliers

40 ;./ $!2 Pontos Originais K-médio (3 Grupos)

41 ;./ $!2! Pontos Originais K-médio (3 Grupos)

42 ;./ $( Pontos Originais K-médio (2 Grupos)

43 & ;./ Pontos Originais Grupos K-médio Uma solução é usar muitos grupos. Encontra partes de grupos, mas precisam ser colocados juntos.

44 & ;./ Pontos Originais Grupos K-médio

45 & ;./ Pontos Originais Grupos K-médio

46 Produz um conjunto de grupos aninhados organizado como uma árvore hierárquica Pode ser visualizado como um dendograma Um diagrama tipo árvore que registra a seqüência de uniões ou divisões

47 Não precisa assumir qualquer número particular de grupos Qualquer número desejado de grupos pode ser obtido cortando o dendograma no nível apropriado Podem corresponder a taxonomias com significado Exemplo em ciências biológicas (e.g., reino animal, reconstrução filogenética, )

48 Dois tipos principais de agrupamento hierárquico Aglomerativo: Inicia com os pontos sendo grupos individuais A cada passo une os pares de grupos mais próximos até que somente um grupo exista (ou k grupos) Divisivo: Inicia com um grupo que inclui todos os pontos A cada passo divide um grupo até que cada grupo contenha um ponto (ou hajam k grupos) Algoritmos hierárquicos tradicionais usam uma matriz de similaridade ou de distância Unem ou dividem um grupo por vez

49 ) Técnica de agrupamento hierárquica mais popular Algoritmo básico é eficiente. Calcular a matriz de proximidade 2. Fazer cada ponto de dados ser um grupo 3. Repetir 4. Unir os dois grupos mais próximos 5. Atualizar a matriz de proximidade 6. Até que exista somente um único grupo Operação-chave é o cálculo da proximidade de dois grupos Diferentes abordagens para definir a distância entre grupos distinguem os diferentes algoritmos

50 &+ Iniciar com grupos de pontos individuais e uma matriz de proximidade p p2 p3 p4 p5.. p p2 p3 p4 p5.... Matriz de Proximidade

51 &+ Após alguns passos de união, têm-se alguns grupos C C2 C3 C4 C5 C3 C4 C C2 C3 C4 C5 C Matriz de Proximidade C2 C5

52 &+ Deseja-se unir os dois grupos mais próximos (C2 e C5) e atualizar a matriz de proximidade C C2 C C2 C3 C4 C5 C C3 C4 C3 C4 C5 Matriz de Proximidade C2 C5

53 4< A questão é Como se atualiza a matriz de proximidade? C C2 U C5 C3 C4 C? C3 C4 C2 U C5 C3 C4?????? C Matriz de Proximidade C2 U C5

54 "!2& - p p2 p3 p4 p5... Similaridade? p p2 MIN MAX Média do Grupo Distância entre Centróides Outros métodos definidos por uma função objetivo Método de Ward usa erro quadrático p3 p4 p5... Matriz de Proximidade

55 "!2& - p p2 p3 p4 p5... p p2 p3 p4 MIN MAX Média do Grupo Distância entre Centróides Outros métodos definidos por uma função objetivo Método de Ward usa erro quadrático p5... Matriz de Proximidade

56 "!2& - p p2 p3 p4 p5... p p2 p3 p4 MIN MAX Média do Grupo Distância entre Centróides Outros métodos definidos por uma função objetivo Método de Ward usa erro quadrático p5... Matriz de Proximidade

57 "!2& - p p2 p3 p4 p5... p p2 p3 p4 MIN MAX Média do Grupo Distância entre Centróides Outros métodos definidos por uma função objetivo Método de Ward usa erro quadrático p5... Matriz de Proximidade

58 "!2& - p p p2 p3 p4 p5... p2 p3 p4 MIN MAX Média do Grupo Distância entre Centróides Outros métodos definidos por uma função objetivo Método de Ward usa erro quadrático p5... Matriz de Proximidade

59 & $8+&;3 Similaridade de dois grupos é baseada nos dois pontos mais similares (próximos) nos diferentes grupos Determinado por um par de pontos, i.e., por uma ligação no grafo de proximidade I I2 I3 I4 I5 I I I I I

60 $ Grupos Aninhados Dendograma

61 8+ Pontos Originais Dois Grupos Pode manipular formatos não elípticos

62 ; 8+ Pontos Originais Dois Grupos Sensível a ruídos e outliers

63 & $8=";3 Similaridade de dois grupos é baseada nos dois pontos menos similares (mais distantes) nos diferentes grupos Determinado por todos os pares de pontos nos dois grupos I I2 I3 I4 I5 I I I I I

64 $8= Grupos Aninhados Dendograma

65 8= Pontos Originais Dois Grupos Menos suscetível a ruído e outliers

66 ; 8= Pontos Originais Dois Grupos Tende a quebrar grandes grupos Tendencioso para grupos globulares

67 & $8 Proximidade de dois grupos é a média da proximidade par-apar entre pontos dos dois grupos 5 5 A >> > Precisa usar conectividade média para escalabilidade já que proximidade total favorece grandes grupos #? = I I2 I3 I4 I5 I I I I I # # > #?

68 & $ Grupos Aninhados Dendograma

69 & $8 Compromisso entre Single e Complete Link Poder Menos suscetível a ruído e outliers Limitações Tendência para grupos globulares

70 & $8 B Similaridade de dois grupos é baseada no aumento do erro quadrático quando dois grupos são unidos Similar à media do grupo se distância entre pontos é distância quadrática Menos suscetível a ruído e outliers Tendência para grupos globulares Análogo hierárquico do K-médio Pode ser usado para inicializar o K-médio

71 $" Média do Grupo Método de Ward MIN MAX

72 $C - O(N 2 ) em espaço já que usa a matriz de proximidade. N é o número de pontos O(N 3 ) em tempo em muitos casos Há N passos e a cada passo a matriz de proximidade de tamanho N 2 deve ser atualizada e pesquisada Complexidade pode ser reduzida para O(N 2 log(n)) em tempo para algumas abordagens

73 $; Uma vez que uma decisão tenha sido tomada de combinar dois grupos, ela não pode ser desfeita Nenhuma função objetivo é minimizada diretamente Diferentes esquemas tem problemas com um ou mais dos seguintes pontos: Sensibilidade a ruído e outliers Dificuldade de manipular grupos de tamanhos diferentes e formatos convexos Quebrar grandes grupos

74 8&$!)) Construir MST (Minimum Spanning Tree) Iniciar com uma árvore que consiste de qualquer ponto Em passos sucessivos buscar o par de pontos mais próximos (p, q) tal que um ponto (p) está na árvore atual e o outro (q) não Adicionar q à árvore e colocar uma aresta entre p e q

75 8&$!)) Usar MST para construir uma hierarquia de grupos

76 !%&" DBSCAN é um algoritmo baseado em densidade Densidade = número de pontos dentro de um raio específico (Eps) Um ponto é um ponto núcleo se ele tem mais que um número especificado de pontos (MinPts) dentro de Eps Estes são os pontos que estão no interior de um grupo Um ponto de fronteira tem menos que MinPts dentro de Eps mas está na vizinhança de um ponto núcleo Um ponto de ruído é um ponto que não é nem um ponto núcleo nem um ponto de fronteira

77 !%&"$

78 !%&" Eliminar pontos de ruído Fazer agrupamento sobre os pontos restantes

79 !%&"$ Pontos Originais Tipos de pontos: núcleo, fronteira e ruído Eps = 0, MinPts = 4

80 E!%&"(% Pontos Originais Grupos Resistente a ruído Pode manipular grupos de diferentes formas e tamanhos

81 E!%&"F(% Pontos Originais (MinPts=4, Eps=9.75). Densidades variáveis Dados de alta dimensionalidade (MinPts=4, Eps=9.92)

82 !%&"$! -&8 Idéia é que para pontos em um grupo, seus k-ésimos vizinhos estão aproximadamente à mesma distância Pontos de ruído tem o k-ésimo vizinho a uma distância maior Desta forma, o gráfico da distância ordenada de todo ponto até seu k-ésimo vizinho mais próximo

83 9 Para classificação supervisionada tem-se uma variedade de medidas para avaliar quão bom o modelo é Exatidão, precisão, recuperação( recall ) Para análise de agrupamentos a questão análoga é como avaliar o quão bom são os grupos resultantes Mas grupos estão nos olhos de quem os vê! Então por quê deseja-se avaliá-los? Para evitar encontrar padrões nos ruídos Para comparar algoritmos de agrupamento Para comparar dois conjuntos de grupos Para comparar dois grupos

84 ! Pontos Aleatórios y y DBSCAN x x K-médio Complete Link y 0.5 y x x

85 !2 9. Determinar a tendência de agrupamento de um conjunto de dados, i.e., distinguir se uma estrutura não aleatória realmente existe nos dados. 2. Comparar os resultados de uma análise de grupos com resultados externamente conhecidos, e.g., a rótulos de classes externamente fornecidos. 3. Avaliar quão bem os resultados de uma análise de grupos se ajustam aos dados sem referência a informação externa. - Usar somente os dados 4. Comparar os resultados de dois diferentes conjuntos de análise de grupos para determinar qual deles é melhor. 5. Determinar o número correto de grupos. Para 2, 3, e 4 pode-se ainda distinguir se é desejada uma avaliação do agrupamento inteiro ou apenas de grupos individuais.

86 8 ) Medidas numéricas que são aplicadas para julgar vários aspectos de avaliação de grupos são classificados em três tipos. Índice Externo: Usado para medir até que ponto rótulos de grupos correspondem a rótulos de classes externamente fornecidos. Entropia Índice Interno: Usado para medir quão boa é a estrutura de agrupamento sem relação com informação externa. Soma dos Erros Quadráticos (SSE) Índice Relativo: Usado para comparar dois grupos ou agrupamentos diferentes. Freqüentemente um índice externo ou interno é usado para esta função, e.g., SSE ou entropia As vezes eles são chamados de critérios em vez de índices Entretanto, as vezes critério é a estratégia geral e índice é a medida numérica que implementa o critério.

87 8 ) 9" Duas matrizes Matriz de Proximidade Matriz de Incidência Uma linha e uma coluna para cada ponto de dados Uma célula é se o par de pontos associado pertence ao mesmo grupo Uma célula é 0 se o par de pontos associado pertence a diferentes grupos Calcular a correlação entre as duas matrizes Como as matrizes são simétricas, somente a correlação entre n(n-)/2 entradas precisa ser calculada Alta correlação indica que pontos que pertencem ao mesmo grupo estão próximos entre si Não é uma boa medida para alguns grupos baseados em densidade ou contigüidade

88 8 ) 9" Correlação das matrizes de incidência e proximidade para os agrupamentos K-médio dos seguintes conjuntos de dados y x y x Correlação = Correlação =

89 < 8: & ) Ordenar a matriz de similaridade com relação aos rótulos dos grupos e inspecionar visualmente. y x Points Similarity 0 Points

90 < 8: & ) Grupos em dados aleatórios não são tão definidos Points y Similarity 0 Points x DBSCAN

91 < 8: & ) Grupos em dados aleatórios não são tão definidos Points y Similarity 0 Points x K-médio

92 < 8: & ) Grupos em dados aleatórios não são tão definidos Points Similarity 0 Points y x Complete Link

93 < 8: & ) DBSCAN

94 8 +$&&- Grupos em figuras mais complicadas não são bem separados Índice Interno: Usado para medir quão boa é a estrutura de agrupamento sem relação a alguma informação externa SSE é bom para comparar dois agrupamentos ou dois grupos (SSE média) Também pode ser usado para estimar número de grupos SSE K

95 8 +$&&- Curva do SSE para conjunto de dados mais complicado SSE de grupos encontrados usando K-médio

96 -) Precisa-se de estrutura para interpretar qualquer medida Por exemplo, se a medida de avaliação tem valor 0, a qualidade é boa, mediana ou pobre? Estatística fornece estrutura para avaliar grupos Quanto mais atípico o resultado de um agrupamento for, tanto mais provavelmente ele representa uma estrutura válida nos dados Pode comparar os valores de um índice que resulta de dados aleatórios ou agrupamentos com os resultados de agrupamento. Se o valor de um índice é improvável, então os resultados dos grupos são válidos Estas abordagens são mais complicadas e difíceis de compreender Para comparar os resultados de dois diferentes conjuntos de análises de agrupamento, uma estrutura não é tão necessária. Entretanto, há a questão sobre se a diferença entre os valores dos dois índices é significante

97 --&&- Exemplo Comparar SSE de com três grupos em dados aleatórios Histograma mostra SSE de três grupos em conjuntos de pontos de dados aleatórios de tamanho 00 distribuído na faixa para valores de x e y y x Count SSE

98 --" Correlação das matrizes de incidência e proximidade para os agrupamentos de K-médio dos dois seguintes conjuntos de dados y x y x Correlação = Correlação =

99 "() The validation of clustering structures is the most difficult and frustrating part of cluster analysis. Without a strong effort in this direction, cluster analysis will remain a black art accessible only to those true believers who have experience and great courage. Algorithms for Clustering Data, Jain and Dubes

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining Clustering - agrupamento Baseado no capítulo 8 de Introduction to Data Mining de Tan, Steinbach, Kumar Clustering - agrupamento 1 O que é Clustering? Encontar grupos de objectos tal que os objectos dentro

Leia mais

Clustering: K-means and Aglomerative

Clustering: K-means and Aglomerative Universidade Federal de Pernambuco UFPE Centro de Informática Cin Pós-graduação em Ciência da Computação U F P E Clustering: K-means and Aglomerative Equipe: Hugo, Jeandro, Rhudney e Tiago Professores:

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Agrupamento de dados

Agrupamento de dados Organização e Recuperação de Informação: Agrupamento de dados Marcelo K. A. Faculdade de Computação - UFU Agrupamento de dados / 7 Overview Agrupamento: introdução Agrupamento em ORI 3 K-médias 4 Avaliação

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

Técnicas de Clustering: Algoritmos K-means e Aglomerative

Técnicas de Clustering: Algoritmos K-means e Aglomerative Técnicas de Clustering: Algoritmos K-means e Aglomerative Danilo Oliveira, Matheus Torquato Centro de Informática Universidade Federal de Pernambuco 9 de outubro de 2012 Danilo Oliveira, Matheus Torquato

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Uma exploração preliminar dos dados para compreender melhor suas características. Motivações-chave da exploração de dados incluem Ajudar na seleção da técnica correta para pré-processamento ou análise

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008 Tabela de Símbolos Análise Semântica A Tabela de Símbolos Fabiano Baldo Após a árvore de derivação, a tabela de símbolos é o principal atributo herdado em um compilador. É possível, mas não necessário,

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Algoritmo k Means Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) 2 Problema do Agrupamento Seja x = (x 1, x 2,,

Leia mais

Recuperação de Informação em Bases de Texto. Aula 10

Recuperação de Informação em Bases de Texto. Aula 10 Aula 10 1 Agrupamento/ clustering de documentos: Agrupar os documentos em classes/grupos, de acordo com a sua semelhança Aprendizagem não supervisionada Sem conjunto de treino/exemplos 2 3 Agrupamento/

Leia mais

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type.

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type. Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/ Factor Analysis (FACAN) Abrir o arquivo ven_car.sav Utilizar as 10 variáveis a

Leia mais

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões Classificação de imagens Autor: Gil Gonçalves Disciplinas: Detecção Remota/Detecção Remota Aplicada Cursos: MEG/MTIG Ano Lectivo: 11/12 Sumário Classificação da imagem (ou reconhecimento de padrões): objectivos

Leia mais

Pré processamento de dados II. Mineração de Dados 2012

Pré processamento de dados II. Mineração de Dados 2012 Pré processamento de dados II Mineração de Dados 2012 Luís Rato Universidade de Évora, 2012 Mineração de dados / Data Mining 1 Redução de dimensionalidade Objetivo: Evitar excesso de dimensionalidade Reduzir

Leia mais

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE MÓDULO 6 INTRODUÇÃO À PROBBILIDDE Quando estudamos algum fenômeno através do método estatístico, na maior parte das vezes é preciso estabelecer uma distinção entre o modelo matemático que construímos para

Leia mais

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS Obter uma imagem temática a partir de métodos de classificação de imagens multi- espectrais 1. CLASSIFICAÇÃO POR PIXEL é o processo de extração

Leia mais

A Otimização Colônia de Formigas

A Otimização Colônia de Formigas A Otimização Colônia de Formigas Estéfane G. M. de Lacerda Departamento de Engenharia da Computação e Automação UFRN 22/04/2008 Índice A Inspiração Biológica O Ant System Aplicado ao PCV O Ant System Aplicado

Leia mais

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014 PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA 09/abril de 2014 Considerações Estatísticas para Planejamento e Publicação 1 Circularidade do Método

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Engenharia Informática (ramos de Gestão e Industrial) Departamento de Sistemas e Informação Reconhecimento de Padrões Projecto Final 2004/2005 Realizado por: Prof. João Ascenso. Departamento de Sistemas

Leia mais

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento Professor Rene - UNIP 1 Roteamento Dinâmico Perspectiva e histórico Os protocolos de roteamento dinâmico são usados

Leia mais

Projeto de Redes Neurais e MATLAB

Projeto de Redes Neurais e MATLAB Projeto de Redes Neurais e MATLAB Centro de Informática Universidade Federal de Pernambuco Sistemas Inteligentes IF684 Arley Ristar arrr2@cin.ufpe.br Thiago Miotto tma@cin.ufpe.br Baseado na apresentação

Leia mais

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido Arquitetura Roteiro Arquitetura Tipos de Arquitetura Centralizado Descentralizado Hibrido Questionário 2 Arquitetura Figura 1: Planta baixa de uma casa 3 Arquitetura Engenharia de Software A arquitetura

Leia mais

SUMÁRIO. Introdução... 3

SUMÁRIO. Introdução... 3 SUMÁRIO Introdução..................................... 3 1 Consultas por Similaridade e Espaços métricos............. 5 1.1 Consultas por abrangência e consultas aos k-vizinhos mais próximos... 5 1.2

Leia mais

Prof. Antonio Torres antonioctorres@gmail.com @_antonioctorres. Fundamentos de Sistemas Operacionais UNIP/2015

Prof. Antonio Torres antonioctorres@gmail.com @_antonioctorres. Fundamentos de Sistemas Operacionais UNIP/2015 Prof. Antonio Torres antonioctorres@gmail.com @_antonioctorres Fundamentos de Sistemas Operacionais UNIP/2015 Disciplinas FUNDAMENTOS DE SISTEMAS OPERACIONAIS Horários Quarta-feira Fundamentos de Sistemas

Leia mais

MLP (Multi Layer Perceptron)

MLP (Multi Layer Perceptron) MLP (Multi Layer Perceptron) André Tavares da Silva andre.silva@udesc.br Roteiro Rede neural com mais de uma camada Codificação de entradas e saídas Decorar x generalizar Perceptron Multi-Camada (MLP -

Leia mais

Inteligência de Enxame: ACO

Inteligência de Enxame: ACO Inteligência de Enxame: ACO! Otimização colônia de formigas é uma meta-heurística: «baseada em população «inspirada no comportamento forrageiro das formigas.! Muitas espécies de formigas são quase cegas.!

Leia mais

Aprendizagem de Máquina. Ivan Medeiros Monteiro

Aprendizagem de Máquina. Ivan Medeiros Monteiro Aprendizagem de Máquina Ivan Medeiros Monteiro Definindo aprendizagem Dizemos que um sistema aprende se o mesmo é capaz de melhorar o seu desempenho a partir de suas experiências anteriores. O aprendizado

Leia mais

Dificuldades de Modelos de PNL. Onde está a solução ótima? Outro exemplo: Condição ótima Local vs. Global. 15.053 Quinta-feira, 25 de abril

Dificuldades de Modelos de PNL. Onde está a solução ótima? Outro exemplo: Condição ótima Local vs. Global. 15.053 Quinta-feira, 25 de abril 15.053 Quinta-feira, 25 de abril Teoria de Programação Não-Linear Programação Separável Dificuldades de Modelos de PNL Programa Linear: Apostilas: Notas de Aula Programas Não-Lineares 1 2 Análise gráfica

Leia mais

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu 1 Programação Não Linear Aula 25: Programação Não-Linear - Funções de Uma única variável Mínimo; Mínimo Global; Mínimo Local; Optimização Irrestrita; Condições Óptimas; Método da Bissecção; Método de Newton.

Leia mais

Departamento de Matemática - UEL - 2010. Ulysses Sodré. http://www.mat.uel.br/matessencial/ Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

Departamento de Matemática - UEL - 2010. Ulysses Sodré. http://www.mat.uel.br/matessencial/ Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010. Matemática Essencial Extremos de funções reais Departamento de Matemática - UEL - 2010 Conteúdo Ulysses Sodré http://www.mat.uel.br/matessencial/ Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

Leia mais

Localização dos inquéritos de rua para Arroios e Gulbenkian

Localização dos inquéritos de rua para Arroios e Gulbenkian Project IAAPE Pedestrian Accessibility and Attractiveness Indicators: Tool for Urban Walkability Assessment and Management Working Paper No. WP-8 Localização dos inquéritos de rua para Arroios e Gulbenkian

Leia mais

CAP 254 CAP 254. Otimização Combinatória. Professor: Dr. L.A.N. Lorena. Assunto: Metaheurísticas Antonio Augusto Chaves

CAP 254 CAP 254. Otimização Combinatória. Professor: Dr. L.A.N. Lorena. Assunto: Metaheurísticas Antonio Augusto Chaves CAP 254 CAP 254 Otimização Combinatória Professor: Dr. L.A.N. Lorena Assunto: Metaheurísticas Antonio Augusto Chaves Conteúdo C01 Simulated Annealing (20/11/07). C02 Busca Tabu (22/11/07). C03 Colônia

Leia mais

Diagrama de transição de Estados (DTE)

Diagrama de transição de Estados (DTE) Diagrama de transição de Estados (DTE) O DTE é uma ferramenta de modelação poderosa para descrever o comportamento do sistema dependente do tempo. A necessidade de uma ferramenta deste tipo surgiu das

Leia mais

4 Aplicativo para Análise de Agrupamentos

4 Aplicativo para Análise de Agrupamentos 65 4 Aplicativo para Análise de Agrupamentos Este capítulo apresenta a modelagem de um aplicativo, denominado Cluster Analysis, dedicado à formação e análise de grupos em bases de dados. O aplicativo desenvolvido

Leia mais

Probabilidade. Distribuição Normal

Probabilidade. Distribuição Normal Probabilidade Distribuição Normal Distribuição Normal Uma variável aleatória contínua tem uma distribuição normal se sua distribuição é: simétrica apresenta (num gráfico) forma de um sino Função Densidade

Leia mais

Inteligência Computacional Aplicada a Engenharia de Software

Inteligência Computacional Aplicada a Engenharia de Software Inteligência Computacional Aplicada a Engenharia de Software Estudo de caso III Prof. Ricardo de Sousa Britto rbritto@ufpi.edu.br Introdução Em alguns ambientes industriais, pode ser necessário priorizar

Leia mais

Teste de Software. Ricardo Argenton Ramos ricargentonramos@gmail.com. Engenharia de Software I 2012.2

Teste de Software. Ricardo Argenton Ramos ricargentonramos@gmail.com. Engenharia de Software I 2012.2 Teste de Software Ricardo Argenton Ramos ricargentonramos@gmail.com Engenharia de Software I 2012.2 O que diferencia teste de software OO de testes Convencionais? Técnicas e abordagens são normalmente

Leia mais

3 Metodologia para Segmentação do Mercado Bancário

3 Metodologia para Segmentação do Mercado Bancário 3 Metodologia para Segmentação do Mercado Bancário Este capítulo descreve a metodologia proposta nesta dissertação para a segmentação do mercado bancário a partir da abordagem post-hoc, servindo-se de

Leia mais

Aula 20. Roteamento em Redes de Dados. Eytan Modiano MIT

Aula 20. Roteamento em Redes de Dados. Eytan Modiano MIT Aula 20 Roteamento em Redes de Dados Eytan Modiano MIT 1 Roteamento Deve escolher rotas para vários pares origem, destino (pares O/D) ou para várias sessões. Roteamento datagrama: a rota é escolhida para

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas

Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas Processamento e Otimização de Consultas Banco de Dados Motivação Consulta pode ter sua resposta computada por uma variedade de métodos (geralmente) Usuário (programador) sugere uma estratégia para achar

Leia mais

ISO/IEC 12207: Gerência de Configuração

ISO/IEC 12207: Gerência de Configuração ISO/IEC 12207: Gerência de Configuração Durante o processo de desenvolvimento de um software, é produzida uma grande quantidade de itens de informação que podem ser alterados durante o processo Para que

Leia mais

Ciclo de Desenvolvimento de Sistemas de BD

Ciclo de Desenvolvimento de Sistemas de BD Gerenciamento de Dados e Informação Fernando Fonseca Ana Carolina Valeria Times Bernadette Loscio Robson Nascimento Ciclo de Desenvolvimento de Sistemas de BD Investigação dos Dados Modelagem dos Dados

Leia mais

2. Método de Monte Carlo

2. Método de Monte Carlo 2. Método de Monte Carlo O método de Monte Carlo é uma denominação genérica tendo em comum o uso de variáveis aleatórias para resolver, via simulação numérica, uma variada gama de problemas matemáticos.

Leia mais

Projeto e Análise de Algoritmos Projeto de Algoritmos Introdução. Prof. Humberto Brandão humberto@dcc.ufmg.br

Projeto e Análise de Algoritmos Projeto de Algoritmos Introdução. Prof. Humberto Brandão humberto@dcc.ufmg.br Projeto e Análise de Algoritmos Projeto de Algoritmos Introdução Prof. Humberto Brandão humberto@dcc.ufmg.br aula disponível no site: http://www.bcc.unifal-mg.edu.br/~humberto/ Universidade Federal de

Leia mais

Introdução a Química Analítica. Professora Mirian Maya Sakuno

Introdução a Química Analítica. Professora Mirian Maya Sakuno Introdução a Química Analítica Professora Mirian Maya Sakuno Química Analítica ou Química Quantitativa QUÍMICA ANALÍTICA: É a parte da química que estuda os princípios teóricos e práticos das análises

Leia mais

Feature-Driven Development

Feature-Driven Development FDD Feature-Driven Development Descrição dos Processos Requisitos Concepção e Planejamento Mais forma que conteúdo Desenvolver um Modelo Abrangente Construir a Lista de Features Planejar por

Leia mais

Este documento foi elaborado sob a licença

Este documento foi elaborado sob a licença 1 2 Este documento foi elaborado sob a licença Atribuição - Não Comercial - Sem Trabalhos Derivados Brasil (CC BY-NC-ND 4.0) Sobre este documento, você tem o direito de: Compartilhar - reproduzir, distribuir

Leia mais

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES 3.1 - IDENTIFICADORES Os objetos que usamos no nosso algoritmo são uma representação simbólica de um valor de dado. Assim, quando executamos a seguinte instrução:

Leia mais

A limiarização é uma das abordagens mais importantes de segmentação de imagens. A limiarização é um caso específico de segmentação.

A limiarização é uma das abordagens mais importantes de segmentação de imagens. A limiarização é um caso específico de segmentação. Limiarização A limiarização é uma das abordagens mais importantes de segmentação de imagens. A limiarização é um caso específico de segmentação. O princípio da limiarização consiste em separar as regiões

Leia mais

Conteúdo. Disciplina: INF 02810 Engenharia de Software. Monalessa Perini Barcellos. Centro Tecnológico. Universidade Federal do Espírito Santo

Conteúdo. Disciplina: INF 02810 Engenharia de Software. Monalessa Perini Barcellos. Centro Tecnológico. Universidade Federal do Espírito Santo Universidade Federal do Espírito Santo Centro Tecnológico Departamento de Informática Disciplina: INF 02810 Prof.: (monalessa@inf.ufes.br) Conteúdo 1. Introdução 2. Processo de Software 3. Gerência de

Leia mais

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

Pós-Graduação em Gerenciamento de Projetos práticas do PMI Pós-Graduação em Gerenciamento de Projetos práticas do PMI Planejamento do Gerenciamento das Comunicações (10) e das Partes Interessadas (13) PLANEJAMENTO 2 PLANEJAMENTO Sem 1 Sem 2 Sem 3 Sem 4 Sem 5 ABRIL

Leia mais

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler

Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler Tecnologia em Gestão Pública Desenvolvimento de Projetos - Aula 9 Prof. Rafael Roesler Introdução Objetivos da Gestão dos Custos Processos da Gerência de Custos Planejamento dos recursos Estimativa dos

Leia mais

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo UNIVERSIDADE DE SÃO PAULO Faculdade de Arquitetura e Urbanismo DISTRIBUIÇÃO AMOSTRAL ESTIMAÇÃO AUT 516 Estatística Aplicada a Arquitetura e Urbanismo 2 DISTRIBUIÇÃO AMOSTRAL Na aula anterior analisamos

Leia mais

Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008

Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008 PROJECTOS DE INVESTIGAÇÃO CIENTÍFICA E DESENVOLVIMENTO TECNOLÓGICO Clip-art Retrieval using Sketches PTDC/EIA-EIA/108077/2008 Deliverable: D1 - Clip-art Simplification Tool Task: T1 - Clip-art Simplification

Leia mais

4 Avaliação Econômica

4 Avaliação Econômica 4 Avaliação Econômica Este capítulo tem o objetivo de descrever a segunda etapa da metodologia, correspondente a avaliação econômica das entidades de reservas. A avaliação econômica é realizada a partir

Leia mais

CAP. I ERROS EM CÁLCULO NUMÉRICO

CAP. I ERROS EM CÁLCULO NUMÉRICO CAP. I ERROS EM CÁLCULO NUMÉRICO 0. Introdução Por método numérico entende-se um método para calcular a solução de um problema realizando apenas uma sequência finita de operações aritméticas. A obtenção

Leia mais

Regra do Evento Raro p/ Inferência Estatística:

Regra do Evento Raro p/ Inferência Estatística: Probabilidade 3-1 Aspectos Gerais 3-2 Fundamentos 3-3 Regra da Adição 3-4 Regra da Multiplicação: 3-5 Probabilidades por Meio de Simulações 3-6 Contagem 1 3-1 Aspectos Gerais Objetivos firmar um conhecimento

Leia mais

3 Classificação. 3.1. Resumo do algoritmo proposto

3 Classificação. 3.1. Resumo do algoritmo proposto 3 Classificação Este capítulo apresenta primeiramente o algoritmo proposto para a classificação de áudio codificado em MPEG-1 Layer 2 em detalhes. Em seguida, são analisadas as inovações apresentadas.

Leia mais

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I! A utilização de escores na avaliação de crédito! Como montar um plano de amostragem para o credit scoring?! Como escolher as variáveis no modelo de credit

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

Teorema do Limite Central e Intervalo de Confiança

Teorema do Limite Central e Intervalo de Confiança Probabilidade e Estatística Teorema do Limite Central e Intervalo de Confiança Teorema do Limite Central Teorema do Limite Central Um variável aleatória pode ter uma distribuição qualquer (normal, uniforme,...),

Leia mais

CAPÍTULO 7 NÍVEL DE LINGUAGEM DE MONTAGEM

CAPÍTULO 7 NÍVEL DE LINGUAGEM DE MONTAGEM CAPÍTULO 7 NÍVEL DE LINGUAGEM DE MONTAGEM 71 Introdução Difere dos níveis inferiores por ser implementado por tradução A tradução é usada quando um processador está disponível para uma mensagem fonte mas

Leia mais

Norma Interpretativa 2 (NI2) - Uso de Técnicas de Valor Presente para mensurar o Valor de Uso.

Norma Interpretativa 2 (NI2) - Uso de Técnicas de Valor Presente para mensurar o Valor de Uso. Tópicos Valor de Uso NCRF12 - Imparidade de activos Norma Interpretativa 2 (NI2) - Uso de Técnicas de Valor Presente para mensurar o Valor de Uso. 4 - Definições Perda por imparidade: é o excedente da

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Revisão de Probabilidade e Estatística Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Conceitos Básicos Estamos

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

Status. Barra de Título. Barra de Menu. Barra de. Ferramentas Padrão. Caixa de nomes. Barra de. Ferramentas de Formatação. Indicadores de Coluna

Status. Barra de Título. Barra de Menu. Barra de. Ferramentas Padrão. Caixa de nomes. Barra de. Ferramentas de Formatação. Indicadores de Coluna O que é uma planilha eletrônica? É um aplicativo que oferece recursos para manipular dados organizados em tabelas. A partir deles pode-se gerar gráficos facilitando a análise e interpretação dos dados

Leia mais

Filosofia e Conceitos

Filosofia e Conceitos Filosofia e Conceitos Objetivo confiabilidade para o usuário das avaliações. 1. Princípios e definições de aceitação genérica. 2. Comentários explicativos sem incluir orientações em técnicas de avaliação.

Leia mais

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd. Apresentação Este curso tem como objetivo, oferecer uma noção geral sobre a construção de sistemas de banco de dados. Para isto, é necessário estudar modelos para a construção de projetos lógicos de bancos

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Análisede links Page Rank Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Motivação Suponha que um modelo clássico, como

Leia mais

Qual é o risco real do Private Equity?

Qual é o risco real do Private Equity? Opinião Qual é o risco real do Private Equity? POR IVAN HERGER, PH.D.* O debate nos mercados financeiros vem sendo dominado pela crise de crédito e alta volatilidade nos mercados acionários. Embora as

Leia mais

CAPÍTULO 1 Introduzindo SIG

CAPÍTULO 1 Introduzindo SIG CAPÍTULO 1 Introduzindo SIG Por muito tempo, estudou-se o mundo usando modelos como mapas e globos. Aproximadamente nos últimos trinta anos, tornou-se possível colocar estes modelos dentro de computadores

Leia mais

01/05/2016. Danillo Tourinho Sancho da Silva, MSc ROTEIRIZAÇÃO TEORIA DOS GRAFOS MOTIVAÇÃO

01/05/2016. Danillo Tourinho Sancho da Silva, MSc ROTEIRIZAÇÃO TEORIA DOS GRAFOS MOTIVAÇÃO ROTEIRIZAÇÃO Danillo Tourinho Sancho da Silva, MSc TEORIA DOS GRAFOS MOTIVAÇÃO 1 MOTIVAÇÃO Por que estudar grafos? Importante ferramenta matemática com aplicação em diversas áreas do conhecimento Utilizados

Leia mais

IA: Problemas de Satisfação de Restrições. Prof. Msc. Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br

IA: Problemas de Satisfação de Restrições. Prof. Msc. Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br IA: Problemas de Satisfação de Restrições Prof. Msc. Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br Introdução Um PSR é definido por um conjunto de variáveis X 1, X 2,..., X n, e por um conjunto de restrições,

Leia mais

6 Construção de Cenários

6 Construção de Cenários 6 Construção de Cenários Neste capítulo será mostrada a metodologia utilizada para mensuração dos parâmetros estocásticos (ou incertos) e construção dos cenários com respectivas probabilidades de ocorrência.

Leia mais

IA Colônia de Formigas. Prof. Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br

IA Colônia de Formigas. Prof. Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br IA Colônia de Formigas Prof. Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br Sumário Introdução O Experimento da Ponte Binária. Ant System Aplicado ao PCV. Elitist Ant System. Introdução Otimização colônia

Leia mais

BCC202 - Estrutura de Dados I

BCC202 - Estrutura de Dados I BCC202 - Estrutura de Dados I Aula 04: Análise de Algoritmos (Parte 1) Reinaldo Fortes Universidade Federal de Ouro Preto, UFOP Departamento de Ciência da Computação, DECOM Website: www.decom.ufop.br/reifortes

Leia mais

Histogramas. 12 de Fevereiro de 2015

Histogramas. 12 de Fevereiro de 2015 Apêndice B Histogramas Uma situação comum no laboratório e na vida real é a de se ter uma grande quantidade de dados e deles termos que extrair uma série de informações. Encontramos essa situação em pesquisas

Leia mais

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica Mapeamento não-linear Radiologia Digital Unidade de Aprendizagem Radiológica Princípios Físicos da Imagem Digital 1 Professor Paulo Christakis 1 2 Sistema CAD Diagnóstico auxiliado por computador ( computer-aided

Leia mais

SUMÁRIO Acesso ao sistema... 2 Atendente... 3

SUMÁRIO Acesso ao sistema... 2 Atendente... 3 SUMÁRIO Acesso ao sistema... 2 1. Login no sistema... 2 Atendente... 3 1. Abrindo uma nova Solicitação... 3 1. Consultando Solicitações... 5 2. Fazendo uma Consulta Avançada... 6 3. Alterando dados da

Leia mais

Concepção e Elaboração

Concepção e Elaboração UNIVERSIDADE ESTADUAL PAULISTA INSTITUTO DE BIOCIÊNCIAS, LETRAS E CIÊNCIAS EXATAS DEPARTAMENTO DE CIÊNCIAS DE COMPUTAÇÃO E ESTATÍSTICA Análise e Projeto Orientado a Objetos Concepção e Elaboração Estudo

Leia mais

5 A Utilização da Técnica do Espaço Nulo e dos Atributos Baseados na Escolha de Coeficientes de Autocorrelações

5 A Utilização da Técnica do Espaço Nulo e dos Atributos Baseados na Escolha de Coeficientes de Autocorrelações 5 A Utilização da Técnica do Espaço Nulo e dos Atributos Baseados na Escolha de Coeficientes de Autocorrelações Este capítulo apresenta uma nova proposta que consiste em empregar os atributos baseados

Leia mais

A lógica de programação ajuda a facilitar o desenvolvimento dos futuros programas que você desenvolverá.

A lógica de programação ajuda a facilitar o desenvolvimento dos futuros programas que você desenvolverá. INTRODUÇÃO A lógica de programação é extremamente necessária para as pessoas que queiram trabalhar na área de programação, seja em qualquer linguagem de programação, como por exemplo: Pascal, Visual Basic,

Leia mais

Arquitetura de Computadores - Arquitetura RISC. por Helcio Wagner da Silva

Arquitetura de Computadores - Arquitetura RISC. por Helcio Wagner da Silva Arquitetura de Computadores - Arquitetura RISC por Helcio Wagner da Silva Introdução RISC = Reduced Instruction Set Computer Elementos básicos: Grande número de registradores de propósito geral ou uso

Leia mais

Teoria dos Grafos. Edson Prestes

Teoria dos Grafos. Edson Prestes Edson Prestes Complemento de Grafos Mostre que para qualquer Grafo G com 6 pontos, G ou possui um triângulo Considere um vértice v de V(G). Sem perda de generalidade, podemos assumir v é adjacente a outros

Leia mais

PLANEJAMENTO EXPERIMENTAL

PLANEJAMENTO EXPERIMENTAL PLANEJAMENTO EXPERIMENTAL Técnicas de Pesquisas Experimentais LUIS HENRIQUE STOCCO MARCIO TENÓRIO SANDRA MARCHI Introdução O Planejamento de Experimentos (Design of Experiments, DoE), técnica utilizada

Leia mais

1. Introdução. 1.1 Introdução

1. Introdução. 1.1 Introdução 1. Introdução 1.1 Introdução O interesse crescente dos físicos na análise do comportamento do mercado financeiro, e em particular na análise das séries temporais econômicas deu origem a uma nova área de

Leia mais

Faculdade Lourenço Filho - ENADE 2011-1

Faculdade Lourenço Filho - ENADE 2011-1 1. Quando se constrói um banco de dados, define-se o modelo de entidade e relacionamento (MER), que é a representação abstrata das estruturas de dados do banco e seus relacionamentos. Cada entidade pode

Leia mais

9.5.2. Preparando um esquema de endereçamento de sua rede

9.5.2. Preparando um esquema de endereçamento de sua rede Guia Internet de Conectividade - Cyclades - Endereçamento IP - página 1 9.5. Identificação dos Hosts em uma rede Todo sistema ou host que você quiser conectar em sua rede deve ter uma única identificação

Leia mais

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A. IMES Catanduva Probabilidades e Estatística Estatística no Excel Matemática Bertolo, L.A. Aplicada Versão BETA Maio 2010 Bertolo Estatística Aplicada no Excel Capítulo 3 Dados Bivariados São pares de valores

Leia mais

Estatísticas Nacionais do Fone@RNP (VoIP) Manual do Usuário Estatísticas do Fone@RNP

Estatísticas Nacionais do Fone@RNP (VoIP) Manual do Usuário Estatísticas do Fone@RNP Manual do Usuário Estatísticas do Fone@RNP Uso do Mapa A utilização do mapa como filtro reflete nos relatórios exibidos no DASHBOARD. Além de modificar os gráficos por conseqüência dos filtros por Região

Leia mais

ENGENHARIA DA COMPUTAÇÃO BANCO DE DADOS I CONTEÚDO 5 ABORDAGEM RELACIONAL

ENGENHARIA DA COMPUTAÇÃO BANCO DE DADOS I CONTEÚDO 5 ABORDAGEM RELACIONAL ENGENHARIA DA COMPUTAÇÃO BANCO DE DADOS I CONTEÚDO 5 ABORDAGEM RELACIONAL PROF. MS C. RICARDO ANTONELLO WWW.ANTONELLO.COM.B R PORQUE SER RELACIONAL? Hoje, há um claro predomínio dos SGBD relacionais, principalmente

Leia mais

Introdução aos critérios de consulta. Um critério é semelhante a uma fórmula é uma cadeia de caracteres que pode consistir em

Introdução aos critérios de consulta. Um critério é semelhante a uma fórmula é uma cadeia de caracteres que pode consistir em Material retirado do site Office online. Introdução aos critérios de consulta Um critério é semelhante a uma fórmula é uma cadeia de caracteres que pode consistir em referências de campo, operadores e

Leia mais

Noções de Pesquisa e Amostragem. André C. R. Martins

Noções de Pesquisa e Amostragem. André C. R. Martins Noções de Pesquisa e Amostragem André C. R. Martins 1 Bibliografia Silva, N. N., Amostragem probabilística, EDUSP. Freedman, D., Pisani, R. e Purves, R., Statistics, Norton. Tamhane, A. C., Dunlop, D.

Leia mais

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini E-mail: prof.andre.luis.belini@gmail.com /

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini E-mail: prof.andre.luis.belini@gmail.com / Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini E-mail: prof.andre.luis.belini@gmail.com / andre.belini@ifsp.edu.br MATÉRIA: GESTÃO DE PROJETOS Aula N : 10 Tema: Gerenciamento

Leia mais

GERAÇÃO DE VIAGENS. 1.Introdução

GERAÇÃO DE VIAGENS. 1.Introdução GERAÇÃO DE VIAGENS 1.Introdução Etapa de geração de viagens do processo de planejamento dos transportes está relacionada com a previsão dos tipos de viagens de pessoas ou veículos. Geralmente em zonas

Leia mais

O que é a estatística?

O que é a estatística? Elementos de Estatística Prof. Dr. Clécio da Silva Ferreira Departamento de Estatística - UFJF O que é a estatística? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Aula anterior Organização e Recuperação de Informação(GSI521) Modelo vetorial- Definição Para o modelo vetorial, o

Leia mais