Visualização Multidimensional Projeções Coleções de Documentos Coleções de Imagens

Documentos relacionados
Projeções Multi-dimensionais

Visualização de Informação Parte III. Multi-dimensional Visualization: Visual Mining of Text, Images and other Multi-dimensioanl entities.

Técnicas de Visualização para Dados Multivariados

Processo de Visualização - Modelo de Referência (Card et al. 1999) Maria Cristina F. de Oliveira Rosane Minghim. Classificação (Keim 1996, 2000)

Mapeamento de Dados Multi-dimensionais Integrando

Grupo A: Ana Catarina Aperta, Daniel Peixeiro, Pedro Antunes

Técnicas de Visualização para Dados Multivariados

Número: Nome:

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

Projected Clustering Algorithm

2COP229 Inteligência Computacional. Aula 3. Clusterização.

Pré processamento de dados II. Mineração de Dados 2012

Agrupamento Espectral e Hierárquico

Mapas Auto Organizáveis SOMs Mapas de Kohonen

Teste 1 - Análise Numérica Funcional e Optimização Instituto Superior Técnico, 8 de Novembro de 2012, 12h00-13h30

Chapter 4: Unsupervised Learning

Mapeamento de dados multi-dimensionais integrando mineração e visualização. Fernando Vieira Paulovich

Prova tipo A. Gabarito. Data: 8 de outubro de ) Decida se cada afirmação a seguir é verdadeira ou falsa. 1.a) Considere os vetores de R 3

G3 de Álgebra Linear I

INSTITUTO SUPERIOR TÉCNICO Sistemas de Apoio à Decisão

Márcio Antônio de Andrade Bortoloti

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

Exercícios de matemática - revisão

INSTITUTO SUPERIOR TÉCNICO Sistemas de Apoio à Decisão

Divisão de Engenharia Mecânica. Programa de Pós-Graduação em Engenharia Aeronáutica e Mecânica. Prova de Seleção para Bolsas 1 o semestre de 2013

CANape/vSignalyzer. Data Mining and Report Examples Offline Analysis V

Thiago Christiano Silva

Visualização de Informação Parte I (2010)

Mapeamento de dados multidimensionais usando árvores filogenéticas: foco em mapeamento de textos. Ana Maria Cuadros Valdivia

ÁLGEBRA LINEAR I - MAT0032

[DataSet11] D:\Fmh\Doutoramento\Tese\Dados\Quantitativos\Questionário Prof essores.sav

Mapeamento de Domínios do Conhecimento. Técnicas e Resultados. ção. Motivaçã. Visualizaçã. ção o e Mineraçã ORGANIZAÇÃO. Rosane Minghim ORGANIZAÇÃO

SCC5895 Análise de Agrupamento de Dados

Viewing Pipeline 2D. Viewing Pipeline 2D/3D. Viewing Pipeline 2D. Viewing Pipeline 2D. Maria Cristina F. de Oliveira Rosane Minghim 2005

Valores e vectores próprios

Análise de Componentes Principais (PCA)

Número: Nome:

Créditos. SCC5895 Análise de Agrupamento de Dados. Relembrando... Aula de Hoje. Algoritmos Hierárquicos: Parte I. [ x ] T. Algoritmos Hierárquicos

Redes Complexas Aula 3

PROGRAMAÇÃO DINÂMICA

Análise e Síntese de Algoritmos. Programação Dinâmica CLRS, Cap. 15

Fundamentos em Visualização

Iam Vita Jabour. O Impacto de Atributos Estruturais na Identificação de Tabelas e Listas em Documentos HTML. Dissertação de Mestrado

Exercícios de ANÁLISE E SIMULAÇÃO NUMÉRICA

Análise de componentes principais (PCA)

Introdução a Redes 2 o semestre de Virgílio A. F. Almeida Agosto de 2006

GEOMETRY INTERSECTIONS PROGRAMAÇÃO 3D SIMULAÇÃO E JOGOS MEIC/IST

Escalonamento Multidimensional

Aprendizagem de Dados Simbólicos e/ou Numéricos. Francisco Carvalho

CÁLCULO NUMÉRICO. Profa. Dra. Yara de Souza Tadano

Reflections and Shadows on Planar Surfaces

Ajuste de Splines a um Conjunto de Dados

G2 de Álgebra Linear I

the axiom a string of characters (each one having a meaning) that is used to start the generation of the fractal and an angle θ,

K-MEANS COM ÁRVORES KD

Amostras não Uniformes e Reconstrução em Espaços

Visualização de Informação: Processo, Técnicas e Ferramentas

Número: Nome:

CLARA. Resumo. Introdução. Artigo de Referência [1] Introdução PAM. Modelagem como grafo CLARANS. Comparação de eficiência Conclusão

Sistemas Lineares. ( Aula 3 )

Tutorial 1. Introdução

folha prática 5 valores próprios e vetores próprios página 1/3

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

GEOMETRIA II EXERCÍCIOS RESOLVIDOS - ABRIL, 2018

Em contraste aos métodos de aprendizado que constroem uma descrição explicita genérica da função alvo. Os métodos baseados em instâncias guardam os

UNIVERSIDADE DE COIMBRA - FACULDADE DE CIÊNCIAS E TECNOLOGIA DEPARTAMENTO DE MATEMÁTICA ALGORITMO DO PONTO MÉDIO PARA

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Map05 - Métodos Matriciais Computacionais Mat Álgebra Matricial Computacional Primeiro Exercicio Computacional, entregar ao Prof: 22/10/2012

Provably Good Quality Multi-triangulation of Surfaces

Boids Model Applied to Cell Segregation

Algebra Linear. 1. Ortonormalização. 2. Sistema de Equações Lineares. pag.1 Teoria de Sistemas Lineares Aula 6. c Reinaldo M.

Comunicação Científica I

Matemática Computacional - 2 o ano LEMat e MEQ

Disciplina que estuda métodos analíticos para auxiliar na tomada de decisões.

INSTITUTO SUPERIOR TÉCNICO Sistemas de Apoio à Decisão

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Resolução do Exame Tipo

Sumário DBSCAN kd-trees DBSCAN com kd-trees DBSCAN. DBSCAN Parâmetros: Eps e MinPts Algoritmo: R*-Trees DBSCAN com R*-Trees. Noise

Número: Nome:

INSTITUTO SUPERIOR TÉCNICO Licenciatura em Engenharia Física Tecnológica Licenciatura em Engenharia e Gestão Industrial Ano Lectivo: 2002/

Introduzir os conceitos de base e dimensão de um espaço vetorial. distinguir entre espaços vetoriais de dimensão fnita e infinita;

Course Review for Midterm Exam 1. Cpt S 223 Fall 2010

Divisão de Engenharia Mecânica. Programa de Pós-Graduação em Engenharia Aeronáutica e Mecânica. Prova de Seleção para Bolsas 1 o semestre de 2014

Para calcular o polinómio de Lagrange noutros pontos Ficheiro polagrangeval.m

1ª PROVA ICIN 1º/2015

Os espelhos esféricos são calotas esféricas polidas.

Passo a passo: Software Adjust v (disponível em: Ajustamento de redes de nivelamento altimétrico

Acessando catálogos modernos em Astronomia: dicas e práticas

Multi-Layer. Perceptrons. Algoritmos de Aprendizado. Perceptrons. Perceptrons

P4 de Álgebra Linear I de junho de 2005 Gabarito

Sistemas de Equações Lineares

Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

RESISTÊNCIA DOS MATERIAIS 2 Marcel Merlin dos Santos

Computação e Programação 2009 / 2010

ÁLGEBRA LINEAR I - MAT Em cada item diga se a afirmação é verdadeira ou falsa. Justifiquei sua resposta.

Lista 8 de Álgebra Linear /01 Produto Interno

Rendering Volumétrico Direto A versão resumida. Haim Levkowitz Maria Cristina F. de Oliveira Rosane Minghim

Álgebra Linear e Geometria Anaĺıtica. Matrizes e Sistemas de Equações Lineares

P3 de Álgebra Linear I

Transcrição:

Visualização Multi-dimensional: Mineração Visual de Dados multidimensionais e alicações Parte I Rosane Minghim 8- Visualização Multidimensional Projeções Coleções de Documentos Coleções de Imagens Visualização Análise de Dados emineração Visual Projeções Exemlos: Textos e Imagens Continuidade

Scatter Plot Matrix Data Matrix

Correlation Matrix Parallel Coordinates

Parallel Coordinates 7 RadViz 8

Chernoff Faces 9 Stick Figures roerties of a line icon two attributes of the data are maed to the dislay axes the remaining attributes are maed to the angle/length of the limbs texture atterns in the isualization show certain data characteristics β γ α δ ε Stick Figure Icon A Family of Stick Figures

Stick Figure Icon -dimensional NOAA image data from the great lake region IBM DOLLAR IBM DOLLAR DOW JONES GOLD.US$ Peano-Hilbert Sace-Filling Cures DOW JONES Morton (Z-Cure) GOLD.US$

Cone Tree File system structure isualized as a cone tree Animated D isualization of hierarchical data 7

SOM based Self-Organization Mas (SOMs) cartográficos (ex. Skurin ) Maeamento ara o lano ermitindo a exloração. Ex: Patents surgery, drugs, molecular bio 8

Projection Techniques X R m f Y R,, δ: x i, x j R, x i,x j X d: y i, y j R, y i,y j Y f: X Y, δ(x i,x j ) d(f(x i ), f(x j )), x i,x j X 7 8 9

Problems PCA 9 dimensions 9 Problems PCA

Problems PCA Ex: Sammon Maing Let X be the oints in the original sace R n, we aly a distance measure d ij * between Xi an Xj., and find Y, the rojected oint, ex. R and d ij the Euclidean distance between them. Sammon s method alies an error function to measure the target.

Force Based Point Placement Force Scheme [Tejada et al., ] q' x'

Force Scheme [Tejada et al., ] q' x' Force Scheme [Tejada et al., ] < q' x'

Force Scheme [Tejada et al., ] < < x' > < > 7 Force Scheme [Tejada et al., ]. Maear cada onto em X ara um onto no lano (fastma, nn, etc.). Para cada onto rojetado x. Para cada onto rojetado q x. Calcular o etor de x ara q. Moer q na direção de uma fração de δ ( x, q) δ min d( x', q' ) δ max δ min. Normalizar as coordenadas entre [,] 8

LSP [Pauloich et al., /8] Least-Square Projection (LSP) Idéia central: rojetar um sub-conjunto de ontos e interolar o restante Interolação busca reserar a izinhança entre os ontos Cada onto é maeado dentro do fecho conexo de seus izinhos 9 LSP [Pauloich et al., /8] Três assos rinciais. Selecionar um subconjunto de ontos (ontos de controle) e rojetar esses em R. Determinar a izinhança dos ontos. Construir um sistema linear cujas resostas são as coordenadas cartesianas dos ontos i em R

LSP: Matriz Lalaciana Seja V i i,, iki a izinhança de um onto i e seja c i as coordenadas de i em R i i c i c j ki j V i i i i i Cada i será o centróide dos ontos em V i LSP: Matriz Lalaciana Lx, Lx,, Lx onde x, x,, x são etores contendo as coordenadas cartesianas dos ontos e L é a matriz dada or Lij ki i j j V i caso contrário L x x M M x n...

LSP: Adicionando os Pontos de Controle L j é um onto de controle A Cij C caso contrário b i x ci i n n < i n + nc L L L x x M M x n M M c c LSP: Visão Geral Pontos em R m Escolher os ontos de controle Projetar os ontos de controle Resoler um sistema linear esarso Pontos em R Determinar a izinhança dos ontos 7

8 LSP: Exemlo de Sistema L LSP: Exemlo de Sistema L

9 7 LSP: Exemlo de Sistema L 8 LSP: Exemlo de Sistema c L A

9 LSP: Exemlo de Sistema c L C A x x n c c x x x A M M LSP: Exemlo de Sistema c

x x n c c x x x A M M LSP: Exemlo de Sistema c y y n c c y y y A M M LSP: Exemlo de Sistema c

y y n c c y y y A M M LSP: Exemlo de Sistema c É necessário resoler Este sistema é resolido usando mínimos quadrados A única solução analítica será A T A é simétrica e esarsa e ode ser resolida usando a fatoração de Cholesky LSP: Resolendo o Sistema A x b ( ) T T T T A A A A A A x b x b Ax b

Choosing the Control Points In order to select the control oints the sace R m is slit into nc clusters using k-medoids. the control oints are the medoids of each cluster Choosing the Control Points Once the control oints are chosen, these oints are rojected onto R d through a fast dimensionality reduction method Fast Projection (Fastma or NNP) Force Placement

Control oints in blue 7 Content based by Projections 8

Exemlo de Projeção 9 Exemlo de Projeção: IDH

Exemlo de Projeção: Votação Point Placement by Phylogenetic Tree Construction Algorithms (N-J Trees)

Point Placement by Phylogenetic Tree Construction Algorithms (N-J Trees) Algorithm Neighbor-joining Inut: distance matrix. Criate a star tree for n objects.. Iteration. Select a node air (i,j) with smaller Sij (branch size). Combine nodes i and j in a new node and calculate the branch size of the new node. 7

Algorithm Neighbor-joining. Calculate new distance matrix, comuting the new distances from the new node to the remaining nodes.. Eliminate reious nodes i and j. If n> then iterate again. NJ similarity Tree 8

Alternate iew (N-J Tree) 7 8 9

Context: Visual Data Mining Definition [Ankerst ] ste in rocess of knowledge discoery / extraction (KDD) utilizes isualization as communication channel between comuter and user to suort identification of new and interretable atterns 9 Visualization by Projections

O caso de coleções de documentos Alicações Ensino/Pesquisa Busca Inestigação Patentes Laudos médicos Notícias Mas of text Collections Based on Relationshis (Borner & Chen) Co-authorshi, co-citation Based on Content Similarity and Grouing Common underlying subject Toics

Relationshis : Toic Busts and co-word (Mane and Borner) Relationshis : Citation and Co-citation (Borner) ()

Content-based Text Maing Aroach : Dimension reduction ex. MSD, SVD, PCA Aroach : Point Placement (PP) Aroach : Clustering Aroach : Projections ex. FASPMAP, NNP, LSP Content - based (Skuin) () (abstracts) SOM

SOM based Self-Organization Mas (SOMs) cartográficos (ex. Skurin ) 7 Content - based (Dimensional Reduction) News flash IN-SPIRE (PNL) 8

Content based by Projections 9 Exemlo de Projeção 7

Exemlo de Projeção: IDH 7 Exemlo de Projeção: Votação 7

Continua na Parte II : ariações e alicações 7 7