Visualização Multi-dimensional: Mineração Visual de Dados multidimensionais e alicações Parte I Rosane Minghim 8- Visualização Multidimensional Projeções Coleções de Documentos Coleções de Imagens Visualização Análise de Dados emineração Visual Projeções Exemlos: Textos e Imagens Continuidade
Scatter Plot Matrix Data Matrix
Correlation Matrix Parallel Coordinates
Parallel Coordinates 7 RadViz 8
Chernoff Faces 9 Stick Figures roerties of a line icon two attributes of the data are maed to the dislay axes the remaining attributes are maed to the angle/length of the limbs texture atterns in the isualization show certain data characteristics β γ α δ ε Stick Figure Icon A Family of Stick Figures
Stick Figure Icon -dimensional NOAA image data from the great lake region IBM DOLLAR IBM DOLLAR DOW JONES GOLD.US$ Peano-Hilbert Sace-Filling Cures DOW JONES Morton (Z-Cure) GOLD.US$
Cone Tree File system structure isualized as a cone tree Animated D isualization of hierarchical data 7
SOM based Self-Organization Mas (SOMs) cartográficos (ex. Skurin ) Maeamento ara o lano ermitindo a exloração. Ex: Patents surgery, drugs, molecular bio 8
Projection Techniques X R m f Y R,, δ: x i, x j R, x i,x j X d: y i, y j R, y i,y j Y f: X Y, δ(x i,x j ) d(f(x i ), f(x j )), x i,x j X 7 8 9
Problems PCA 9 dimensions 9 Problems PCA
Problems PCA Ex: Sammon Maing Let X be the oints in the original sace R n, we aly a distance measure d ij * between Xi an Xj., and find Y, the rojected oint, ex. R and d ij the Euclidean distance between them. Sammon s method alies an error function to measure the target.
Force Based Point Placement Force Scheme [Tejada et al., ] q' x'
Force Scheme [Tejada et al., ] q' x' Force Scheme [Tejada et al., ] < q' x'
Force Scheme [Tejada et al., ] < < x' > < > 7 Force Scheme [Tejada et al., ]. Maear cada onto em X ara um onto no lano (fastma, nn, etc.). Para cada onto rojetado x. Para cada onto rojetado q x. Calcular o etor de x ara q. Moer q na direção de uma fração de δ ( x, q) δ min d( x', q' ) δ max δ min. Normalizar as coordenadas entre [,] 8
LSP [Pauloich et al., /8] Least-Square Projection (LSP) Idéia central: rojetar um sub-conjunto de ontos e interolar o restante Interolação busca reserar a izinhança entre os ontos Cada onto é maeado dentro do fecho conexo de seus izinhos 9 LSP [Pauloich et al., /8] Três assos rinciais. Selecionar um subconjunto de ontos (ontos de controle) e rojetar esses em R. Determinar a izinhança dos ontos. Construir um sistema linear cujas resostas são as coordenadas cartesianas dos ontos i em R
LSP: Matriz Lalaciana Seja V i i,, iki a izinhança de um onto i e seja c i as coordenadas de i em R i i c i c j ki j V i i i i i Cada i será o centróide dos ontos em V i LSP: Matriz Lalaciana Lx, Lx,, Lx onde x, x,, x são etores contendo as coordenadas cartesianas dos ontos e L é a matriz dada or Lij ki i j j V i caso contrário L x x M M x n...
LSP: Adicionando os Pontos de Controle L j é um onto de controle A Cij C caso contrário b i x ci i n n < i n + nc L L L x x M M x n M M c c LSP: Visão Geral Pontos em R m Escolher os ontos de controle Projetar os ontos de controle Resoler um sistema linear esarso Pontos em R Determinar a izinhança dos ontos 7
8 LSP: Exemlo de Sistema L LSP: Exemlo de Sistema L
9 7 LSP: Exemlo de Sistema L 8 LSP: Exemlo de Sistema c L A
9 LSP: Exemlo de Sistema c L C A x x n c c x x x A M M LSP: Exemlo de Sistema c
x x n c c x x x A M M LSP: Exemlo de Sistema c y y n c c y y y A M M LSP: Exemlo de Sistema c
y y n c c y y y A M M LSP: Exemlo de Sistema c É necessário resoler Este sistema é resolido usando mínimos quadrados A única solução analítica será A T A é simétrica e esarsa e ode ser resolida usando a fatoração de Cholesky LSP: Resolendo o Sistema A x b ( ) T T T T A A A A A A x b x b Ax b
Choosing the Control Points In order to select the control oints the sace R m is slit into nc clusters using k-medoids. the control oints are the medoids of each cluster Choosing the Control Points Once the control oints are chosen, these oints are rojected onto R d through a fast dimensionality reduction method Fast Projection (Fastma or NNP) Force Placement
Control oints in blue 7 Content based by Projections 8
Exemlo de Projeção 9 Exemlo de Projeção: IDH
Exemlo de Projeção: Votação Point Placement by Phylogenetic Tree Construction Algorithms (N-J Trees)
Point Placement by Phylogenetic Tree Construction Algorithms (N-J Trees) Algorithm Neighbor-joining Inut: distance matrix. Criate a star tree for n objects.. Iteration. Select a node air (i,j) with smaller Sij (branch size). Combine nodes i and j in a new node and calculate the branch size of the new node. 7
Algorithm Neighbor-joining. Calculate new distance matrix, comuting the new distances from the new node to the remaining nodes.. Eliminate reious nodes i and j. If n> then iterate again. NJ similarity Tree 8
Alternate iew (N-J Tree) 7 8 9
Context: Visual Data Mining Definition [Ankerst ] ste in rocess of knowledge discoery / extraction (KDD) utilizes isualization as communication channel between comuter and user to suort identification of new and interretable atterns 9 Visualization by Projections
O caso de coleções de documentos Alicações Ensino/Pesquisa Busca Inestigação Patentes Laudos médicos Notícias Mas of text Collections Based on Relationshis (Borner & Chen) Co-authorshi, co-citation Based on Content Similarity and Grouing Common underlying subject Toics
Relationshis : Toic Busts and co-word (Mane and Borner) Relationshis : Citation and Co-citation (Borner) ()
Content-based Text Maing Aroach : Dimension reduction ex. MSD, SVD, PCA Aroach : Point Placement (PP) Aroach : Clustering Aroach : Projections ex. FASPMAP, NNP, LSP Content - based (Skuin) () (abstracts) SOM
SOM based Self-Organization Mas (SOMs) cartográficos (ex. Skurin ) 7 Content - based (Dimensional Reduction) News flash IN-SPIRE (PNL) 8
Content based by Projections 9 Exemlo de Projeção 7
Exemlo de Projeção: IDH 7 Exemlo de Projeção: Votação 7
Continua na Parte II : ariações e alicações 7 7