Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Documentos relacionados
Técnicas de Visualização de Dados aplicadas à Segurança da Informação

Universidade Federal do Ma Pós-Graduação em Eng. Elétrica

Análise de Requisitos

DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)

Tutorial. Georreferenciamento de Imagens. versão /08/2008. Autores: Rafael Bellucci Moretti, Vitor Pires Vencovsky

Prof. Daniela Barreiro Claro

Fundamentos de Teste de Software

CENTRO EDUCACIONAL CHARLES DARWIN ENSINO FUNDAMENTAL. DIRETRIZES CURRICULARES 1º ao 5º ANO MATEMÁTICA

Programação Orientada a Objetos SANTOS, Rafael

BANCO DE DADOS GEOGRÁFICOS E WEBMAPPING. Prof. Angelo Augusto Frozza, M.Sc.

QUESTÕES PARA A 3ª SÉRIE ENSINO MÉDIO MATEMÁTICA 2º BIMESTE SUGESTÕES DE RESOLUÇÕES

Análise Qualitativa no Gerenciamento de Riscos de Projetos

Universidade Federal do Paraná - Setor de Ciências da Terra

ADMINISTRAÇÃO DE BANCOS DE DADOS MÓDULO 8

Autoria: Fernanda Maria Villela Reis Orientadora: Tereza G. Kirner Coordenador do Projeto: Claudio Kirner. Projeto AIPRA (Processo CNPq /2010-2)

Adriana da Silva Santi Coord. Pedagógica de Matemática SMED - Abril/2015

Software PHC com MapPoint 2007

Modelo Entidade Relacionamento (MER) Professor : Esp. Hiarly Alves

Deswik.Sched. Sequenciamento por Gráfico de Gantt

Computação Gráfica - 12

Comandos de Eletropneumática Exercícios Comentados para Elaboração, Montagem e Ensaios

Métodos Estatísticos Avançados em Epidemiologia

Conteúdo programático por disciplina Matemática 6 o ano

MANUAL DO INSTALADOR XD EM AMBIENTES MICROSOFT WINDOWS

Instituto Nacional de Pesquisas Espaciais

Curso de Formação de Oficiais Conhecimentos Específicos ENGENHARIA DE COMPUTAÇÃO CADERNO DE QUESTÕES

Plano de Projeto. Tema 3. Gerência de Projetos Profa. Susana M. Iglesias

GUIA DE DIGITALIZAÇÃO ÓTIMA

Planejamento - 2. Definição de atividades Sequenciamento das atividades. Mauricio Lyra, PMP

Introdução. Modelo de um Sistema de Comunicação

CONCEITOS DE CARTOGRAFIA ENG. CARTÓGRAFA ANNA CAROLINA CAVALHEIRO

Análise espacial do prêmio médio do seguro de automóvel em Minas Gerais

Inteligência Artificial

Fundamentos de Bancos de Dados 3 a Prova Caderno de Questões

Curso de Desenvolvimento de Negócios Sociais e Inclusivos

SISTEMA DE NUMERAÇÃO NA FORMAÇÃO DO ALUNO UTILIZANDO MATERIAL CONCRETO

ESCOLA ESTADUAL DR. MARTINHO MARQUES VERA LUCIA DOS SANTOS GIVANILZA ALVES DOS SANTOS MARIA APARECIDA CRIVELI SIRLEI R. C. DO P.

CIBERESPAÇO E O ENSINO: ANÁLISE DAS REDES SOCIAIS NO ENSINO FUNDAMENTAL II NA ESCOLA ESTADUAL PROFESSOR VIANA

SISTEMAS DE INFORMAÇÕES GEOGRÁFICAS I (GEO 01007) AULA 8

Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste

FERRAMENTAS DA QUALIDADE FOLHA DE VERIFICAÇÃO

Graphing Basic no Excel 2007

Fundamentos de Programação. Diagrama de blocos

Cento de Ensino e Pesquisa Aplicada à Educação. Subárea de Matemática. Plano de Ensino de Matemática 7º Ano

Mídias Discretas. Introdução à Ciência da Informação

ARTIGO. Sobre monitoramento a Distancia e aplicação automática de medicamentos. Sistema de monitoração a distancia e aplicação de medicamentos.

AULA 07 Distribuições Discretas de Probabilidade

PESQUISA OPERACIONAL -PROGRAMAÇÃO LINEAR. Prof. Angelo Augusto Frozza, M.Sc.

FACULDADE SANTA TEREZINHA - CEST COORDENAÇÃO DO CURSO DE TECNOLOGIA EM GESTÃO AMBIENTAL PLANO DE ENSINO

Ficheiro de Matemática

8 -SISTEMA DE PROJEÇÃO UNIVERSAL TRANSVERSA DE MERCATOR - UTM

SISTEMAS OPERACIONAIS. 3ª. Lista de Exercícios

Métodos de Estudo & Investigação Científica. Elaborando um projeto de pesquisa

Ensino Técnico Integrado ao Médio FORMAÇÃO PROFISSIONAL. Plano de Trabalho Docente 2013

Composição do Layout no MicroStation

UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA DEPARTAMENTO DE ENGENHARIA QUÍMICA ENG 008 Fenômenos de Transporte I A Profª Fátima Lopes

Revisão Diagrama de Caso de Uso. Rodolfo Adamshuk Silva 30/08/2013

Processo de Gerenciamento do Catálogo de Serviços de TIC

ENGENHARIA DE SOFTWARE

Aula 04: Dados Profa. Ms. Rosângela da Silva Nunes

Curso de Análise Estatística Comparação entre variáveis contínuas: correlação e regressão Linear

Programação para Internet I 4. XML. Nuno Miguel Gil Fonseca nuno.fonseca@estgoh.ipc.pt

Contabilidade - Conceitos e Objetivos

Sistemas Distribuídos

Tutorial Autodesk Inventor Sheet Metal

epucc.com.br SAIBA COMO INCLUIR INFORMAÇÕES DE COLABORADORES, CENTROS DE CUSTO E RATEIO DE DESPESAS

Primeira Lista de Exercícios de Métodos Numéricos II Primeiro semestre de 2015

2 Workshop processamento de artigos em serviços de saúde Recolhimento de artigos esterilizados: é possível evitar?

Figura 4.1: Diagrama de representação de uma função de 2 variáveis

A CONTAGEM DE ESTRELAS COMO TEMA TRANSVERSAL EM ASTRONOMIA

As Inteligências: arsenal de competitividade e conhecimento para vencer a guerrilha empresarial

Experiência 04: Comandos para testes e identificação do computador na rede.

(72) Inventor(es): (74) Mandatário: (54) Epígrafe: APLICAÇÃO COMPUTORIZADA PARA O CONTROLO DE ROBOTS INDUSTRIAIS

Gestão Documental. Gestão Documental

RELATÓRIO DE AVALIAÇÃO DEPARTAMENTO DE EDUCAÇÃO PRÉ ESCOLAR. Ano Letivo 2014/ º Período

Álgebra Linear Aplicada à Compressão de Imagens. Universidade de Lisboa Instituto Superior Técnico. Mestrado em Engenharia Aeroespacial

Física Experimental III

1 CLASSIFICAÇÃO 2 SOMA DOS ÂNGULOS INTERNOS. Matemática 2 Pedro Paulo

Índice Geral. O Problema do Caminho Mais Curto com um só Objectivo

Tipos de investigação educacional diferenciados por:

Pesquisador em Informações Geográficas e Estatísticas A I GEOMORFOLOGIA LEIA ATENTAMENTE AS INSTRUÇÕES ABAIXO.

Manual de Utilização. Ao acessar o endereço chegaremos a seguinte página de entrada: Tela de Abertura do Sistema

MÓDULO 2 Topologias de Redes

Prof. Regis de Castro Ferreira

Roteiro de Auxílio para as Atividades Práticas de Sistemas de Informação

Lista de Exercícios 5: Soluções Teoria dos Conjuntos

Solicitação de Cadastramento de Instituição de Pesquisa ou Empresa (a partir da versão

CONSIDERAÇÕES BÁSICAS SOBRE PROJETO DE MUSEU DE ARTES VISUAIS 1

Manual do Revisor Oficial de Contas. Recomendação Técnica n.º 5

2.0 O PROJETO DE LAJES PROTENDIDAS - SÍNTESE

Universidade Federal do ABC Disciplina: Natureza da Informação Lista de Exercícios 02 Códigos e conversão A/D Prof. João Henrique Kleinschmidt

Unidade 1: O Computador

Análise da Base Nacional Comum Curricular de Matemática. Revisado por Phil Daro, USA Common Core Standards

NOVA VERSÃO SAFE DOC MANUAL

ENG1000 Introdução à Engenharia

Análise de Sistemas 3º Bimestre (material 2)

Metodologias Ativas de Aprendizagem para a Educação Médica Permanente

Mobilidade: implicações económicas. Prof. João Confraria ( UCP )

Transcrição:

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 4: 1 /57

Programa Dia 1: Apresentação dos conceitos de mineração de dados, motivação e alguns exemplos. Dia 2: Algoritmos de classificação supervisionada e aplicações. Dia 3: Algoritmos de classificação não-supervisionada e aplicações. Algoritmos de mineração de associações. Dia 4: Visualização e mineração de dados. Outros algoritmos e idéias. Onde aprender mais. Dia 4: 2 /57

Visualização Dia 4: 3 /57

Visualização Pode ser usada no início do processo de mineração... Para ter uma idéia da distribuição dos dados ou de relações entre os dados para formulação de hipóteses. Para selecionar atributos ou regiões de dados. Para ter uma idéia de que tipos de algoritmos podem trazer resultados para estes dados. Pode ser usada no final do processo de mineração... Para ver as informações/regras/grupos/etc. obtidos: sumarização do conhecimento. Para ver distribuições contextualizadas (isto é, com conhecimento adicional adquirido integrado). Análise Explorativa / Análise Confirmativa / Apresentação Dia 4: 4 /57

Objetivos de Visualização Análise exploratória: Análise para confirmação: Temos os dados, não temos hipótese sobre os mesmos. Busca visual por padrões, estruturas, etc. Temos os dados e hipótese sobre os mesmos. Busca visual para confirmar ou rejeitar. Apresentação Técnica adequada deve ser usada! Dia 4: 5 /57

Conceitos de Visualização Edward Tufte, The Visual Display of Quantitative Information:... gráficos sobre dados podem fazer muito mais do que simplesmente ser substitutos para pequenas tabelas estatísticas. Na sua melhor concepção, gráficos são instrumentos para compreender informação quantitativa. Frequentemente a forma mais efetiva de descrever, explorar e sumarizar um conjunto de números mesmo um conjunto com muitos números é ver figuras destes números. Adicionalmente, de todas as formas de analisar e comunicar informação estatística, gráficos bem feitos sobre dados são geralmente ao mesmo tempo a mais simples e mais poderosa. Dia 4: 6 /57

http://visualthinkmap.ning.com/ Supergráficos Mapping the Human 'Diseasome' by Marc Vidal, Albert-Laszlo Barabasi and Michael Cusick: ligação entre doenças e genes em comum. Dia 4: 7 /57

Dia 4: 8 /57

Supergráficos Marcha de Napoleão para Moscou na Guerra de 1812 (Charles Joseph Minard) Dia 4: 9 /57

Supergráficos Dia 4: 10 /57

Subjetividade em Visualização Dia 4: 11 /57

Subjetividade em Visualização Dia 4: 12 /57

Visualização Desafios: Subjetividade / Interpretabilidade. Métodos e técnicas específicos. Limitações de hardware (humano e máquina!) Número de dimensões (atributos) dos dados. Número de instâncias para visualização. Empilhamento e ordenação. Vantagens: Inerentemente exploratório. Padrões detectados mesmo que não sejam explicáveis! Dia 4: 13 /57

Visualização: Técnicas Geométricas Idéia básica: transformações e projeções usando arranjos em um número menor de dimensões. Scatterplot Matrices: K atributos em grade KxK. Prosection Views: Scatterplot Matrices com mecanismos de seleção (drill-down). Parallel Coordinates: muito bom para dados mistos, requer exploração e rearranjos. Visualização com Mapas de Kohonen (SOMs). Dia 4: 14 /57

Visualização: Scatterplot Matrices Dia 4: 15 /57

Visualização: Scatterplot Matrices Dia 4: 16 /57

Visualização: Prosection Views Exemplo de R. Spence, ilustrado no tutorial de Daniel Keim. Dia 4: 17 /57

Visualização: Parallel Coordinates Dia 4: 18 /57

Visualização: Parallel Coordinates Dia 4: 19 /57

Visualização: Parallel Coordinates Dia 4: 20 /57

Visualização: Parallel Coordinates Origem do vinho a partir de conteúdo físico-químico (13 atributos) http://archive.ics.uci.edu/ml/datasets/wine (nomes de atributos originais) Dia 4: 21 /57

Visualização: Parallel Coordinates Dia 4: 22 /57

Visualização: Parallel Coordinates X: Flavonoids, Y: Color Intensity Dia 4: 23 /57

Visualização: Parallel Coordinates Fabian Fischer, Florian Mansmann, Daniel A. Keim, Stephan Pietzko, and Marcel Waldvogel. LargeScale Network Monitoring for Visual Analysis of Attacks. VizSec 2008 (LNCS 5210) Dia 4: 24 /57

12x12 SOM, Dados em 8 dimensões. T=0 R=25 Lr=0.9 Dia 4: 25 /57

12x12 SOM, Dados em 8 dimensões. T=40 R=16.7 Lr=0.74 Dia 4: 26 /57

12x12 SOM, Dados em 8 dimensões. T=320 R=1 Lr=0.18 Dia 4: 27 /57

12x12 SOM, Dados em 8 dimensões. T=480 R=1 Lr=0.1 Dia 4: 28 /57

Visualização: Self-Organizing Maps Dia 4: 29 /57

Visualização: Técnicas Baseadas em Ícones Idéia básica: usamos duas dimensões para mostrar ícones que representam outras dimensões adicionais. Interpretação deve ser feita com legendas! Chernoff faces: atributos das faces (geometria, olhos, excentricidade, curvaturas, etc.) representam outras dimensões. Stick figures: dimensões adicionais mapeadas para ângulos e comprimentos de segmentos de retas. Dia 4: 30 /57

Visualização: Chernoff Faces Dia 4: 31 /57

Visualização: Chernoff Faces Exemplo de H. Chernoff, ilustrado no tutorial de Daniel Keim. Dia 4: 32 /57

Visualização: Stick Figures Uso de duas dimensões mais textura Fonte: Tutorial de Daniel Keim. Dia 4: 33 /57

Visualização: Stick Figures Fonte: Tutorial de Daniel Keim. Dia 4: 34 /57

Visualização: Técnicas Baseadas em Pixels Idéia básica: ícones pequenos, uso de cores, geometria simples. Interpretação mais instintiva, menos uso de legendas. Distribui pixels em duas dimensões que podem ou não ser índices (podendo ou não causar artefatos!). Existem várias maneiras de organizar pixels em duas dimensões. Dia 4: 35 /57

Visualização: Grouping Technique Fonte: Tutorial de Daniel Keim. Dia 4: 36 /57

Técnicas de Visualização: Grouping Technique Pacotes TCP, UDP e ICMP recebidos por honeypots em 10 dias (a cada 20 minutos). Dia 4: 37 /57

Técnicas de Visualização: Grouping Technique Pacotes TCP, UDP e ICMP recebidos por honeypots em 10 dias (a cada 20 minutos). Dia 4: 38 /57

Visualização: Técnicas Hierárquicas Idéia básica: particionamento das dimensões em subdimensões. Dimensional Stacking: Particionamento de N dimensões em conjuntos de 2 dimensões. Worlds-within-Worlds: Particionamento de N dimensões em conjuntos de 3 dimensões. Treemap: Preenche área de visualização alternando eixos X e Y. Cone Trees: Visualização interativa de dados hierárquicos. InfoCube: Visualização hierárquica com 3D e transparência. Dia 4: 39 /57

Visualização: Dimensional Stacking Fonte: Tutorial de Daniel Keim. Dia 4: 40 /57

Visualização: Treemap Fonte: Tutorial de Daniel Keim. Dia 4: 41 /57

Visualização: Cone Trees Fonte: Tutorial de Daniel Keim. Dia 4: 42 /57

Visualização: InfoCube Fonte: Tutorial de Daniel Keim. Dia 4: 43 /57

Visualização: Técnicas Baseadas em Grafos Idéia básica: conjunto de pontos (vértices) ligados por linhas (as arestas). Representam conexões ou ligações de alguma forma. Enorme variabilidade na organização geométrica dos vértices e arestas. Representações gráficas diferentes para vértices e arestas. Representação para visualização mineração de grafos. Dia 4: 44 /57

Técnicas de Visualização: Grafos Um Sistema de Recomendação de Publicações Científicas Baseado em Avaliação de Conteúdo, Relatório Final de Alessandro Oliveira Arantes, disciplina CAP-359, INPE. Dia 4: 45 /57

Técnicas de Visualização: Grafos Um Sistema de Recomendação de Publicações Científicas Baseado em Avaliação de Conteúdo, Relatório Final de Alessandro Oliveira Arantes, disciplina CAP-359, INPE. Dia 4: 46 /57

Técnicas de Visualização: Grafos Visualização de similaridade entre malware. Dia 4: 47 /57

Visualização: Técnicas Tridimensionais Idéia básica: recursos de computação gráfica para usar dimensão adicional na exibição dos gráficos. Muito mais efetivo para display do que para impressão. Devem ser interativos (pan, zoom, rotação, etc.) Dia 4: 48 /57

Técnicas de Visualização: 3D Mineração de Dados para Encontrar Motifs em Séries Temporais, Relatório Final de Rosângela Follmann Bageston, disciplina CAP-359, INPE. Dia 4: 49 /57

Visualização: Mapas Idéia básica: plotagem de elementos sobre coordenadas geográficas. Valores, categorias, etc. podem ser representados como ícones, pixels, etc. Devem ser interativos (pan, zoom). Dia 4: 50 /57

Técnicas de Visualização: Mapas 42.1695-87.9588 12 37.0 127.5 12-21.3167-47.75 12 39.9289 116.3883 6 41.0186 28.9647 6-23.0-46.85 6 Dia 4: 51 /57

Técnicas de Visualização: Mapas Dia 4: 52 /57

Técnicas de Visualização: Mapas Mineração de Dados Espaciais Utilizando Métricas de Paisagem, Relatório Final de Márcio Azeredo, disciplina CAP-359, INPE. Dia 4: 53 /57

Técnicas de Visualização: Mapas Classificação do risco da esquistossomose no estado de Minas Gerais, Relatório Final de Flávia de Toledo Martins, disciplina CAP-359, INPE. Dia 4: 54 /57

Técnicas de Visualização: Comentários Esta taxonomia é incompleta e imperfeita. Técnicas podem pertencer a mais de uma categoria ou mesmo usar elementos de várias. Implementação de técnicas deve considerar também: Interatividade com o gráfico em si (seleção, drill-down). Interatividade com os dados usados para o gráfico (filtros, queries). Dia 4: 55 /57

Próximos passos... Dia 1: Apresentação dos conceitos de mineração de dados, motivação e alguns exemplos. Dia 2: Algoritmos de classificação supervisionada e aplicações. Dia 3: Algoritmos de classificação não-supervisionada e aplicações. Algoritmos de mineração de associações. Dia 4: Visualização e mineração de dados. Outros algoritmos e idéias. Onde aprender mais. Dia 4: 56 /57

Mais informações em... /dmapresentacoes.jsp /cap359-2010.jsp http://www.lac.inpe.br/elac/index.jsp Dia 4: 57 /57