Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões PCA. Luiz Eduardo S. Oliveira, Ph.D.

Documentos relacionados
Reconhecimento de Padrões. Principal Component Analysis (PCA) Análise dos Componentes Principais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Classificação. David Menotti.

Universidade Federal do Paraná (UFPR) Especialização em Engenharia Industrial 4.0. Classificação. David Menotti.

Sensoriamento Remoto II

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Estatística Aplicada à Administração II. Tópico. Análise de Componentes Principais

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Análise de Componentes Principais (PCA)

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

GPDI Grupo de Profissionais de Dados e Inteligência

Distância Estatística

Álgebra Linear I - Aula Matriz de uma transformação linear em uma base. Exemplo e motivação

29 e 30 de julho de 2013

P3 de Álgebra Linear I

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Componentes Principais

G3 de Álgebra Linear I

Aprendizado de Máquina (Machine Learning)

Maldição da dimensionalidade

Aula 25: Análise Fatorial. Prof. Eduardo A. Haddad

Aprendizado de Máquinas. Seleção de Características

P4 de Álgebra Linear I de junho de 2005 Gabarito

PARTE 3- MEDIDAS DE DISPERSÃO VERSÃO: MARÇO DE 2017

Nome do candidato (a):

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações

. Repare que ao multiplicar os vetores (-1,1) e

Função prcomp. 1. Introdução

IDENTIFICAÇÃO DE TECIDO COM ATEROSCLEROSE PELO MÉTODO DE ANALISE DO COMPONENTE PRINCIPAL. Thiago Siqueira Pinto, Landulfo Silveira Junior

G4 de Álgebra Linear I

5 Análise Multivariada dos Dados 5.1. Quimiometria

Geovan Tavares, Hélio Lopes e Sinésio Pesco PUC-Rio Departamento de Matemática Laboratório Matmidia

G3 de Álgebra Linear I

INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO

Transformação dos dados. Analise de Componentes Principais - PCA

4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)

Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento

Apontamentos de Introdução às Probabilidades e à Estatística

G4 de Álgebra Linear I

GAAL - Terceira Prova - 15/junho/2013. Questão 1: Analise se a afirmação abaixo é falsa ou verdadeira:

- identificar operadores ortogonais e unitários e conhecer as suas propriedades;

Álgebra Linear I - Aula 20

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Exemplo 1: Variáveis padronizadas Z t = ( Z 1 (1), Z 2 (1), Z 1 (2), Z 2 Z 1 (1) Z (1) = Z (2) = Z 2. Matriz de correlações:

G3 de Álgebra Linear I

Parte I. Álgebra Linear. Sistemas Dinâmicos Lineares. Autovalores, autovetores. Autovalores, autovetores. Autovalores e Autovetores.

Segunda Lista de Exercícios Cálculo de Probabilidades II Prof. Michel H. Montoril

Função prcomp em R. 1. Introdução

Mineração de Dados. Análise e Seleção de Variáveis

Ajustamento de Observações

ÁLGEBRA LINEAR. Valores Próprios (Autovalores) e Vetores Próprios (Autovetores) Prof. Susie C. Keller

3 a. Lista de Exercícios

Exercícios de programação

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

Álgebra Linear I - Aula 22

FUNDAMENTOS DE SISTEMAS LINEARES PARTE 1

Medidas de Semelhança

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

Álgebra Linear I - Lista 11. Autovalores e autovetores. Respostas. 1) Calcule os autovalores e autovetores das matrizes abaixo.

5. Seja A uma matriz qualquer. Assinale a afirmativa

n. 35 AUTOVALORES e AUTOVETORES ou VALORES e VETORES PRÓPRIOS ou VALORES CARACTERÍSTICOS e VETORES CARACTERÍSTICOS

CORRELAÇÃO E REGRESSÃO

Computação Científica com MATLAB. Melissa Weber Mendonça

3 a Avaliação Parcial - Álgebra Linear

Prof. MSc. David Roza José -

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

RESTAURAÇÃO E RECONSTRUÇÃO DE IMAGENS. Nielsen Castelo Damasceno

5. Seja R : R 3 R 3 uma rotação em torno do eixo gerado por (0, 0, 1). Suponha que R mande o vetor

Universidade Federal da Paraíba Departamento de Matemática. Álgebra Linear e Geometria Analítica

Variáveis Aleatórias. Esperança e Variância. Prof. Luiz Medeiros Departamento de Estatística - UFPB

$QiOLVHGHVHQVLELOLGDGHHVWDWtVWLFD

SME Roberto F. Ausas / Gustavo C. Buscaglia

Universidade Federal de Alagoas UFAL Centro de Tecnologia - CTEC Programa de Pós-Graduação em Engenharia Civil - PPGEC

Ralph S. Silva

Provas. As notas da primeira e segunda prova já foram digitadas no Minha UFMG. Caso você não veja sua nota, entre em contato com o professor.

Mais Informações sobre Itens do Relatório

PROCESSAMENTO DIGITAL DE IMAGENS (SERP11) TRANSFORMAÇÕES LINEARES: COMPONENTES PRINCIPAIS, TASSELED CAP, IHS. Daniel C. Zanotta

Aula 19 Operadores ortogonais

Álgebra Linear I - Aula Forma diagonal de uma matriz diagonalizável

Utilização de modelos marginais na análise de dados longitudinais irregulares em relação ao tempo

Filho, não é um bicho: chama-se Estatística!

Correlação Eletrônica - CI e MP2

4 Estado da Arte do Kernel PCA

Lista de Exercícios #5 Assunto: Variáveis Aleatórias Multidimensionais Contínuas

Correlação e Regressão

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

(a) (1,5) Obtenha os autovalores e autovetores de L. (b) (1,0) A matriz de L em relação à base canônica de M 2 2 é diagonalizável? Explique.

)XQGDPHQWRVGHSUREDELOLGDGHHHVWDWtVWLFD

G4 de Álgebra Linear I

Programa de Provas para Seleção do Mestrado em Engenharia Civil da Universidade Federal do Ceará

Multicolinariedade e Autocorrelação

PROCESSAMENTO DE IMAGENS

3 3. Variáveis Aleatórias

Métodos Quantitativos Aplicados

CONHECIMENTOS ESPECÍFICOS

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Introdução

Medidas de Dispersão para uma Amostra. Conteúdo: AMPLITUDE VARIÂNCIA DESVIO PADRÃO COEFICIENTE DE VARIAÇÃO

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

AULAS 14 E 15 Modelo de regressão simples

Transcrição:

Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões PCA Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceitos de PCA e suas aplicações para extração de características Revisão dos conceitos básicos de estatística e álgebra linear. 1

Estatística Variância Variância de uma variável aleatória é uma medida dispersão estatística, indicando qual longe em geral os seus valores se encontram do valor esperado. Desvio padrão é a raiz da variância O resultado do desvio se dá na mesma medida dos dados da população ou amostra. Estatística Covariância Variância é uma medida unidimensional. É calculada de maneira independente pois não leva em consideração as outras dimensões. Covariância por sua vez, é uma medida bidimensional. Verifica a dispersão, mas levando em consideração duas variáveis aletórias. 2

Estatística Matriz de covariância Para 3 variáveis aleatórias, x, y e z, o cálculo de todas as covariâncias (x-y, x-z e y-z) pode ser acomodada em uma matriz, a qual denomina-se matriz de covariância. Cov(x,y) = cov(y,x) Cov(z,z) = var(z) Álgebra Autovetores Como sabe-se duas matrizes podem ser multiplicadas se elas possuem tamanhos compatíveis. Autovetores são casos especiais neste contexto. Múltiplo do vetor resultante 3

Autovetores Nesse caso (3,2) representa um vetor que aponta da origem (0,0) para o ponto (3,2). A matriz quadrada, pode ser vista como uma matriz de transformação. Se esta matriz for multiplicada por outro vetor, a resposta será outro vetor transformado da sua posição original. É da natureza desta transformação que surgem os autovetores. Autovetores Propriedades Podem ser achados somente em matrizes quadradas. Nem todas as matrizes possuem autovetores. Para uma data n x n matriz, existem n autovetores. Se o vetor for multiplicado por uma constante, ainda obteremos o mesmo resultado Apenas fazemos o vetor mais longo, mas não mudamos a direção. 4

Autovetores/Autovalores Todos os autovetores são ortogonais (perpendiculares), ou seja os dados podem ser expressos em termos destes vetores. O valor pelo qual o vetor é multiplicado é conhecido como autovalor Um autovetor sempre possui um autovalor associado. Análise dos Componente Principais (PCA) Uma maneira de identificar padrões em dados, colocando em evidência suas similaridades e diferenças. Ferramenta importante para altas dimensões, onde não podemos fazer uma análise visual. Uma vez encontrados esses padrões, podemos comprimir os dados sem grande perda de qualidade. Extrator de características (representação) 5

PCA Tutorial 1) Escolha um conjunto de dados. 2) Normalize esses dados, subtraindo-os da média. Dados Dados Normalizados PCA Tutorial 6

PCA Tutorial 3) Calcule a matriz de correlação para os dados normalizados. Uma vez que os dados possuem duas dimensões, teremos uma matriz 2x2 PCA Tutorial 4) Encontre os autovetores e autovalores para a matriz de covariância. Uma vez que a matriz de covariância é quadrada podemos encontrar os autovetores e autovalores. O que esses valores significam?? 7

PCA Tutorial PCA Tutorial 5) Escolhendo os componentes que vão formar o vetor Como vimos, os autovalores são bastante diferentes. Isso permite ordenar os autovetores por ordem de importância. Se quisermos eliminar um componentes, devemos então eliminar os que tem menos importância. 8

PCA Tutorial No nosso exemplo temos duas escolhas Manter os dois. Eliminar um autovetor, diminuindo assim a dimensionalidade dos dados Maldição da dimensionalidade Quanto maior a dimensionalidade do seu vetor, mais dados serão necessários para a aprendizagem do modelo. PCA Tutorial 5) Construindo novos dados. Uma vez escolhidos os componentes (autovetores), nós simplesmente multiplicamos os dados pelo autovetor(es) escolhidos. O que temos? Dados transformados de maneira que expressam os padrões entre eles. Os PCs (Principal Components) são combinações linear de todas as características, produzindo assim novas características não correlacionadas. 9

PCA Tutorial Dados transformados usando 2 autovetores Exemplo PCA Tutorial Usando a função pcacov do Matlab, três parâmetros são retornados. -autovetores -autovalores -percentagem da variância total explicada pro cada modelo 10

PCA Tutorial Exemplo 2 W1 x b y = W 2 AUTOVETORES -0.6779-0.7352-0.7352 0.6779 AUTOVALORES 1.2840 0.0491 VARIÂNCIA EXPLICADA 96.3181 3.6819 PCA Tutorial Exercício Gere diferentes conjuntos de dados em duas dimensões e aplique PCA. Verifique e discuta a variância explicada em função da dispersão dos dados. 11

12