ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Documentos relacionados
ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

Estatística Aplicada à Administração II. Tópico. Análise de Componentes Principais

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)

Parte 3 - Produto Interno e Diagonalização

Sensoriamento Remoto II

ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões PCA. Luiz Eduardo S. Oliveira, Ph.D.

29 e 30 de julho de 2013

Reconhecimento de Padrões. Principal Component Analysis (PCA) Análise dos Componentes Principais

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

Aula 25: Análise Fatorial. Prof. Eduardo A. Haddad

Análise Multivariada Aplicada à Contabilidade

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações

ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Componentes Principais

Estudo dirigido de Análise Multivariada

8. Análise em Componentes Principais - ACP

Autovetor e Autovalor de um Operador Linear

FUNDAMENTOS DE SISTEMAS LINEARES PARTE 1

GPDI Grupo de Profissionais de Dados e Inteligência

Avaliação climatológica da cidade de Uberlândia por meio da Análise de Componentes Principais

Técnicas Multivariadas em Saúde

Métodos Quantitativos Aplicados

. Repare que ao multiplicar os vetores (-1,1) e

3 a Avaliação Parcial - Álgebra Linear

(b) A não será diagonalizável sobre C e A será diagonalizável sobre R se, e

Exponencial de uma matriz

Formas Quádricas Cônicas hlcs

Multicolinariedade e Autocorrelação

PROCESSAMENTO DE IMAGENS

G2 de Álgebra Linear I

Universidade Federal de Alagoas UFAL Centro de Tecnologia - CTEC Programa de Pós-Graduação em Engenharia Civil - PPGEC

Análise multivariada

Análise de Componentes Principais Simbólicas

TRANSFORMAÇÕES MULTIESPECTRAIS (GLOBAIS)

CSE-020 Revisão de Métodos Matemáticos para Engenharia

MAT 138 Noções de Àlgebra Linear

GAAL - Terceira Prova - 15/junho/2013. Questão 1: Analise se a afirmação abaixo é falsa ou verdadeira:

Exemplo 1: Variáveis padronizadas Z t = ( Z 1 (1), Z 2 (1), Z 1 (2), Z 2 Z 1 (1) Z (1) = Z (2) = Z 2. Matriz de correlações:

Análise de Regressão Linear Simples e

Transformação dos dados. Analise de Componentes Principais - PCA

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Descomposição de Cholesky

G4 de Álgebra Linear I

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Classificação. David Menotti.

Teorema da Triangularização de Schur e Diagonalização de Matrizes Normais

Análise Multivariada Aplicada à Contabilidade

G3 de Álgebra Linear I

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

GAAL - Exame Especial - 12/julho/2013. Questão 1: Considere os pontos A = (1, 2, 3), B = (2, 3, 1), C = (3, 1, 2) e D = (2, 2, 1).

Provas. As notas da primeira e segunda prova já foram digitadas no Minha UFMG. Caso você não veja sua nota, entre em contato com o professor.

Função prcomp. 1. Introdução

Setor de Tecnologia - TC Engenharia Ambiental Prova 2. Matemática Aplicada I

Autovalores e Autovetores

Álgebra Linear I - Lista 11. Autovalores e autovetores. Respostas. 1) Calcule os autovalores e autovetores das matrizes abaixo.

Setor de Tecnologia - TC Engenharia Ambiental Prova 1. Matemática Aplicada I

AUTOVALORES E AUTOVETORES

INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO

Técnicas Multivariadas em Saúde

Medidas de Semelhança

Mapeamento de solos TÓPICOS ESPECIAIS: ANÁLISE ESTATÍSTICA DE DADOS AMBIENTAIS MULTIVARIADOS MODELAGEM DE FENÔMENOS NATURAIS

G3 de Álgebra Linear I

Capítulo 1 Estatística Descritiva. Prof. Fabrício Maciel Gomes

G3 de Álgebra Linear I

ÁLGEBRA LINEAR. Valores Próprios (Autovalores) e Vetores Próprios (Autovetores) Prof. Susie C. Keller

Algoritmos Numéricos 2 a edição

Função prcomp em R. 1. Introdução

5. Seja A uma matriz qualquer. Assinale a afirmativa

CAPÍTULO 1 Operações Fundamentais com Números 1. CAPÍTULO 2 Operações Fundamentais com Expressões Algébricas 12

Processamento de Imagens CPS755

A2 - ANÁLISE FATORIAL

Representação esquemática de estruturas de dados

Representação de Fourier para Sinais 1

Aula 7 - Revisão de Álgebra Matricial

CORRELAÇÃO E REGRESSÃO

Álgebra Linear. Professor Alessandro Monteiro. 1º Sábado - Matrizes - 11/03/2017

Universidade Federal de Viçosa Centro de Ciências Exatas e Tecnológicas Departamento de Matemática

Setor de Tecnologia - TC Engenharia Ambiental Prova 1. Matemática Aplicada I

Geovan Tavares, Hélio Lopes e Sinésio Pesco PUC-Rio Departamento de Matemática Laboratório Matmidia

Elementos de Matemática Avançada

2 Álgebra Linear (revisão)

5. Seja R : R 3 R 3 uma rotação em torno do eixo gerado por (0, 0, 1). Suponha que R mande o vetor

APLICAÇÃO DE TÉCNICAS MULTIVARIADAS NA SELEÇÃO DE GENÓTIPOS DE PLANTAS PARA GRAMADOS RESISTENTES A INSETOS

CONHECIMENTOS ESPECÍFICOS

G4 de Álgebra Linear I

PROCESSAMENTO DIGITAL DE IMAGENS (SERP11) TRANSFORMAÇÕES LINEARES: COMPONENTES PRINCIPAIS, TASSELED CAP, IHS. Daniel C. Zanotta

Álgebra Linear. Shin Takahashi, Iroha Inoue e Trend-Pro Co., Ltd. novatec

Análise Discriminante

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

MATRIZ DE REFERÊNCIA-Ensino Médio Componente Curricular: Matemática

. (1) Se S é o espaço vetorial gerado pelos vetores 1 e,0,1

Setor de Tecnologia - TC Engenharia Ambiental Prova 1. Matemática Aplicada I

(a) (1,5) Obtenha os autovalores e autovetores de L. (b) (1,0) A matriz de L em relação à base canônica de M 2 2 é diagonalizável? Explique.

Engenharia da Qualidade I Aula 5

Seminário de Análise Multivariada

Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo. Disciplina: EAD 351. Técnicas Estatísticas de Agrupamento

Matrizes e Linearidade

Transcrição:

Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP Transformação linear de p" variáveis originais em p" novas variáveis, de tal modo que a primeira nova variável computada seja responsável pela maior variação possível existente no conjunto de dados. Análise de componentes principais: maximizar a variância de uma combinação linear de variáveis. Objetivo: variáveis originais X, X, X,..., Xp, correlacionadas, são transformadas em variáveis Y, Y, Y,..., Yp, não correlacionadas e com variâncias ordenadas, para que seja possível comparar os indivíduos usando apenas as variáveis Y i que apresentam maior variância. Variáveis medidas na mesma escala e em escalas diferentes Solução: Cálculo dos autovalores e correspondentes autovetores de uma matriz de variâncias-covariâncias [S] ou de correlações [R] entre variáveis. Imagem formada por um quadrado com vetores. Essa imagem sofre uma ampliação (transformação) apenas na horizontal, resultando um retângulo. Nessa condição, o vetor v passou a v*, que não tem a mesma direção do original v. O vetor v* não pode, portanto, ser representado por v multiplicado por um escalar. Mas o vetor v* tem a mesma direção de v e, por isso, pode ser representado por v multiplicado por um escalar. Diz-se então que v é um autovetor da transformação e que esse escalar é um autovalor associado. Autovetores representam as componentes principais e são o resultado do carregamento das variaveis originais em cada um deles. Tais carregamentos podem ser considerados como uma medida da relativa importância de cada variável em relação às componentes principais e os respectivos sinais, se positivos ou negativos, indicam relações direta ou inversamente proporcionais. O primeiro autovalor a ser determinado correspondera à maior porcentagem da variabilidade total presente e, assim, sucessivamente com os demais. Matriz de carregamentos de cada variavel nas componentes principais, ao ser multiplicada pela matriz original de dados, fornece a matriz de contagens (scores) de cada caso em relação às componentes principais. Esses valores dispostos num diagrama de dispersão, em que os eixos ortogonais são as duas componentes mais importantes, mostram o relacionamento entre os casos condicionados pelas variáveis medidas. 6

AUTOVALORES (EINGENVALUES) AUTOVETORES (EIGENVECTORS) As componentes principais são determinadas resolvendo-se a equação característica da matriz S ou R: det [R - I] = ou R - I = Cálculo das raizes da equação (autovalores) para uma matriz x : (a l)x + a x + a x = a x + (a l)x + a x = a x + a x + (a l)x = 7 8, λ,8,98 [ A] λ[i],8, λ,9,98,9, λ matriz de dados: (, - )(, - )(, - ) + (,8) (-,9)(-,98) + (-,98)(,8)(-,9) (-,98)(, - )(-,98) - (, - ) (-,9)(-,9) - (,8)(,8)(, - ) = matriz de coeficientes de correlação [A], [A],8,98 (variância total no sistema: + + = ),8,,9,98,9, 9 ( -,8)( -,88)( -,) autovalores: =,8 (,8/* = 9,66%) =,88 (,88/* = 6,7%) =, (,/* =,7%) (soma = ) Cálculo dos autovetores: Padronização do autovetor V para o tamanhao unitário Componentes do autovetor V: (, -,8)X +,8X -,98X =,8 - (, -,8)X -,9X = -,98X -,9X - (, -,8)X = X = -,; X = -,97; X =, V = -, -,97, Q = - + (-,97) + (,) =, Q=,7 V = -/,7 = -,8 V = -,97/,7 = -,6 V =,/,7 =,9 Autovetores F F F Var -.8 -.6.6 Var -.6.79.6 Var.9.6.79

Componente II (6.7 %) Componente II (6.7 %) Factor loadings (carregamento das variáveis nas componentes principais) ( autovetor padronizado F F F Var -.97 -.6. Var -.9.. Var..7. autovalor.7.. -. -. V V correspondente) ACP: variáveis V 7 8 *,8,6,9,6,79,6,6,6,79 F F F O b s... O b s.9 -. -. 7 O b s -.6 9 -.. 6 O b s -.. -. = factor scores -.7 - - -.7 -. -....7 Componente I (9.66 %) ACP: observações. O O O -. O - -. - -. - -... 6 Componente I (9.66 %) Tradicionalmente, o coeficiente de correlação é usado, em vez do de covariância, para a matriz inicial de similaridades. Isso porque o coeficiente de correlação elimina o efeito de escala: uma variável que oscile entre e não pesa mais na carga fatorial do que uma variável variando entre e. No entanto quando as variáveis foram obtidas em escalas idênticas ou quando se quer ressaltar a variância das variáveis, que influenciam nas cargas fatoriais, a covariância é utilizada. A escolha do número de componentes principais Manter componentes suficientes para explicar uma determinada percentagem do total da variância, por exemplo 8%. Manter componentes cujos auto-valores são maiores do que a média dos autovalores i /p; para uma matriz de correlações, essa média é. Usar o gráfico de declive/scree graph, e observar a mudança de inclinação de altos autovalores para baixos autovalores. Testar a significância das maiores componentes, ou seja, aquelas correspondentes aos maiores autovalores. 7 8

gráfico de declive/scree graph Exemplo r=-. i CP 9 valores ordenados; r=,98 Análise de agrupamentos e análise das componentes principais: fornecem os mesmos resultados mais informações em ACP Óxidos em rochas magmáticas Rochas SiO AlO FeO FeO MgO CaO NaO KO Sienito 6.7...7.6.. Sienito 8. 7.9..7..7.9. Sienito. 7.6.....7. Monzonito.... 6. 7.7.. Diorito 8.7.7.8.9. 6Diorito 6.9.9.9 7 9.6.7.7 7Diorito 8 7...8.... 8QDiorito. 6..7.6 6.7 6.7.. 9Gabro...7..8 9.9.9. Gabro.9..7.9 6. 8.9..7 Norito 7...6.8. 8... Norito 8. 8.. 6..8 9...7 HipGabro.8 8.8..7..6.9. HipGabro 7..8 6...7 Sienito 9.8 7..6.6..8. 6QSienito 66. 6...8. 6..8 7SienitoAlt 9.9..9 8.. 8Monzonito 7. 8..7..7 6.8..7 9Monzonito 9.8.8.8...9. Diabasio. 8....7 6..6.9

Porcentágens de empregados em nove grupos industriais em países na Europa: AGR: agricultura, florestal e pesca MIN: mineração e exploração de pedreiras FAB: fabricação FEA: fornecimento de energia e água CON: construção SER: serviços FIN: finanças SSP: serviços sociais e pessoais TC: transporte e comunicações 6 7 8 9