ANÁLISE DE CORRELAÇÕES CANÓNICAS. Identificar e quantificar a associação entre dois conjuntos de variáveis.

Documentos relacionados
Exemplo 1: Variáveis padronizadas Z t = ( Z 1 (1), Z 2 (1), Z 1 (2), Z 2 Z 1 (1) Z (1) = Z (2) = Z 2. Matriz de correlações:

Revisões de Matemática e Estatística

Estatística Aplicada à Administração II. Tópico. Análise de Componentes Principais

NOTAS DE AULA DA DISCIPLINA CE076

Transformação dos dados. Analise de Componentes Principais - PCA

Análise de Regressão Linear Simples e

Ralph S. Silva

Tratamento Estatístico de Dados em Física Experimental

VERIFICAÇÃO DOS RECURSOS NECESSÁRIOS. Capítulo 1 VARIÁVEIS E AMOSTRAS 1

Técnicas Multivariadas em Saúde. Representação de Dados Multivariados. Métodos Multivariados em Saúde Roteiro. Análise Exploratória de Dados

Espaços Vectoriais. Espaços Vectoriais

Estatística e Modelos Probabilísticos - COE241

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Técnicas Multivariadas em Saúde

A Metodologia de Box & Jenkins

Lista 6: transformações lineares.

Estatística 1 - Lista de Exercícios 4-21/06/ Professor José Carlos Fogo

Análise Multivariada Aplicada à Contabilidade

Técnicas Multivariadas em Saúde

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

Fundamentos de Inteligência Artificial [5COP099]

Estudo dirigido de Análise Multivariada

29 e 30 de julho de 2013

Support Vector Machines

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações

Medidas de Semelhança

Expansão linear e geradores

Seminário de Análise Multivariada

Seja (X,Y) uma v.a. bidimensional contínua ou discreta. Define-se valor esperado condicionado de X para um dado Y igual a y da seguinte forma:

PESQUISA EM MERCADO DE CAPITAIS. Prof. Patricia Maria Bortolon, D. Sc.

Análise de Regressão Linear Múltipla III

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

Estatística e Modelos Probabilísticos - COE241

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Segunda Lista de Exercícios Cálculo de Probabilidades II Prof. Michel H. Montoril

Cálculo Diferencial e Integral II

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Séries Temporais. Fernando Lucambio. Agosto de Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, , Brasil

SME0822 Análise Multivariada 2 o semestre de 2014

Métodos Quantitativos Aplicados

Estatística 1 - Lista de Exercícios 4 Professore José Carlos Fogo

Gestão de Riscos e Investimentos

Ralph S. Silva

1. Conceitos básicos de estatística Níveis de medição Medidas características de distribuições univariadas 21

Prova Final de Estatística I

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

SME0822 Análise Multivariada 2 o semestre de 2014

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1

Redes de Computadores sem Fio

Ficha de Trabalho 09 e 10

ADMINISTRAÇÃO FINANCEIRA

Introdução ao modelo de Regressão Linear

Universidade Federal de Alfenas Programa de Pós-graduação em Estatística Aplicada e Biometria-PPGEAB Prova de Conhecimentos Específicos

SME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo. Sala 3-113

08/12/97 Luiz Feijó Jr.

Nov/2016. José Roberto Motta Garcia

IND 1115 Inferência Estatística Aula 7

Distribuições Amostrais

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

Hipóteses do modelo linear clássico (CLM) Análise da Regressão múltipla: Inferência. Hipóteses do CLM (cont.) O teste t. Distribuição normal amostral

O ambiente de trabalho R

PROCESSOS ESTOCÁSTICOS. O resultado de muitas experiências aleatórias é função do tempo ou de uma (ou mais) coordenada espacial.

2012/2013-1º SEMESTRE- 1ª ÉPOCA EXAME DE ÁLGEBRA LINEAR (1303) 2 de Janeiro de 2013

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

Momentos: Esperança e Variância. Introdução

Capitulo 6 Viabilidade Econômica em Situação de Incerteza

Motivação. VA n-dimensional. Distribuições Multivariadas VADB

ÁLGEBRA LINEAR A FICHA 2

Métodos Empíricos de Pesquisa I. } Análise Bidimensional

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS

β 1 x β j 1 x j 1 + β j (x j +k) β j 1 x j 1 +

Apontamentos de Introdução às Probabilidades e à Estatística

Esquema Fatorial. Lucas Santana da Cunha Universidade Estadual de Londrina

Distribuições Amostrais e Estimação Pontual de Parâmetros

Actividade Formativa 1

Regressão Linear - Parte I

DISTRIBUIÇÃO CONJUNTA (parte II)

FUNDAMENTOS DE SISTEMAS LINEARES PARTE 1

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

Geometria (X 6 ) Português (X 3 ) Álgebra (X 4 )

Instituto Universitário de Lisboa

Uma breve introdução a probabilidade

X - D U A L I D A D E

Métodos Quantitativos

Estatísticas Inferenciais Distribuições Amostrais. Estatística

Análise Multivariada Aplicada à Contabilidade

4.1.1 Participantes, Instrumentos de Medição e Procedimento

A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos.

8. Análise em Componentes Principais - ACP

Inferência Estatistica

por eliminaçaoda linha i e da coluna j

Diagonalização de Operadores. Teorema Autovetores associados a autovalores distintos de um operador linear T : V V são linearmente independentes.

Introdução à Bioestatística

Probabilidade I. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula 3 04/14 1 / 20

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Componentes Principais

REGRESSÃO LINEAR SIMPLES

Cap. 13 Correlação e Regressão

Transcrição:

OBJECTIVO Identificar e quantificar a associação entre dois conjuntos de variáveis. Identificar duas combinações lineares das variáveis, num e noutro conjunto, que tenham a maior correlação possível. Identificar outro par de combinações lineares, num e noutro conjunto, não correlacionadas com o par anterior, que tenham entre si a maior correlação possível. etc. Os sucessivos pares de combinações lineares não designados por variáveis canónicas e as respectivas correlações são designadas por correlações canónicas. Estas constituem uma medida da associação entre os dois conjuntos de variáveis. UTAD 995 - ANÁLIE MULTIDIMENIONAL - F. WOLFANGO DE MACEDO G

Conjuntos de variáveis ( ) ( ) x x : p x : q x :( p q) x + p q Estatísticas x x = ( ) x :( p + q) ( ) 2 = 2 :( p + q) ( p + q) 2 22 ( i ) ( ) = cov ( x, x ) i, =, 2 Combinações lineares de variáveis i u = a x v = b x ( ) Correlações amostrais c = corr ( u, v) = a b 2 a a b b 22 () UTAD 995 - ANÁLIE MULTIDIMENIONAL - F. WOLFANGO DE MACEDO G2

DEFINIÇÃO O primeiro par de variáveis canónicas (amostrais) é o par de combinações lineares u = a x ( ) 2, v = b x ( ), com variâncias, que maximizam (). O i-ésimo par de variáveis canónicas (amostrais) é o par de combinações lineares u = a x ( ), v = b x ( 2 ), com variâncias, não correlacionadas com as anteriores variáveis canónicas, que maximizam (). etc. As correlações c = corr ( u, v ), =,, p entre variáveis canónicas, são as correlações canónicas. UTAD 995 - ANÁLIE MULTIDIMENIONAL - F. WOLFANGO DE MACEDO G3

TEOREMA ) eja M = 2 22 ( p p) 2 2 2 com valores próprios e vectores próprios 2 2 2 r r2 r p 2) eja com vectores próprios g, g,, g 2 N = 22 2 2 22 2 2 f, f,, f 2 Os primeiros p vectores próprios de N podem calcular-se pelas expressões q p f = 22 2 g = r 2 2,, p 3) O i-ésimo par de variáveis canónicas (amostrais) é : u = g 2 x v = f 2 x ( ) 22 a b 4) As correlações canónicas (amostrais são): c = corr ( u, v ) = r UTAD 995 - ANÁLIE MULTIDIMENIONAL - F. WOLFANGO DE MACEDO G4

Correlações entre as variáveis canónicas e as variáveis originais var ( u ) = var ( v ) = =,, p corr ( u, u ) = corr ( v, v ) = l l l corr ( u, v ) = l l Façamos A = [ a, a 2,, a p] B = [ b, b,, bq] ( p p) u ( p ) Tem-se ( q q) ( ) = A x v = B x ( q ) 2 R corr ( u, ( ) x ) A D u, x ( = = ) R corr ( u, x ) A D u, x ( 2 = = ) 2 22 UTAD 995 - ANÁLIE MULTIDIMENIONAL - F. WOLFANGO DE MACEDO G5

R corr ( v, ( ) x ) B D v, x ( = = ) 2 R corr ( v, x ) B D v, x ( 2 = = ) em que 22 22 ( ) D i = diag ( s ) i =,, p D 22 j Variáveis padronizadas = diag ( s ) j =,, q Z HX Z = ( ) Z = HX ( ) D D 22 u = A D Z ( p ) ( ) v = B D Z ( q ) 22 As correlações canónicas não se alteram com a padronização das variáveis. UTAD 995 - ANÁLIE MULTIDIMENIONAL - F. WOLFANGO DE MACEDO G6

EXEMPLO eja ( ) ( ) x x2 x x2 = 2 =. 95 2 22. 95 Tem-se neste caso 2 =. 95 2 2 95 =. 22 22 2 = 22 M =. 925 N =. 925 Valores próprios Vectores próprios M. 925 g g 2 N. 925 f f 2 UTAD 995 - ANÁLIE MULTIDIMENIONAL - F. WOLFANGO DE MACEDO G7

EXEMPLO Variáveis e correlações canónicas u = a x ( ) v = b x correlações canónicas ( ) x 2 x.95 ( ) 2. x. x 2 A = B =.. Correlações entre as variáveis canónicas e as variáveis originais D D 22 D D 22 R u, x ( ) R u x,. 95 R v x, ( ) R v, x. 95 UTAD 995 - ANÁLIE MULTIDIMENIONAL - F. WOLFANGO DE MACEDO G8

EXERCÍCIO Considere a matriz IRI de dados relativos à variedade Iris setosa, que contém medições do seguinte conjunto de variáveis: x sepal length ( ) x x 2 sepal width x = = ( ) x x3 petal length x4 petal width Execute os cálculos necessários a uma análise de correlações canónicas. a) Poderemos considerar as variáveis canónicas u e v como índices de forma das sépalas e das pétalas, repectivamente? No caso afirmativo, calcule os valores de u e v para cada uma das flores Iris setosa b) Com base nas variáveis canónicas u e v, classifique as sépalas e as pétalas. Qual o grau de coincidência entre as duas classificações? Interprete esse grau de coincidência em termos de corr ( u, v ) c) Represente graficamente o par de variáveis canónicas ( u, v ) Que conclui, analisando o gráfico?. UTAD 995 - ANÁLIE MULTIDIMENIONAL - F. WOLFANGO DE MACEDO G9