NOTAS DE AULA DA DISCIPLINA CE076

Documentos relacionados
CE-704 ANÁLISE MULTIVARIADA APLICADA À PESQUISA

Regressão Múltipla. Parte I: Modelo Geral e Estimação

MAE 5776 ANÁLISE MULTIVARIADA

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Prof. Lorí Viali, Dr.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

PRESSUPOSTOS DO MODELO DE REGRESSÃO

NOTAS DE AULA DA DISCIPLINA CE076 = 2. ], T 2 = conhecido como T 2 de Hotelling

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

Associação entre duas variáveis quantitativas

Gabarito da Lista de Exercícios de Econometria I

O problema da superdispersão na análise de dados de contagens

Estatística II Antonio Roque Aula 18. Regressão Linear

Análise de Regressão

Capítulo 1. Exercício 5. Capítulo 2 Exercício

1. CORRELAÇÃO E REGRESSÃO LINEAR

Análise Exploratória de Dados

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

ANÁLISE DE COMPONENTES PRINCIPAIS, ANÁLISE FATORIAL: Exemplos em STATA. Prof. Dr. Evandro Marcos Saidel Ribeiro RESUMO

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

UNIVERSIDADE NOVA DE LISBOA Faculdade de Economia Análise de Dados e Probabilidade 2º Semestre 2008/2009 Exame Final 1ª Época. Grupo I (4 Valores)

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

a média populacional do i-ésimo tratamento; o efeito do i-ésimo tratamento na variável dependente Y e mede o afastamento da média µ

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

MODELOS DE REGRESSÃO PARAMÉTRICOS

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

CAPÍTULO 2 - Estatística Descritiva

CORRELAÇÃO E REGRESSÃO

Universidade de São Paulo Escola Superior de Agricultura Luiz de Queiroz Departamento de Ciências Exatas

8.16. Experimentos Fatoriais e o Fatorial Fracionado

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Probabilidade de Óbito por Leptospirose Humana em Belém - PA

Teoria Elementar da Probabilidade

ANÁLISE MATRICIAL DE ESTRUTURAS DE BARRAS PELO MÉTODO DE RIGIDEZ

AULA EXTRA Análise de Regressão Logística

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Eletroquímica 2017/3. Professores: Renato Camargo Matos Hélio Ferreira dos Santos.

2ª Atividade Formativa UC ECS

Neste capítulo abordam-se os principais conceitos relacionados com os cálculos de estatísticas, histogramas e correlação entre imagens digitais.

Transcrição:

5. COMPONENTES PRINCIPAIS 5. Introdução A análse de Comonentes Prncas está relaconada com a exlcação da estrutura de covarânca or meo de oucas combnações lneares das varáves orgnas em estudo, ou sea, rocura exlcar a estrutura de varânca-covarânca da matrz de dados através de combnações lneares não correlaconadas das varáves orgnas. Embora comonentes seam necessáras ara reroduzr a varabldade total do sstema, frequentemente muto desta varabldade ode ser exlcada or um número equeno, k, de comonentes rncas. Neste caso, exste quase a mesma quantdade de nformação nas k comonentes que exste nas varáves orgnas. As k comonentes rncas odem então substtur as varáves ncas e, o conunto de dados orgnal que consste de n meddas das varáves, é reduzdo ara um formado or n meddas das k comonentes rncas (CHAVES NETO, 00). Varáves orgnas Comonentes rncas,,..., Tranformação lnear e ortogonal Y, Y,..., Y - A rerodução da varabldade total do sstema requer as varáves, orém, frequentemente a maor arte dessa varabldade ode ser exlcada or um número equeno k <, de comonentes rncas. - Neste caso exste um ercentual de quantdade de nformações nas k comonente rncas que nas varáves orgnas. - As k comonente rncas odem então substtur as varáves orgnas. - A ACP frequentemente revela relaconamentos que não são revamente susetos e ermte nterretações que oderam não ocorrer ordnaramente. 5.. Prncas obetvos da ACP: () Reduzr a dmensonaldade das varáves. () Obtenção de v.a s não correlaconadas; (3) Analsar quas as varáves ou, quas os conuntos de varáves exlcam a maor arte da varabldade total, revelando que to de relaconamento exste entre eles. Materal Retrado das Aostlas dos Profs. Jar Mendes Marques e Anselmo Chaves Neto Págna

Observações: () A ACP não deende da suosção ncal de normaldade. () A ACP é muto útl como método auxlar em Regressão, Análse Fatoral e Análse de Agruamentos (Cluster). 5.3 Comonentes Prncas Poulaconas: As combnações lneares reresentam a seleção de um novo sstema de coordenadas, obtdo or rotação do sstema orgnal com,,..., como exos. Os novos exos Y, Y,..., Y, reresentam as dreções com varabldade máxma (ermte uma nterretação mas smles da estrutura da matrz de covarânca). Por exemlo, ara = : Y Y Sea o vetor aleatóro = [,,..., ] que tem vetor de médas E() = µ e matrz de covarânca V() = Σ com autovalores... 0. Consdere as combnações lneares: Y = c = c + c +... +c Y = c = c + c +... +c c c... c c c... c C =............ c c... c Y = c = c + c +... +c Materal Retrado das Aostlas dos Profs. Jar Mendes Marques e Anselmo Chaves Neto Págna

Y c c... c Então, tem-se Y = Y c c... c = =... C e............... Y c c... c - E(Y ) = E(c ) = c E() = c µ - V(Y ) = V(c ) = c V()c = c Σc - cov(y,y k ) = c Σc k = 0 - cov(y ) = V( C ) = CΣC As comonentes rncas são as combnações lneares não-correlaconadas Y, Y,..., Y cuas varâncas são tão grandes quanto ossível, assm: Resultado: Sea Σ a matrz de covarâncas assocada ao vetor aleatóro = [,,..., ] e que tem os ares de autovalor-autovetor (,e ),(,e ),...,(,e ) onde... 0. A -ésma comonente rncal é dada or Y = e e tem V(Y ) = e Σe = e cov(y, Y k ) = 0 k. Se algum é gual a outro, na escolha do corresondente vetor de coefcentes e, Y então não é únco. c Solução normalzada: c c c c c c.c = = = M = c Pode-se defnr então: A ª comonente rncal: como a combnação lnear c que maxmza V( c ) sueta à restrção c.c =. A ª comonente rncal: como a combnação lnear c que maxmza V( c ) sueta às restrções c.c = e Cov ( c,c ) = 0.. A -ésma comonente rncal como a combnação lnear c que maxmza V( c ) sueta às restrções c.c = e Cov ( c,c ) = 0 ara todo <. Proredades: () Sea o vetor aleatóro =,,..., ] com matrz covarânca Σ e ares de [ autovalores-autovetores (,e ), (,e ),...,(,e ), onde... 0. A - ésma comonente rncal é dada or: Materal Retrado das Aostlas dos Profs. Jar Mendes Marques e Anselmo Chaves Neto Págna 3

Y = e = e + e +... + e, =,,..., onde: V(Y ) = e. Σ. e = e Cov(Y,Y ) = e. Σ. e = 0, () Varânca total: V( + + + = = σ + σ + + σ ) V( )... V() V(... = + +... + = ) = V(Y ) = (3) Se Y = e, Y = e,..., Y = e são as comonentes rncas de Σ então ρ Y = e σ,, =,,..., são os coefcentes de correlação entre as comonentes rncas Y e as varáves, onde (,e ), (,e ),...,(,e ), são os ares de autovalores-autovetores de Σ. (4) A roorção da varânca total devda à -ésma comonente rncal é, =,,..., + +... + Observação Imortante: Cada autovetor e = [e,e,...,e ] ode auxlar na nterretação da comonente rncal Y. A magntude de e mede a mortânca da - ésma varável ara a -ésma comonente rncal Y. Na realdade, e, é roorconal ao coefcente de correlação entre Y e. 5.4.Comonentes Prncas de Varáves Padronzadas: A -ésma comonente rncal das varáves adronzadas: z = [z = µ µ µ,,,z,...,z], σ σ σ ou, em notação matrcal: z = V / ( µ ) Materal Retrado das Aostlas dos Profs. Jar Mendes Marques e Anselmo Chaves Neto Págna 4

onde: σ 0 V / = M 0 0 σ M 0 M 0 0, M σ µ µ µ =, M µ = M com Cov(z) = ρ é dada or: y = e e.z = (V / ) ( µ), =,,..., Proredades: () V (y ) V(z ) = = = = () ρ y z = e,, =,,...,, onde: (,e ), (,e ),...,(,e ) são os ares de autovalores-autovetores de ρ com... 0. (3) A roorção da varânca total exlcada ela -ésma comonente rncal de z é dada or Exercícos: 0. Dada a matrz Σ = 5 0 do vetor aleatóro = (,, 3 ). 0 0 a) determne os ares de autovalor-autovetor da matrz de covarânca; b) escreva as comonentes rncas; c) determne a V(Y ); d) escreva a matrz C das combnações lneares referente às comonentes rncas; e) calcule a matrz de covarâncas do vetor de comonentes rncas Y; f) determne a roorção da varânca total que cabe a cada uma das comonentes rncas; g) qual a roorção da varânca total exlcada elas duas rmeras comonentes rncas; h) calcule os coefcentes de correlação entre a comonente Y e as v.a s e ; ) calcule os coefcentes de correlação entre a comonente Y e as v.a s, e 3 ; ) faça alguma conclusão quanto as comonentes rncas e as v.a s orgnas. k) Faça tudo de novo com dados adronzados; ) Sea a matrz de covarânca Σ = 4 4 00 do vetor aleatóro = [ ]. Materal Retrado das Aostlas dos Profs. Jar Mendes Marques e Anselmo Chaves Neto Págna 5

a) Determne a matrz de correlação do vetor; b) determne os ares de autovalor-autovetor de Σ; c) determne os ares de autovalor-autovetor de ρ; d) determne as comonentes rncas, or Σ; e) determne as comonentes rncas, or ρ; f) determne as varâncas das comonentes rncas, or Σ e or ρ; g) determne a roorção da varação total que cabe ara cada uma das comonentes rncas; h) calcule os coefcentes de correlação entre Y e e ; ) calcule os coefcentes de correlação entre Y e Z e Z ; 5.5.Comonentes Prncas Amostras: Na rátca, os arâmetros µ e Σ são desconhecdos e devem ser estmados. Suonha que x, x,..., x n, com n >, são vetores de observações ndeendentes de. As estmatvas de µ e Σ são, resectvamente, n µ ˆ = x = n x e n S = x) (x x)(x = n = A -ésma comonente amostral é dada or: Ŷ ˆ = e = ê + ê +... + ê, =,,..., onde: ( ˆ, ˆ ),(ˆ, ˆ ),...,(ˆ, ˆ e e e) são os autovalores-autovetores de S com ˆ ˆ... ˆ 0. Tem-se que: () V(Ŷ ) = ˆ, =,,,...,. () Cov (Ŷ,Ŷ ) = 0,. (3) s = s + s +... + = ˆ = ˆ + ˆ +... + ˆ s. = = (4) A roorção da varânca total devdo a -ésma comonente rncal estmada é ˆ, =,,...,. ˆ ˆ... ˆ + + + Materal Retrado das Aostlas dos Profs. Jar Mendes Marques e Anselmo Chaves Neto Págna 6

ê ˆ (5) A correlação amostral entre Ŷ e é r =,, =,,...,. Ŷ s Para um vetor de observações adronzadas: z ˆ = [ẑ,ẑ,...,ẑ] a matrz covarânca será: Sz ρˆ = R = M ρˆ ρˆ M ρ ρˆ ρˆ M A -ésma comonente rncal será ˆ ŷ = e z = ê z + ê z +... + ê z, =,,..., onde: ( ˆ, ˆ e ) é o -ésmo ar autovalor-autovetor de R com ˆ ˆ... ˆ 0. Para ŷ tem-se que: () V(ŷ ) ˆ =, =,,...,. () Cov (ŷ, ŷ ) = 0,. (3) Varânca total amostral = ˆ = ˆ + ˆ + + ˆ =... = tr(r) = (4) r ŷ z = ê ˆ, =,,..., (5) A roorção da varânca total amostral exlcada ela -ésma comonente será dada or ˆ, =,,...,. Materal Retrado das Aostlas dos Profs. Jar Mendes Marques e Anselmo Chaves Neto Págna 7

Exercícos: ) O censo de 970 forneceu nformações sobre cnco varáves sóco-econômcas de determnada regão. Os dados roduzram os seguntes resultados: 4, 3 x = 4, 0, 95, 7, 45 ª lnha oulação (ml) ª lnha dade escolar méda (anos) 3ª lnha total de emregados (ml) 4ª lnha total de emregados em servços lgados a saúde (00) 5ª lnha valor médo de resdêncas 4, 308, 683 803,, 55 0, 53, 683, 768 0, 588 0, 77 0, 76 S = 803, 0, 588 0, 80, 065 0, 58, 55 0, 77, 065, 970 0, 357 0, 53 0, 76 0, 58 0, 357 0, 504 Pergunta-se, ode a varação total amostral ser sumarada or uma ou duas comonentes rncas? ) Em um estudo sobre o relaconamento entre comrmento e forma de tartarugas ntadas, dos centstas medram o comrmento da caraaça, largura e altura. Seus dados, sugerem uma análse em termos de logartmos. O obetvo do trabalho era dar um sgnfcado ara os concetos de tamanho e forma. Foram fetas as meddas de (comrmento), (largura) e 3 (altura) em 4 tartarugas machos e a matrz de covarânca dos dados é dada a segur. Pede-se: a) Calcule os autovalores e autovetores de S; b) Determne as comonentes rncas Y, Y e Y 3; c) Qual a orcentagem da varânca total exlcada or cada uma das comonentes rncas? d) Calcule os coefcentes de correlação entre as comonentes e as v.a s orgnas; 43,58 59,87 6, 67 S = 64,57 98,99 63,87 Materal Retrado das Aostlas dos Profs. Jar Mendes Marques e Anselmo Chaves Neto Págna 8

3) Berce e Wlbaux (935) coletaram meddas de 5 varáves meteorológcas durante um eríodo de anos. As varáves são: ANO 3 4 5 90-87.9 9.6.0 66 8.37 9-89.9 5. 90. 968 3.77 9-3 53.0 9.7 56.6 353 6.04 93-4 3. 7.0 9.0 93 5.74 94-5 88.8 8.3 93.7 53 6.68 95-6 0.9 7.8 06.9 86 4.9 96-7 7.7 7.8 65.5 04 8.00 97-8 09.0 8.3 4.8 574 8.37 98-9 56. 7.8 57.4 4.96 99-30 8.5 6.8 40.6 90.66 930-3 8.4 7.0 74.3 50 4.37 a) Estme com base na amostra de tamanho n = observações do vetor o vetor médo oulaconal, a matrz de covarânca e a matrz de correlação oulaconas; b) Calcule os autovetores e os autovalores da matrz de correlação R; c) Escreva as comonentes rncas com base na matrz de correlação R; d) Determne a arcela da varação total exlcada or cada uma das comonentes rncas; e) Calcule os coefcentes de correlação entre as comonentes rncas ˆ Y =,,...,5 e as varáves orgnas =,...,5; f) Usando a matrz de covarâncas S que você obteve no tem a determne as comonentes rncas e determne a roorção da varânca total exlcada or elas. Comare com o que você obteve anterormente com base em R. Qual a nterretação é mas sgnfcatva. Materal Retrado das Aostlas dos Profs. Jar Mendes Marques e Anselmo Chaves Neto Págna 9