ANÁLISE MULTIVARIADA
|
|
|
- Maria Júlia Ximenes Cordeiro
- 8 Há anos
- Visualizações:
Transcrição
1 MINISTÉRIO DA EDUCAÇÃO E DO DESPORTO UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CIÊNCIAS EXATAS ANÁLISE MULTIVARIADA Daniel Furado Ferreira LAVRAS, MG 996
2 ii SUMÁRIO Pág.. Aspecos da análise mulivariada.. Inrodução.. Aplicação das écnicas mulivariadas 3.3. Organização de dados 5.4. Disâncias 5.5. Exercícios 4. Álgebra veorial e maricial 5.. Inrodução 5.. Elemenos de álgebra veorial 6.3. Elemenos de álgebra maricial Exercícios 8 3. Amosragem mulivariada Inrodução Geomeria amosral Amosras aleaórias e esperanças do veor de média e da mariz de covariância amosral Variância generalizada Variância generalizada de variáveis generalizadas Oura generalização da variância Exercícios 7
3 iii 4. Disribuição normal mulivariada Inrodução Pressuposições das análises mulivariadas Densidade normal mulivariada e suas propriedades 4.4. Disribuição normal bivariada Disribuição amosral de X e S Disribuições amosral derivada da disribuição normal mulivariada Verificando a normalidade Exercícios Inferências sobre o veor média Inrodução Inferências sobre média de uma população normal Região de confiança e comparações simulâneas de componenes de média Inferências sobre proporções de grandes amosras Comparações pareadas Comparações de veores de médias de duas populações Exercícios 5 6. Análise de variância mulivariada Inrodução Delineameno de classificação simples 0
4 iv 6.3. Inervalos de confiança simulâneos para o efeio de raamenos Exercícios 3 7. Componenes principais Inrodução Componenes principais populacionais Componenes principais amosrais Gráficos dos componenes principais Inferências para grandes amosras Exercícios 8 8. Análise de agrupameno Inrodução Medidas de parecença (similaridades e dissimilaridades) Agrupamenos Exercícios Análise de faores Inrodução Modelo de faores orogonais Esimação de cargas faoriais Roação faorial Tese da fala de ajuse do modelo faorial 346
5 v 9.6. Escores faoriais Exercícios Análise de correlação canônica Inrodução Variáveis canônicas e correlação canônica populacionais Variáveis e correlações canônicas amosrais Inferências para grandes amosras Exercícios 386. Referencias bibliográficas 389 Apêndices 395 Índice remissivo 397
6 [ ] Aspecos da análise mulivariada.. Inrodução Nos rabalhos cieníficos, o problema de se inferir, a parir de dados mensurados pelo pesquisador, sobre os processos ou fenômenos físicos, biológicos ou sociais, que não se pode direamene observar, é uma realidade consane. A pesquisa cienífica se consiui num processo ineraivo de aprendizado. Para explicação de um fenômeno, o pesquisador em geral colea e analisa dados de acordo com uma hipóese. Por ouro lado, a análise deses mesmos dados coleados de amosragem ou experimenação geralmene sugere modificações da explicação do fenômeno, além disso, devido à complexidade deses fenômenos, o pesquisador deve colear observações de diferenes variáveis. Nese conexo, a inferência esaísica é realizada de acordo com o paradigma hipoéico-deduivo (Bock, 975). Devido aos fenômenos serem esudados a parir de dados coleados ou mensurados em muias variáveis, os méodos esaísicos delineados para ober informações a parir deses conjunos de informações, são denominados de méodos de análises mulivariados. A necessidade de compreensão das relações
7 . Aspecos da análise mulivariada enre as diversas variáveis faz com que as análises mulivariadas sejam complexas ou aé mesmo difíceis. O objeivo do presene maerial é apresenar a uilidade das écnicas mulivariada de uma forma clara, usando exemplos ilusraivos e eviando o máximo de possível de cálculo. Sendo assim, os objeivos gerais, para os quais a análise mulivariada conduz são: a. redução de dados ou simplificação esruural: o fenômeno sob esudo é represenado da maneira mais simples possível, sem sacrificar informações valiosas e ornando as inerpreações mais simples; b. ordenação e agrupameno: agrupameno de objeos (raamenos) ou variáveis similares, baseados em dados amosrais ou experimenais; c. invesigação da dependência enre variáveis: esudos das relações esruurais enre variáveis muias vezes é de ineresse do pesquisador; d. predição: relações enre variáveis devem ser deerminadas para o propósio de predição de uma ou mais variável com base na observação de ouras variáveis; e. consrução e ese de hipóeses. Os modelos mulivariados possuem em geral, um propósio aravés do qual o pesquisador pode esar ou inferir a respeio de uma hipóese sobre um
8 Ferreira, D.F. Esaísica mulivariada 3 deerminado fenômeno. No enano a sua uilização adequada depende do bom conhecimeno das écnicas e das suas limiações. A frase uilizada por Marrio (974) descreve bem ese fao: Não há mágica com os méodos numéricos, e que apesar de serem uma imporane ferramena para análise e inerpreação de dados, não devem ser uilizados como máquinas auomáicas de encher lingüiça, ransformando massas numéricas em pacoes de faos cieníficos... Aplicação de écnicas mulivariadas As écnicas esaísicas consiuem se uma pare inegral da pesquisa cienífica e em paricular as écnicas mulivariadas em sido regularmene aplicada em várias invesigações cieníficas nas áreas de biologia, física, sociologia e ciências médicas. Parece, nese insane, ser apropriado descrever as siuações em que as écnicas mulivariadas êm um grande valor. Medicina Nos esudos onde as reações de pacienes a um deerminado raameno são mensuradas em algumas variáveis e possuem difícil diagnósico, as écnicas mulivariadas podem ser usadas para consruir uma medida de resposa simples ao raameno, na qual é preservada a maior pare da informação da amosra e das múliplas variáveis resposas. Em ouras siuações as écnicas
9 . Aspecos da análise mulivariada 4 mulivariadas podem ser usadas ambém quando a classificação de um paciene, baseada nos sinomas medidos em algumas variáveis, é difícil de ser realizada. Nese caso, uma écnica mulivariada de classificação, em que se cria uma função que pode ser usada para separar as pessoas doenes das não doenes, pode ser implemenada. Sociologia Em alguns esudos o iner-relacionameno e o agrupameno de indivíduos, cidades ou esados em grupos homogêneos em relação à mobilidade, número de esrangeiros nascidos e de segunda geração em deerminado país é necessária em alguns esudos sociológicos. As écnicas de análise mulivariada, conhecidas como análise de agrupameno (Cluser analysis), pode ser empregada com esa finalidade. Biologia No melhorameno de planas é necessário, após o final de uma geração, selecionar aquelas planas que serão os geniores da próxima geração. a seleção deve ser realizada de maneira que a próxima geração seja melhorada em relação à resposa média de uma série de caracerísicas da geração anerior. O objeivo do melhorisa consise em maximizar o ganho genéico em um espaço
10 Ferreira, D.F. Esaísica mulivariada 5 mínimo de empo. As análises mulivariadas podem ser usadas para converer uma série de caracerísicas para um índice, na qual a seleção e escolha dos pais possam ser feias. Em algumas siuações se deseja a separação de algumas espécies, e as écnicas mulivariadas êm sido uilizadas com esa finalidade. Uma função é consruída e os seus valores são usados para esa separação..3. Organização de dados Aravés dese maerial preende-se raar das análises realizadas em muias caracerísicas ou variáveis. Essas medidas, muias vezes chamadas de dados, devem ser organizadas e apresenadas em várias formas. Por exemplo, a uilização de gráficos e arranjos abulares são imporanes auxiliares nas análises de dados. Por ouro lado, números que resumem, ou seja, que descrevem quaniaivamene ceras caracerísicas, são essenciais para a inerpreação de os dados amosrais ou experimenais. Arranjos Os dados mulivariados são provenienes de uma pesquisa em deerminada área em que são selecionadas p variáveis ou caracerísicas para
11 . Aspecos da análise mulivariada 6 serem mensuradas. As medidas são omadas em cada unidade da amosra ou do experimeno. A represenação deses dados é feia com a noação x jk para indicar um valor paricular da j-ésima unidade amosral ou experimenal e da k-ésima variável mensurada. Conseqüene, esas medidas de p variáveis em n unidades amosrais ou experimenais, podem ser represenadas conforme o arranjo apresenado na Tabela.. Tabela.. Represenação de dados aravés da noação x jk para indicar um valor paricular da k-ésima variável mensurada na j-ésima unidade amosral ou experimenal. Variáveis Unidades amosrais ou experimenais... k... p X X... X k... X p X X... X k... X p j X j X j... X jk... X jp n X n X n... X nk... X np
12 Ferreira, D.F. Esaísica mulivariada 7 Eses valores, apresenados na Tabela., podem ser represenados em um arranjo reangular, denominado de X, com n linhas e p colunas, da seguine forma: X x x x k x p x x xk x p = x j xj xjk xjp x n xn xnk xnp Exemplo. Uma seleção de 4 firmas de ração de Minas Gerais foi obida para avaliar a venda de rações. Cada observação bivariada forneceu a quanidade de sacos de ração vendidos e a quanidade de reais de cada venda. Os dados obidos na forma abular são: Variável (Reais/venda) Variável (número de sacos de ração vendidos) Usando a noação proposa aneriormene, em-se: X =80 X =0 X 3 =90 X 4 =0 X =0 X = X 3 =6 X 4 =8 E a mariz X dos dados é:
13 . Aspecos da análise mulivariada 8 X = A organização dos dados em arranjos facilia a exposição e permie que os cálculos sejam efeuados de uma forma ordenada e eficiene. Os ganhos na eficiência são: () descrição dos cálculos como operações com marizes e veores; e () sua fácil implemenação em compuadores. ESTATÍSTICAS DESCRITIVAS Grandes conjunos de dados possuem um sério obsáculo para qualquer enaiva de exração de informações visuais perinenes aos mesmos. muias das informações conidas nos dados podem ser obidas por cálculo de ceros números, conhecidos como esaísicas descriivas. Por exemplo, a média ariméica ou média amosral, é uma esaísica descriiva que fornece informação de posição, iso é, represena um valor cenral para o conjuno de dados. Como um ouro exemplo, a média das disâncias ao quadrado de cada dado em relação à média, fornece uma medida de dispersão, ou variabilidade. Às esaísicas descriivas que mensuram posição, variação e associação linear são enfaizadas. As descrições formais desas medidas esão apresenadas a seguir. A média amosral, simbolizada por X, é dada por:
14 Ferreira, D.F. Esaísica mulivariada 9 X k n n j = = X k=,,..., p (.) jk Uma medida de variação é fornecida pela variância amosral, definida para as n observações de i-ésima variável por: S = S = X X ( ) k kk n jk k n j = k =,,..., p (.) A raiz quadrada da variância amosral, S kk, é conhecida como desvio padrão amosral. Esa medida de variação esá na mesma unidade de medida das observações. Uma medida de associação enre as observações de duas variáveis, variáveis k e k, é dada pela covariância amosral: S = ( X X )( X X ) k, k =,,..., p (.3) kk ' ' ' n jk k jk k n j= Se grandes valores de uma variável são observados em conjuno com grandes valores da oura variável, e os pequenos valores ambém ocorrem junos, S kk será posiiva. Se grandes valores de uma variável ocorrem com pequenos valores da oura, S kk será negaiva. Se não há associação enre os
15 . Aspecos da análise mulivariada 0 valores das duas variáveis, S kk será aproximadamene zero. Quando k=k, a covariância reduz-se a variância amosral. Além disso, S kk = S k k, para odo k e k. A úlima esaísica descriiva a ser considerada aqui é o coeficiene de correlação amosral. Esa medida de associação linear enre duas variáveis não depende da unidade de mensuração. O coeficiene de correlação amosral para k-ésima e k -ésima variável, é definido por: r S S kk kk ' kk ' = = S k ' k ' n n j= ( X jk Xk )( X jk ' Xk ') n ( X jk Xk ) ( X jk ' Xk ') j= j= (.4) Verifica-se que r kk =r k k para odo k e k. O coeficiene de correlação amosral é a versão esandardizada da covariância amosral, onde o produo das raízes das variâncias das amosras fornece a esandardização. O coeficiene de correlação amosral pode ser considerado como uma covariância amosral. Suponha que os valores X jk e X jk sejam subsiuídos pelos valores padronizados, ( X jk Xk ) ( X jk ' Xk ') S e kk S k' k'. Esses valores padronizados são expressos sem escalas de medidas (adimensionais), pois são cenrados em zero e expressos em unidades de desvio padrão. O coeficiene de correlação amosral é jusamene a covariância amosral das observações esandardizadas. A correlação amosral (r), em resumo, em as seguines propriedades:
16 Ferreira, D.F. Esaísica mulivariada. Os valores de r devem ficar compreendidos enre - e ;. Se r = 0, implica em inexisência de associação linear enre as variáveis. Por ouro lado, o sinal de r, indica a direção da associação: se r < 0 há uma endência de um dos valores do par ser maior que sua média, quando o ouro for menor do que a sua média, e r > 0 indica que quando um valor do par for grande o ouro ambém o será, além de ambos valores ender a serem pequenos junos; 3. Os valores de r kk não se aleram com a aleração da escala de uma das variáveis. As esaísicas S kk e r kk, em geral, não necessariamene refleem odo o conhecimeno de associação enre duas variáveis. Associações não lineares exisem, as quais, não podem ser reveladas por esas esaísicas descriivas. Por ouro lado, esas esaísicas são muio sensíveis a observações discrepanes (ouliers). Além desas, ouras esaísicas como a soma de quadrados de desvios em relação à média (W kk ) e a soma de produos de desvios (W kk ), são muias vezes de ineresse. Essas esão apresenadas a seguir:
17 . Aspecos da análise mulivariada W = n kk X jk X k j= ( ) ' = n kk jk k jk ' k ' j= W ( X X )( X X ) As esaísicas descriivas mulivariadas calculadas de n observações em p variáveis podem ser organizadas em arranjos. Médias da amosra X X X X p = Mariz de covariância amosral S S S S S S S = S S S p p p p pp
18 Ferreira, D.F. Esaísica mulivariada 3 Mariz de correlações amosral r r p r rp R = rp r p Exemplo. Considerando os dados inroduzidos no exemplo., enconrar as o veor de médias X e as marizes S e R. Nese exemplo, cada firma de ração, represena uma das observações mulivariadas, com p = variáveis (valor da venda em reais e número de sacos de rações vendidas). As médias amosral são: 4 j 4 j= 4 X = X = ( ) = 00 4 j 4 j= 4 X = X = ( ) = 9 X X 00 9 X = = A mariz de covariância amosral é:
19 . Aspecos da análise mulivariada 4 S =[(80-00) +(0-00) +(90-00) +(0-00) ]/3 = 333,333 S =[(0-9) +(-9) +(6-9) +(8-9) ]/3 = 6,667 S =[(80-00)(0-9)+(0-00)(-9)+(90-00) (6-9)+(0-00)(8-9)]/3 = 0,000 S =S =0,000, e S = 333, 333 0, 000 0, 000 6, 667 A correlação amosral é: 0 r = =0, , 333 6, 667 r =r =0,443 Porano,,0000 0,443 R = 0,443,0000
20 Ferreira, D.F. Esaísica mulivariada 5.4. Disâncias A maioria das écnicas mulivariadas é baseada no simples conceio de disância, por mais formidável que isso possa parecer. O conceio de disância euclidiana deve ser familiar para a maioria dos esudanes. Se for considerado um pono P=(x, x ) no plano caresiano, a disância dese pono P da origem O=(0, 0), definida por d(o,p), é dada pelo eorema de Piágoras por: dop (, )= x + x (.5) Esa siuação é ilusrada na Figura.. Em geral, se o pono P em p coordenadas, de al forma que P=(x, x,... x p ), a disância de P da origem O=(0, 0,..., 0), pode ser generalizada por: dop (, ) = x + x x p (.6)
21 . Aspecos da análise mulivariada 6 P d(o, P) X X Figura.. Disância enre um pono P=(x, x ) e a origem O=(0, 0), fornecida pelo eorema de Piágoras. Todos os ponos (x, x,.., x p ) que coném uma disância ao quadrado, denominada c, da origem, saisfaz a equação: d ( O, P) = x + x x = c (.7) p A expressão em (.7) represena a equação de uma hiperesfera (um círculo se p = ), e os ponos eqüidisanes da origem por uma disância d(o, P) perencem a essa hiperesfera. A disância de um pono P a um pono arbirário Q, com coordenadas P=(x, x,... x p ) e Q=(y, y,... y p ) é dada por: ( ) ( ) ( p p) dpq (, ) = x y + x y x y (.8)
22 Ferreira, D.F. Esaísica mulivariada 7 A disância euclidiana é insaisfaória para muias siuações esaísicas. Isso ocorre devido à conribuição de cada coordenada er o mesmo peso para o cálculo da disância. Quando esas coordenadas represenam medidas são provenienes de um processo que sofre fluuações aleaórias de diferenes magniudes é muias vezes desejável ponderar as coordenadas com grande variabilidade por menores pesos em relação àquelas com baixa variabilidade. Iso sugere o uso de uma nova medida de disância. Será apresenada a seguir uma disância que considera as diferenças de variação e a presença de correlação. Devido a escolha de a disância depender das variâncias e das covariâncias amosrais, a parir dese insane, será uilizado o ermo disância esaísica para disinguir de disância euclidiana. A princípio, será considerada a consrução de uma disância enre um pono P, com p coordenadas, da origem. O argumeno que pode ser usado refere-se ao fao de que as coordenadas de P podem variar no espaço produzindo diferenes posições para os ponos. Para ilusrar, suponha que se enha n pares de medidas em duas variáveis (x e x ) e que as medidas de x variam independenemene das mensurações em x. O significado de independene nese pono pode ser dado pelo fao de que os valores de x não podem ser predios com nenhuma acurácia a parir dos valores de x e vice-versa. Em adição, é assumido que as observações de x possuem maior variabilidade que as de x. Uma ilusração desa siuação esá apresenada na Figura..
23 . Aspecos da análise mulivariada 8 X Figura.. Diagrama de dispersão, mosrando a maior variabilidade na direção de x do que na direção de x. Observando a Figura., verifica-se que não é surpreendene enconrar desvios na direção de x que se afasem da origem consideravelmene, o que não ocorre na direção de x. Parece ser razoável, enão, ponderar x com mais peso do que x para um mesmo valor, quando as disâncias da origem forem calculadas.
24 Ferreira, D.F. Esaísica mulivariada 9 Um modo de fazer isso é dividir cada coordenada pelo desvio padrão * amosral. Após a divisão, êm-se as coordenadas esandardizadas x x s = e * =. Após eliminar as diferenças de variabilidade das variáveis x x s (coordenadas), deermina-se a disância usando a fórmula euclidiana padrão: * * x x dop (, ) = ( x ) + ( x ) = + S S (.9) Usando a equação (.9) odos os ponos endo como coordenadas (x, x ) e com disância quadrada (c ) da origem devem saisfazer: x S x + = c (.0) S A expressão (.0) é a equação de uma elipse, cujos maiores e menores eixos coincidem com os eixos das coordenadas. A Figura.3 mosra o caso geral para p = coordenadas.
25 . Aspecos da análise mulivariada 0 X 0.5 cs 0.5 -cs O 0.5 cs X 0.5 -cs Figura.3. Elipse de uma disância esaísica quadráica d (O,P)= x S x + = c. S Exemplo.3 Um conjuno de pares (x, x ) de duas variáveis forneceu X = X =, S =9 e S =. Supõe-se que as observações de x são independenes de x. A disância quadráica de um pono arbirário (P) da origem, uma vez que as variâncias da amosra não são iguais, é dada por: d x x ( O, P)= + 9
26 Ferreira, D.F. Esaísica mulivariada Todos os ponos (x, x ) que possuem disâncias quadrada da origem igual a, saisfazem a equação: x x + = (.) 9 As coordenadas de alguns ponos com disância quadráica uniária da origem foram apresenadas na Tabela.. Tabela.. Coordenadas de alguns ponos com disância quadráica uniária da origem. Coordenadas (x, x ) Disância ao quadrado ( 0, ) = ( 0,-) 0 ( ) 9 + = ( 3, 0) = (-3, 0) ( 3) = O gráfico da equação (.) é uma elipse cenrada na origem (0,0), cujo maior eixo é o da direção de x e o menor da direção de x. A meade do maior eixo (semi-eixo maior) é c S = 3 e do menor c S =. A elipse de disância quadráica uniária foi ploada na Figura.4.
27 . Aspecos da análise mulivariada 5 4 x x Figura.4. Elipse de disância uniária quadráica da origem obida a parir da equação.. A expressão (.9) pode ser generalizada para o cálculo da disância enre ponos P e Q, cujas coordenadas variam, muuamene independenemene uma da oura. O caso mais geral, em que a hipóese de independência não é saisfeia, será abordado fuuramene. dpq (, ) = ( x y ) ( x y ) ( xp yp) (.) S S S pp
28 Ferreira, D.F. Esaísica mulivariada 3 Todos os ponos (P) siuados a uma disância quadráica consane de Q, perencem a uma hiperelipsóide cenrada em Q, cujos maiores e menores eixos são paralelos aos eixos das coordenadas. O programa SAS, apresenado a seguir, coném os códigos necessários para a obenção das principais esaísicas descriivas mulivariadas apresenadas nesse capíulo. O programa coném códigos mariciais e será abordado com mais dealhe nos próximos capíulos. Os dados do exemplo. são uilizados para a ilusração. Proc IML; X={ 80 0, 0, 90 6, 0 8}; Prin X; n=nrow(x);p=ncol(x); Xbar=x`*j(n,,)/n; Prin Xbar; q=i(n)-(/n)*j(n,n,); prin q; S=(/(n-))*X`*q*X; W=(n-)*S; prin S W; V=diag(S); Vroo=half(V); IVroo=inv(Vroo); R=Ivroo*S*Ivroo; Prin V Vroo IVroo; Prin R; Qui; Foi moivado nesse capíulo o esudo das análises mulivariadas e enou-se fornecer alguns rudimenares, mas imporanes, méodos de organizar e resumir os dados. Em adição, o conceio geral de disância foi apresenado, e será abordado e generalizado nos próximos capíulos.
29 . Aspecos da análise mulivariada 4.5. Exercícios Considere as amosras com 8 observações e 3 variáveis apresenadas a seguir: x x x a) Consrua o gráfico de dispersão dos ponos das variáveis x e x, x e x 3, x e x 3. Comene sobre sua aparência. b) Calcule: X, S e R e inerpree os valores em R. c) Calcule a disância euclidiana dada em (.8) de um pono P=( x, x, x 3 )=(5,, 8) em relação a origem e em relação a X. d) Calcule as mesmas disâncias do iem c, usando (.).
30 [ ] Álgebra veorial e maricial.. Inrodução É desejável que as p resposas mulivariadas sejam represenadas por uma noação concisa. Os dados mulivariados podem ser disposos convenienemene como um arranjo de números, como foi apresenado no capíulo. Em geral, um arranjo reangular deses números, com n linhas e p colunas, por exemplo, é chamada de mariz de dimensões n x p. Se por ouro lado, o arranjo consise em n mensurações em apenas variável, ou ainda, de uma observação mulivariada em p variáveis, esses arranjos são denominados de veores. Com esse arranjo bidimensional, não só, a noação fica mais concisa, mas os muios resulados maemáicos de álgebra veorial e maricial faciliam a derivação e exposição dos méodos esaísicos mulivariados. Nese maerial, os elemenos de álgebra veorial e maricial, serão considerados como conhecidos. Nesse capíulo, no enano, para os esudanes não familiarizados com o assuno, será apresenada uma breve revisão.
31 . Álgebra veorial e maricial 6.. Elemenos de álgebra veorial De um pono de visa geomérico, as observações mulivariadas, podem ser consideradas como ponos no espaço p-dimensional, cujas coordenadas são dadas por (x, x,..., x p ). Esse pono pode ser viso como o final de um segmeno de rea da origem (0, 0,..., 0) ao pono (x, x,..., x p ). Tal segmeno de rea é denominado de veor de posição e pode ser denoado simplesmene por X. O veor de posições é apenas um exemplo de veor, para os quais pode ser elaborada a álgebra, baseada nos seguines posulados. POSTULADOS. Para qualquer veor X dado um número escalar c, a muliplicação do escalar pelo veor, resula em ouro veor Y, definido por: Y = c X c será considerado um número real;. A adição de dois veores conduz a um único veor definido como:
32 Ferreira, D.F. Esaísica mulivariada 7 Z = X + Y 3. A adição de veores é: Comuaiva: X + Y = Y + X Associaiva: X + ( Y+ Z) = ( ) X+ Y + Z 4. Se 0 é o veor nulo, enão: X + 0 = X 0. X = 0 COMPRIMENTO, ÂNGULO E DISTÂNCIA Inicialmene, é definido produo inerno enre dois veores, que represena a soma de produos de pares de coordenadas correspondenes. Para dois veores (n x ) de posição X e Y, o produo inerno será o escalar, dado por: n X.Y = x y = x y + x y + + x y i= i i n n
33 . Álgebra veorial e maricial 8 É fácil verificar que X.Y = Y.X. Por meio, do produo inerno é possível generalizar o eorema de Piágoras para o espaço euclidiano n-dimensional: n = = i = n = i= X X.X x x x x d (P,O) (.) em que P, é o pono do espaço n-dimensional, definido pelas coordenadas do veor X. A expressão (.) é o comprimeno ao quadrado do veor X. A expressão enre módulo X indica a norma de X. Dessa forma o comprimeno do veor é definido por: X = X.X (.) O ângulo θ enre dois veores ( X e Y ) pode ser expresso em função do produo inerno e do comprimeno dos veores, obido aravés da lei dos cosenos, por: Cos ( ) θ = X.Y X.X Y.Y (.3) As disâncias apresenadas no capíulo, enre os ponos coordenados dos veores X e Y, podem ser expressos agora como o
34 Ferreira, D.F. Esaísica mulivariada 9 comprimeno do veor diferença das coordenadas de X e Y. A disância enre X e Y é: d(x,y) = X Y = (X Y).(X Y) (.4) Além de ser não negaiva, essa disância enre os dois veores é independene da direção das medidas e saisfaz a desigualdade riangular: d( X, Y ) d( X, Z ) + d( Y, Z ) (.5) Derivada a parir da desigualdade de Cauchy-Schwars: a.b a.b (.6) O que implica, no fao, que o valor do co-seno do ângulo enre a e b não pode exceder a unidade. ORTOGONALIDADE Dois veores não nulos são denominados orogonais, se o co-seno do ângulo enre eles for zero. Iso indica que:
35 . Álgebra veorial e maricial 30 X.Y = 0 (.7) Muias vezes é desejável (em sisemas de equações lineares) consruir uma base oronormal de veores, iso é, cada veor da base possui comprimeno uniário ( X.X = ) ( X.X i j = 0,i j) i i e cada par de veor da base são orogonais. Para um conjuno de veores arbirários pode-se empregar a consrução de Gram-Schimid. O algorimo esá apresenado a seguir, considerando o conjuno X, X,..., Xn de veores: Passo : normalize X: X X = ; X.X 0 X.X Passo : Oronormalize X calculando o produo inerno enre X * e X, e subraindo de X os componenes de * X : Orogonalizando X e X : ( ) X X X.X X * * = Enão, normalizando-se X :
36 Ferreira, D.F. Esaísica mulivariada 3 * X X ; X.X 0 = X.X Passo 3: Calcule o produo inerno de X 3 com X * e X *, e subraia de X 3 os componenes de * X e * X, ( ) ( ) X = X X.X X X.X X * * * * X Enão, normalizando-se 3 : * X3 X 3; X 3.X3 0 = X 3.X 3 E assim por diane, aé o n-ésimo eságio, quando odos os veores enrarem na consrução. Se o i-ésimo veor for linearmene dependene dos veores aneriores, enão X i será igual ao veor nulo, X i = 0, devendo ser eliminado do conjuno e o processo deve coninuar com o veor X i +. O número de veores não nulos remanescenes no conjuno, consiuem a dimensão do espaço veorial original.
37 . Álgebra veorial e maricial 3 Exemplo. Dado o conjuno de veores, a seguir, uilizar como ilusração a consrução de Gram-Schimid. 0 0 X = 0 0 Os veores de X são dados por: X = [ X X X3 ] Passo. Normalize X: X * = Passo : Oronormalize X : Produo inerno: X. X = *
38 Ferreira, D.F. Esaísica mulivariada 33 orogonalização: X =. = 0 0 Normalização: * X =. = Passo 3: Oronormalização de X3 Produo inerno: * X.X 3 = e * X.X 3 = orogonalização: X3 =. ( ). = = 0 0 Verifica-se nese passo que X 3 é linearmene dependene dos veores X e X, e deve ser eliminado da base veorial. É fácil verificar que X = X X 3. Agrupando os veores linearmene independenes oronormalizados obém-se a base veorial de Gram-Schimid.
39 . Álgebra veorial e maricial 34 X = Pode ser observar facilmene que o produo inerno dos veores em X, é igual a zero. Um imporane ipo de mariz inversa, denominado de inversa de Moore- Penrose, é obido de uma base oronormal das colunas de uma mariz para a qual se deseja ober a inversa generalizada de Moore-Penrose. Seja A uma mariz de dimensão qualquer nxp e seja U a base oronormal de veores obida da oronormalização das colunas de A, enão, defini-se T por: T=U A Logo, a inversa generalizada de Moore-Penrose (A + ) é definida por: A + = T (TT ) - U..3. Elemenos de álgebra maricial Na álgebra maricial as relações e operações são definidas aravés de operações em arranjos reangulares dos elemenos, denominados de marizes. Um exemplo de mariz é:
40 Ferreira, D.F. Esaísica mulivariada 35 A a a a a a a p p = n x p a a a n n np O número de linhas de uma mariz é denominado de ordem de linha e o número de colunas, ordem de colunas. Se o número de linhas é n e o número de colunas é p, diz-se que a mariz possui ordem n x p. Pode-se represenar a mariz por: A=[a ij ] i=,,..., n j=,,..., p (.8) Nas análises mulivariadas, muias vezes, será feio referências a mariz de dados, a qual consise de p resposas de n observações ou unidades experimenais, e erá ordem nxp. POSTULADOS. Igualdade: Duas marizes necessariamene com o mesmo número de linhas e colunas são iguais, se e somene se os elemenos correspondenes, forem iguais: A=B a ij =b ij i=,,..., n e j=,,..., p
41 . Álgebra veorial e maricial 36. Adição: A soma de duas marizes de mesma ordem é obida pela soma dos elemenos correspondenes: A+B = [ a ij ] + [b ij ] = [a ij + b ij ] A adição com mariz nula 0, conendo elemenos iguais a zero é: na p + n 0 p = n A p 3. Muliplicação por escalar: o produo de um escalar e uma mariz é obido pela muliplicação de cada elemeno da mariz pelo número escalar: ca = c[ a ij ] = [ ca ij ] 4. Muliplicação de mariz: a muliplicação de marizes é definida para aquelas em que a ordem coluna do faor que pré muliplica é igual a ordem linha do faor que pós muliplica. Tais marizes são denominadas conformáveis para muliplicação. O elemeno (i, k) da mariz resulane do produo é a soma dos produos dos elemenos correspondenes, da i-ésima linha do faor que pré muliplica com os da k-ésima coluna do faor que pós muliplica. na q q B p = AB = q ab ij jk = [a i b k + a i b k a iq b qk ] = [c ik ] = C j=
42 Ferreira, D.F. Esaísica mulivariada 37 Em geral AB BA. A mariz quadrada com unidades na diagonal e zero nas demais pares é denominada de mariz uniária ou idenidade: Ι= 0 0 Verifica-se que: na p p Ι p = n A p nι n n A p = n A p A mariz quadrada cujos elemenos fora da diagonal principal são iguais a zero é denominada mariz diagonal: D = diag[d, d,..., d n ] = d d dn
43 . Álgebra veorial e maricial 38 A pré-muliplicação por uma mariz diagonal, simplesmene re-escala as linhas do faor que pós muliplica, e a pós-muliplicação re-escala as colunas do pré-faor. 5. Inversão de mariz: a inversa de uma mariz quadrada A, nxn, é chamada de A - e é definida de al forma que A A - = A - A = Ι. A inversa de um produo de marizes é o produo do inverso dos faores em ordem inversa a ordem de muliplicação original: (AB) - = B - A - Pois, B - A - AB = B - B = Ι e AB B - A - = AA - = Ι 6. Mariz ransposa: uma mariz obida pela roca de linhas por colunas a parir de uma mariz específica é denominada de mariz ransposa. É denoada por A. na P = [a ij ], enão, p A n = [a ij ] = [a ji ] (A + B) = A + B (AB) = B A
44 Ferreira, D.F. Esaísica mulivariada 39 (A - ) = (A ) - 7. Marizes paricionadas: deixe as r linhas de uma mariz A (mxn) ser paricionada das resanes s=m-r linhas, e as p colunas paricionadas das remanescenes q = n - p colunas. Enão, A pode ser represenada por submarizes, como a seguir: A A A r A A s p q = Seja B uma mariz paricionada de forma similar e sejam A e B ais que suas parições sejam conformáveis para adição, logo, A B A + B A + B r A B A B s p q + = + + Suponha agora que B seja paricionada em p e q linhas e em e u colunas. Enão, é possível verificar que:
45 . Álgebra veorial e maricial 40 AB r A A B B p q p q u = s A A B B A B + A B A B + A B r A B A B A B A B s u = + + Ainda é possível verificar que: ( ) ( ) p A B p A + A B D CA B CA A B D CA B q C D = q ( D CA B) CA ( D CA B) p q p q Méodo práico para cálculo de marizes inversas As roinas para compuadores usualmene fazem uso da versão compaca do méodo de Gauss, denominado de méodo de Gauss-Jordan (Householder, 953, 964). Os cálculos do méodo de Gauss-Jordan são recursivos, sendo que os elemenos da mariz no eságio i+ são rocados pelos resulados da chamada operação pivoane dos elemenos do eságio i, por: () i () i a ( ) ( ) kj a i+ i j k k () i a jj a = a k e j
46 Ferreira, D.F. Esaísica mulivariada 4 a + a = () i ( i ) j j () i a jj j a ( i+ ) akj = k j a () i kj () i jj a ( i+ ) jj = a () i jj O elemeno a é chamado de pivô, e sua linha e coluna são () i jj chamados de linha e coluna pivoais. Após n operações pivoanes, a mariz original é subsiuída pela sua inversa, garanindo-se que cada linha e coluna seja pivoada somene uma vez. Exemplo. Use o algorimo de Gauss-jordan para inverer a mariz A (x) a seguir: ( ) 4 A 0 = Passo. Um bom compromisso com a precisão é pivoar a linha e coluna cujo elemeno da diagonal seja o maior de odos os não pivoados. Assim o
47 . Álgebra veorial e maricial 4 elemeno escolhido para pivô é o elemeno a =4. A mariz após a primeira ação pivoane é: A () = = 4 4 Passo. Nese passo, a única coluna ou linha não pivoada é a. Porano o pivô é a =, e a mariz resulane da operação pivoane é: A ( ) ( ) 4 = = = Ao final da operação pivoane, a mariz resulane, A (), é a mariz inversa de A. Marizes orogonais Classes especiais de marizes, que serão uilizadas roineiramene nas écnicas mulivariadas, são denominadas de marizes orogonais, sendo simbolizadas em geral por Q e caracerizada por:
48 Ferreira, D.F. Esaísica mulivariada 43 Q Q = QQ = Ι ou Q = Q - O nome deriva da propriedade de que se Q em i-ésima linha q i, enão, se QQ = Ι implica que qq i i = e qq i j = 0 para i j, sendo que as linhas possuem amanho uniário e são muuamene orogonais (perpendiculares). De acordo com a condição de que Q Q = Ι, as colunas êm a mesma propriedade. Exemplo.3 Dado a mariz Q, a seguir, verifique sua orogonalidade: Q = A ransposa de Q é dada por: Q = enão, QQ 0 0 = = 0 = 0
49 . Álgebra veorial e maricial 44 e, QQ 0 0 = = 0 = 0 sendo, Q Q = QQ = Ι ou Q = Q -, verificou-se que Q é orogonal. Deerminanes Uma função escalar imporane de uma mariz A quadrada nxn, é o deerminane da mesma. O deerminane da mariz A é simbolizado por A e é definido por: A = a se n = n j= ij ij ( ) i + j A = a A se n > (.9) em que A ij é a mariz quadrada (n-)x(n-) obida deleando-se a i-ésima linha e a j-ésima coluna de A, para qualquer escolha arbirária de i=,,..., n. Exemplo.4 Para ilusrar a definição (.9), serão consideradas as seguines marizes:
50 Ferreira, D.F. Esaísica mulivariada 45 A = 4; 4 4 A = [4] B= C 0 = 0 3 B = 4 ( ) + ( ) = 4.. = 7 ; 0 0 C = 4 ( ) + ( ) + ( ) = [ ( ) 0 0 ( ) ] ( ) [ ( ) 0 ( ) ] ( ) + + = = 3 4 [ 0 ( ) ( ) ] ( ) C = 0 Propriedades dos deerminanes. A = A ;. Se uma linha ou coluna de A for muliplicada por uma consane k, o deerminane ficará muliplicado pela consane; 3. Se A é muliplicada por uma consane k, o deerminane resulane ficará muliplicado por k n ;
51 . Álgebra veorial e maricial 46 n ka = k A 4. Se duas linhas ou duas colunas são rocadas de posição, enão o deerminane muda de sinal; 5. Se duas linhas ou duas colunas são proporcionais, enão o deerminane de A será igual a zero; 6. O deerminane obido deleando a i-ésima linha e j-ésima coluna de A é denominado menor de A, e denoado por A ij. A relação enre A e A ij foi apresenada na definição de deerminane (.9); 7. A = = A ; A 8. AB = A B. Deerminane e poso (rank) Se A 0, enão, A é denominada de poso compleo, ou como é mais comum dizer, A é não-singular e A - exise. Uma condição necessária e suficiene para a exisência da inversa de A é que A 0.
52 Ferreira, D.F. Esaísica mulivariada 47 Teorema da muliplicação n x n dadas por: Seja a mariz A de ordem n x n, paricionada em sub-marizes B C n A = D E n n n Supõe-se que o deerminane de A é não nulo, e se necessário for, linhas e colunas correspondenes de A devem ser rocadas para assegurar que B seja não-singular. Como o número de rocas de linhas e colunas é necessariamene par, o valor de A não se alera. Considere marizes elemenares, com deerminane, dadas por: Ι DB 0 Ι e Ι 0 B C Ι o resulado é: Se A for pré e pós-muliplicada, respecivamene, por essas marizes
53 . Álgebra veorial e maricial 48 Ι 0 B C Ι B C DB D E Ι 0 Ι B C B 0 Ι B C = = 0 DB C+ E 0 0 E DB C Ι Enão, A foi reduzida para sua forma quase-diagonal ou bloco diagonal. Seja uma mariz V (n x n) paricionada da seguine forma: V V 0 n 0 V n n n = enão, o deerminane de v é dado por: V = V V Aplicando essa regra a A ransformada pela pré e pós-muliplicação por marizes elemenares, cujo deerminane é igual a, o que não alera o valor de A, em-se: B 0 = = 0 E DB C A B E DB C Observe que se A for quasi-riangular, ou seja, riangular por blocos, o deerminane é o produo dos deerminanes de suas sub-marizes principais:
54 Ferreira, D.F. Esaísica mulivariada 49 B C BE 0 E = Agora é possível apresenar e provar o eorema da muliplicação. Se A e B são marizes quadradas n x n, enão, AB = A. B. Considere para isso a idenidade: I A A 0 0 AB 0 I = I B I B O produo do lado esquerdo da igualdade envolve operações elemenares que não afea o deerminane. Assim, o deerminane de ambos os lados é igualado e o resulado obido é: A 0 0 AB = I B I B Colocando o lado direio na forma quasi-riangular por meio de rocas nas úlimas n colunas o resulado obido é dado por: A 0 AB 0 = ( ) n I B B I
55 . Álgebra veorial e maricial 50 blocos, êm-se: Usando o resulado do deerminane de uma mariz riangular por n AB= ( ) AB I n n AB= ( ) ( ) AB n AB= ( ) AB AB = A B Infelizmene, não há eorema simples para a soma de marizes. Decorre desse eorema que: A A = I A A A = = = A A Derivadas de veores e marizes As derivadas de funções envolvendo veores e marizes são necessárias em inúmeras aplicações na mulivariada e em ouras áreas. Apesar de ser possível escrever essas mesmas funções em uma forma expandida e omar as derivadas elemeno a elemeno pelas regras de diferenciação escalar, é vanajoso definir regras que reenham veores e marizes na noação (Bock, 975).
56 Ferreira, D.F. Esaísica mulivariada 5 A seguir são apresenadas as principais regras de diferenciação veorial e maricial. Derivadas de marizes de funções em relação a variáveis escalares Seja A uma mariz m x n cujos elemenos são funções diferenciáveis com relação a uma variável escalar x. A derivada de A em relação a x é uma mariz m x n: A x a an x x = am a mn x x (.0) Seja A uma mariz m x n de funções diferenciáveis em x e B oura mariz p x q cujos elemenos, ambém, são diferenciáveis em x. Para cada caso abaixo, são adoadas dimensões ais que as operações mariciais sejam conformáveis. ( A+ B) A B = + ; m= p, n = q x x x (.) ( AB) B A = A + B; n = p x x x (.)
57 . Álgebra veorial e maricial 5 ( A ) A = A A ; m= n, A 0 x x (.3) j-ésima coluna, enão, Seja X uma mariz m x n com o elemeno x ij na i-ésima linha e X = x ij ij (.4) em que ij é uma mariz m x n com na i-ésima linha e j-ésima coluna e 0 nas demais posições. Se X for uma mariz diagonal n x n, logo, X = x ii ii (.5) Derivadas de uma função escalar de marizes em relação a um veor ou mariz variável Seja g uma função escalar qualquer de uma mariz X, que pode ser por exemplo o deerminane, o raço, enre ouras, enão, a diferenciação de g em relação a X é:
58 Ferreira, D.F. Esaísica mulivariada 53 g g x x n g = X g g xm x mn (.6) a) o raço O raço de uma mariz n x n é uma função que aparece com muia freqüência na esaísica mulivariada, o qual é a soma dos elemenos da diagonal principal dessa mariz: n r ( A) = a (.7) i= ii Para as marizes A, B e C de ordem m x n, p x q e r x s, respecivamene, o raço em as seguines propriedades: r ( A+ B) = r ( A) + r ( B), m = n = p = q (.8) r ( δ A) =δ r ( A), m = n (.9) r ( A ) = r ( A), m = n (.0) r ( AB) = r ( BA), m = q, n = p (.)
59 . Álgebra veorial e maricial 54 ( ) [ ] ( ) r ABC = r (AB)C = r CAB, m = s, n = p, q = r (.) Seja C uma mariz r x s de consanes e X uma mariz u x v de variáveis. As seguines direivas de derivação do raço de funções de C e X com relação aos elemenos de X, resulam em marizes de dimensão u x v: r ( C) = 0, r = s X (.3) r ( X) = I, r = s X (.4) r ( XC) = C, r= v, s= u X (.5) ( ) r XCX X ( ) = C+ C X, r = v = s = u (.6) Essas direivas de derivação são invarianes as permuações cíclicas sofridas por ransposição ou permuação dos faores de muliplicação de marizes. no enano, as derivadas com relação a ransposa de X resulam em ransposas das marizes aneriores de ordem v x u. Em paricular:
60 Ferreira, D.F. Esaísica mulivariada 55 r ( XC) = C, r= v, s= u X (.7) ( ) r XCX X ( ) X, r v s u = C + C = = = (.8) Para ober derivadas de funções elemenares das marizes algumas direivas ambém são definidas. Sejam os elemenos de A e B funções de X, e seja C uma mariz de consanes. Enão, r ( A+ B) r ( A) r ( B ) = +, m = n = p = q X X X (.9) r ( AB) r ( AB) r ( AB ) = +, m = q,n = p X X X (.30) r ( A ) r ( A A ) =, m = n, A 0 X X (.3) ( ) r ( ) r A C = A CA A, m = n = r = s, A 0 X X (.3) A barra acima das marizes aneriores em (.9) a (.3) indica que essas são consideradas consanes para fins de diferenciação.
61 . Álgebra veorial e maricial 56 b) deerminane X = adj ( ) ( X = X X ), u = v, X 0 X (.33) ln X X adj( ) = X = ( X ), u = v, X 0 X (.34) Resrições da variável de diferenciação Alguns problemas esão sujeios a maximização ou minimização com relação a uma variável que por sua vez esá sujeia a resrições. Os casos especiais são àqueles em que X é simérica. Logo X=X e os elemenos fora da diagonal são sujeios a: x ij = x ji i<j (.35) Uma abordagem apropriada para o problema é impor resrições por meio de muliplicadores de Lagrange. Para aplicar esse méodo, deve-se diferenciar com relação a x não resria a expressão da forma: g+ r[ U( X X )]
62 Ferreira, D.F. Esaísica mulivariada 57 em que g é uma função escalar de X, U a n x n mariz de muliplicadores de Lagrange. Logo, X deve saisfazer: g + ( U U ) = 0 X (.36) Como ambém g g + ( U U) = ( U U) = 0 X X (.37) Somando essas expressões obém-se a condição para o exremo resrio: g g + = 0 X X (.38) Ouro caso imporane de mariz X resria é: se X é uma mariz diagonal n x n e Y uma mariz função de X, enão, r(y) r(y) r(y) r(y) = Diag X x x x (.39) nn E se X = x Ι, enão,
63 . Álgebra veorial e maricial 58 r(y) r(y) = X x (.40) Regra da cadeia para funções escalares de marizes Seja g uma função escalar de A diferenciável com relação aos elemenos de A, e deixe os elemenos de A ser função diferenciável de x. Enão, g g A r = x A x (.4) Por exemplo, para A 0, g=ln A de (.34) em-se: g ln A ln A A A = = r = r ( A ) x x A x x (.4) derivada de uma função de um veor com relação a um veor Seja um veor z m x, cujos elemenos são diferenciáveis pelos elemenos x n do veor x = [ x x x ] n. A derivada de Z em relação a x é a mariz m x n:
64 Ferreira, D.F. Esaísica mulivariada 59 z z i =,,..., m = x x j j =,,..., n ij (.43) simérica, Por exemplo, de (.6) em-se a primeira derivada de xax, sendo A ( ) xax r xax = = Ax x x (.44) De (.43), a segunda derivada é represenada em forma maricial por: ( xax x) xax Ax A = = = x x x x (.45) Formas quadráicas Definindo A como uma mariz simérica não nula (nxn), e o veor x = [X X X n] a expressão: n n n ii i ij i j i= i= j= i+ Q= x A x = a X + a XX
65 . Álgebra veorial e maricial 60 é dia forma quadráica, pois só coném ermos quadrados ( ) ( i j) xx. x e de produos i Exemplo.5 Obenha a expansão da forma quadráica, dado o veor x e a mariz A, a seguir: [ ] x x x A 4 = = 4 x x Q = [ x x] [ 4x x x x] = + + x x Q = 4x + x x + x Assumindo, para o momeno, que p elemenos x, x,..., x p, de um veor x são realizações de p variáveis aleaórias X, X,..., X p pode-se considerá-los como coordenadas de um pono no espaço p-dimensional. A disância desse pono [x x x p] da origem pode e deve, nesse caso, ser inerpreada em ermos de unidades de desvio padrão. Desse modo, pode-se considerar a incereza inerene (variabilidade) às observações. Ponos com a mesma incereza associada são considerados de mesma disância da origem. Inroduzindo agora uma fórmula geral de disância mais apropriada êm-se:
66 Ferreira, D.F. Esaísica mulivariada 6 n n n ( 0,P) = ii i + ij i j i= i= j= i+ (.46) d a x a x x e garanindo que d > 0 para odo pono P 0, e fazendo a ij =a ji, êm-se: a a a p x a a ap 0< d = x Ax = x x p p x ap a p app (.47) Verifica-se que (.47) é uma forma quadráica, o que permie que a inerpree como uma disância. A deerminação, dos coeficienes da mariz A de (.47) será apresenada oporunamene. Classificação de formas quadráicas As formas quadráicas podem ser classificadas, quano aos resulados que produzem. Nesa seção, o ineresse residirá nas formas quadráicas não negaivas e nas marizes associadas (denominadas posiivas definidas). Uma condição necessária e suficiene para que A seja posiiva definida (pd) é que esa possa ser faorada por:
67 . Álgebra veorial e maricial 6 A = S S n n n n n n e que o poso de S seja n, em que S é uma mariz riangular, denominada faor de Cholesky de A (Bock, 975). Porano, se uma mariz admie o faor de Cholesky, ela é posiiva definida. Q = x Ax = x (SS )x = (S x) (S x) = z z = Z + Z + + Z n Devido a S er poso coluna compleo, não exise x não nulo, al que z= S x = 0. Porano, a forma quadráica Q é sempre posiiva, como foi afirmado. Se por ouro lado, o poso de S for r n, enão o poso de A será r, e a forma quadráica Q = x'ax 0, é denominada posiiva semidefinida (psd). Isso se deve ao fao de que para algum veor x 0, a igualdade Q = 0, aconece. O algorimo para obenção do faor de Cholesky de uma mariz pd, esá apresenado a seguir. Algorimo para obenção do faor de Cholesky de uma mariz posiiva definida. Dada uma mariz A (nxn), com elemenos a ij.
68 Ferreira, D.F. Esaísica mulivariada 63. Obenção da ransposa do faor de Cholesky S, é dada pelo algorimo abaixo, sendo que os elemenos desa mariz não conemplados pelo méodo devem ser considerados iguais a zero: a linha: j S = a Sj = j> S a i-ésima linha: S = a i S ii ii ri r= S = a i SS ij ij ri rj Sii r= i j> i 3. A obenção de S -, inversa de S, com elemenos S ij, é dada por: S = S = S S i > j i ii ij rj ri Sii Sii r= = ij para i < j S 0 4. A obenção da A -, inversa de A, com elemenos a ij, em que a ij =a ji, é dada por:
69 . Álgebra veorial e maricial 64 n n ( ) ii ri ij ri rj a = S a = S S i> j r= i r= i Exemplo.6 Obenha o faor de Cholesky (S), sua inversa (S - ) e a mariz inversa (A - ), a parir da mariz A, apresenada a seguir: 4 0 A = 0 Obenção de S : Primeira linha: 0 S = 4 = ; S = = ; S3 = = 0 Segunda linha: S = = S3 = [ 0] = Terceira linha:
70 Ferreira, D.F. Esaísica mulivariada 65 ( ) S33 = 0 + = Logo, S = 0 e S= 0 A mariz S - é obida por: Linha : Linha : 3 S = ; S = S = 0 i< j S = = ; S = = ; S = 0 pois i < j linha 3: = = = + = = = S ; S 0 S ( )
71 . Álgebra veorial e maricial 66 logo, 0 0 = S 0 A mariz A - é obida por: Diagonal principal: a 3 = + + = 4 ( ) a = + = 33 a = = Demais elemenos: = + = = = = = = = = = = = a ( ) ; 3 3 a ; a ( ) ; a a ; a a ; a a
72 Ferreira, D.F. Esaísica mulivariada 67 Logo, 3 4 A = O faor de Cholesky S e sua inversa êm as seguines propriedades:. SS = A. S - S = S (S - ) = Ι 3. S - A = S 4. A(S - ) = S 5. (S - )A(S - ) = Ι 6. (S - ) (S - ) = A -
73 . Álgebra veorial e maricial 68 Maximização de formas quadráicas Na esaísica mulivariada e em ouras áreas aplicadas, é muias vezes necessária a maximização de uma forma quadráica. Devido à forma quadráica Q = x Ax poder ser feia arbirariamene grande omando-se os valores dos elemenos de x grandes, é necessário maximizar Q condicionada a alguma resrição no comprimeno de x. Uma conveniene alernaiva é omar uma solução normalizada de x, ou seja, uma solução al que x enha comprimeno uniário. Enão a maximização da forma quadráica Q pode ser ransformada na maximização da razão: xax xx λ= para oda mariz A simérica real. Para a maximização deve-se omar a derivada em relação a x e igualar a zero, resolvendo o sisema obido, como demonsrado a seguir. usando a regra do quociene: Q x Ax x x = = Ax e = x x x x
74 Ferreira, D.F. Esaísica mulivariada 69 λ Ax(x x) (x Ax)x x Ax = A x = Ι x (x x) x x x x igualando a zero essa derivada e dividindo-a por ( x x), é obido o sisema homogêneo de equações: xax A Ι x = 0 xx Desde que xax xx = λ, enão para um pono esacionário qualquer i, ( ) A λι i xi = 0 (.48) Para que o sisema de equações em (.48) não possua apenas a solução rivial, A-λ i Ι não pode er poso compleo. Iso significa que seu deerminane deve ser zero: A-λ i Ι = 0 (.49) A equação polinomial em λ, resulado da expansão dos ermos a esquerda na equação (.49) aravés do uso da definição (.9), é chamada de equação caracerísica de A. A i-ésima raiz da equação (λ i ) é denominada de valor
75 . Álgebra veorial e maricial 70 caracerísico de A; xi é denominado veor caracerísico de A associado a λ i. Ouras erminologias podem ser empregadas, ais como, auovalores e auoveores, ou, valores e veores próprios, ou ainda, raiz e veor laene. Pares de formas quadráicas É de fundamenal imporância na análise mulivariada o problema de maximizar razão enre duas formas quadráicas: xax xbx λ= B 0 em que B é uma mariz pd. O máximo é dado da mesma forma que apresenado aneriormene, a parir da derivada em relação a x, igualando-a a zero, como apresenado a seguir: xbx xax x x Bx λ = Ax Bx = (A λ B)x = 0 (.50) ( x 0 ), se e somene se, O sisema homogêneo de equações (.50) erá solução não rivial A λ B = 0 (.5)
76 Ferreira, D.F. Esaísica mulivariada 7 Os auovalores (λ) de A em relação a B são denominados de valores próprios, raízes caracerísicas, e os auoveores de veores caracerísicos ou próprios. Desde que B seja pd, é possível faorá-la aravés do faor de Cholesky, por: B= S S B B Enão definindo-se z= SBx e usando as propriedades do faor de Cholesky em-se que = ( ) x SB z. Agora, se (.50) for pré muliplicada por S B e ( ) B x = S z for subsiuído na expressão, êm-se: ( B ) ( ) SBA λ SBB SB z= 0 SBA S λι z= 0 (.5) desde que S B( S ) B B =Ι A solução de (.5) é a mesma da obida pela maximização de uma forma quadráica, apresenada em (.48), exceo que = ( ) x SB Z deve ser recuperado, uma vez que Z é obido. Os auovalores, no enano, são invarianes à ransformação não-singular realizada.
77 . Álgebra veorial e maricial 7 Cálculo práico dos auovalores e auoveores Será apresenado aqui o méodo denominado Power mehod derivado por Hoelling (936). Esse méodo é apropriado para problemas em que somene r auovalores de maior magniude e os seus respecivos auoveores são necessários (r n). O méodo é ieraivo, dado um veor inicial arbirário v (0). O veor do eságio i será represenado por v (i) e o da próxima ieração será obido por: v = Av (i+ ) (i) Usualmene um veor de elemenos iguais a ± é usado como veor inicial. Os veores caracerísicos devem ser normalizados em cada eságio, para que o criério de convergência seja verificado. Quando uma aproximação desejada para λ e x sejam alcançados, o segundo auovalor e auoveor devem ser enconrados na mariz A, definida por: A = A λ x x (.53) E assim o processo é repeido aé que um número r n de pares de auovalores e auoveores sejam obidos.
78 Ferreira, D.F. Esaísica mulivariada 73 Exemplo.7 aplicar o power mehod e deerminar os auovalores e auoveores da mariz apresenada a seguir: 4 A =. Deerminação de λ e x O veor (0) v será considerado como: (0) v = Na avaliação da convergência, o auoveor em cada eságio será padronizado aravés da divisão pelo elemeno de maior valor do mesmo. (i) v () (0) 4 6 = Av = = 3 Normalizando () v : v () 6 6 = 3 = 6
79 . Álgebra veorial e maricial 74 Para avaliar a convergência, os veores v (0) e v () devem ser comparados. Será considerado, convergene se odos os elemenos de v () forem semelhanes aos (0) elemenos correspondenes de v, para uma precisão pré esipulada, ou seja, de x0-8. Nese caso, os veores diferem consideravelmene. (ii) v 4 5 = Av = =.5, normalizando () () v () = Comparando-se () v com () v, padronizados, verifica-se que são idênicos, indicando que o criério de convergência foi alcançado. O auoveor x é obido pela normalização de () v e o primeiro auovalor λ, por λ = x A x. () V 0,8944 x = = () () V V 0,447 0,8944 λ = x A x = [ 4,47,36] = 5 0,447. deerminação de λ e x A A x x = λ = 5 [ 0,8944 0,447] 4 0, = 0,
80 Ferreira, D.F. Esaísica mulivariada 75 Porano os demais auovalores e auoveores de A são nulos (λ =0 e x = 0 ). Os auovalores da mariz da forma quadráica podem servir para classificação das mesmas. Demonsra-se que se odos os auovalores da mariz A, dado Q = x Ax, forem posiivos e maiores que zero a mariz A é posiiva definida e a forma quadráica é posiiva. Se A possui auovalores posiivos e nulos a mariz será psd, e a forma quadráica poderá ser nula para um veor x 0. Os resulados apresenados aé agora, a respeio de formas quadráicas, são conseqüências da expansão de marizes siméricas em um processo denominado de decomposição especral. A decomposição especral de uma mariz A (nxn), simérica, é dada por: A=λ ee +λ e e + +λ e e n n n (.54) em que λ i (i=,,..., n) são os auovalores de A e e i são os auoveores normalizados associados. Exemplo.8 Considere a mariz simérica: 4 A = com os auovalores e auoveores normalizados, apresenados a seguir:
81 . Álgebra veorial e maricial 76 0,8507 0,557 λ = 5,36 e = λ = 0,7639 e = 0,557 0,8507 Obenha a decomposição especral de A. 3,7893,347,347,447 λ ee = 0, 0,346 0,346 0,558 λ ee = 4 3,7893,347 0, 0,346 = +,347, 447 0,346 0,558 A expressão da disância como raiz quadrada de uma forma quadráica posiiva definida permie que se obenha a inerpreação geomérica baseada nos auovalores e auoveores de uma mariz. Dada uma mariz A, pxp, e suponha que p=, os ponos x =[x, x ] de disância consane c da origem saisfazem a: xax= a X + a X + a XX = c pela decomposição especral de A, como no exemplo.8, em-se:
82 Ferreira, D.F. Esaísica mulivariada 77 A =λ ee +λee xax=λ Xe +λ Xe ( ) ( ) Fazendo y i =, obém-se: c =λ y +λ y que é uma elipse, pois λ i >0. Verifica- x ei se que x = cλ e xax= λ cλ ee = c saisfaz ( ) e x = cλ e fornece a apropriada disância na direção de e. Porano, os ponos de disância c perencem a uma elipse cujos eixos são dados pelos auoveores de A com amanhos proporcionais ao recíproco da raiz quadrada dos auovalores. A consane de proporcionalidade é c. A siuação é ilusrada na Figura.. Se p> os ponos perencem a uma hiperelipsóide de disância c consane da origem, cujos eixos são dados pelos auoveores de A. O semi eixo na direção i em comprimeno de c λ. i x e -0,5 cλ e -0,5 cλ x Figura.. Ponos de disância c consane da origem (λ < λ ).
83 . Álgebra veorial e maricial 78 Mariz raiz quadrada A parir da decomposição especral, é possível definir uma caegoria de mariz, em função dos auovalores e auoveores, denominada de mariz raiz quadrada. Sendo A (nxn), uma mariz com decomposição especral dada por n ieiei, pode-se consruir uma mariz P, cujas colunas são os auoveores i= A= λ normalizados de A, al que, P= [ e e e ] n auovalores de A, al que, Λ=diag[λ i ]. É fácil verificar que:, e uma mariz Λ diagonal, como os A= PΛP n A = PΛ P = ee (.55) i i i= λ i Definindo, Λ / como uma mariz diagonal com λ i como elemeno da i-ésima diagonal, enão, a mariz a seguir é definida como mariz raiz quadrada de A e é simbolizada por A /. n = λ i i i = Λ i= A ee P P (.56)
84 Ferreira, D.F. Esaísica mulivariada 79 As suas propriedades são:. (A / ) = A / (A / é simérica). A / A / =A 3. ( ) n = i i = Λ λi i= A ee P P 4. A / A -/ =A -/ A / =Ι e A -/ A -/ =A - em que A -/ = (A / ) - Exemplo.9 Obenha a mariz raiz quadrada e a inversa da mariz uilizada no exemplo (.8), usando as equações (.55) e (.56): 4 A = com auovalores e auoveores normalizados, apresenados a seguir:
85 . Álgebra veorial e maricial 80 0,8507 0,557 λ = 5,36 e = λ = 0,7639 e = 0,557 0,8507 As marizes P e Λ foram obidas pelos auovalores e auoveores, e esão apresenadas a seguir: 0,8507 0,557 5,36 0 P = 0,557 0,8507 Λ = 0 0,7639 5,36 0 0,8507 0,557 0,8507 0,557 A = PΛ P = 0,557 0, = 0,7639 0,557 0,8507 A = PΛ P = 0,8507 0,557 5,36 0 0,8507 0,557,8975 0,634 = 0,557 0,8507 = 0 0,7639 0,557 0,8507 0,634,649 A seguir, um programa SAS é apresenado conendo os principais comandos para a realização das várias operações mariciais e veoriais descrias nesse capíulo.
86 Ferreira, D.F. Esaísica mulivariada 8 /* Capiulo de mulivariada - principais operações mariciais descrias */ /* por meio do proc iml. Roinas de inversão, muliplicação, ransposição */ opions nodae nonumber ps=000 ls=76; proc iml; /* elemenos de algebra veorial*/ x={,,,}; x={,,0,0}; x3={0,0,,}; prin x x x3; y=4*x; z=x+x; prin y z; yz=y` * z; yy=y`*y; /*disancia quadraica*/ dy=sqr(yy); /* disancia da origem*/ zz=z`*z; dz=sqr(zz); cosea=yz/(dy*dz); prin yz yy zz dy dz cosea; /* elemenos de algebra maricial*/ x=x x x3;/* concaenando veores para ober uma mariz*/ xpx=x`*x; xx=xpx#xpx; /* produo de xpx elemeno a elemeno por xpx*/ prin x xpx xx; /*calculo da base oronormal de Gramshimid - a mariz p coném as colunas oronormalizadas de X*/ Call Gsorh(p,, lindep, X); prin lindep p ; /* calculo de auovalores e auoveores */ pu=eigvec(xpx); /* pu mariz de auoveores */ au=eigval(xpx); /* au veor de auovalores */ prin pu; prin au; a={4, }; /* mariz A*/ ainv=inv(a); /* inversa de A*/ dea=de(a); /* deerminane de A*/ prin a ainv dea; c={4, 0, 0 }; dec=de(c); prin c dec; /* faor de Cholesky A=S`S em que S e uma mariz riangular superior */ /* S e a ransposa do faor de Cholesky */ Sc=roo(c); /* mariz c e singular, porem o SAS calcula assim mesmo o faor de Cholesky */ /* pode-se observar que a ulima linha, da mariz Sc e nula devido a isso*/ Sa=roo(a); b={4 0,,0 }; prin b; sb=roo(b); prin Sc Sa sb; /*maximização de pares de formas quadráicas */ /* resolver (D - lg)e=0 */ D={4, }; G={7, 4}; prin D G; Sg=roo(G); /* ransposa do faor de Cholesky de G */ Sginv=inv(Sg); /* inversa da ransposa do faor de Cholesky de G */
87 . Álgebra veorial e maricial 8 prin Sg Sginv; II=Sginv`*G*Sginv; /* mosrar que é igual a idenidade */ prin ii; H=Sginv`*D*Sginv; /* operar D, e em seguida exrair auo valores e veores */ prin H; /* D ransformada */ zh=eigvec(h); /* zh mariz de auoveores */ auh=eigval(h); /* auh veor de auovalores */ xh=sginv*zh; /* mariz de auoveores recuperados */ ese=xh`*g*xh; prin ese;/*mosrar que resula na idenidade*/ prin xh; prin auh; /* obencao de mariz raiz quadrada - exemplificar com a mariz D */ aud=eigval(d); /* auovalores de D*/ lamb=diag(aud); /* diagonalizando aud e resulado em lamb */ prin lamb; lambs=roo(lamb); /* achando a raiz quadrada de lamb */ avd=eigvec(d); /* auoveores de D em avd */ Droo=avd*lambS*avd`; /* usando a definição para enconrar a mariz raiz quadrada de D */ prin Droo; DD=avd*lamb*avd`; /* checando propriedades */ prin DD; /* deve ser igual a D */ qui;.4. Exercícios.. Sejam os veores x =[3,, 4] e y' =[-,, ] (a) ploe os dois veores (b) enconre (i) o comprimeno de x, (ii) o ângulo enre x e y, e (iii) a disância enre x e y. (c) ploe os veores x x. e y y. ( x = 3 e y = ).
88 Ferreira, D.F. Esaísica mulivariada 83.. Dada a mariz X = (a) Oronormalize as colunas de X, usando a consrução de Gram-Schimid. (b) Deermine o veor (coluna de x) linearmene dependene. (c) Deermine o poso coluna de X, a parir da consrução de Gram-Schimid realizada em (a)..3. Dadas as marizes A = 0 B = (a) Obenha a inversa de A e de B, usando o algorimo de Gauss-Jordan. (b) Verifique usando o processo de Gauss-Jordan que (AB) - =B - A Verifique se a mariz
89 . Álgebra veorial e maricial 84 0,8507 0,557 P = 0,557 0,8507 é uma mariz orogonal..5. Seja 8 A = (a) Calcule o deerminane de A. (b) Com base em (a) a mariz A pode ser considerada posiiva definida? Porque? (c) Obenha o faor de Cholesky, e confirme a resposa dada em (b). (d) Deermine os auovalores e auoveores de A. (e) Obenha a decomposição especral de A. (f) Enconre A -.
90 Ferreira, D.F. Esaísica mulivariada 85 (g) Enconre os auovalores e auoveores de A -. Verifique que relação em como os valores enconrados em (d)..6. Considere as marizes 4 4,00 4 4,00 A = B 4,00 4,00 = 4,00 4,0000 As marizes são idênicas, exceo por pequenas diferenças no elemeno, a e b devida a arredondamenos. Mosre que A - = -3B - (pequenas mudanças, alvez devido a arredondamenos, podem causar subsanciais diferenças na inversa)..7. Verifique se a forma quadráica Q = x x x + 4x é posiiva definida. Sugesão: Verificar se Q = x Ax é posiiva, pode ser feia verificando se A é pd..8. Dada as marizes
91 . Álgebra veorial e maricial 86 4 A = B = (a) deermine os auovalores e auoveores que maximizam a razão xax xbx λ= B 0 Obs. O que é equivalene a resolver o sisema deerminanal dado por (.5) A λ B = 0. (b) Deermine a mariz raiz quadrada de A e de B..9. Dada a mariz de covariância amosral (S) 5 S = 4 (a) Deermine R, dada D /, definida por:
92 Ferreira, D.F. Esaísica mulivariada 87 D S S 0 = 0 0 S pp Sendo R = ( D ) ( ) S D (b) Verifique a relação S= ( D ) R ( D )
93 . Álgebra veorial e maricial 88
94 [ 3 ] Amosragem mulivariada 3.. Inrodução Com os conceios de álgebra veorial inroduzidos no capíulo, pode-se aprofundar na inerpreação geomérica das esaísicas descriivas X, S e R. A maioria das explicações usam a represenação das colunas de X, como p ponos no espaço n dimensional. Será inroduzida nese insane a pressuposição de que as observações consiuem uma amosra aleaória. De uma forma simplificada, amosra aleaória significa (i) que as medidas omadas em diferenes iens (unidades amosrais ou experimenais) são não relacionadas uma com as ouras, e (ii) que a disribuição conjuna das p variáveis permanece a mesma para odos os iens. Essa esruura de amosra aleaória é que jusifica uma escolha paricular de disância e dia a geomeria para a represenação n dimensional dos dados. Finalmene, quando os dados podem ser raados como uma amosra aleaória à inferência esaísica erá por base um sólido fundameno.
95 3. Amosragem mulivariada Geomeria amosral Uma observação mulivariada é uma coleção de medidas em p variáveis omadas na mesma unidade amosral ou experimenal. No capíulo, iem.3, as n observações obidas foram disposas em um arranjo (Mariz) X por, X x x x k x p x x xk x p = x j xj xjk xjp x n xn xnk xnp em que cada linha de X represena uma observação mulivariada. Desde que o conjuno odo de mensurações é muias vezes uma paricular realização de variáveis aleaórias, diz-se que os dados represenam uma amosra de amanho n de uma população p variada. Os dados podem ser ploados por um gráfico com p coordenadas. As colunas de X represenam n ponos no espaço p dimensional. Esse ipo de gráfico fornece informações de locação dos ponos e de variabilidade. Se os ponos perencem a uma esfera, o veor de médias amosrais, X, é o cenro de balanço ou de massa. Se a variabilidade ocorre em mais de uma direção, pode-se deecar pela mariz de covariância, S. Uma medida numérica única de variabilidade é fornecida pelo deerminane da mariz de covariância.
96 Ferreira, D.F. Esaísica mulivariada 9 Exemplo 3. Calcule o veor média X para a mariz X apresenada a seguir. Ploe os n = 3 ponos no espaço p= (bidimensional) e localize X no diagrama resulane. X = 3 0 A média amosral é dada por: ( ) ( ) ( ) X = = o erceiro por X = [ ] O primeiro pono é dado por X = [ ], o segundo por X = [ 3 0] 3. A Figura 3. mosra os ponos junamene com X, cenro de massa ou de balanço, obidos a parir da mariz X., e
97 3. Amosragem mulivariada 9 3 x 3 _ x x x Figura 3.. Diagrama com n=3 ponos no espaço bidimensional (p=) mosrando o cenro de massa, X. Uma represenação alernaiva é obida aravés da consideração de p ponos no espaço n dimensional. Os elemenos das linhas de X são uilizados como coordenadas.
98 Ferreira, D.F. Esaísica mulivariada 93 X x x x k x p x x xk x p = x j xj xjk xjp x n xn xnk xnp y y y y = k p As coordenadas do k-ésimo pono y = [ x x x ] k k k nk deerminada pela n-upla de odas as medidas da k-ésima variável. É conveniene é represenar k y como veor ao invés de ponos. Exemplo 3. Ploe os dados da mariz X, com p= veores no espaço ridimensional (n=3) X = [ ] y = 3 e y = [ 0 ]
99 3. Amosragem mulivariada 94 3 Y 0 Y Figura 3.. Diagrama da mariz de dados X como p= veores no espaço ridimensional. Muia das expressões algébricas que serão enconradas na análise mulivariada, podem ser relacionadas às noções geoméricas de ângulos, comprimeno (norma) e volumes. Iso é imporane, pois represenações geoméricas faciliam a compreensão e conduz a novas visões. Infelizmene, o ser humano esá limiado a visualizar objeos no espaço ridimensional, e as represenações da mariz X não serão úeis se n>3. No enano, os relacionamenos geoméricos e os conceios esaísicos associados, descrios para o espaço ridimensional ou bidimensional, permanecem válidos para dimensões maiores.
100 Ferreira, D.F. Esaísica mulivariada 95 É possível, em função do exposo, prover uma inerpreação geomérica ao processo de enconrar a média amosral. O veor (nx) será definido por =[ ]. O veor forma um ângulo igual com cada um dos eixos coordenados, de al forma que ( n) enha comprimeno uniário e mesmo ângulo de direção. Considerando o veor y = [ x x x ] projeção em ( n) é: k k k nk, cuja n X ( ) jk j= k = = k = k y y X n n n n Pois, a projeção geral de X em Y é dada por: ( ) XY Proj X em Y = Y Y Dessa forma Xk = ( yk) n corresponde a um múliplo de, obido a parir da projeção de k y em um veor, de acordo com o esquema a seguir.
101 3. Amosragem mulivariada 96 y k e k = y k X k X k em que, y k X k é perpendicular a X k. Observe, ambém, que e k = y k X k é definido como desvio da k-ésima variável em relação a sua média amosral, e consise nos elemenos apresenados a seguir: e y X x x k k k k = k k = x nk Xk X Xk A decomposição de yi, nos veores média e desvio da média esá apresenada esquemaicamene na Figura 3.3 para p= e n=3.
102 Ferreira, D.F. Esaísica mulivariada 97 x 3 _ x _ x e e Y Y x x Figura 3.3. Decomposição de yk em componenes de média X k e componenes de desvio ek = yk Xk. Exemplo 3.3 Faça a decomposição de y k em componenes de média X k e componenes de desvio ek = yk Xk, k=,, para os dados do exemplo 3..
103 3. Amosragem mulivariada 98 X = [ ] [ ] y = 3 y = 0 + ( 3) + ( ) + 0+ X = = X = = 3 3 X = = X = = 3 e = y X= 3 = 0 e = y X= 0 = Observa-se que: X e e, X e e, são perpendiculares. 3 X y X = = 3+ + = 0 ( ) ( ) [ ] A decomposição é:
104 Ferreira, D.F. Esaísica mulivariada 99 y 3 = 3 = + ; e 0 y = 0 = +. Os veores de resíduos podem ser ploados a parir da origem, como apresenado na Figura 3.4, para os resíduos do exemplo 3.3. X 3 e e X X Figura 3.4. Veores de desvios ei do exemplo 3.3. obidos por (.): Considere o comprimeno ao quadrado dos veores de desvios, ek = e k. ek = n ( xjk X k ) (3.) j= Observa-se por (3.) que o comprimeno ao quadrado dos veores de desvios é proporcional à variância da i-ésima variável. Equivalenemene, o
105 3. Amosragem mulivariada 00 comprimeno é proporcional ao desvio padrão. Veores longos represenam maiores variabilidades que os veores mais curos. Para dois veores desvios ek e e : n ( )( ) ee = x X x X (3.) k jk k j j= veores ek e e, em-se: De (.3) e denoando o ângulo θ ik como o ângulo formado pelos Cos ( ) θ = k ee k ee k k ee (3.3) Usando (3.) e (3.) é fácil verificar que (3.3) é: r k Sk = Cos( θ k) = S S kk (3.4) O coseno do ângulo formado enre dois veores desvios é igual ao coeficiene de correlação amosral. Porano, se os dois veores de desvios possuem a mesma orienação, o coeficiene de correlação será próximo de. Se os dois veores esão próximos de serem perpendiculares, a correlação amosral será próxima de zero. Se os dois veores forem orienados em direções oposas, o coeficiene de correlação amosral será próximo de -. Os conceios de
106 Ferreira, D.F. Esaísica mulivariada 0 comprimeno e ângulos permiem que se façam inerpreações das esaísicas amosrais geomericamene, e auxiliam na compreensão dos seus significados Amosras aleaórias e esperanças do veor de média e da mariz de covariância amosral. Com a finalidade de esudar a variabilidade amosral de esaísicas como X e S com a finalidade de se fazer inferências, é necessário fazer pressuposições a respeio das variáveis cujos valores observados consiuem um conjuno de dados X. Supondo que os dados não foram ainda observados, mas preende-se ober n mensurações em p variáveis. Anes de serem mensurados, os valores não podem em geral ser predios exaamene. Conseqüenemene, eses são raados como variáveis aleaórias. Nese conexo, os elemenos (j, k) da mariz de dados represenam realizações de uma variável aleaória, X jk. Cada conjuno de medidas X j em p variáveis é um veor aleaório. X x x x k x p X x x xk x p X = = xj xj xjk xjp X j xn xn xnk xnp X n (3.5)
107 3. Amosragem mulivariada 0 Uma amosra aleaória pode ser definida por: Se o veor coluna X, X,..., X n em (3.5), represena independenes observações com disribuição conjuna com densidade f( x )=f(x, x,..., x p ), enão X, X,..., X n é uma amosra aleaória. Se a função conjuna de densidade é igual ao produo das marginais f( x ). f( x )....,. f( x n), sendo f( x j)=f(x j, x j,..., x jp ), enão, X, X,..., X n é uma amosra aleaória. Algumas conclusões podem ser obidas da disribuição de X e S sem pressuposições sobre a forma da disribuição conjuna das variáveis. Dessa forma, considere X, X,..., X n como sendo uma amosra aleaória de uma disribuição conjuna com veor média µ e mariz de covariância Σ. Enão, X é um esimador não viciado de µ e sua mariz de covariância é n Σ. Iso é, E( X ) = µ (veor média populacional) Cov( X ) = n Σ (Mariz de covariância populacional dividida pelo amanho da amosra). PROVA: X =( X + X X n)/n
108 Ferreira, D.F. Esaísica mulivariada 03 ( ) E(X) = E X + X + + X n n n n ( ) ( ) ( ) = E X + E X + + E X n n n n = ne ( X j ) n n = µ n E(X) =µ Para provar o valor da covariância, pode-se observar que: n j= n = n j= = ( X -µ ) ( X -µ ) n n n n = ( Xj µ ) ( X µ ) = ( Xj µ )( X µ ) Enão, n n Cov( X ) = E( X µ )( X µ ) = E( Xj µ )( X µ ) n j= = Sendo j e considerando que E( X µ )( X µ ) j é igual a zero, devido a covariância enre os elemenos independenes X j e X ser nula, enão, n Cov( X ) = E( X j µ )( Xj µ ) n j=
109 3. Amosragem mulivariada 04 Desde que Σ= E( X µ )( X µ ) j j é a covariância populacional comum dos componenes X j, êm-se: n ( ) ( j )( j ) ( ) Cov X = E X µ X µ = Σ+Σ+ +Σ = n j= n = (n Σ ) = Σ n n 3.4. Variância Generalizada Com uma única variável, a variância da amosra é usada para descrever a variação nas mensurações desa variável. Quando p variáveis são observadas em cada unidade da amosra ou do experimeno, a variação é descria pela mariz de variância e covariância amosral. S S S p S S S p S = Sp Sp S pp A mariz de covariância amosral coném p variâncias e ½p(p-) covariâncias, poencialmene diferenes. Algumas vezes, no enano, deseja-se expressar a variação por um único valor numérico. Uma escolha dese valor é o deerminane de S, o qual reduz à variância amosral usual para o caso de uma
110 Ferreira, D.F. Esaísica mulivariada 05 única variável (p=). Ese deerminane é denominado de variância amosral generalizada. Variância amosral Generalizada= S (3.6) Exemplo 3.4 O peso de espiga PE (X ), e o número de espigas NE (X ), foi avaliado em 8 variedades de milho em See Lagoas, MG. A mariz de covariância amosral S, obida dos dados é: S=, 905 9, 096 9, , 87 A variância generalizada nese caso é: Variância amosral Generalizada = S =,905x90,87-9,096 = 8,086 A variância amosral generalizada se consiui numa forma de escrever oda a informação de odas as variâncias e covariâncias como um único valor numérico. Obviamene, quando p> é possível que algumas informações amosrais sejam perdidas no processo. A inerpreação geomérica, no enano, poderá mosrar a força e as fraquezas desa esaísica descriiva.
111 3. Amosragem mulivariada 06 Considerando-se o volume (área) gerado no plano definido por dois veores de desvios e = Y X e = Y X. Seja L e e L e os comprimenos e dos veores e e e, respecivamene. Da geomeria êm-se: e h= L e Sen(θ) θ L e e A área do rapezóide é L e x Sen(θ) x L e, podendo ser expressa por: Área= L L cos ( θ ) e e Mas, n e = j = j= L (X X ) (n )S n e = j = j= L (X X ) (n )S Cos(θ)=r Porano,
112 Ferreira, D.F. Esaísica mulivariada 07 Área = (n ) SS ( r ) (3.7) Por ouro lado, S S S = = S S S S S r S S r S = S S S S r = S S ( r ) (3.8) Se (3.7) e (3.8) forem comparados, pode-se observar que: S =(Área) /(n-) Esa expressão pode ser generalizada para p veores desvios por indução: Variância amosral Generalizada = S = (Volume).(n-) -p (3.9) A equação (3.9) mosra que a variância amosral é proporcional ao quadrado do volume gerado pelos p veores desvios. Na Figura 3.5 (a) e (b) mosra-se regiões rapezoidais geradas com p=3 veores resíduos correspondenes a grandes e pequenas variâncias amosrais generalizadas, respecivamene.
113 3. Amosragem mulivariada 08 (a) (b) e 3 e e e e 3 e Figura 3.5. (a) grande variância amosral generalizada, e (b) pequena variância amosral generalizada, para p=3. Para um amanho amosral fixo, é óbvio que S cresce com o aumeno do comprimeno dos veores de desvios e i (ou ( n ) Sii ). Em adição, o volume aumenará para um comprimeno fixado, se os veores residuais forem movidos aé possuírem ângulos reos. Por ouro lado se um ou mais dos veores residuais aproximar do hiperplano formado por ouros veores residuais, o volume diminuirá endendo a zero. Apesar de a variância amosral generalizada possuir algumas inerpreações geoméricas formidáveis como as ilusradas na Figura 3.5, ela sofre
114 Ferreira, D.F. Esaísica mulivariada 09 alguns problemas como esaísica amosral capaz de sumariar a informação conida na mariz S. Para ilusrar esas deficiências, considere as marizes de covariâncias e os coeficienes de correlações apresenados a seguir S= S S 8 0 = = r = = 0,8 r = = 0,8 r = = 0, S = 36 S = 36 S = 36 Apesar das rês marizes possuírem a mesma variância amosral generalizada ( S =36), elas possuem esruuras de correlações disinas. Porano, diferenes esruuras de correlações não são deecadas pela variância amosral generalizada. As siuações em que p> podem ser ainda mais obscuras. Muias vezes é desejável mais informações do que um simples valor como S pode oferecer como resumo de S. Pode-se mosrar que S pode ser expresso como produo dos auovalores de S ( S =λ.λ...λ p ). A elipsóide cenrada na média é baseada em S -, possui eixos de comprimeno proporcionais a raiz quadrada de λ i s de S, que reflee a variabilidade no senido do i-ésimo auovalor. Esa elipsóide é apresenada a seguir. ( ) ( ) X X 'S X X = c (3.0)
115 3. Amosragem mulivariada 0 Demonsra-se que o volume desa hiperelipsóide é proporcional à raiz quadrada de S. Desa forma, os auovalores, fornecem informações da variabilidade em odas as direções da represenação no espaço p-dimensional dos dados. Porano, é mais úil apresenar seus valores individuais do que seu produo. Ese ópico será abordado com mais dealhe quando se discuir sobre os componenes principais. A variância amosral generalizada será zero se um ou mais veores residuais perencerem a um (hiper) plano formado por uma combinação linear dos ouros, ou seja, quando as linhas da mariz de desvios, forem linearmene dependenes. Exemplo 3.5 Mosre que S =0 para X = O veor média é: = [ ] X 4 Os veores dos desvios são:
116 Ferreira, D.F. Esaísica mulivariada X X = [ e e e 3] = 0 0 Verifica-se que e3 = e+ e, ou seja: [ 0 -] = [ - 0] +[ -] = [ 0 -] c.q.d. Iso significa que um dos veores resíduos, perence ao plano gerado pelos ouros dois. Desa forma o volume ridimensional é zero (degenerescência). Ese caso é ilusrado na Figura 3.6 e demonsrado numericamene aravés da obenção de S. 0 S = Pela definição (.9), êm-se: S = ( ) + 0 ( ) + ( ) = = ( 3). = 3 3= 0
117 3. Amosragem mulivariada 3 e e3 e Figura 3.6 Caso em que S =0 (degenerescência) para o volume ridimensional. Em qualquer análise esaísica o resulado S =0 indica que exisem variáveis redundanes, ou seja, que possuem a mesma informação, e que esas podem ser removidas do esudo. A mariz de covariância reduzida, será de poso compleo e a variância generalizada diferene de zero. A quesão de quais variáveis devem ser removidas no caso de degenerescência não é fácil de responder e será abordado nos esudos de componenes principais. No enano, quando há possibilidade de escolha, o pesquisador deve reer as medidas de uma variável (presumidamene) causal ao invés de uma caracerísica secundária.
118 Ferreira, D.F. Esaísica mulivariada Variância generalizada de variáveis padronizadas A variância amosral generalizada é influenciada pela diferença de variabilidade das mensurações das variáveis individuais, ou seja, caso a variância amosral de uma deerminada variável (S ii ) seja grande ou pequena em relação às demais. O veor residual correspondene e i = Y i x i será muio longo ou muio curo, do pono de visa geomérico e erá um papel imporane na deerminação do volume. É muias vezes necessário, em função do exposo, padronizar os veores residuais, de al forma que eles enham o mesmo comprimeno. A padronização deses veores residuais é equivalene a ransformar as variáveis originais x jk pelos seus valores ( ) x x S. A mariz de jk k kk covariância amosral das variáveis padronizadas será enão igual a R, ou seja, igual a mariz de correlação das variáveis originais. Dessa forma pode-se definir: Variância generalizada amosral das variáveis padronizadas= R (3.) e jk =( ) jk k kk Os veores resíduos resulanes, cujos valores são dados por x x S, possuem odos os comprimenos iguais a n. A variância generalizada amosral das variáveis padronizadas será grande se eses veores forem perpendiculares e será pequena se dois ou mais deles iverem próximas da mesma direção. Em (3.4) foi viso que o co-seno do ângulo θ ik enre os veores residuais ei e e k, com i k, é igual ao coeficiene de correlação amosral r ik. Dessa
119 3. Amosragem mulivariada 4 forma, o R será grande quando odos os r ik forem próximos de zero e será pequeno quando um ou mais dos r ik for próximo de - ou de +. Uilizando os mesmos argumenos que conduziram a (3.9) pode-se verificar que: R =(n-) -p (volume) (3.) O volume gerado pelos veores desvios de p=3 variáveis padronizadas esá ilusrado na Figura 3.7. Eses veores desvios padronizados são correspondenes aos veores desvios da Figura 3.5, cuja comparação revela que a influência do veor e (com grande variabilidade na direção de x ) no volume quadrado de S é maior do que sua influência no volume quadrado de R. (a) (b) e e3 e e e3 e Figura 3.7. Volume gerado por rês variáveis padronizadas: (a) grande variância e (b) pequena variância generalizada. As quanidades S e R são relacionadas por:
120 Ferreira, D.F. Esaísica mulivariada 5 S = (S S... S pp ) R (3.3) Exemplo 3.6 É ilusrada aravés dese exemplo a relação (3.3) enre S e R para p=3 caraceres de milho (x : diâmero do colmo; x : número de folhas; e x 3 : comprimeno de folhas). A mariz R e S obidas são: 4, 935 0, 55, 9 S= 0, 55 0, ,, 9 93, 7, , 030, 03, e R= 030, 00, 055, 03, 055, 00, Usando-se a definição de deerminane (.9), em-se: S =37,3878 R =0,637 Usando (3.3) e os resulados obidos: S = (S S... S pp ) R 37,3878 = (4,935 x 0,686 x 7,993) x 0,637
121 3. Amosragem mulivariada 6 37, ,388 (verificado, apesar da pequena diferença devido às aproximações nos cálculos) 3.6. Oura generalização da variância Uma oura medida capaz de sineizar a informação conida na mariz de covariância que é uilizada em componenes principais é definida pela soma dos elemenos da diagonal da mariz de covariância S e é denominada de variância amosral oal. Porano, Variância amosral oal = Traço de S= Tr(S) =S +S +...+S pp (3.4) Exemplo 3.7 Calcular a variância amosral oal da mariz S do exemplo (3.6) Tr(S)= S +S +S 33 =4,935+0,686+7,993=3,64 Geomericamene a variância amosral oal represena a soma dos comprimenos ao quadrado dos veores residuais e i (i=,,...,p) dividido por n-. Ela não considera as orienações dos veores residuais, sendo porano limiada
122 Ferreira, D.F. Esaísica mulivariada 7 para ser uilizada com variáveis padronizadas, pois seu valor será sempre o mesmo para disinos conjunos de dados desde que o número de variáveis deses seja igual Exercícios Ploe os n=4 ponos no diagrama bidimensional e localize X no diagrama resulane. X = Enconre o ângulo enre os veores y e y do exemplo 3.. Calcule o co-seno do mesmo e discua sobre o significado dese resulado Obenha a decomposição dos veores y e y do exemplo 3. em componene de média e componene de desvio. Comprove a orogonalidade dos componenes de média com os veores de desvios ou residuais.
123 3. Amosragem mulivariada Calcule usando (3.3) o coseno do ângulo enre os veores residuais e e e obidos em 3.3. Calcule o coeficiene de correlação usando (.4) enre as variáveis e, e compare os resulados obidos Obenha as marizes de covariância amosral para o conjuno de dados do exercício 3.7., e calcule as variâncias amosrais generalizadas das variáveis originais e padronizadas. Calcule ambém a variância amosral oal Qual é a área do rapezóide gerado pelos p= veores desvios, do exercício 3.7..
124 4 Disribuição normal mulivariada 4.. Inrodução A generalização da densidade normal univariada para duas ou mais dimensões desempenha um papel fundamenal na análise mulivariada. De fao, a maioria das écnicas mulivariadas pare do pressuposo de que os dados foram gerados de uma disribuição normal mulivariada. Apesar dos dados originais não serem quase nunca exaamene normal mulivariados, a densidade normal se consiui muias vezes numa aproximação adequada e úil da verdadeira disribuição populacional. A disribuição normal, além da sua araividade pela sua facilidade de raameno maemáico, possui duas razões práicas que jusificam a sua uilidade. A primeira, diz que a disribuição normal é a mais adequada para modelos populacionais em várias siuações; e a segunda refere-se ao fao da disribuição amosral de muias esaísicas mulivariadas ser aproximadamene normal, independenemene da forma da disribuição da população original, devido ao efeio do limie cenral.
125 4. Disribuição normal mulivariada Pressuposições das análises mulivariada É imporane compreender que as análises esaísicas de modelos com erros adiivos baseiam-se na pressuposição de normalidade. A disribuição normal requerida refere-se, não a variação dos dados, mas a variação residual, dos erros exisenes enre as observações e o modelo ajusado. A variação sisemáica dos dados deve-se presumidamene aos efeios fixos dos modelos e o resane da variação aleaória é devida a pequenas influências independenes, as quais produzem resíduos com disribuição normal (Bock, 975). Um segundo pono, muias vezes negligenciado nas discussões das pressuposições sobre a disribuição, refere-se ao fao de que as afirmações probabilísicas dos eses de significância e dos inervalos de confiança, dizem respeio a esaísicas ais como médias amosrais ou diferenças enre médias, e não a disribuição das observações individuais. É conhecido que a disribuição desas esaísicas orna-se ipicamene normal quando a amosra aumena de amanho. Ese resulado se deve ao eorema do limie cenral. Do pono de visa práico exisem consideráveis vanagens de se rabalhar com grandes amosras. Neses casos, a violação da pressuposição de que a população seja normal é menos críica para os eses esaísicos e inervalos de confiança e a precisão da esimação de parâmeros desconhecidos é melhor.
126 Ferreira, D.F. Esaísica mulivariada 4.3. Densidade normal mulivariada e suas propriedades A densidade normal mulivariada é uma generalização da densidade normal univariada. Para a disribuição normal univariada com média µ e variância σ, a função de densidade de probabilidade é bem conhecida e é dada por: ( x µ ) σ f(x) e x ; ] [ = + πσ (4.) O gráfico da função (4.) em forma de sino e esá apresenado na Figura 4.. As probabilidades são áreas sob a curva enre dois valores da variável X, limiada pela abscissa. É bem conhecido o fao de que as áreas enre ± desvio padrão da média e ± desvios padrões da média são respecivamene 68,3% e 95,4%, como ilusrado na Figura 4..
127 4. Disribuição normal mulivariada µ σ µ σ 0,683 0,954 µ µ+σ µ+σ Figura 4.. Densidade normal univariada com média desacando-se as áreas enre µ ±σ e µ ± σ. µ e variância σ, O expoene da função de densidade normal univariada: ( x ) µ = µ σ µ σ ( x )( ) ( x ) (4.) mede a disância quadrada de x em relação à µ em unidade de desvio padrão. Esa disância pode ser generalizada para o caso mulivariado, com um veor X de observações (p x ), dada por,
128 Ferreira, D.F. Esaísica mulivariada 3 ( X µ ) ( Σ) ( X µ ) (4.3) Nesa expressão (4.3) o veor µ (px) represena o valor esperado do veor X e a mariz Σ (pxp) represena a sua covariância. Enão, (4.3) represena a disância generalizada de X para µ. Subsiuindo a expressão (4.3) na função de densidade (4.), a consane univariada de normalização πσ deve ser rocada de modo a fazer com que o volume sob a superfície da função de densidade mulivariada obida, seja igual a unidade para qualquer p. Pode-se demonsrar (Anderson, 984) que esa consane é ( ) p π Σ, sendo a densidade dada por: ( π) ( ) ( ) f ( X ) = exp X X p µ Σ µ Σ (4.4) Propriedades da disribuição normal mulivariada Seja um veor X endo disribuição normal mulivariada, enão:. Combinações lineares dos componenes de X serão normalmene disribuídos: seja a combinação linear a X =a X +a X a p X p, enão, a X erá disribuição N( a µ, a Σ a );
129 4. Disribuição normal mulivariada 4. Todos os subconjunos de X em disribuição normal (mulivariada). Pelos resulados da propriedade, fazendo alguns a i s iguais a zero, iso se orna evidene; i) Fazendo X X 0 0 X X p a X =[ ] = a propriedade se orna evidene. Assim, X N( a µ = µ, a Σ a = σ ). De uma forma mais geral pode-se afirmar que odo componene X i em disribuição N( µ i, σ ii ). ii) A disribuição de várias combinações lineares é: ax +... apx p A X = ~ N A µ ;AΣA' aqx +... aqpx p q p p q ( ) iii) Todos os subconjunos de X em disribuição normal (mulivariada) Tomando-se uma parição: X p qx X = = (p q) X X e suas correspondenes parições no veor de média e de covariância, dadas por: qµ µ µ = = (p q) µ µ p e Σ= Σ Σ q q q (p q) Σ Σ (p q) q (p q) (p q)
130 Ferreira, D.F. Esaísica mulivariada 5 Logo, ( µ Σ ) X ~ N ; q Prova: Basa fazer q A p =[ q I q q 0 (p-q) ] e aplicar (ii). 3. Se os componenes de covariância forem zero enre dois subconjunos de X, implica em dizer que eles são independenemene disribuídos. Esa propriedade só é valida se X iver disribuição normal mulivariada; e 4. A disribuição condicional de componenes de X é normal (mulivariada). Dada a parição X p qx X = =, logo a disribuição condicional de (p q) X X X/X = x é normal e êm média e covariância dados por: ( x ) µ =µ +Σ Σ µ c e Σ =Σ Σ Σ Σ c 4.4. Disribuição normal bivariada Sejam X e X duas variáveis com parâmeros E(X )=µ, E(X )=µ, σ Var(X )=σ, Var(X )=σ e ρ = = Corr( X, X). A mariz de covariância é σ σ
131 4. Disribuição normal mulivariada 6 σ σ Σ= σ σ Cuja inversa é, σ σ Σ = σσ σ σ σ Fazendo σ = ρ σ σ, obém-se ( ) Σ= σ σ σ = σ σ ρ, e a disância generalizada de (4.3) será: σ σ ( ρ ) [ µ µ ] X X ρ σ σ σ ρ σ σ σ X X µ µ = (4.5) = ρ X µ σ X µ + σ ρ X µ X µ σ σ Desde que, Σ =σ σ - (σ ) = σ σ (- ρ ), podem ser subsiuídos Σ - e Σ em (4.4) para se er a expressão da densidade normal bivariada, apresenada a seguir.
132 Ferreira, D.F. Esaísica mulivariada 7 f(x,x ) = π σ σ ( ρ ) (4.6) X X X X µ µ µ µ exp + ρ ( ) ρ σ σ σ σ Se X e X não são correlacionadas, ρ =0, a densidade conjuna pode ser escria como produo das densidades normais univariadas, ambas com a forma de (4.), ou seja, f(x,x )= f(x ) f(x ), além do que X e X são dias independenes, como comenado na propriedade número 3 da seção 4.3. Duas disribuições normais bivariadas com variâncias iguais são mosradas nas Figuras 4.. e 4.3. A Figura 4. mosra o caso em que X e X são independenes ( ρ =0) e a Figura 4.3 o caso de ρ =0.8. Observa-se que a presença de correlação faz com que as probabilidades se concenrem ao longo de uma linha.
133 4. Disribuição normal mulivariada 8 Figura 4.. Disribuição normal bivariada com σ = σ e ρ =0. Figura 4.3. Disribuição normal bivariada com σ = σ e ρ =0.8.
134 Ferreira, D.F. Esaísica mulivariada 9 Da análise da expressão (4.4), relaiva a densidade de p-variáveis normais, fica claro que alguns valores padrões de X fornecem aluras consanes para as densidades elipsóides. Iso significa que a densidade normal é consane em superfícies cujas disâncias quadráicas ( X µ ) ( Σ) ( X µ ) Esses padrões são chamados de conornos ou curvas de nível. são consanes. Conornos={odo X al que ( X µ ) ( Σ) ( X µ ) =c } (4.7) A expressão (4.7) é uma superfície de uma elipsóide cenrada em µ, cujos eixos possuem direção dos auoveores de Σ - e seus comprimenos são proporcionais ao recíproco da raiz quadrada dos seus auovalores. Demonsra-se que se λ i e e i são os auovalores e auoveores, respecivamene, de Σ, enão a elipsóide ( X µ ) ( Σ) ( X µ ) ± c λ e (i=,,..., p). i i =c é cenrada em µ e em eixos na direção de σ Considerando como ilusração a densidade normal bivariada com = σ, os eixos da elipsóide dados por (4.7) são fornecidos pelos auovalores e auoveores de Σ. Porano, para obê-los, a equação Σ-λI =0 deve ser resolvida. σ λ σ ( ) i σ λi σ σ σ λi = = 0 ( λ σ σ )( λ σ σ ) = + = 0 i i
135 4. Disribuição normal mulivariada 30 Conseqüenemene os auovalores são: λ = σ + σ e λ = σ σ Os auoveores são deerminados por: Σ i e =λ i e i Para i=, em-se: σ σ σ σ e e = ( σ + σ) e e ou, σ e + σ e = ( σ + σ ) e σ e + σ e = ( σ + σ ) e Essas equações levam ao resulado de que e =e, e após normalização, o primeiro auoveor é: e =
136 Ferreira, D.F. Esaísica mulivariada 3 De forma similar foi obido o segundo auoveor, o qual é: e = Se a covariância é posiiva, λ = σ + σ é o maior auovalor e seu auoveor associado se posiciona ao longo de uma linha de 45 0 aravés do pono [ ] µ = µ µ, para qualquer σ > 0. Os eixos são fornecidos por ± c λi ei (i=, ) e esão represenados na Figura 4.4. cv σ + σ c v σ - σ Figura 4.4. Curva de nível de densidade consane para a disribuição normal bivariada com σ = σ e σ > 0. Anderson (984) demonsra que a escolha de c = χ p ( α), em que χ ( α) é o percenil (00α) superior da disribuição de qui-quadrado com p graus de p
137 4. Disribuição normal mulivariada 3 liberdade, leva aos conornos que coném (-α)x00% de probabilidade. Para a disribuição normal mulivariada (p variada), a elipsóide dos valores de X saisfazendo, ( X µ ) ( Σ) ( X µ ) χp ( α) (4.8) em probabilidade -α. Os conornos conendo 95% e 99% de probabilidade sob a densidade normal bivariada das Figuras 4. e 4.3, esão represenados nas Figuras 4.5 e 4.6. X 99% µ 95% 0 0 µ X Figura 4.5. Curvas de níveis de 95% e 99% de probabilidade para a disribuição normal bivariada apresenada na Figura 4., σ = σ e ρ =0.
138 Ferreira, D.F. Esaísica mulivariada 33 95% 99% Figura 4.6. Curvas de níveis de 95% e 99% de probabilidade para a disribuição normal bivariada apresenada na Figura 4.3, σ = σ e ρ =0,8. A densidade (4.4) possui máximo quando X = µ. Porano, µ é o pono de máxima densidade ou moda, bem como o valor esperado de X, ou média Disribuição amosral de X e S Se a pressuposição de que as linhas de
139 4. Disribuição normal mulivariada 34 n X x x x x x x p p = p x x x n n np se consiuem numa amosra aleaória de uma população normal com média µ e covariância Σ for verdadeira, enão ese fao é suficiene para compleamene definir a disribuição amosral de X e de S. São apresenadas a seguir esas disribuições amosrais, fazendo-se um paralelo com a disribuição amosral univariada que já é familiar e bem conhecida. No caso univariado (p = ), sabe-se que X possui disribuição normal com média µ (média populacional) e variância σ n O resulado para o caso mulivariado (p ) é similar a ese, no senido que X possui disribuição normal com média µ e mariz de covariância (/n)σ. Para a variância amosral, caso univariado, sabe-se que a disribuição de (n )S σ possui disribuição de qui-quadrado com n - graus de liberdade. Para o caso mulivariado, a disribuição da mariz de covariância é
140 Ferreira, D.F. Esaísica mulivariada 35 chamada de disribuição de Wishar, após sua descobera, com (n ) graus de liberdade. Os resulados a seguir resumem dealhes desas disribuições: Sendo X, X,..., X n uma amosra aleaória de amanho n de uma população normal p-variada com média µ e mariz de covariância Σ. Enão,. X possui disribuição normal com média µ e mariz de covariância (/n)σ.. (n-)s possui disribuição de uma mariz aleaória de Wishar com n- gl. 3. X e S são independenes. Devido a Σ não ser conhecida, a disribuição de X não pode ser usada direamene para se fazer inferência sobre µ. Felizmene, S fornece informação independene sobre Σ e a disribuição de S não depende de µ. Iso permie que se consruam esaísicas para fazer inferência sobre µ, como será abordado no capíulo 5. Densidade da disribuição de Wishar Seja S uma mariz posiiva definida, com n>p, enão se pode definir, (n p )/ r(s Σ )/ S e w n (S/ Σ= ) π Σ Γ (n i) p(n )/ p(p )/4 p (n )/ i = [ ] (4.9)
141 4. Disribuição normal mulivariada 36 em que, Γ(.) represena a função gama. Reornando ao caso da disribuição das médias amosrais, o resulado 4., sineiza um imporane eorema em esaísica. Resulado 4.. (eorema do limie cenral) Sendo X, X,..., X n uma amosra aleaória de n independenes observações de uma população qualquer com média µ e mariz de covariância Σ, finia e não singular. Enão, ( ) n X µ possui disribuição aproximadamene normal N p (0, Σ) para grandes amosras. Aqui n deve ser ambém bem maior do que p (número de variáveis). Como já foi comenado quando n é grande, S converge em probabilidade para Σ, consequenemene, a subsiuição de Σ por S causa efeios apenas negligíveis nos cálculos de probabilidades. Desa forma, uilizando a expressão (4.8), pode-se ober o imporane resulado, apresenado a seguir. Resulado 4.. (eorema do limie cenral) Sendo X, X,..., X n uma amosra aleaória de n independenes observações de uma população qualquer com média µ e mariz de covariância Σ, finia e não singular. Enão, ( ) n X µ possui disribuição aproximadamene normal N p (0, Σ ) e ( µ ) Σ ( X µ ) n X se disribui aproximadamene como χ p para n - p grande.
142 Ferreira, D.F. Esaísica mulivariada 37 Para a disribuição normal univariada, se µ e σ são conhecidos, as probabilidades sob a curva para a disribuição de X, podem ser obidos das abelas da disribuição normal, ou da inegral da função apresenada em (4.) nos inervalos apropriados, com µ=0 e σ=, sendo X µ z = σ (4.0) n Alernaivamene, pode-se ober a aproximação de Hasing (955) ciado por Bock (975), com erro máximo de 0-6, dada por Φ( z) Gsez 0 Gsez> 0 (4.) em que, Sendo que Φ( z ) represena a probabilidade acumulada sob a curva da disribuição normal de - a z; G = ( a η + a η + a η + a η + a η ) φ ( z) ; 3 4 5
143 4. Disribuição normal mulivariada 38 η= + 0, 3648 z ; φ( z) = ( π) e z ; a =0, a =-0, a 3 =, a 4 =-, a 5 =, Disribuições amosral derivada da disribuição normal mulivariada Teoria da Disribuição das grandes amosras e disribuição exaa Na análise dos dados freqüenemene são uilizadas funções das observações chamadas esaísicas, as quais servem como esimadores dos parâmeros ou como criério para os eses de hipóeses. A imporância de ais
144 Ferreira, D.F. Esaísica mulivariada 39 esaísicas muias vezes depende do conhecimeno da () disribuição assumida para as observações, () do méodo de amosragem, e (3) da naureza da função das observações. Há dois ipos de eoria amosral avaliada para derivar a disribuição amosral. A eoria das grandes amosras, a qual fornece a disribuição aproximada à medida que o amanho amosral cresce indefinidamene, e a eoria das pequenas amosras ou eoria exaa, a qual é válida para qualquer amanho amosral. As disribuições derivadas assumindo o amanho amosral indefinidamene grande são chamadas de disribuições assinóicas ou limiane. A eoria assinóica é especialmene simples, como conseqüência do eorema do limie cenral que demonsra que muias esaísicas êm disribuição normal como limie. Para ais esaísicas é necessário somene ober a média e a variância para er a disribuição assinóica. A disribuição amosral sem considerar os argumenos da eoria assinóica, geralmene depende do amanho da amosra e pode ser não-normal para pequenas amosras, mesmo se a forma limie for normal. Se ese for o caso, algum indicaivo de qual amanho amosral é necessário para uma dada acurácia na eoria assinóica é exremamene úil para rabalhos práicos. Como exemplo, pode ciar que a disribuição de F, de razões de variâncias, com ν graus de liberdade do numerador e ν do denominador, se aproxima de qui-quadrado dividido por ν quando o valor de ν cresce sem limie. χ υ lim F ( υ, υ) = υ υ ( )
145 4. Disribuição normal mulivariada 40 Comparando as abelas de F e qui-quadrado dividido por ν, pode-se concluir que ao nível de 0,05, com erro de duas unidades na segunda casa decimal, quando ν for maior que 40, haverá boa concordância. Semelhanemene, considerando o valor nominal de significância de 0,0, verifica-se que a concordância com a mesma precisão se dá quando o valor de ν excede 00. Disribuição da soma de quadrados de n desvios normais aleaórios A esaísica Seja Z um veor ν x de ν observações normais N(0,) padronizadas. χ ν ( ) = ZZ ' = z + z z υ (4.) é disribuída como uma variável qui-quadrado com ν graus de liberdade. Foi obida em 876 por Helmer e independenemene em 900 por Karl Pearson. A função de disribuição de qui-quadrado pode ser expressa pela função gama incomplea. χ ( υ ) P( χ χ/ υ) = υ e d υ Γ( ) 0 (4.3)
146 Ferreira, D.F. Esaísica mulivariada 4 A função de disribuição (4.3) pode ser aproximada para aplicações em compuadores pela série convergene apresenada a seguir. e χ n χ χ υ = χ υ (4.4) n0 = Γ υ+ + P( / ) χ ( n ) quando χ < max( υ, 3 ), e caso conrário pela expansão assinóica: υ χ υ ( υ )( υ ) P( / ) e... χ χ χ χ υ χ (4.5) Os valores de Γ( a ) podem ser obidos pela fórmula de Sirling: a / / Γ (a) = (a )! e a ( π ) + + a 88a 5840a a 4 (4.6) A forma recursiva Γ( a + ) =aγ( a ) e Γ( ) =Γ( ) pode ser usada quando a for pequeno. Sabe-se que a média da disribuição de qui-quadrado, E( χ ), é ν e que sua variância é ν. Para ν>30, as probabilidades podem ser obidas usando a aproximação normal assinóica usando χ υ como um desvio normal uniário.
147 4. Disribuição normal mulivariada 4 Razão enre independenes χ (F de Fisher) Sejam χ e respecivamene. Enão, χ, dois χ independenes com ν e ν graus de liberdade, χ F = υ χ υ possui disribuição de uma variável F com ν e ν graus de liberdade. A disribuição de F foi derivada por R. A. Fisher (94). A função de disribuição de F pode ser aproximada pela série convergene da função bea incomplea: a b x ( x) B(a +,n + ) n+ I (a,b) = + x x (4.7) ab(a,b) n= 0 B (a + b,n + ) em que, B(, ab) = Γ( a) Γ( b) Γ( a+ b) Enão, υ υ PF (, υ, υ) = I x (, ) em que, x = υ υ + υ F
148 Ferreira, D.F. Esaísica mulivariada Verificando a normalidade A pressuposição de que cada veor de observação X j veio de uma disribuição normal mulivariada será requerida nas écnicas esaísicas que serão abordadas nos capíulos subsequenes. Por ouro lado, nas siuações em que a amosra é grande e as écnicas dependem apenas do comporameno de X, ou disâncias envolvendo X da forma n ( X µ ) S ( X µ ), a pressuposição de normalidade das observações individuais X j é menos crucial. Iso devido à aproximação da disribuição normal assinóica das principais esaísicas. No enano, melhor será a qualidade da inferência quano mais próxima à população parenal se assemelhar da forma da disribuição normal mulivariada. É imperaivo que exisam procedimenos para deecar os casos em que os dados exibam desvios de moderados a exremos em relação ao esperado sob normalidade mulivariada. Baseado na disribuição normal sabe-se que odas as combinações lineares de variáveis normais são normais e que conornos da densidade normal são elipsóides. Devido às dificuldades de avaliação de um ese conjuno em odas as dimensões, os eses para checar a normalidade serão concenrados em uma ou duas dimensões. Obviamene se paga um preço por esas simplificações, como não revelar algumas caracerísicas que só podem ser observadas em dimensões maiores. É possível, por exemplo, consruir uma disribuição não normal bivariada
149 4. Disribuição normal mulivariada 44 com marginais normais. No enano, muios ipos de não normalidade são revelados em geral nas disribuições marginais, e para aplicações práicas será suficiene checar a normalidade em uma ou duas dimensões. Verificando a validade da normalidade por meio da disribuição marginal Texos elemenares muias vezes recomendam que a normalidade univariada seja invesigada, examinando o hisograma de freqüência amosral para avaliar discrepâncias enre as freqüências observadas e esperadas pelo ajuse da disribuição normal. Usualmene, sugere-se ambém que as discrepâncias sejam submeidas ao ese de aderência de qui-quadrado. Um χ significaivo (P<0,05) é ido como evidência conra a normalidade da população. Apesar de ese méodo er a virude da simplicidade de compuação e ser livre do ipo de desvios da normalidade que eseja sendo esado (curose, assimeria, ec.), em a desvanagem, quando aplicados a dados conínuos, de depender da arbirariedade da escolha dos inervalos de agrupameno dos dados. Essa escolha deermina a resolução do hisograma e o número de ermos a ser somado para ober a esaísica de χ. Uma escolha errada pode conduzir a resulados não consisenes. Se a escolha de a ampliude dos inervalos for muio esreia, o hisograma pode ser irregular e a acurácia do χ pode ser grandemene afeada devido aos pequenos valores esperados. Se os inervalos são largos, desvios de normalidade podem ser obscurecidos ano no hisograma quano no ese de χ.
150 Ferreira, D.F. Esaísica mulivariada 45 Uma melhor aproximação, eviando odas essas dificuldades, é conseguida fazendo uso de méodos que não requerem agrupameno de escores. Felizmene, excelenes procedimenos gráficos e compuacionais exisem para ese propósio. a) Disribuição de proporções A disribuição normal univariada possui probabilidade de 0,683 para o inervalo [ µ i σ ii µ i + σii] [ µ i σ ii µ i + σii] ; e probabilidade de 0,954 para o inervalo ; (Figura 4.). Consequenemene, para grandes amosras de amanho n, é esperado que a proporção de P i observações conidas no inervalo [ X s X s ] i ii i + ii ; seja de cerca de 0,683, e de forma semelhane, espera-se que a proporção P i de observações em [ Xi sii Xi + sii ] ; seja de cerca de 0,954. Usando a aproximação normal da disribuição de P i, enão se P i 0, 683 > 3 0, 683 0, 37, 396 = n n P i 0, 954 > 3 0, 954 0, 046 0, 68 = n n
151 4. Disribuição normal mulivariada 46 devem indicar desvios da disribuição normal para i-ésima caracerísica (Johnson & Wichern, 988). b) Processos gráficos Os gráficos são em geral úeis para avaliar desvios da normalidade. Dois processos gráficos serão considerados nese capíulo. i) Q-Q plo Esses gráficos são obidos da disribuição marginal das observações de cada variável. Consise em ploar em um plano caresiano os percenis amosrais versus os percenis esperados pelo ajuse de uma disribuição normal. Se os ponos perencem a uma linha rea a pressuposição de normalidade deve ser aceia. Sejam x, x,..., x n as n observações de uma variável X. Sejam x (), x (),..., x (n) essas observações ordenadas crescenemene, ou seja, x () é a menor observação e x (n) é a maior. Quando os x (j) são disinos, exaamene j observações são menores ou iguais a x (j) (iso é eoricamene verdadeiro quando as observações são do ipo conínuo, o que em geral será assumido). A proporção amosral j/n é aproximada por (j-½)/n, onde ½ é usado para correção de desconinuidade. Os percenis esperados sob normalidade são dados por (q (j) ):
152 Ferreira, D.F. Esaísica mulivariada 47 j n q( j) π z / = e dz (4.8) Os percenis q (j) podem ser obidos, como se percebe por (4.8), pela inversão da função de disribuição de probabilidade da normal, em roinas apropriadas em compuadores ou aravés de abelas da disribuição normal. (Tabela A.). Os percenis q (j) e x (j) são ploados em um sisema caresiano com q (j) na abscissa e x (j) na ordenada. Desvios da normalidade podem ser observados pela inspeção dese ipo de gráfico, cujos ponos, quando da normalidade devem perencer a uma linha rea de mínimos quadrados. No exemplo 4. ilusram-se os cálculos necessários para obenção dos Q-Q plos. Exemplo 4. Seja uma amosra (n=0) obida de uma população normal N(3; 4) apresenada a seguir. Nese caso, a observação 4 consiui-se um oulier, proposiadamene gerado. {3,74;,9; 4,79; 8,65;,06; 4,59; 4,0; 0,46;,79; 3,30} passos: Dessa forma para se ober o Q-Q plo é necessário os seguines
153 4. Disribuição normal mulivariada 48 ) ordenar a amosra: x (), x (),..., x (n) e ober os seus valores correspondenes de probabilidade acumulada (j-½)/n. j x (j) (j-½)/n q (j) * 0,46,79,06,9 3,30 3,74 4,0 4,59 4,79 8,65 0,05 0,5 0,5 0,35 0,45 0,55 0,65 0,75 0,85 0,95 -,645 -,036-0,675-0,385-0,6 0,6 0,385 0,675,036,645 ) calcular os percenis da disribuição normal padrão. Ex. Para a observação em-se: j n q() = = 0,05 = π 0 e z / dz Porano, q () = -,645, e assim sucessivamene. 3) ploar (q (), x () ), (q (), x () ),..., (q (n), x (n) ) e examinar os resulados
154 Ferreira, D.F. Esaísica mulivariada 49 0 Q-Q Plo 8 Oulier 6 X (j) Q (j) Figura 4.7. Q-Q plo para os dados do exemplo 4., desacando a presença de um oulier. Observa-se que os ponos amosrais se siuam praicamene em uma linha rea de mínimos quadrados, com exceção da presença de um oulier, desacado na Figura 4.6. O procedimeno adequado seria de eliminar esa
155 4. Disribuição normal mulivariada 50 observação e refazer a análise para os dados amosrais remanescenes, o que é deixado a cargo do leior. Ese processo gráfico, embora basane poderoso para se verificar desvios da normalidade não consiui num ese formal dese propósio. Para conornar esa limiação, Johnson & Wichern (988) apresenam um ese complemenar a ese processo gráfico, o qual mede o ajuse dos ponos do Q-Q Plo a linha rea de mínimos quadrados por meio de uma medida de um coeficiene de correlação apresenada a seguir. r Q = n n j= ( x() j x)( q() j q) n ( x() j x ) ( q() j q ) j= j= (4.9) Um poderoso ese de normalidade pode ser consruído omando-se por base ese coeficiene de correlação (4.9). Formalmene rejeia-se a hipóese de normalidade se o valor calculado for menor que os valores críicos para um deerminado nível de significância (Tabela 4.).
156 Ferreira, D.F. Esaísica mulivariada 5 Tabela 4.. Valores críicos para o ese para normalidade baseado no coeficiene de correlação Q-Q plo. Tamanho amosral Nível de significância (α) n 0,0 0,05 0, ,899 0,880 0,96 0,969 0,940 0,9479 0,9599 0,967 0,970 0,977 0,98 0,9879 0,9905 0,9935 Fone: Johnson & Wichern (998) 0,8788 0,998 0,9389 0,9508 0,959 0,965 0,976 0,9768 0,980 0,9838 0,9873 0,993 0,993 0,9953 0,903 0,935 0,9503 0,9604 0,9665 0,975 0,977 0,9809 0,9836 0,9866 0,9895 0,998 0,994 0,9960 Exemplo 4. (coninuação) Calculando a correlação amosral, aravés de (4.9), obeve-se: 8,7709 r Q = = 0,953 44,5849 8, Como, o valor abelado ao nível de 5% de probabilidade (0,98) é inferior ao valor calculado (0,953), enão, não exise razão para duvidar da hipóese de normalidade.
157 4. Disribuição normal mulivariada 5 ii) Gráfico das probabilidades acumuladas Um segundo processo gráfico, basane uilizado, refere-se aos gráficos em que são ploados as probabilidades amosrais acumuladas versus probabilidades acumuladas da disribuição normal (Bock, 975). O algorimo é: ) ordenar a amosra: x (), x (),..., x (n) e ober os seus valores correspondenes de probabilidade acumulada p j = (j-½)/n, amosrais. ) Calcular a média amosral e o desvio padrão viesado S n = n j= X j n n j= X n j (4.0) 3) Ober as probabilidades normais acumuladas uilizando (4.) ou abelas da disribuição normal, aravés de: Z j = X j X S n P j =Φ(Z j )
158 Ferreira, D.F. Esaísica mulivariada 53 4) Ploar P j (abcissa) conra p j (na ordenada) Exemplo 4. Com os dados do exemplo 4., o algorimo apresenado no iem (ii) foi execuado, resulando nos seguines valores: j x (j) p j = (j-½)/n P j * 0,46,79,06,9 3,30 3,74 4,0 4,59 4,79 8,65 0,05 0,5 0,5 0,35 0,45 0,55 0,65 0,75 0,85 0,95 0,066 0,89 0,7 0,367 0,436 0,50 0,575 0,677 0,709 0,99 Na Figura 4.8 esão ploados os ponos P j (abcissa) conra p j (na ordenada) p j P j Figura 4.8. Gráfico normal acumulado da amosra simulada no exemplo 4..
159 4. Disribuição normal mulivariada 54 Se a população for normal, os ponos endem a cair em uma linha definida pela rea P j =p j. Uma vez que o gráfico apresena efeios cumulaivos, os ponos não são independenes e ainda pode-se afirmar que sucessivos ponos não enderão a se siuar aleaoriamene em ambos os lados da linha. Em ouras palavras, um grupo de ponos sucessivos poderá esar de um lado da rea ou de ouro, sem ser um indicaivo de desvio da normalidade. Alguma familiaridade com ese ipo de gráfico indicará a forma da disribuição e os desvios da normalidade que possam ocorrer. De maneira geral, as siuações mais comuns devem se enquadrar nos seguines ipos de gráficos. Disribuições assiméricas à esquerda enderão a er seus ponos de exremos no lado superior da rea, e os ponos inermediários no lado inferior da mesma. Para disribuições assiméricas à direia, o oposo deve ocorrer, ou seja, ponos exremos no lado inferior da rea e ponos inermediários no lado superior. Os achaamenos da disribuição, conhecidos por curose, ambém podem ser deecados. Nas disribuições lepocúricas, os ponos de menor densidade acumulada se concenram no lado inferior da rea, vindo a cruzá-la no cenro. Os ponos de maior densidade se concenram no lado superior da rea, a parir do cenro. Nas disribuições plaicúricas, o oposo se dá, ou seja, ponos de menor densidade acumulada se concenram no lado superior, e os ponos de maior densidade no lado inferior da rea, vindo a cruzá-la no cenro. Disribuições bimodais possuem gráficos que represenam os casos exremos da disribuição plaicúrica.
160 Ferreira, D.F. Esaísica mulivariada 55 c) Uso dos momenos Os momenos não cenrados para a média, podem ser calculados a parir dos dados amosrais, fazendo /n como densidade para cada pono amosral. Desa forma, pode-se definir, o r-ésimo momeno amosral não cenrado para média por: n ~m = x n r j= r j (4.) Pode-se enão, definir a média amosral, e o segundo, erceiro e quaro momenos cenrados na média, em função dos momenos não cenrados por: Média: µ = 0 (4.) Variância: ~ µ ~ ~ = m m (4.3) Assimeria ~ µ ~ ~ ~ ~ 3 3 = m 3 3m m + m (4.4) Curose µ= m 4m m + 6m m 3m (4.5)
161 4. Disribuição normal mulivariada 56 respecivamene: Os valores amosrais de o coeficiene de assimeria e curose são, µ ~ µ ~ µ ~ 3 b = (4.6) µ ~ 4 b = µ ~ (4.7) O coeficiene de assimeria populacional, para a disribuição normal, é β = 0 e o coeficiene de curose é β =3. Se β < 0, enão, a disribuição é assimérica à esquerda, caso conrário, β > 0, a disribuição é assimérica à direia. Disribuições com β <3 são plaicúricas (menos ponudas com caudas mais baixas do que a normal), e aquelas com β >3 são lepocúricas (mais ponudas e com caudas mais alas do que a normal). Exemplo 4.3 Uilizando os dados do exemplo 4. calcular os momenos e os coeficienes de assimeria e curose amosrais.
162 Ferreira, D.F. Esaísica mulivariada 57 x x x 3 x 4 0,46,79,06,9 3,30 3,74 4,0 4,59 4,79 8,65 36,3 0,6 3,04 4,436 8,468 0,8900 3,9876 6,604,068,944 74,85 76,000 0,0973 5,7353 8,748 4,64 35,9370 5,336 64, ,706 09,90 647,46 046,50 0,0448 0,663 8,008 7,7087 8,59 95,6530 6, , , , ,350 Têm-se: ~ m =36,3/0=3,63 ~ m =76,000/0=7,6000 ~ m 3 =046,50/0=04,65 ~ m 4 =744,35/0=74,435 ~ µ = 3,63 ~ µ = 7,6 - (3,63) = 4,458 ~ µ 3 = 04,65-3 x 3,63 x 7,6 + x (3,63) 3 = 8,658 ~ µ 4 = 74,435-4 x 3,63 x 04, x (3,63) x 7,6-3 x (3,63) 4 = 75,68
163 4. Disribuição normal mulivariada 58 b = 8,658/(4,458 x 4,458 / ) = 0,934 b = 75,68/(4,458) = 3,8780 c.) Uso do coeficiene de assimeria Para se avaliar o grau de assimeria da disribuição, um ese baseado no coeficiene de assimeria (4.6), pode ser realizado. Níveis críicos para a esaísica b, podem ser enconrados em Pearson e Harley (966) para n>4, e em D Agosino e Tiejen (973) para n variando de 5 a 35. A assimeria será à esquerda se b for negaivo, e à direia se b for posiivo, significaivamene. Em grandes amosras, os valores críicos de b podem ser obidos com boa aproximação usando como desvio da normal padrão a esaísica: Z = b ( n+ )( n+ 3) 6( n ) (4.8) c.) Uso do coeficiene de curose Valores críicos para o coeficiene de curose (4.7), podem ser enconrados em Pearson e Harley (966) para n>49 e D Agosino e Tiejen (97)
164 Ferreira, D.F. Esaísica mulivariada 59 para n variando de 7 a 50. Em grandes amosras, os valores críicos para o ese de achaameno da curva, podem ser aproximados usando como desvio normal a seguine esaísica: 6 (n+ ) (n+ 3) (n+ 5) Z= b 3+ n 4n(n )(n 3) + (4.9) Valores de b maiores que 3 indicam que a disribuição é mais ponuda com caldas mais alas do que a normal; valores menores que 3 indicam uma disribuição achaada no cenro e com caudas mais baixas do que a disribuição normal. Exemplo 4.3 (coninuação) Os valores de Z e Z, para o ese de assimeria e curose foram: Z =,609 com P(Z> Z )=0,074 Z =,886 com P(Z> Z )=0,059 Desa forma, ao nível de 5% de probabilidade se aceia a hipóese de simeria e de não achaameno da curva, demonsrando não se er desvio da normalidade.
165 4. Disribuição normal mulivariada 60 Verificando a normalidade mulivariada Em geral se deseja verificar a normalidade para dimensões superiores a, ou seja, para a disribuição p-variada, p. Mesmo que seja suficiene, como já comenado aneriormene, avaliar apenas as disribuições univariadas e bivariadas o procedimeno apresenado nessa seção é válido para qualquer p. O caso bivariado será enfocado nesa seção, devido às facilidades de cálculos para fins didáicos. Pelo resulado 4., dado veor X com disribuição normal p-variada, em-se que, ( ) ( ) x µ Σ x µ χp ( α) Aravés dese resulado, pode-se enão, generalizar o processo gráfico conhecido como Q-Q plo. Dada uma amosra bivariada com n observações, o algorimo seguine pode ser usado para generalizar o processo gráfico mencionado. É imporane salienar que ese processo não é limiado apenas ao espaço bidimensional. O algorimo será apresenado, uilizando os dados do exemplo., com X represenando a quanidade de reais pela venda de ração, e X sendo o número de sacos de rações vendidos, por n = 4 firmas de Minas Gerais.
166 Ferreira, D.F. Esaísica mulivariada 6 Exemplo 4.4 ) Calcular a disância quadrada generalizada amosral d (j) de cada observação em relação à média amosral, dada por: d j = (xj x)'s (xj x), j=,,..., n Os valores da média e da mariz de covariância amosrais foram apresenados no exemplo., e são: 00 X = 9 e 333,333 S = 0,000 0,000 6,667 A mariz inversa de S é: S 0,0037 = 0,00 0,00 0,89 A disância generalizada para primeira observação é: 0,0037 0, d = [ ] =,0853 0,00 0, E assim sucessivamene, para as demais observações:
167 4. Disribuição normal mulivariada 6 d =,796; d 3 =,3536 e d 4 = 0,7683. ) ordenar as disâncias quadráicas amosrais do menor para o maior d () d ( )... d ( n ). 3) Ober os valores correspondenes, percenis, de probabilidade acumulada q (j) =χ p ((j-½)/n), da disribuição de qui-quadrado. Eses percenis dependem da inversa da função de disribuição de qui-quadrado, e podem ser obidos em vários sofwares esaísicos. J d ( j) (j-½)/n q (j) 3 4 0,7683,3536,796,0853 0,5 0,375 0,65 0,875 0,67 0,9400,479 4,589 4) Ploar (d ( j) ; q (j) ) e examinar os resulados
168 Ferreira, D.F. Esaísica mulivariada q (j) d (j) Figura 4.9. Q-Q plo para os dados do exemplo., desacando a possibilidade de uilização dese processo para os casos de dimensões superiores ou iguais a. Pela Figura 4.9, verifica-se que não exisem razões para duvidar de que a disribuição do número de sacos de rações vendidos e o monane de dinheiro arrecadado pelas firmas de rações em Minas Gerais, não seja normal bivariada, apesar do pequeno amanho de amosras. Verificando a normalidade mulivariada por meio da curose e assimeria de Mardia Os coeficienes de assimeria e curose de uma disribuição mulivariada qualquer são definidos por:
169 4. Disribuição normal mulivariada 64 {( ) ( )} 3 β,p = E X µ Σ Y µ (4.30) em que a variável X é independene de Y, mas em a mesma disribuição com média µ e covariância Σ ; e {( ) ( )} β,p = E X µ Σ X µ (4.3) Essas esperanças para a disribuição normal mulivariada são: β 0 e β = p(p ),p =,p + Para uma amosra de amanho n, os esimadores de β,p e β,p são: ˆ β = n n 3,p g ij n i= j= n n 4,p i i i n i= n i= β ˆ = g = d em que, ( ) ( ) gij = Xi X Sn Xj X e d = g i i i
170 Ferreira, D.F. Esaísica mulivariada 65 Os esimadores ˆβ,p (quadrado do coeficiene de assimeria quando p=) e ˆβ,p (igual ao coeficiene de curose univariado quando p=) são nãonegaivos. Sob disribuição normal mulivariada espera-se que a E( E ( β ˆ,p ) ) seja zero. O esimador ˆβ,p é muias vezes usado para avaliar observações que esão a grandes disâncias da média amosral. Mardia (970) mosra que para grandes amosras, k = nˆ β 6,p segue a disribuição de χ com p(p+)(p+)/6 graus de liberdade, e k = { βˆ,p p(p + ) } / 8p(p + ) n segue a disribuição normal padrão. Para pequenos valores de n, as abelas de valores críicos para esar a hipóese mulivariada de normalidade são fornecidas por Mardia (974). Exemplo 4.5 Usando o exemplo das rações esar a normalidade mulivariada pelo ese dos desvios de assimeria e curose. Os valores amosrais são:
171 4. Disribuição normal mulivariada 66 Obs Reais Vendas As esaísicas amosrais são: 00 X = , ,04634 S n = S 5 5 = n 5 5 ou S = n 0, , Os desvios de cada observação da média amosral ( ε i ):. ε = [ ] 0. ε = [ ] ε = [ ] ε = [ ] 4 0 i) Tese baseado no coeficiene de assimeria obidos da seguine forma: É necessário calcular os valores de g ij para odos os pares de i e j, 0 Para i= e j=, g = [ 0 ], 7805 S n = 0 g = 0 Sn = 0,634 3 Para i= e j=, [ ]
172 Ferreira, D.F. Esaísica mulivariada 67 Para as demais combinações, êm-se: g 3 =-0,4878, g 4 =-,6585, g =,390, g 3 =-,8537, g 4 =0,0976, g 3 3 =,8049, g 3 4 =0,5366 e g 4 4 =,044. Logo, β ˆ =, (, ( 0, 634) 3 + +, ) 6 =,766 enão, k nˆ β = 6 4,766 = 6, = 0,85 Como k χ com p(p+)(p+)/6=4 graus de liberdade, e sabendo que χ 9, 488, enão H 0 não deve ser falseada, ou seja, não exise razões = 0,05; 4 para suspeiar da violação da simeria da disribuição mulivariada. ii) Tese baseado no coeficiene de curose Inicialmene, esima-se o coeficiene de curose da seguine forma: 7,753 (,7805 +,390 +,8049 +,044 ) = 4, 4378 n βˆ = g = =,p i i n i= 4 4
173 4. Disribuição normal mulivariada 68 em seguida, esima-se o valor esimado da normal (0, ): 4,4378 ( + ) 3,56 k = = = 0, Não exisem razões para duvidar de que a disribuição mulivariada enha algum desvio de curose, uma vez que < z, 96. k = 0, 05 iii) Programa SAS para o ese de normalidade A seguir são apresenados um programa SAS usando o Proc Calis para o ese da curose e um programa em IML, para ambos parâmeros. O programa fornece as esaísicas amosrais e os valores das significâncias observadas. Daa FR; Inpu Reais Vendas; cards; ; Proc Calis daa=fr Kurosis; Tile j= "Uso do Calis para esar a normalidade"; Tile "pela Curose de Mardia"; Lineqs Reais=e, vendas=e; sd e=eps, e=eps; Cov e=eps, e=eps; Run; Proc IML; use FR; read nex 4 ino X; /* lendo n observacoes denro de X */ n=nrow(x);p=ncol(x); dfchi=p*(p+)*(p+)/6; /*definindo GL para B,p */ q=i(n) - (/n)*j(n,n,); /* criando q=i-/nj, auxiliar */ S=(/n)*x`*q*x; /* mariz de covariancias viesada */ S_inv=inv(S); /* inversa de S */ prin s s_inv; g=q*x*s_inv*x`*q; /* mariz com gij */ prin g; bea=(sum(g#g#g))/(n*n); /*produo elem. a elem. E sua soma/n^ */ bea=race(g#g)/n; /* idem com omada do raco/n */ prin bea bea; k=n*bea/6; /* definindo k e k, ransformacoes de b,p e b,p */ k=(bea-p*(p+))/sqr(8*p*(p+)/n); pvalskew=-probchi(k,dfchi); /* calculo dos p_values respecivos */ pvalkur=*(-probnorm(abs(k))); prin k pvalskew; prin k pvalkur; Qui; /* abandonando IML */
174 Ferreira, D.F. Esaísica mulivariada 69 Finalmene é apresenado a seguir um programa SAS para orienar os leiores na simulação de dados com disribuição normal mulivariada com média e covariância especificada. O exemplo apresenado gera uma disribuição normal rivariada. Proc IML; n=00;p=3; SIG={8 4, 4 0 3, 3 8}; s=roo(sig); mu={, 0, 8}; x=j(n,p,0); zi=j(p,,0); do i= o n; do ii= o p; zi[ii]=rannor(0); end; xi=s`*zi+mu; do ii= o p; x[i,ii]=xi[ii]; end; end; prin x; creae dnorm from x; append from x; qui; proc prin daa=dnorm; run;qui;
175 4. Disribuição normal mulivariada Exercícios Com os dados do exemplo 4.4, endo como hipóese que os mesmos seguem a disribuição normal bivariada, uilize o resulado 4., ao nível de 50%, de que as disâncias generalizadas seguem a disribuição qui-quadrado. Uilizando enão a disribuição de proporções, iem (a), verifique a normalidade bivariada dos dados, conando a proporção observada ( P i ) de disâncias que perencem a elipse, e comparando com a esaísica abaixo. 05, > 3 P i 05, 05, 5, = n n Uilizando os dados dese exemplo (.), realize odos os eses univariados, proposos, nese capíulo, para ambas variáveis Uilizando os dados climáicos, obidos por Diniz (996), na fazenda Cooparaíso-EPAMIG, Jacuí, MG, de agoso de 994 a janeiro de 995, ese a pressuposição de normalidade ridimensional dos mesmos. Uilize para isso, o processo gráfico apresenado, e o ese do exercício número 4.8. e o ese baseado nos desvios de assimeria e curose de Mardia.
176 Ferreira, D.F. Esaísica mulivariada 7 Temperaura Umidade Relaiva (%) Precipiação (mm),7 3,7 4,3 4,4 4,5 5, 5,5 4,7 4,3 4,7 4,9 64, 56, 54,9 58, 6,8 70,3 75, 8,4 79,3 74,6 78,0 7,9,5 0,0 0,0 8,7,5 57,0 75,7 3, 4,4 48, Uilize os dados de uma amosra de 4 cochonilhas, fêmeas adulas, de Quadraspidious perniciosus (Coms.), por ramo de pessegueiro, na região de Jacuí-MG, e ese a pressuposição de normalidade dos dados, uilizando os procedimenos apresenados univariados na seção ,8,0 0,6 0,6 0, 0,8,5,5 0,3,7,9,5, 5,0 0,9,7,6 4,5,8,0 0,5 0,4,8 0,7
177 [ 5 ] Inferências sobre o veor média 5.. Inrodução Ese capíulo é o primeiro dese maerial a apresenar inferências, uilizando as écnicas, os conceios e os resulados apresenados nos capíulos prévios. Ese capíulo, por esar inimamene relacionado à inferência esaísica, ou seja, é volado para obenção de conclusões válidas para a população com base nas informações amosrais. As inferências realizadas nese capíulo são relaivas a veor populacional de médias e nos seus componenes. Umas das mensagens cenrais da análise mulivariada, que deverá ser abordada nese e nos próximos capíulos, é que p variáveis correlacionadas devem ser analisadas simulaneamene. 5.. Inferências sobre média de uma população normal Nesa seção serão abordados os eses de significância e a obenção de inervalos de confiança (IC) para a média de uma população normal.
178 5. Inferências sobre o veor média 7 Inicialmene será abordado o problema de verificar se um deerminado valor µ 0 é um possível valor (plausível) para a verdadeira média populacional desconhecida. Do pono de visa dos eses de hipóeses ese problema pode ser abordado aravés do ese: H : µ =µ vs H : µ µ aqui, H 0 é a hipóese nula e H é a hipóese (bilaeral) alernaiva. Considerando o caso univariado, e se X, X,..., X n represenam uma amosra aleaória exraída de uma população normal, o ese esaísico apropriado para esa hipóese, quando p é igual a, é: ( X µ 0 ) n =, em que, X= X S n j j= n e S n = ( Xj X). n j= O ese em quesão segue a disribuição de -suden com n- graus de liberdade. A hipóese H 0 será rejeiada se o valor observado de exceder um valor críico especificado da disribuição de -suden com n- graus de liberdade (GL). Analogamene, considerando agora a disância quadrada da média amosral X para o valor a ser esado, pode-se rejeiar H 0 a um nível de significância α, se
179 Ferreira, D.F. Esaísica mulivariada 73 = n(x µ )(S ) (X µ ) ( α ) (5.) 0 0 n em que, ( /) n α represena o quanil quadráico superior 00(α/) da disribuição de -suden com n- GL. Se H 0 não é rejeiada, enão se conclui que µ 0 é um valor plausível para represenar a média populacional normal. No enano, uma perguna naural pode surgir: exisem ouros valores de µ que são consisenes com os dados? A resposa é sim. De fao, exise um conjuno de valores plausíveis que serviriam como média para a população normal esudada. Da bem conhecida correspondência enre a região de aceiação dos eses de hipóeses e o inervalo de confiança para µ em-se: X S µ 0 < n ( α /) (não rejeiar H0 ) é equivalene a: n S S X n ( α/) µ 0 X+ n ( α /) (5.) n n Anes de a amosra ser reirada, o inervalo de confiança de 00(-α)% de (5.) é um inervalo aleaório, pois seus limies dependem das variáveis aleaórias X e S. A probabilidade do inervalo coner µ é 00(-α)% e
180 5. Inferências sobre o veor média 74 enre um grande número independenes de ais inervalos, 00(-α)% deles conerão µ. É considerada agora a generalização do caso univariado para o mulivariado. O problema de deerminar se um dado veor µ 0 (p x ) é um valor plausível da média de uma disribuição normal mulivariada. Uma generalização da disância quadrada apresenada em (5.) é: ( 0) ( 0) T n X S X = µ µ (5.3) em que, n X = X n j = j n = n, S= ( Xj X)( Xj X) j e µ µ µ 0 0 µ 0 = 0p A esaísica T é chamada de chamada de T de Hoelling, em honra a Harold Hoelling (Bock, 975), um pioneiro da esaísica mulivariada, que pela primeira vez obeve a sua disribuição. Felizmene, abelas especiais dos ponos percenuais para a disribuição T não são necessárias na realização dos eses de hipóeses, devido à esaísica: T ( n ) p ser disribuída como Fpn, p n p (5.4)
181 Ferreira, D.F. Esaísica mulivariada 75 em que, F p,n-p represena uma variável com disribuição F com p e n-p GL. De uma forma geral a disribuição de T considerando ν graus de liberdade e dimensão p é dada por: T νp p = Fp, ν+ p ν+ (5.5) Desa forma para se esar a hipóese H 0 :µ =µ 0 versus H:µ µ 0, no valor nominal α de significância, deve-se rejeiar H 0 em favor de H se ( ) ( ) (n )p T = n X µ 0 S X µ 0 > F p,n p( α) n p (5.6) Infelizmene, é raro, nas siuações mulivariadas, o pesquisador se saisfazer com o ese da hipóese H 0 :µ =µ 0, em que odos os componenes do veor média são especificados sob a hipóese de nulidade. Em geral é preferível enconrar regiões de valores de µ que são plausíveis para serem o veor de média populacional na luz dos dados observados. Exemplo 5. A mariz X, apresenada a seguir, represena uma amosra de n=3 observações reiradas de uma disribuição normal bivariada.
182 5. Inferências sobre o veor média 76 X = Tese a hipóese de que populacional. µ 0 =[9 ] seja um valor plausível para represenar a média A esaísicas amosrais são: 0 X = 3 e, 0 0,5 S = 0,5,0 Enão, 4 S = 3 4 E o valor de T será obido da seguine forma: T = 3 [ ] 3 4 = 3 O valor de F, ao nível de 5% é 99,5, enão, H 0 será rejeiada se o valor observado de T superar
183 Ferreira, D.F. Esaísica mulivariada 77 ( n ) p 4 F, = 99,5 = 798,0. n p Como nese caso, o valor de T observado (,0) foi inferior ao valor críico (798,0), enão, H 0 não deve ser rejeiada. É imporane salienar nese pono, que a hipóese H 0 será rejeiada se um ou mais dos componenes do veor média amosral, ou alguma combinação de médias, diferir muio do valor hipoéico µ 0 = [9 ]. Nese eságio, não se em idéia de quais os valores hipoéicos não são suporados pelos dados Região de confiança e Comparações simulâneas de componenes de média Será inicialmene, generalizado o conceio univariado de inervalo de confiança para o mulivariado de região de confiança, R(X). A região de confiança conerá 00(-α)% se anes de a amosra ser selecionada, P[R(X) cobrir o verdadeiro θ ] = α (5.7) em que θ, represena um veor de parâmeros desconhecidos (Krzanowski, 993). No caso, a região de confiança para µ de uma disribuição normal p variada, será odos os valores de µ ais que:
184 5. Inferências sobre o veor média 78 ( ) ( ) (n )p Pn X µ S X µ F p,n p( α) n p (5.8) Para deerminar se um dado valor µ 0 é um valor plausível de µ, basa calcular a disância quadrada generalizada n(x µ ) S (X µ ) e comparar com ( n ) pf, ( α)/( n p). Se a disância quadrada for maior que pn p ( n ) pf ( α)/( n p), enão µ 0 não perence à região de confiança. Iso é pn, p equivalene a esar a hipóese H 0 : µ =µ 0 conra a H : µ µ 0, a qual possibilia afirmar que a região de confiança consiui-se em odos os valores de µ 0 cujo ese T não rejeiaria a hipóese nula a favor da alernaiva, em um nível de significância α. Para p 4 não se pode fazer o gráfico da região de confiança para µ. Pode se, no enano, calcular os eixos da elipsóide de confiança e seus amanhos relaivos, os quais são deerminados pelos auovalores λ i e auoveores e i de S. Os amanhos dos semi-eixos de ( ) ( ) p(n ) µ µ = α n p nx S X c F p,n p() são deerminados por
185 Ferreira, D.F. Esaísica mulivariada 79 λ ic = λ i [ pn ( ) Fp, n p( α )]/[ nn ( p)] unidades ao longo de e. n i são: Começando do cenro, deerminado por X, os eixos da elipsóide ± λ [p(n )F ( α)]/[n(n p)] e i p,n p i Exemplo 5. A parir dos dados do exemplo 5., ober a região de confiança de 95%, e verificar se o pono µ 0 =(3, 4) perence a mesma. 0 X = 3,, 0 0,5 S = 0,5,0 e S 4 = 3 4 Os auovalores e auoveores de S, são: [ ] λ =,5 e = 0, ,70707 [ ] λ = 0,5 e = 0, ,70707
186 5. Inferências sobre o veor média 80 A elipse de confiança 95% para µ consise de odos os valores (µ, µ ) que saisfazem: 4 0 µ () 3[0 µ, 3 µ ] 99, µ ou, 4(0 µ ) + 4(0 µ )(3 µ ) + 4(3 µ ) 798 Para verificar se o pono µ 0 =(3, 4) perence a elipse, calcula-se: 4(0 3) + 4(0 3)(3 4) + 4(3 4) = 5 798,0 o que permie que se conclua que o pono esado esá na região de confiança. O gráfico da elipse obida pode ser visualizado na Figura 5.. com a análise gráfica, pode-se confirmar que o pono em quesão perence à região de confiança.
187 Ferreira, D.F. Esaísica mulivariada 8 x x Figura 5.. Elipse de 95% de confiança para o veor populacional de médias, obido a parir dos dados do exemplo 5.. Exemplo 5.3 Para exemplificar a região ridimensional para a média populacional, os dados de produção comercial (/ha), produção de ubérculos graúdos (/ha) e peso médio de ubérculos graúdos (g) de 5 clones de baaa selecionados em Maria da Fé e Lavras (Momené, 994), foram uilizados e enconram-se no quadro a seguir. Ober a região de 95% de confiança para o veor média populacional. Verificar se o pono µ 0 = (6,89 8,76 09,3) perence a região de confiança (pono referene a culivar Acha). Traçar a região de confiança.
188 5. Inferências sobre o veor média 8 Clones Produção comercial 47,8 4,40 3 4,8 4 40, ,7 6 39, , ,5 9 37, ,9 36,5 35,7 3 34, , ,5 Fone: Momené, 994 Produção de ubérculos graúdos 40,40 6,96 7,33,8 33,06,3 3,8 6,0,69 5,65 3,46 5,9,9 6,5,75 Peso médio de ubérculos graúdos 46,30 94,58 43,66 7,9 5,7 99,3 50,3 3,7 5,04 54,83 95,43 05,97 3,59 86,39 9,50 O veor de médias e a mariz de covariância amosrais são: 38,54 X = 5,854,358 3,895 5,884 4,750 S = 5,884 34, ,05 4,750 63,05 540,553 Os auovalores e auoveores de S são: λ = 549,08 e = (0,049 0,3 0,99) λ = 34, 460 e = (0,500 0,856 0,3) λ 3 = 5,85 e 3 = (0,865 0,50 0,09)
189 Ferreira, D.F. Esaísica mulivariada 83 A região de confiança fica deerminada por: p(n ) n p n(x µ ) S (X µ ) c = F p,n p( α) 0,549 Sim. 38,54 µ 5[ 38,54 µ 5,854 µ,358 µ 3] 0,074 0, ,854 µ 0,0038 0, ,00358,358 µ 3 4 3,49 =,5 3 =,7(38,54 µ ),4(38,54 µ )(5,854 µ ) + 0,04(38,54 µ )(,358 µ ) + 3 +,05(5,854 µ ) 0,5(5,854 µ )(,358 µ ) + 0,04(,358 µ ),5 3 3 Para verificar se o pono µ = 0 (6,89 8,76 09,3) perence à região de confiança, basa subsiuir os valores de µ por 6,89, de µ por 8,76 e o de µ 3 por 09,3. O valor enconrado de 563,4964 é superior a,5, o que indica que a média da Culivar Acha, não perence à região de 95% de confiança para média das 5 famílias clonais esudadas. Uilizando o programa Maple, aravés da seguine macro, foi raçado o gráfico, elipsóide de confiança (Figura 5.), da região de 95% de confiança para µ. Pode-se visualizar ambém que o pono em quesão não perence a elipsóide de confiança.
190 5. Inferências sobre o veor média 84 x 3 x x Figura 5.. Elipsóide de 95% de confiança para o veor de médias populacional, obida a parir dos dados do exemplo 5.3. Inervalos de confiança simulâneos Enquano a região de confiança fornece correamene o conjuno de valores plausíveis para a média de uma população normal, qualquer resumo de conclusões, em geral, inclui inervalos de confiança sobre médias individuais. Assim, adoa-se que odos os inervalos de confiança sejam verdadeiros simulaneamene com uma ala probabilidade específica. Iso garane com ala
191 Ferreira, D.F. Esaísica mulivariada 85 probabilidade que qualquer afirmação não seja incorrea, o que conduz ao ermo inervalo de confiança simulâneo (Johnson e Wichern, 998). Considerando uma combinação linear das médias amosrais, X = X+ X + + pxp cuja disribuição amosral possui esimador da covariância dado por: S n Dessa forma poderia se pensar em se ober inervalos de confiança de 95% baseados na disribuição de -suden, S X± n ( α/) n (5.9) O inervalo da expressão (5.9) pode ser inerpreado como inervalos sobre componenes do veor de média, assim, por exemplo, fazendo-se = [ ], a expressão (5.9) se orna o inervalo clássico para a média de uma população normal univariada. Nese caso em-se uma série de inferências sobre os componenes de µ, cada um associado com o coeficiene de confiança de -α, aravés de diferenes escolhas de. No enano o coeficiene de confiança para
192 5. Inferências sobre o veor média 86 odos os inervalos omados simulaneamene não é -α. Para corrigir esa imperfeição demonsra-se (Johnson e Wichern, 988; Anderson, 984) que para garanir o coeficiene nominal de confiança simulâneo de -α para a coberura de os valores paraméricos é necessário recorrer à disribuição de T. Ese resulado esá apresenado a seguir: p(n ) n(n p) X± F p,n p( α) S (5.0) Méodo de Bonferroni para Comparações múliplas Muias vezes um pequeno número de inervalos de confiança é requerido. Nesas siuações pode-se er uma melhor opção do que as comparações simulâneas, proposa em (5.0), obendo inervalos de confiança mais curos (mais precisos) do que o inervalo simulâneo de T. Esa alernaiva de inervalo é conhecida por méodo de Bonferroni. A seguir será apresenado o méodo para obenções de inervalo de confiança para os componenes de média. Se as m=p médias forem consideradas, enão, o méodo de Bonferroni é: S ± = = (5.) n α ii Xi n ( m) i,,...,p m
193 Ferreira, D.F. Esaísica mulivariada 87 Exemplo 5.4 Uilizando os dados do exemplo 5., ober os inervalos clássicos de -suden, T e Bonferroni, para os componenes individuais do veor de média, e compará-los enre si, quano ao comprimeno. O veor de médias e a mariz de covariância amosral são: 0 X = 3 e, 0 0,5 S = 0,5,0. Inervalo T p(n ) S IC = X ± F ( α) n p n µ (0,95) p,n p (3 ) IC µ = 0 ± 99,5 (0,95) 3 3 IC µ = 0 ± 6,3 = [ 6,3; 6,3] (0,95) (3 ) IC µ = 3 ± 99,5 (0,95) 3 3 IC µ = 3 ± 6,3 = [ 3,3;9,3] (0,95)
194 5. Inferências sobre o veor média 88 Observa-se que os limies dos inervalos de confiança múliplos represenam os limies da elipse de confiança de 95% (Figura 5.), projeados nos respecivos eixos.. Inervalo de Bonferroni Nese caso, m=p=, porano α/m=0,05. O valor de -suden correspondene, com n-= GL é 6,. Enão, IC µ = 0 ± 6, (0,95) 3 IC µ = [6,4;3,59] (0,95) IC µ = 3± 6, (0,95) 3 IC µ = [ 0,59; 6,59] (0,95) Observa-se nesa siuação que os inervalos são bem mais esreios que o seu correspondene em.
195 Ferreira, D.F. Esaísica mulivariada Inervalo de Suden GL é 4,30. Enão, Nese caso α/=0,05 e o valor de -suden correspondene com IC µ = 0 ± 4,30 (0,95) 3 IC µ = [7,5;,48] (0,95) IC µ = 3± 4,30 (0,95) 3 IC µ = [0,5; 5,48] (0,95) Apesar de eses úlimos inervalos individualmene garanir com 95% de probabilidade que as médias populacionais esão conidas nos mesmos, não há garania de que simulaneamene eles conenham as médias populacionais no mesmo valor nominal do coeficiene de confiança, diga-se 95%. Na melhor das hipóeses, variáveis não correlacionadas, o valor real do coeficiene de confiança é (-α) p =0,95 =0,905.
196 5. Inferências sobre o veor média Inferências sobre proporções de grandes amosras Freqüenemene, algumas caracerísicas de ineresse na população esão na forma de aribuos. Cada indivíduo nesa população pode ser descrio em ermos dos aribuos que possui, os quais são codificados, pela sua presença e ausência. Na população, com q caracerísica, a proporção de elemenos que possui os aribuos,,..., q é p, p,..., p q. Considerando q aribuos muuamene exclusivos e caracerísicas exausivas, enão, p q =-(p +p +...+p q- ). Numa grande amosra de amanho n, pelo eorema do limie cenral, ˆp possui disribuição aproximadamene normal, com p p E(p) ˆ = p q e p( p) pp pp q pp p( p) pp q Cov(p) ˆ = = Σ. n n pp q pp q p( q p) q Para grandes amosras, a aproximação coninua válida se um esimador de Cov( pˆ ), (/n) ˆΣ, for uilizado. Uma vez que cada elemeno da população esá associado a apenas um aribuo, enão, p q =-(p +p +...+p q- ), o que rás como conseqüência que o poso de ˆΣ é igual a q-, porano sua inversa não exise. Apesar disso, pode-se desenvolver inervalos de confiança simulâneos aproximados de 00(-α)%, para qualquer combinação p.
197 Ferreira, D.F. Esaísica mulivariada 9 Para uma amosra de amanho n, considerando q caegorias da disribuição mulinomial, o inervalo aproximado de confiança simulâneo de 00(-α)%, para qualquer combinação p = p+ p qpq, é dado por: ˆ ˆp ± χq ( α) n Σ (5.) garanindo que n--q seja grande. Segundo Johnson e Wichern (988), o valor grande de n-q-, significa que k=,,..., q. np ˆ k deve esar em orno de 0 para cada caegoria Exemplo 5.5 Numa amosra de n=35 cochonilhas, obida na região de Jacuí, MG, em fevereiro de 995, em planas de pessegueiro raadas, Diniz (996) obeve os seguines resulados: Fêmeas adulas Ninfa móvel Ninfa fêmea Ninfa macho Toal Ober os inervalos de confiança simulâneos de 95% usando a aproximação de grandes amosras para proporções de inseos em cada caegoria. O veor de proporções e a mariz de covariância amosral são:
198 5. Inferências sobre o veor média 9 0,49 0,343 ˆp = 0,486 0,4 e 0,5 Sim. ˆ 0,0449 0,55 Σ= 0,06 0,347 0,449 0,063 0,0359 0,0489 0,0 O valor de χ 3 (0,05) é 7,85, e os inervalos são: 0,5 p : 0,49 ± 7,85 = 0,49 ± 0,654 = [ 0,05; 0,3083] 35 0,55 p : 0,343 ± 7,85 = [0,0949; 0,5337] 35 0,449 p 3 : 0,486 ± 7,85 = [0,948; 0,664] 35 0,0 p 4 : 0,4 ± 7,85 = [ 0,036; 0,645] Comparações pareadas Em muias siuações experimenais deseja-se esar o efeio ou eficácia de um raameno. Para isso, medidas são omadas nas unidades experimenais anes e após a aplicação do raameno. Uma oura siuação em que esa comparação pode ser de ineresse é quando na mesma unidade
199 Ferreira, D.F. Esaísica mulivariada 93 amosral ou experimenal dois raamenos são aplicados. Esas resposas são denominadas medidas pareadas, e podem ser analisadas calculando-se suas diferenças, eliminando a influência da variação enre as unidades experimenais ou amosrais. Será, inicialmene, abordado o caso univariado e, em seguida, a sua respeciva generalização para o caso mulivariado. Denoando X j a resposa do raameno (ou resposa anes do raameno) e X j a resposa do raameno (ou resposa após o raameno) para a j-ésima unidade amosral ou experimenal, em que (X j, X j ) são medidas omadas na mesma unidade amosral ou experimenal, enão as n diferenças: D j = X j - X j, j=,,..., n (5.3) devem refleir somene o efeio diferencial enre os raamenos. Assumindo que as diferenças D j são observações independenes de uma disribuição normal N(δ, σ D ), a variável D δ = (5.4) S D n segue a disribuição de -suden com n- graus de liberdade, em que:
200 5. Inferências sobre o veor média 94 n D n n n j j= D = Dj e D ( Dj D) Dj n S = = j= n j= n j= n (5.5) para a hipóese: Conseqüenemene, para um coeficiene de confiança de -α, o ese H : δ= 0 ( efeio nulo de raameno) 0 H : δ 0 pode ser realizado comparando-se com n- (α/), o quanil 00(α/) superior da disribuição de -suden com n- graus de liberdade. O inervalo de confiança de 00(-α)% para o efeio do raameno (ou diferença de efeios dos raamenos) é dado pela maneira usual e apresenado a seguir. S D ( /) n D ± n α (5.6) Para exensão mulivariada dos procedimenos adoados no caso univariado, a seguine noação é uilizada, pois exise a necessidade de disinguir enre os índices para os dois raamenos ( o índice), a resposa da j-ésima unidade experimenal ou amosral ( o índice) e as p variáveis (3 o índice). Nese caso, X jk represena a resposa do raameno (ou medida anes de se aplicar o
201 Ferreira, D.F. Esaísica mulivariada 95 raameno) na k-ésima variável omada na j-ésima unidade e, X jk represena a resposa do raameno (ou medida após se aplicar o raameno) na k-ésima variável omada na j-ésima unidade, sendo que j=,,..., n; k=,,..., p. As diferenças êm a mesma noação com exceção do primeiro índice, do efeio do raameno, que deve desaparecer. Iso se deve ao fao de as diferenças refleirem o efeio diferencial dos raamenos. Assim, D jk represena a diferença enre os raamenos na j-ésima unidade amosral ou experimenal obida na k-ésima variável. Fazendo Dj = Dj Dj D jp e assumindo que é disribuído normal e independenemene, N p ( δ, Σ D ), a esaísica T se aplica para se realizar inferências sobre o veor média das diferenças. Os seguines resulados podem ser obidos, a parir das pressuposições assumidas. Dadas as diferenças observadas Dj = Dj Dj D jp, j=,,..., n, um ese de a hipóese H o : δ =δ0 vs H : δ δ0 valor observado deve rejeiar H 0 se o p(n ) T = n( D δ0) Sd ( D δ 0) > F p,n p( α) (n p) (5.7) em que, n D= D n j = j n = n e SD = ( Dj D)( Dj D) j
202 5. Inferências sobre o veor média 96 valores de δ ais que A região de confiança de 00(-α)% para δ consise em odos os p(n ) T = n(d δ) S D (D δ) F p,n p( α) (n p) (5.8) Os inervalos de confiança simulâneos 00(-α)% para as diferenças de médias individuais δ i são dados por: p(n ) S IC δ ( α ) : D i i ± F p,n p( α) (n p) n D(ii) (5.9) em que, S D. D i é o i-ésimo elemeno de D e S D(ii) é i-ésimo elemeno da diagonal de Para n-p grande, [(n-)p/(n-p)]f p,n-p (α) χ ( α ), e a normalidade não p precisa ser assumida. O inervalo simulâneo de Bonferroni 00(-α)% para as médias individuais das diferenças δ i é: IC ( ) : D δi α p α i ± n S D(ii) n (5.0)
203 Ferreira, D.F. Esaísica mulivariada 97 Exemplo 5.6 Em uma amosra de n=4 fazendas em Marechal Cândido Rondon foram mensuradas a produção leieira diária média por animal (X ) e a renda oal diária da produividade de leie (X ) anes da aplicação do plano governamenal panela cheia e após a aplicação. Tesar a hipóese de que o plano foi ineficiene em aumenar a média dos dois índices zooécnicos. Os dados da amosra são: Anes Após X j X j X j X j A hipóese a ser esada é: 0 H 0 : δ= 0= 0 As diferenças foram obidas e são dadas por: D j D j As esimaivas amosrais são:
204 5. Inferências sobre o veor média 98 6, 5 D = 0,00 S e D,967 34,6667 = 34, ,3333 O valor da esaísica T pode ser compuado por: 0,595 0,647 6,5 T = 4[ 6,5 0] = 4,655 0,647 0,064 0,00 O valor críico é: p(n ) (4 ) F p,n p(5%) = F,4 (5%) = 3 9= 57 (n p) (4 ) Como T =4,655<57, enão, H 0 não pode ser falseada para o valor nominal de 5% de significância. Os inervalos de confiança simulâneos são: (4 ),967 IC δ (0,95) : D ± F,4 (0, 05) = 6, 5 ± 3,57 = 7,3;9,8 (4 ) 4 [ ] (4 ) 09,3333 IC δ (0,95) : D ± F,4 (0,05) = 0 ± 39,47 = 9,47; 59,47 (4 ) 4 [ ]
205 Ferreira, D.F. Esaísica mulivariada Comparações de veores médias de duas populações O ese T para esar a igualdade de veores média de duas populações pode ser desenvolvido por analogia ao procedimeno univariado. Ese ese T é apropriado para comparar a resposa média de um grupo experimenal (população ) com a resposa média independene de ouro grupo experimenal (população ). Se possível, as unidades experimenais devem ser soreadas para cada conjuno de observações de ambas as populações, o que abrandará o efeio da variabilidade enre unidades na comparação enre raamenos. Apesar diso, ese ipo de comparação, é em geral, menos preciso do que o caso de comparações pareadas. Considerando uma amosra aleaória de amanho n da população e uma amosra n da população. As observações das p variáveis podem ser organizadas como: Amosra (População ) X, X,..., Xn X n = X j n j = Esaísicas amosrais n S = Xj X Xj X n = j ( )( ) (População ) n X, X,..., X X n = j X n j= Subscrios e, denoam a população. n S = X X X X ( )( ) j j n j =
206 5. Inferências sobre o veor média 00 Deseja-se realizar inferência a respeio da diferença de médias populacionais ( µ µ ), para verificar se esa diferença é nula, o que equivale a afirmar que não exise efeio dos raamenos. De forma equivalene, pode-se fazer al inferência, esando a hipóese de igualdade dos veores médias populacionais ( H 0 :µ =µ ). Algumas pressuposições devem ser obedecidas para a validade dos eses e da inferência realizada. Enre as pressuposições desaca-se a necessidade de que sejam realizadas amosras aleaórias, de amanho n e n, de ambas as populações (população com média µ e covariância Σ, e população com média µ e covariância Σ ); além disso, supõe-se que as observações da amosra são independenemene obidas em relação aquelas da amosra. Ainda é necessário assumir que ambas as populações sejam normais que a mariz de covariância amosral seja a mesma ( Σ =Σ =Σ). As marizes de covariância S e S são esimadores de Σ e de Σ, respecivamene. Conseqüenemene, pode-se combinar as informações de ambas as amosras para esimar a variância comum Σ da seguine forma: S p ( n ) S + ( n ) S = n + n (5.) resulados: Para se esar a hipóese H 0 :µ µ =δ0, considera-se os seguines
207 Ferreira, D.F. Esaísica mulivariada 0 ( X) =µ µ E X (5.) ( X) Cov X = + Σ n n (5.3) Devido ao resulado (5.), em que S p é um esimador de Σ, enão, + n n S p é um esimador de Cov( X X). Demonsra-se que o ese da razão de verossimilhança para a hipóese, H :µ µ =δ 0 0 é dado pela disância quadrada T. Rejeia-se H 0 se (n+ n )p T = [X X δ 0] + S p [X X δ 0] > F p,n+ n p ( α) n n (n+ n p )
208 5. Inferências sobre o veor média 0 Exemplo 5.7 Os dados a seguir referem-se à produividade e alura de planas de duas variedades de milho (A e B). Deerminar a região de 95% de confiança para diferença µ µ. A B Produividade Alura da plana Produividade Alura da plana 5,7 8,9 6, 5,8 6,8 6,,0,90,98,9,00,0 4,4 7,5 5,4 4,6 5,9,80,75,78,89,90 As esaísicas amosrais são: X 6,57 =, 99, S,4587 0,054 = 0,054 0,005 X 5,56 =,8, S,5430 0,0366 = 0,0366 0,0045 A mariz de variância e covariância amosral combinada é: S p,496 0,0448 = 0,0448 0,0048
209 Ferreira, D.F. Esaísica mulivariada 03 Os auovalores e auoveores de S p são: [ ] λ =,4975 e = 0,9995 0,0300 [ ] λ = 0,0035 e = 0,0300 0,9995 O valor de F,8 (0,05)=4,459. A região de confiança é dada por: (n+ n )p T = [X X δ 0] + S p [X X δ0] F p,n+ n p ( α) n n (n+ n p ) em que, δ µ µ δ 0 = = δ µ µ Desa forma com os valores amosrais, em-se: [ ] 30 0,976 8,6575, 0 δ,0 δ 0,7 δ 0,038 8, ,364 0,7 δ Esa equação foi implemenada no programa Maple, para se ober a elipse de 95% de confiança, apresenada na Figura 5, cujos comandos esão apresenados a seguir:
210 5. Inferências sobre o veor média 04 µ µ Figura 5.3. Elipse de 95% de confiança para diferença do veor média de ambas as variedades de milho. µ µ Verifica-se pela Figura 5.3 que a origem 0 =[0, 0], não perence a região de confiança, indicando que as duas variedades diferem quano ao veor média.
211 Ferreira, D.F. Esaísica mulivariada 05 Inervalos de confiança simulâneos Para desenvolver inervalos de confiança simulâneos para um componene de µ µ, adoa-se o veor al que a combinação ( µ µ ), será abrangida com probabilidade -α, para qualquer escolha de, por (n + n )p + ( ) X X ± F p,n + n p ( α ) + Sp n n p n n (5.4) Méodo de Bonferroni para comparações múliplas O inervalo de confiança simulâneo de 00(-α)% de Bonferroni para as p diferenças enre duas médias populacionais é dado por: α µ µ :(X X ) ± + S i i i i n+ n ii p n n (5.5) Comparações enre veores médias quando Σ Σ Quando Σ Σ, a disribuição das esaísicas dependem de uma medida de disância que não são independenes das covariâncias populacionais desconhecidas. Por serem desconhecidas as covariâncias populacionais, o ese
212 5. Inferências sobre o veor média 06 de Barle pode ser usado para esar H 0 : Σ Σ. No enano, ese ese é foremene afeado se a pressuposição de normalidade for violada. O ese em quesão não pode diferenciar enre a ausência de normalidade e a heerogeneidade das covariâncias. Quando ambos n -p e n -p são grandes, pode-se eviar as complicações da desigualdade de variâncias, uilizando a elipsóide de 00(-α)% de confiança aproximada, dada por (5.6). O problema de covariâncias heerogêneas, quando as amosras são provenienes de populações normais é conhecido como problema de Behrens-Fisher mulivariado. [X X δ 0] S+ S [X X δ0] χp( α) n n (5.6) O inervalo de confiança simulâneo aproximado é dado por: ( X X ) ± χp( α ) S+ S n n (5.7) See soluções para o problema mulivariado de Behrens-Fisher foram esudadas por Chrisensen e Rencher (997) por meio de simulação Mone Carlo, comparando as axas de erro ipo I e o poder desas soluções. Algumas dessas soluções esudadas por eses auores são apresenadas a seguir.
213 Ferreira, D.F. Esaísica mulivariada 07 a) Aproximação de Benne A primeira dessas alernaivas é àquela esudada por Benne (95), a qual assume que n n, o que não é limiane. Para conornar o problema, caso essa condição não seja aendida, basa rocar os nomes das amosras, iso é, a amosra passa ser a amosra e vice-versa. Inicialmene é necessário calcular os veores Z, j j=,,,n da seguine forma. n Z X X X X n n j = j j+ j k n nn j= n k= (5.8) Em seguida calcula-se a média ( Z ) e a covariância (S Z ) a parir das n observações amosrais p-variadas obidas na expressão (5.8). A esaísica T = n ZS Z Z (5.9) possui disribuição T de Hoelling com dimensão p e ν=n - graus de liberdade, que pode ser dada pela expressão geral (5.5). b) Aproximação de James A aproximação de James (954) envolve uma correção do valor de χ quando se uiliza a esaísica T *, definida por:
214 5. Inferências sobre o veor média 08 T = [X X ] S + S [X X ]~ χ p n n (5.30) James (954) propõe valores críicos ajusados ao invés de uilizar a disribuição aproximada de qui-quadrado direamene. Os valores críicos proposos por James (954) são dados em (5.3). ( p ) χ ( α ) A+ B χ ( α ) (5.3) p em que χ ( ) p α é o quanil superior α da disribuição de qui-quadrado e A e B são dados em (5.3) e (5.33). S i A= + r Se (5.3) p i= ni ni S i S i B= r Se + r Se (5.33) p(p + ) i= ni ni ni em que: S S S = e n + n (5.34)
215 Ferreira, D.F. Esaísica mulivariada 09 c) Aproximação de Yao A aproximação de Yao (965) é uma exensão da aproximação de Welch para os graus de liberdade. A esaísica (T * ) apresenada em (5.30) é aproximada por uma T de Hoelling com dimensão p e graus de liberdade ν dados por (5.35). ( T ) ( ) ( ) S i X X Se Se X X = ν i= ni ni (5.35) d) Aproximação de Johansen A aproximação de Johansen (980) usa a esaísica T * de (5.30) dividida por uma consane C para que a esaísica resulane enha disribuição aproximada pela disribuição F com ν =p e ν =ν graus de liberdade. Assim, os valores necessários para calcular a esaísica F c de Johansen (980) são: F c T = (5.36) C D + 6D C= p p(p ) + (5.37)
216 5. Inferências sobre o veor média 0 i= i { ( ) i ( i) } D= r I V V + r I V V (5.38) (n ) p(p + ) ν= (5.39) 3D com V i =(S i /n i ) - para i= ou e V=V +V. e) Aproximação de Nel e Van der Merwe A aproximação de Nel e Van der Merwe (986) usa a esaísica T * de (5.30), a qual é aproximada pela T de Hoelling com dimensão p e graus de liberdade ν, em que: ν= ( ) + r ( S ) r S e e S S S S r + r + r + r n n n n n n (5.40) É conveniene chamar a aenção para o fao de que nas expressões aneriormene apresenadas aparece um ermo como: r(a). Esse ermo significa que é necessário calcular r(a*a). Em ouras ocasiões os ermos eram [r(a)], o que significa que o raço da mariz A deve ser calculado e o seu quadrado é a resposa almejada.
217 Ferreira, D.F. Esaísica mulivariada f) Aproximação de Kim A aproximação de Kim (99) é a mais elaborada de odas e ambém se refere a uma exensão da aproximação dos graus de liberdade de Welch, como aconece com o procedimeno de Yao (965). O procedimeno de Kim requer a maximização de um par de formas quadráicas dado por: S q d = S q n n q q A maximização desse par de formas quadráicas resula na solução do sisema de equações homogêneas dado por (5.4). S S dk qk = 0 n n (5.4) A solução desse sisema pode ser obida conforme descrio no capíulo. O auovalores d k e os auoveores qk (k=,,..., p) são uilizados para definir a mariz D=diag(d, d,..., d p ) e Q= q q q p. A parir dessas marizes definem-se as seguines quanidades: ( ) w = Q X X (5.4)
218 5. Inferências sobre o veor média r p p = dk k= (5.43) d + = (5.44) k k ( dk + r) p k= c = p k= k k (5.45) f = p k= p k= k k (5.46) O próximo passo é calcular a esaísica do ese que em uma aproximação F dada na expressão (5.48) com ν =f e ν =ν-p+ graus de liberdade. O valor ν é definido em (5.49). ( ) ( ) / / G = w D + ri D + ri w (5.47) F c ( ν p+ )G = cfν (5.48)
219 Ferreira, D.F. Esaísica mulivariada 3 w D(D+ I) w w (D+ I) w = + ν n w(d+ I) w n w(d+ I) w (5.49) Tese de Barle para igualdade de marizes de covariâncias O ese da razão de verossimilhança para igualdade de marizes de covariâncias de populações Wishar foi apresenado por Barle (947). Ese auor demonsrou que sob a hipóese H o :Σ =Σ = =Σ k =Σ a esaísica da expressão (5.50) em disribuição assinóica de qui-quadrado com ν=(k-)p(p+)/ graus de liberdade. Em que, k é o número de grupos ou subpopulações amosradas, p é a dimensão das marizes. k p + 3p χ c = j = nj n k 6(p+ )(k ) (5.50) k ( n ) ln S (n k)ln S j = j j p
220 5. Inferências sobre o veor média 4 em que: S j é o esimador não viesado da covariância da sub-população j, baseado em n j observações mulivariadas de dimensão p; k n = n ; j=,,..., k, e j= j S p = k ( nj ) j= n k S j Exemplo 5.8. Tesar a hipóese de igualdade das covariâncias de populações. Uma amosra de observações foi obida da primeira população e oura de 5 da segunda. Duas variáveis foram mensuradas, sendo as esimaivas amosrais apresenadas a seguir (Fone: Bock, 975). 0,5964 0,44700 S = 0, , ,8543 0,73786 com n = e S = 0,73786,5488 com n =5 O valor de n=+5=6 e de k= (populações). A hipóese a ser esada é: hipóese são: H o :Σ =Σ =Σ Os demais valores necessários para a realização do ese de ln S = 3,0698; ln S = 0,5648; e ln Sp = 0,90335
221 Ferreira, D.F. Esaísica mulivariada 5 Logo, + 3 χ c = ( 0 ( 3,0698) 4 ( 0,5648) ) 4 ( 0,90335) + = =,43 Os graus de liberdade são ν=xx3/=3 e os valores críicos 5% e % da disribuição de qui-quadrado são χ 3 (0,05) = 7,847 e χ 3 (0,0) =,3448. Como o valor calculado (,43) é superior aos valores críicos, rejeia-se H 0 com P<0,0. Porano, exisem evidências de que as covariâncias das duas populações não sejam iguais Exercício A mariz X, apresenada a seguir, represena uma amosra de n=4 observações reiradas de uma disribuição normal bivariada.
222 5. Inferências sobre o veor média 6 X 0 4 = a) Tese a hipóese de que µ 0 = [9 ] seja um valor plausível para represenar a média populacional. b) Obenha a região de 95% de confiança e esboce graficamene a mesma, desacando o valor hipoéico nessa região Com os dados do exercício 5.7., deermine os inervalos de confiança simulâneo para os componenes de média individual por: a) T de Hoelling b) Procedimeno de Bonferroni c) Tese de de suden univariado Com os dados do exemplo 5.3, uilizando as duas primeiras variáveis, ese a pressuposição de normalidade univariada (marginal) e bivariada, uilizando os procedimenos apresenados no capíulo 4.
223 Ferreira, D.F. Esaísica mulivariada Uilizando os dados do exemplo 5.5, faça o IC simulâneo para proporções de 90% de confiança Os dados abaixo se referem ao peso e ao eor de proeína, medidos em 6 animais anes e após um período de diea balanceada. Tese a hipóese de que não houve efeio da diea. Deerminar a região de confiança e o esboço da região de confiança, o inervalo de confiança simulâneo e de Bonferroni, no nível de 5% de probabilidade. Peso Anes Teor de proeína (%) Peso Após Teor de proeína (%)
224 5. Inferências sobre o veor média Com os dados do exemplo 5.7, reapresenados a seguir, ober os inervalos de confiança de 95% simulâneos e de Bonferroni, para as diferenças de médias marginais. Compare os resulados com a Figura 5.3, e obenha conclusões de ineresse. A B Produividade Alura da plana Produividade Alura da plana 5,7 8,9 6, 5,8 6,8 6,,0,90,98,9,00,0 4,4 7,5 5,4 4,6 5,9,80,75,78,89,90
225 [ 6 ] Análise de variância mulivariada 6.. Inrodução Com o desenvolvimeno da esaísica no século XX a possibilidade de condução e análise de experimenos propiciou grande sucesso às pesquisas, principalmene pela habilidade de lidar com variações não conroláveis. O primeiro a represenar os resulados experimenais por um modelo foi W. S. Gosse (Suden, 908). As erminologias dos delineamenos experimenais, independenemene da área de aplicação, se ornaram iguais aos dos experimenos em agriculura. Porano, unidades experimenais são denominadas de parcelas e o valor da variável aleaória como resposa. Experimenos com apenas uma classificação dos raamenos são denominados de delineamenos ineiramene casualizados ou de classificação simples. Experimenos em que vários ipos de raamenos são aplicados ao maerial experimenal simulaneamene são denominados de faoriais. Oura classe de experimenos é gerada pelos arranjos hierarquizados dos maeriais.
226 6. Análise de variância mulivariada 0 O presene capíulo em por objeivo apresenar a exensão mulivariada dos méodos univariados de análise de variância. As idéias básicas desse capíulo podem ser esendidas a odos os ipos de delineamenos e arranjos das esruuras de raamenos, embora sejam apresenas na siuação mais simples, a do delineameno de classificação simples. 6.. Delineameno de classificação simples O caso mais simples dos delineamenos experimenais é o de classificação simples ou delineameno ineiramene casualizado. O arranjo experimenal consise em g raamenos, possivelmene incluindo a(s) esemunha(s), para os quais as unidades experimenais são aleaorizadas. As amosras aleaórias de cada raameno são represenadas por: Traameno : X, X,..., Xn Traameno : X, X,..., Xn Traameno g: Xg, Xg,..., Xgn g
227 Ferreira, D.F. Esaísica mulivariada A análise de variância mulivariada (MANAVA) é usada para invesigar se os veores de médias de raameno são os mesmos, e se não, qual componene de média difere significaivamene. Algumas pressuposições da esruura dos dados devem ser obedecidas para validade da inferência esaísica: (a) X,X,,X i i i n i deve ser uma amosra aleaória de amanho n i do raameno i, com média µ i, i=,,..., g. As amosras dos raamenos devem ser independenes; (b) odos os raamenos possuem covariância comum Σ; e (c) cada raameno em disribuição normal mulivariada. O modelo de análise de variância mulivariada esá apresenado a seguir. Nese modelo cada componene é um veor de p componenes. X =µ+τ + e i=,,,g e j=,,,n ij i ij i (6.) em que, eij é independenemene e idenicamene disribuído e N p (0, Σ) para odo i e j; µ é o veor média geral e τ i represena o veor de efeios do i-ésimo raameno. Pode-se adoar a resrição paramérica g niτ i = 0. i= Os erros do veor X ij são correlacionados, no enano a mariz de covariância Σ é a mesma para odos os raamenos. O veor de observações pode ser decomposo em:
228 6. Análise de variância mulivariada Xij = X.. + (Xi. X..) + (Xij X i. ) Observação Esimaiva da Esimaiva do resíduo média geral efeio do raameno (6.) Analogamene, demonsra-se que a soma de quadrados e produos oais possui a seguine decomposição: Soma de quadrados e produos (SQP) = SQP raamenos + SQP resíduo oal corrigido g ni i= j= g ( Xij X.. )( Xij X.. ) = g ni ( )( ) ( i. )( i. ) = n X X X X + X X X X i i... i... i j i j i= i= j= (6.3) A soma de quadrados e produos do resíduo pode ser expressa por: ( i. )( i. ) g n i ij ij g g (6.4) i= j= E = X X X X = (n )S + (n )S (n )S em que S i é a mariz de covariância amosral do i-ésimo raameno. O ese da hipóese de inexisência de efeios de raamenos, H 0 : τ =τ = =τ g = 0 (6.5)
229 Ferreira, D.F. Esaísica mulivariada 3 é realizado considerando as magniudes das somas de quadrados e produos de raameno e resíduo pela variância generalizada. O esquema de análise de variância mulivariada (MANAVA) esá apresenado na Tabela 6.. A fone de variação oal é paricionada em causas de variação devido a raameno e ao erro experimenal ou resíduo. Tabela 6.. Tabela de MANAVA para esar a hipóese de igualdade do veor de efeio dos raamenos em um delineameno de classificação simples. FV GL Mariz de SQP Traameno g- (.. )(.. ) g i i. i. i= B= n X X X X Resíduo g g n i ni g E = ( Xij Xi. )( Xij Xi. ) i= i= j= υ= Toal corrigido g g n i ni B+ E= ( Xij X.. )( Xij X.. ) i= i= j= Os criérios para o ese da hipóese apresenada em (6.5), envolvem variâncias generalizadas e auovalores e auoveores da maximização de duas formas quadráicas dadas em (.5 e.6). De maneira geral, supondo que H seja a mariz de SQP relaiva aos efeios dos raamenos que se deseja esar a igualdade, para o exemplo H=B, enão a solução da equação deerminanal dada por:
230 6. Análise de variância mulivariada 4 ( ) H λ ke ek = 0 fornece as esimaivas dos auovalores e auoveores, necessários aos eses de hipóese (6.5), os quais esão apresenados na Tabela 6.. Quaro criérios exisem para o ese desa hipóese. Muios auores recomendam uilizar o criério de Wilks como referência, por se raar de um ese baseado na razão de verossimilhança. Ouros recomendam que a hipóese nula deva ser rejeiada se pelo menos rês dos quaro criérios forem significaivos em um nível nominal de significância previamene adoado. Esses criérios podem ser aproximados pela disribuição F. Essas aproximações, ambém, se enconram apresenadas na Tabela 6..
231 Ferreira, D.F. Esaísica mulivariada 5 Tabela 6.. Esaísicas mulivariadas e suas equivalência aproximada com a disribuição F. Criério Esaísica Aproximação F GL de F Wilks E Λ= = H+ E +λ k k r f F= Λ Λ pq v =pq v =r-f Traço de Pillai Traço de Hoelling Lawley Raíz máxima de Roy V= r[h(h+ E) ] = λ +λ k U r(he ) = = λ k V n+ s+ F= s V m+ s+ + )U k (sn F = s(m + s + ) θ = λ θ( ν d+ q) F = d v =s(m+s+) v =s(n+s+) v =s(m+s+) v =(sn+) v =d v = ν d+ q p: número de variáveis = poso(h+e); q: GL de raameno (ou do conrase); ν: GL do erro; S=min(p,q); r=ν- (p-q+)/; f=(pq-)/4; d=max(p,q); m=( p-q -)/; n=(ν-p-)/; e pq 4 = p + q 5 cc Se p + q 5> 0 Obs. Criério de Wilks possui aproximação exaa de F se min(p,q)
232 6. Análise de variância mulivariada 6 Exemplo 6. Num experimeno envolvendo 4 variedades de feijão, avaliou-se na seca, a produividade (P) em kg/ha e número de grão por vagem (NGV), uilizando 5 repeições. Os resulados obidos foram: Culivar A B C D P NGV P NGV P NGV P NGV ,66 4,50 4,30 4,70 4, ,5 5,30 5,4 5,6 5, ,8 5,0 5,0 5,30 5, ,45 5,8 5,8 5,40 5,50 546, , , ,7 Tese a hipóese de igualdade do veor média de raamenos. Os veores de médias amosrais de raameno são: X. 09, 400 = 4,55 X. 64,600 = 5,5 X ,800 = 5,80 X ,600 = 5,34 E a média geral: X.. 367,35000 = 5,465
233 Ferreira, D.F. Esaísica mulivariada 7 A mariz B é obida por: 09, 400 B = 367, , 55 55, 665, , , 34 5, 5 {[ 09, 400 4, 55] [ 367, , 465] } + + {[ 665, 600 5, 5] [ 367, , 465] } Obviamene, quando os cálculos não são realizados no compuador, é mais fácil de se ober as marizes de somas de quadrados e produos, pelas expressões apresenadas a seguir. Para isso, considere que X i j k represena o valor observado do i-ésimo raameno, na j-ésima unidade experimenal e na k-ésima variável. Enão, SQB kk g X = n i= X i.k..k g i ni i= (6.6) represena a soma de quadrados de raameno para o i-ésimo componene, e g X X X X SPB = (6.7) k i= i.k i.....k g ni ni i= represena a soma de produos de raameno enre as variáveis k e, com k =,,..., p.
234 6. Análise de variância mulivariada 8 Para o oal as SQ e SP são: SQT kk g ni X = i= j= X..k ijk g i= n i (6.8) g n i XX ijk ij i= j= X X i..k.. SPTk = (6.9) g n i= Para o resíduo basa ober a diferença: E = T - B (6.0) No exemplo, as marizes B, E e T são: B = 8930, , , 3605, 638 T = 8360, , , 645, 957 E= T B= 9058, , , , 399 O quadro de MANAVA esá apresenado a seguir:
235 Ferreira, D.F. Esaísica mulivariada 9 FV GL SQ&P Traameno , ,3605 B = 768,3605,638 Erro 6 Toal Corrigido ,4000 9,9040 E = 9,9040 0, , ,645 T = 778,645,957 Para o ese da hipóese H 0 : τ =τ = =τ g = 0, a razão enre o par de formas quadráicas ebe eeee resolver o sisema de equação, k k k k, deve ser maximizada. Iso equivale a ( ) B λ ke ek = 0 Para o exemplo, os auovalores e auoveores são: [ ] λ = 4,3463 e = 0,0058 0,95 [ ] λ = 6,678 e = 0,00,7667 Alguém desavisado poderia pensar que o valor do segundo elemeno do segundo auoveor (,7667) fosse algum ipo de erro de digiação, por se raar de um valor superior a. No enano, iso é perfeiamene possível, pois os
236 6. Análise de variância mulivariada 30 auoveores, no caso da maximização da razão enre duas formas quadráicas, são normalizados da seguine forma: eee k k = eeee k = 0(k ), o que pode ser facilmene verificado. Todos os criérios uilizados rejeiaram a hipóese de igualdade dos veores efeios raameno (P<0,0), como pode ser viso no quadro seguine. Criério Esaísica F G.L. Pr>F Wilks Λ=0, ,6 v =6 e v =30 0,000 Traço de Pillai V=, ,00 v =6 e v =3 0,000 Traço de Hoelling Lawley U=48,044,06 v =6 e v =8 0,000 Raíz máxima de θ=4,3463 0,5 v =3 e v =6 0,000 Roy p=; q=3; v=6; s=; r=6; f=; d=3; m=0; n=6,5; e = 6.3. Inervalos de confiança simulâneos para o efeio de raamenos Quando a hipóese de efeios iguais para raamenos é rejeiada, aqueles efeios que levaram a rejeição são de ineresse. Para comparações simulâneas duas a duas, a aproximação de Bonferroni pode ser usada para consruir inervalos de confiança simulâneos para os componenes da diferença τh τ i (diferenças de efeios dos raamenos h e i, respecivamene). Esses inervalos são mais curos que os obidos para odos os conrases, e requerem apenas valores críicos da esaísica univariada.
237 Ferreira, D.F. Esaísica mulivariada 3 Fazendo τ ik o k-ésimo componene de τ i. Desde que τ i pode ser esimado por τ ˆi = Xi. X.., enão, ˆ ik Xi.k X..k τ = (6.) Devido a (6.) corresponder a diferença enre duas médias amosrais independenes, o ese de de duas amosras é válido, modificando-se adequadamene o nível de significância. A esimaiva da variância do conrase enre duas médias de raamenos é dada por, ^ Var(Xh.k X i.k) E = + nh ni υ kk (6.) A divisão de E kk pelos seus respecivos graus de liberdade (υ), é devido ao fao de que, o elemeno em quesão (E kk ) refere-se a uma soma de quadrados. Desa forma, desde que p variáveis são consideradas e g(g-)/ comparações duas a duas serão realizadas, enão o inervalo de confiança proegido por Bonferroni para diferença de efeios de raameno é dado por: X α Ekk υ h.k Xi.k ± υ + pg(g ) nh ni (6.3) para odos os k =,,..., p e odas as diferenças h < i =,,..., g.
238 6. Análise de variância mulivariada Exercício Repeir a análise de variância do exemplo 6. uilizando o proc GLM do SAS e soliciar a realização dos seguines conrases: i) A e B vs C e D; ii) A vs B e iii) C vs D.
239 [ 7 ] Componenes principais 7.. Inrodução A análise de componenes principais esá relacionada com a explicação da esruura de covariância por meio de poucas combinações lineares das variáveis originais em esudo. Os objeivos dessa análise são: i) redução da dimensão original; e ii) faciliação da inerpreação das análises realizadas. Em geral, a explicação de oda a variabilidade do sisema deerminado por p variáveis só pode ser efeuada por p componenes principais. No enano, uma grande pare dessa variabilidade pode ser explicada por um número r menor de componenes, r p. Os componenes principais são uma écnica de análise inermediária e, porano não se consiuem em um méodo final e conclusivo. Esse ipo de análise se presa fundamenalmene como um passo inermediário em grandes invesigações cieníficas. Essa écnica pode ser aplicada, ainda, na análise de regressão múlipla, principalmene, nos casos de colinearidade ou de mulicolinearidade; aplica-se ambém à análise de agrupameno e como esimadores de faores nas écnicas mulivariadas denominadas de análises faoriais. Muias ouras aplicações
240 7. Componenes principais 34 de componenes principais são enconradas nas lierauras aplicadas. A écnica AMMI (addiive muliplicaive ineracion model) considera modelos lineares com ineração enre dois faores e aplica como base para seus procedimenos a análise de componenes principais. 7.. Componenes principais populacionais Algebricamene os componenes principais represenam combinações lineares de p variáveis aleaórias X, X,, X p. Geomericamene, essas combinações lineares represenam a seleção de novos eixos coordenados, os quais são obidos por roações do sisema de eixos original, represenados por X, X,, X p. Os novos eixos represenam as direções de máxima variabilidade. Como pode ser demonsrado, os componenes principais dependem somene da mariz de covariância Σ (ou da mariz de correlação ρ) e de X, X,, X p. Seu desenvolvimeno não requer pressuposições de normalidade mulivariada, mas possuem inerpreações úeis em ermos da consane elipsóide de densidade, se a normalidade exisir. A princípio, serão definidos os conceios de componenes principais populacionais. Poseriormene, nauralmene esses conceios serão esendidos para a siuação amosral. Seja o veor aleaório X = X X X p amosrado de uma população com covariância Σ, cujos auovalores são λ λ λ p 0, enão, os
241 Ferreira, D.F. Esaísica mulivariada 35 componenes principais (Y, Y,,Y p ) são as combinações lineares dadas por (7.) Y = ex= ex+ ex epxp Y = e X = e X + e X e X p p Y = e X= e X + e X e X p p p p pp p (7.) É fácil verificar que: ( ) ( ) Var(Y ) = Var e X = e Var X e = e Σe i i i i i i (7.) ( ) Cov(Y,Y ) = Cov e X,e X = e Σe i k i k i k (7.3) Dessa forma, pode-se definir o i-ésimo componene principal (Y i ) por (7.4), assumindo que o veor X possui covariância Σ, com pares de auovalores e auoveores ( ) λ i,e i, i =,,..., p, em que λ λ λ p 0. Yi = eix = eix + eix eipxp i =,,...,p (7.4) No capíulo, verificou-se que a maximização de uma forma quadráica resulava na solução dada pelo conjuno de odos os pares de auovalores e auoveores da mariz núcleo. Os auoveores da solução eram
242 7. Componenes principais 36 resrios ao comprimeno uniário. Seja a forma quadráica dada por o seu máximo é obido pela resolução da equação (7.5). e Σe λ=, enão ee ( ) Σ λ iiei = 0 (7.5) É fácil perceber que dessa equação surge a seguine e óbvia relação, obida no pono máximo, dada por: Σ ei =λiei. Porano, a variância e a covariância de Y i, especificadas em (7.) e em (7.3) são dadas por: Var(Y ) = e Σ e = e λ e =λ e e =λ i i i i i i i i i i (7.6) Cov(Y i,y k) = eiσ ek = eiλ kek =λ keiek = 0 i k (7.7) pode-se demonsrar que: Uilizando algumas propriedades mariciais esudadas no capíulo, p Var(X ) = Var(Y ) i i= i= p i σ +σ σ =λ +λ λ pp p A variação oal exisene nas variáveis X i, i=,,...,p é igual à variação exisene nos p componenes principais. Para demonsrar isso, seja Σ a
243 Ferreira, D.F. Esaísica mulivariada 37 mariz de covariância enre as p variáveis X, cujos pares de auovalores e auoveores são dados por (λ i, ei ). O componene principal Y i é definido por Y i = eix, o qual possui variância igual a λ i. verifica-se que: Da decomposição especral de Σ=PΛP e sabendo que PP =P P=I ( ) r( Σ ) = r PΛ P A=P e B=ΛP, enão, Uma propriedade do raço de uma mariz é: r(ab)=r(ba). Fazendo p ( ) ( ) ( ) r( Σ ) = σ = r PΛ P = r Λ P P = r Λ = λ ii i= i= p i E, porano, a porcenagem da variação oal explicada pelo k-ésimo componene principal é dada por (7.8). k %VarExp(Y k ) = 00 p λ λ i= i (7.8) Em muias siuações em que se aplicam os componenes principais se uma porcenagem de 70% ou mais for aribuída aos primeiros r componenes principais, enão, esses podem subsiuir as p variáveis originais sem perda de
244 7. Componenes principais 38 uma quanidade demasiada de informações. A deerminação dessa porcenagem da variação explicada pelos primeiros r componenes deve ser feia pelo pesquisador ineressado e que possui maior conhecimeno da área esudada. A deerminação do número r de componenes para que uma deerminada porcenagem fixada da informação seja conemplada por eles é um dos problemas que dificula o emprego dessa meodologia. Os componenes do auoveor e i = ei ei e ip podem informar sobre a imporância das variáveis para o i-ésimo componene principal, por meio de suas magniudes. No enano, esses componenes são influenciados pela escala das variáveis. Para conornar al problema, os pesquisadores podem uilizar uma imporane medida de associação, a qual não depende da magniude das mensurações (escala) das variáveis originais, que é o coeficiene de correlação enre Y i e X k. Esse coeficiene de correlação esá apresenado em (7.9). e λ ik i ρ Y,X = = i k σkk, i,k,,...,p (7.9) Demonsração: Para demonsrar (7.9), primeiro é apresenada a definição do coeficiene de correlação. Poseriormene, foi avaliado cada ermo dessa expressão individualmene. ρ = Y,X i k ( i k) ( ) ( ) Cov Y,X Var Y Var X i k
245 Ferreira, D.F. Esaísica mulivariada 39 Mas, ( i k) = ( i k) = ( i ) Cov Y,X Cov e X,X Cov e X, X com, = [ ] Logo,, veor composo de valores 0 e com na k-ésima posição. ( ) ( ) Cov Y,X = Cov e X, X = e Σ = Σe i k i i i Como Σ ei =λiei, enão, ( ) Cov Y,X = Σ e = λ e =λ e =λ e i k i i i i i i ik Da mesma forma as variâncias de Y i e X k são: ( ) ( ) Var Y = Var e X = e Σ e =λ e e =λ i i i i i i i i e, Var(X ) = σ k kk Assim, a prova fica complea, conforme descrio a seguir:
246 7. Componenes principais 40 ( ) ( ) ( ) Cov Y,X λ e λ e ρ Y,X = = = i k Var Y Var X λ σ σ i i k i ik i ik k i kk kk Exemplo 7. Sejam as variáveis aleaórias X, X e X 3 com covariância dada por: 4 0 Σ= Ober os componenes principais, a correlação das variáveis originais com os componenes e verificar a veracidade da afirmaiva a seguir de forma numérica: p Var(X ) = Var(Y ) i i= i= p i σ +σ σ =λ +λ λ pp p Aplicando-se o power mehod, deerminaram-se os pares de auovalores e auoveores de Σ, os quais são: [ ], λ = 3 e = [ 0,707 0,707 0] e λ = e = [ 0 0 ] λ = 5 e = 0,707 0, Os componenes principais são:
247 Ferreira, D.F. Esaísica mulivariada 4 Y = e X = 0,707X + 0,707X Y = e X = 0,707X 0,707X Y = e X= X A variável X 3 é individualmene um de os componenes principais por não ser correlacionada com nenhuma das ouras duas variáveis. As variâncias de os componenes principais são: Var(Y ) =λ = 5, Var(Y ) = λ = 3 e Var(Y 3) = λ 3 = Pode-se mosrar, a íulo de ilusração, que: Var(Y ) = Var X+ X Var X Var X Cov X, X = + + = ( ) ( ) ( ) = Var X + Var X + Cov X,X = = 5=λ Verifica-se, ambém, que: σ +σ +σ 33 =λ +λ +λ =5+3+ 0=0 c.q.m.
248 7. Componenes principais 4 A porcenagem da variação explicada por cada componene é apresenada na abela seguine. Componene Var(Y i )=λ i % da variação explicada % variação acumulada Y Y Y originais são: Os coeficienes de correlação enre os componenes e as variáveis Componene X X X 3 Y 0,7906 0,7906 0,0000 Y 0,64-0,64 0,0000 Y 3 0,0000 0,0000,0000 Para ilusrar um dos cálculos usando a expressão (7.9), apresena-se a seguir a correlação enre Y e X. λ 5 ρ Y,X = = = σ 4 e 0,7906. Para o componene principal mais imporane (Y ), concluiu-se que X e X são igualmene imporanes. Os componenes principais podem ser obidos pela padronização das variáveis originais por:
249 Ferreira, D.F. Esaísica mulivariada 43 Z i Xi µ = σ ii i (7.0) Em noação maricial em-se: / Z V X ( ) = µ (7.) em V -/ é uma mariz diagonal com os elemenos da diagonal dados fácil verificar que: σ ii. É ( ) = e ( ) / / Cov Z V V E Z 0 = Σ =ρ Enão, os componenes principais de Z são dados pelos auovalores e auoveores de ρ, mariz de correlação de X. Os auovalores e auoveores de Σ são, em geral, diferenes daqueles derivados de ρ. com ( ) Sejam as variáveis padronizadas Z, Z,..., Z p disposa no veor Z Cov Z =ρ, enão, os componenes principais são dados por: ( ) / Yi = eiz= eiv X µ Da mesma forma, verifica-se que:, i=,,..., p (7.)
250 7. Componenes principais 44 p i i= i= p i= i p Var(Y ) = Var(Z ) = p λ = p i (7.3) Também se verifica que: ρ = e λ (7.4) Y,Z i k ik i Sendo que em odos esses casos (λ i, ei ) são os auovalores e auoveores de ρ, com λ λ... λ p. As demonsrações de (7.), (7.3) e (7.4) podem ser realizadas da mesma forma que as demonsrações aneriores, subsiuindo Σ por ρ. Para algumas marizes de covariância, com esruuras especiais, exisem simples formas de se expressar os componenes principais. Serão raados alguns desses casos, conforme apresenado em Johnson e Wichern, (998) e em Morrison (976). Para uma mariz Σ diagonal, σ σ Σ= 0 0 σpp (7.5) Os auovalores e auoveores são dados por:
251 Ferreira, D.F. Esaísica mulivariada 45 λ i =σ ii e e = [ ] i com na i-ésima posição e 0 nas demais. A demonsração disso pode ser facilmene realizada, uma vez que das equações de maximização de formas quadráicas verifica-se que : Σ ei =λiei. Assumindo-se as definições aneriores para os auovalores e auoveores verificase que: Σ ei =λiei = Σ ei =σiiei σ σ ii = =σ σ pp 0 0 Dessa forma, pode-se concluir que (σ ii, ei ), com ei definido aneriormene, são os pares de auovalores e auoveores de Σ. Desde que os componenes principais são dados pelas combinações lineares ex i =X i, enão, os componenes principais são as próprias variáveis originais não correlacionadas, cujos auovalores são as próprias variâncias originais das respecivas variáveis aleaórias. Do pono de visa de exração de componenes principais nada pode ser ganho, uma vez que os eixos originais já esão no senido de maior variabilidade. Dessa forma não há necessidade para fazer roação dos eixos
252 7. Componenes principais 46 originais. A esandardização não alera a siuação, uma vez que ρ=i, e o par auovalor e componene principal é dado por (, Z i ), em que Z i é a i-ésima variável padronizada. Ouro ipo de mariz de covariância com deerminado padrão é apresenado a seguir, o qual descreve muias vezes o comporameno de enidades biológicas, desempenha um papel imporane na eoria dos componenes principais. σ ρσ ρσ ρσ σ ρσ Σ= ρσ ρσ σ (7.6) A mariz de correlação correspondene é dada por: ρ ρ ρ ρ ρ= ρ ρ (7.7) que implica em uma esruura de igualdade de correlação enre as p variáveis esudadas. Morrison (976) demonsra que os componenes principais de (7.6) são dados por dois grupos. O primeiro grupo com o primeiro componene e o segundo com os demais componenes principais. O primeiro componene principal de (7.6) é definido pelo par auovalor e auoveor apresenado a seguir.
253 Ferreira, D.F. Esaísica mulivariada 47 [ ] λ =σ + ρ (7.8) (p ) e =,,..., p p p (7.9) Para a mariz de correlação definida em (7.7), pode-se demonsrar que 7.8 e 7.9 permanecem válidos, sendo necessário apenas fazer σ =. A proporção da explicação do primeiro componene principal é dada por 00[ + (p ) ρ ]/ p (%) do oal do conjuno de variáveis. Se ρ é próximo a o primeiro componene principal erá uma elevada explicação da variação oal. Os demais (p-) componenes principais possuem valores caracerísicos iguais, dados por: ( ) λ =σ ρ = (7.0) i ; i,3,,p e seus respecivos auoveores são iguais a:
254 7. Componenes principais 48 e =,,0,...,0 e 3 =,,,0,..., (i ) e i =,...,,,0,...,0 (i ) i (i ) i (i ) i (p ) e p =,...,, (p ) p (p ) p (p ) p (7.) Finalmene é raada a siuação em que o veor X é uma variável aleaória da disribuição normal mulivariada, ou seja, X N p ( µ, Σ). Nesse caso os componenes principais êm uma araiva inerpreação. Foi demonsrado no capíulo 4 que a densidade de X é consane na elipsóide cenrada em µ, ( ) ( ) X µ Σ X µ = c =χp ( α) cujos eixos são dados por ± χp( α) λ ie i, i =,,..., p, em que (λ i, ei ) são os pares de auovalor-auoveor de Σ. É possível verificar, fazendo µ = 0 por conveniência de algumas demonsrações que se seguem, que: χ α = Σ = ( ) ( ) ( ) p( ) X X ex ex... epx λ λ λp
255 Ferreira, D.F. Esaísica mulivariada 49 em que eix, i =,,..., p são os componenes principais de X. Fazendo Yi = eix, i =,,..., p em-se χ ( α ) = X Σ X = Y + Y Y p p λ λ λp Essa úlima equação define uma elipsóide com os eixos coordenados Y, Y,..., Y p disposos nas direções de e, e,..., e p, respecivamene. Como λ é o maior auovalor, o maior eixo em a direção definida por e, os eixos remanescenes êm a direção definida por e,..., ep. Foi assumido que µ = 0. No enano, é pouco provável que isso aconeça em uma siuação real. Todavia, as inerpreações definidas aneriormene são válidas da mesma forma, apenas sendo necessário definir o i-ésimo componene principal cenrado na média, por: ( ) Yi = ei X µ, i =,,..., p (7.) o qual em média zero e direção definida por e i. Na Figura 7. ilusram-se os componenes principais bivariados com densidade fixa de 95%. A roação dos eixos X e X nos novos eixos Y e Y são a essência dos componenes principais.
256 7. Componenes principais 50 Y Y Figura 7.. A elipse de 95% de densidade consane e os componenes principais Y e Y para a disribuição normal bivariada com média µ= Componenes principais amosrais Seja X,X,,Xn uma amosra aleaória reirada de uma população p-variada qualquer com média µ e covariância Σ. O veor de médias amosrais é X, a mariz de covariância amosral é S e a mariz de correlação amosral é R. O objeivo dessa seção é apresenar os conceios de componenes principais para a esruura de covariância amosral. As combinações lineares das variáveis mensuradas que maximizam a variação oal da amosra e que são muuamene orogonais são chamadas de componenes principais amosrais. Seja a forma quadráica
257 Ferreira, D.F. Esaísica mulivariada 5 ˆ ˆ ˆ Q = Var(Y) = Var(e X) = e Se O máximo de Q não exise, pois quano maior for o comprimeno de e maior será o valor de Q. É conveniene omar-se o máximo de Q resrio ao comprimeno uniário de e. Dessa forma, o máximo em que ser obido da forma quadráica resria seguine. ese ee λ= O máximo é obido omando-se a derivada em relação a e e igualando-se a derivada a zero. O sisema obido é resolvido em relação a e e as soluções obidas referem-se ao máximo. ˆˆˆ ˆ ˆˆ ˆ ˆ ˆˆ ˆˆ ˆˆ λ Se(e e) (e Se)e e Se = = S Ι eˆ = 0 e (e e) e'e e e ese ˆ ˆ S Ι eˆ = 0 ee ˆˆ A equação resulane é dada por: ( ˆ ) S λι eˆ = 0 (7.3)
258 7. Componenes principais 5 ( ˆ i;eˆ i) A solução de (7.3) conduz aos pares de auovalores e auoveores λ de S, que correspondem a variância amosral e combinação linear que definem os componenes principais amosrais, para i=,,..., p. Porano, o i-ésimo componene principal amosral é: Yˆ i = eˆix = eˆ ˆ ˆ ix+ eix eipx p, i =,,..., p (7.4) em que λˆ λˆ ˆ... λp 0 são os auovalores amosrais de S correspondenes. O esimador da variância amosral dos componenes principais é: ( ˆ k) Var ˆ Y =λ ˆ, k =,,..., p (7.5) k e a covariância enre dois componenes principais (i e k) é: ( ˆ ˆ i k) Cov ˆ Y,Y = 0, i k =,,...,p (7.6) Pela mesma razão apresenada para os componenes principais populacionais, verifica-se que a variação oal explicada pelos componenes principais amosrais é igual a p λ ˆ p i = Sii. A parir da decomposição especral de i= i= S, dada por S ˆˆˆ = PΛ P e da propriedade que r(ab)=tr(ba) demonsra-se que:
259 Ferreira, D.F. Esaísica mulivariada 53 p ( ˆˆˆ ) ( ˆˆ ˆ) ( ˆ) r(s) = S = r PΛ P = r Λ P P = r Λ = λˆ ii i= i= n i Dessa forma, a explicação do k-ésimo componene principal amosral da variação oal do sisema é: ˆ λˆ k %VarExp(Y k ) = 00 p λ ˆ i= i (7.7) A correlação amosral enre Ŷ i e X k é definida por: ê λˆ = = (7.8) ik i r, i,k,,...,p Ŷ,X i k Skk Os componenes principais podem ser definidos por componenes principais amosrais cenrados na média amosral X, da seguine forma: ( ) ( ) ( ) ( ) Yˆ i = eˆi X X = eˆ ˆ ˆ i X X + ei X X eip Xp X p, i =,,..., p (7.9) Se o veor X for subsiuído em (7.9) por X j (veor de observações amosrais), pode-se ober os escores dos componenes principais. Esses escores são ploados, muias vezes, com o inuio de agrupar objeos ou iens, simplificar a represenação para uma ou duas dimensões, enre ouras aplicações.
260 7. Componenes principais 54 Os componenes principais, em geral, não são invarianes com relação a ransformações nas escalas. A mudança de escala mais usual é aquela que ransforma as escalas das variáveis para uma oura escala sem dimensão, cuja média é igual a zero e a variância é igual a. A padronização é obida por: ( j ) / Z j = D X X, j =,,...,n (7.30) em que D -/ = Diag ( / S,/ S,...,/ S pp ). O esimador de a covariância de Z é dado por: ˆ = ˆ = = / / / / Cov(Z) D Cov(X)D D SD R (7.3) Os componenes principais obidos de R são definidos pelos pares de auovalores e auoveores de R ( ˆ i;eˆ i) λ. Assim, o i-ésimo componene principal amosral obido da mariz de correlação amosral é dado por: Yˆ i = eˆiz = eˆ ˆ ˆ iz+ eiz eipz p, i =,,..., p (7.3) A variação oal explicada pelo k-ésimo componene principal é dada por: ˆ k %VarExp(Y k ) 00 λˆ = (7.33) p
261 Ferreira, D.F. Esaísica mulivariada 55 A correlação amosral enre Ŷ i e Z k é definida por: r = e ˆ λ ˆ, i,k =,,...,p (7.34) Y,Z ˆ ik i i k Pequenos valores para os úlimos auovalores, ano de S como de R, indicam, em geral, a presença de dependência linear no conjuno de dados. Nese conexo pelo menos uma variável é redundane e pode ser eliminada do conjuno de variáveis originais. Exise sempre a quesão imporane de o número de componenes a ser reido. Não exise uma resposa definiiva para essa quesão. Os aspecos que devem ser considerados incluem a quanidade da variação amosral explicada, o amanho relaivo dos auovalores e a inerpreação subjeiva dos componenes. Uma ferramena visual imporane para auxiliar a deerminação de o número suficiene de componenes a ser reido é o scree plo. O ermo scree refere-se ao acumulo de rochas nas bases de um penhasco, porano os scree plos serão considerados gráficos de coovelos. Na Figura 7. observa-se que um coovelo é formado aproximadamene na posição i=4. Isso significa que os componenes acima de ˆλ 3 possuem aproximadamene a mesma magniude e são relaivamene pequenos. Isso indica que os rês primeiros, alvez os quaros primeiros componenes são suficienes para resumir a variação amosral oal.
262 7. Componenes principais 56 ^ 0 λ i componene principal Figura 7.. Scree plo de um exemplo com p=6 componenes principais para ilusrar o processo de deerminação de o número apropriado de componenes a ser reido Gráficos dos componenes principais Os gráficos provenienes dos componenes principais podem ser reveladores de diversos aspecos presenes nos dados de ineresse do pesquisador. Em muias áreas os pesquisadores uilizam os primeiros e mais imporanes componenes para agrupar objeos e iens de acordo com a represenação em duas ou no máximo rês dimensões reidas. Os gráficos dos componenes principais podem revelar observações suspeias, como ambém
263 Ferreira, D.F. Esaísica mulivariada 57 permiir uma avaliação da suposição de normalidade. Por se raarem de combinações lineares de p variáveis, suposamene normais, é possível assumir a normalidade para os componenes principais. O ese de normalidade pode ser feio em apenas alguns poucos componenes, o que pode simplificar a complexidades das análises necessárias e reduzir o número de eses a ser realizado. Os valores amosrais dos componenes principais obidos a parir de os dados amosrais originais são chamados de escores. A equação (7.35) refere-se a definição do escore do k-ésimo componene principal, para a j-ésima observação amosral. Yˆ jk = eˆk X j = eˆ ˆ ˆ kx j + ekx j ekpx jp, k =,,..., p; j =,,..., n (7.35) De uma forma geral, os escores dos p componenes principais, represenados pelo veor Y ˆ j = Y ˆ ˆ ˆ j Y j...y jp para a j-ésima observação amosral X j = X j X j... X jp, são dados por: ê ˆ ê Y = P X = X êp ˆ j j j (7.36)
264 7. Componenes principais 58 Para o agrupameno de objeos e ambém para avaliar desvios de normalidade obêm-se gráficos dos primeiros componenes reidos em um diagrama conendo pares de componenes. Também, é possível ober os Q-Q plos para cada componene, conforme descrição realizada no capíulo 4. Desvios de normalidade podem ser verificados e o ese da correlação Q-Q plo pode ser realizado. Para a verificação de observações suspeias os gráficos dos úlimos componenes principais omados dois a dois são uilizados. Esse ipo de gráfico pode ajudar a idenificar observações suspeias. Também, com esse inuio os Q- Q plos desses componenes, de menor imporância para a variação oal, são uilizados. Da equação (7.36) e relembrando que ˆP é uma mariz orogonal, pois PP ˆˆ ˆ = P Pˆ = Ι, porano ( Pˆ ) = Pˆ, pode-se demonsrar que: Xj = PY ˆˆ j = ˆ ˆ ˆ ˆ e e e p Yj X = Yˆ eˆ + Yˆ eˆ + + Yˆ eˆ j j j jp p (7.37) Essa é uma imporane equação que mosra que a observação amosral mulivariada X j pode ser recuperada dos escores dos componenes principais correspondenes. Consiui-se, porano, em uma proeminene forma de idenificar com elevada precisão as observações suspeias. Para isso um número q de componenes principais q p é reido para ajusar as n observações amosrais
265 Ferreira, D.F. Esaísica mulivariada 59 mulivariadas. Dessa forma, uma medida da qualidade desse ajuse é obida avaliando quano Ye ˆ ˆ j + Ye ˆ ˆ ˆ ˆ j + + Ye jq q difere de X j, endo como desvio o valor dado por Y ˆ ˆ ˆ ˆ ˆ ˆ jq+ eq+ + Yjq+ eq+ + + Yjpep. Essa medida é feia omando-se o quadrado desse desvio, o qual refere-se ao seu comprimeno quadráico, ou seja, por Yˆ + Yˆ + + Yˆ jq+ jq+ jp. As observações consideradas suspeias são aquelas que possuem pelo menos uma das coordenadas de Y ˆ ˆ ˆ jq +,Y jq +,,Y jp que conribui para o comprimeno quadráico oal com grande valor Inferências para grandes amosras Foram apresenados os conceios fundamenais dos componenes principais. A essência dos componenes principais esá na obenção dos auovalores e auoveores da mariz de covariância (correlação). Os auoveores deerminam a roação a ser realizada nos eixos coordenados originais nos senidos de maior variabilidade e os auovalores deerminam as variâncias desses novos eixos coordenados. As decisões com relação aos componenes principais devem ser omadas com base nos pares de auovalores-auoveores, ( ˆ i;eˆ i) λ, esimados na amosra. Esses auovalores e auoveores são diferenes dos respecivos valores populacionais devido às variações amosrais. Derivações à respeio das disribuições amosrais de ˆλ i e de ê i são apresenadas em Anderson
266 7. Componenes principais 60 (963). Os resulados relaivos aos resulados de grandes amosras são apresenados a seguir, de uma forma resumida. Suponha que X,X,,Xn seja uma amosra aleaória reirada de uma população p-variada qualquer com média µ e covariância Σ. O veor de médias amosrais é X, a mariz de covariância amosral é S e a mariz de correlação amosral é R. Suponha que Σ possui auovalores (desconhecidos) disinos e posiivos, quais sejam, λ >λ > >λ p > 0 com correspondenes auoveores (desconhecidos) e,e,,e p. O esimador amosral de Σ é S, sendo que os esimadores de λ i e ei são λ ˆ >λ ˆ ˆ > >λ p > 0 e e,e, ˆ ˆ,eˆ p. Girshik (939), Lawley (956) e Anderson (963) demonsraram que os resulados doravane apresenados se verificam para grandes amosras. Dessa forma, os resulados proporcionados referem-se a eoria de disribuições de grandes amosras para os auovalores λ ˆ = ˆ ˆ ˆ λ λ λp e para os auoveores e,e, ˆ ˆ,eˆ p de S. Fazendo Λ uma mariz diagonal dos auovalores λ, λ,, λp de Σ, enão,. n ( λ λ ˆ ) em disribuição aproximadamene Np ( 0,Λ ).. Seja E λ =λ p k i i eke k k= ( λk λi) k i (7.38) ˆ i i p i enão, n( e e ) N ( 0,E ).
267 Ferreira, D.F. Esaísica mulivariada 6 3. Cada ˆλ i em disribuição independene dos elemenos do veor caracerísico associado êi. 4. A covariância do r-ésimo elemeno de êi e o s-ésimo elemeno de ê j (i j) é: λiλ jee is jr Cov( e ˆ ˆ ir,e js ) = (i j) n ( λ λ i j) (7.39) Os resulados a 4 são referenes às propriedades disribucionais de grandes amosras e válidas para o caso de p disinas raízes caracerísicas. Enreano, Anderson (963) apona que o resulado requer somene que λ i seja disino dos demais p- valores caracerísicos, os quais podem er qualquer muliplicidade. Esses resulados podem ser uilizados para consruir eses de hipóeses e inervalos de confiança para os auovalores e auoveores populacionais. O resulado implica, em grande amosras, que os ˆλ i s são independenemene disribuídos com disribuição aproximadamene N ( i, i /n) λ λ. As inferências podem ser derivadas desse resulado. O inervalo de confiança para λ i pode ser obido a parir da afirmaiva probabilísica:
268 7. Componenes principais 6 λ λ ˆ i i P Z ( α /) = α λi n (7.40) O inervalo de confiança resulane é dado por: λˆ i i IC λ ( α) : ; i λˆ ( ) ( ) + Z α/ Z α/ n n (7.4) Obviamene os valores de α e de n devem ser apropriados para que o limie superior de (7.4) seja válido. Caso o limie superior não seja válido e n for suficienemene grande, é possível ober o inervalo alernaivo subsiuindo a variância paramérica de ˆλ i pelo seu esimador. Assim, ˆ ( ) ˆ ˆ ( ) ˆ IC λ ( α) : λ i i Z α/ λi ; λ+ i Z α/ λi n n (7.4) Teses de hipóeses de o ipo H o :λ i =λ 0 podem ser realizados calculando-se o escore normal padrão: Z c λˆ i λ0 = λ0 n (7.43)
269 Ferreira, D.F. Esaísica mulivariada 63 Uma inferência imporane e mais geral sobre a esruura de dependência é apresenada por Anderson (963). O ese de hipóese de que os r auovalores inermediários de Σ sejam iguais é apresenado. A hipóese de ineresse é: H 0 : λ q+ =λ q+ = =λq+ r (7.44) Aos q maiores e aos (p-q-r) menores auovalores não são imposas resrições quano aos seus valores ou muliplicidades. A hipóese alernaiva é especificada da seguine forma: H : pelo menos um dos r auovalores difere dos demais inermediários. O ese de razão de verossimilhança conduz a esaísica χ c = (n ) ln ( λ ˆ j) + (n )r ln q+ r ˆ λ q+ r j j= q+ (7.45) j= q+ r que em disribuição aproximadamene de qui-quadrado sob H 0 com ν=r(r+)/ - graus de liberdade para grandes amosras. Um caso especial imporane dese ese de hipóese ocorre quando q+r=p ou quando a variação das úlimas r dimensões é esférica. Ouro imporane ese refere-se aos auoveores. A hipóese de que o i-ésimo auoveor populacional de Σ é igual a um veor de consanes com norma é apresenada a seguir.
270 7. Componenes principais 64 H :e = e 0 i 0 (7.46) O ese da hipóese nula (7.46) é realizado com base no resulado dessa seção e na mariz de covariância E i definida em (7.38) devidamene subsiuída pelo seu esimador Ê i, o qual é obido pela subsiuição de λ i e e i pelos seus esimadores ˆλ i e ê i. Assim, Anderson (963) demonsra que o ese esaísico dado por: ˆ χ = n λ e S e + e Se = n e e E e e ˆ λ i ( ˆ ) ˆ ( ˆ ) g c i i 0 i i 0 (7.47) em disribuição assinóica de qui-quadrado com p- graus de liberdade se H 0 for verdadeira. Em que g Ê i é uma inversa generalizada de Ê i. Demonsração: A mariz E i do resulado pode ser rescria na forma maricial como se segue. Para isso, serão definidas as seguines marizes:
271 Ferreira, D.F. Esaísica mulivariada 65 Λ i = λ ( λ λ ) i 0 0 λ 0 0 ( λ λi) 0 0 λ p ( λp λi) uma mariz (p-)x(p-) originária da eliminação da i-ésima linha e i-ésima coluna de uma mariz Diag λ ( λj λi) j, pxp. Pi = e e ep p (p ), px(p-). Assim, pode-se definir E i por: sendo e j os auoveores de Σ, com j i e dimensão p λ j Ei =λipiλ ipi =λi e je j j= ( λ λ i j) j i e sua inversa generalizada, devido a E i er poso (dimensão) p-, por: ( λ λ) i j p g Ei = PiΛ i Pi = eje j λi λi j= λj j i No capíulo 4 foi viso que sob normalidade ou para grandes amosras a forma quadráica ( ) ( ) g i 0 i i 0 χp n e e E n e e
272 7. Componenes principais 66 Os graus de liberdade são iguais a (p-) e não a p devido a E i er poso incompleo (p-). Devido aos auoveores de E g i e o auoveor e i serem orogonais, a forma quadráica anerior pode ser simplificada por: ( λ λ) p g g n i j n( ei e0) Ei ( ei e0) = ne0eie0 = e 0 eje j e0 λ i j= λ j = j i ( j i j i ) p p p p n λ λλ +λ n = e0 ejeje0 = e0 λjeje j λ i eje j +λi ejej e0 λi j= λj λi j= j= j= λj j i j i j i j i = Como p λ jee j j =Σ, além disso, somando e subraindo j= λ ee i i i ao ermo da expressão p λ jee j j, em-se que: j= j i p λ ee +λee λ ee =Σ λee j= j i j j j i i i i i i i i i Uilizando o mesmo raciocínio para p Σ = ee j j somando e j= λ j subraindo ao ermo p ee j j a quanidade dada por j= λ j j i ee i i λi, em-se: + =Σ p ee j j ee i i ee i i ee i i j= λj λi λi λi j i
273 Ferreira, D.F. Esaísica mulivariada 67 Finalmene, o ermo p ee j j j= j i é equivalene a seguine expressão, lembrando que os auoveores êm norma e são orogonais e ainda aplicando-se o mesmo ipo de arifício: p ee = I ee j= j i j j i i qui-quadrado em-se: Assim, reornando ao desenvolvimeno anerior da aproximação de p p p n e0 λjee j j λ i ee j j +λ i ee j j e0 = λi j= j= j= λj j i j i j i n = e0 Σ λieiei λi ( I eiei ) +λi Σ eieie0 = λi λi e0σe0 e0eieie0 e0ie0 eeee 0 i i 0 e0σ e0 eeee 0 i i 0 = n λi λ i + λ i +λi λ i = λi λi λi λi λi λ i λi e0σe0 = n e0eee i i 0 e0e0 + e0eee i i 0 +λie0σ e0 e0eee i i 0 = λi e0σe0 = n +λie0σ e0 λi
274 7. Componenes principais 68 Subsiuindo nessa úlima expressão Σ pelo esimador S, a disribuição ainda coninua aproximadamene de qui-quadrado para grandes amosras. Dessa forma, a prova fica complea. Um ouro imporane ese de ineresse é o da hipóese de mesma esruura de correlação, ou seja, Cov(X i, X k)= σiiσkkρ ou Corr(X i, X k)=ρ, para odo i k. Nesse caso, os auovalores de Σ não são odos disinos e os resulados aneriores não se aplicam. Embora as disribuições amosrais dos componenes principais obidos da mariz R sejam difíceis de derivar, esse caso especial conduz a resulados raáveis (Morrison, 976). Lawley (963) propôs um ese para essa hipóese que é alernaivo e equivalene àquele baseado na razão de verossimilhança, para a esruura de eqüicorrelação da mariz de correlação populacional ρ (pxp). Para isso basa aplicar o ese da hipóese de igualdade de odas as p(p-)/ correlações (ρ ij ). A hipóese de ineresse é dada por: ρ ρ H : ρ ρ ρ=ρ = vs H : ρ ρ ρ ρ (7.48) Essa hipóese pode ser escria na forma equivalene H 0 :ρ ij =ρ para odos os subscrios i j. O procedimeno de Lawley (963) requer as seguines quanidades:
275 Ferreira, D.F. Esaísica mulivariada 69 p rk = r ; k =,,..., p p = ik i (7.49) i k r p p = r p(p ) (7.50) ik i= k= i+ (p ) ( r) γ= ˆ p (p )( r) (7.5) Verifica-se facilmene que r k de (7.49) é a média dos elemenos fora da diagonal para as k colunas de R e r de (7.50) é a média de odos os elemenos fora da diagonal principal de R. Lawley (963) mosrou que quando n ende para infinio o ese esaísico: p n p ( ) p c r ik r ˆ ( rk r) ( r ) i= k= i+ k= (7.5) χ = γ em disribuição de qui-quadrado com ν=(p+)(p-)/ graus de liberdade. Finalmene, o ese, denominado de ese de esfericidade, é apresenado. A hipóese de ineresse é dada por: H : 0 Σ =Σ 0 =σ I (7.53)
276 7. Componenes principais 70 Para o ese dessa hipóese, suponha uma amosra aleaória da disribuição normal p-variada com média µ e covariância Σ, dada por X,X,,Xn. A seguir é apresenado o ese de razão de verossimilhanças para esar a hipóese de ineresse. A função de verossimilhança sob a hipóese H : 0 Σ=Σ é dada por: L n n π Σ np / n / ( µ, Σ X) = f ( X j ) = ( ) exp ( X j µ ) Σ ( X j µ ) j= j= A função supore é deerminada pelo logarimo naural (neperiano) da função de verossimilhança. O máximo de L deve ser obido, no enano, o máximo da função supore com relação a µ e Σ coincidem. A função supore é dada por: S n np n ( µ, Σ X) = ln f ( X j ) = ln ( π) ln Σ ( X j µ ) Σ ( X j µ ) j = j = n Para ober o máximo dessa função, é necessário derivar em relação aos parâmeros µ e Σ. Igualar as derivadas a zero e achar a solução do sisema de equações formado. Esses resulados esão apresenados na seqüência. a) Derivada de S ( µσ, X ) em relação a µ
277 Ferreira, D.F. Esaísica mulivariada 7 S ( µσ X ), n = Σ µ j = ( X j µ ) Igualando a zero e resolvendo a equação formada obém-se: n j = ( X j ) µ ˆ = 0 nµ= ˆ n j = n X X j j = µ ˆ = = n j X b) Derivada de S ( µσ, X ) em relação a Σ S ( µσ X ), n ( ) = Σ + nσ SnΣ Σ Igualando a zero e resolvendo a equação para Σ, subsiuindo-se o valor de µ enconrado em (a), em-se as seguines passagens.
278 7. Componenes principais 7 S ( µσ, X ) Σ = 0 n ( Σ ) + Σ ˆ Σ ˆ = ˆ n Sn 0 ˆ ˆ n nσ S Σ = Σˆ ( ) n Σˆ Σ ˆ =Σ ˆ S n obém-se: Pré e pós muliplicando ambos os lados dessa úlima equação por ˆΣ ˆˆ ˆ ˆ ˆˆ ΣΣ S ˆ nσ Σ =ΣΣ Σ ˆ Σ= S = ( X X)( X X) = W n n n j j j n j= n j= seguine forma: Subsiuindo as soluções obidas em L obém-se o seu máximo da ( ) ( ) / n / ˆ np n L µσ ˆ, = π S ( ) n exp X j X j Sn ( X j X j) j = n / n / np = ( π) Sn exp r Sn ( X j X j)( X j X j) j = n / n / np = ( π) Sn exp rsn ( X j X j)( X j X j) j =
279 Ferreira, D.F. Esaísica mulivariada 73 np / n / = ( π) Sn exp r Sn ns n np / n / n = ( π) Sn exp r [] Ι np / n / np = ( π) S n exp Sob H : 0 Σ=Σ 0 =σ I a verossimilhança e a função supore são dadas por: L n π np ( ) ( ) / n / µσ, ( ) 0 X = Σ0 exp X j µ Σ0 ( X j µ ) j = n np / ( ) np / = π ( σ ) exp ( X j µ ) ( X j µ ) σ j = e S np np σ n ( µσ, X ) = ln ( ) π ln ( σ ) ( X j µ ) ( X j µ ) j = aos parâmeros µ e Para ober o máximo dessa função, é necessário derivar em relação σ. Em seguida deve se igualar às derivadas a zero e achar a solução do sisema de equações formado.
280 7. Componenes principais 74 c) Derivada de S ( µσ, X ) em relação a µ S ( µσ X ), n = µ σ j = ( X j µ ) Igualando a zero e resolvendo a equação formada obém-se: n j = ( X j ) µ ˆ = 0 nµ= ˆ n j = n X X j j = µ ˆ = = n j X Essa solução é a mesma do caso anerior. d) Derivada de S ( µσ, X ) em relação a Σ 0 S ( µσ X ), n np = + ( ) ( ) X j µ X j µ ( ) j = σ σ σ Igualando a zero e resolvendo a equação para valor de µ enconrado em (a), em-se os seguines resulados. σ, subsiuindo-se o
281 Ferreira, D.F. Esaísica mulivariada 75 S ( µσ, X ) ( ) = 0 n np + ( ) ( ) 0 X j X X j X = σˆ ( σˆ ) j = σˆ σ np n ( ) ( ) r X j X X j X = j = σˆ n np r ( X X)( X X) = σˆ ( ) j j j = σˆ Pré e pós muliplicando ambos os lados dessa úlima equação por ˆσ, e simplificando algumas Expressões obém-se: np σ ˆ r ( ns ) = σˆ ( σˆ ) σˆ np p = = σˆ nr S ˆ n σ = ( n) r( Sn) ( ) r S p n Subsiuindo as soluções obidas em L ( µσ, 0 X ) máximo da seguine forma: obém-se o seu
282 7. Componenes principais 76 ( ) np / n ( ˆ np / r Sn p L µσ ˆ, 0 ) = ( π) exp ( X j X j) ( X j X j) p r ( Sn ) j = ( ) np / r Sn p = ( π) exp r ( nsn ) p r ( Sn ) ( ) np / np / np / r Sn np = ( π) exp p Para esar a hipóese H : 0 Σ =Σ 0 =σ I obém-se a razão do máximo de as duas funções de verossimilhança. Enão, baseando-se no resulado de que o logarimo naural muliplicado por - em disribuição aproximada de qui-quadrado, pode-se efeuar um ese para essa hipóese. Assim, seja: ( ) np / np / r Sn np ( ) exp / ( ˆ, ˆ n L µσ π 0 ) p Sn Λ = = = L / ( µσ ˆ, ˆ ) np / n np ( ) S exp r ( Sn ) n π p np / Ou ainda, se for considerado que S n for subsiuído por S, não há aleração dos resulados obidos, e se for considerado ambém que λ ˆ i é o i-ésimo auovalor de S, enão Λ pode ser expresso por: np / np / p p p ˆ n/ λi p ˆ i S λ i= i= np / p np / p [ r(s) / p] ˆ ˆ i /p λi /p λ i= i= Λ = = = (7.54)
283 Ferreira, D.F. Esaísica mulivariada 77 aneriormene por: Um ese esaísico pode ser obido, conforme mencionado n np χ c = ln( Λ) = ln S + { ln[ r ( S )] ln ( p) } = p p n ( ˆ np ln ) ln ˆ = λ + ln ï ( p) ï λ χ i= i= ν (7.55) A disribuição aproximada de qui-quadrado possui ν graus de liberdade, que referem-se a diferença enre o número de parâmeros do modelo compleo e o número de parâmeros do modelo sob a hipóese nula. Como são esimadas p médias, p variâncias e p(p-)/ covariâncias no modelo compleo e p médias e σ no modelo sob a hipóese nula, os graus de liberdade são dados por: p ( p + ) ( ) ( )( ) p p + p + p p p ν= + = = Barle (954) sugere uma correção no ese anerior para uma melhor performance, sendo que para grandes amosras a esaísica dada por: + + χ = Λ 6pn (p p ) c ln ( ) (7.56) em disribuição aproximadamene de qui-quadrado com ν=(p+)(p-)/ graus de liberdade sob H 0 dada em (7.53).
284 7. Componenes principais 78 O ese (7.56) da hipóese nula (7.53) é denominado de ese de esfericidade, porque os conornos da densidade são esferas quando Σ=σ I. Um ese mais geral do que o ese (7.56) para a hipóese de que odas as variáveis sejam independenes é dado pelo ese de razão de verossimilhança. Seja a hipóese σ H : σ ; 0 0 σpp 0 Σ= σii> 0 (7.57) A seguine esaísica deve ser calculada inicialmene: n/ S Λ = = p n/ Sii i= R n/ (7.58) Para grandes amosras, sob H 0, o ese esaísico: (p + ) χ = lnλ 6n ( ) c (7.59) em disribuição aproximadamene de qui-quadrado com ν=p(p-)/ graus de liberdade sob H 0 dada em (7.57). Essa aproximação é devida a Barle (954) em
285 Ferreira, D.F. Esaísica mulivariada 79 subsiuição a aproximação usual -ln(λ ). O resulado (7.59) melhora a aproximação qui-quadrado usual. Lawley (940) mosra que o ese (7.59) pode ser aproximado por: χ (p + ) 6 p p c n rik i= k= i+ (7.60) Essa expressão represena uma melhor aproximação de (7.59) para pequenas correlações e para grandes amosras é pouco provável que conduza a diferenes resulados dos obidos pela fórmula deerminanal exaa (7.59), Morrison (976). É apresenado a seguir um programa SAS no procedimeno de marizes IML para a realização de odas as inferências proposas nessa seção. Um exemplo é apresenado, com comenários, para que o usuário possa reproduzir os eses e os procedimenos de esimação proposos. opions ps=5000 ls=75 nodae nonumber;; proc iml; S={ , , }; p=ncol(s);n=4;alpha=0.05; prin 'Valor de p amanho da amosra e alpha'; prin p n alpha; prin 'Mariz de covariancias amosral: S'; prin S; Ls=diag(eigval(s)); Ps=eigvec(S); prin 'Mariz de auovalores de S'; prin Ls; prin 'Mariz de auoveores de S'; prin Ps; D=diag(S); D_=inv(roo(D)); *prin D_;
286 7. Componenes principais 80 Rs=D_*S*D_; prin 'Mariz de correlacoes amosrais R'; prin Rs; Lr=diag(eigval(Rs)); prin 'Mariz de auovalores de R'; prin Lr; Pr=eigvec(Rs); prin 'Mariz de auoveores de R'; prin Pr; /*inervalo de confianca para auovalores de S - equacao 7.4*/ za=probi(-alpha/); prin 'Inervalos de confianca para os auovalores de S, sendo - alpha=' alpha; prin 'Auovalor Li Ls'; do i= o p; lin=ls[i,i]/(+za*(/n)**0.5); lsu=ls[i,i]/(-za*(/n)**0.5); prin i lin lsu; end; /*Tesar a hipoese de que o maior auovalor de S e igual a l0=.35 - equacao 7.4 */ /* ese ese eh moivado pelo fao de l=sig(+(p-)rho), com sig=4. e rho=0.97 */ l0=.35; Zc=(ls[,]-l0)/(l0*(n/))**0.5; przc=*(-probnorm(abs(zc))); prin 'Tese de H0: l=.35 (igual correlacao). Esse valor eh apenas um exemplo'; prin 'Valor de Zc valor de prob> zc '; prin 'Se [prob> zc ]>valor de alpha Ho nao deve ser rejeiada'; prin Zc przc; /* ese 7.43 igualdade de r auovalores inermediarios*/ /* nese exemplo sera esado Ho: l = l3 */ /*q=, r=, p=3 -ese 7.44 */ aux=0;aux=0;q=;r=; do i=q+ o q+r; aux=aux+log(ls[i,i]); aux=aux+ls[i,i]/r; end; quic=-(n-)*aux+(n-)*r*log(aux); prin 'Valores dos somaorios auxiliares para ese H0: l = l3'; prin 'aux = soma ln(lj) e aux = media dos lj inermediarios'; prin aux aux; v=r*(r+)/-; prquic=-probchi(quic,v); prin 'Tese da hipoese de que Ho: l = l3 '; prin 'Qui-quadrado GL Pr>qui-Quadr'; prin quic v prquic; /* ese para a hipoese de igualdade de um auoveor a um veor de consanes*/ /* Para ilusrar sera esado que e=[/3^0.5 /3^0.5 /3^0.5], ou seja, igual*/ /* esruura de correlacao da mariz Sigma que originou a S */ e0=j(p,,/3**0.5); E=j(p,p,0); do i= o p; ek=ps[,i]; if i^= hen do; E=E+(ls[i,i]/(ls[i,i]-ls[,])**)*ek*(ek);
287 Ferreira, D.F. Esaísica mulivariada 8 end; end; E=ls[,]*E; Le=eigval(e); *prin E le; ei=ps[,]; prin e0 ei; quic=n*(ls[,]*e0`*inv(s)*e0+e0`*s*e0/ls[,]-); quic=n*(ps[,]-e0)*ginv(e)*(ps[,]-e0); v=p-; prquic=-probchi(quic,v); prin 'Tese da hipoes e=e0=([/3^0.5 /3^0.5 /3^0.5])'; prin 'Qui-quadrado qui-quad GL Pr>qui-Quadr'; prin quic quic v prquic; /*ese da H0:phoij=pho - igual esruura de correlacao */ rbar=(sum(rs)-race(rs))/(p*(p-)); rk=j(p,,0); do i= o p; rk[i]=(sum(rs[,i])-)/(p-); end; gama=(p-)***(-(-rbar)**)/(p-(p-)*(-rbar)**); aux=(rs-j(p,p,rbar))#(rs-j(p,p,rbar)); aux=(sum(aux)-race(aux))/; aux3=(rk-j(p,,rbar))#(rk-j(p,,rbar)); aux4=sum(aux3); quic=(n-)/(-rbar)***(aux-gama*aux4); v=(p+)*(p-)/; if quic<=0 hen quic=e-4; prqui=-probchi(quic,v); prin 'Tese da hipoes phij=pho: igual esruura de correlacao'; prin 'Qui-quadrado GL Pr>qui-Quadr'; prin quic v prqui; prin 'Valores uilizados no ese-para simples conferencia'; prin 'media geral dos rij, veor de medias de cada coluna de R e gama chapeu'; prin rbar rk gama; /*ese de esfericidade-h0: Sigma=Sig^*I*/ Lamb=((de(S)**(/p))/(race(S)/p)); quic=-*(n*p/)*log(lamb)*(-(*p**+p+)/(6*p*n)); v=(p+)*(p-)/; prqui=-probchi(quic,v); prin 'Tese de esfericidade - H0: Sigma=Sig^*I'; prin 'Qui-quadrado GL Pr>qui-Quadr Lambida ^(/(np))'; prin quic v prqui lamb; /*ese de independencia de variaveis mais geral - H0: Sigma = Diag(sig sig... sigpp)*/ Lamb=de(Rs); quic=-*(n/)*log(lamb)*(-(*p+)/(6*n)); v=p*(p-)/; prqui=-probchi(quic,v); prin 'Tese de independencia - H0: Sigma = Diag(sig sig... sigpp)'; prin 'Qui-quadrado GL Pr>qui-Quadr Lambida ^/n'; prin quic v prqui lamb; /*ese de independencia de variaveis - uso da aproximacao de Lawleypior*/ aux=rs#rs; aux=(sum(aux)-race(aux))/; quic=aux*(n-(*p+)/6); v=p*(p-)/;
288 7. Componenes principais 8 prqui=-probchi(quic,v); prin 'Tese de independencia aproximado de Lawley (940)'; prin 'para a hipoese H0: Sigma = Diag(sig sig... sigpp)'; prin 'Qui-quadrado GL Pr>qui-Quadr Soma de rij^=aux'; prin 'Obs. para grandes valores de rij essa eh uma pessima aproximacao'; prin quic v prqui aux; qui; 7.6. Exercícios Exrair os componenes principais da mariz S obida das mensurações de rês variáveis em carapaças de ararugas. As variáveis X, X, e X 3 são referenes ao comprimeno, largura e alura ransformadas por logarimo naural, respecivamene. Uma amosra de 4 fêmeas foi realizada. A mariz S é apresenada a seguir, junamene com o veor de médias das variáveis ransformadas. Ober os componenes principais de S e inerpreá-los, quando for possível. Ober a mariz R e os respecivos componenes principais. Ober em ambos os casos: a) a porcenagem de informação explicada por cada componene; b) a correlação enre as variáveis originais ransformadas e os componenes principais. Observando o primeiro componene principal de R com mais profundidade, o que pode ser afirmado sobre a mariz R (sem a realização de ese).,8 X =,008 e,70 4,980 3,8063 4,7740 S = 3,8063 3,0680 3,783 4,7740 3,783 4,864
289 Ferreira, D.F. Esaísica mulivariada Com os dados do exercício 7.6., deermine os inervalos de 95% de confiança assinóico para os 3 auovalores de Σ (3x3) Com os dados do exercício 7.6. ese a hipóese de que o primeiro auoveor de ρ seja igual a e = Qual é sua conclusão com relação à decisão omada? Com os dados do exercício 7.6. reproduza a mariz S a parir do primeiro componene principal e a mariz de resíduos Tese a hipóese de que os r= úlimos valores caracerísicos de Σ, sejam iguais, uilizando os dados do exemplo Tese a hipóese de independência geral enre 3 variáveis, para as quais uma amosra de n=50 observações apresenou a seguine mariz de covariância. 4,98 0,0796 0,0574 S = 0,0796 5,76 0,000 0,0574 0,000 3, Os dados a seguir referem a uma amosra de 30 elemenos em uma população normal rivariada. Obenha os componenes principais e verifique a normalidade por meio dos dois primeiros componenes. Faça os Q-Q plos e os gráficos de dispersão dos escores do componene vs. Uilize o úlimo componene para verificar a possibilidade de observações suspeias. Caso alguma observação suspeia seja observada, elimine-a da amosra e refaça o exercício.
290 7. Componenes principais 84 U.A. X X X 3,80 9,56 45,9 4, 6,54 49,9 3 9,09 33,6 49,79 4 5,98 3,00 5,73 5 6,00 8,94 50,30 6 6,5 3,67 48,06 7 4,05 30, 55,5 8 4,34 6,47 46,84 9 6,87 9,00 5,6 0,93 38,00 39,4 5, 30,68 54,0 5,54 7,37 5,5 3 7,7 30,0 5,66 4 4,4 9,99 5,50 5 3,38 3,6 5,33 6 3,9 9,59 44,9 7 5,53 9,30 53,7 8 6,40 8,96 46,56 9 8,35 30,5 5,8 0 3,59 7,70 5,33 9,08 3,6 48,59 3,95 9,94 54,73 3 6, 34,5 5,69 4 7,0 9,39 5,03 5 8,8 3,48 49,79 6 5,7 9,54 43, 7 4,80 3,88 48,08 8 7,39 8,88 50,69 9 8,0 34,0 49, ,5 5,3 45,89
291 [ 8 ] Análise de agrupameno 8.. Inrodução As análises rudimenares e exploraórias de dados como os procedimenos gráficos auxiliam, em geral, o enendimeno da complexa naureza da análise mulivariada. No presene capíulo são discuidas algumas écnicas gráficas adicionais para agrupar objeos (iens ou variáveis) e ambém apresenar os algorimos que devem ser usados para efeivamene realizá-los. Enconrar nos dados uma esruura naural de agrupameno é uma imporane écnica exploraória. A análise de agrupameno deve ser disinguida da análise discriminane, pelo fao desa úlima ser aplicada a um número de grupos já conhecidos, endo por objeivo a discriminação de um novo indivíduo a um deses grupos. A análise de agrupameno por sua vez não considera o número de grupos e é realizada com base na similaridade ou dissimilaridade (disâncias). Objeivo dessa análise é agrupar objeos semelhanes segundo suas caracerísicas (variáveis). Todavia, não exisem impedimenos para realizar o agrupameno de variáveis semelhanes segundo as realizações obidas pelos objeos amosrados. Um ouro problema para o qual uma resposa é necessária
292 8. Análise de agrupameno 86 consise em verificar se um indivíduo A é mais parecido com B do que com C. Quando o número de variáveis envolvidas é pequeno, a inspeção visual poderá responder. Assim, por exemplo, na Figura 8. observa-se uma siuação em que A é mais parecido com C do que com B. Inuiivamene para fazer al inferência usou-se o conceio de disância euclidiana, o qual definiu a idéia de parecença. 0 B 8 Variável A C Variável Figura 8.. Dispersão enre rês indivíduos mensurados com relação a duas variáveis quaniaivas conínuas. 8.. Medidas de parecença (similaridade e dissimilaridade) Como foi viso no exemplo da Figura 8., é necessário especificar um coeficiene de parecença que indique a proximidade enre os indivíduos. É imporane considerar, em odos os casos semelhanes a ese, a naureza da
293 Ferreira, D.F. Esaísica mulivariada 87 variável (discrea, conínua, binária) e a escala de medida (nominal, ordinal, real ou razão). No capíulo foi discuida a noção de disância e apresenada a disância euclidiana enre dois objeos no espaço p-dimensional. Sejam X = X X X p e X = X X X p observações enre dois objeos (indivíduos). Enão, a disância euclidiana enre eles é dada por: ( ) ( ) ( ) ( ) p p dx,x = X X + X X X X = (X X)(X X) (8.) Uma imporane disância esaísica enre eses dois objeos é conhecida como disância de Mahalanobis, dada por: ( X,X ) d = (X X ) S (X X ) (8.) em que, S - é a inversa da mariz de variância e covariância amosral. Oura medida de disância é a mérica de Minkowski, a qual depende de funções modulares. p d( X,X ) = Xi X i= ii m m (8.3)
294 8. Análise de agrupameno 88 Para m= a equação (8.3) é conhecida por mérica do quareirão (mérica ciy-block) e para m = represena a disância euclidiana e, em geral, variações de m causam rocas nos pesos dados a pequenas e a grandes diferenças. Sempre que possível é conveniene usar disâncias verdadeiras, ou seja, aquelas que obedecem à desigualdade riangular para o agrupameno de objeos, embora alguns algorimos de agrupameno não exigem o aendimeno dessa pressuposição. De uma maneira geral, sejam X hj as observações do h-ésimo objeo na j-ésima variável e X ij as observações do i-ésimo objeo na j-ésima variável, e sejam Z hj e Z ij eses valores padronizados, enão, podem ser definidas as disâncias apresenadas a seguir. Sendo que h, i =,,..., n e j =,,..., p. Disância euclidiana média, d hi, = p ( X ) hj Xij j = p (8.4) Disância euclidiana padronizada, p Xhj X ij h,i = = h i h i j= S jj ( ) ( ) d X X D X X (8.5)
295 Ferreira, D.F. Esaísica mulivariada 89 em que, D é uma mariz diagonal endo o j-ésimo componene igual a variância S jj, ou seja, S S 0 D = 0 0 Spp média, De modo análogo pode-se definir a disância euclidiana padronizada d h,i p Xhj X ij j S = jj ( Xh Xi) D ( Xh Xi) = = (8.6) p p Ouros ipos de definições de disâncias podem ser enconrados na lieraura (Bussab, Miazaki e Andrade, 990). Um exemplo é o coeficiene de Gower, o qual é baseado na proporção da variação em relação a maior discrepância possível. d p Xhj X ij = log (8.7) p j = X( n) j X () j hi, 0
296 8. Análise de agrupameno 90 em que X ( n) j e X () j são os valores máximos e mínimos, respecivamene, em uma amosra de n objeos para a j-ésima variável. Muias vezes os objeos não podem ser mensurados em variáveis quaniaivas. Essas variáveis podem ser ransformadas em dicoômicas (binárias), deerminado um pono de core de ineresse práico. Assim, por exemplo, se a alura (Y) de n indivíduos é mensurada e o ineresse é deerminar àqueles com alura superiores a,80m, enão, defini-se a variável binária (X) da seguine forma: se Y i >,80m enão X i = caso conrário, se Y i,80m, enão X i = 0. Da mesma forma, variáveis qualiaivas podem ser ransformadas em variáveis binárias omando-se como valor a presença de uma deerminada realização e o valor 0 para as demais. Assim, por exemplo, se na amosra ocorresse um indivíduo com cor de olhos preos deerminaria o valor e a ocorrência de ouro com oura cor de olhos deerminaria o valor 0. De uma maneira geral, a presença e ausência de uma caracerísica devem ser represenadas por uma variável binária, a qual assume valor se a caracerísica esiver presene e o valor zero se esiver ausene. A ocorrência de dados binários é basane comum em genéica molecular. Nesse caso, os indivíduos são genoipados para a presença ou ausência de um deerminado marcador molecular, marcador de DNA. Como exemplos consideram-se duas linhagens de milho as quais foram esereoipadas aravés de marcadores moleculares denominados RAPD. O melhorisa nesse caso esava ineressado na similaridade genéica dessas linhagens. Cinco bandas (marcadores diferenes) foram uilizadas. Os resulados
297 Ferreira, D.F. Esaísica mulivariada 9 para presença e para a ausência dessas bandas foram obidos e esão apresenados a seguir. Bandas Linhagens A 0 0 B 0 0 Exisem, nese exemplo, duas concordâncias, uma com - e oura com - e duas discordâncias, quais sejam, 0- e -0. Represenando o escore ( ou 0) da j-ésima variável binária no h-ésimo objeo por X hj e da mesma forma X ij represena o escore do i-ésimo objeo na j-ésima variável, j=,,..., p. Conseqüenemene, a diferença ao quadrado enre os dois indivíduos ou objeos para uma deerminada variável resulará apenas no valor 0 ou no valor. Isso pode ser observado facilmene pelos seguines argumenos. 0 se X 0 ( ) hj X ij ou se X hj X ij Xhj X ij = se X hj X = = = = ij (8.8) Dessa forma, a disância euclidiana quadráica represena a conagem do número de pares não coincidenes. Grandes disâncias correspondem a muios pares não coincidenes e, porano, a objeos dissimilares. Para o exemplo em quesão, em-se: d = AB,
298 8. Análise de agrupameno 9 A equação (8.4) pode ser usada muias vezes como base para disância, no enano, algumas vezes possui algumas limiações por considerar que os pares (-) e (0-0) possuem o mesmo peso, o que em deerminadas siuações reais (-) represena uma fore evidência de similaridade, mas o (0-0) não. Muios coeficienes exisem na lieraura, dando diferenes raamenos a ese problema. Cabe ao leior decidir em qual siuação o seu problema se enquadra e escolher a medida de parecença mais apropriada. Para inroduzir esas medidas de parecença são apresenados os resulados de coincidências e divergências dos objeos h e i em uma abela de coningência. Iem i 0 Toais a b a + b Iem h 0 c d c + d Toais a + c b + d p = a + b +c + d Nesa Tabela pode-se observar que a represena a freqüência de coincidências (-), b a freqüência de (-0), e assim sucessivamene. No exemplo raado a =, b = c = d =. Na Tabela 8. apresenam-se alguns dos coeficienes de semelhança (similaridade) em ermos das freqüências descrias aneriormene, considerando variáveis binárias. Os valores para o exemplo, a variação de cada
299 Ferreira, D.F. Esaísica mulivariada 93 uma, o nome comum na lieraura e explicação racional para as mesmas foram apresenados. Na Tabela 8., esão apresenados os coeficienes de similaridades, no enano, deve ser ressalado que a única exceção é a disância binária de Sokal. Muias vezes as medidas de dissimilaridade podem ser ransformadas em medidas de similaridade pela relação apresenada em Johnson e Wichern (988). S hi, = + d hi, (8.9) Oura forma de se ober coeficienes de similaridades a parir da disância euclidiana, calculada com variáveis padronizadas, pode ser obida pelo coeficiene de Cael (Bussab, Miazaki, Andrade, 990). S hi, p d 3 = p + d 3 hi, hi, (8.0) Uma oura expressão apresenada é aribuída a Cael e Couler (Bussab, Miazaki, Andrade, 990), ambém derivada considerando disâncias euclidianas padronizadas é dada por: S p d hi, hi, = p + dhi, (8.)
300 8. Análise de agrupameno 94 No enano, nem sempre é possível consruir disâncias a parir de similaridades. Isso só pode ser feio se a mariz de similaridades for não negaiva definida. Com a condição de que S i,i =, máximo das similaridades, e que a mariz de similaridades seja não negaiva definida, enão a expressão (8.) em as propriedades de disância. d ( S, ) hi, hi = (8.)
301 Ferreira, D.F. Esaísica mulivariada 95 Tabela 8.. Alguns coeficienes de parecença para variáveis dicoômicas. Nome Expressão Explicação Variação Ex. Coincidência simples Sokal Sneah Rogers Tanimoo Russel e Rao Jaccard e e Sorenson a d p ( a + d) ( a + d) + b+ c a + d a + ( b+ c) + d a p a a + b + c a a + b + c - a + Pesos iguais para - e ,60 a + ( b + c) - a b+ c Dis. Binária de Sokal Ochiai Baroni-Urbani- Peso duplo para - e ,75 Duplo peso para pares não coincidenes 0-0,43 Nenhum 0-0 no numerador 0-0,40 As coincidências 0-0 são raadas como irrelevanes 0-0 é irrelevane e duplo peso para é irrelevane e duplo peso para não coincidência. Razão enre coincidências e não coincidências - Exceo ,50 0-0,66 0-0,33 0-(p-),00 b+ c Única medida de dissimilaridade. 0-0,63 p a ( a+ b)( a+ c) Concordâncias posiivas sobre adapação da média geomérica de discordâncias Concordâncias posiivas e a média geom. de concordância posiivas e negaivas a+ ad Buser a+ b+ c+ ad Haman ( a+ d) ( b+ c) Proporção de coincidências menos a proporção de discordâncias p Yule ad bc ad + bc φ ad bc ( a+ b)( a+ c)( b+ d)( c+ d) Ochiai II ad ( a+ b)( a+ c)( b+ d)( c+ d) 0-0,67 0-0, ,0 Proporção de ad menos a de bc ,33 Produo de momeno de correlação aplicado a variáveis binárias Proporção de coincidências em relação à média geom. oal modificada ,7 0-0,33
302 8. Análise de agrupameno 96 Em algumas aplicações é necessário agrupar variáveis ao invés de objeos. As medidas de similaridades para agrupar variáveis usadas na práica são baseadas nos coeficienes de correlação amosral. Em algumas aplicações de agrupameno, as correlações negaivas são rocadas pelos seus valores absoluos. Quando, as variáveis são binárias esa correlação esá apresenada na Tabela 8. (φ). Ese coeficiene de correlação esá associado à esaísica de quiquadrado, para esar a independência de duas variáveis caegóricas por ( φ =χ n, n = a + b + c + d, χ com grau de liberdade). Para n fixo, uma grande similaridade (ou correlação) é consisene com a fala de independência enre as variáveis. Uma oura imporane observação que pode ser feia é que para agrupameno de variáveis os coeficienes de similaridade e de disâncias podem ser usadas, apenas omando-se o cuidado de subsiuir p (número de variáveis) por n (número de objeos) Agrupamenos Muios algorimos exisem para formar os agrupamenos, devido a exisência de vários criérios exisenes para conceiuar os grupos que nem sempre são aceios universalmene. Uma oura razão para isso, é que raramene pode-se examinar odas as possibilidades de agrupameno, mesmos com os mais rápidos e possanes compuadores.
303 Ferreira, D.F. Esaísica mulivariada 97 São apresenadas nese maerial algumas das écnicas de agrupamenos denominadas hierárquicas e oura do grupo das não hierárquicas Agrupamenos hierárquicos Os agrupamenos hierárquicos são realizados por sucessivas fusões ou por sucessivas divisões. Os méodos hierárquicos aglomeraivos iniciam com anos grupos quano aos objeos, ou seja, cada objeo forma um agrupameno. Inicialmene, os objeos mais similares são agrupados e fundidos formando um único grupo. Evenualmene o processo é repeido, e com o decréscimo da similaridade, odos os subgrupos são fundidos, formando um único grupo com odos os objeos. Os méodos hierárquicos divisivos rabalham na direção oposa. Um único subgrupo inicial exise com odos os objeos e eses são subdivididos em dois subgrupos de al forma que exisa o máximo de semelhança enre os objeos dos mesmos subgrupos e a máxima dissimilaridade enre elemenos de subgrupos disinos. Eses subgrupos são poseriormene subdivididos em ouros subgrupos dissimilares. O processo é repeido aé que haja anos subgrupos quanos objeos. Os resulados finais deses agrupamenos podem ser apresenados por gráficos denominados dendrogramas. Os dendrogramas apresenam os
304 8. Análise de agrupameno 98 elemenos e os respecivos ponos de fusão ou divisão dos grupos formados em cada eságio. Os esforços dese capíulo serão concenrados nos méodos hierárquicos aglomeraivos ( Linkage Mehods ). Serão discuidos os méodos de ligação simples (mínima disância ou vizinho mais próximo), ligação complea (máxima disância ou vizinho mais disane) e ligação média (disância média). As idéias para eses rês processos esão, esquemaicamene, apresenados na Figura 8.. d (a).. 3 d 5. (b) (c) (d 3 +d 4 +d 5 +d 3 +d 4 +d 5 )/6 Figura 8.. Disâncias enre os grupos para os méodos da (a) ligação simples, (b) ligação complea e (c) ligação média.
305 Ferreira, D.F. Esaísica mulivariada 99 A seguir esá apresenado um algorimo geral para os agrupamenos hierárquicos aglomeraivos com n objeos (iens ou variáveis).. Iniciar com n grupos, cada um com um único elemeno e com uma mariz simérica n x n de dissimilaridades (disâncias) D={d hi }.. Buscar na mariz D o par de grupos mais similar (menor disância) e fazer a disância enre os grupos mais similares U e V igual a d uv. 3. Fundir os grupos U e V e nomeá-lo por (UV). Recalcular e rearranjar as disâncias na mariz D (a) eliminando as linhas e colunas correspondenes a U e V e (b) acrescenando uma linha e coluna com as disâncias enre o grupo (UV) e os demais grupos. 4. Repeir os passos e 3 num oal de (n-) vezes (odos os objeos esarão em único grupo). Anoar a idenidade dos grupos que vão sendo fundidos e os respecivos níveis (disâncias) nas quais iso ocorre. (a) Ligação simples (vizinho mais próximo) Para exemplificar é considerado um exemplo, no qual desacam-se 4 objeos (A, B, C, D), e para o qual a mariz de disâncias enre os objeos é apresenada a seguir. A B C D A 0 B 3 0 D = C D
306 8. Análise de agrupameno 300 Para ilusrar o méodo da ligação simples, os objeos menos disanes devem, inicialmene, ser fundidos. Enão, ( dhi) min = d = 3. O próximo, AB, passo é fundir A com B formando o grupo (AB) e em seguida calcular as disâncias dese grupo e os objeos remanescenes. As disâncias dos vizinhos mais próximos são, d( AB), C = min{ dac, dbc} = min{7, 9} = 7 d( AB), D = min{ dad, dbd} = min{8, 6} = 6 A nova mariz D para o próximo passo é: AB C D AB 0 D= C 7 0 D A menor disância é enre D e C, com d DC =5, os quais foram fundidos formando o subgrupo DC, no nível 5. Recalculando as disâncias êm-se, d = min{ d, d } = min{6, 7} = 6 ( DC),( AB) D( AB) C( AB) A nova mariz D fica, DC AB DC 0 D = AB 6 0
307 Ferreira, D.F. Esaísica mulivariada 30 Conseqüenemene o grupo DC é fundido com AB na disância 6. Na Figura 8.3, foi apresenado o dendrograma, com os resulados alcançados. Dendrograma Single Linkage Mariz de dissmilaridade A B C D Disância de ligação Figura 8.3. Dendrograma para agrupar 4 objeos (A, B, C e D) pelo méodo da ligação simples (vizinho mais próximo). (b) Ligação complea (vizinho mais disane) O méodo da ligação complea é realizado da mesma forma que o do vizinho mais próximo, com exceção de que a disância enre grupos é omada como a máxima disância enre dois elemenos de cada grupo. Para ilusrar, será usado o mesmo exemplo. Assim, considerando a mesma mariz de dissimilaridade D do exemplo anerior. Inicialmene são fundidos os dois objeos menos disanes. Enão, como ( hi) min d = d = 3, os objeos A e B devem ser fundidos formando o, AB, grupo (AB) e em seguida deve-se calcular as disâncias dese grupo e os objeos remanescenes. As disâncias enre os grupos são consideradas com sendo a disância enre os vizinhos mais disanes, dadas por:
308 8. Análise de agrupameno 30 d( AB), C = max{ dac, dbc} = max{7, 9} = 9 d( AB), D = max{ dad, dbd} = max{8, 6} = 8 A nova mariz D para o próximo passo é: AB C D AB 0 D= C 9 0 D A menor disância é enre D e C, com d DC =5, os quais foram fundidos formando o subgrupo DC, no nível 5. Recalculando as disâncias enre os grupos em-se, d = max{ d, d } = max{8, 9} = 9 ( DC),( AB) D( AB) C( AB) A nova mariz D fica, DC AB DC 0 D = AB 9 0 Conseqüenemene, o grupo DC é fundido com AB na disância 9. Na Figura 8.4, foi apresenado o dendrograma, com os resulados alcançados.
309 Ferreira, D.F. Esaísica mulivariada 303 Dendrograma Complee Linkage Mariz de dissimilaridades A B C D Disância de ligação Figura 8.4. Dendrograma para agrupar 4 objeos (A, B, C e D) pelo méodo da ligação complea (vizinho mais disane). Comparando-se os resulados alcançados e apresenados nas Figuras 8.3 e 8.4, pode-se noar que os dendrogramas para o méodo do vizinho mais próximo e do vizinho mais disane não diferem na alocação dos objeos e sim na magniude da fusão dos grupos CD com AB, para esse exemplo em paricular. (c) Ligação média (méodo do cenróide) O méodo da ligação média é realizado da mesma forma que o do vizinho mais próximo e mais disane, com exceção de que a disância enre grupos é omada como a média da disância enre dois elemenos de cada grupo. Para ilusrar, é usado o mesmo exemplo. Da mesma forma, são fundidos os
310 8. Análise de agrupameno 304 objeos menos disanes. Enão, como ( hi) min d = d = 3, os objeos A e B devem, AB, ser fundidos, formando o grupo (AB) e em seguida deve-se calcular as disâncias dese grupo e os objeos remanescenes. As disâncias enre grupos são baseadas na média das disâncias enre odos os elemenos de um grupo com relação aos elemenos de ouro grupo. d( AB), C = ( dac + dbc )/ = (7+ 9)/= 8 d( AB), D = ( dad + d BD)/ = (8+ 6)/= 7 A nova mariz D para o próximo passo é: AB C D AB 0 D= C 8 0 D A menor disância é enre D e C, com d DC =5, os quais foram fundidos formando o subgrupo DC, no nível 5. Recalculando as disâncias êm-se, d = ( d + d ) = (7+ 8)/= 7,5 ( DC),( AB) D( AB) C( AB) A nova mariz D fica, DC AB DC 0 D = AB 7,5 0
311 Ferreira, D.F. Esaísica mulivariada 305 Conseqüenemene o grupo DC é fundido com AB na disância 7,5. Na Figura 8.5, foi apresenado o dendrograma, com os resulados alcançados. Dendrograma Unweighed pair-group average Mariz de dissimilaridade A B C D Disância de ligação Figura 8.5. Dendrograma para agrupar 4 objeos (A, B, C e D) pelo méodo da ligação média (cenróide) Agrupamenos não hierárquicos Os agrupamenos não hierárquicos procuram a parição de n objeos em k grupos. Os méodos exigem a pré-fixação de criérios que produzam medidas sobre a qualidade da parição produzida. Um dos mais populares méodos é o das k-médias.
312 8. Análise de agrupameno 306 O algorimo das k-médias, de uma forma basane simplificada, é dividido em rês passos:. Paricionar os iens em k grupos iniciais arbirariamene;. Percorrer a lisa de iens e calcular as disâncias de cada um deles para o cenróide (médias) dos grupos. Fazer a realocação do iem para o grupo em que ele apresenar mínima disância, obviamene se não for o grupo ao qual ese perença. Recalcular os cenróides dos grupos que ganharam e perderam o iem. 3. Repeir o passo aé que nenhuma aleração seja feia. Exemplo 8. Uilizando 4 iens (A, B, C e D) e variáveis (X e X ) dividir em k= grupos, pelo méodo das k-médias. Observação Objeo x x A B C D i) paricionar os iens arbirariamene em grupos, como por exemplo AD e BC. Calcular a média de cada grupo. Objeo AD BC Cenróide X X (+8)/=5 (+5)/=3 (0+4)/= (+4)/=3
313 Ferreira, D.F. Esaísica mulivariada 307 ii) Nese passo a disância de cada iem será compuada em relação ao cenróide de cada grupo e se necessário, os objeos serão realocados para o grupo mais próximo. d d A( AD) ABC ( ) = ( 5) + (0 ) = 3 = ( 3) + (0 3) = 0 Nese caso há necessidade de realocação de A para o grupo BC, sendo que os cenróides dos grupos devem ser recalculados. Objeo D ABC Cenróide X X 8 4,667 Recalculando as disâncias dos objeos para o cenróide dos grupos e checando a possibilidade de realocação, em-se: d d AD, = 5 A,( ABC) = 4,44 d d BD, = 3 B,( ABC) = 5,44 d d CD, = 49 C,( ABC) = 6,77 Iem (disância quadráica p/ cenróide) Grupo A B C D D ABC 5,0 4,4 3,0 5,4 49,0 6,8 0,0 3,4
314 8. Análise de agrupameno 308 Nenhuma realocação deve ser realizada, pois os objeos êm menor disância para os respecivos grupos aos quais eles perencem. Para realizar uma checagem da esabilidade de a parição alcançada é recomendável execuar novamene o algorimo com uma nova parição inicial Exercícios Agrupar os 4 objeos cuja mariz de dissimilaridades esá apresenada a seguir, uilizando odos os méodos apresenados nesse maerial. A B C D A 0 B 9 0 D = C D
315 [ 9 ] Análise de faores 9.. Inrodução A écnica dos componenes principais consise em uma ransformação orogonal dos eixos coordenados do sisema mulivariado buscando as orienações de maior variabilidade. Para o esudo de dependências esruurais mulinormais, as écnicas de explicação das covariâncias das resposas são preferidas. Apesar de as écnicas dos componenes principais poder ser usada para essa finalidade, esa não deve ser preferida por ser apenas uma ransformação e não um resulado de um modelo fundamenal da esruura de covariância. Esse méodo possui alguns inconvenienes, ais como não ser invariane quano às mudanças de escalas e não possuir um criério adequado para deerminar quando uma proporção suficiene da variação oal foi explicada pelos componenes reidos. Nesse capíulo apresena-se a écnica de análise de faores com o propósio essencial de descrever, se possível, as relações de covariância enre diversas variáveis em função de poucas, não observáveis, quanidades aleaórias denominadas de faores. Sob o modelo de faores cada variável resposa é
316 9. Análise de faores 30 represenada por uma função linear de uma pequena quanidade de faores comuns, não observáveis, e de uma simples variável laene específica. Os faores comuns geram as covariâncias enre as variáveis observadas e os ermos específicos conribuem somene para as variâncias de suas resposas relacionadas. Os coeficienes dos faores comuns não são resrios a condição de orogonalidade, o que confere generalidade, apesar de se exigir normalidade dos dados e a deerminação, a priori, do número de faores. Nesse capíulo são apresenados o modelo de faores orogonais, os méodos de esimação dos parâmeros desse modelo e brevemene o problema de roação dos faores. É considerado um méodo de esimação que não exige normalidade. Méodos de esimação de os escores dos faores são, ambém, abordados, o que ao conrário dos componenes principais não é uma arefa simples. 9.. Modelo de faores orogonais Supondo que o sisema mulivariado consise de p resposa descrias pelas p variáveis observáveis aleaórias X, X,..., X p. Assumindo que o veor de observações mulivariadas p X possui média µ e covariância Σ, enão, o modelo de faores pressupõe que o veor p X é linearmene dependene de algumas poucas variáveis não observáveis F, F,..., F m chamadas de faores comuns, e p
317 Ferreira, D.F. Esaísica mulivariada 3 fones de variações adicionais ε, ε,..., ε p chamadas de erro ou de faores específicos. O modelo de faores pode ser especificado por: X µ = F + F F +ε m m X µ = F + F F +ε m m X µ = F + F F +ε p p p p pm m p (9.) ou em noação maricial por: X µ = L F + ε (9.) (p ) (p m) (m ) (p ) em que ij é denominado de carga da i-ésima variável para o j-ésimo faor, enão a mariz L é chamada mariz de cargas faoriais. O i-esimo faor específico ε i é associado somene com a i-ésima variável resposa X i. Os p desvios X -µ, X -µ,..., X p -µ p são represenados por p + m variáveis aleaórias F, F,..., F m, ε, ε,..., ε p, as quais são não observáveis. Esse fao disingue o modelo de faores do modelo de regressão mulivariada, pois ese úlimo possui variáveis independenes (ocupadas em (9.) por F) que são observáveis. Devido ao grande número de quanidades não observáveis e ambém com a finalidade de ornar úil o modelo de faores, algumas pressuposições sobre os veores F e ε são imposas. Assim é assumido que F em disribuição com média 0 e que os elemenos de F são independenemene
318 9. Análise de faores 3 disribuídos, ou seja, F possui covariância Ι. Da mesma forma é assumido que ε possui média zero e os seus elemenos são independenemene disribuídos, ou seja, Cov( ε )= Ψ diagonal (p x p). Sendo assim, definem-se: E(F) = 0 (9.3) Cov(F) E(FF ) = =Ι (9.4) E( ε ) = 0 (9.5) ψ ψ ε = εε =Ψ = 0 0 ψp Cov( ) E( ) (9.6) Finalmene, é assumido que F e ε são independenes, porano, ( ) Cov( ε,f) = E ε F = 0 (p m) (9.7) O modelo (9.) e essas pressuposições definem o modelo de faores orogonal. Dessa forma a esruura de covariância de X pode ser dada por: Cov(X) = Σ= E(X µ )(X µ )
319 Ferreira, D.F. Esaísica mulivariada 33 pelas definições dadas no modelo (9.), verificase que: Subsiuindo X µ ( ) ( X )( X ) ( LF )( LF ) ( LF ) ( LF) µ µ = +ε +ε = +ε +ε = = LF( LF) +ε ( LF) + LFε +εε Enão, Cov(X) =Σ= E(X µ )(X µ ) = = E LF( LF) +ε ( LF) + LFε +εε = LE(FF )L + E ε F L + L E Fε + E εε ( ) ( ) ( ) De acordo com as condições (9.4), (9.6) e (9.7), em-se: Cov(X) = Σ= LL +Ψ (9.8) Também podem ser obidas as covariâncias enre os componenes de X e F a parir das suposições assumidas e apresenadas aneriormene. Assim, ( ) ( ) ( ) ( ) Cov X, F = E X µ F = E LF +ε F = E LFF +ε F = ( ) ( ) ( ) ( ) = E LFF + E ε F = LE FF + E ε F = LΙ+ 0= L
320 9. Análise de faores 34 Logo, ( ) ( ) Cov X, F = L ou Cov X, F = i j ij (9.9) Da relação (9.8) verifica-se que: m i =σ ii = ij+ψ i = i+ i + + im +ψi j= Var(X )... m Cov(X, X ) =σ = = i k ik ij kj i k i k im km j= (9.0) A porção da i-ésima variável explicada por m faores comuns é chamada de comunalidade e a porção de σ ii devida aos faores específicos é denominada de variância específica. Denoando a i-ésima comunalidade por fácil observar de (9.0) que: h i é h = (9.) i i i im Assim, σ = h +ψ i =,,..., p (9.) ii i i
321 Ferreira, D.F. Esaísica mulivariada 35 Quando m = p a mariz Σ pode ser reproduzida exaamene por LL, de al forma que Ψ=0. A uilidade da análise de faores, no enano, ocorre quando m é bem menor do que p. Dessa forma, o número de parâmeros na análise de faores, p(m+), é bem menor do que aqueles p(p+)/ parâmeros de Σ. Por exemplo, para p=0 exisem 0 /=0 parâmeros em Σ. Se m= faores são uilizados, enão, o modelo de faores possui p(m+)=0(+)=60 parâmeros ( ij e ψ i ). O grande problema da análise de faores é a dificuldade ou a impossibilidade de faorar a mariz Σ em LL +Ψ, quando m é bem menor do que p. Algumas vezes, quando são obidas soluções, esas são, em geral, inconsisenes com as inerpreações esaísicas. A análise de faores em como propósio a deerminação dos elemenos da mariz de cargas faoriais L e dos elemenos de Ψ, obedecendo a resrição (9.). Quando m >, várias soluções exisem para o modelo de faores, odas consisenes com as inerpreações esaísicas. Essa ambigüidade é a base para uma imporane caracerísica da análise de faores que é a roação faorial. Para demonsrar essa propriedade, seja T uma mariz orogonal m x m, ou seja, TT =T T=I. A expressão (9.) pode ser reescria por: X LF LTT F LF * * µ= +ε= +ε= +ε (9.3) em que: * L = LT e * F = T F.
322 9. Análise de faores 36 Como e Cov(F * ) T'Cov(F)T T T T = = Ι = T =Ι, * E(F ) = T E(F) = T 0 = 0 enão, é impossível disinguir as cargas de L das de L *, ou seja, os faores * FeF = TF possuem as mesmas propriedades, uma vez que geram a mesma mariz de covariância Σ, mesmo que as cargas faoriais de L e de L * sejam, em geral, diferenes. Assim, * * Σ= LL +Ψ= LTT L +Ψ= L L +Ψ (9.4) A escolha da mariz T é direcionada por um criério de faciliação da inerpreação dos faores gerados, uma vez que as propriedades esaísicas não são aleradas Esimação das cargas faoriais Nas siuações reais, os parâmeros do modelo de faores são desconhecidos e devem ser esimados das observações amosrais. A análise de faores é jusificável quando Σ difere de uma mariz diagonal, ou quando mariz ρ de correlações difere da idenidade. Para uma amosra X, X,..., Xn de amanho n em p variáveis correlacionadas a mariz S é um esimador de Σ, bem como R é de ρ. Com base em uma esimaiva de Σ é possível realizar o ese de hipóese de igualdade de Σ a uma mariz diagonal, conforme descrição realizada no capíulo 7.
323 Ferreira, D.F. Esaísica mulivariada 37 Se a hipóese não for rejeiada, os faores específicos possuem papel dominane, sendo que a análise de faores é deerminar alguns poucos faores comuns. Nesse caso, a análise de faores não erá grande uilidade. Se a hipóese de a esruura de Σ ser igual a uma mariz diagonal for rejeiada, enão, o modelo de faores será úil e o problema inicial será o de esimar as cargas faoriais ij e as variâncias específicas ψ i. Nessa seção são considerados dois méodos de esimação para os parâmeros do modelo de faores: o méodo dos componenes principais e o méodo da máxima verossimilhança apresenado por Lawley (940, 94 e 943). Qualquer que seja o méodo aplicado, as soluções podem sofrer roações com a finalidade de simplificar as inerpreações dos faores. É prudene, ambém, enar mais de uma solução Méodo dos componenes principais A decomposição especral visa nos capíulos e 7, represena um imporane méodo de faoração de Σ. Sejam as marizes P = e e... ep e Λ= Diag( λ, λ,..., λ p) composas dos auoveores e auovalores de Σ, com λ λ... λ, enão: p / / Σ= PΛ P = PΛ Λ P = LL (9.5)
324 9. Análise de faores 38 em que, L / = PΛ é uma mariz p x p de cargas faoriais. A equação (9.5) reflee um ajuse da esruura de covariância por um modelo de faores endo anos faores quano variáveis (m = p) e variâncias específicas ψ i nulas para odo i =,,..., p. Nesse modelo as cargas faoriais do j- ésimo faor represenam os coeficienes do j-ésimo componene principal (auoveor) muliplicado pelo faor de escala λ j. Embora a relação (9.5) seja exaa, esa não é úil por uilizar anos faores quano variáveis e por não deixar variação alguma para os faores específicos. Uma solução para o problema é considerar um número m, de faores comuns, menor do que o de variáveis p. Com esse criério p-m auovalores e os respecivos auoveores são desconsiderados. Esses auovalores são àqueles (pm) menores. Dessa forma a conribuição de λ e e +λ e e λ e e m+ m+ m+ m+ m+ m+ p p p para Σ é negligenciada. Desprezando essa conribuição, a seguine aproximação de Σ pode ser obida: λe λ e Σ λ λ λ = λme m e e... mem LL (9.6) em que L é uma mariz p x m. A represenação (9.6), no enano, não considera a conribuição dos faores específicos. A conribuição desses faores pode ser esimada omando-se a diagonal de Σ - LL, sendo LL definida em (9.6).
325 Ferreira, D.F. Esaísica mulivariada 39 Dessa forma a mariz Σ pode ser aproximada por: Σ LL +Ψ m i ii ij j= Ψ= Diag( Σ LL ) ou ψ =σ para i=,,..., p. (9.7) É comum rabalhar com a represenação das variáveis em uma escala padronizada. Nessa siuação a variável Z i possui média 0 e variância. A padronização pode ser realizada por: X µ Z Z σ / Z= = V ( X µ ) = Xp µ p Z p σpp (9.8) em que: V / σ σ = 0 0 σ pp
326 9. Análise de faores 30 A mariz de covariância de Z é dada por ρ. O processo de obenção dos parâmeros do modelo de faores é o mesmo descrio nas equações de (9.7), considerando Σ=ρ e L / = PΛ, sendo P a mariz p x m com as colunas composas pelos m primeiros auoveores de ρ e Λ / uma mariz m x m com diagonal igual a λ i. Como σ ii =, é fácil perceber que i m ψ =. A padronização evia que j= ij uma variável com elevada variação influencie indevidamene a deerminação das cargas faoriais. A represenação apresenada em (9.7), quando Σ ou ρ são subsiuídos pelos seus esimadores S ou R, é conhecida como solução dos componenes principais para a análise de faores. O nome se origina do fao de os faores serem derivados dos primeiros componenes principais amosrais. O resumo dos principais resulados desse méodo de esimação é doravane apresenado. A análise de faores por componenes principais obidos da covariância amosral S é especificada em função dos pares de auovalores e auoveores ( ˆ i,eˆ i) λ, i =,,..., p, em que λ ˆ λ ˆ ˆ... λ p. Seja m < p, o número de faores comuns. A mariz das cargas faoriais esimadas ( ˆ ij ) é dada por: L = λˆ eˆ λˆ e ˆ... λ ˆ eˆ = Pˆˆ Λ / m m (9.9)
327 Ferreira, D.F. Esaísica mulivariada 3 em que ˆP é uma mariz p x m dos auoveores amosrais de S e ˆΛ é uma mariz diagonal m x m dos auovalores amosrais de S. Os esimadores das variâncias específicas são dados pela mariz diagonal resulane da seguine operação maricial. ψ ψ 0 Ψ= = Diag S 0 0 ψ p ( LL ) (9.0) De (9.0) verifica-se que: m i S ii ij Sii h i j= ψ = = (9.) Sendo que o esimador da comunalidade é dado por: h = (9.) i i i im A análise de faores por componenes principais da mariz R, por sua vez, é obida subsiuindo S por R nas equações de (9.9) a (9.). Na solução dos componenes principais as esimaivas das cargas faoriais não se aleram com o aumeno do número m de faores.
328 9. Análise de faores 3 É fácil perceber por meio das definições apresenadas que a mariz S não é fielmene reproduzida pela solução de componenes principais. A diagonal de S é exaamene reproduzida pelo modelo de faores, mas os elemenos fora da diagonal principal não são. Assim, S (9.3) LL +Ψ Se o número de faores não é especificado por considerações a priori, como por eoria ou por rabalhos aneriores de ouros pesquisadores, a escolha de m para uma decomposição de maior acurácia de S pode ser baseada nos auovalores esimados, da mesma forma que o número de componenes principais a serem reidos é deerminado. Analiicamene, Johnson e Wichern (998) demonsram que a soma de quadrados dos elemenos da mariz de resíduos S LL Ψ é menor ou igual a p i= m+ λˆ i. Assim, um pequeno valor da soma de quadrados dos úlimos (p-m) auovalores negligenciados implica em uma pequena soma de quadrados do erro da aproximação realizada por m componenes. O ideal é ober uma elevada conribuição dos primeiros faores para a variação oal amosral. Assim, verifica-se que: p i= = = λˆ eˆ λ ˆ eˆ =λˆ ij j j pj j j j j j (9.4)
329 Ferreira, D.F. Esaísica mulivariada 33 por: Logo, a porcenagem da variação oal devida ao j-ésimo faor é dada λˆ j 00 para faores de S Tr(S) %VarExp = λ ˆ j 00 para faores de R p (9.5) O criério (9.5) é usado como um arifício heurísico para deerminar o valor apropriado de m. O número de faores comuns reidos deve aumenar aé que uma fração adequada da variação amosral enha sido conemplada. Exemplo 9.. Em 4 ararugas fêmeas foram mensuradas p = 3 variáveis X, X e X 3, quais sejam, comprimeno, largura e alura de carapaças ransformadas por logarimo. A mariz de covariâncias amosrais é apresenada a seguir. Ober a análise de faores com m = e m = usando o méodo dos componenes principais. 4,980 3,8063 4,7740 S = 3,8063 3,0680 3,783 4,7740 3,783 4,864 Inicialmene foi esada a hipóese:
330 9. Análise de faores 34 σ H : σ ; 0 0 σpp 0 Σ= σii> 0 O valor de qui-quadrado obido foi de χ c = 7,9805 com ν=3 graus de liberdade. Como ( ) Pr χ > 7,9805 = 0, rejeia-se H 0 de independência enre odas as variáveis. Porano, a análise de faores deve ser eficiene. A solução para m = é apresenada a seguir. A solução de faor explica 98,% da variação oal e pode ser julgada saisfaória. A soma de quadrados dos dois úlimos auovalores, dada por λ ˆ +λ ˆ = 0,09, foi considerada 3 muio pequena e indica que a soma de quadrados dos elemenos da mariz de resíduos não deve ulrapassar esse valor. Os resulados obidos são: Variáveis Cargas faoriais F Comunalidades h i Variâncias específicas ψ X,65 4,99 0,068 X,777,9849 0,083 X 3,770 4,7394 0,0870 % explicação 98,500 i A mariz de resíduos é dada por:
331 Ferreira, D.F. Esaísica mulivariada 35 S LL Ψ = 4,980 3,8063 4,7740 = 3,8063 3,0680 3,783 4,7740 3,783 4,864, 65 0, ,777 [,65,777,770 ] 0 0,083 0, , ,08 0,055 = 0,08 0 0,049 0,055 0, A soma de quadrados dos elemenos dessa mariz de resíduos é de apenas 0,0003, que é menor do que 0,09 conforme já era esperado. Para m = a solução é dada por: Cargas faoriais Comunalidades Variáveis F F h i Variâncias específicas ψ X,65 0,630 4,9394 0,048 X,777 0,608 3,008 0,0575 X 3,770-0,935 4,855 0,0003 % explicação acumulada 98,5 99,3 i A soma de quadrados de resíduos para esse caso (m = ) é igual a 0,0049, a qual é limiada por 0,0099. Uma vez que os ganhos foram muio pequenos, o modelo de faor pode ser julgado adequado. O faor pode ser inerpreado como um faor de volume.
332 9. Análise de faores 36 Uma aproximação modificada do méodo dos componenes principais é denominada solução faorial principal. O procedimeno é válido ano para R quano para S. A descrição que é realizada a seguir uiliza a mariz R. No modelo de faores ρ= LL +Ψ é perfeiamene especificado: os m faores comuns reconsiuirão perfeiamene os elemenos fora da diagonal principal de ρ, bem como os elemenos da diagonal com a paricipação da variância específica: = h i +ψ i. Supondo que a conribuição dos faores específicos seja removida da reconsiuição de ρ, enão, a mariz resulane é ρ - Ψ = LL. Suponha, ambém, que esimaivas iniciais ψ * i enham sido obidas por um meio qualquer, enão, é possível definir a mariz de correlação amosral reduzida (R r ) eliminando o efeio dos faores específicos por Rr * = R Ψ. Esse processo é equivalene a subsiuir a diagonal de R por h = ψ. A mariz R r é definida por: * * i i R r h r r * p * r * h rp R = Ψ = * rp rp hp (9.6) Teoricamene, desconsiderando a variação amosral, é possível esabelecer que a mariz R r pode ser recomposa pelos m faores comuns. Dessa forma, R r é faorada em:
333 Ferreira, D.F. Esaísica mulivariada 37 R L L (9.7) * * r r r em que esimadores: * L r é a mariz dos esimadores das cargas faoriais * ij. O méodo faorial principal de análise de faores uiliza os L = λˆ eˆ λˆ eˆ λˆ eˆ ψ = * * * * * * * r m m m * * i ij j= (9.8) em que ( ˆ * * i;eˆ í ) λ, i =,,..., m são os (maiores) pares de auovalor-auoveor obidos de R r. As comunalidades devem ser re-esimadas por: m * * i = ij j= h (9.9) O méodo, enão, é aplicado ieraivamene, considerando as comunalidades esimadas em (9.9) para recalcular a mariz R r em (9.6). Os auovalores e auoveores dessa nova mariz R r são obidos e as esimaivas das cargas faoriais e variâncias específicas uilizando (9.8) são novamene obidas. Novas comunalidades, ambém, são obidas uilizando (9.9) e o processo é repeido em novos eságios sucessivos, aé que não haja alerações nas
334 9. Análise de faores 38 esimaivas das cargas faoriais e das variâncias específicas para uma dada precisão. Um problema que pode surgir nesse procedimeno é o aparecimeno de auovalores de R r negaivos. Recomenda-se uilizar o número de faores comuns igual ao poso da mariz reduzida (R r ). Uma das causas dos auovalores negaivos é devida aos valores iniciais das variâncias específicas uilizadas. Algumas alernaivas exisem para a escolha desses valores iniciais. A mais popular é uilizar ψ = r * ii i, em que r ii é o elemeno da i-ésima diagonal da mariz R -. As comunalidades iniciais são, enão, dadas por: * * hi = ψ i = (9.30) r ii que é igual ao coeficiene de deerminação parcial múliplo enre a i-ésima variável (X i ) e as (p-) demais variáveis. Essa relação é úil, pois permie que h * i seja obida pelo coeficiene de deerminação múliplo, mesmo quando R não iver poso compleo. Usando S, a variância específica inicial é função de S ii, o elemeno da i- ésima posição da diagonal de S -, da seguine forma: m h = S S p * ii i ii (9.3)
335 Ferreira, D.F. Esaísica mulivariada Méodo da máxima verossimilhança Se os faores comuns F e os faores específicos ε possuem disribuição normal, esimaivas de máxima verossimilhança podem ser obidas. Do modelo de faores e da consideração de que as variáveis F e ε possuem disribuição normal pode concluir que X j µ= LF j +ε j disribuído e porano a função de verossimilhança é: ambém é normalmene n/ np / L( µσ, ) = ( π) Σ n exp r Σ ( X j X)( X j X) + n ( X µ )( X µ ) = j = = ( π) Σ exp r Σ S (n )p/ (n )/ n ( ) ( ) p/ / n ( π) Σ exp r X X µ Σ µ (9.3) a qual depende de L e Ψ por meio de Σ = LL +Ψ. Devido à muliplicidade de escolhas para L dadas por ransformações orogonais é imperaivo impor uma resrição de unicidade compuacional por: LΨ L= uma mariz diagonal (9.33)
336 9. Análise de faores 330 Os esimadores de máxima verossimilhança ˆL e ˆΨ devem ser obidos por maximização numérica de (9.3). A maximização de (9.3) sujeia a condição de unicidade (9.33) deve saisfazer: ( ˆ / ˆ / )( ˆ / ˆ) ˆ S L / Lˆ ( ˆ) n Ψ Ψ Ψ =Ψ Ι+ (9.34) Lawley (940, 94, 943) mosra que o esimador ˆ é dado por: ˆ ˆ ˆ ˆ = LΨ L (9.35) Assim, a equação (9.34) pode ser rescria de oura forma, procedendo as seguines operações: ( ˆ / ˆ / / / ) ˆ ˆ ˆ S L Lˆ ( Lˆ ˆ Ψ Ψ Ψ =Ψ Ι+ Ψ Lˆ) n ( n ) ˆ / ˆ / ˆ / ˆ ˆ / ˆ ˆ / ˆ ˆ ˆ ˆ Ψ S Ψ Ψ L Ψ L=Ψ LLΨ L ( n ) ˆ / ˆ / ˆ / ˆ ˆ / ˆ ˆ ˆ ˆ Ψ S Ψ Ι Ψ L=Ψ LLΨ L Logo, ( n ) ˆ / ˆ ˆ / ˆ / ˆ ˆ / ˆ ˆ ˆ ˆ Ψ S Ψ Ψ Ψ L=Ψ LLΨ L (9.36)
337 Ferreira, D.F. Esaísica mulivariada 33 Como ˆ ˆ LΨ Lˆ é uma mariz diagonal para garanir que os elemenos de ˆL sejam únicos, enão, os auovalores de ( S Ψ) Ψ ( Sn ) ˆ ˆ ˆ n ˆ ˆ, e porano / / Ψ Ψ Ψ, são iguais aos valores correspondenes a diagonal de ˆ. Dessa forma, a i-ésima coluna de ao i-ésimo auovalor de ( Sn ) ˆ ˆ ˆ ˆ ˆL / Ψ é o veor caracerísico correspondene / Ψ Ψ Ψ /. O cálculo desses veores não é um processo direo, uma vez que os elemenos de ˆΨ são ambém desconhecidos, os quais devem ser obidos da relação Ψ= ˆ Diag(S LL ˆ ˆ ). Sendo assim, o processo de esimação deve ser execuado ieraivamene esimando-se os veores caracerísicos correspondenes a valores iniciais de os elemenos de ˆΨ, e enão, uilizá-los para ober novas esimaivas mais precisas das variâncias específicas sucessivamene. Para o modelo com m faores os veores caracerísicos correspondenes aos m maiores auovalores de S n podem ser uilizados como valores iniciais do processo ieraivo. Os elemenos desses veores devem ser reescalonados para que as somas de seus quadrados sejam iguais aos respecivos auovalores. O processo ieraivo é descrio a seguir:. Calcular as m raízes caracerísicas ( ˆ 0, ˆ 0,..., ˆ m0 ) caracerísicos correspondenes ( e ˆ,e ˆ,...,eˆ ) λ λ λ de S n e os veores 0 0 m0, de al sore que seus elemenos sejam re-escalonados para que enham norma quadráica igual
338 9. Análise de faores 33 a ˆλ i0, na mariz ˆP 0 apresenada a seguir, com i =,,..., m. Seja a mariz ˆQ (p x m) definida por Qˆ [ eˆ e ˆ... eˆ ] 0 =, sem re-escalonar. Dessa forma, m0 é possível definir as marizes ˆΛ 0 (m x m) e ˆP 0 (p x m) por: ˆ Λ 0 = λˆ λˆ λˆ m0 Pˆ e = Qˆ Λ ˆ / Aproximar as variâncias específicas por: ( Pˆ Pˆ ) Ψ ˆ = Diag S (9.37) 0 n Ober a mariz ( S ) Ψˆ Ψˆ Ψ ˆ (9.38) / / 0 n 0 0 e exrair os m auoveores ( e ˆ,e ˆ,...,eˆ ) ( ˆ, ˆ,..., ˆ m ) m e os correspondenes auovalores λ λ λ dessa mariz. Formar a mariz Qˆ [ eˆ e ˆ... eˆ ] = sem reescalonar e definir as marizes: m
339 Ferreira, D.F. Esaísica mulivariada 333 ˆ Λ = λˆ λˆ λˆ m Pˆ e = Qˆ Λ ˆ / A primeira aproximação de L ( ˆL ) é dada por: L ˆ =Ψ ˆ P ˆ (9.39) / 0 4. Calcular ( Lˆ Lˆ ) Ψ ˆ = Diag S (9.40) n Repeir os passos 3 e 4 aé que os correspondenes elemenos de sucessivas ierações de ˆL i e ˆL i+ não difiram por um valor superior a uma quanidade pré-deerminada (criério de convergência). O resulado final do processo ieraivo conerá as esimaivas de máxima verossimilhança para as cargas faoriais L e das variâncias específicas para o modelo m-faorial. É apresenado a seguir um programa SAS no procedimeno de marizes IML para a obenção de esimaivas de máxima verossimilhança do modelo m-faorial.
340 9. Análise de faores 334 As cargas faoriais e as variâncias específicas da mariz R podem ser obidas direamene de ˆL e ˆΨ realizando as seguines ransformações. Formar a mariz diagonal (D) a parir dos elemenos S ii de S. Enão ober as esimaivas de máxima verossimilhança de R para as cargas faoriais ( ˆL Z ) e para as variâncias específicas ˆΨ Z. Esses esimadores são: ˆ = ˆ (9.4) / LZ D L ˆ D ˆD / / Ψ Z = Ψ (9.4) As esimaivas de máxima verossimilhança das comunalidades são dadas por: h ˆ = ˆ + ˆ ˆ para i =,,..., p (9.43) i i i im
341 Ferreira, D.F. Esaísica mulivariada 335 opions ps=5000 ls=80 nodae nonumber;; proc iml; S={ , , }; p=ncol(s);n=4;alpha=0.05; L0=Diag(eigval(S));P0=eigvec(S); numfac=;numi=00; L0=L0[:numfac,:numfac]; P0=P0[:p,:numfac];P0=P0*roo(L0); prin L0 P0; Psi0=diag(S-P0*P0`); prin psi0; psii=psi0; do i= o numi; Prin ' '; prin 'ieracao ' i; Prin' '; Dela=inv(roo(psii))*(S-psii)*inv(roo(psii)); *prin dela; Li=Diag(eigval(dela));Pi=eigvec(dela); Li=Li[:numfac,:numfac]; Pi=Pi[:p,:numfac]; Pi=roo(psii)*Pi*roo(Li); *prin Li Pi; Psii=diag(S-Pi*Pi`); /*soma de quadrados dos residuos do modelo*/ resi=s-pi*pi`-psii; prin 'Soma de quadrados dos residuos'; SQResiduo=sum(resi#resi); prin sqresiduo; *prin psii; Prin' '; end; Prin 'Solucao final do modelo de faores'; Prin 'Cargas faoriais'; prin Pi; prin 'Variancias especificas'; prin psii; resi=s-pi*pi`-psii; prin 'mariz de residuos'; prin resi; prin 'Soma de quadrados dos residuos'; SQResiduo=sum(resi#resi); prin sqresiduo; prin 'Cargas faoriais de Z-variaveis padronizadas'; D=roo(inv(diag(S))); PiZ=D*Pi; prin PiZ; prin 'Variancias especificas faoriais de Z-variaveis padronizadas'; PsiZ=D*psii*D; prin PsiZ; Li=Diag(eigval(dela)); prin Li; qui;
342 9. Análise de faores 336 Dessa forma, a proporção explicada pelo j-ésimo faor é dada por: p ˆ ij i= Tr(S) %VarExp = p ˆ i= p Z(i j) 00 para faores de S 00 para faores de R (9.44) O processo descrio aneriormene para a obenção das soluções de máxima verossimilhança possui convergência lena. Aiken (937) propôs uma écnica conhecida por processo δ de aceleração dos esquemas ieraivos de convergência. Seja j os elemenos do -ésimo processo ieraivo, referene a j- ésima coluna da mariz de cargas faoriais L do eságio. O processo de Aiken (937) prevê para 3 consecuivos valores de j o ajuse pela razão: ij ij( ) ij = + ij ij(+ ) ij(+ ) ij ij( ) (9.45) em que ij é o i-esimo elemeno de j. Se o denominador de (9.45) for nulo o valor de ij deve ser feio igual a ij. Aiken (937) mosra que os ermos de j convergem mais rapidamene do que àqueles de j.
343 Ferreira, D.F. Esaísica mulivariada 337 Exemplo 9.. Uilizando a mariz de covariâncias amosral das 4 ararugas fêmeas que foram mensuradas em p = 3 variáveis X, X e X 3, as quais são: comprimeno, largura e alura de carapaças ransformadas por logarimo, deerminar o modelo de faores com m =. Ajusar o modelo por meio de esimaivas de máximas verossimilhanças. 4,980 3,8063 4,7740 S = 3,8063 3,0680 3,783 4,7740 3,783 4,864 i) Inicialmene foram obidos os auovalores e auoveores de S e composas as marizes Λ ˆ ˆ 0( ), Q ˆ 0(3 ) e P 0(3 ) por: 0, Λ ˆ 0 =,63747 ˆQ 0 = 0, ,6436,6443 / Lˆ ˆ ˆ ˆ 0 = P0 = Q0Λ 0 =,77603,77344 ii) As variâncias específicas iniciais foram obidas por: ˆ ( ˆ ˆ ) 0, Ψ 0 = Diag Sn P0P 0 = 0 0, , iii) Foi obida a seguine mariz e desa exraídos os auovalores e auoveores. O m = primeiro auovalor e auoveor correspondene foram usados para compor as marizes Λ ˆ ˆ ( ), Q ˆ (3 ) e P (3 ).
344 9. Análise de faores 338 7, , , ˆ S ˆ ˆ 50, , , ( ) / / Ψ0 n Ψ0 Ψ 0 = 6, , , , Λ ˆ = 6,45963 ˆQ = 0, , , / Pˆ ˆ ˆ = QΛ = 5, , Finalmene a primeira aproximação ˆL é feia por:,546 / Lˆ ˆ ˆ =Ψ 0 P =,7606,67934 iv) Foi calculado o segundo valor ˆΨ por: ˆ ( ˆ ˆ ) 0, Ψ = Diag Sn L0L0 = 0 0, ,646 Os procedimenos 3 e 4 foram repeidos 4 vezes aé que as rocas na mariz (veor) ˆL fosse da ordem de e-7 ou menos. O resulado final foi:
345 Ferreira, D.F. Esaísica mulivariada 339,0656 / Lˆ ˆ ˆ 4 =Ψ 40 P4 =,77993, e ( ) ˆ ˆ ˆ 0, Ψ 4 = Diag Sn L4L4 = 0 0, ,6777 A mariz de resíduos (R) foi: 0,9835E-8 3,7474E-8 R =,9835E-8 0-7,05E-8 3,7474E-8-7,05E-8 0 E a soma de quadrados dos resíduos foi: SQResíduos=,453E-4 As cargas faoriais obidas das variáveis padronizadas são: ˆ ˆ 0 0 4,980,0656 0, ,0680, , ,864 / LZ = D L = 0 0,77993 = 0, E as variâncias específicas são:
346 9. Análise de faores 340 ˆ ˆ 0, / / Ψ Z = D Ψ D = 0 0, , Exemplo 9.3. A mariz de correlação enre 0 escores das respecivas 0 provas do declao, medidas em n = 60 aleas, esá apresenada a seguir. Ober os m = 4 faores pelo méodo da máxima verossimilhança. As dez variáveis mensuradas são: i) corrida de 00 m rasos; ii) salo em disância; iii) lançameno de peso; iv) salo em alura; v) corrida dos 400m livres; vi) 0 m com barreiras; vii) arremesso de disco; viii) salo com vara; ix) arremesso de dardos; e x) corrida de 500 m. A mariz de correlação dos escores dos 60 compeições.,00 0,59 0,35 0,34 0,63 0,40 0,8 0,0 0, 0,07,00 0,4 0,5 0,49 0,5 0,3 0,36 0, 0,09,00 0,38 0,9 0,36 0,73 0,4 0,44 0,08,00 0,9 0,46 0,7 0,39 0,7 0,8,00 0,34 0,7 0,3 0,3 0,39 R =,00 0,3 0,33 0,8 0,00,00 0,4 0,34 0,0,00 0,4 0,7,00 0,00, 00 A solução de m = 4 faores, dada por Johnson e Wichern (998), foi obida pelo algorimo apresenado nesse maerial por meio das esimaivas de máxima verossimilhança. Após 00 mil ierações o algorimo convergiu.
347 Ferreira, D.F. Esaísica mulivariada 34 Esimaivas de máxima verossimilhança Cargas faoriais esimadas Variáveis F F F 3 F 4 Variâncias específicas ψ ˆ = hˆ i i Corrida 00m -0,0869 0,3449 0,890-0,685 0,57935 Salo em disância 0,0688 0,435 0,593 0,746 0, Lançameno de peso -0,94 0,99-0,0038-0,0007 0,00053 Salo em alura 0,603 0,4059 0,3343 0,445 0, corrida 400m 0,3787 0,437 0,670-0,37 0,396 0m com barreira -0,078 0,369 0,434 0,3878 0,53830 Arremesso de disco -0,0563 0,794 0,068 0,08 0,46385 Salo com vara 0,573 0,640 0,75 0,3937 0, Arremesso de dardos -0,08 0,44-0,05 0,097 0, m rasos 0,9986 0,0496-0,0004-0,000 0, Proporção cumulaiva da variância explicada 0, 0,37 0,55 0,6
348 9. Análise de faores Roação faorial A faoração de Σ em LL +Ψ não é única, conforme discussão realizada na seção 9.. A pós-muliplicação da mariz de cargas faoriais L por qualquer mariz orogonal conformável (T) conduz a uma faoração igualmene válida. A solução numérica de Rao-Maxwell para as equações de verossimilhança remove essa indeerminação por adoar a resrição de que ˆ ˆ LΨ Lˆ seja uma mariz diagonal. Não obsane, após a obenção da solução de máxima verossimilhança, qualquer ransformação orogonal pode ser realizada. A idéia é aplicar al ransformação rígida dos eixos coordenados, a qual conduz a um padrão que ornam as cargas faoriais mais facilmene inerpreáveis. Essa roação rígida dos eixos coordenados das m-dimensões faoriais é chamada de roação das cargas faoriais. Ciado por Morrison (974) Thursone sugere um criério de resposa de simples esruura para a realização da roação faorial. Esruuras como a sugerida raramene exise em dados reais e não será descrio o procedimeno de Thursone. Oura écnica de uso limiado é a obenção de roação graficamene dos faores ploados dois a dois. A roação analíica é o procedimeno mais comumene empregado. Na roação orogonal rígida as propriedades esaísicas dos faores ficam inaleradas, embora a mariz de cargas faoriais não seja a mesma. Supondo que a mariz p x m de cargas faoriais seja submeida a uma roação rígida pela mariz orogonal T (m x m) por meio da seguine operação:
349 Ferreira, D.F. Esaísica mulivariada 343 * L = LT. A orogonalidade de T, iso é, TT = TT = Ι, faz com que as comunalidade fiquem inaleradas: m m * * ij = ij hi = hi j= j= bem como a soma de seus quadrados: p m p m p m m 4 ij = ij + ij ik i= j= i= j= i= j= k= j+ (9.46) ambém é invariane. Com esse resulado em evidência é possível especificar criérios de simplicidade ou parcimônia proposos pelos analisas de faores (Morrison, 976). Fergusson (954) sugeriu minimizar o ermo dos duplos produos de (9.46) como uma medida de parcimônia, por meio de uma escolha adequada de T. Esse resulado foi deerminado quase que ao mesmo empo e independenemene por Carroll (953). Neuhaus e Wrigley (954) propuseram a maximização da variância do quadrado das pm cargas faoriais para definir T. A variância do quadrado das cargas faoriais é: p m p m 4 V = ij ij (9.47) i= j= pm i= j= Como o ermo de correção é meramene soma das comunalidades omada ao quadrado, enão, a maximização de V é equivalene a maximizar a
350 9. Análise de faores 344 soma da quara poência das cargas faoriais, ou equivalenemene, minimizar a medida de parcimônia de Fergusson (954) e Carroll (953). Por argumenos diferenes Sanders (960) obeve o mesmo criério de Neuhaus e Wrigley (954). Esse criério deermina o méodo denominado de quarimax por maximizar a soma da quara poencia das cargas faoriais. Kaiser (958, 959) propôs uma medida de esruura simples relacionada a soma das variâncias das cargas faoriais quadráicas denro de cada coluna da mariz L de faores. O criério de varimax de linha de Kaiser é: v m p p * 4 = p ij ij p j= i= i= (9.48) Esse criério dá pesos iguais às resposas com grandes e com pequenas comunalidades e Kaiser sugere a melhora desse criério pelo uso do criério alernaivo: em que: v= p x x m p p 4 ij ij p j= i= i= (9.49) x ij = m ij j= ij (9.50)
351 Ferreira, D.F. Esaísica mulivariada 345 é j-ésima carga faorial do i-ésima variável resposa dividida pela raiz quadrada de sua comunalidade. Na seqüência da roação os valores de x ij devem ser muliplicados pela raiz quadrada de sua comunalidade respeciva para resaurar a dimensão original. Esse criério foi nomeado por Kaiser de varimax. O processo compuacional para a roação varimax é descrio a seguir. Considere o par de faores r e s, com cargas normalizadas x ir e x is. A roação desses faores envolve o simples ângulo φ, e diferenciando (9.49) com relação a φ Kaiser mosrou que o ângulo deve saisfazer a relação: p p p p ( xir xis ) xirxis ( xir xis ) xirxis i= i= i= g( φ ) = p p p p ( xir xis ) ( xirxis ) ( xir xis ) xirxis i= i= i= (9.5) Para que a segunda derivada seja negaiva é necessário que 4φ seja colocado no quadrane correo. A escolha é designada pelos sinais do numerador e denominador de (9.5). A Tabela 9. especifica o quadrane de 4φ em função deses sinais. A solução ieraiva para a roação é realizada de acordo com os seguines procedimenos: a roação do primeiro e segundo faor é realizada como ângulo φ deerminado conforme descrição anerior; o novo primeiro faor é roado
352 9. Análise de faores 346 com o erceiro faor original, e assim por diane, aé que m(m-)/ pares de roações enham sido execuadas. Essa seqüência de roações é repeida aé que odos os ângulos sejam menores que um criério de convergência especificado ε, denro de um ciclo. Tabela 9.. Quadrane do ângulo 4φ em função dos sinais do numerador e denominador da equação (9.5). Sinal do numerador Sinal do denominador + (posiivo) - (negaivo) + (posiivo) Ι: 0 0 4φ<90 0 ΙV: φ<0 0 - (negaivo) ΙΙ: φ<80 0 ΙΙΙ: φ<-90 0 Exemplo 9.4. Efeuar a roação varimax dos m = 3 faores obidos por Morrison (974) apresenados a seguir. (incompleo) 9.5. Tese da fala de ajuse do modelo de faores A naureza das esimaivas de máxima verossimilhança das cargas faoriais conduz a um ese formal para o m-ésimo modelo faorial. A hipóese nula é:
353 Ferreira, D.F. Esaísica mulivariada 347 H 0 : Σ= LL +Ψ H: Σ umamarizp pp.d.sim. (9.5) Usando a disribuição de Wishar, Morrison (976) mosra que a razão de verossimilhança fornece o seguine ese, com a correção de Barle (954): ˆˆ ˆ (p 4m 5) LL Ψ χ c = n ln 6 Sn (9.53) o qual em disribuição qui-quadrado para grandes amosras com: (p m) p m ν= (9.54) graus de liberdade. Pela propriedade da invariância das cargas e das variâncias específicas esimadas segue-se que o valor do ese seria o mesmo da solução de faores da mariz de correlação R. Para a aplicação do ese da fala de ajuse é necessário que os graus de liberdade sejam posiivos. Isso significa que o número de faores comuns m não pode exceder o maior ineiro que saisfaz a equação: ( ) m< p+ 8p+ (9.55)
354 9. Análise de faores 348 O ese de razão de verossimilhança compara as variâncias generalizadas ˆˆ ˆ LL +Ψ e S n. Se m for pequeno em relação a p, geralmene H 0 é rejeiada, conduzindo a um modelo com um maior número de faores comuns. Por ouro lado, quando m for grande em relação a p, a hipóese ende a ser não rejeiada, principalmene para grandes valores de n. Isso aconece devido ao fao de ˆˆ ˆ LL +Ψ aproximar de S n, de al sore que o acréscimo de novos faores não raga novas melhoras ao modelo. A diminuição de m pode, ainda, pelas mesmas razões levar a não rejeição de H 0. Algum ipo de bom sendo deve ser aplicado na escolha de m. Para demonsrar que a padronização das variáveis não afea o ese apresenado seja / D definida aneriormene a mariz diagonal com o recíproco dos desvios padrões das p variáveis na diagonal principal. Enão, a razão que aparece na equação (9.53) pode ser operada por: LL ˆˆ +Ψ ˆ D LL ˆˆ +Ψˆ D = S D S D / / n / / n uma vez que a muliplicação do numerador e denominador não alera o resulado final. Pela propriedade do deerminane AB = A B, verifica-se que:
355 Ferreira, D.F. Esaísica mulivariada 349 LL ˆˆ +Ψ ˆ D LL ˆˆD + D Ψ ˆD Lˆ Lˆ +Ψˆ = = S D S D R / / / / Z Z z n / / n Dessa forma o ese de qui-quadrado é exaamene o mesmo, quando for aplicado a parir da mariz S n ou da mariz R, com os dados padronizados Escores faoriais Os faores são variáveis não observáveis, muio embora seus valores possam ser esimados. Os valores esimados dos faores são denominados de escores. Dois méodos de esimação são proposos. Ambos raam as cargas faoriais e as variâncias específicas esimadas como se fossem os verdadeiros valores desconhecidos. Se ocorrer roação, os escores são obidos a parir das cargas faoriais que sofreram roação e não a parir das originais. Não obsane, as fórmulas não disinguirão enre as siuações em que ocorreu roação daquelas em não ocorreu, uma vez que esas fórmulas não são aleradas pelas roações.
356 9. Análise de faores Méodo dos mínimos quadrados ponderados Suponha que µ, L e Ψ sejam considerados inicialmene como conhecidos para o modelo faorial: X µ= LF+ε Como Var(ε i )=ψ i, não necessariamene igual para odo i, Barle (937) sugeriu o uso dos quadrados mínimos ponderados, usando como peso o recíproco das variâncias específicas. A soma de quadrados de resíduos do modelo faorial ponderada é dada por: p ( X LF) ( X LF) ε i =εψ ε= µ Ψ µ i= ψi (9.56) Barle (937) propôs a solução ˆF que minimiza (9.56). A solução é: ( ) ( ) ˆF= LΨ L LΨ X µ (9.57) Como, de fao, L, Ψ e µ são desconhecidos, os respecivos esimadores devem ser uilizados para a obenção dos escores faoriais:
357 Ferreira, D.F. Esaísica mulivariada 35 ( ) ( j ) Fˆ ˆ ˆ ˆ ˆ ˆ j = L Ψ L L Ψ X X j =,,..., n (9.58) Se a mariz de correlação for uilizada, enão: ( ) ˆ ˆ ˆ ˆ ˆ ˆ Fj = LZΨZLZ LZΨ Z Z j j =,,..., n (9.59) Se as cargas faoriais que sofreram roação são usadas Lˆ * = LT ˆ, enão, ˆF j se relaciona com * ˆF j por: Fˆ * j = T'Fˆ (9.60) j Méodo de regressão A parir do modelo de faores originais: X µ= LF+ε Considerando que L e Ψ são conhecidas, e que F e ε possuem disribuição normal mulivariada com média e variâncias dadas pelas equações de
358 9. Análise de faores 35 (9.3) a (9.6), a combinação linear X µ= LF+ε disribuição conjuna de X µ e F é, ambém, N * m p( 0, + Σ ) em disribuição N ( p 0,LL +Ψ) ; em que:. A * Σ = LL +Ψ L L Ι (9.6) A média 0 é um veor [(m+p) ] de zeros. A disribuição condicional de F/x é normal com média e variância dados por: e ( ) = Σ ( µ ) = ( +Ψ) ( µ ) E F/x L x L LL x ( ) =Ι Σ =Ι ( +Ψ) Cov F/x L L L LL L (9.6) (9.63) Os coeficienes L ( LL ) +Ψ são os coeficienes de uma regressão mulivariada dos faores com as variáveis originais. As esimaivas desses coeficienes produzem os escores faoriais. Dados as observações X j e omandose os esimadores de máxima verossimilhança ˆL e ˆΨ os escores dos faores são dados por: ( ) ( j ) ˆ ˆ ˆ ˆ ˆ j F = L LL +Ψ X X j =,,..., n (9.64)
359 Ferreira, D.F. Esaísica mulivariada 353 O uso da idenidade de marizes: ( ) ( ) Lˆ LL ˆ ˆ + Ψ ˆ = Ι+ Lˆ Ψˆ Lˆ Lˆ Ψ ˆ (9.65) pode simplificar o cálculo dos escores dos faores, os quais são dados por: ( ) ( j ) Fˆ ˆ ˆ ˆ ˆ ˆ j = Ι+ L Ψ L L Ψ X X j =,,..., n (9.66) A comparação dos escores faoriais obidos por regressão (LS) e por mínimos quadrados ponderados (WLS) pode ser realizada subraindo os esimadores (9.66) e (9.58). Assim, simbolizando os esimadores de regressão por LS ˆF j e o de mínimos quadrados ponderados por ˆF WLS j e usando a idenidade de mariz dada por: ( ) ( ) Lˆ LL ˆ ˆ + Ψ ˆ = Ι+ Lˆ Ψˆ Lˆ Lˆ Ψ ˆ Tem-se: ( ) ( ) ( Lˆ ˆ Lˆ ) Fˆ Lˆ ˆ Lˆ Lˆ ˆ Lˆ Fˆ Fˆ WLS LS LS j = Ψ Ι+ Ψ j = Ψ +Ι j ( ˆ ˆ L Lˆ) Pelas esimaivas de máxima verossimilhança verifica-se que Ψ é uma mariz diagonal e quando o seu valor for próximo de zero os
360 9. Análise de faores 354 esimadores aneriores serão aproximadamene os mesmo, ou seja, os esimadores aneriores fornecerão aproximadamene os mesmos escores Exercícios Tese a hipóese de que o modelo com m = faor, apresenado no exemplo 9., é adequado uilizando o ese de qui-quadrado para fala de ajuse do modelo Para o exemplo 9.3 esar a aderência do modelo com m = 4 faores Ober esimaivas de máxima verossimilhança para m = e m = dos dados apresenados no exemplo e calcular os escores pelos dois méodos apresenados. Para o caso de m = faores ploar os escores dos dois faores obidos.
361 [ 0 ] Análise de correlação canônica 0.. Inrodução A análise de correlação canônica é cenrada na idenificação e quanificação da associação enre dois grupos de variáveis. O foco da correlação canônica é direcionado para a correlação enre uma combinação linear das variáveis em um dos grupos com uma oura combinação linear das variáveis do ouro grupo de variáveis. A idéia fundamenal é, a princípio, deerminar as combinações lineares dos dois grupos que possuem a maior correlação. No próximo eságio, é deerminado o par de maior correlação que seja, ainda, não correlacionado com o par selecionado inicialmene. O processo coninua aé se esgoar as dimensões de ambos os grupos ou do menor grupo. Os pares de combinações lineares são denominados de variáveis canônicas e suas correlações são chamadas de correlações canônicas. A écnica de enconrar essas combinações lineares e suas respecivas correlações é devida a Hoelling (935 e 936).
362 0. Análise de correlação canônica 356 A idéia fundamenal é enconrar relações enre dois conjunos de variáveis, em ala dimensão, em poucos pares de variáveis canônicas. Várias aplicações nas ciências humanas, na genéica enre ouras áreas são enconradas na lieraura. 0.. Variáveis canônicas e correlação canônica populacionais Seja X um veor de dimensão (p+q x ), o qual possui mariz de covariância Σ e média µ. Sejam os veores X () (p x ) e X () (q x ) definidos como sendo originados de uma parição do veor original X, represenando um grupo com p variáveis e ouro com q, respecivamene. Sem perda de generalidade é assumido que p q. Pressupõe-se, ambém, que Σ possui elemenos finios e é posiiva definida. Para o veor aleaório X, os seguines resulados são apresenados. X X X X = = () () () () X p () () X X () X X () q (0.)
363 Ferreira, D.F. Esaísica mulivariada 357 Cuja média é: () µ µ= E(X) = () µ (0.) E cuja mariz de covariância é: p q ( )( ) p Σ Σ Σ= E X µ X µ = q Σ Σ (0.3) Assim, para os veores X () (p x ) e X () (q x ) verifica-se que: () () () ( ) Cov( X ) E X = µ =Σ () () () E( X ) = µ Cov( X ) =Σ () () Cov( X, X ) =Σ =Σ (0.4) As covariâncias enre pares de variáveis perencenes aos dois grupos, uma de X () e oura de X (), esão conidas em Σ. Dessa forma, os pq elemenos de Σ medem a associação enre os dois grupos. Se ambos os valores de p e q são grandes, a inerpreação simulânea desse conjuno de covariâncias é uma arefa difícil e na maioria das vezes infruífera. Como a finalidade, em geral, é
364 0. Análise de correlação canônica 358 de realizar predição ou realizar comparação, o ineresse pode ser focado em combinações lineares das variáveis originais. A idéia é, porano, concenrar a aenção em algumas poucas combinações lineares de variáveis perencenes a X () e a () X, ao invés de uilizar odas as pq covariâncias conidas em Σ. Seguindo a noação normalmene uilizada na lieraura especializada, sejam as variáveis U e V combinações lineares das variáveis de X () e de X (), respecivamene, definidas por: U= a X V= b X () () sendo a e b veores não nulos dos coeficienes dessas combinações lineares. (0.5) Assim, () ( ) () ( ) ( ) Var(U) = Cov a X = a Σ a Var(V) = Cov b X = b Σ b = = Σ () () Cov(U, V) a Cov X, X b a b (0.6) A correlação enre U e V é definida por: Corr(U, V) =ρ = U, V a Σ b a Σa b Σb (0.7)
365 Ferreira, D.F. Esaísica mulivariada 359 Hoelling (935 e 936) propôs esabelecer os pares (U i, V i ), i=,,..., p, deerminando os veores a i e b i que maximizam (0.7). As variáveis U i e V i são denominadas de variáveis canônicas e a correlação enre elas de correlação canônica. Na seqüência são apresenados os resulados necessários para a maximização de (0.7) e, porano, para a obenção das variáveis canônicas e de suas correlações. resrições: Para deerminar o máximo de ρ U,V, inicialmene são imposas as a Σ a = b Σ b= (0.8) A mudança de escala imposa pelas resrições (0.8) não afea a correlação (0.7). Para ober o máximo de ρ U,V é preciso derivar a equação (0.7) com relação aos veores a e b e igualar as derivadas parciais a zero. As equações obidas são: ρu,v / / 3/ = ( b Σb) ( a Σa) Σ b+ ( a Σb)( a Σa) Σa a U,V / / 3/ ρ = ( a Σa) ( b Σb) Σ a+ ( a Σb)( b Σb) Σb b (0.9) Igualando as derivadas parciais de (0.9) a zero e impondo as resrições (0.8), rearranjando alguns ermos, obém-se:
366 0. Análise de correlação canônica 360 ( ) a Σb Σ a+σ b= 0 Σ a ( a Σ b) Σ b = 0 (0.0) É fácil observar que (0.7) sujeia as resrições (0.8) se orna igual a ρ = a Σ U, V b, que é o valor máximo, enão: ρu, VΣ a+σ b= 0 Σ a ρ U, V Σ b = 0 (0.) Assim, para solução de (0.) é necessário que o deerminane dos coeficienes do sisema de equações homogêneas seja nulo. Logo, ρ Σ Σ = 0 U, V Σ ρu, VΣ (0.) Uma imporane propriedade dos deerminanes é reproduzida a seguir. Seja uma mariz A com as seguines parições: A A A = A A (0.3)
367 Ferreira, D.F. Esaísica mulivariada 36 O deerminane de A, se A e A são não singulares, é dado por: A = A A A A A ou A = A A A A A (0.4) Uilizando o resulado (0.4) no deerminane (0.), obém-se os seguines resulados para a primeira equação: ρ Σ ρ Σ + Σ Σ Σ = 0 U, V U, V ρu, V Como ρu, VΣ é diferene de zero, pois Σ é posiiva definida, enão, o deerminane anerior só será zero se: ρ Σ + Σ Σ Σ = 0 U, V ρu, V Como o resulado dessa equação é zero, não há aleração se ambos os ermos da equação à esquerda da desigualdade for muliplicado por ( ρ U, V ). Se procede da mesma forma para a segunda equação do deerminane de (0.4). O resulado final dessa derivação é:
368 0. Análise de correlação canônica 36 ΣΣΣ ρu,vσ = 0 Σ Σ Σ ρ U,V Σ = 0 (0.5) Fazendo λ=ρ U,V, verifica-se que as equações deerminanais de (0.5) podem ser visas como maximização de pares de formas quadráicas (capíulo ) do ipo: resrio a ebe =. seguine forma: eae λ= ebe Assim, os resulados de (0.5) podem ser reescrios (capíulo ) da ( ) Σ Σ Σ λσ a = 0 (a) ( Σ Σ Σ λσ ) b = 0(b) (0.6) A resolução do sisema de equações pode ser feia aplicando uma ransformação linear não singular. Isso é ilusrado doravane com a equação (a) de (0.6). Seja Σ / a mariz raiz quadrada de Σ e considere a ransformação linear c=σ a /, enão, / a =Σ c. Se a equação (a) for pré-muliplicada por / Σ e a for subsiuído por a =Σ / c, enão:
369 Ferreira, D.F. Esaísica mulivariada 363 ( ) Σ Σ Σ Σ λσ Σ = / / c 0 / / / / ( ) Σ ΣΣΣΣ λσ ΣΣ c= 0 equações homogêneas: Enão a solução de (a) é dada pela solução do seguine sisema de / / ( ) Σ ΣΣΣΣ λι i ci = 0 (0.7) A solução de (0.7) é facilmene obida pelo cálculo dos auovalores (λ i ) e auoveores ( ) i c de Σ Σ Σ Σ Σ. Os auovalores (λ i ) dessa mariz são / / os mesmos do sisema não ransformados por serem invarianes com relação a ransformações não singulares, no enano, os auoveores são afeados pela ransformação. Dessa forma, os auoveores devem ser recuperados pela ransformação linear inversa a efeuada. Assim, a =Σ c / i i (0.8) Traameno igual é dado para a equação (b) de (0.6), agora efeuando a ransformação linear d =Σ / b. Enão,
370 0. Análise de correlação canônica 364 / / ( ) Σ ΣΣΣΣ λι i di = 0 (0.9) Os auoveores bi, soluções almejadas, são recuperados por: b =Σ d / i i (0.0) O máximo é obido subsiuindo essas soluções em (0.7). Logo, a Σb Max( ρ U, V ) = = a Σ b a,b a Σa b Σb ( a ) b λ= Σ Da equação (0.0), sabendo que, logo: ρ = a Σ b= λ U, V i, verifica-se que ( ) Max a,b ρ = λ U, V i (0.) As variáveis canônicas êm as seguines propriedades: ( ) Var(U ) = Cov a X = a Σ a = c Σ Σ Σ c = c c () / / i i i i i i i i
371 Ferreira, D.F. Esaísica mulivariada 365 Sabendo que ci é um auoveor de procedendo da mesma forma para Var(V i ) verifica-se que: Σ Σ Σ Σ Σ com norma, e / / ( ) ( ) Var U = Var V = (0.) i i A Cov( U k, U ) com (k ) é dada por: ( ) ( ) Cov U k, U () () = Cov a kx, ax = a kσ a = / / = ckσ ΣΣ c = ckι c = ckc = 0(k ) Logo, ( ) = ( ) = ( ) Cov U k, U Corr U k, U 0 k Cov V k, V Corr V k, V 0 k ( ) = ( ) = ( ) (0.3) Finalmene, a covariância enre U k e V com ( k ) é dada por: ( ) ( ) () () Cov U k, V = Cov a kx, bx = a kσ b = / / = ckσ ΣΣ d = 0 (k ) Logo,
372 0. Análise de correlação canônica 366 ( ) = ( ) = ( ) Cov U, V Corr U, V 0 k (0.4) k k Para variáveis padronizadas () () () () Z = Z Z Z p e () () () () Z = Z Z Z q as variáveis canônicas são dadas por: U = a Z = c ρ Z V = b Z = d ρ Z () / () k k k () / () k k k (0.5) em que c k e d k são os auoveores de norma das marizes ρ ρ ρ ρ ρ e / / ρ ρ ρ ρ ρ, respecivamene. Os auoveores originais devem ser / / recuperados por: a =ρ b =ρ c / k k d / k k (0.6) em que: ρ (p x p), ρ (p x q) e ρ (q x q) são parições de ρ (p + q x p + q) dadas por: p q p ρ ρ ρ= E( ZZ ) = q ρ ρ (0.7)
373 Ferreira, D.F. Esaísica mulivariada 367 de forma que: () () ( ) ( ) E Z = 0 Cov Z =ρ () () E( Z ) = 0 Cov( Z ) =ρ () () Cov( Z, Z ) =ρ =ρ (0.8) são dadas por: As correlações canônicas das combinações lineares padronizadas Corr(U, V ) a ρ k k k k = = λ k akρak bkρbk b (0.9) em que λ k é k-ésimo auovalor de ρ ρ ρ ρ ρ, ou equivalenemene de / / ρ ρ ρ ρ ρ. / / Por se raarem de variáveis arificiais, as variáveis canônicas não possuem significado físico. Se X () (p x ) e X () (q x ) são uilizados, os () coeficienes de a e b êm as unidades dos correspondenes coeficienes de X e () de X. Se as variáveis padronizadas forem uilizadas, enão, os coeficienes canônicos não possuem unidades de mensuração e não dependem da escala das variáveis. Em geral, é dada uma inerpreação subjeiva para as variáveis canônicas de acordo com a magniude das correlações das variáveis originais com
374 0. Análise de correlação canônica 368 as variáveis canônicas em foco. Muios pesquisadores preferem fazer al relacionameno uilizando os coeficienes canônicos esandardizados. Sejam A (p x p) e B (q x q) marizes definidas pelos veores canônicos: a b a b A = e B= ap bq (0.30) simulaneamene por: É possível definir os veores de odas as p ou q variáveis canônicas U V U = = = V U AX e V = BX Up Vq () () (0.3) Logo, (, () ) ( (), () ) ( () ) Cov U = = = Σ X Cov AX X ACov X A (0.3) A mariz de correlação enre as p variáveis originais de X () e as p variáveis canônicas de U é dada pela covariância enre as p variáveis canônicas,
375 Ferreira, D.F. Esaísica mulivariada 369 as quais já são esandardizadas, e as p variáveis de X () padronizadas. A padronização de X () é dada por: V σ 0 0 () () X 0 0 () / () () X X = σ () Xp 0 0 () σpp (0.33) Assim, ( ) ( ) () () / () / ρ () = Corr U, =,, = Σ X UX Cov AX V X A V (0.34) () (, ) VX que resula em: () () Cálculo semelhane é realizado para os pares ( UX, ), (, ) VX e / ρ () = AΣ, V ( p q) UX ρ = B Σ V ( q q) () VX, / () VX, ρ = Σ / B V ( q p) (0.35) em que V é uma mariz diagonal (q x q) com o i-ésimo elemeno dado por / () / σ ii.
376 0. Análise de correlação canônica 370 Para as variáveis canônicas calculadas de marizes de correlação ρ, a inerpreação pode ser realizada alernaivamene pelas correlações enre as variáveis canônicas e as variáveis padronizadas. Sejam A Z (p x p) e B Z (q x q) marizes composas dos coeficienes canônicos de Z () e () Z, respecivamene. As correlações enre as variáveis canônicas e as variáveis padronizadas são dadas por: ρ = A ρ ; ρ = B ρ ρ = A ρ ; ρ = B ρ () () UZ, Z VZ, Z () () UZ, Z VZ, Z (0.36) As marizes de correlação (0.34), (0.35) com (0.36), apresenam, no enano, os mesmos valores numéricos, como por exemplo ρ () = ρ, e () assim por diane. Verifica-se facilmene isso por: UZ, UX, ρ = A Σ V = AV V Σ V = A ρ = ρ / / / / () () UX, Z UZ, ou seja, a correlação não é afeada pela padronização (mudança de escala).
377 Ferreira, D.F. Esaísica mulivariada Variáveis e correlações canônicas amosrais variáveis aleaórias X () Uma amosra aleaória de amanho n em cada conjuno de (p + q) (p x ) e () X (q x ), dada por () () () X, X,, X possui veores de médias amosrais dados por: n () () () X, X,, X e n () X () () X X p X = = () () X X () Xq (0.37) Em que: X X e X X n n () () () () = j = j n j= n j= (0.38) A mariz de correlação amosral S (p + q x p + q) é dada por: S p S = q S S p q S (0.39)
378 0. Análise de correlação canônica 37 n ( k) ( k) ( ) ( ) em que Sk = ( Xj X )( Xj X ) n j=, k, =,. combinações lineares: As k-ésimas variáveis canônicas amosrais são dadas pelas Uˆ ˆ k = a X ˆVk () k = bˆ X () k (0.40) que maximizam a k-ésima correlação canônica amosral dada por: âs k b ˆ k r U ˆ ˆ = k,v (0.4) k asa ˆ ˆ ˆ ˆ k k bs k bk O processo de maximização de (0.4) segue esriamene os mesmos passos da maximização de (0.7), subsiuindo apenas Σ, Σ e Σ por S, S e S, respecivamene. As equações homogêneas correspondenes ao máximo são dadas por: ( ˆ ) SSS λ ks aˆ k = 0 (a) ( S ˆ SS λ ks ) bˆ k = 0 (b) (0.4)
379 Ferreira, D.F. Esaísica mulivariada 373 Em que o máximo de r é dado por uˆ, ˆ ˆλ, para os auoveores aˆ k V k k k e ˆ k b obidos por: / aˆk = S ˆ c k (a) ˆ / b ˆ k = S d k (b) (0.43) sendo que ĉ k é k-ésimo auoveor de S S S S S / / e ˆd k o k-ésimo auoveor de S S S S S / / ; ˆλ k é o k-ésimo auovalor de ambas as marizes, por serem idênicos; k=,,..., p q. As variáveis canônicas amosrais êm as seguines propriedades:. Variâncias amosrais uniárias ( ˆ ) ˆ k ( ˆ k) Var ˆ U = Var V = (0.44). Correlações amosrais: r = r = r = 0 (k ) (0.45) U ˆ k;u ˆ ˆ ˆ ˆ ˆ V k;v U k;v 3. Correlação amosral máxima: r = λ ˆ (0.46) U ˆ ˆ k k;vk
380 0. Análise de correlação canônica 374 canônicos amosrais: Sejam as marizes Â(p p) e ˆB(q q) definidas pelos veores ˆ aˆ b ˆ ˆ ˆ a ˆ b A = e B= aˆ ˆ p b q (0.47) Analogamene a (0.3) definem-se: Uˆ ˆ V ˆ ˆ ˆ U ˆ ˆ V U= AX e V BX ˆ = = = Uˆ ˆ p V q () () (0.48) As correlações enre as variáveis canônicas amosrais e as variáveis originais de cada um dos grupos podem ser obidas. Para isso definiu-se as marizes diagonais ( ) / () D = Diag / Sii, (pxp) e D ( ) / () Diag / Sii =, (qxq).. Mariz de correlações enre Û e X () R = AS ˆ D / ˆ () U, X (0.49)
381 Ferreira, D.F. Esaísica mulivariada 375. Mariz de correlações enre Û e X () R = AS ˆ D / ˆ () U, X (0.50) 3. Mariz de correlações enre ˆV e X () R = BS ˆ D / ˆ () V, X (0.5) 4. Mariz de correlações enre ˆV e X () R = BS ˆ D / ˆ () V, X (0.5) correspondenes são: Para variáveis padronizadas, as variáveis canônicas Uˆ ˆ V ˆ ˆ ˆ U ˆ ˆ V U= A Z e V Bˆ = = = Z Uˆ ˆ p V q () () Z Z (0.53) em que: Aˆ = AD ˆ e Bˆ = BD ˆ (0.54) Z / / Z
382 0. Análise de correlação canônica 376 Sendo que aˆ z e b ˆ z, para as variáveis padronizadas, são obidos da mesma forma que os respecivos veores para variáveis não padronizadas, subsiuindo-se nas expressões correspondenes S, S e S por R, R e R, respecivamene. A relação (0.54) se verifica para o caso de variáveis canônicas, mas não se pode esabelecer a mesma relação para os componenes principais de mariz de covariância e mariz de correlação, como aponado por Johnson e Wichern (998). As marizes de correlações enre as variáveis de cada grupo padronizadas e as respecivas variáveis canônicas são dadas por: ˆ ˆ R ˆ () = AZR = A ˆ Z R ˆ () = B U,Z V,Z ZR R = Aˆ R R = Bˆ R = Bˆ ˆ () Z ˆ () U,Z V,Z Z Z (0.55) Da mesma forma, é fácil verificar que as correlações não são afeadas pela padronização, ou seja, as correlações obidas em (0.49) a (0.5) são as mesmas as correspondenes em (0.55). Uma imporane avaliação da qualidade do poencial das variáveis canônicas é medir o poder de resumo da variabilidade conida respecivo conjuno. Duas formas básicas são descrias: na primeira apresena-se uma mariz de erro da aproximação e na segunda calcula-se a proporção da variância explicada pelas variáveis canônicas para cada grupo de variáveis.
383 Ferreira, D.F. Esaísica mulivariada 377 As marizes de erro são obidas como se segue, admiindo as definições ˆ ˆ = () U AX e ˆ = ˆ V BX (). Logo, é possível definir: = ˆ ˆ = ˆ ˆ X () A U e X () B V (0.56) Como  e ˆB são dadas por: ˆd ĉ ĉ ˆ () / / () / d / Aˆ = Pˆ S = S e Bˆ = Pˆ S = S cˆ p dˆ p (0.57) Enão: Aˆ = S Pˆ e Bˆ = S Pˆ (0.58) / () / () devido a () ˆP e () ˆP serem marizes orogonais de auoveores, é fácil perceber que ( Pˆ () ) = Pˆ () e ( Pˆ ) = Pˆ. () () Das definições de Û e ˆV sabe-se que a covariância enre eles é uma mariz diagonal ˆΛ (pxq) com ˆλ k na k-ésima diagonal para k=,,...p, e cujas demais p-q colunas são formadas de zeros. Assim,
384 0. Análise de correlação canônica 378 ( ) ˆ ˆ ˆ ˆ ˆ () / / () Cov ˆ U, V = AS ˆ ˆ B = P S SS P =Λ Cov ˆ ( Uˆ ) = AS ˆ ˆ A =Ι Cov ˆ ( Vˆ ) BS ˆ Bˆ = =Ι (0.59) Assim, ˆ ˆ ˆ AS B =Λ S Bˆ = Aˆ Λˆ ( ) S = Aˆ Λˆ Bˆ Da mesma forma: ˆ ( ) ˆ = e ˆ ( ˆ S ) = B B S A A A idéia é reer um número r menor ou igual a p de variáveis canônicas em cada grupo. O número r é escolhido de deerminada forma que a covariância amosral denro de grupo seja reproduzida de uma forma saisfaória. Da mesma forma é desejável uma boa aproximação das covariâncias enre grupos S. Sejam, enão, as marizes composas das r (r p) primeiros auovalores e auoveores de S S S S S / / e de S S S S S / / definidas por:
385 Ferreira, D.F. Esaísica mulivariada 379 ĉ ˆ () / ĉ / r r Aˆ = P S = S ĉ r (0.60) ˆd ˆ ˆd B = P S = S ˆd r ˆ () / / r r (0.6) Λ ˆ r = λˆ λˆ λˆ r (0.6) Assim, definem-se as marizes: Aˆ = S Pˆ e Bˆ = S Pˆ (0.63) / () / () r r r r Considerando as marizes de resíduos E, E e E das reproduções de S, S e S, respecivamene, êm-se:
386 0. Análise de correlação canônica 380 ( ˆ )( ˆ ) E = S Ar A r (a) E = S Br B r (b) ( ˆ )( ˆ ) ( ˆ E S Ar ) ˆ r ( B ˆ = Λ r ) (c) (0.64) A segunda alernaiva relacionada a essa que apresena em simples número a explicação do respecivo conjuno, em subsiuição aos p(p-)/, q(q-)/ ou pq valores de E, E e E. Como ( ) ( ˆ )( ˆ r S = r A A ) + r ( E ) r r, e assim por diane para as demais marizes, a explicação das r variáveis canônicas para o seu respecivo conjuno é dada por: ( ) ( ) r E ( ˆ ˆ ˆ r) = r ( E ) ( ˆ ˆ ˆ r) = ( ) () %Exp U, U,, U de X 00 (a) r S () %Exp V,V,,V de X 00 (b) r S (0.65) 0.4. Inferências para grandes amosras Quando Σ =0 as variáveis canônicas U = a X () e V = b X possuem covariância nula para odos os pares de veores a e b. Dessa forma, ()
387 Ferreira, D.F. Esaísica mulivariada 38 não exisem vanagens em realizar uma análise de correlação canônica. Enão, é evidene que um ese de hipóese de que (Σ ) seja igual a uma mariz nula é primordial para a validação da análise de correlação canônica. A seguir é apresenado o ese para a hipóese: H 0 : Σ = 0 (p q) vs H : Σ 0 (0.66) covariância Σ, dado por: Seja o veor aleaório normal de dimensão (p + q x ) com média µ e X X = () j j () X j cuja covariância pode ser paricionada em: p Σ p q Σ Σ= q Σ Σ H por L, quais sejam: Sob H 0 o máximo da função de verossimilhança é dado por L 0 e sob np ( + q)/ n / ( XS,, S ) = π ( + ) L0 ( ) S S exp np ( q)/ (0.67)
388 0. Análise de correlação canônica 38 em que n é o amanho da amosra, S e S são os esimadores das covariâncias amosrais do grupo e do grupo de variáveis, p e q represenam o número oal de variáveis no grupo e, respecivamene. Sob H, modelo irresrio em-se: np / n / ( XS, ) = π S ( np ) L ( ) exp / (0.68) A razão de verossimilhança é dada por: (,, ) L ( XS, ) L0 XS S S S Λ= = S n / (0.69) O ese da razão de verossimilhança para a hipóese (0.66), dado por: S p S ( ˆ i ) S i= χ c = ln( Λ ) = nln = nln λ (0.70) em disribuição qui-quadrado com ν=pq graus de liberdade. Em que Λ é a razão de verossimilhança do ese da hipóese (0.66). O ese de razão de verossimilhança compara a variância amosral generalizada sob H 0 :
389 Ferreira, D.F. Esaísica mulivariada 383 S 0 0 S = S S com a variância generalizada irresria, S. O primeiro caso com p(p + )/ + q(q + )/ parâmeros e o segundo com (p + q)(p + q + )/. A diferença é igual a ν = pq parâmeros, que é igual aos graus de liberdade do ese em quesão. Barle (939) sugere uma correção para uma melhor aproximação de qui-quadrado, subsiuindo n em (0.70) por n - (p + q + )/. O ese com a correção de Barle (939) é dado por: p S S c n ( p q ) ln n ( p q ) ln ( ˆ χ = + + i ) = + + λ S (0.7) i= Se a hipóese nula H 0 : Σ = 0( ρ =ρ = =ρ p = 0) for rejeiada, é naural buscar um número de correlações canônicas r que diferem significaivamene de zero. Em que ρ k é a noação abreviada de ρ U k;v. Barle k (938) sugere um ese seqüencial baseado na razão de verossimilhança. A princípio, esar a hipóese de que a primeira correlação canônica é não nula e as demais (p-) são nulas; em seguida, esar que as duas primeiras são não nulas e as demais (p-) são nulas; e assim por diane. Para o k-ésimo passo desse processo esar a hipóese (k) H 0 dada por:
390 0. Análise de correlação canônica 384 (k) H 0 : ρ 0, ρ 0,, ρk 0, ρ k+ =ρ k+ = =ρ p = 0 (k) H : ρi 0 para algum i k + (0.7) pode ser realizado por: O ese dessa hipóese incorporando a correção de Barle (939) ˆ χ c = n p+ q+ ln λ (0.73) i= k+ p ( ) ( i) o qual possui disribuição de qui-quadrado com ν=(p-k)(q-k) graus de liberdade. O ese é realizado para k=,,..., (p-). Cada hipóese da seqüência H 0, () H 0, () H 0, ec. é esada uma de cada vez aé que H (k) 0 não seja rejeiada para algum k. O valor nominal da significância não é α, e possui difícil deerminação. O ese é especialmene úil para os dados normais e deve ser inerpreado com cauela, e possivelmene deva melhor ser usado como um guia não muio refinado de seleção do número r de variáveis canônicas a ser reido. As disribuições amosrais das variáveis canônicas possuem um esudo mais dealhado em Kshirsagar (97). Uma oura opção para esse ese é apresenada por Morrisson (976) que afirma que a disribuição do maior auovalor segue a disribuição da maior raiz caracerísica de Roy, com S=min(p, q), m=( P-Q -)/ e n=(n-p-q-)/. O ese anerior foi generalizado por Wilks (935) para avaliar a independência enre k grupos de variáveis. O ese de razão de verossimilhança
391 Ferreira, D.F. Esaísica mulivariada 385 para a hipóese de independência enre k-grupos da disribuição normal mulivariada é apresenado doravane. Seja Σ, mariz de covariância para odas as variáveis, paricionada em k grupos, cada um com p i variáveis; a sub-mariz Σ ij de dimensão p i xp j (i j=,,...,k) é uma parição de Σ que conem as correspondenes covariâncias enre as p i variáveis do i-ésimo grupo com as p j variáveis do j-ésimo grupo. A hipóese de ineresse é: H 0 : Σ ij = 0 para odo i j=,,..., k H : Σij 0 para algum i j=,,..., k (0.74) Cujo ese apresenado por Wilks (935) depende da quanidade: V c = S S S S kk (0.75) cuja disribuição é muio complicada. Mas Box (949) obeve boa aproximação de qui-quadrado com ν graus de liberdade. O ese proposo é: n χ c = ln ( V c) (0.76) C em que:
392 0. Análise de correlação canônica 386 = Γ + Γ ν(n ) ν= Γ ( ) C 3 3 (0.77) e k S k S S i i i= i= (0.78) Γ = p p ; S=,3 Se k = com p = p e p = q, o ese (0.76) é exaamene o mesmo de (0.7). Se k = p + q e p i =, para odo i=,,..., p + q, o ese é se especifica no ese apresenado no capíulo 7, para a independência de variáveis, ou seja, H 0 : Σ=diag(σ ii ). Enão, esse ese é uma generalização dos demais supra ciados. É conveniene que se saliene que se os eses forem aplicados sobre a mariz de correlação, os resulados são equivalenes aos obidos para a mariz de covariâncias, subsiuindo-se S por R nas expressões aneriores Exercícios Verifique que a derivação do máximo de (0.7) pode ser obida a parir de (0.6) uilizando o faor de Cholesky F, na ransformação linear de ( ) a = F c e de = ( ) b F d no lugar de a =Σ / c e de / b =Σ d,
393 Ferreira, D.F. Esaísica mulivariada 387 respecivamene; em que, F e F são os faores de Cholesky de Σ e de Σ, respecivamene Dois eses ( X e X () ) de leiura foram aplicados em n=40 crianças () junamene com dois eses de ariméica ( X e X () ). A mariz de correlação amosral obida foi: () R,0000 0,638 = 0,638,0000 ; R,0000 0,448 0,4 0,0586 = 0,448,0000 ; e R = 0,0553 0,0655 a) obenha odas as variáveis canônicas amosrais e as respecivas correlações máximas. b) realizar o ese da hipóese: H 0 : Σ =ρ = 0 (p q) vs H : Σ =ρ 0 Se H 0 for rejeiada realizar o ese da hipóese: H 0 : ρ 0; ρ = 0 Vs H 0 : ρ 0 discua os resulados obidos.
394 0. Análise de correlação canônica 388 c) esime as marizes E, E e E para o primeiro par de variáveis canônicas (r=). d) Deermine a proporção da variação explicada pelo primeiro par de variáveis canônicas nos dois grupos. e) calcule a correlação amosral enre () Z e () Z com U e com V.
395 [ ] Referências bibliográficas ANDERSON, T.W. An inroducion o mulivariae saisical analysis. nd Ed. New York, John Wiley, 984, 675p. ANDERSON, T.W. The asympoic heory for principal componens analysis, Annals of Mahemaical Saisics, v.34, p.-48, 963. BARTLETT, M.S. A noe on muliplying facors for various Chi-Square approximaions. Journal of he royal Saisical Sociey Series B. v.6, p.96-98, 954. BARTLETT, M.S. A noe on ess of significance in mulivariae analysis. Proceedings of he Cambridge Philosophical Sociey, v.35, p.80-85, 939. BARTLETT, M.S. Furher aspecs of he heory of muliple regression. Proceedings of he Cambridge Philosophical Sociey, v.34, p.33-40, 938. BARTLETT, M.S. The saisical concepion of menal facors. Briish Journal of Psychology. v.8, p.97-04, 937.
396 . Referências bibliográficas 390 BENNETT, B.M. Noe on a soluion of he generalized Behrens-Fisher problem, Annals of he Insiue of Saisical Mahemaics, v., p.97-90, 95. BOCK, R.D. Mulivariae saisical mehods in behavioral research. McGraw Hill, 975. BOX, G.E.P. A general disribuion heory for a class of likelihood crieria, Biomerika. v.36, p.37346, 949. CARROLL, J.B. An analyical soluion for approximaing simple srucure in facor analysis. Psychomerika. v.8, pp.3-8, 953. CHRISTENSEN, W.F.; RENCHER, A.C. A comparison of ype I raes and power levels for seven soluions o he mulivariae Behrens-Fisher problem. Communicaion in Saisics-Simula., v.6, n.4, p.5-73, 997. CLEVELAND, W.S.; RELLES, D.A. Clusering by idenificaion wih special applicaion o wo way ables of couns. Journal of American Saisical Associaion. v.70, n.35, p. D AGOSTINO, R.B.;TIÉTJEN, G.L. Approaches o he null disribuion of b, Biomerika, v.60, p.69-73, 973. D AGOSTINO, R.B.;TIÉTJEN, G.L. Simulaion probabiliy poins of b in small samples, Biomerika, v.58, p , 97.
397 Ferreira, D.F. Esaísica mulivariada 39 DINIZ, L de C. Dinâmica populacional do piolho de são José Quadraspidious perniciosus (Comosock, 88) (Homópera: Dispididae) em pessegueiro, no município de Jacuí - Minas Gerais. UFLA, Lavras, MG, p. (disseração de mesrado). FERGUSON, G.A. The concep of parsimony in facor analysis. Psychomerika. v.9, pp.8-90, 954. GIRSHICK, M.A. On he sampling heory of roos of deerminanal equaions. Annals of Mahemaical Saisics. v.0, p.03-4, 939. HOTELLING, H. Relaions beween wo ses of variables. Biomerika. v.8, p.3-377, 936. HOTELLING, H. The mos predicable crierion. Journal of Educaional Psychology. v.6, p.39-4, 935. HOUSEHOLDER, A.S. Principles of numerical analysis. McGraw-Hill, New york, 953. HOUSEHOLDER, A.S. The heory of marices in numerical analysis. Blarsdell, Walham, Mass., 964. JAMES, G.S. Tess of linear hypoheses in univariae and mulivariae analysis when he raios of he populaion variances are unknown, Biomerika, v.4, p.9-43, 954.
398 . Referências bibliográficas 39 JOHANSEN, S. The Welch-James approximaion o he disribuion of he residual sum of squares in a weighed linear regression, Biomerika, v.67, n., p.85-9, 980. JOHNSON, R.A.; WICHERN, D.W. Applied mulivariae saisical analysis. 4h ediion. Prenice Hall, New Jersey, p. KAISER, H.F. Compuer program for varimax roaion in facor analysis. Journal of Educaional and Psychological Measuremen. v.9, pp.43-40, 959. KAISER, H.F. The varimax crierion for analyic roaion in facor analysis. Psychomerika. v.3, pp.87-00, 958. KIM, S. A pracical soluion o he mulivariae Behrens-Fisher problem, Biomerika, v.79, n., p.7-76, 99. KRZANOWSKI, W.J. Principles of mulivariae analysis. A user s perspecive. Oxford, 3rd ediion, p. KSHIRSAGAR, A.M. Mulivariae analysis. New York: Marcel Dekker, 97. LAWLEY, D.N. Furher esimaion in facor analysis. Proceedings of he Royal Sociey of Edinburgh, Series A. v.6, pp.76-85, 94. LAWLEY, D.N. On esing a se of correlaion coefficiens for equaliy, Annals of Mahemaical Saisics, v.34, p.49-5, 963.
399 Ferreira, D.F. Esaísica mulivariada 393 LAWLEY, D.N. Tess of significance for he laen roos of covariance and correlaion marices. Biomerika, v.43, p.8-36, 956. LAWLEY, D.N. Tess of significance in canonical analysis. Biomerika. v.46, p.59-66, 959. LAWLEY, D.N. The applicaion of he maximum likelihood mehod o facor analysis. Briish Journal of Psychology. v.33, pp.7-75, 943. LAWLEY, D.N. The esimaion of facor loadings by he mehod of he maximum likelihood. Proceedings of he Royal Sociey of Edinburgh, Series A. v.60 ou 40 (checar), pp.64-8, 940. MARDIA, K.V. Applicaions of some measures of mulivariae skewness and kurosis for esing normaliy and robusness sudies. Sankyã. A36, p.5-8, 974. MARDIA, K.V. Measures of mulivariae skewness and kurosis wih applicaions. Biomerika, p , 970. MARRIOTT, F.H.C. The inerpreaion of muliple observaions. London, Academic Press, 974. MOMENTÉ, V.G. Comparações enre diferenes ipos de famílias clonais para o melhorameno genéico da baaa (Solanum uberosum L.). ESAL, Lavras, MG, p. (disseração de mesrado).
400 . Referências bibliográficas 394 MORRISON, D.F. Mulivariae saisical mehods. New York: McGraw-Hill, d ed., p. NEHAUS, J.; WRIGLEY, C. The quarimax mehod: an analyical approach o orhogonal simple srucure. Briish Journal of Psychology. v.7, pp.8-9, 954. NEL, D.G.; Van der MERWE, C.A. A soluion o he mulivariae Behrens-Fisher problem. Communicaions in Saisics: Theory and Mehods, v.5, p , 986. PEARSON, E.S.; HARTLEY, H.O. Biomerika Tables for Saisicians Vol. ed. Cambridge Universiy Press, New York, 966. SEARLE, S.R. Marix algebra for he biological sciences. Wiley, New York, 966. WIKS, S.S. On he independence of k ses of normally disribued saisical variables. Economerica. v.3, p , 935. YAO, Y. An approximae degrees of freedom soluion o he mulivariae Behrens-Fisher problem. Biomerika, v.5, n., p.39-47, 965.
DEPARTAMENTO DE ESTATÍSTICA - UFSCar 6 a Lista de exercício de Teoria de Matrizes 28/06/2017
DEPARTAMENTO DE ESTATÍSTICA - UFSCar 6 a Lisa de exercício de Teoria de Marizes 8/06/017 1 Uma pesquisa foi realizada para se avaliar os preços dos imóveis na cidade de Milwaukee, Wisconsin 0 imóveis foram
Universidade Federal do Rio de Janeiro
Universidade Federal do Rio de Janeiro Circuios Eléricos I EEL42 Coneúdo 8 - Inrodução aos Circuios Lineares e Invarianes...1 8.1 - Algumas definições e propriedades gerais...1 8.2 - Relação enre exciação
está localizado no cruzamento da i-ésima linha com a j-ésima coluna.
MATRIZES 1. DEFINIÇÕES As marizes são frequenemene usadas para organizar dados, como uma abela indexada. Por exemplo, as noas dos alunos de uma escola podem ser disposas numa mariz cujas colunas correspondem
3 Metodologia do Estudo 3.1. Tipo de Pesquisa
42 3 Meodologia do Esudo 3.1. Tipo de Pesquisa A pesquisa nese rabalho pode ser classificada de acordo com 3 visões diferenes. Sob o pono de visa de seus objeivos, sob o pono de visa de abordagem do problema
3 Modelos de Markov Ocultos
23 3 Modelos de Markov Oculos 3.. Processos Esocásicos Um processo esocásico é definido como uma família de variáveis aleaórias X(), sendo geralmene a variável empo. X() represena uma caracerísica mensurável
Prof. Lorí Viali, Dr. UFRGS Instituto de Matemática - Departamento de Estatística
Conceio Na Esaísica exisem siuações onde os dados de ineresse são obidos em insanes sucessivos de empo (minuo, hora, dia, mês ou ano), ou ainda num período conínuo de empo, como aconece num elerocardiograma
Universidade Federal de Viçosa Centro de Ciências Exatas e Tecnológicas Departamento de Matemática. Primeira Lista de Exercícios MAT 241 Cálculo III
Universidade Federal de Viçosa Cenro de Ciências Exaas e Tecnológicas Deparameno de Maemáica Primeira Lisa de Exercícios MAT 4 Cálculo III Julgue a veracidade das afirmações abaixo assinalando ( V para
4 Metodologia Proposta para o Cálculo do Valor de Opções Reais por Simulação Monte Carlo com Aproximação por Números Fuzzy e Algoritmos Genéticos.
4 Meodologia Proposa para o Cálculo do Valor de Opções Reais por Simulação Mone Carlo com Aproximação por Números Fuzzy e Algorimos Genéicos. 4.1. Inrodução Nese capíulo descreve-se em duas pares a meodologia
Capítulo Cálculo com funções vetoriais
Cálculo - Capíulo 6 - Cálculo com funções veoriais - versão 0/009 Capíulo 6 - Cálculo com funções veoriais 6 - Limies 63 - Significado geomérico da derivada 6 - Derivadas 64 - Regras de derivação Uiliaremos
4 Análise de Sensibilidade
4 Análise de Sensibilidade 4.1 Considerações Gerais Conforme viso no Capíulo 2, os algorimos uilizados nese rabalho necessiam das derivadas da função objeivo e das resrições em relação às variáveis de
Formas Quadráticas e Cônicas
Formas Quadráicas e Cônicas Sela Zumerle Soares Anônio Carlos Nogueira ([email protected]) ([email protected]). Resumo Faculdade de Maemáica, UFU, MG Nesse rabalho preendemos apresenar alguns resulados da
4 O modelo econométrico
4 O modelo economérico O objeivo desse capíulo é o de apresenar um modelo economérico para as variáveis financeiras que servem de enrada para o modelo esocásico de fluxo de caixa que será apresenado no
Análise de Pós-optimização e de Sensibilidade
CPÍULO nálise de Pós-opimização e de Sensibilidade. Inrodução Uma das arefas mais delicadas no desenvolvimeno práico dos modelos de PL, relaciona-se com a obenção de esimaivas credíveis para os parâmeros
Instituto de Física USP. Física Moderna. Aula 23. Professora: Mazé Bechara
Insiuo de Física USP Física Moderna Aula 3 Professora: Mazé Bechara Aula 3 Bases da Mecânica quânica e equações de Schroedinger: para odos os esados e para esados esacionários. Aplicação e inerpreações.
CONCURSO PÚBLICO EDITAL Nº 06/2010. Professor do Magistério do Ensino Básico, Técnico e Tecnológico DISCIPLINA / ÁREA. Matemática.
CONCURSO PÚBLICO EDITAL Nº 6/ Professor do Magisério do Ensino Básico, Técnico e Tecnológico DISCIPLINA / ÁREA Maemáica Caderno de Provas Quesões Objeivas INSTRUÇÕES: - Aguarde auorização para abrir o
Circuitos Elétricos I EEL420
Universidade Federal do Rio de Janeiro Circuios Eléricos I EEL420 Coneúdo 1 - Circuios de primeira ordem...1 1.1 - Equação diferencial ordinária de primeira ordem...1 1.1.1 - Caso linear, homogênea, com
Conceito. Exemplos. Os exemplos de (a) a (d) mostram séries discretas, enquanto que os de (e) a (g) ilustram séries contínuas.
Conceio Na Esaísica exisem siuações onde os dados de ineresse são obidos em insanes sucessivos de empo (minuo, hora, dia, mês ou ano), ou ainda num período conínuo de empo, como aconece num elerocardiograma
Modelos Não-Lineares
Modelos ão-lineares O modelo malhusiano prevê que o crescimeno populacional é exponencial. Enreano, essa predição não pode ser válida por um empo muio longo. As funções exponenciais crescem muio rapidamene
2.6 - Conceitos de Correlação para Sinais Periódicos
.6 - Conceios de Correlação para Sinais Periódicos O objeivo é o de comparar dois sinais x () e x () na variável empo! Exemplo : Considere os dados mosrados abaixo y 0 x Deseja-se ober a relação enre x
Professor: Danilo Dacar
Progressão Ariméica e Progressão Geomérica. (Pucrj 0) Os números a x, a x e a x esão em PA. A soma dos números é igual a: a) 8 b) c) 7 d) e) 0. (Fuves 0) Dadas as sequências an n n, n n cn an an b, e b
Introdução ao Controle Ótimo: Otimização de funções e funcionais. Otimização paramétrica. Problema de controle ótimo com tempo final fixo.
Inrodução ao Conrole Óimo: Oimização de funções e funcionais. Oimização paramérica. Problema de conrole óimo com empo final fio. Oimização Deerminação de uma ação que proporciona um máimo de benefício,
Professor: Danilo Dacar
. (Pucrj 0) Os números a x, a x e a3 x 3 esão em PA. A soma dos 3 números é igual a: é igual a e o raio de cada semicírculo é igual à meade do semicírculo anerior, o comprimeno da espiral é igual a a)
Capítulo 11. Corrente alternada
Capíulo 11 Correne alernada elerônica 1 CAPÍULO 11 1 Figura 11. Sinais siméricos e sinais assiméricos. -1 (ms) 1 15 3 - (ms) Em princípio, pode-se descrever um sinal (ensão ou correne) alernado como aquele
CINÉTICA QUÍMICA LEI DE VELOCIDADE - TEORIA
CINÉTICA QUÍMICA LEI DE VELOCIDADE - TEORIA Inrodução Ese arigo raa de um dos assunos mais recorrenes nas provas do IME e do ITA nos úlimos anos, que é a Cinéica Química. Aqui raamos principalmene dos
Curvas e Superfícies Paramétricas
Curvas e Superfícies araméricas Eemplo de superfícies NURBS Curvas e Superfícies ara aplicações de CG normalmene é mais conveniene adoar a forma paramérica Independene do sisema de coordenadas Represenação
Questão 1. Questão 3. Questão 2. alternativa B. alternativa E. alternativa C. Os números inteiros x e y satisfazem a equação
Quesão Os números ineiros x e y saisfazem a equação x x y y 5 5.Enãox y é: a) 8 b) 5 c) 9 d) 6 e) 7 alernaiva B x x y y 5 5 x ( ) 5 y (5 ) x y 7 x 6 y 5 5 5 Como x e y são ineiros, pelo Teorema Fundamenal
Observação: No próximo documento veremos como escrever a solução de um sistema escalonado que possui mais incógnitas que equações.
.. Sisemas Escalonados Os sisemas abaio são escalonados: 7 Veja as maries associadas a esses sisemas: 7 Podemos associar o nome "escalonado" com as maries ao "escalar" os eros ou energar a "escada" de
Séries temporais Modelos de suavização exponencial. Séries de temporais Modelos de suavização exponencial
Programa de Pós-graduação em Engenharia de Produção Análise de séries de empo: modelos de suavização exponencial Profa. Dra. Liane Werner Séries emporais A maioria dos méodos de previsão se baseiam na
EXAME DE ESTATÍSTICA AMBIENTAL 1ª Época (v1)
Nome: Aluno nº: Duração: horas LICENCIATURA EM CIÊNCIAS DE ENGENHARIA - ENGENHARIA DO AMBIENTE EXAME DE ESTATÍSTICA AMBIENTAL ª Época (v) I (7 valores) Na abela seguine apresena-se os valores das coordenadas
SISTEMAS DE EQUAÇÕES A DIFERENÇAS LINEARES
8//7 SISTEMAS DE EQUAÇÕES A DIFERENÇAS LINEARES Teorema: Considere o seguine sisema de k equações a diferenças lineares de primeira ordem, homogêneo: x a x a x... a x k k x a x a x... a x k k x a x a x...
Exercícios sobre o Modelo Logístico Discreto
Exercícios sobre o Modelo Logísico Discreo 1. Faça uma abela e o gráfico do modelo logísico discreo descrio pela equação abaixo para = 0, 1,..., 10, N N = 1,3 N 1, N 0 = 1. 10 Solução. Usando o Excel,
ONDAS ELETROMAGNÉTICAS
LTROMAGNTISMO II 3 ONDAS LTROMAGNÉTICAS A propagação de ondas eleromagnéicas ocorre quando um campo elérico variane no empo produ um campo magnéico ambém variane no empo, que por sua ve produ um campo
Primeira Lista de Exercícios
TP30 Modulação Digial Prof.: MSc. Marcelo Carneiro de Paiva Primeira Lisa de Exercícios Caracerize: - Transmissão em Banda-Base (apresene um exemplo de especro de ransmissão). - Transmissão em Banda Passane
DEMOGRAFIA. Assim, no processo de planeamento é muito importante conhecer a POPULAÇÃO porque:
DEMOGRAFIA Fone: Ferreira, J. Anunes Demografia, CESUR, Lisboa Inrodução A imporância da demografia no planeameno regional e urbano O processo de planeameno em como fim úlimo fomenar uma organização das
TRANSFORMADA DE FOURIER NOTAS DE AULA (CAP. 18 LIVRO DO NILSON)
TRANSFORMADA DE FOURIER NOTAS DE AULA (CAP. 8 LIVRO DO NILSON). CONSIDERAÇÕES INICIAIS SÉRIES DE FOURIER: descrevem funções periódicas no domínio da freqüência (ampliude e fase). TRANSFORMADA DE FOURIER:
Função Exponencial 2013
Função Exponencial 1 1. (Uerj 1) Um imóvel perde 6% do valor de venda a cada dois anos. O valor V() desse imóvel em anos pode ser obido por meio da fórmula a seguir, na qual V corresponde ao seu valor
Econometria Semestre
Economeria Semesre 00.0 6 6 CAPÍTULO ECONOMETRIA DE SÉRIES TEMPORAIS CONCEITOS BÁSICOS.. ALGUMAS SÉRIES TEMPORAIS BRASILEIRAS Nesa seção apresenamos algumas séries econômicas, semelhanes às exibidas por
Análise e Processamento de BioSinais
Análise e Processameno de BioSinais Mesrado Inegrado em Engenaria Biomédica Faculdade de Ciências e Tecnologia Slide Análise e Processameno de BioSinais MIEB Adapado dos slides S&S de Jorge Dias Tópicos:
DICAS PARA RESOLUÇÃO - LISTA 5 ÁLGEBRA LINEAR (MATRIZES E DETERMINANTES) t
DICAS PARA RESOLUÇÃO - LISTA 5 ÁLGEBRA LINEAR (MATRIZES E DETERMINANTES) 0. a, a, a, A a, a, a,,,, a a a 0 5 4 0. + 6 4 + 4 7 + 8 5 8 5 a) A + B + 8 9 + 0 6 + 6 5 9 B 7 4 6 5 7 b)a 9 7 8 9 5 8 8 0 0. s,
Cinemática em uma dimensão. o Posição, deslocamento velocidade, aceleração. o Movimento com aceleração constante, o Queda livre
Cinemáica em uma dimensão o Posição, deslocameno velocidade, aceleração. o Movimeno com aceleração consane, o Queda livre Mecânica( Dinâmica! é! o! esudo! do! movimeno! de! um! corpo! e! da! relação!dese!movimeno!com!conceios!lsicos!como!força!
4 O Papel das Reservas no Custo da Crise
4 O Papel das Reservas no Cuso da Crise Nese capíulo buscamos analisar empiricamene o papel das reservas em miigar o cuso da crise uma vez que esa ocorre. Acrediamos que o produo seja a variável ideal
ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.
ECONOMETRIA Prof. Paricia Maria Borolon, D. Sc. Séries Temporais Fone: GUJARATI; D. N. Economeria Básica: 4ª Edição. Rio de Janeiro. Elsevier- Campus, 2006 Processos Esocásicos É um conjuno de variáveis
Introdução às Medidas em Física
Inrodução às Medidas em Física 43152 Elisabeh Maeus Yoshimura [email protected] Bloco F Conjuno Alessandro Vola sl 18 agradecimenos a Nemiala Added por vários slides Conceios Básicos Lei Zero da Termodinâmica
Séries de Fourier de Senos e de Cossenos de Índices Ímpares
Séries de Fourier de Senos e de Cossenos de Índices Ímpares Reginaldo J. Sanos Deparameno de Maemáica-ICEx Universidade Federal de Minas Gerais hp://www.ma.ufmg.br/~regi 26 de seembro de 21 2 Análogo ao
Exercícios Sobre Oscilações, Bifurcações e Caos
Exercícios Sobre Oscilações, Bifurcações e Caos Os ponos de equilíbrio de um modelo esão localizados onde o gráfico de + versus cora a rea definida pela equação +, cuja inclinação é (pois forma um ângulo
Movimento unidimensional 25 MOVIMENTO UNIDIMENSIONAL
Movimeno unidimensional 5 MOVIMENTO UNIDIMENSIONAL. Inrodução Denre os vários movimenos que iremos esudar, o movimeno unidimensional é o mais simples, já que odas as grandezas veoriais que descrevem o
Movimento unidimensional. Prof. DSc. Anderson Cortines IFF campus Cabo Frio MECÂNICA GERAL
Movimeno unidimensional Prof. DSc. Anderson Corines IFF campus Cabo Frio MECÂNICA GERAL 218.1 Objeivos Ter uma noção inicial sobre: Referencial Movimeno e repouso Pono maerial e corpo exenso Posição Diferença
Características dos Processos ARMA
Caracerísicas dos Processos ARMA Aula 0 Bueno, 0, Capíulos e 3 Enders, 009, Capíulo. a.6 Morein e Toloi, 006, Capíulo 5. Inrodução A expressão geral de uma série emporal, para o caso univariado, é dada
Funções vetoriais. I) Funções vetoriais a valores reais:
Funções veoriais I) Funções veoriais a valores reais: f: I R f() R (f 1 n (), f (),..., f n ()) I = inervalo da rea real denominada domínio da função veorial f = {conjuno de odos os valores possíveis de,
MATEMÁTICA APLICADA AO PLANEJAMENTO DA PRODUÇÃO E LOGÍSTICA. Silvio A. de Araujo Socorro Rangel
MAEMÁICA APLICADA AO PLANEJAMENO DA PRODUÇÃO E LOGÍSICA Silvio A. de Araujo Socorro Rangel [email protected], [email protected] Apoio Financeiro: PROGRAMA Inrodução 1. Modelagem maemáica: conceios
APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS NO CONTROLE DA POLUIÇÃO PROVOCADA PELO TRÁFEGO DE VEÍCULOS MOTORIZADOS
! "#$ " %'&)(*&)+,- /2*&4365879&4/:+58;2*=?5@A2*3B;- C)D 5,5FE)5G+ &4- (IHJ&?,+ /?=)5KA:+5MLN&OHJ5F&4E)2*EOHJ&)(IHJ/)G- D - ;/);& Foz do Iguaçu, PR, Brasil, 9 a de ouubro de 27 APLICAÇÃO DA ANÁLISE
Cálculo Vetorial - Lista de Exercícios
álculo Veorial - Lisa de Exercícios (Organizada pela Profa. Ilka Rebouças). Esboçar o gráfico das curvas represenadas pelas seguines funções veoriais: a) a 4 i j, 0,. d) d i 4 j k,. b) b sen i 4 j cos
UNIVERSIDADE FEDERAL DO PARÁ CÁLCULO II - PROJETO NEWTON AULA 20. Palavras-chaves: derivada,derivada direcional, gradiente
Assuno: Derivada direcional UNIVERSIDADE FEDERAL DO PARÁ CÁLCULO II - PROJETO NEWTON AULA 20 Palavras-chaves: derivada,derivada direcional, gradiene Derivada Direcional Sejam z = fx, y) uma função e x
Análise de séries de tempo: modelos de decomposição
Análise de séries de empo: modelos de decomposição Profa. Dra. Liane Werner Séries de emporais - Inrodução Uma série emporal é qualquer conjuno de observações ordenadas no empo. Dados adminisraivos, econômicos,
Cálculo do valor em risco dos ativos financeiros da Petrobrás e da Vale via modelos ARMA-GARCH
Cálculo do valor em risco dos aivos financeiros da Perobrás e da Vale via modelos ARMA-GARCH Bruno Dias de Casro 1 Thiago R. dos Sanos 23 1 Inrodução Os aivos financeiros das companhias Perobrás e Vale
Voo Nivelado - Avião a Hélice
- Avião a Hélice 763 º Ano da icenciaura em ngenharia Aeronáuica edro. Gamboa - 008. oo de ruzeiro De modo a prosseguir o esudo analíico do desempenho, é conveniene separar as aeronaves por ipo de moor
Calcule a área e o perímetro da superfície S. Calcule o volume do tronco de cone indicado na figura 1.
1. (Unesp 017) Um cone circular reo de gerariz medindo 1 cm e raio da base medindo 4 cm foi seccionado por um plano paralelo à sua base, gerando um ronco de cone, como mosra a figura 1. A figura mosra
QUESTÕES ANPEC EQUAÇÕES DIFERENCIAIS E EQUAÇÕES DE DIFERENÇAS
QUESTÕES ANPEC EQUAÇÕES DIFERENCIAIS E EQUAÇÕES DE DIFERENÇAS QUESTÃO Assinale V (verdadeiro) ou F (falso): () A solução da equação diferencial y y y apresena equilíbrios esacionários quando, dependendo
Exercícios de torção livre em seção circular fechada - prof. Valério SA Universidade de São Paulo - USP
São Paulo, dezembro de 2015. 1) a. Deerminar a dimensão a de modo a se er a mesma ensão de cisalhameno máxima nos rechos B-C e C-D. b. Com al dimensão pede-se a máxima ensão de cisalhameno no recho A-B.
