Métodos Quantitativos Aplicados Aula 7 http://www.iseg.utl.pt/~vescaria/mqa/
Tópicos apresentação Relações de interdependência entre variáveis quantitativas: A Análise Factorial
Análise Factorial: técnica estatística de simplificação da informação, utilizada para representar as relações entre um conjunto de variáveis, através de um menor número de características relações entre as variáveis observadas decorrem da sua relação com variáveis não observadas os factores comuns expressam o que existe de comum nas varáveis originais
Objectivos da análise factorial Reduzir o número de variáveis iniciais identificando os factores comuns subjacentes eliminar a informação que possa ser considerada como redundante e garantindo perda mínima de informação; Evidenciar a estrutura fundamental implícita nos dados iniciais identificar factores independentes (número reduzido) que representam as variações das observações originais num espaço multidimensional.
O modelo da análise factorial para cada variável J Análise factorial X b F b F b F U j j1 1 j2 2... jk K j F 1, F 2,...,F K - factores comuns faz sentido análise se k<p U j - variável residual ou factores únicos - não estão correlacionados, entre si, nem com os factores comuns b j1,..,b jk - coeficientes utilizados na combinação dos K factores factor loadings medem a correlação entre factores comuns e variáveis observadas Factores comuns podem ser expressos como combinações lineares das variáveis originais w são os loadings ou pesos J F w X w X w X w X i ij j j1 i1 1 i2 2... ij J
Etapas da análise factorial: Operações Prévias: i) Relativização da dimensão; ii) Normalização das variáveis; Etapa 1 - testar a possibilidade de utilização da técnica; Etapa 2 - extracção dos factores; Etapa 3 - Rotação dos factores com objectivo de melhor evidenciar a estrutura fundamental dos dados iniciais e interpretar o significado dos factores comuns considerados; Etapa 4 determinação dos valores dos factores para as diferentes observações das variáveis
Etapa 1 - Testar a possibilidade de utilização desta técnica estatística utilização das matrizes dos coeficientes de correlação só faz sentido se as variáveis originais significativamente correlacionadas entre si. testes KMO e Bartlett testam a hipótese de existir correlação entre variáveis KMO com coeficientes de correlação e coeficientes de correlação parcial e Bartlett testa hipótese da matriz dos coeficientes de correlação ser uma matriz identidade Matrizes de anti-imagem simétricos dos coeficientes de correlação parcial valores fora da diagonal principal devem ser baixos
Etapa 1 testar utilização da técnica - Estatística KMO e utilização da Análise Factorial KMO Utilização da Análise Factorial 0.90-1.00 Muito Boa 0.80-0.90 Boa 0.70-0.80 Média 0.60-0.70 Medíocre 0.50-0.60 Muito má < 0.50 Inaceitável
Etapa 2 - Extracção dos factores - escolha do modelo de ajustamento a utilizar e determinação dos factores a serem considerados na representação da informação inicial Método das componentes principais - técnica de análise estatística multivariada - tem por objectivo transformar um conjunto J de variáveis correlacionadas, num novo conjunto de J de variáveis combinações lineares das variáveis originais não correlacionadas e que explicam igualmente a variância das variáveis originais - novas variáveis denominam-se componentes principais técnica é independente da análise factorial Toma-se como primeira componente principal (F 1 ) a combinação linear das variáveis X 1, X 2,...,X J, que for capaz de explicar a maior percentagem da variância das variáveis originais - factores seguintes explicam progressivamente menos e são ortogonais
Componentes principais A análise das componentes principais: Transforma um conjunto de variáveis correlacionadas num conjunto menor de variáveis independentes, combinações lineares das primeiras (as componentes principais) Um método de redução da complexidade dos dados F X X... X 1 11 1 12 2 1p F X X... X... 2 21 1 22 2 2p F X X... X p p1 1 p2 2 pp p p p
Etapa 2 Cada valor próprio (eigenvalue) dá a variância total explicada pelo respectivo factor O número de factores a considerar Com menos 30 variáveis - considerar os factores em que se verifique a condição Var(F i )> 1 - factores que consigam captar uma variância superior à de cada uma das variáveis consideradas individualmente Mais de 30 variáveis usar scree plot e verificar quando aumento dos factores dá ganho reduzido linha mais horizontal NOTA: Se Nº obs for maior que 250 e valor médio comunalidades (variância cada variável explicada pelos factores comuns) for maior que 0,6 ambos dão o mesmo resultado Sinal de poucos factores retidos - análise da matriz de correlações finais muitos pares de variáveis com correlações elevadas significa poucos factores retidos
Etapa 2 a matriz dos ponderadores dos factores (factor loadings) - permite expressar as variáveis iniciais estandardizadas em função dos factores comuns - os ponderadores representam os coeficientes de correlação entre as variáveis e os factores comuns
Etapa 3 - Rotação dos factores com objectivo de melhor evidenciar a estrutura fundamental dos dados iniciais e interpretar o significado dos factores comuns considerados solução original apresenta vários factores correlacionados com as mesmas variáveis etapa 3 transforma matriz dos ponderadores numa outra mais facilmente interpretável - Matriz de componentes rodada rotação dos factores não altera valores da variância comum das variáveis - apenas redistribui a variância explicada pelos diferentes factores comuns
Etapa 3 - Métodos de rotação ortogonais gera factores que não se correlacionam. Ex: o varimax - procura minimizar o número de variáveis que apresentam elevados valores nos ponderadores associados a um determinado factor comum torna loadings próximos de 0 ou de 1. Oblíqua factores correlacionados para interpretar solução necessário considerar simultaneamente a matriz de correlações e os loadings
Etapa 4 - Estimação dos valores dos factores para diferentes observações Análise factorial valores dos factores são determinados para as diferentes observações das variáveis a Factor Score Coefficient Matrix Permite calcular posição da observação nos factores (uma alternativa a considerar os scores pode ser calcular índices ex: médias simples das variáveis que pesam para cada factor)
Bibliografia Maroco, Cap. 10 Pestana e Gageiro, Cap.8