ROTAÇÃO E INTERPRETAÇÃO DAS COMPONENTES PRINCIPAIS Consideremos o seguinte exemplo (exercício 6): 15 alunos de uma determinada escola foram sujeitos a testes de 6 disciplinas e os resultados obtidos encontram-se registados na tabela seguinte: Aluno Inglês (X 1 ) História (X 2 ) Português (X 3 ) Álgebra (X 4 ) Calculo Aritmético (X 5 ) Geometria (X 6 ) 1 14 13 12 6 9 10 2 15 13 10 10 8 11 3 7 10 11 16 14 16 4 8 9 12 11 13 13 5 16 17 15 14 14 13 1 Cálculos efectuados em computador permitiram-nos determinar: - Matriz amostral de correlações: R= 1 0. 81503 1 0. 71227 0. 89968 1 0. 29166 0. 51222 0. 60434 1 0. 16655 0. 31606 0. 45533 0. 8536 1 0. 24453 0. 42003 0. 49165 0. 88395 0. 86269 1 - Valores próprios da matriz R: 1 = 3.87327, 2 = 1.5547, 3 = 0.25535, 4 = 0.15061, 5 = 0.09929 e 6 = 0.06678; 2
- Vectores próprios respectivos normalizados: a 1 a 2 a 3 a 4 a 5 a 6 0,32989 0,52879 0,73272 0,09289-0,17125-0,191627 0,414596 0,4198-0,24068-0,2502 0,12612 0,71794 0,43889 0,30014-0,55256 0,29697 0,17499-0,5414 0,44488-0,31801-0,13742-0,27231-0,77603-0,07561 0,39206-0,44935 0,1651 0,70982 0,09927 0,32161 0,41836-0,388595 0,23179-0,512465 0,55867-0,213375 NOTA: Como as duas primeiras componentes principais explicam 90,5% da variância total, vamos reter apenas estas duas componentes principais. 3 Os resultados da análise factorial de componentes principais podem ser resumidos no quadro seguinte: c ij = j a ij 1ª componente principal - Y 1 (j=1) 2ª componente principal - Y 2 X 1 (i=1) 0.64925 0.65933 0.85624 X 2 (i=2) 0.81595 0.52345 0.93978 X 3 (i=3) 0.86376 0.37424 0.88614 X 4 (i=4) 0.87556-0.39652 0.92383 X 5 (i=5) 0.77159-0.56029 0.90927 X 6 (i=6) 0.82336-0.48453 0.9127 (j=2) Soma dos quadrados 3.87327 1.5547 por coluna = j Soma dos quadrados por linha = Comunalidades h i % de variância explicada 3.87327/6= 64.6 1.5547/6= 25.9 % cumulativa de 64.6 90.5 variância explicada 4
A interpretação das componentes principais é feita através dos pesos (loadings) c ij = j a ij. Denotamos por C a matriz destes pesos. Neste caso particular temos que: 0. 64925 0. 65933 0. 81595 0. 52345 0. 86376 0. 37424 C= 0. 87556 0. 39652 0. 77159 0. 56029 0. 82336 0. 48453 5 Como todas as variáveis têm pesos positivos e mais ou menos da mesma ordem de grandeza na 1ª componente, podemos sugerir que esta seja designada por Factor Geral de Inteligência, já que parece reflectir a resposta geral dos alunos à instrução recebida. Metade dos pesos na 2ª componente principal são negativos e outra metade são positivos. Este factor não é facilmente identificado mas é tal que, alunos que tenham valores altos nos testes da área de letras ficam com scores altos neste factor e alunos que tenham valores altos nos testes da área de matemática ficam com scores baixos. Talvez, este factor (2ª componente principal) possa ser identificado por Factor Matemática / não Matemática. 6
No gráfico seguinte estão representados os pares (c i1,c i2 ) (com i=1,2,3,4,5,6) de pesos das variáveis X 1, X 2, X 3, X 4, X 5 e X 6 nos 2 factores. O gráfico apresenta também uma rotação ortogonal dos eixos no sentido dos ponteiros do relógio. Com esta rotação todos os pontos caem no 1º quadrante, isto é, as variáveis passam todas a ter pesos positivos em ambos os factores. 7 8
Depois de efectuada a rotação torna-se mais simples identificar e interpretar cada factor (componente principal). As variáveis correspondentes aos testes de matemática passam a ter pesos elevados no 1º factor e pesos muito pequenos no 2º factor. As variáveis correspondentes aos testes da área de letras passam a ter pesos elevados no 2º factor e pequenos no 1º. Assim o 1º factor pode ser designado por Habilidade para a Matemática e o 2º factor por Habilidade para as Letras. Sendo C a matriz de pesos antes da rotação dos factores, a matriz C * de pesos depois da rotação é dada por: C * = C T, onde T é a matriz ortogonal correspondente à rotação pretendida. 9 É de notar que quando k=2 (número de componentes a reter) a simples visualização gráfica permite-nos identificar facilmente os factores sem ter de calcular a matriz de pesos C *. Mas quando k>2 esta visualização gráfica não é fácil, sendo geralmente necessário inspeccionar a matriz de pesos depois da rotação (C * ) afim de interpretar os factores. A rotação dos factores permite-nos encontrar uma matriz de pesos mais facilmente interpretável. O ideal seria atingir uma matriz na qual cada variável tivesse um peso alto em apenas um factor e pesos pequenos ou moderados nos restantes factores. 10
Por isso a matriz ortogonal T, correspondente à rotação a efectuar, deve ser escolhida de forma a que os pesos de C * tornem a interpretação dos factores mais fácil. Existem vários métodos para encontrar T de modo a facilitar esta interpretação: método Varimax: é um método de rotação ortogonal e pretende que, para cada componente principal, existam apenas alguns pesos significativos e todos os outros sejam próximos de zero, isto é, o objectivo é maximizar a variação entre os pesos de cada componente principal, daí o nome Varimax; 11 método Quartimax: é também um método de rotação ortogonal e pretende simplificar as linhas de uma matriz de pesos, isto é, o seu objectivo é tornar os pesos, de cada variável, elevados para um nº reduzido de componentes e próximos de zero para todas as restantes componentes; método Equimax: é também um método de rotação ortogonal, que pretende ser uma solução de compromisso entre os dois métodos anteriores. Em vez de se concentrar nas linhas ou nas colunas da matriz de pesos, o seu objectivo é simplificar simultaneamente linhas e colunas. 12
Nota: Além dos métodos de rotação ortogonal existem métodos oblíquos em que o pressuposto de independência entre os factores é retirado. É permitido aos factores que rodem livremente de maneira a simplificarem a sua interpretação. Depois de efectuada a rotação, torna-se mais simples identificar e interpretar cada componente principal (factor) a partir dos pesos das variáveis que a compõem. Quanto mais próximo de 1 estiver esse peso, mais forte é a associação entre a dita variável e a componente, enquanto que um peso da variável próximo de zero nos permite concluir que pouco contribui para a formação do factor. 13 Cabe ao analista decidir, com um certo grau de subjectividade, qual o significado ou interpretação daquela componente principal e qual a designação a dar-lhe. No exemplo considerado foi utilizado o método Varimax que, ao fim de 3 iterações, forneceu a matriz T= resumidos na seguinte tabela: 0,7375 0,675 0,675 0, 7375. Os resultados finais podem ser 14
c* 1ª componente 2ª componente principal Soma dos quadrados por ij principal - Y * 1 (j=1) - Y * 2 (j=2) linha = Comunalidades h i X 1 (i=1) 0.03353 0.92473 0.85624 X 2 (i=2) 0.24824 0.9371 0.93978 X 3 (i=3) 0.38427 0.85934 0.88614 X 4 (i=4) 0.91351 0.29889 0.92383 X 5 (i=5) 0.94743 0.10789 0.90927 X 6 (i=6) 0.93445 0.19872 0.9127 Soma dos 2.81732 2.61221 quadrados por coluna % de variância 2.81732/6= 46.96 2.61221/6= 43.54 explicada % cumulativa de 46.96 90.5 variância explicada 15 Note-se que a percentagem de variância total explicada pelas duas componentes depois da rotação é a mesma, mas cada uma delas explica diferentes percentagens das que eram explicadas pelas componentes antes da rotação. 16