Aula 25: Análise Fatorial. Prof. Eduardo A. Haddad

Documentos relacionados
Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Análise Multivariada Aplicada à Contabilidade

Métodos Quantitativos Aplicados

Estudo dirigido de Análise Multivariada

Estatística Aplicada à Administração II. Tópico. Análise de Componentes Principais

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações

4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)

Avaliação climatológica da cidade de Uberlândia por meio da Análise de Componentes Principais

Geometria (X 6 ) Português (X 3 ) Álgebra (X 4 )

Estatística II. Tópico: Análise Fatorial. Exemplo completo (Livro Corrar modificado)

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões PCA. Luiz Eduardo S. Oliveira, Ph.D.

ÍNDICE DE DESENVOLVIMENTO MUNICIPAL ANIPES Edição

Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo. Disciplina: EAD 351. Técnicas Estatísticas de Agrupamento

9 Análise Multivariada de Dados

Anexo I. Distribuição dos Recursos do PNATE-2008

RAD5017 Estatística II Aula 2 Análise Fatorial (Conceitos Teóricos) 1. Validade (definição do conceito) x Confiabilidade (consistência da medida)

29 e 30 de julho de 2013

Sensoriamento Remoto II

Análise Fatorial Exploratória (AFE) Disciplina: Medidas em Psicologia Professora: Ana Carolina Rodrigues

ANÁLISE DO DESENVOLVIMENTO SOCIOECONÔMICO

A2 - ANÁLISE FATORIAL

A seguir descrevem-se os procedimentos utilizados na construção da tipologia das CIR s.

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II

MINISTÉRIO DA EDUCAÇÃO CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS CONSELHO DE GRADUAÇÃO

ÍNDICE DE SATISFAÇÃO DOS USUÁRIOS DE PLANOS DE SAÚDE NO TRIÂNGULO CRAJUBAR, CEARÁ

O extenso número de variáveis envolvidas dificulta a análise da Morfologia.

CORRELAÇÃO. Flávia F. Feitosa

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada

Exemplo 1: Variáveis padronizadas Z t = ( Z 1 (1), Z 2 (1), Z 1 (2), Z 2 Z 1 (1) Z (1) = Z (2) = Z 2. Matriz de correlações:

NOSSA SÃO PAULO. Um Estudo Sobre Indicadores Sociais, Ambientais, Econômicos, Políticos e Culturais sobre a Cidade de São Paulo. CARLOS ADRIANO ROCHA

ESTUDO COMPARATIVO DOS ESCORES FATORIAIS E DE COMPONENTES PRINCIPAIS EM DADOS ARQUEOMÉTRICOS.

Métodos Empíricos de Pesquisa I. } Análise Bidimensional

APLICAÇÃO DE TÉCNICAS MULTIVARIADAS NA SELEÇÃO DE GENÓTIPOS DE PLANTAS PARA GRAMADOS RESISTENTES A INSETOS

Tabela 2: PIB Brasil e unidades da federação a preços constantes - R$ de 2000(mil) - Deflacionado pelo Deflator Implícito do PIB nacional

Tutorial SPSS Módulo 17- Análise fatorial Tutorial SPSS Geração de Tabelas

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Componentes Principais

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

1 Introdução aos Métodos Estatísticos para Geografia 1

Estatística Aplicada I. } Análise Bidimensional

8. Análise em Componentes Principais - ACP

CURTA DURAÇÃO APLICAÇÕES DE ESTATÍSTICA

Aula 3: Análise Exploratória de Dados Espaciais (AEDE) Prof. Eduardo A. Haddad

Aula 1: Medidas de Concentração, Especialização e Localização. Prof. Eduardo A. Haddad

O que é Análise de Fatores. As principais aplicações da técnica da Análise de Fatores (Factor Analysis) são:

Aula 7 - Revisão de Álgebra Matricial

Reconhecimento de Padrões. Principal Component Analysis (PCA) Análise dos Componentes Principais

INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO

Álgebra Linear I - Aula Matrizes simultaneamente ortogonais e simétricas

5. Seja R : R 3 R 3 uma rotação em torno do eixo gerado por (0, 0, 1). Suponha que R mande o vetor

Álgebra Linear /2 Turma 11852

OTIMIZAÇÃO DE PONTOS AMOSTRAIS DE QUALIDADE DE ÁGUA EM RESERVATÓRIOS

. Repare que ao multiplicar os vetores (-1,1) e

Técnicas Multivariadas em Saúde

CONHECIMENTOS ESPECÍFICOS

Álgebra Linear I - Aula Bases Ortonormais e Matrizes Ortogonais

Cap. 13 Correlação e Regressão

Análise de Componentes Principais Simbólicas

UTILIZAÇÃO DA ANÁLISE FATORIAL PARA DETERMINAR O POTENCIAL DE CRESCIMENTO ECONONÔMICO EM UMA REGIÃO DO SUDESTE DO BRASIL

CORRELAÇÃO E REGRESSÃO

Nordeste Janeiro de 2019

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

Representação esquemática de estruturas de dados

Ralph S. Silva

Objetivo: Determinar a eficiência de um transformador didático. 1. Procedimento Experimental e Materiais Utilizados

Determinação e Modelagem do Volume Total de Pinus carabea var bahamensis: Uma Abordagem Multivariada

PLANO DE ENSINO E APRENDIZAGEM

Análise Fatorial. Da Álgebra matricial, sabemos que uma transformação. (ou reflexão) dos eixos coordenados em relação

ÍNDICE Janelas Menus Barras de ferramentas Barra de estado Caixas de diálogo

Análise de Componentes Principais (PCA)

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

Modelo de definição de valor para o programa estadual de gerenciamento da faixa de domínio

A heterogeneidade do desenvolvimento econômico do estado de Minas Gerais

Multicolinearidade em Modelos de Regressão

Computação Gráfica. Engenharia de Computação. CEFET/RJ campus Petrópolis. Prof. Luis Retondaro. Aula 3. Transformações Geométricas

Programa de Educação Tutorial PET Departamento de Estatística-UFSCar

Classificação de Folhas por Tamanho e Forma Através de Descritores Geométricos e Análise dos Componentes Principais

PESQUISA EM MERCADO DE CAPITAIS. Prof. Patricia Maria Bortolon, D. Sc.

SISTEMA FINANCEIRO, CRESCIMENTO ECONÔMICO E

Criação de um indicador de diversificação produtiva, como ferramenta de avaliação do uso das receitas do petróleo

G3 de Álgebra Linear I

VICE-PRESIDÊNCIA COMERCIAL Dir. Nac. de Marketing Out/17

Análise Multivariada Aplicada à Contabilidade

Universidade Federal de Alagoas UFAL Centro de Tecnologia - CTEC Programa de Pós-Graduação em Engenharia Civil - PPGEC

PROCESSAMENTO DE IMAGENS

Matrizes. Lino Marcos da Silva

AULA 08 Correlação e Análise Fatorial

Econometria. Operações básicas de vetores. Operações básicas de vetores. Operações básicas de vetores. Independência de vetores

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

CIR LITORAL NORTE. Possui 4 municípios: Caraguatatuba, Ilhabela, São Sebastião e Ubatuba

Importante: havia 6 modelos de prova, com os dados numéricos diferentes. Os valores numéricos das soluções estão no final deste arquivo.

Correlação Tenho orgulho 1 0,444 0,457 0,283 0,336 0,607 0,503. Vale a pena ap 0,607 0,339 0,487 0,32 0, ,538

Empoderando vidas. Fortalecendo nações.

LISTA EXTRA DE EXERCÍCIOS MAT /I

Agenda Bahia. Cidades inovadoras e ecossistemas geradores de novos negócios. 30 agosto 2017

MAE125 Álgebra Linear /2 Turmas EQN/QIN

Transcrição:

Aula 25: Análise Fatorial Prof. Eduardo A. Haddad

Utilização específica Como identificar o potencial de desenvolvimento agropecuário dos municípios brasileiros? Banco de dados municipais: Tamanho do rebanho, número de armazéns, população ocupada na agropecuária, número de domicílios rurais abastecidos com água, produção agrícola, valor da produção, área plantada, etc. É possível sintetizar estas variáveis em um único indicador para todos os municípios? 2

Utilização geral Econometria: Criar variáveis que, por construção, apresentam correlação igual a zero (multicolinearidade) Análise regional e urbana: Finalidade classificatória de regiões e cidades, por meio da criação de um índice que permita a hierarquização das mesmas 3

Redução dos dados síntese Construção de índices a partir de um conjunto de variáveis X j Transformação feita por meio de uma combinação linear das variáveis X j Z 1 = a 11 X 1 + a 12 X 2 +...+a 1k X k Z 2 = a 21 X 1 + a 22 X 2 +...+a 2k X k Z k = a k1 X 1 + a k2 X 2 +...+a kk X k 4

Que pesos (a ij ) atribuir? Variáveis Z i devem ser ortogonais Variáveis Z i devem ser calculadas de forma que Z 1 (o primeiro fator) explique a maior parcela da variação total das variáveis X j ; Z 2 a segunda maior parcela da variação total, etc. 5

Objetivos Encontrar uma forma de condensar (sintetizar) as informações contidas em uma lista (série) de variáveis originais em um conjunto menor de informações (fatores), sem perda de informação Agrupar variáveis com base em suas correlações, isto é, todas as variáveis dentro de um grupo particular devem ser altamente correlacionadas entre si, mas devem apresentar, relativamente, pequena correlação com as variáveis dos demais grupos 6

Indicadores econômicos e sociais para os estados do Nordeste (1980) Estados Variáveis X1 X2 X3 X4 X5 X6 X7 X8 MA 29.97 3978 42.00 16488 5848 528 25.13 69.4 PI 20.67 2130 42.55 11006 4225 313 31.93 59.7 CE 33.09 5271 48.72 83926 16868 1310 40.81 43.2 RN 37.20 1892 50.89 34408 5520 595 47.57 38.2 PB 27.50 2763 46.43 36271 9374 716 42.06 48.1 PE 47.59 6125 51.65 121129 19920 3223 54.47 40.8 AL 38.85 1975 40.23 36663 6058 731 39.78 53.2 SE 41.14 1135 45.59 18556 3144 410 46.12 42.9 BA 53.72 9417 49.71 104576 17508 7823 41.18 49.2 X1 Renda per capita em 1980, em cruzados X2 População estadual em 1980, em mil habitantes X3 Proporção de alfabetizados na população de 5 anos e mais, em 1980 X4 Pessoal ocupado na indústria, em 31.12.1980 X5 Número de leitos hospitalares, em 1980 X6 Consumo total de eletricidade, em 1980 X7 Taxa de urbanização (população urbana/população total), em 1980 X8 Participação percentual da PEA do setor primário, em 1980 7

Intuição Representação gráfica dos valores (normalizados) de renda per capita (A) e taxa de urbanização (B) para três estados PE A B PB PI 8

Para todas as variáveis Os ângulos entre os vetores medem a relação que existe entre as características que estão representadas pelos vetores. Portanto, quanto menor o ângulo, maior a associação entre as duas características ou variáveis X6 X1 X3 X8 X4 X2 X5 X7 9

Possíveis fatores Pode-se distinguir três grupos (fatores): I) formado pelas variáveis X6, X3, X1 e X8; II) formado pelas variáveis X4 e X5; e III) formado pelas variáveis X2 e X7 X6 X1 I X3 X8 X4 X2 X5 II III X7 10

Carga fatorial O método de análise fatorial consiste em definir estes eixos ou fatores Os três fatores representariam a variabilidade das características que estão sendo utilizadas para representar as regiões As projeções de cada um dos oito vetores sobre cada um dos três (nove) eixos (ou seja, os co-senos dos ângulos formados pelos vetores e cada eixo) definem a relação de cada variável com o eixo ou fator Estas projeções são chamadas de carga fatorial ( factor loading ) 11

Etapas 1. Montagem da matriz de correlação 2. Extração dos fatores iniciais 3. Rotação dos fatores 4. Cálculo dos escores fatoriais 5. Agrupamento dos escores fatoriais 12

1. Montagem da matriz de correlação Matriz R X1 X2 X3 X4 X5 X6 X7 X8 X1 1.000 X2 0.615 1.000 X3 0.538 0.505 1.000 X4 0.713 0.837 0.714 1.000 X5 0.560 0.860 0.668 0.972 1.000 X6 0.765 0.913 0.492 0.755 0.706 1.000 X7 0.595 0.105 0.735 0.565 0.432 0.233 1.000 X8-0.476-0.050-0.773-0.475-0.369-0.159-0.930 1.000 13

2. Extração dos fatores iniciais Comunalidade Fator 1 Fator 2 Fator 3 Fator 4 Fator 5 Fator 6 Fator 7 h2 X1 0.841 0.068 0.515 0.070 0.056-0.105-0.004 0.996 X2 0.781 0.616-0.060-0.077-0.004-0.029 0.017 1.000 X3 0.837-0.311-0.263-0.348 0.095-0.027-0.003 0.997 X4 0.949 0.167-0.149 0.205 0.033-0.006-0.033 0.995 X5 0.881 0.280-0.326 0.193-0.039-0.005 0.018 1.000 X6 0.797 0.482 0.286-0.175-0.077 0.112-0.008 0.998 X7 0.698-0.684 0.008 0.130 0.072 0.122 0.013 0.992 X8-0.641 0.742 0.028 0.039 0.172 0.047 0.002 0.996 Eingevalue 5.228 1.838 0.549 0.260 0.055 0.042 0.002 % da variância 0.653 0.230 0.069 0.033 0.007 0.005 0.000 % var acum 0.653 0.883 0.952 0.984 0.991 0.997 0.997 Cargas Fatoriais i e i i - autovalor da matriz de variância-covariância das variáveis observadas e - autovetor da matriz de variância-covariância das variáveis observadas i 14

Algumas definições Autovalor: Seja A uma matriz quadrada e I a matriz identidade de A. Portanto, os autovalores de A são os termos que satisfazem a seguinte equação: Autovetor: A I 0 Seja A uma matriz quadrada e seus autovalores. Os autovetores e i dessa matriz são aqueles capazes de satisfazer a seguinte equação: i Ae e 15

Mais definições Comunalidade (h 2 ) é o somatório dos quadrados das cargas fatoriais e representa quanto da variância da variável é reproduzida pelos fatores comuns Eingevalue é a variância total explicada pelo fator, e seu valor resultado da adição dos quadrados das cargas fatoriais de cada variável com o fator % da variância da variância explicada pelo fator: divide-se o eingevalue pelo número de variáveis Variância total: variância acumulada 16

3. Rotação dos fatores Objetivo: definir melhor as relações entre as variáveis e os fatores Rotação ortogonal: os eixos podem ser rotacionados de maneira a preservar independência entre os fatores extraídos O método varimax objetiva definir de forma mais clara quais variáveis estão associadas com um dado fator 17

Resultados da rotação varimax Cargas Fatoriais - Rotacionadas Fator 1 Fator 2 Fator 3 Fator 4 X1 0.329 0.488 0.789-0.032 X2 0.854-0.092 0.475 0.218 X3 0.451 0.690 0.136 0.545 X4 0.859 0.390 0.306 0.029 X5 0.948 0.271 0.152 0.051 X6 0.619 0.021 0.735 0.170 X7 0.140 0.952 0.190-0.018 X8-0.086-0.975-0.090-0.086 Eingevalue 3.088 2.806 1.568 0.386 % da variância 0.386 0.351 0.196 0.048 % var acum 0.386 0.737 0.933 0.981 18

4. Cálculo dos escores fatoriais Depois de rotacionar os fatores é possível gerar os escores fatoriais para cada unidade de observação Procedimento de cálculo: Normalizar a matriz de dados originais Calcular as cargas fatoriais Calcular os escores fatoriais 19

Matriz de dados originais Indicadores sociais e econômicos para os estados Nordestinos em 1980 Estados Variáveis X1 X2 X3 X4 X5 X6 X7 X8 MA 29.97 3978 42.00 16488 5848 528 25.13 69.4 PI 20.67 2130 42.55 11006 4225 313 31.93 59.7 CE 33.09 5271 48.72 83926 16868 1310 40.81 43.2 RN 37.20 1892 50.89 34408 5520 595 47.57 38.2 PB 27.50 2763 46.43 36271 9374 716 42.06 48.1 PE 47.59 6125 51.65 121129 19920 3223 54.47 40.8 AL 38.85 1975 40.23 36663 6058 731 39.78 53.2 SE 41.14 1135 45.59 18556 3144 410 46.12 42.9 BA 53.72 9417 49.71 104576 17508 7823 41.18 49.2 Média 37 3854 46 51447 9829 1739 41 49 Desvio Padrão 10 2671 4 40945 6474 2450 9 10 20

Matriz de dados normalizados Matriz de Dados Normalizados - Z Estados Variáveis Z1 Z2 Z3 Z4 Z5 Z6 Z7 Z8 MA -0.65 0.05-1.07-0.85-0.62-0.49-1.85 2.00 PI -1.56-0.65-0.94-0.99-0.87-0.58-1.06 1.03 CE -0.35 0.53 0.56 0.79 1.09-0.17-0.02-0.62 RN 0.06-0.73 1.08-0.42-0.67-0.47 0.77-1.12 PB -0.90-0.41 0.00-0.37-0.07-0.42 0.12-0.13 PE 1.07 0.85 1.26 1.70 1.56 0.61 1.57-0.86 AL 0.22-0.70-1.50-0.36-0.58-0.41-0.14 0.38 SE 0.44-1.02-0.20-0.80-1.03-0.54 0.60-0.65 BA 1.67 2.08 0.80 1.30 1.19 2.48 0.02-0.02 21

Matriz de escores fatoriais Matriz de Factor Score para os estados Nordestinos Fator 1 Fator 2 Fator 3 Fator 4 MA -2.71-5.28-1.89-0.83 PI -3.75-3.99-2.82-0.84 CE 2.24 1.35 0.38 0.53 RN -1.20 2.31-0.48 0.38 PB -1.26-0.33-1.30-0.14 PE 5.26 4.75 3.00 1.12 AL -2.37-1.67-0.93-1.12 SE -2.68 0.77-0.79-0.47 BA 6.47 2.09 4.83 1.36 Média + 1DP 3.74 3.19 2.43 0.89 Média 0.00 0.00 0.00 0.00 Média - 1DP -3.74-3.19-2.43-0.89 22

5. Agrupamento dos escores fatoriais Fator 1 Clusters Alto > 3.74 PE, BA Média <3.74 e >-3.74 MA, CE, RN, PB, AL, SE Baixo <-3.74 PI Fator 2 Clusters Alto > 3.19 PE Média <3.19 e >-3.19 CE, RN, AL, SE, BA Baixo <-3.19 PI, MA Fator 3 Clusters Alto > 2.43 PE, BA Média <2.43 e >-2.43 MA, CE, RN, PB,AL, SE Baixo <-2.43 PI 23

Aplicação Objetivo: Calcular o potencial de desenvolvimento dos municípios brasileiros e, a partir destes, construir tipologias que permitam delimitar áreas econômicas deprimidas e desenvolvidas O potencial diferenciado pode explicar o diferenciais de renda entre os municípios brasileiros? 24

Metodologia A metodologia utilizada é composta por três passos: Aplicação de análise fatorial (SPSS) Construção de um fator ponderado endogenamente (Excel) Econometria espacial (GeoDa) 25

Fator ponderado O fator ponderado, i.e. o fator síntese, será elaborado da seguinte forma: FP i = (varf1/vartotal)* F1 i + (varf2/vartotal) *F2 i + (varf3/vartotal) *F3 i 26

Dados 21 variáveis pré-agrupadas com o intuito de melhor caracterizar os fatores: Variáveis relativas aos setores industrial, comercial e a condicionantes urbanos (X001 a X012) Variáveis relacionadas às condições de vida (X013 a X018) Variáveis relacionadas ao setor agrícola (X019 a X021) 5507 municípios 27

Dados Indicador Significado Unidade/ano Fator X001 Número de estabelecimentos industriais 1998 F1 X002 Número de estabelecimentos comerciais 1998 F1 X003 Pessoal ocupado na indústria 1998 F1 X004 Pessoal ocupado no comércio 1998 F1 X005 Número de estabelecimentos bancários 1998 F1 X006 Número de estabelecimentos administração pública 1998 F1 X007 Pessoal ocupado no setor bancário 1998 F1 X008 Pessoal ocupado na administração pública 1998 F1 X009 Domicílios urbanos abastecidos com água 2000 F1 X010 Número de professores do ensino fundamental 2000 F1 X011 Número de professores do ensino médio 2000 F1 X012 Número de professores do ensino pré-escolar 2000 F1 X013 IDH Educação 2000 F2 X014 IDH Longevidade 2000 F2 X015 IDH Renda 2000 F2 X016 Consultórios médicos por 10 mil habitantes 2000 F2 X017 Número de internações por 100 habitantes 2000 F2 X018 Número de leitos por 1000 habitantes 2000 F2 X019 Valor da produção agrícola (R$ 1000) 1998 F3 X020 Área plantada (hectare) 1998 F3 X021 Área colhida (hectare) 1998 F3 28

Figura 1. Brasil: Distribuição espacial do potencial de desenvolvimento industrial/comercial e condicionantes urbanos 29

Figura 2 Brasil: Distribuição espacial do potencial de condições de vida 30

Figura 3 Brasil: Distribuição espacial do potencial de desenvolvimento agropecuário 31

Figura 4. Potencial de Desenvolvimento (Síntese) 32

Diferencial de PIB per capita Modelo para determinação de PIB per capita municipal, em 2002 logppc02 = f (FTOT) logppc02 = f (F1, F2, F3) logppc02 = f (W_logPPC02, F1, F2, F3) (...) 33

Bibliografia Haddad, P. R. (org.) (1989). Economia Regional: Teorias e Métodos de Análise. Banco do Nordeste, Fortaleza, cap. 9. 34