ANÁLISE ESPACIAL E ESTATÍSTICA DA METODOLOGIA DE CONSTRUÇÃO DO ÍNDICE DE EXCLUSÃO SOCIAL PARA O MUNICÍPIO DE SÃO JOSÉ DOS CAMPOS- SP (CENSO IBGE 1991)

Tamanho: px
Começar a partir da página:

Download "ANÁLISE ESPACIAL E ESTATÍSTICA DA METODOLOGIA DE CONSTRUÇÃO DO ÍNDICE DE EXCLUSÃO SOCIAL PARA O MUNICÍPIO DE SÃO JOSÉ DOS CAMPOS- SP (CENSO IBGE 1991)"

Transcrição

1 MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS ANÁLISE ESPACIAL E ESTATÍSTICA DA METODOLOGIA DE CONSTRUÇÃO DO ÍNDICE DE EXCLUSÃO SOCIAL PARA O MUNICÍPIO DE SÃO JOSÉ DOS CAMPOS- SP (CENSO IBGE 1991) Norton Roberto Caetano Patrícia C. Genovez Roberto Penido Duque Estrada INPE São José dos Campos 2000

2 SUMÁRIO 1 -INTRODUÇÃO OBJETIVOS METODOLOGIA E RESULTADOS REGRESSÃO LINEAR 3.2 SELEÇÃO DE VARIÁVEIS AUTONOMIA DE RENDA DESENVOLVIMENTO HUMANO QUALIDADE DE VIDA EQUIDADE 3.3 CÁLCULO DO NOVO ÍNDICE DE EXCLUSÃO SOCIAL A PARTIR DOS 4 NOVOS ÍNDICES OBTIDOS NO ÍTEM CÁLCULO DO NOVO ÍNDICE DE EXCLUSÃO SOCIAL A PARTIR DOS DADOS ORIGINAIS DO CENSO IBGE 1991 SELECIONADOS PELAS REGRESSÕES NO ÍTEM CÁLCULO DO NOVO ÍNDICE DE EXCLUSÃO SOCIAL A PARTIR DA REGRESSÃO LINEAR COM OS 4 ÍNDICES DO ÍTEM ANÁLISE ESPACIAL DE ÁREAS SOBRE O FENÔMENO DA EXCLUSÃO SOCIAL NO MUNICÍPIO DE SÃO JOSÉ DOS CAMPOS CONCLUSÕES REFERÊNCIAS BIBLIOGRÁFICAS

3 1 INTRODUÇÃO Os problemas relacionados à Exclusão Social, assim como qualquer fenômeno que ocorra em áreas urbanas é dotado de complexidade resultante da interação de fatores em múltiplas dimensões. A enorme quantidade de dados e de interações possíveis para os mesmos gera uma confusão semântica, onde tudo passa a ser nada, o presente torna-se instantaneamente passado, e a realidade urbana perde seus significados adquirindo vida própria se propagando em direção ao caos. Esta confusão semântica gerada pelo excesso de variáveis nos revela questões importantes como. O que explicar? Quais os fatores (variáveis) causais relevantes à interpretação de tais problemas?. Cabe ressaltar que em função da rápida e caótica metamorfose dos grandes centros urbanos, os resultados obtidos limitam-se ao fator temporal, referindo-se apenas ao momento de coleta dos dados analisados. Desta forma, os métodos Estatísticos e de Análise Espacial mostram-se extremamente promissores e esclarecedores, no sentido de discriminar, desvendar em meio ao todo, as variáveis (independentes), que possivelmente possam explicar melhor o fenômeno (variável dependente), buscando a minimização dos erros e a eliminação de variáveis que impliquem em informações redundantes, concomitantemente revelando o comportamento espacial da Exclusão Social. Pretende-se, a partir de dados provenientes do Mapa de Exclusão/Inclusão Social realizado para o Município de São José dos Campos, realizar uma metodologia de investigação a partir do método de Regressão Linear realizado para os quatro Índices Intermediários componentes do Índice de Exclusão Social Total inicialmente calculado pela metodologia de Sposati (1996), visando chegar a novas formas de calcular a Exclusão Social partindo-se de um conjunto de variáveis brutas reduzido, de tal forma que os resultados permaneçam semelhantes. A realização de novas técnicas que mantiveram o universo de Utopias proposto por Sposati (1996) em comparação com um método em que se excluiu as mesmas, torna-se uma preocupação fundamental para os objetivos propostos. Ou seja, até que ponto pode-se reduzir o espaço de variáveis sem prejudicar as dimensões de entendimento da cidade representadas, neste caso, pelos subíndices Autonomia de Renda, Desenvolvimento Humano, Qualidade de Vida e Equidade. 2

4 Os resultados finais obtidos neste trabalho mostram-se de extrema importância para o entendimento da Exclusão Social no Tempo e no Espaço, visto que a metodologia proposta por Sposati (1996), considera uma enorme quantidade de dados provenientes do Censo IBGE (1991) realizado somente a cada 10 anos. Isso se torna um empecilho para análises periódicas. Desta forma os novos métodos propostos neste trabalho são uma alternativa para que, a partir de um espaço amostral de variáveis reduzido, seja possível chegar a um resultado confiável que expresse numericamente e espacialmente o fenômeno da Exclusão Social no Município de São José dos Campos. 2 OBJETIVOS! Análise Estatística (regressão linear) - Obter o Índice de Exclusão Social com um Menor Número de Variáveis.! Análise Espacial - Comparar os Novos Índices Obtidos Com o Proposto por Sposati, (1996).! Verificar a Precisão dos Métodos Propostos! Tornar possíveis futuros estudos Temporais. 3

5 3 METODOLOGIA E RESULTADOS Nesta seção será apresentada a metodologia deste trabalho e, conjuntamente, os resultados obtidos pelo uso destas técnicas. Todo estudo foi dividido em dois grandes tópicos, a análise estatística e a análise espacial. O fluxograma da Figura 3.1 apresenta de forma esquemática o desenvolvimento do trabalho REGRESSÃO LINEAR A primeira parte deste estudo refere-se à análise estatística dos dados. Nesta seção serão apresentados e discutidos a metodologia e os resultados das regressões lineares, realizados para os quatro sub-índices que compõe o Índice de Exclusão Social proposto pela metodologia de Aldaísa Sposati (1996), objetivando, a partir investigação sobre os mesmos propor novas alternativas para a obtenção do Índice de Exclusão Social. A Regressão é uma ferramenta capaz de analisar relações entre variáveis, possibilitando, através de métodos específicos, a seleção e análise das mesmas objetivando a geração de modelos que expliquem, da maneira mais simples possível, fenômenos específicos (Chaterjee & Price, 1977). A relação entre as variáveis pode ser expressa através de uma função matemática que relaciona a variável dependente Y, a ser explicada, às variáveis independentes X (X 1... X p ), explicativas. Função de regressão de 1 a Ordem é apresentada abaixo: Y i = X i p-1 X i p-1 + i E (Y) = X i p-1 X i p-1 onde:! 0, 1... p-1 são os parâmetros! X i1,... X i p-1 são as varáveis independentes! i é o resíduo 3.2 SELEÇÃO DE VARIÁVEIS 4

6 O processo de geração e validação do modelo de regressão múltipla depende da Seleção das Variáveis Independentes (X) a serem incluídas no modelo. Para tal pode-se realizar análises a partir de diversos tipos de testes, este trabalho utilizou-se de 3 métodos, a análise da Matriz de Correlação, Componentes Principais e Regressões Lineares Simples e Múltiplas para selecionar as variáveis mais explicativas, ou seja, de maiores pesos para comporem o modelo destinado ao cálculo do Índice de Exclusão Social. A grande diversidade e complexidade dos dados sócio-geográficos são os principais motivos para a busca de uma simplificação que traga, além de uma redução do espaço amostral das variáveis independentes a eliminação de variáveis correlacionadas proporcionando uma análise mais apurada dos dados evitando possíveis informações redundantes. Os problemas relacionados à seleção de variáveis e à especificação funcional da função de regressão estão interligados. As questões a serem respondidas durante a formulação do modelo de regressão são:! Quais variáveis e em quais formas as mesmas devem ser incluídas no modelo?! A coerência do modelo foi mantida mesmo após a redução do universo de variáveis? Embora idealmente ambos os problemas devam ser resolvidos simultaneamente, por questão de simplicidade, eles são tratados seqüencialmente: Primeiramente são determinadas as variáveis a serem incluídas na função de regressão e após são investigadas as exatas formas nas quais as variáveis serão incluídas na função (Chaterjee & Price, 1977). O problema inerente à seleção de variáveis resume-se, então, na escolha da menor lista de variáveis independentes que possa ser considerada como a melhor seleção de variáveis independentes (Neter & Wasserman, 1974), neste caso, para chegarmos ao cálculo da Exclusão Social. A seguir serão apresentados os métodos de seleção de variáveis e de regressão para todos os Índices Intermediários que compõe o Índice de Exclusão Social. 5

7 CENSO IBGE 1991 METODOLOGIA PROPOSTA POR SPOSATI, 1996 AUTONOMIA DE RENDA DESENVOLVIMENTO HUMANO QUALIDADE DE VIDA REGRESSÃO LINEAR PARA CADA SUB-ÍNDICE NOVO AUTONOMIA DE RENDA A_LIN_PO LIN_POB NOVO DESENVOLVIMENTO HUMANO CHF_NALF ESC_PREC NOVO QUALIDADE DE VIDA PREC_A_A PREC_I_S PREC_T_L ARA NOVOS S NESTE SOMA LINEAR DOS NOVOS SUB-ÍNDICES PARA RECALCULO DA EXCLUSÃO REGRESSÃO LINEAR PARA EXCLUSÃO SOCIAL, DIRETO DOS DADOS BRUTOS DO IBGE IEX. NOVO EXCLUSÃO SOCIAL IEX. NOVO EXCLUSÃO SOCIAL (DIRETO) ANÁLISE ESPACIAL DOS NOVOS ÍNDICES DE EXCLUSÃO SOCIAL IMORAN BOXMAP LISAMAP MORANMAP MAPA DE BARRAS 6

8 3.2.1 AUTONOMIA DE RENDA! ESTATÍSTICA DESCRITIVA. Descriptive Statistics (trab1.sta) AUTONOMIA DE RENDA Confid. Confid. Valid N Mean % % Minimum Maximum Std.Dev. AUT_REND 350,000 54,470 52,458 56,481 0, ,000 19,130 Figura Espacialização da variável dependente Autonomia de Renda em conjunto com sua estatística descritiva. Figura : Curva comparativa entre o comportamento do índice de autonomia de renda e a correspondente curva gaussiana de distribuição normal. 7

9 ! MATRIZ DE CORRELAÇÃO A Matriz de Correlação foi aplicada sobre as 11 variáveis iniciais componentes do Índice Autonomia de Renda esquematizadas abaixo: FONTE INDICADORES ÍNDICES CAMPO Iexi Chefes de família abaixo da linha de Pobreza (sem Rendimento) Iexi Chefe de Família na Linha de Pobreza (com ganho até 2 SM Iex Precária Condição de Sobrevivência CENSO IBGE (1991) Iexi sem Rendimento Iexi até 0,5 SM Iexi de 0,5 até 1 SM Iexi de 1 a 2 SM Iexi de 2 a 3 SM Iexi de 3 a 5 SM Iexi de 5 à 10 SM Iexi de 10 a 15 SM Iexi de 15 a 20 SM Iexi mais de 20 SM Iex de Distribuição de Renda dos Chefes de Família Iex AUTONOMIA DE RENDA DOS CHEFES DE FAMÍLIA Analisando-se a Matriz de Correlação, verifica-se a baixa correlação da variável independente de 3 a 5 Salários Mínimos (SM) com a variável dependente Autonomia de Renda. A variável de 10 a 15 SM apresentou-se muito relacionada com as variáveis na Linha da Pobreza (LIN_POBR) e de 15 a 20 SM, as variáveis de 0,5 à 15 SM e de 1 à 2 SM mostraram-se muito relacionadas com LIN_POBR e a variável mais de 20 SM muito relacionada com de 15 à 20 SM. Portanto, em função da análise da matriz de correlação foram excluídas as variáveis D3_5SM, D10_15SM, D0,5_1SM, D1_2SM e M20_SM, destacadas na Tabela , por apresentarem baixa correlação com o Índice de Renda ou grande autocorrelação entre si. não sendo boas estimadoras da variável dependente. 8

10 ! MATRIZ DE CORRELAÇÃO. Figura : Matriz de gráficos de correlação 9

11 ! MATRIZ DE CORRELAÇÃO NUMÉRICA A_LN_POB LIN_POBR DE2_3SM DE3_5SM DE5_10SM D10_15SM D15_20SM M20_SM A_0_5_SM D0_5_1SM D1_2SM AUT_RE Correlations (trab1.sta) A_LN_POB 1,000 0,270 0,154 0,100-0,206-0,352-0,335-0,291 0,286 0,201 0,226-0,52 LIN_POBR 0,270 1,000 0,548 0,061-0,601-0,703-0,638-0,532 0,627 0,844 0,897-0,93 DE2_3SM 0,154 0,548 1,000 0,536-0,290-0,679-0,673-0,578 0,230 0,259 0,668-0,60 DE3_5SM 0,100 0,061 0,536 1,000 0,302-0,401-0,515-0,531-0,012-0,117 0,187-0,16 DE5_10SM -0,206-0,601-0,290 0,302 1,000 0,522 0,276 0,023-0,353-0,497-0,553 0,602 D10_15SM -0,352-0,703-0,679-0,401 0,522 1,000 0,891 0,665-0,416-0,493-0,708 0,814 D15_20SM -0,335-0,638-0,673-0,515 0,276 0,891 1,000 0,815-0,379-0,430-0,655 0,757 M20_SM -0,291-0,532-0,578-0,531 0,023 0,665 0,815 1,000-0,324-0,371-0,534 0,636 A_0_5_SM 0,286 0,627 0,230-0,012-0,353-0,416-0,379-0,324 1,000 0,524 0,381-0,69 D0_5_1SM 0,201 0,844 0,259-0,117-0,497-0,493-0,430-0,371 0,524 1,000 0,557-0,75 D1_2SM 0,226 0,897 0,668 0,187-0,553-0,708-0,655-0,534 0,381 0,557 1,000-0,82 AUT_REND -0,528-0,934-0,602-0,168 0,602 0,814 0,757 0,636-0,696-0,758-0,825 1,000 Excluídos pela Matriz de Correlação Excluídos pelas Componentes Principais Tabela : Matriz de Correlação 10

12 ! COMPONENTES PRINCIPAIS. O método de componentes principais (Tabela ) pode ser aplicado como mais uma forma de redução do número de variáveis e detecção de estruturas presentes nos relacionamentos entre as mesmas. No presente trabalho o referido método foi utilizado para a identificação de correlação entre as variáveis independentes, com o objetivo de eliminar uma ou mais variáveis. Para tal analisou-se a última componente na qual o autovalor aproxima-se de zero ( 6 = 0,199). Igualando-se a zero a combinação linear das variáveis independentes originais correspondentes a esta componente principal e eliminando-se as variáveis com coeficientes próximos de zero (< 0,1 em módulo), chegou-se à seguinte expressão: 0,199 0 = LIN_POBR*0,353 - A_0,5_SM*0,141 + A_LIN_PO*0,044 + DE5_10SM*0,151 + D15_20SM*0,173 D2_3SM*0,01 Sendo assim, das seis variáveis restantes, uma variável passou a ser combinação das outras cinco. Analisando as seis variáveis restantes na matriz de correlação, verificou-se que a variável D5_10SM era a mais indicada para ser retirada, devido a sua menor correlação com a variável dependente AUT_RENDA. 0,151*D5_10SM = A_0,5_SM*141 D15_20SM*0,173 LIN_POBR*0,353 Assim pode-se afirmar que D5_10SM é uma combinação linear das outras variáveis e pode ser excluída. 11

13 Tabela : Autovetores e Autovalores dos Componentes Principais. Factor Loadings (Unrotated) (trab1.sta) Extraction: Principal components (Marked loadings are > ) Factor Factor Factor Factor Factor Factor A_LIN_PO -0,464-0,406 0,747 0,232 0,075 0,044 LIN_POB -0,899-0,053-0,215-0,066-0,116 0,353 A_0_5_SM -0,681-0,422-0,103-0,554 0,146-0,141 DE2_3SM -0,708 0,599 0,028 0,090 0,361-0,010 DE5_10SM 0,639 0,325 0,447-0,514 0,008 0,151 D15_20SM 0,803-0,382-0,227 0,078 0,349 0,173 Eigenval 3,042 0,956 0,867 0,643 0,292 0,199 Prp.Totl 0,507 0,159 0,144 0,107 0,049 0,033! REGRESSÃO LINEAR Realizou-se todas as regressões possíveis a partir de todas as combinações possíveis entre as variáveis (duas a duas, três a três, dentre outras). Para este caso verificou-se que o maior R 2, de 0,9542, foi obtido para a combinação das variáveis A_LN_POB e LIN_POB. O acréscimo de qualquer das variáveis restantes resultou em um aumento não significativo do R 2, portanto não foram acrescentadas no modelo. O quadro abaixo apresenta os resultados da regressão. 12

14 Tabela : Resultados da regressão múltipla para as variáveis A_LIN_PO e LIN_POB. Regression Summary for Dependent Variable: AUT_REND R= R 2 = Adjusted R 2 = F(2,347)= p< Std.Error of estimate: St. Err. St. Err. BETA of BETA B of B t(347) p-level Intercpt 89,229 0, ,108 0,000 A_LIN_PO -0,298 0,012-1,314 0,053-24,962 0,000 LIN_POB -0,853 0,012-1,033 0,014-71,555 0,000 Tabela : ANOVA da regressão múltipla para as variáveis A_LIN_PO e LIN_POB. Analysis of Variance (trab1.sta) Sums of Mean Squares df Square F p-level Regress ,992 2, , ,809 0 Residual 5843, ,000 16,839 Total ,117 A seguir observa-se a equação de regressão para as variáveis selecionadas que melhor explicam o Índice de Autonomia de Renda. AUT_REN = 89,229 1,3142*A_LIN_PO 1,033*LIN_POBR 13

15 Figura : Superfície de regressão plana simples. As superfícies de regressão revelam tendências comportamentais entre as variáveis, ou seja, a existência ou não de interação entre as variáveis resulta em diferentes superfícies de respostas. O modelo genérico de regressão linear não se restringe a respostas de superfície lineares. O termo linear refere-se ao fato de que o parâmetro é linear, mas não necessariamente a superfície de resposta. (Nether & Wasserman, 1973). A superfície de regressão plana simples (Figura ), correspondente ao modelo final da função de regressão, indica a não existência de interação entre as variáveis independentes e uma relação inversamente proporcional entre as mesmas e a variável dependente.! ANÁLISE DOS RESÍDUOS Como o modelo de regressão contém em si algumas hipóteses sobre o erro, tais como distribuição normal, independência, média igual a zero e variância constante, torna-se necessário uma investigação aprimorada sobre os resíduos provenientes da função de regressão. Pode-se observar pelos gráficos abaixo que as características exigidas pelo modelo foram atendidas. Assim verifica-se que os erros obtidos têm média igual a zero (Figura ), distribuição normal (Figuras e ) e variância constante (Figura ), independência das variáveis independentes (Figuras e ). 14

16 Figura : Resíduos x Observados. Figura : Resíduos x Estimados (). Figura : Observados (Yi) x Estimados (). 15

17 Como pode ser observado na Figura , os resíduos possuem uma relação diretamente proporcional com os valores observados. No entanto, na Figura , após a regressão constata-se uma ausência de relação entre os valores estimados e os resíduos. Na Figura , constata-se que com o aumento dos valores observados, os estimados distanciam-se da reta de regressão, ou seja, evidencia-se o aumento dos resíduos com o aumento dos observados. Figura : Distribuição normal dos resíduos. Figura : Histograma de distribuição normal dos resíduos. 16

18 35 Raw residuals vs. A_LIN_PO A_LIN_PO = * Raw residuals Correlation: r = A_LIN_PO Raw residuals Regression 95% confid. Figura : Resíduos x A_LIN_PO 110 Raw residuals vs. LIN_POB LIN_POB = * Raw residuals Correlation: r = LIN_POB Raw residuals Figura : Resíduos x LIN_POBR Regression 95% confid. 17

19 ! ANÁLISE DE OUTLIERS 18

20 DES_HUMA 350,000 60,051 58,292 61,810 0, ,000 16, DESENVOLVIMENTO HUMANO! ESTATÍSTICA DESCRITIVA. Descriptive Statistics (trab1.sta) DESENVOLVIMENTO HUMANO Confid. Confid. Valid N Mean % % Minimum Maximum Std.Dev. Figura Espacialização da variável dependente Desenvolvimento Humano em conjunto com sua estatística descritiva. 100 Distribution of Observed Values Dependent variable: DES_HUMA No of obs Expected Normal Figura : Curva comparativa entre o comportamento do índice de autonomia de renda e a correspondente curva gaussiana de distribuição normal. 19

21 ! MATRIZ DE CORRELAÇÃO A Matriz de Correlação foi aplicada sobre as 9 variáveis iniciais componentes do Índice de Desenvolvimento Humano esquematizadas abaixo: FONTE INDICADORES ÍNDICES CAMPO Iexi Chefes de Família não Alfabetizados CENSO IBGE (1991) Iexi Escolaridade Precária (de 1 à 3 anos de estudo) Iexi de 4 a 7 anos de estudo Iexi de 8 a 10 anos de estudo Iexi de 11 a 14 anos de estudo Iexi mais de 15 anos de estudo Iexi Alfabetização Precoce (com 5 a 9 anos ) Iexi Alfabetização Tardia (de 10 a 14 anos) Iexi não Alfabetizados Iexi Escolaridade Precária Iexi População acima de 70 anos Iex de Desenvolvimento Educacional Iex Estímulo Educacional Iex Escolaridade Precária Iex Longevidade Iex DESENVOLVIMENTO HUMANO Analisando-se a Matriz de Correlação, verifica-se a baixa correlação das variáveis independentes de 8 a 10 anos de Estudo e População acima de 70 anos com a variável dependente Desenvolvimento Humano. As variáveis Alfabetização Precoce (com 5 a 9 anos) e Alfabetização Tardia (de 10 a 14 anos) apresentaram baixa correlação com o Desenvolvimento Humano e alta correlação entre si.. Portanto, em função da análise da matriz de correlação foram excluídas as variáveis de 8 a 10 anos de estudo (D8_10AES),População acima de 70 anos (POP_70), Alfabetização Precoce (A_PREC) e Alfabetização Tardia (A_TARDIA) destacadas na Tabela , por apresentarem baixa correlação com o índice de Desenvovilmento Humano ou grande autocorrelação entre si. não sendo boas estimadoras da variável dependente. 20

22 ! MATRIZ DE CORRELAÇÃO. Figura : Matriz de gráficos de correlação 21

23 ! MATRIZ DE CORRELAÇÃO NUMÉRICA Correlations (trab1.sta) CHF_NALF ESC_PREC D4_7AEST D8_10AES D11_14AEM15_AEST POP_70 A_PRECOCA_TARDIADES_HUMA CHF_NALF 1,000 0,787 0,447-0,232-0,643-0,532-0,071-0,195 0,228-0,877 ESC_PREC 0,787 1,000 0,654-0,060-0,711-0,679-0,054-0,097 0,322-0,929 D4_7AEST 0,447 0,654 1,000 0,396-0,575-0,774-0,083 0,046 0,273-0,594 D8_10AES -0,232-0,060 0,396 1,000 0,237-0,382-0,019 0,291 0,145 0,198 D11_14AE -0,643-0,711-0,575 0,237 1,000 0,526 0,106 0,316-0,024 0,751 M15_AEST -0,532-0,679-0,774-0,382 0,526 1,000 0,053 0,157-0,083 0,615 POP_70-0,071-0,054-0,083-0,019 0,106 0,053 1,000-0,147-0,140 0,064 A_PRECOC -0,195-0,097 0,046 0,291 0,316 0,157-0,147 1,000 0,605 0,254 A_TARDIA 0,228 0,322 0,273 0,145-0,024-0,083-0,140 0,605 1,000-0,350 DES_HUMA -0,877-0,929-0,594 0,198 0,751 0,615 0,064 0,254-0,350 1,000 Excluídos pela Matriz de Correlação Excluídos pela componentes Principais Tabela : Matriz de Correlação 22

24 ! COMPONENTES PRINCIPAIS. O método de componentes principais (Tabela ), aplicado ao Índice de Desenvolvimento Humano (DES_HUM) analisou a última componente na qual o autovalor aproxima-se de zero ( 9 = 0,138) objetivando a eliminação de variáveis. Igualando-se a zero a combinação linear das variáveis independentes originais correspondentes a esta componente principal e eliminando-se as variáveis com coeficientes próximos de zero (< 0,1 em módulo), chegou-se à seguinte expressão: 0,138 0 = ESC_PREC*0,236 + D4_7AEST*0,105 + D11_14AEST*0,106 + M15_AEST*0,22 Sendo assim, das nove variáveis restantes, uma variável passou a ser combinação das outras oito. Analisando as nove variáveis restantes na matriz de correlação, verificou-se que a variável D4_7AEST era a mais indicada para ser retirada, devido a sua menor correlação com a variável dependente DES_HUM. 0,105D4_7AEST = - 0,236ESC_PREC D11_14AEST*0,106 0,22*M15AEST Assim pode-se afirmar que D4_7AEST é uma combinação linear das outras variáveis e pode ser excluída. 23

25 Tabela : Autovetores e Autovalores dos Componentes Principais. CHF_NALF ESC_PREC -0,917-0,808-0,036-0,216 Factor 0,166 0,306Loadings 0,130 0,108 (Unrotated) 0,077 0,333(trab1.sta) -0,040-0,141-0,211 0,121-0,136 0,190-0,027 0,236 D4_7AEST -0,826 0,294-0,286 Extraction: -0,026 Principal -0,248 components 0,053 0,048-0,267 0,105 D8_10AES -0,080 0,674-0,670 (Marked loadings -0,088 are 0,122 > ) 0,058-0,223 0,110 0,052 D11_14AE Factor 0,807 Factor 0,341-0,123 Factor Factor 0,079 Factor 0,386-0,038 Factor Factor 0,176-0,136 Factor Factor 0,106 M15_AEST 0, , , , , , , , ,220 9 POP_70 0,122-0,221-0,335 0,905-0,065-0,018-0,018 0,002-0,021 A_PRECOC 0,146 0,840 0,320 0,121-0,169-0,356-0,008 0,021-0,026 A_TARDIA -0,278 0,692 0,508 0,249 0,066 0,334 0,022 0,008-0,084 Eingenval 3,640 1,950 1,309 0,943 0,399 0,276 0,185 0,160 0,138 Prp.Totl 0,404 0,217 0,145 0,105 0,044 0,031 0,021 0,018 0,015! REGRESSÃO LINEAR Realizou-se todas as regressões possíveis a partir de todas as combinações possíveis entre as variáveis (duas a duas, três a três, dentre outras). Para este caso verificou-se que o maior R 2, de 0,918, foi obtido para a combinação das variáveis CHF_NALF e ESC_PREC. O acréscimo de qualquer das variáveis restantes resultou em um aumento não significativo do R 2, portanto não foram acrescentadas no modelo. O quadro abaixo apresenta os resultados da regressão. 24

26 Tabela : Resultados da regressão múltipla para as variáveis CHF_NALF e ESC_PREC. Regression Summary for Dependent Variable: DES_HUMA R= R= Adjusted R= F(2,347)= p< Std.Error of estimate: St. Err. St. Err. BETA of BETA B of B t(347) p-level Intercpt 85,925 0, ,643 0,000 CHF_NALF -0,384 0,025-0,950 0,062-15,443 0,000 ESC_PREC -0,626 0,025-1,260 0,050-25,192 0,000 Tabela : ANOVA da regressão múltipla para as variáveis CHF_NALF e ESC_PREC. Analysis of Variance (trab1.sta) Sums of Mean Squares df Square F p-level Regress , , ,756 0 Residual 7979, ,996 Total 97700,2 A seguir observa-se a equação de regressão para as variáveis selecionadas que melhor explicam o Índice de Autonomia de Renda. DES_HUM = 85,925 0,95*CH_NALF 1,26*ESC_PREC 3D Surface Plot (TRAB1.STA 37v*350c) z = *x-0.145*y

27 Figura : Superfície de regressão plana simples. A superfície de regressão plana simples (Figura ), correspondente ao modelo final da função de regressão, indica a não existência de interação entre as variáveis independentes e uma relação inversamente proporcional entre as mesmas e a variável dependente.! ANÁLISE DOS RESÍDUOS Como o modelo de regressão contém em si algumas hipóteses sobre o erro, tais como distribuição normal, independência, média igual a zero e variância constante, torna-se necessário uma investigação aprimorada sobre os resíduos provenientes da função de regressão. Pode-se observar pelos gráficos abaixo que as características exigidas pelo modelo foram atendidas. Assim verifica-se que os erros obtidos têm média igual a zero (Figura ), distribuição normal (Figuras e ) e variância constante (Figura ), independência das variáveis independentes (Figuras e ). 26

28 Figura : Resíduos x Observados. Figura : Resíduos x Estimados (). 120 Predicted vs. Observed Values Dependent variable: DES_HUMA Observed Values Predicted Values Regression 95% confid. Figura : Observados (Yi) x Estimados (). Como pode ser observado na Figura , os resíduos possuem uma relação diretamente proporcional com os valores observados. No entanto, na Figura , após a regressão constata-se uma ausência de relação entre os valores estimados e os resíduos. Na Figura , constata-se que com o aumento dos valores observados, os estimados distanciam-se da reta de regressão, ou seja, evidencia-se o aumento dos resíduos com o aumento dos observados. 27

29 Figura : Distribuição normal dos resíduos. Figura : Histograma de distribuição normal dos resíduos. CHF_NALF Raw residuals vs. CHF_NALF CHF_NALF = * Raw residuals Correlation: r = Regression 95% confid.

30 Figura : Resíduos x CHF_NALF. ESC_PREC Raw residuals vs. ESC_PREC ESC_PREC = * Raw residuals Correlation: r = Raw residuals Figura : Resíduos x ESC_PREC. Regression 95% confid.! ANÁLISE DE OUTLIERS 29

31 QUALIDADE DE VIDA 30

32 QUAL_VID 350,000 82,529 80,861 84,197 0, ,000 15,865 Descriptive Statistics (trab1.sta) QUALIDADE DE VIDA Confid. Confid. Valid N Mean % % Minimum Maximum Std.Dev. Figura Espacialização da variável dependente Autonomia de Renda em conjunto com sua estatística descritiva. 200 Distribution of Observed Values Dependent variable: QUAL_VID No of obs Expected Normal Figura : Curva comparativa entre o comportamento do índice de autonomia de renda e a correspondente curva gaussiana de distribuição normal.! MATRIZ DE CORRELAÇÃO A Matriz de Correlação foi aplicada sobre as 10 variáveis iniciais componentes do Índice Autonomia de Renda esquematizadas abaixo, sendo que para a variável Condições de Privacidade considerou-se as três variáveis brutas que a constituem, a saber cômodos*, dormitórios* e banheiros* por pessoa por domicílio: 31

33 CENSO IBGE (1991) Iexi Precário Abastecimento de Água Iexi Precário Instalação anitária (Esgoto) Iexi Precário Tratamento do Lixo Iexi Propriedade Domiciliar Iexi Densidade Habitacional Iexi Condições de Privacidade* Iexi Conforto Sanitário Iexi Habitação Precária Iex Qualidade Ambiental Conforto Domiciliar Iex Qualidade Domiciliar Iex QUALIDA DE DE VIDA Analisando-se a Matriz de Correlação, verifica-se a baixa correlação das variáveis independentes Propriedade Domiciliar, Densidade Habitacional e Habitação Precária com a variável dependente Qualidade de Vida. As variáveis Dormitórios por Pessoa por Domicílio, Cômodos por Pessoa por Domicílio e Banheiros por Pessoa por Domicílio apresentaram alta correlação entre si e com a variável dependente Qualidade de Vida. Portanto, em função da análise da matriz de correlação foram excluídas as variáveis PROP_DOM, DENS_HAB, DORM_P_D, BANH_P_D E e HAB_PREC, destacadas na Tabela , por apresentarem baixa correlação com o Índice de Qualidade de Vida ou grande autocorrelação entre si. não sendo boas estimadoras da variável dependente. 32

34 ! MATRIZ DE CORRELAÇÃO. Correlations (TRAB1.STA 37v*350c) PREC_A_A PREC_I_S PREC_T_L DENS_HAB COM_P_DM DORM_P_D BAN_P_DO PROP_DOM HAB_PREC CONF_SAN QUAL_VID Figura : Matriz de gráficos de correlação 33

35 ! MATRIZ DE CORRELAÇÃO NUMÉRICA PREC_I_S PREC_A_A 0,519 1,000 1,000 0,519 0,588 0,645-0,181-0,107 Correlations -0,305-0,160 (trab1.sta) -0,205-0,144-0,253-0,086-0,072 0,104 0,045 0,016-0,860-0,501-0,833-0,789 PREC_T_L PREC_A_A 0,645 PREC_I_S 0,588 PREC_T_L 1,000 DENS_HAB -0,091 COM_P_DM -0,181 DORM_P_D -0,144 BAN_P_DO -0,167 PROP_DOM -0,190 HAB_PREC 0,054 CONF_SAN -0,552 QUAL_VID -0,828 DENS_HAB -0,107-0,181-0,091 1,000 0,122-0,191-0,015-0,557-0,040-0,228 0,074 COM_P_DM -0,160-0,305-0,181 0,122 1,000 0,687 0,861-0,029 0,120 0,344 0,373 DORM_P_D -0,144-0,205-0,144-0,191 0,687 1,000 0,611 0,181 0,115 0,347 0,332 BAN_P_DO -0,086-0,253-0,167-0,015 0,861 0,611 1,000 0,052 0,101 0,327 0,334 PROP_DOM -0,072 0,104-0,190-0,557-0,029 0,181 0,052 1,000-0,122 0,091 0,227 HAB_PREC 0,016 0,045 0,054-0,040 0,120 0,115 0,101-0,122 1,000 0,000-0,116 CONF_SAN -0,501-0,860-0,552-0,228 0,344 0,347 0,327 0,091 0,000 1,000 0,793 QUAL_VID -0,789-0,833-0,828 0,074 0,373 0,332 0,334 0,227-0,116 0,793 1,000 Excluídos pela Matriz de Correlação Excluídos pelas Componentes Principais Tabela : Matriz de Correlação 34

36 ! COMPONENTES PRINCIPAIS. O método de componentes principais (Tabela ), aplicado ao Índice de Qualidade de Vida (Q_VIDA) analisou a última componente na qual o autovalor aproxima-se de zero ( 5 = 0,138) objetivando a eliminação de variáveis. Igualando-se a zero a combinação linear das variáveis independentes originais correspondentes a esta componente principal e eliminando-se as variáveis com coeficientes próximos de zero (< 0,1 em módulo), chegou-se à seguinte expressão: 0,138 0 = 0,266*PREC_I_S + 0,259*CONF_SAN Sendo assim, das cinco variáveis restantes, uma variável passou a ser combinação das outras quatro. Analisando as cinco variáveis restantes na matriz de correlação, verificou-se que a variável CONF_SAN era a mais indicada para ser retirada, devido a sua menor correlação com a variável dependente Q_VIDA. CONF_SAN = - 0,266/0,259* PREC_I_S Assim pode-se afirmar que CONF_SAN é uma combinação linear das outras variáveis e pode ser excluída. Tabela : Autovetores e Autovalores dos Componentes Principais. Factor Loadings (Unrotated) (trab1.sta) Extraction: Principal components (Marked loadings are > ) Factor Factor Factor Factor Factor PREC_A_ A ,757 0,347-0,404-0,379 0,004 PREC_I_S -0,891-0,050 0,365-0,023 0,266 PREC_T_L -0,801 0,300-0,259 0,448-0,021 COM_P_DM 0,427 0,841 0,330-0,014-0,013 CONF_SAN 0,881 0,112-0,373 0,065 0,259 Expl.Var 2,968 0,934 0,611 0,349 0,138 Prp.Totl 0,594 0,187 0,122 0,070 0,028 35

37 ! REGRESSÃO LINEAR Realizou-se todas as regressões possíveis a partir de todas as combinações possíveis entre as variáveis (duas a duas, três a três, dentre outras). Para este caso verificou-se que o maior R 2, de 0,928, foi obtido para a combinação das variáveis PREC_A_A, PREC_I_S e PREC_T_L, retirada de uma variável reduz o R 2 para 0,86. O acréscimo de qualquer das variáveis restantes resultou em um aumento não significativo do R 2, portanto não foram acrescentadas no modelo. O quadro abaixo apresenta os resultados da regressão. Tabela : Resultados da regressão múltipla para as variáveis PREC_A_A, PREC_I_S e PREC_T_L. Regression Summary for Dependent Variable: QUAL_VID R= R= Adjusted R= F(3,346)= p< Std.Error of estimate: St. Err. St. Err. BETA of BETA B of B t(346) p-level Intercpt 89,279 0, ,149 0,000 PREC_A_A -0,327 0,019-0,218 0,013-16,836 0,000 PREC_I_S -0,460 0,018-0,194 0,008-25,065 0,000 PREC_T_L -0,346 0,021-0,265 0,016-16,849 0,000 36

38 Tabela : ANOVA da regressão múltipla para as variáveis variáveis CHF_NALF e ESC_PREC. Analysis of Variance (trab1.sta) Sums of Mean Squares df Square F p-level Regress ,617 3, , ,428 0,000 Residual 6352, ,000 18,360 Total 87838,078 A seguir observa-se a equação de regressão para as variáveis selecionadas que melhor explicam o Índice de Qualidade de Vida. Q_VIDA = 89,279 0,218*PREC_A_A 0,194*PREC_I_S 0,265*PREC_T_L! ANÁLISE DOS RESÍDUOS Como o modelo de regressão contém em si algumas hipóteses sobre o erro, tais como distribuição normal, independência, média igual a zero e variância constante, torna-se necessário uma investigação aprimorada sobre os resíduos provenientes da função de regressão. Pode-se observar pelos gráficos abaixo que as características exigidas pelo modelo foram atendidas. Assim verifica-se que os erros obtidos têm média igual a zero (Figura ), distribuição normal (Figuras e ) e variância constante (Figura ), independência das variáveis independentes (Figuras , e ). 37

39 15 Observed Values vs. Residuals Dependent variable: QUAL_VID Residuals Observed Values Regression 95% confid. Figura : Resíduos x Observados. 15 Predicted vs. Residual Scores Dependent variable: QUAL_VID Residuals Predicted Values Regression 95% confid. Figura : Resíduos x Estimados (). 120 Predicted vs. Observed Values Dependent variable: QUAL_VID 100 Observed Values Predicted Values Regression 95% confid. Figura : Observados (Yi) x Estimados (). 38

40 Como pode ser observado na Figura , os resíduos possuem uma relação diretamente proporcional com os valores observados. No entanto, na Figura , após a regressão constata-se uma ausência de relação entre os valores estimados e os resíduos. Na Figura , constata-se que com o aumento dos valores observados, os estimados distanciam-se da reta de regressão, ou seja, evidencia-se o aumento dos resíduos com o aumento dos observados. 3.5 Normal Probability Plot of Residuals 2.5 Expected Normal Value Residuals Figura : Distribuição normal dos resíduos. 200 Distribution of Raw residuals No of obs Expected Normal Figura : Histograma de distribuição normal dos resíduos. 39

41 120 Raw residuals vs. PREC_A_A PREC_A_A = * Raw residuals Correlation: r = PREC_A_A Raw residuals Regression 95% confid. Figura : Resíduos x PREC-A_A. 220 Raw residuals vs. PREC_I_S PREC_I_S = * Raw residuals Correlation: r = PREC_I_S Raw residuals Regression 95% confid. Figura : Resíduos x ESC_PREC. PREC_T_L Raw residuals vs. PREC_T_L PREC_T_L = * Raw residuals Correlation: r = Raw residuals Regression 95% confid. Figura : Resíduos x ESC_PREC. 40

42 ! ANÁLISE DE OUTLIERS 41

43 EQUIDADE Descriptive Statistics (trab1.sta) EQUIDADE Confid. Confid. Valid N Mean % % Minimum Maximum Std.Dev. EQUIDADE 350,000 41,645 40,549 42,740 0, ,000 10,423 Figura Espacialização da variável dependente Equidade em conjunto com sua estatística descritiva. 180 Distribution of Observed Values Dependent variable: EQUIDADE No of obs Expected Normal Figura : Curva comparativa entre o comportamento do Índice de Equidade a correspondente curva gaussiana de distribuição normal. 42

44 ! MATRIZ DE CORRELAÇÃO A Matriz de Correlação foi aplicada sobre as 2 variáveis iniciais componentes do Índice de Equidade esquematizadas abaixo: CENSO IBGE (1991) Iexi Mulheres não Alfabetizadas Iexi Concentração de Mulheres Chefes de Família Iex EQUIDADE Analisando-se a Matriz de Correlação, verifica-se a baixa correlação da variável independente Mulheres não Alfabetizadas (M_NALF) com a variável dependente Equidade, portanto, em função desta análise a mesma foi excluída como em destaque na Tabela ! MATRIZ DE CORRELAÇÃO. Correlations (TRAB1.STA 37v*350c) M_NALF M_CHF EQUIDADE Figura : Matriz de gráficos de correlação 43

45 ! MATRIZ DE CORRELAÇÃO NUMÉRICA Correlations (trab1.sta) M_NALF M_CHF EQUIDADE M_NALF 1,000 0,205 0,100 M_CHF 0,205 1,000 0,904 EQUIDADE 0,100 0,904 1,000 Excluído pela Matriz de Correlação Tabela : Matriz de Correlação! REGRESSÃO LINEAR Para regressão realizada verificou-se que o maior R 2 foi de 0,825 obtido para a combinação das variáveis M_CHF e M_NALF. No entanto a regressão com apenas a variável M_CH apresentou pouca diferença em relação a anterior, tendo um R 2 de 0,817, o que resultou na exclusão da variável M_NALF. O quadro abaixo apresenta os resultados da regressão. 44

46 Tabela : Resultados da regressão múltipla para a variável M_CH Regression Summary for Dependent Variable: EQUIDADE R= R= Adjusted R= F(1,348)= p< Std.Error of estimate: St. Err. St. Err. BETA of BETA B of B t(348) p-level Intercpt 31,293 0,355 88,197 0,000 M_CHF 0,904 0,023 0,457 0,012 39,424 0,000 Tabela : ANOVA da regressão múltipla para as variável M_CH Analysis of Variance (trab1.sta) Sums of Mean Squares df Square F p-level Regress ,549 1, , ,286 0,000 Residual 6935, ,000 19,930 Total 37912,105 A seguir observa-se a equação de regressão para as variáveis selecionadas que melhor explicam o Índice de Equidade. EQUIDADE = 31, ,457*M_CHF 180 Scatterplot (TRAB1.STA 37v*350c) y = *x+eps 140 M_CHF EQUIDADE Figura : Reta de Regressão com os valores estimados da variável mulheres chefes de família em relação a equidade. 45

47 ! ANÁLISE DOS RESÍDUOS Como o modelo de regressão contém em si algumas hipóteses sobre o erro, tais como distribuição normal, independência, média igual a zero e variância constante, torna-se necessário uma investigação aprimorada sobre os resíduos provenientes da função de regressão. Pode-se observar pelos gráficos abaixo que as características exigidas pelo modelo foram atendidas. Assim verifica-se que os erros obtidos têm média igual a zero (Figura ), distribuição normal (Figuras e ) e variância constante (Figura ), independência da variável independente (Figura ). 20 Observed Values vs. Residuals Dependent variable: EQUIDADE 10 0 Residuals Observed Values Figura : Resíduos x Observados. Regression 95% confid. 20 Predicted vs. Residual Scores Dependent variable: EQUIDADE 10 0 Residuals Predicted Values Regression 95% confid. Figura : Resíduos x Estimados (). 46

48 120 Predicted vs. Observed Values Dependent variable: EQUIDADE 100 Observed Values Predicted Values Regression 95% confid. Figura : Observados (Yi) x Estimados (). Como pode ser observado na Figura , os resíduos possuem uma relação diretamente proporcional com os valores observados. No entanto, na Figura , após a regressão constata-se uma ausência de relação entre os valores estimados e os resíduos. Na Figura , constata-se que com o aumento dos valores observados, os estimados distanciam-se da reta de regressão, ou seja, evidencia-se o aumento dos resíduos com o aumento dos observados. 3.5 Normal Probability Plot of Residuals 2.5 Expected Normal Value Residuals Figura : Distribuição normal dos resíduos. 47

49 200 Distribution of Raw residuals No of obs Expected Normal Figura : Histograma de distribuição normal dos resíduos. 180 Raw residuals vs. M_CHF M_CHF = * Raw residuals Correlation: r = M_CHF Raw residuals Regression 95% confid. Figura : Resíduos x M_CHF. 48

50 ! ANÁLISE DE OUTLIERS 49

51 3.3 CÁLCULO DO NOVO ÍNDICE DE EXCLUSÃO SOCIAL (N_EXCLUS) A partir das Regressões Lineares realizadas para os quatro Índices Intermediários componentes do Índice de Exclusão Social Total inicialmente calculado pela metodologia de Aldaísa Sposati (1996), chegamos a quatro equações de regressão que possibilitaram o cálculo de novos valores para os mesmos, a partir da substituição dos βs (variáveis independentes) pelos valores originais. As quatro equações obtidas pelas regressões apresentam-se relacionadas abaixo:! N_AUT_REN = 89,229 1,3142*A_LIN_PO 1,033*LIN_POBR! N_DES_HUM = 85,925 0,95*CH_NALF 1,26*ESC_PREC! N_Q_VIDA = 89,279 0,218*PREC_A_A 0,194*PREC_I_S 0,265*PREC_T_L! N_EQUIDADE = 31, ,457*M_CHF O novo Índice de Exclusão foi obtido através da soma linear dos novos valores dos índices intermediários (N_AUT_RE, N_DES_HU, N_Q_VIDA e N_EQUID) e posteriormente escalonado de 1 à 1 A seguir mostra-se uma análise comparativa a partir da espacialização do Índice de Exclusão Total original e do Novo Índice originado. 50

52 I E X T O T A L N O V O I E X 51

53 Nota-se a semelhança qualitativa (visual) entre os dois mapas, comprovada quantitativamente pela média calculada referente aos dois Índices, 0,24 para o original e 0,244 para o novo Índice. A região destacada acima sofreu grande interferência do Índice Equidade espacializado abaixo. A opção da manutenção das utopias, ou seja, das dimensões da Exclusão Social (Índices Intermediários) sem a atribuição de pesos aos Índices causou, embora mínimas, interferências nos resultados. Pelo mapa abaixo pode-se observar que a região de confusão entre os mapas é claramente caracterizada pelo Índice de Equidade. Isto ocorre porque a única variável restante após a regressão foi Mulheres Chefes de Família, condição que não se restringe apenas aos excluídos e que, portanto, deveria ter um peso menor no cálculo do Índice final. 52

54 3.4 CÁLCULO DO NOVO ÍNDICE DE EXCLUSÃO SOCIAL (N_EX_DIR) A PARTIR DOS DADOS ORIGINAIS DO CENSO 1991 SELECIONADOS PELAS REGRESSÕES NO ÍTEM 3.2. As regressões realizadas para os sub-índices N_AUT_REN, N_DES_HUMA, N_QUAL_VID e N_EQUIDADE (item 3.2), utilizaram-se das variáveis (dados brutos do censo IBGE 1991) LIN_POB e A_LIN_PO; CHF_NALF e ESC_PREC; PREC_A_A, PREC_I_S e PREC_T_L; e M_CHF, respectivamente. Com estas 8 variáveis selecionadas para as equações das regressões do item 3.2, foi realizada uma regressão linear, agora na tentativa de explicar-se a exclusão social. Este novo índice de Exclusão Social foi chamado de Direto, pois foi obtido através da regressão das variáveis brutas diretamente, sem estas estarem compondo os sub-índices. A seguir é apresentada a análise. 53

55 ! ESTATÍSTICA DESCRITIVA. Descriptive Statistics (trab1.sta) Confid. Confid. Valid N Mean % % Minimum Maximum Std.Dev. EXC_SOC , , , ,48988 Figura Espacialização da variável dependente Exclusão Social Direta em conjunto com sua estatística descritiva. No of obs Distribution of Observed Values Dependent variable: EXC_SOC Expected Normal Figura 3.4.2: Curva comparativa entre o comportamento do índice Exclusão Social Direto e a correspondente curva gaussiana de distribuição normal. 54

56 ! MATRIZ DE CORRELAÇÃO. Correlations (TRAB1.STA 37v*350c) A_LIN_PO LIN_POB CHF_NALF ESC_PREC M_CHF PREC_A_A PREC_I_S PREC_T_L EXC_SOC Figura 3.4.3: Matriz de gráficos de correlação 55

57 ! MATRIZ DE CORRELAÇÃO NUMÉRICA Correlations (trab1.sta) A Matriz de Correlação foi aplicada sobre as 9 variáveis selecionadas para os Índices Intermediários (item 3.2) esquematizadas abaixo: A_LIN_PO LIN_POB CHF_NALF ESC_PREC M_CHF PREC_A_A PREC_I_S PREC_T_L EXC_SO C A_LIN_PO 1,000 0,270 0,290 0,354-0,182-0,038 0,190 0,032-0,375 LIN_POB 0,270 1,000 0,821 0,850-0,289 0,311 0,449 0,443-0,853 CHF_NALF 0,290 0,821 1,000 0,787-0,365 0,449 0,580 0,613-0,876 ESC_PREC 0,354 0,850 0,787 1,000-0,407 0,338 0,493 0,426-0,882 M_CHF -0,182-0,289-0,365-0,407 1,000-0,224-0,285-0,217 0,560 PREC_A_A -0,038 0,311 0,449 0,338-0,224 1,000 0,519 0,645-0,532 PREC_I_S 0,190 0,449 0,580 0,493-0,285 0,519 1,000 0,588-0,673 PREC_T_L 0,032 0,443 0,613 0,426-0,217 0,645 0,588 1,000-0,614 EXC_SOC -0,375-0,853-0,876-0,882 0,560-0,532-0,673-0,614 1,000 Excluídos pela Matriz de Correlação Excluídos pela componentes Principais Tabela 3.4.1: Matriz de Correlação Pela análise da matriz de correlação pode-se excluir a variável A_LIN_PO, a qual apresenta baixa correlação com a exclusão social.! COMPONENTES PRINCIPAIS. O método de componentes principais (Tabela 3.4.2) pode ser aplicado como mais uma forma de redução do número de variáveis e detecção de estruturas presentes nos relacionamentos entre as mesmas. No presente trabalho o referido método foi utilizado para a identificação de correlação entre as variáveis independentes, com o objetivo de eliminar uma ou mais variáveis. Para tal analisou-se a última componente na qual o autovalor aproxima-se de zero ( 6 = 0,126). Igualando-se a zero a combinação linear das variáveis independentes originais correspondentes a esta componente principal e eliminando-se as variáveis com coeficientes próximos de zero (< 0,1 em módulo), chegou-se à seguinte expressão: 56

58 LIN_POB CHF_NALF ESC_PREC Sendo assim, das 8 variáveis restantes, uma variável passou a ser combinação das outras 7. Analisando as 7 variáveis restantes na matriz de correlação, verificou-se que LIN_POB era a mais indicada para ser retirada, devido a sua menor correlação com a variável dependente N_EX_DIR LIN_POB CHF_NALF ESC_PREC Pode-se afirmar que LIN_POB é uma combinação linear de CHF_NALF e de ESC_PREC e que portanto pode ser retirada do modelo. Tabela 3.4.2: Autovetores e Autovalores dos Componentes Principais. Factor Loadings (Unrotated) (trab1.sta) Extraction: Principal components (Marked loadings are > ) Factor Factor Factor Factor Factor Factor Factor LIN_POB 0,827-0,402-0,270-0,085 0,045 0,007-0,268 CHF_NALF 0,906-0,176-0,147-0,037-0,106 0,307 0,144 ESC_PREC 0,843-0,407-0,107-0,032 0,132-0,250 0,176 M_CHF -0,480 0,264-0,832 0,039 0,063-0,011 0,038 PREC_A_A 0,646 0,598 0,097-0,308 0,345 0,032-0,007 PREC_I_S 0,746 0,299 0,040 0,585 0,100-0,002-0,030 PREC_T_L 0,751 0,469-0,061-0,116-0,426-0,129-0,016 Expl.Var 3,984 1,095 0,814 0,461 0,345 0,175 0,126 Prp.Totl 0,569 0,156 0,116 0,066 0,049 0,025 0,018! REGRESSÃO LINEAR Realizando-se todas as combinações possíveis entre as variáveis, chegou-se a uma equação de regressão com três termos. O acréscimo de qualquer das variáveis restantes resultou em 57

59 um aumento não significativo do R 2, portanto não foram acrescentadas no modelo. O quadro abaixo apresenta os resultados da regressão. Tabela 3.4.3: Resultados da regressão múltipla para as variáveis M_CHF, ESC_PREC e CHF_NALF. Regression Summary for Dependent Variable: EXC_SOC R= R= Adjusted R= F(3,346)= p< Std.Error of estimate: St. Err. St. Err. BETA of BETA B of B t(346) p-level Intercpt 79,680 0, ,645 0,000 CHF_NALF -0,451 0,027-1,101 0,066-16,702 0,000 ESC_PREC -0,439 0,028-0,870 0,055-15,930 0,000 M_CHF 0,217 0,018 0,173 0,015 11,889 0,000 Tabela 3.4.4: ANOVA da regressão múltipla para as variáveis M_CHF, ESC_PREC e CHF_NALF. Analysis of Variance (trab1.sta) Sums of Mean Squares df Square F p-level Regress , , ,609 0 Residual 9075, ,23084 Total 94898,7 A seguir observa-se a equação de regressão para as variáveis selecionadas que melhor explicam o Índice de Autonomia de Renda. 58

60 N_IEXCL_DIR = CHF_NALF 0.87.ESC_PREC M_CH! ANÁLISE DOS RESÍDUOS Como o modelo de regressão contém em si algumas hipóteses sobre o erro, tais como distribuição normal, independência, média igual a zero e variância constante, torna-se necessário uma investigação aprimorada sobre os resíduos provenientes da função de regressão. Pode-se observar pelos gráficos abaixo que as características exigidas pelo modelo foram atendidas. Assim verifica-se que os erros obtidos têm média igual a zero (Figura ), distribuição normal (Figuras e 3.4.7) e variância constante (Figura 3.4.5), independência das variáveis independentes (Figuras 3.4.9,3.4.10, e ). 25 Predicted vs. Residual Scores Dependent variable: EXC_SOC 15 Residuals Predicted Values Regression 95% confid. Figura : Resíduos x Observados Observed Values vs. Residuals Dependent variable: EXC_SOC 59 als 5

61 Figura 3.4.6: Resíduos x Estimados (). 120 Predicted vs. Observed Values Dependent variable: EXC_SOC 100 Observed Values Predicted Values Regression 95% confid. Figura : Observados (Yi) x Estimados (). Como pode ser observado na Figura 3.4.7, os resíduos possuem uma relação diretamente proporcional com os valores observados. No entanto, na Figura 3.4.8, após a regressão constata-se uma ausência de relação entre os valores estimados e os resíduos. Na Figura 3.4.6, constata-se que com o aumento dos valores observados, os estimados distanciam-se da reta de regressão, ou seja, evidencia-se o aumento dos resíduos com o aumento dos observados. 3.5 Normal Probability Plot of Residuals rmal Value

62 Figura 3.4.8: Distribuição normal dos resíduos. 180 Distribution of Raw residuals No of obs Expected Normal Figura 3.4.9: Histograma de distribuição normal dos resíduos. 180 Raw residuals vs. M_CHF M_CHF = * Raw residuals Correlation: r = _CHF 100

63 Figura : Resíduos x M_CHF CHF_NALF Raw residuals vs. CHF_NALF CHF_NALF = * Raw residuals Correlation: r = Raw residuals Regression 95% confid. Figura : Resíduos x LIN_POBR ESC_PREC! ANÁLISE DE OUTLIERS Raw residuals vs. ESC_PREC ESC_PREC = * Raw residuals Correlation: r = Raw residuals Figura : Resíduos x LIN_POBR Regression 95% confid. 62

64 ! RESULTADOS COMPARATIVOS 63

65 I E X T O T A L N E X C D I R Podemos observar que embora a metodologia aplicada tenha excluído as dimensões utópicas do Ìndice proposto por Aldaísa a espacialização do Índice calculado diretamente das variáveis brutas selecionadas apresenta-se, visualmente, muito semelhante (qualitativamente), embora quantitativamente exista uma diferença entre a média resultante deste (0,126) em relação ao do Índice original (0,24). 64

66 3.5 CÁLCULO DO NOVO ÍNDICE DE EXCLUSÃO SOCIAL (N_EX_IND) A PARTIR DA REGRESÃO LINEAR COM OS 4 NOVOS ÍNDICES CALCULADOS NO ÍTEM 3.2. O Índice de Exclusão Social Indireto foi construído semelhantemente ao Novo Índice de Exclusão (item 3.3), diferenciando-se por uma continuação da análise de regressão a partir dos Novos Índices Intermediários visando diferencia-los em ordem de prioridade, importância, na constituição do Índice de Exclusão Social. Resumindo foram utilizados os novos sub-índices gerados, porém realizou-se uma regressão linear com estas variáveis, objetivando selecionar as variáveis de maior contribuição para a explicação da Exclusão Social. Este novo Índice de Exclusão Social foi chamado de Indireto. Para tanto foi utilizada a mesma metodologia da análise de regressão linear, a qual é apresentada a seguir.! ESTATÍSTICA DESCRITIVA. 65

67 Descriptive Statistics (trab1.sta) Confid. Confid. Valid N Mean % % Minimum Maximum Std.Dev. EXC_SOC 350,000 61,962 60,228 63,695 0, ,000 16,490 Figura Espacialização da variável dependente Exclusão Social Indireto em conjunto No of obs com sua estatística descritiva. Distribution of Observed Values Dependent variable: EXC_SOC Expected Normal Figura 3.4.2: Curva comparativa entre o comportamento do índice de Exclusão social Indireto e a correspondente curva gaussiana de distribuição normal.! MATRIZ DE CORRELAÇÃO. 66

68 A Matriz de Correlação foi aplicada sobre os 4 Novos Índices Intermediários componentes do Índice Exclusão Social citados abaixo:! Índice de Autonomia de Renda! Índice de Desenvolvimento Humano! Índice de Qualidade de Vida! Índice de Equidade Analisando-se a Matriz de Correlação, verifica-se a baixa correlação da variável independente N_EQUIDA com a variável dependente Exclusão Social Independente. Portanto, em função da análise da matriz de correlação a mesma foi excluída não sendo um bom estimador para variável dependente.! MATRIZ DE CORRELAÇÃO. Correlations (TRAB1.STA 41v*350c) N_AUT_RE N_DES_HU N_QU_VID N_EQUIDA EXC_SOC Figura 3.4.3: Matriz de gráficos de Correlação! MATRIZ DE CORRELAÇÃO NUMÉRICA 67

69 N_AUT_RE N_DES_HU N_QU_VID N_EQUIDA EXC_SOC N_AUT_RE 1,000 0,855 0,438 0,264 0,827 N_DES_HU 0,855 1,000 0,589 0,412 0,928 N_QU_VID 0,438 0,589 1,000 0,290 0,722 N_EQUIDA 0,264 0,412 0,290 1,000 0,560 EXC_SOC 0,827 0,928 0,722 0,560 1,000 Excluídos pela Matriz de Correlação Excluídos pela Componentes Principais Tabela 3.4.1: Matriz de Correlação! COMPONENTES PRINCIPAIS. A analise da última componente, a qual o autovalor aproxima-se de zero ( 6 = 0,125). Igualando-se a zero a combinação linear das variáveis independentes originais correspondentes a esta componente principal e eliminando-se as variáveis com coeficientes próximos de zero (< 0,1 em módulo), chegou-se à seguinte expressão: N_AUT_RE N_DES_HU Sendo assim, das 4 variáveis restantes, uma variável passou a ser combinação das outras três. Analisando as 4 variáveis restantes na matriz de correlação, verificou-se que a variável N_AUT_RE era a mais indicada para ser retirada, devido a sua menor correlação com a variável dependente Exclusão Social Indireta N_AUT_RE = N_DES_HU Assim pode-se afirmar que N_AUT_RE é função de N_DES_HU e pode ser excluída do modelo. Tabela 3.4.2: Autovetores e Autovalores dos Componentes Principais. 68

70 Factor Loadings (Unrotated) (trab1.sta) Extraction: Principal components (Marked loadings are > ) Factor Factor Factor N_AUT_RE -0,897 0,379-0,226 N_DES_HU -0,951 0,162 0,265 N_QU_VID -0,750-0,658-0,065 Expl.Var 2,272 0,603 0,125 Prp.Totl 0,757 0,201 0,042! REGRESSÃO LINEAR - Método do maior R 2. Realizando-se as combinações possíveis com as duas variáveis restantes, observa-se que com apenas a variável N_DES_HU no modelo, o R 2 já era de Com a inclusão da variável N_QU_VID no modelo, o R 2 aumenta para Ou seja, um acréscimo de apenas 0,0472 no R 2. O acréscimo de qualquer das variáveis restantes resultou em um aumento não significativo do R 2, tornando desnecessária acrescenta-las no modelo. O quadro abaixo apresenta os resultados da regressão.. O quadro abaixo apresenta os resultados da regressão.resulta em um pequeno acréscimo no R 2. Tabela 3.4.3: Resultados da regressão múltipla para a variável N_DES_HU 69

71 Regression Summary for Dependent Variable: EXC_SOC R= R= Adjusted R= F(1,348)= p< Std.Error of estimate: St. Err. St. Err. BETA of BETA B of B t(348) p-level N_DES_HU 0,928 0,020 0,954 0,021 46,385 0,000 Intercpt 4,666 1,278 3,650 0,000 Tabela 3.4.4: ANOVA da regressão múltipla para a variável N_DES_HU Analysis of Variance (trab1.sta) Sums of Mean Squares df Square F p-level Regress ,383 1, , ,543 0,000 Residual 13212, ,000 37,966 Total 94898,695 A seguir observa-se a equação de regressão para a variável selecionada que melhor explicou o Índice de Exclusão Social Indiretamente. N_EXCL_I = N_DES_HUM! ANÁLISE DOS RESÍDUOS Como o modelo de regressão contém em si algumas hipóteses sobre o erro, tais como distribuição normal, independência, média igual a zero e variância constante, torna-se necessário uma investigação aprimorada sobre os resíduos provenientes da função de regressão. Pode-se observar pelos gráficos abaixo que as características exigidas pelo modelo foram atendidas. Assim verifica-se que os erros obtidos têm média igual a zero (Figura 3.5.6), distribuição normal (Figuras e 3.5.8) e variância constante (Figura 3.5.6), independência das variáveis independentes (Figuras e ). 25 Observed Values vs. Residuals Dependent variable: EXC_SOC 15 Residuals

72 Figura 3.5.5: Resíduos x Observados. 25 Predicted vs. Residual Scores Dependent variable: EXC_SOC 15 5 Residuals Predicted Values Regression 95% confid. Figura 3.5.6: Resíduos x Estimados (). 120 Predicted vs. Observed Values Dependent variable: EXC_SOC 100 Observed Values Predicted Values Regression 95% confid. Figura 3.5.7: Observados (Yi) x Estimados (). 71

73 Como pode ser observado na Figura 3.5.8, os resíduos possuem uma relação diretamente proporcional com os valores observados. No entanto, na Figura 3.5.9, após a regressão constata-se uma ausência de relação entre os valores estimados e os resíduos. Na Figura 3.5.7, constata-se que com o aumento dos valores observados, os estimados distanciam-se da reta de regressão, ou seja, evidencia-se o aumento dos resíduos com o aumento dos observados. 3.5 Normal Probability Plot of Residuals 2.5 Expected Normal Value Residuals Figura 35.8: Distribuição normal dos resíduos. 140 Distribution of Raw residuals No of obs Expected Normal Figura 3.5.9: Histograma de distribuição normal dos resíduos. 72

74 100 Raw residuals vs. N_DES_HU N_DES_HU = * Raw residuals Correlation: r = N_DES_HU Raw residuals Regression 95% confid. Figura : Resíduos x N_DES_HU 100 Scatterplot (TRAB1.STA 41v*350c) y = *x+eps 80 N_DES_HU EXC_SOC Figura : Excl_Social x N_DES_HU 100 Scatterplot (TRAB1.STA 41v*350c) y = *x+eps 80 N_DES_HU N_AUT_RE Figura : N_AUT_RE x N_DES_HU 73

75 ! ANÁLISE DE OUTLIERS 74

76 ! RESULTADOS COMPARATIVOS I E X T O T A L I E X E I N D I R Embora, quantitativamente, a média tenha sido um pouco maior (0,341) do que a do índice original (0,24), nota-se a semelhança qualitativa (visual) entre os dois mapas. A região destacada acima sofreu grande interferência do Índice de espacializado abaixo. A opção da manutenção das utopias, ou seja, das dimensões da Exclusão Social (Ìndices Intermediários) com a atribuição de pesos aos Índices causou, embora mínimas, 75

77 interferências nos resultados. Pelo mapa abaixo pode-se observar que a região de confusão entre os mapas é claramente caracterizada pelo Índice de Desenvolvimento Humano, que foi considerado, pela regressão, como a variável que melhor explica o fenômeno da Exclusão Social. 3.6 ANÁLISE ESPACIAL DE ÁREAS SOBRE O FENÔMENO DA EXCLUSÃO SOCIAL NO MUNICÍPIO DE SÃO JOSÉ DOS CAMPOS SP! ÍNDICE GLOBAL DE MORAN O Índice Global de Moran, para os três novos Índices e para o original, fornece o grau de autocorrelação espacial da variável estudada, ou seja, mede quanto o valor da mesma numa região é independente dos valores dos vizinhos. Este indicador detecta afastamentos de uma distribuição espacial aleatória. Verifica-se que os índices Globais de Moran obtidos foram 0,6835 (original), 0,6887(recalculado), 0,6990 (direto) e 0,6701 (indireto) indicando uma alta correlação espacial positiva para a região como um todo. Tal resultado não deve ser analisado de maneira conclusiva para a região, pois pelo fato do índice ser global, este pode mascarar regimes espaciais locais não detectados pelo mesmo. Em função disto, torna-se necessário a continuação da análise exploratória dos dados através dos indicadores locais de associação espacial (LISA), particularmente o Índice Local de Moran. ] 76

78 A L D A Í S A R E C A L C U L O D I R E T O I N D I R E T O! INDICE LOCAL DE MORAN O Índice Local de Moran computa o índice local de cada polígono, pela multiplicação do desvio em relação à média global dos resíduos, pela média dos desvios dos vizinhos. Este índice permite a identificação de agrupamentos de polígonos com valores de atributos semelhantes (clusters) que apresentam mesmo regime espacial, assim como polígonos anômalos (outliers) e áreas de transição. Um aspecto importante do Índice Local de Moran diz respeito ao nível de significância associado para cada valor calculado. 77

79 A L D A Í S A R E C A L C U L O D I R E T O I N D I R E T O! DIAGRAMA DE ESALHAMENTO DE MORAN O diagrama de espalhamento de Moran é uma maneira alternativa de visualizar o Índice Global de Moran, onde se pode verificar o relacionamento entre os valores observados dos desvios, de cada polígono, em relação à média global (Z) e os valores das médias locais (WZ). O Índice Global de Moran equivale ao coeficiente de regressão linear que indica a inclinação da reta de regressão de WZ em Z. Os quadrantes do diagrama são divididos em 78

80 HH (high, high), LL (low,low). HL (high, low) e LH (low, high), sendo que os dois primeiros indicam correlação espacial positiva (presença de regime espacial) e os dois últimos, correlação espacial negativa (presença de região de transição ou outlier). Verifica-se abaixo menor quantidade de pontos nos quadrantes LH e HL, comparando-se com a quantidade de pontos nos quadrantes HH e LL. Tal fato explica o alto valor obtido nos Índices Globais de Moran, tendo em vista que o produto Z x WZ dos pontos pertencentes aos quadrantes HH e LL contribuem positivamente no somatório do cálculo do referido índice. A L D A Í S A R E C A L C U L O D I R E T O I N D I R E T O! BOX MAP O Box Map classifica os polígonos, presentes no mapa, em 1 ou 2 (dependência espacial positiva (HH) ou negativa (LL)) ou em 3 ou 4 (áreas de transição ou presença de out liers (LH, HL)). Os referidos mapas são uma espacialização do Diagrama de Espalhamento de Moran. 79

81 80 Pelos mapas acima verifica-se a distribuição espacial da classificação dos polígonos em relação aos quadrantes do Diagrama de Espalhamento de Moran, cujos resultados apresentam continuidades, indicando a existência de grandes agrupamentos (clusters). A L D A Í S A D I R E T O R E C A L C U L O I N D I R E T O

82 ! LISA MAP O LISA Map avalia o nível de significância dos índices locais de Moran, obtidos para cada polígono. Tal avaliação da significância é feita comparando os valores de IMoran com uma série de valores obtidos por meio de permutação dos valores dos vizinhos sob a hipótese nula de inexistência de autocorrelação. Os valores de significância, são, então classificados em quatro grupos: não significante, significância de 5%, 1% e 0,1%. A L D A Í S A R E C A L C U L O D I R E T O I N D I R E T O Pelos mapas acima se verifica a distribuição espacial dos valores de significância, cujos resultados apresentam predominância da classificação "não significante" dos valores do Índice Local de Moran obtidos para cada polígono. Porém os mapas acima revelam regiões específicas com agrupamentos significativos (Santana, Campo dos Alemães, Jd. Esplanada, Putim e Jd. Diamante). 81

83 ! MORAN MAP Moram Map é um mapa síntese que combina o LISA MAP e o BOX MAP, destacando os polígonos com significância abaixo de 5% e seu respectivo quadrante. A L D A Í S A R E C A L C U L O D I R E T O I N D I R E T O Pelos mapas acima se verifica a distribuição espacial da classificação, para os polígonos considerados significantes (5%, 1% e 0,1%), em relação aos quadrantes do Diagrama de Espalhamento de Moran, sendo os demais "não significantes", cujos resultados mostram predominância da classificação como "não significante", em concordância com o resultado apresentado no LISA Map. Este comportamento evidencia a existência de agrupamentos significantes em locais específicos (regiões isoladas) para os novos Índices de Exclusão Social no município de São José dos Campos. 82

84 4 CONCLUSÕES As conclusões estão divididas segundo as análises estatísticas e espaciais realizadas para cada novo índice de exclusão social calculado. - Novo índice de exclusão social (n_exclu) Quantitativamente sua Média é semelhante ao do Índice de Exclusão Social original, porém localmente (Qualitativamente) percebe-se erros consideráveis. O Novo Índice diferenciouse levemente do original, em sua espacilização, em função da variável M_CHF, a única considerada no N_Equidade, gerando uma certa confusão nas análises. Pode-se notar esta interferência nas regiões do Jd. da Granja, Jd Uirá, entre outros. O número de mulheres chefes de família não é exclusivamente uma característica dos excluídos, mas uma realidade da nova ordem social que se instala atualmente. - Novo índice de exclusão social direto (n_ex_dir) Quantitativamente a Média apresentou-se um pouco abaixo do Índice original, porém localmente (Qualitativamente) apresentou bom resultado. - Novo índice de exclusão social indireto (n_e_ind) Quantitativamente a Média apresentou-se um pouco acima do Índice original, porém localmente (Qualitativamente) apresentou o melhor resultado. - Índice Global de Moran Os valores do índice mostraram-se muito próximos, indicando significativa correlação espacial. Mostra a manutenção dos agrupamentos para todos os novos índices gerados. O N_EX_IND apresentou maior autocorrelação espacial na região do Jd. Satélite que os outros, por considerar apenas o DES_HUM, o qual possui um agrupamento de incluídos neste local. - Diagrama de espalhamento de moran A forma elipsoidal do espalhamento indica que há tendência de autocorrelação para todos os Índices. - Box map A distribuição HH, LL, LH e HL apresentam comportamento semelhante. 83

85 - LISA Map As regiões significantes (Santana, Campo dos Alemães, Jd. Esplanada, Putim e Jd. Diamante) foram as mesmas para todos os índices gerados. A análise qualitativa da espacialização dos novos índices traz apenas uma percepção do comportamento de cada uma, porém a precisão dos mesmos é verificada nos gráficos de barras. Comparando-se os mapas de barras abaixo, referentes as diferenças dos três novos índices em relação ao índice original de exclusão social, pode-se constatar que o índice indireto apresenta menor diferenças em relação aos outros, sendo que o pior resultado (embora não significativo) foi obtido pelo novo exclusão (soma linear dos novos subíndices). Os mapas de barras abaixo apresentam uma comparação em detalhe entre os novos índices e o índice original (Sposati, 1996), para a área teste escolhida da região do Campo dos Alemães. Os resultados mostram que o índice indireto apresentou-se mais semelhante ao original. NOVO DIRETO INDIRETO 84

Patrícia C. Genovez Norton Roberto Caetano Roberto Duque Estrada

Patrícia C. Genovez Norton Roberto Caetano Roberto Duque Estrada MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS ANÁLISE ESPACIAL E ESTATÍSTICA DA METODOLOGIA DE CONSTRUÇÃO DO ÍNDICE DE EXCLUSÃO/INCLUSÃO SOCIAL: RELATIVO À ÁREA URBANA DE

Leia mais

Módulo 16- Análise de Regressão

Módulo 16- Análise de Regressão Módulo 6 Análise de Regressão Módulo 6- Análise de Regressão Situação Problema Um grupo de investidores estrangeiros deseja aumentar suas atividades no Brasil. Considerando a conjuntura econômica de moeda

Leia mais

Análise espacial da incidência de Dengue no município de São Paulo

Análise espacial da incidência de Dengue no município de São Paulo Análise espacial da incidência de Dengue no município de São Paulo João Vitor, Joyane, Nayara e Rafael TRABALHO FINAL - ETAPA III - MTI QUADRIMESTRE 2015.2 Introdução ESCALA: Distrital TEMPO: 2010 O uso

Leia mais

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO:

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO: INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 Estudos de Mercado EXAME: DATA 24 / 02 / 20010 NOME DO ALUNO: Nº INFORMÁTICO: TURMA: PÁG. 1_ PROFESSOR: ÉPOCA: Grupo I (10

Leia mais

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro Exame de Recorrência de Métodos Estatísticos Departamento de Matemática Universidade de Aveiro Data: 6/6/6 Duração: 3 horas Nome: N.º: Curso: Regime: Declaro que desisto Classificação: As cotações deste

Leia mais

Estudo dirigido de Análise Multivariada

Estudo dirigido de Análise Multivariada Estudo dirigido de Análise Multivariada Conceitos Iniciais De um modo geral, os métodos estatísticos de análise multivariada são aplicados para analisar múltiplas medidas sobre cada indivíduo ou objeto

Leia mais

Regressão linear múltipla. Regressão linear múltipla

Regressão linear múltipla. Regressão linear múltipla Regressão linear múltipla 35 R 2 = 61% Maria Virginia P Dutra Eloane G Ramos Vania Matos Fonseca Pós Graduação em Saúde da Mulher e da Criança IFF FIOCRUZ Baseado nas aulas de M. Pagano e Gravreau e Geraldo

Leia mais

5 Resultados e Interpretação do Índice Construído

5 Resultados e Interpretação do Índice Construído 5 Resultados e Interpretação do Índice Construído Apresentam-se, nesta seção, os resultados dos scores e interpretação da escala produzida. O objetivo é responder questões do tipo: O que significa uma

Leia mais

Gabarito Lista 2 LES0773 Estatística III. Os resultados dessa regressão são apresentados na seguinte tabela:

Gabarito Lista 2 LES0773 Estatística III. Os resultados dessa regressão são apresentados na seguinte tabela: Gabarito Lista 2 LES0773 Estatística III Exercício 1) Utilizando a ferramenta Análise de Dados e a sua função Regressão, foi realizada uma regressão levando em consideração os gastos com PD como variável

Leia mais

Métodos Quantitativos Aplicados

Métodos Quantitativos Aplicados Métodos Quantitativos Aplicados Aula 7 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Relações de interdependência entre variáveis quantitativas: A Análise Factorial Análise Factorial: técnica

Leia mais

MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS CURSO DE PÓS-GRADUAÇÃO EM SENSORIAMENTO REMOTO RELATÓRIO TÉCNICO:

MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS CURSO DE PÓS-GRADUAÇÃO EM SENSORIAMENTO REMOTO RELATÓRIO TÉCNICO: MINISTÉRIO DA CIÊNCIA E TECNOLOGIA INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS CURSO DE PÓS-GRADUAÇÃO EM SENSORIAMENTO REMOTO RELATÓRIO TÉCNICO: ANÁLISE ESPACIAL DA DINÂMICA DE EXCLUSÃO XCLUSÃO/INCLUSÃO

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Regressão David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Regressão Linear ( e Múltipla ) Não-Linear ( Exponencial / Logística

Leia mais

Regressão linear múltipla - Correlação parcial

Regressão linear múltipla - Correlação parcial Regressão linear múltipla - Correlação parcial trigo Matriz de correlações: trigo % matéria orgânica 40 103 32 1 58 192 45 28 50 300 39 5 72 420 46 11 61 510 34 14 69 630 38 2 63 820 32 12 % matéria orgânica

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Permite avaliar se existe relação entre o comportamento de duas ou mais variáveis e em que medida se dá tal interação. Gráfico de Dispersão A relação entre duas variáveis pode ser

Leia mais

4 Análise dos resultados 4.1. Perfil do respondente

4 Análise dos resultados 4.1. Perfil do respondente 4 Análise dos resultados 4.. Perfil do respondente Através da análise dos questionários aplicados, verificou-se que o perfil típico do respondente foi: mulher, entre 3 e 40 anos, remunerações de até oito

Leia mais

M l u t l i t c i oli l n i e n arid i a d de

M l u t l i t c i oli l n i e n arid i a d de Multicolinearidade 1 Multicolinearidade Quando existem relação linear exata entre as variáveis independentes será impossível calcular os estimadores de MQO. O procedimento MQO utilizado para estimação

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos 1 Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 27 de Setembro de 2016 2 3 O modelo de regressão linear é dado por 3 O modelo de regressão linear é dado por Y i = β

Leia mais

Renda x Vulnerabilidade Ambiental

Renda x Vulnerabilidade Ambiental Renda x Vulnerabilidade Ambiental ANEXO D ANÁLISE EXPLORATÓRIA E PREPARAÇÃO DOS DADOS Identificamos tendência linear positiva. A correlação entre as variáveis é significativa, apresentando 99% de confiança.

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro

Leia mais

REGRESSÃO MÚLTIPLA. constantes predeterminadas, sem erro;

REGRESSÃO MÚLTIPLA. constantes predeterminadas, sem erro; REGRESSÃO MÚLTIPLA Um método utilizado para determinar qual a relação entre a variável que se pretende explicar e as variáveis que se pretendem ser explicativas. Descreve uma relação entre um conjunto

Leia mais

Associação entre duas variáveis

Associação entre duas variáveis Associação entre duas variáveis Questões de interesse: Será que duas variáveis são independentes ou pelo contrário dependentes? E se forem dependentes, qual o tipo e grau de dependência? Existem diversas

Leia mais

5 Análise dos resultados

5 Análise dos resultados 5 Análise dos resultados Os dados foram analisados utilizando o software SPSS (Statistical Package for Social Sciences) base 18.0. Para Cooper e Schindler (2003) a análise de dados envolve a redução de

Leia mais

Exame de Recurso de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

Exame de Recurso de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro Exame de Recurso de Métodos Estatísticos Departamento de Matemática Universidade de Aveiro Data: /7/6 Duração: 3 horas Nome: N.º: Curso: Regime: Declaro que desisto Classificação: As cotações deste exame

Leia mais

Associação entre duas variáveis

Associação entre duas variáveis Associação entre duas variáveis Questões de interesse: Será que duas variáveis são independentes ou pelo contrário dependentes? E se forem dependentes, qual o tipo e grau de dependência? Medir o grau de

Leia mais

6 Tratamento e análise dos dados

6 Tratamento e análise dos dados Tratamento e análise dos dados 58 6 Tratamento e análise dos dados Este capítulo apresenta as séries temporais das variáveis previdenciárias e dos indicadores apresentados na revisão de literatura. Relata

Leia mais

i j i i Y X X X i j i i i

i j i i Y X X X i j i i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Métodos Quantitativos para Avaliação de Políticas Públicas

Métodos Quantitativos para Avaliação de Políticas Públicas ACH3657 Métodos Quantitativos para Avaliação de Políticas Públicas Aula 11 Análise de Resíduos Alexandre Ribeiro Leichsenring alexandre.leichsenring@usp.br Alexandre Leichsenring ACH3657 Aula 11 1 / 26

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Session 6 Introducing statistical modeling Part 2 (Correlation and Linear regression) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Continuar

Leia mais

Estatística descritiva

Estatística descritiva Estatística descritiva Para que serve a estatística? Qual o seu principal objectivo? obter conclusões sobre a população usando uma amostra? População Amostragem Amostra Uma ou mais variáveis (X) são observadas

Leia mais

AULAS 14 E 15 Modelo de regressão simples

AULAS 14 E 15 Modelo de regressão simples 1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 30 de abril e 02 de maio de 2013 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem

Leia mais

5 Estudo de Caso e Resultados

5 Estudo de Caso e Resultados 5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos

Leia mais

LISTA DE EXERCÍCIOS - TÉCNICAS DE REGRESSÃO SIMPLES E MÚLTIPLA

LISTA DE EXERCÍCIOS - TÉCNICAS DE REGRESSÃO SIMPLES E MÚLTIPLA LISTA DE EXERCÍCIOS - TÉCNICAS DE REGRESSÃO SIMPLES E MÚLTIPLA 1 1) Em um estudo foi utilizada, erroneamente, uma amostra de apenas 3 observações para se estimarem os coeficientes de uma equação de regressão.

Leia mais

Módulo 19 - Análise Discriminante Geração de Tabelas

Módulo 19 - Análise Discriminante Geração de Tabelas Módulo 19 - Análise Discriminante Geração de Tabelas Situação Problema Um banco deseja classificar seus clientes de acordo com seu perfil de investimento: investidor conservador, investidor moderado ou

Leia mais

Correlação e Regressão Linear

Correlação e Regressão Linear Correlação e Regressão Linear Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais CORRELAÇÃO LINEAR Coeficiente de correlação linear r Mede o grau de relacionamento linear entre valores

Leia mais

Exame Final de Métodos Estatísticos

Exame Final de Métodos Estatísticos Exame Final de Métodos Estatísticos Data: de Junho de 26 Duração: 3h. Nome: Curso: Declaro que desisto N. Mec. Regime: As cotações deste exame encontram-se na seguinte tabela. Responda às questões utilizando

Leia mais

Análise de convergência de renda entre os municípios do Maranhão. Carlos Fernando Quartaroli

Análise de convergência de renda entre os municípios do Maranhão. Carlos Fernando Quartaroli Análise de convergência de renda entre os municípios do Maranhão Carlos Fernando Quartaroli Convergência absoluta Se for encontrado um coeficiente beta menor do que zero, estatisticamente significativo,

Leia mais

Modelos de Análise de Variância

Modelos de Análise de Variância Modelos de Análise de Variância Delineamento Completamente Aleatorizado: k tratamentos, r réplicas (balanceado) yi iid ~ N ; i i Normalidade Variância constante ( homocedasticidade ) Independência Análise

Leia mais

RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE

RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE CE225 - Modelos

Leia mais

PESQUISA SOCIOLÓGICA SÃO LUIS MA

PESQUISA SOCIOLÓGICA SÃO LUIS MA PESQUISA SOCIOLÓGICA SÃO LUIS MA Pesquisa realizada pelo Projeto Brasil 21 Coordenador de Pesquisa Brasil 21: Pr. Luis André Bruneto Oliveira Prof. Omar Neto Fernandes Barros Localização da cidade INTRODUÇÃO

Leia mais

ECONOMETRIA I. I (12 valores)

ECONOMETRIA I. I (12 valores) Faculdade de Economia Universidade Nova de Lisboa ECONOMETRIA I Exame de 2ª Época 26 de Janeiro de 2005 Duração: 2 horas I (12 valores) ATENÇÃO: Para as 10 primeiras questões deste grupo existem 4 opções

Leia mais

Módulo 16- Análise de Regressão

Módulo 16- Análise de Regressão Módulo 16 Análise de Regressão 1 Módulo 16- Análise de Regressão Situação Problema Um grupo de investidores estrangeiros deseja aumentar suas atividades no Brasil. Considerando a conjuntura econômica de

Leia mais

Regressão Linear Simples

Regressão Linear Simples Regressão Linear Simples Mario Andrade Lira Junior Direitos autorais reservados segundo licença Creative Commons 3.0: com Atribuição; Não Comercial; Compartilha Igual Termos importantes Tipos de variáveis

Leia mais

4 Aplicação para o mercado brasileiro

4 Aplicação para o mercado brasileiro 4 Aplicação para o mercado brasileiro 4.1 Dados Uma aplicação da metodologia de Simulação Histórica Filtrada (SHF) foi realizada, a partir dos preços de opções do mercado brasileiro, como forma de verificar

Leia mais

AULAS 14 E 15 Modelo de regressão simples

AULAS 14 E 15 Modelo de regressão simples 1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 18 e 23 de outubro de 2012 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem

Leia mais

Bibliografia Recomendada

Bibliografia Recomendada Bibliografia Recomendada Barros Neto, B.; Scarminio, I. S.; Bruns, R. E. Como Fazer Experimentos. Montgomery, D. C. Design and Analysis of Experiments. Box, G. E. P.; Hunter, J. S.; Hunter, W. G. Statistics

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010

Leia mais

BIOESTATÍSTICA. Análise de regressão

BIOESTATÍSTICA. Análise de regressão BIOESTATÍSTICA Análise de regressão Análise de correlação Existe uma associação estatística entre duas variáveis? As duas variáveis são independentes ( ou seja, qual o grau da variação das duas juntas)?

Leia mais

Regressão Linear em SPSS

Regressão Linear em SPSS Regressão Linear em SPSS 1. No ficheiro Calor.sav encontram-se os valores do consumo mensal de energia, medido em milhões de unidades termais britânicas, acompanhados de valores de output, em milhões de

Leia mais

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito Unidade IV - Regressão Regressões Lineares Modelo de Regressão Linear Simples Terminologia Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito Regressão correlação Diferença

Leia mais

Mapas e Estatística. Professores Ligia Vizeu Barrozo Reinaldo Paul Pérez Machado

Mapas e Estatística. Professores Ligia Vizeu Barrozo Reinaldo Paul Pérez Machado Mapas e Estatística Professores Ligia Vizeu Barrozo Reinaldo Paul Pérez Machado Abordagens Características básicas Ciência Provisório Explicativo Lógico Empírico Filosofia Provisório Explicativo Lógico

Leia mais

Análise da Relação entre a Precariedade Habitacional e Renda na RMBS

Análise da Relação entre a Precariedade Habitacional e Renda na RMBS Universidade Federal do ABC Análise da Relação entre a Precariedade Habitacional e Renda na RMBS Profª Drª Flávia Feitosa Gabriel Marques - 21055715 Gabrielle Rosa - 21074015 Gilmara Gonçalves - 11044913

Leia mais

Estatística Aplicada ao Serviço Social

Estatística Aplicada ao Serviço Social Estatística Aplicada ao Serviço Social Módulo 7: Correlação e Regressão Linear Simples Introdução Coeficientes de Correlação entre duas Variáveis Coeficiente de Correlação Linear Introdução. Regressão

Leia mais

REGRESSÃO PONDERADA GEOGRAFICAMENTE PARA OS DADOS DO CENSO IBGE 2000 DE SÃO PAULO SP

REGRESSÃO PONDERADA GEOGRAFICAMENTE PARA OS DADOS DO CENSO IBGE 2000 DE SÃO PAULO SP REGRESSÃO PONDERADA GEOGRAFICAMENE PARA OS DADOS DO CENSO IBGE 000 DE SÃO PAULO SP Vinicius Santos Oliveira PG Praça Mal. Eduardo Gomes, 50 - Vila das Acácias - CEP 18-900 São José dos Campos - SP Brasil

Leia mais

AULAS 17 E 18 Análise de regressão múltipla: estimação

AULAS 17 E 18 Análise de regressão múltipla: estimação 1 AULAS 17 E 18 Análise de regressão múltipla: estimação Ernesto F. L. Amaral 22 e 24 de outubro de 2013 Avaliação de Políticas Públicas (DCP 046) Fonte: Cohen, Ernesto, e Rolando Franco. 2000. Avaliação

Leia mais

4. ANÁLISE DOS RESULTADOS DA PESQUISA

4. ANÁLISE DOS RESULTADOS DA PESQUISA 68 4. ANÁLISE DOS RESULTADOS DA PESQUISA Conforme já comentado, este estudo visa analisar a relação entre o EVA e o retorno das ações no mercado acionário brasileiro, através da aplicação de dois modelos

Leia mais

ESTATÍSTICA MULTIVARIADA. 2º. Semestre 2006/07

ESTATÍSTICA MULTIVARIADA. 2º. Semestre 2006/07 ESTATÍSTICA MULTIVARIADA º. Semestre 006/07.Março.007 José Filipe Rafael Fez um inquérito a 45 potenciais clientes de um novo produto pedindo-lhes que avaliassem nove características diferentes numa escala

Leia mais

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Análise da Regressão. Prof. Dr. Alberto Franke (48) Análise da Regressão Prof. Dr. Alberto Franke (48) 91471041 O que é Análise da Regressão? Análise da regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas

Leia mais

ANÁLISE ESPACIAL DA DISTRIBUIÇÃO DA VEGETAÇÃO OBTIDA POR NDVI NO ESPAÇO URBANO

ANÁLISE ESPACIAL DA DISTRIBUIÇÃO DA VEGETAÇÃO OBTIDA POR NDVI NO ESPAÇO URBANO ANÁLISE ESPACIAL DA DISTRIBUIÇÃO DA VEGETAÇÃO OBTIDA POR NDVI NO ESPAÇO URBANO Leonardo Rodrigues de Deus Doutorado em Sensoriamento Remoto Instituto Nacional de Pesquisas Espaciais Disciplina: Análise

Leia mais

TRABALHO PARA DISCIPLINA SER-301 REGRESSÃO GEOGRAFICAMENTE PONDERADA APLICADA NA ANÁLISE DO INCÔMODO CAUSADO PELO RUÍDO AERONÁUTICO

TRABALHO PARA DISCIPLINA SER-301 REGRESSÃO GEOGRAFICAMENTE PONDERADA APLICADA NA ANÁLISE DO INCÔMODO CAUSADO PELO RUÍDO AERONÁUTICO TRABALHO PARA DISCIPLINA SER-301 REGRESSÃO GEOGRAFICAMENTE PONDERADA APLICADA NA ANÁLISE DO INCÔMODO CAUSADO PELO RUÍDO AERONÁUTICO Gustavo Sobreiro Santos Instituto Tecnológico de Aeronáutica, Brasil.

Leia mais

Aumento amostral via arquétipos na avaliação do potencial hídrico de espécies de eucalipto

Aumento amostral via arquétipos na avaliação do potencial hídrico de espécies de eucalipto Aumento amostral via arquétipos na avaliação do potencial hídrico de espécies de eucalipto Pórtya Piscitelli Cavalcanti 1 4 Carlos Tadeu dos Santos Dias 2 4 Patrícia Andressa de Ávila 3 4 José Leonardo

Leia mais

UNIVERSIDADE FEDERAL DO ABC Bacharelado em Planejamento Territorial Métodos e técnicas de análise da informação para o planejamento territorial

UNIVERSIDADE FEDERAL DO ABC Bacharelado em Planejamento Territorial Métodos e técnicas de análise da informação para o planejamento territorial UNIVERSIDADE FEDERAL DO ABC Bacharelado em Planejamento Territorial Métodos e técnicas de análise da informação para o planejamento territorial ANÁLISE ESPACIAL DOS ÍNDICES DE GRAVIDEZ NA ADOLESCÊNCIA

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando

Leia mais

ESTATÍSTICA EXPERIMENTAL. ANOVA. Aula 05

ESTATÍSTICA EXPERIMENTAL. ANOVA. Aula 05 ESTATÍSTICA EXPERIMENTAL ANOVA. Aula 05 Introdução A ANOVA ou Análise de Variância é um procedimento usado para comparar a distribuição de três ou mais grupos em amostras independentes. A análise de variância

Leia mais

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação Capítulo 3 O Modelo de Regressão Linear Simples: Especificação e Estimação Introdução Teoria Econômica Microeconomia: Estudamos modelos de oferta e demanda (quantidades demandadas e oferecidas dependem

Leia mais

Aula prática 4 Parte I - Correlação e regressão linear simples

Aula prática 4 Parte I - Correlação e regressão linear simples Aula prática 4 Parte I - Correlação e regressão linear simples Para esta aula prática vamos trabalhar com dados de um estudo cujo objetivo foi verificar a associação entre atividade física, aptidão cardiorrespiratória

Leia mais

i j i i Y X X X i j 1 i 2 i i

i j i i Y X X X i j 1 i 2 i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semana Conteúdo 1 Apresentação da disciplina. Princípios de modelos lineares

Leia mais

REGRESSÃO LINEAR. Introdução a Estatítica Aplicada a Climatologia Programa de Pós Graduação em Geografia Física Universidade de São Paulo

REGRESSÃO LINEAR. Introdução a Estatítica Aplicada a Climatologia Programa de Pós Graduação em Geografia Física Universidade de São Paulo REGRESSÃO LINEAR Introdução a Estatítica Aplicada a Climatologia Programa de Pós Graduação em Geografia Física Universidade de São Paulo REGRESSÃO LINEAR REGRESSÃO LINEAR A correlação linear mostra quanto

Leia mais

Estatística Aplicada II. } Regressão Linear

Estatística Aplicada II. } Regressão Linear Estatística Aplicada II } Regressão Linear 1 Aula de hoje } Tópicos } Regressão Linear } Referência } Barrow, M. Estatística para economia, contabilidade e administração. São Paulo: Ática, 007, Cap. 7

Leia mais

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA

Leia mais

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação 1 AULAS 21 E 22 Análise de Regressão Múltipla: Estimação Ernesto F. L. Amaral 28 de outubro e 04 de novembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Cohen, Ernesto, e Rolando Franco. 2000. Avaliação

Leia mais

Mais Informações sobre Itens do Relatório

Mais Informações sobre Itens do Relatório Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo

Leia mais

Introdução. Teste e avaliação de modelos. Teste e avaliação de modelos. Teste de modelos. Avaliação de modelos

Introdução. Teste e avaliação de modelos. Teste e avaliação de modelos. Teste de modelos. Avaliação de modelos Universidade Federal do Paraná Programa de Pós-Graduação em Ciências Veterinárias AZ 7 Tópicos em Produção Animal Introdução Qual o interesse em desenvolver modelos? Comparação de valores medidos e simulados

Leia mais

Modelos de Regressão para Dados de Contagem

Modelos de Regressão para Dados de Contagem UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Modelos de Regressão para Dados de Contagem CE225 - Modelos Lineares Generalizados Professor Cesar Taconelli Andrea A Alves, GRR: 20096668 NathanM

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS Em uma grande escola, 10% dos alunos são comprovadamente fracos. Um teste educacional conseguiu identificar corretamente 80% entre aqueles que são fracos e 85% entre aqueles que

Leia mais

Disciplina de Modelos Lineares

Disciplina de Modelos Lineares Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique

Leia mais

5 Agregação das Reservas das Entidades

5 Agregação das Reservas das Entidades 5 Agregação das Reservas das Entidades Neste capítulo é apresentado o procedimento de agregação das reservas das entidades. É importante ressaltar que as entidades probabilísticas sofrem agregação probabilística,

Leia mais

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa REGRESSÃO LINEAR Parte I Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Julho de 2015 Onde Estamos Para onde vamos Inferência Esta5s6ca se resumindo a uma equação

Leia mais

INTRODUÇÃO A ECONOMETRIA

INTRODUÇÃO A ECONOMETRIA INTRODUÇÃO A ECONOMETRIA Análise de regressão e uso do Eviews Introdução O modelo de regressão linear se utiliza para estudar a relação que existe entre uma variável dependente e uma ou várias variáveis

Leia mais

Modelos de Escolha Discreta. a)pretende-se conhecer os coeficientes da função de utilidade, assim como a sua significância estatística.

Modelos de Escolha Discreta. a)pretende-se conhecer os coeficientes da função de utilidade, assim como a sua significância estatística. Nº Observações espaço Lx centro espaço periferia nº clientes (15 min) centro Lx nº clientes (15 min) periferia estacionamento centro Lx estacionamento periferia tc rodo centro Lx tc rodo periferia Código

Leia mais

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo

Leia mais

HETEROGENEIDADE ESPACIAL COMO INDICADOR DE RISCO PARA DENGUE. Regina Fernandes Flauzino Reinaldo Souza-Santos

HETEROGENEIDADE ESPACIAL COMO INDICADOR DE RISCO PARA DENGUE. Regina Fernandes Flauzino Reinaldo Souza-Santos HETEROGENEIDADE ESPACIAL COMO INDICADOR DE RISCO PARA DENGUE Regina Fernandes Flauzino Reinaldo Souza-Santos OBJETIVO: Identificar fatores associados à ocorrência da dengue levando-se em conta a unidade

Leia mais

ANOVA - Etapas de Análise

ANOVA - Etapas de Análise ANOVA - Etapas de Análise Entender o Delineamento Estrutura de Tratamento Aleatorização das Unidades Amostrais Aleatorização das Unidades Experimentais aos Tratamentos Adotar um Modelo Estrutural e Distribucional

Leia mais

Capítulo 6 Análise dos Modelos

Capítulo 6 Análise dos Modelos Capítulo 6 Análise dos Modelos Como já foi visto no capítulo 5, foi adotada como técnica estatística capaz de analisar as relações existentes entre as diversas variáveis independentes selecionadas e a

Leia mais

Universidade Católica Portuguesa Faculdade de Ciências Económicas e Empresariais. ESTATÍSTICA MULTIVARIADA 2º. Semestre 2006/07

Universidade Católica Portuguesa Faculdade de Ciências Económicas e Empresariais. ESTATÍSTICA MULTIVARIADA 2º. Semestre 2006/07 Universidade Católica Portuguesa Faculdade de Ciências Económicas e Empresariais ESTATÍSTICA MULTIVARIADA 2º. Semestre 2006/07 28.Maio.2007 José Filipe Rafael I Um colega seu está a tentar explicar o salário

Leia mais

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada Aula 2 Regressão Linear Simples Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada Conceitos Gerais A análise de regressão é utilizada para explicar ou modelar a relação entre

Leia mais

Introdução ao modelo de Regressão Linear

Introdução ao modelo de Regressão Linear Introdução ao modelo de Regressão Linear Prof. Gilberto Rodrigues Liska 8 de Novembro de 2017 Material de Apoio e-mail: gilbertoliska@unipampa.edu.br Local: Sala dos professores (junto ao administrativo)

Leia mais

NOÇÕES SOBRE EXPERIMENTOS FATORIAIS

NOÇÕES SOBRE EXPERIMENTOS FATORIAIS 3 NOÇÕES SOBRE EXPERIMENTOS FATORIAIS Planejamento de Experimentos Design of Experiments - DOE Em primeiro lugar devemos definir o que é um experimento: Um experimento é um procedimento no qual alterações

Leia mais

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO Aluno: Claudemir

Leia mais

ANÁLISE ESTATÍSTICA DOS PRINCIPAIS INDICADORES DO MUNICÍPIO DE SÃO PAULO 2004

ANÁLISE ESTATÍSTICA DOS PRINCIPAIS INDICADORES DO MUNICÍPIO DE SÃO PAULO 2004 ANÁLISE ESTATÍSTICA DOS PRINCIPAIS INDICADORES DO MUNICÍPIO DE SÃO PAULO 24 Fátima Alexandre PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos

Leia mais

PROCESSOS ESTOCÁSTICOS

PROCESSOS ESTOCÁSTICOS PROCESSOS ESTOCÁSTICOS PNV 2452 TRATAMENTO E ANÁLISE DE DADOS 2015 MOTIVAÇÃO PARA A ANÁLISE DE DADOS Data Summary Number of Data Points = 30000 Min Data Value = 0.00262 Max Data Value = 982 Sample Mean

Leia mais

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo: 6 ESQUEMA DO CAPÍTULO Estatística Descritiva 6.1 IMPORTÂNCIA DO SUMÁRIO E APRESENTAÇÃO DE DADOS 6.2 DIAGRAMA DE RAMO E FOLHAS 6.3 DISTRIBUIÇÕES DE FREQUÊNCIA E HISTOGRAMAS 6.4 DIAGRAMA DE CAIXA 6.5 GRÁFICOS

Leia mais

Regressão Linear. Prof. Dr. Leandro Balby Marinho. Análise de Dados II. Introdução Regressão Linear Regressão Múltipla

Regressão Linear. Prof. Dr. Leandro Balby Marinho. Análise de Dados II. Introdução Regressão Linear Regressão Múltipla Regressão Linear Prof. Dr. Leandro Balby Marinho Análise de Dados II Prof. Leandro Balby Marinho 1 / 36 UFCG DSC Roteiro 1. Introdução 2. Regressão Linear 3. Regressão Múltipla Prof. Leandro Balby Marinho

Leia mais

([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV

([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV Data: 09/07/2003 ([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV Duração: 2 horas Nome: N.º: Curso: Regime: Número de folhas suplementares entregues pelo aluno: Declaro que desisto (VWDSURYDFRQVLVWHHPTXHVW}HVGHUHVSRVWDDEHUWDHDVUHVSHFWLYDVFRWDo}HVHQFRQWUDPVHQDWDEHODTXHVHVHJXH

Leia mais

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra) Testes de Tendência Central (média, mediana, proporção) Classificação Variável 1 Variável 2 Núm ero Gru pos Dependência Teste Z Paramétrico Quantitativa - 1 - Premissas Variância pop. * conhecida Teste

Leia mais

MOQ-14 Projeto e Análise de Experimentos

MOQ-14 Projeto e Análise de Experimentos Instituto Tecnológico de Aeronáutica Divisão de Engenharia Mecânica-Aeronáutica MOQ-14 Projeto e Análise de Experimentos Profa. Denise Beatriz Ferrari www.mec.ita.br/ denise denise@ita.br Regressão Linear

Leia mais

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO Mario de Andrade Lira Junior lira.pro.br\wordpress REGRESSÃO X CORRELAÇÃO Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida

Leia mais

Análise de Regressão

Análise de Regressão Análise de Regressão Tópicos em Avaliação de Desempenho de Sistemas Aline Oliveira Camila Araujo Iure Fé Janailda aso2@cin.ufpe.br cga2@cin.ufpe.br isf2@cin.ufpe.br jbs4@cin.ufpe.br Agenda Parte I: Contextualização

Leia mais