BA STA BOLETIM DE ANÁLISE ESTATÍSTICO CLASSIFICAÇÃO DO BRASIL. em base a Indicadores do ATLAS BRASIL BASTA 2014 v1

Tamanho: px
Começar a partir da página:

Download "BA STA BOLETIM DE ANÁLISE ESTATÍSTICO CLASSIFICAÇÃO DO BRASIL. em base a Indicadores do ATLAS BRASIL BASTA 2014 v1"

Transcrição

1 BA STA BOLETIM DE ANÁLISE ESTATÍSTICO CLASSIFICAÇÃO DO BRASIL em base a Indicadores do ATLAS BRASIL 2013 BASTA 2014 v1 ATLAS BRASIL 2013: DIMENSÃO EDUCAÇÃO Amália Costa Farias ATLAS BRASIL 2013: DIMENSÃO RENDA Benedito Geovani Martins de Paiva ATLAS BRASIL 2013: DIMENSÕES DEMOGRAFIA E HABITAÇÃO Cleonice Nazaré do Nascimento ATLAS BRASIL 2013: ALGUMAS VARIÁVEIS DA DIMENSÃO EDUCAÇÃO Dione Fagundes Nunes Gomes ATLAS BRASIL 2013: DIMENSÃO DESENVOLVIMENTO HUMANO Luciano Ferreira da Silva ATLAS BRASIL 2013: DIMENSÃO TRABALHO Maria Carolina Mirabella Belloque

2 ATLAS BRASIL 2013: DIMENSÃO LIBERDADE ECONÔMICA Renato Almeida Santos ATLAS BRASIL 2013: DIMENSÃO DESVULNERABILIDADE Sandra Rocio Parada Castiblanco ATLAS BRASIL 2013: DIMENSÃO GESTÃO FISCAL DOS MUNICÍPIOS Silmara C. Gomes

3 PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Amália Costa Farias 1º Semestre 2014

4 2 1. INTRODUÇÃO O presente trabalho tem por objetivo efetuar uma análise discriminante e verificar os principais componentes da Dimensão Educação baseado no banco de dados Atlas Brasil Para tal, iniciamos com o entendimento de dados, incluindo a definição dos indivíduos e das variáveis, suas classificações em variáveis categóricas ou quantitativas, os significados e unidades de medida, além da apresentação de dados, gráficos e mapas. Na sequência a comparação de médias, intervalos de confiança, variância e análise discriminante de dados quantitativos sobre a dimensão educação dos municípios do Brasil. O processo lógico da análise discriminante nas funções linear e quadrática considerando regiões brasileiras agrupadas no trabalho (8). Em seguida o agrupamento de dados apresentados em Brasis. Neste trabalho será abordada as dimensões ALFAB 15 A17n1, T_FUND15A17n, T_FLBASn. 2. ENTENDENDO OS DADOS 2.1 Os indivíduos Os indivíduos deste trabalho são os municípios brasileiros que serão analisados pelos indicadores relativos a dimensão Educação presente no Atlas Brasil 2013, dados referente a Este sujeito da análise é composto por um total de 5565 municípios brasileiros e os dados analisados de cada município são variáveis descritas na próxima seção. 2.2 As Variáveis São 12 as variáveis desta pesquisa, incluindo a Unidade da Federação (UF). As mesmas são melhor explicadas na Tabela 1. Ressalta-se que todos os dados desta pesquisa são referentes ao ano de Tabela 1. As Variáveis DIMENSÃO VARIÁVEL SIGNIFICADO TIPO UNIDADE DE MEDIDA Educação Município Nome do Município Variável Categórica Educação UFN Nome do Estado Variável Categórica Educação Ano 2010 Variável Categórica Educação E_ANOSESTUDO Número médio de anos de estudo que Variável uma geração de crianças que ingressa na Quantitativa escola deverá completar ao atingir 18 anos de idade, se os padrões atuais se mantiverem ao longo de sua vida escolar. Educação T_ANALF11A14 Razão entre a população de 11 a 14 anos de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Educação T_ANALF15A17 Razão entre a população de 15 a 17 anos de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Educação T_ANALF18M Razão entre a população de 18 anos ou mais de idade que não sabe ler nem Variável Quantitativa Variável Quantitativa Variável Quantitativa N/A N/A N/A Absoluto (anos) Percentual Percentual Percentual

5 3 escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Educação T_FUND15A_17 Razão entre a população de 15 a 17 anos de idade que concluiu o ensino fundamental, em quaisquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo) e o total de pessoas nesta faixa etária multiplicado por 100. Educação T_FUND18M Razão entre a população de 18 anos ou mais de idade que concluiu o ensino fundamental, em quaisquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo) e o total de pessoas nesta faixa etária multiplicado por 100. Educação _FREQ6A17 Razão entre população de 6 a 17 anos de idade que estava frequentando a escola, em qualquer nível ou série e a população total nesta faixa etária multiplicado por 100. Variável Quantitativa Variável Quantitativa Variável Quantitativa Percentual Percentual Percentual Educação T_FLBAS Razão entre o número de pessoas na faixa etária de 6 a 17 anos frequentando o ensino básico (fundamental ou médio - regular ou seriado) e a população total dessa mesma faixa etária multiplicado por 100. As pessoas de 6 a 17 anos frequentando a pré-escola foram consideradas como se estivesse no 1º ano do ensino fundamental. As pessoas de 6 a 17 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. Educação T_FUND Razão entre o número de pessoas na faixa etária de 6 a 14 anos frequentando o ensino fundamental regular seriado e a população total dessa mesma faixa etária multiplicado por 100. As pessoas de 6 a 14 anos frequentando a pré-escola foram consideradas como se estivessem no 1º ano do ensino fundamental. Fonte: Atlas Brasil, Variável Quantitativa Variável Quantitativa Percentual Percentual 2.3. Tabela de Dados Tabela de Dados - Dimensão Educação Dados normalizados Variable N N* Mean SE Mean StDev Minimum Q1 Median T_FLBASn , , , , , ,80948 T_FUNDn , , , , , ,87270 FREQ 6A17n , , , , , ,95065 ALFAB 11A14n , , , , , ,94818 ALFAB 15A17n , , , , , ,94900 ALFAB 18Mn_ , , , , , ,71845 Variable Q3 Maximum T_FLBASn 0, ,00000 T_FUNDn 0, ,00000 FREQ 6A17n 0, ,00000

6 4 3. ANÁLISE DAS VARIÁVEIS 3.1 Variáveis Categóricas Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos d tipo pie chart e/ou barras Variável: Município A amostra totaliza 5565 municípios conforme o gráfico abaixo. Gráfico 1- Distribuição dos municípios nas Regiões Brasileiras Gráfico de Setores de Região NE 612; 33,0% N 148; 8,0% CO 165; 8,9% Category N CO S SE NE S 383; 20,6% SE 547; 29,5% De acordo com o gráfico pode observar que as maiores concentrações de municípios brasileiros estão na região nordeste com 33%, Sudeste com 29,5% somando juntas mais de 50% dos municípios pesquisados, com 62,30%

7 5 O gráfico 2 demostra a distribuição dos munícipios pelas Unidades Federativas do Brasil. SP 11,6% RS 8,9% Gráfico de Setores de UFN MG 15,3% BA 7,5% Other 0,0% PR 7,2% RR 0,3% AP 0,3% SE ES AC ROAM 1,3% 1,4% MS 0,4% 0,9% 1,1% 1,4% RJ AL 1,7% 1,8% TO 2,5% MT 2,5% PA 2,6% SC 5,3% MA 3,9% PB 4,0% PI 4,0% GO 4,4% RN 3,0% CE 3,3% PE 3,3% C ategory RR A P A C RO A M SE ES MS RJ A L TO MT PA RN C E PE MA PB PI GO SC PR BA RS SP MG Conforme pode ser observado no Gráfico 2, as Unidades da Federação mais representativas são Minas Gerais com15,3%, São Paulo com 11,6% e Rio Grande do Sul com 8,9%. As menos expressivas são Amazonas, Sergipe, Espirito Santos. Fonte: Atlas Brasil, 2014

8 6 Fonte: Atlas Brasil, 2014 Conforme a tabela acima houve uma evolução do IDHM no período de 1991 a 2010 nas seguintes proporções: - A população adulta com ensino fundamental concluído passou de 30,1% para 54,9%. - Crianças nas faixas de 5 a 6 anos frequentando a escola passaram de 37,3% para 91,1%. - Jovens de 11 a 13 a anos nos anos finais do fundamental passou de 36,8% para 84,9%. - Jovens de 15 a 17 anos com fundamental completo passou de 20% a 57,2%. Apesar da alta, 40% dos jovens nesta faixa ainda não tem o fundamental completo. - Jovens de 18 a 20 anos com ensino médio completo passou de 13% para 41%, o que significa que a maioria destes jovens ainda não possui o ensino médio completo. Fonte: Atlas Brasil, VARIÁVEIS QUANTITATIVAS Serão apresentadas a utilização da Análise Discriminante para a Dimensão Educação nos métodos Linear e Quadrático. Busca a simplicidade na análise dos dados, sendo assim caso a diferença seja irrelevante entre os métodos, adotaremos o método Linear da base.

9 ANÁLISE DISCRIMINANTE LINEAR POR REGIÃO A análise discriminante é uma técnica da estatística multivariada para discriminar e classificar objetos, e estuda a separação de objetos de uma população em duas classes ou mais. Neste caso queremos discriminar os valores das variáveis ALFAB 15A17n1, T_FUND15A17n e T_FLBAS do Brasil. Utilizaremos inicialmente a variável categórica Região e para a geração análise discriminante, o comando do Minitab: STAT>>MULTIVARIATE>> DISCRIMINANT ANALISYS Discriminant Analysis: Região versus ALFAB 15A17n1; FREQ 6A17n; T_FLBASn Linear Method for Response: Região Predictors: ALFAB 15A17n1; FREQ 6A17n; T_FLBASn Group CO N NE S SE Count Summary of classification True Group Put into Group CO N NE S SE CO N NE S SE Total N N correct Proportion 0,399 0,362 0,589 0,467 0,092 N = 5564 N Correct = 2114 Proportion Correct = 0,380 Squared Distance Between Groups CO N NE S SE CO 0, , , , ,10242 N 1, , , , ,33946 NE 1, , , , ,41494 S 0, , , , ,01445 SE 0, , , , ,00000 Linear Discriminant Function for Groups CO N NE S SE Constant -168,94-152,43-163,43-174,16-172,13 ALFAB 15A17n1 85,79 81,46 67,42 86,84 86,64 FREQ 6A17n 287,07 263,88 291,88 287,30 285,92 T_FLBASn -15,57-4,35-7,17-10,50-11,16 Summary of Misclassified Observations

10 8 Com base nas informações apresentadas a região que mais acertou foi a nordeste (0,589) seguida da região sul (0,467). A região com maior erro foi a sudeste (0,092). As informações exibem o cruzamento de dados entre regiões, por exemplo, a região nordeste possui 1813 municípios, porém, após agrupamento ficaram somente Essa matriz é denominada confusion matrix (matriz de confusão). Assim sendo, com a possibilidade de agrupamento podemos agrupar regiões com maior similaridade. Discriminant Analysis: AGRUPA versus ALFAB 15A17n1; T_FLBASn; T_FUNDn ANÁLISE DISCRIMINANTE LINEAR POR 4 BRASIS Esta segunda análise está interessada em verificar os possíveis agrupamentos dos dados utilizando a variável 4 Brasis calculada a partir do exercício anterior, e demonstra os agrupamentos do Brasil segundo sua proximidade de dados de Educação. Para a análise foram agrupadas as regiões do Sudeste e Centro Oeste, criando o COSE. Discriminant Analysis: AGRUPA versus ALFAB 15A17n1; T_FLBASn; T_FUNDn Linear Method for Response: 4 Brasis Predictors: ALFAB 15A17n1; T_FLBASn; T_FUNDn Group COSE N NE S Count Summary of classification True Group Put into Group COSE N NE S COSE N NE S Total N N correct Proportion 0,417 0,255 0,579 0,493 N = 5564 N Correct = 2634 Proportion Correct = 0,473 Squared Distance Between Groups COSE N NE S COSE 0, , , ,06660 N 0, , , ,91329 NE 1, , , ,53989 S 0, , , ,00000 Linear Discriminant Function for Groups COSE N NE S Constant -153,00-138,81-143,98-153,83 ALFAB 15A17n1 160,81 149,46 143,32 161,92 T_FLBASn -38,90-33,78-33,94-33,73 T_FUNDn 213,95 204,79 217,33 208,90

11 9 Existem duas possibilidades de realizar a Análise discriminante que são a linear e quadrática. Dependendo da variável deve verificar qual a mais adequada. Neste caso apresentou um resultado melhor que a quadrática. Podemos observar que alguns estados do S possuem características da COSE, visto pelo número 892 de municípios foram encontrados intersecção entre os dois agrupamentos de regiões ANÁLISE DISCRIMINANTE QUADRÁTICA POR 4 BRASIS Esta segunda análise está interessada em verificar os agrupamentos dos dados utilizando a variável 4 Brasis, utilizando o Método Quadrático para a Análise Discriminante. Foram mantidos os agrupamentos utilizados no item anterior, no Método Linear Discriminant Analysis: AGRUPA versus ALFAB 15A17n1; T_FLBASn; T_FUNDn Quadratic Method for Response: 4 BRASIS Predictors: ALFAB 15A17n1; T_FLBASn; T_FUNDn Group COSE N NE S Count Summary of classification True Group Put into Group COSE N NE S COSE N NE S Total N N correct Proportion 0,353 0,153 0,589 0,593 N = 5564 N Correct = 2590 Proportion Correct = 0,465 From Generalized Squared Distance to Group Group COSE N NE S COSE -17,57-15,25-16,36-17,73 N -16,25-15,55-16,77-15,91 NE -15,41-15,14-17,42-15,41 S -17,51-15,23-16,33-17,79 No Modelo Quadrático a proporção caiu de 0,473 para Neste caso, o melhor método é o linear.

12 ANÁLISE DISCRIMINANTE LINEAR PARA DADOS AGRUPADOS Dendrogram Single Linkage; Euclidean Distance 51,16 Similarity 67,44 83,72 100,00 AC CE TO BA AP AL RR AM RN SE PB MA PI ES MG Observations MS SP SC PR GO MT PE PA RS RJ RO Neste exemplo, utilizando o Dendrograma pesquisar o grau de similaridade das medias das variáveis ALFAB 15A17n1, T_FUNDn, T_FLBASn nos agrupamentos. Com base na análise discriminante poderemos verificar a proporção correta dos agrupamentos. Discriminant Analysis: C121 versus Mean ALFAB 15A17; Mean T_FLBAS;... * ERROR * After subtracting group means, Mean T_FUND is highly correlated with other predictors. * ERROR * Calculations for discriminant analysis cannot be done. Não foi possível realizar a análise descriminante pela as médias somente pelos números normalizados. Como não possível realizar a análise, apresentaremos o mapa com resultado do Dedrodrograma. O erro diz que as variáveis estão altamente correlacionadas com outros preditor. Cálculos de erros para a análise descriminante não pode ser feito.

13 REGRESSÃO LOGÍSTICA A regressão logística é um método que produz a partir de conjunto de variáveis e observações a predição de valores. Será apresentada a seguir a Regressão Logística para Dimensão Educação com as mesmas variáveis que estão sendo utilizadas ANOVA das Variáveis One-way ANOVA: ALFAB 15A17n1 versus Região Source DF SS MS F P Região 4 6, , ,95 0,000 Error , ,00469 Total ,95875 S = 0,06845 R-Sq = 20,98% R-Sq(adj) = 20,92% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 461 0, ,06736 (--*-) N 431 0, ,11661 (--*--) NE , ,07890 (*) S , ,05104 (*-) SE , ,04732 (-*) ,875 0,900 0,925 0,950 Pooled StDev = 0,06845

14 12 One-way ANOVA: T_FUNDn versus Região Source DF SS MS F P Região 4 0, , ,02 0,000 Error , ,00384 Total ,18398 S = 0,06200 R-Sq = 3,67% R-Sq(adj) = 3,61% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 461 0, ,06936 (---*--) N 431 0, ,11353 (---*---) NE , ,05508 (-*-) S , ,05216 (-*-) SE , ,05409 (-*-) ,840 0,855 0,870 0,885 Pooled StDev = 0,06200 One-way ANOVA: T_FUNDn versus Região Source DF SS MS F P Região 4 0, , ,02 0,000 Error , ,00384 Total ,18398 S = 0,06200 R-Sq = 3,67% R-Sq(adj) = 3,61% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 461 0, ,06936 (---*--) N 431 0, ,11353 (---*---) NE , ,05508 (-*-) S , ,05216 (-*-) SE , ,05409 (-*-) ,840 0,855 0,870 0,885 Pooled StDev = 0,06200 One-way ANOVA: T_FLBASn versus Região Source DF SS MS F P Região 4 0, , ,55 0,000 Error , ,00599 Total ,29205 S = 0,07739 R-Sq = 2,90% R-Sq(adj) = 2,83% Level N Mean StDev

15 13 CO 461 0, ,09467 N 431 0, ,11865 NE , ,06602 S , ,07233 SE , ,07345 Individual 95% CIs For Mean Based on Pooled StDev Level CO (----*---) N (----*----) NE (-*--) S (--*--) SE (--*-) ,780 0,795 0,810 0,825 Pooled StDev = 0, Regressão Logística (nova sequência crescente, ordinal) Ordinal Logistic Regression: AGRUPA versus ALFAB 15A17n1; T_FUNDn; T_FLBASn Link Function: Logit Response Information Variable Value Count AGRUPA COSE 2137 N 431 NE 1813 S 1183 Total 5564 Logistic Regression Table Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Const(1) -1, , ,00 0,003 Const(2) -0, , ,19 0,028 Const(3) 0, , ,44 0,151 ALFAB 15A17n1 2, , ,68 0,000 12,35 6,50 23,46 T_FUNDn 2, , ,31 0,001 8,81 2,43 31,93 T_FLBASn -4, , ,03 0,000 0,01 0,00 0,04 Log-Likelihood = -6944,309 Test that all slopes are zero: G = 135,350, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 16895, ,126 Deviance 13888, ,000 Measures of Association:

16 14 (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,8 Somers' D 0,14 Discordant ,5 Goodman-Kruskal Gamma 0,14 Ties ,8 Kendall's Tau-a 0,10 Total , Classification Tree DIMENSÃO EDUCAÇÃO Classication Tree Warnings Gain summary Tables are not displayed because profits are undefined. Target category gains tables are not displayed because target categories are undefined. Model Summary Specifications Growing Method CHAID Dependent Variable Independent Variables Validation Regiões AFALB 15A17np, T_FLBASnp, T_FUNDnp None Maximum Tree Depth 3 Results Minimum Cases in Parent Node Minimum Cases in Child Node Independent Variables Included AFALB 15A17np, T_FUNDnp, T_FLBASnp Number of Nodes 36 Number of Terminal Nodes 25 Depth 3

17 15

18 16 Risk Estimate Std. Error,408,007 Growing Method: CHAID Dependent Variable: Regiões Classification Observed Predicted CO N NE S SE Percent Correct CO ,0% N ,4% NE ,8% S ,3% SE ,6% Overall Percentage,0% 3,7% 35,4% 15,5% 45,4% 59,2% Growing Method: CHAID Dependent Variable: Regiões 3.5 Análise de Correspondência Gráfico imple Correspondence Analysis: Mean T_FLBAS; Mean T_FUND; Mean ALFAB 15A17 Relative Inertias alf fund flba Total AC 0,004 0,004 0,014 0,021 AL 0,028 0,028 0,098 0,153 AM 0,002 0,002 0,005 0,008 AP 0,001 0,001 0,002 0,003 BA 0,001 0,001 0,003 0,005 CE 0,004 0,004 0,013 0,021 ES 0,003 0,003 0,010 0,016 GO 0,005 0,005 0,018 0,028 MA 0,014 0,014 0,048 0,076 MG 0,003 0,003 0,012 0,019 MS 0,008 0,008 0,028 0,043 MT 0,024 0,024 0,084 0,132 PA 0,000 0,000 0,000 0,001 PB 0,009 0,009 0,033 0,052 PE 0,003 0,003 0,010 0,015 PI 0,021 0,021 0,075 0,118 PR 0,005 0,005 0,017 0,026 RJ 0,000 0,000 0,001 0,001 RN 0,010 0,010 0,037 0,058 RO 0,008 0,008 0,027 0,042 RR 0,009 0,009 0,031 0,049 RS 0,001 0,001 0,003 0,005 SC 0,005 0,005 0,018 0,029 SE 0,011 0,011 0,038 0,060 SP 0,003 0,003 0,011 0,017 TO 0,000 0,000 0,002 0,002

19 17 Total 0,181 0,181 0,637 1,000 * NOTE * Fewer components than requested Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0017 1,0000 1,0000 ****************************** Total 0,0017 Row Contributions Component 1 ID Name Qual Mass Inert Coord Corr Contr 1 AC 1,000 0,032 0,021 0,033 1,000 0,021 2 AL 1,000 0,038 0,153-0,083 1,000 0,153 3 AM 1,000 0,033 0,008 0,021 1,000 0,008 4 AP 1,000 0,040 0,003-0,012 1,000 0,003 5 BA 1,000 0,039 0,005-0,014 1,000 0,005 6 CE 1,000 0,039 0,021-0,030 1,000 0,021 7 ES 1,000 0,040 0,016 0,026 1,000 0,016 8 GO 1,000 0,040 0,028 0,034 1,000 0,028 9 MA 1,000 0,039 0,076-0,057 1,000 0, MG 1,000 0,040 0,019 0,028 1,000 0, MS 1,000 0,039 0,043 0,043 1,000 0, MT 1,000 0,037 0,132 0,077 1,000 0, PA 1,000 0,038 0,001-0,005 1,000 0, PB 1,000 0,039 0,052-0,047 1,000 0, PE 1,000 0,038 0,015-0,026 1,000 0, PI 1,000 0,040 0,118-0,070 1,000 0, PR 1,000 0,040 0,026 0,033 1,000 0, RJ 1,000 0,041 0,001 0,006 1,000 0, RN 1,000 0,039 0,058-0,050 1,000 0, RO 1,000 0,039 0,042 0,042 1,000 0, RR 1,000 0,031 0,049 0,052 1,000 0, RS 1,000 0,041 0,005 0,014 1,000 0, SC 1,000 0,040 0,029 0,035 1,000 0, SE 1,000 0,040 0,060-0,050 1,000 0, SP 1,000 0,040 0,017 0,026 1,000 0, TO 1,000 0,040 0,002-0,010 1,000 0,002 Column Contributions Component 1 ID Name Qual Mass Inert Coord Corr Contr 1 alf 1,000 0,319 0,181-0,031 1,000 0,181 2 fund 1,000 0,319 0,181-0,031 1,000 0,181 3 flba 1,000 0,363 0,637 0,054 1,000 0,637 * ERROR * Wrong axes pair specified Simple Correspondence Analysis: StDev T_ FLBAS; StDev T_ FUND; StDev ALFAB 15A1 Relative Inertias alf fund flba Total AC 0,003 0,003 0,014 0,019 AL 0,003 0,003 0,015 0,021 AM 0,008 0,008 0,039 0,054 AP 0,002 0,002 0,011 0,016 BA 0,000 0,000 0,001 0,001 CE 0,000 0,000 0,001 0,001 ES 0,003 0,003 0,015 0,021 GO 0,010 0,010 0,049 0,069 MA 0,005 0,005 0,024 0,033

20 18 MG 0,006 0,006 0,027 0,038 MS 0,008 0,008 0,040 0,057 MT 0,000 0,000 0,001 0,002 PA 0,001 0,001 0,003 0,004 PB 0,003 0,003 0,012 0,018 PE 0,002 0,002 0,009 0,012 PI 0,005 0,005 0,023 0,033 PR 0,010 0,010 0,051 0,072 RJ 0,007 0,007 0,035 0,049 RN 0,002 0,002 0,008 0,011 RO 0,014 0,014 0,067 0,095 RR 0,022 0,022 0,108 0,152 RS 0,007 0,007 0,035 0,049 SC 0,011 0,011 0,053 0,074 SE 0,003 0,003 0,013 0,018 SP 0,011 0,011 0,053 0,075 TO 0,001 0,001 0,004 0,005 Total 0,144 0,144 0,711 1,000 * NOTE * Fewer components than requested Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0529 1,0000 1,0000 ****************************** Total 0,0529 Row Contributions Component 1 ID Name Qual Mass Inert Coord Corr Contr 1 AC 1,000 0,074 0,019 0,117 1,000 0,019 2 AL 1,000 0,031 0,021 0,190 1,000 0,021 3 AM 1,000 0,087 0,054 0,182 1,000 0,054 4 AP 1,000 0,033 0,016-0,161 1,000 0,016 5 BA 1,000 0,028 0,001-0,050 1,000 0,001 6 CE 1,000 0,025 0,001 0,056 1,000 0,001 7 ES 1,000 0,019 0,021-0,242 1,000 0,021 8 GO 1,000 0,032 0,069-0,335 1,000 0,069 9 MA 1,000 0,032 0,033 0,234 1,000 0, MG 1,000 0,031 0,038-0,255 1,000 0, MS 1,000 0,028 0,057-0,325 1,000 0, MT 1,000 0,057 0,002-0,039 1,000 0, PA 1,000 0,044 0,004 0,068 1,000 0, PB 1,000 0,031 0,018 0,173 1,000 0, PE 1,000 0,034 0,012 0,139 1,000 0, PI 1,000 0,029 0,033 0,245 1,000 0, PR 1,000 0,027 0,072-0,374 1,000 0, RJ 1,000 0,018 0,049-0,375 1,000 0, RN 1,000 0,031 0,011 0,139 1,000 0, RO 1,000 0,025 0,095-0,445 1,000 0, RR 1,000 0,139 0,152 0,241 1,000 0, RS 1,000 0,027 0,049-0,310 1,000 0, SC 1,000 0,028 0,074-0,371 1,000 0, SE 1,000 0,025 0,018 0,195 1,000 0, SP 1,000 0,028 0,075-0,376 1,000 0, TO 1,000 0,035 0,005-0,091 1,000 0,005 Column Contributions Component 1 ID Name Qual Mass Inert Coord Corr Contr 1 alf 1,000 0,356 0,144-0,147 1,000 0,144 2 fund 1,000 0,356 0,144-0,147 1,000 0,144 3 flba 1,000 0,289 0,711 0,361 1,000 0,711 * ERROR * Wrong axes pair specified

21 19 4. CONSIDERAÇÕES FINAIS Para realizar a análise discriminante dos dados busca verificar qual dos métodos entre as funções linear e quadrática, demonstra maior assertividade nos agrupamentos e grupos de similaridade. Foram analisadas análises da dimensão Educação utilizando o agrupamento de 4 Brasis. Foi necessário agrupar o Mato Grosso ao grupo vermelho, ou seja, ao grupo 1 visto que o software necessita de pelo menos dois registro em cada grupo para fazer a análise discriminante. Na dimensão Educação as variáveis ALFAB. 15ª17n1, T_Fundn, T_FLBASn utilizamos a análise discriminante linear e conseguimos um resultado de 47,30% de proporção correta, valor muito baixo de confiança nos dados em análise. Foi considerado o resultado da linear porque a quadrática foi inferior. NA regresão Logística o resultado melhor, chegando a 56,8%, porém, com baixo grau de confiabilidade. Para a análise realizada da classification Tree por meio do software SPSS análise continuou com índices insatisfatório apresentando um percentual de 59,2% superior ao análise discriminante e logística, no entanto, baixo grau de confiabilidade.

22 PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO RENDA Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Benedito Geovani Martins de Paiva 1º Semestre 2014

23 2 SUMÁRIO 1. INTRODUÇÃO ENTENDENDO OS DADOS Os indivíduos As variáveis ANÁLISE DOS DADOS... 5 CONSIDERAÇÕES FINAIS... 7

24 3 1. INTRODUÇÃO Árvores de decisão são modelos estatísticos que utilizam um treinamento supervisionado para a classificação e previsão de dados. Em outras palavras, em sua construção é utilizado um conjunto de treinamento formado por entradas e saídas. Estas últimas são as classes. Estes modelos utilizam a estratégia de dividir para conquistar: um problema complexo é decomposto em sub-problemas mais simples e recursivamente esta técnica é aplicada a cada subproblema. O presente trabalho tem por objetivo efetuar uma análise comparativa de médias, intervalos de confiança e regressões de dados de indicadores relacionados ao desenvolvimento humano dos municípios do Brasil. Utilizamos a análise discriminante para tentar predizer ou explicar os indicadores relacionados ao renda e educação dos municípios do Brasil. Os dados são originários da pesquisa da Atlas Brasil 2013 com base nos dados sobre a dimensão Desenvolvimento Humano dos municípios do Brasil. Neste trabalho abordaremos as variáveis referentes RDPC, RENOCUP, PRENTRAB e RMPOBn dos municípios. O software estatístico utilizado é o SPSS.

25 4 2. ENTENDENDO OS DADOS 2.1 Os indivíduos Os indivíduos deste trabalho são os municípios brasileiros, que serão analisados pelos seus indicadores relativos à dimensão Renda presentes no relatório Atlas Brasil 2013, dados referentes ao ano de Este sujeito da análise é composto por um total de 5565 municípios brasileiros e os dados analisados de cada município são as variáveis que serão descritas a seguir. 2.2 As variáveis São 8 as variáveis desta pesquisa, incluindo a Unidade da Federação (UF). As mesmas são melhor explicadas na Tabela 1. Ressaltamos que todos os dados desta pesquisa são referentes ao ano de Tabela 1. As Variáveis Dimensão Varíavel Significado Tipo Ambas Município Nome do Município Renda RDPC Renda per capita média Renda RENOCUP Rendimento médio dos ocupados Renda Renda Desigualdade Desigualdade Desigualdade RMPOB RIND PRENTRAB REN5 PREN80 Renda domiciliar per capita média dos pobres Renda domiciliar per capita média dos extremamente pobres Percentual da renda proveniente de rendimentos do trabalho Percentual dos ocupados com rendimento de até 5 salários mínimo Percentual da renda apropriada pelos 80% mais pobres Variável Categórica Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Unidade de medida N/A Absoluto (valor) Absoluto (valor) Absoluto (valor) Absoluto (valor) Percentual Percentual Percentual Fonte: elaborado pelo autor, 2014.

26 5 3. ANÁLISE DOS DADOS Classification Tree [DataSet0] Warnings Gain summary Tables are not displayed because profits are undefined. Target category gains tables are not displayed because target categories are undefined. Model Summary Specifications Growing Method CHAID Dependent Variable Independent Variables Validation Região RDPCn, RENOCUPn, PRENTRABn, RMPOBn None Maximum Tree Depth 3 Results Minimum Cases in Parent Node Minimum Cases in Child Node Independent Variables Included RDPCn, PRENTRABn, RMPOBn, RENOCUPn Number of Nodes 72 Number of Terminal Nodes 49 Depth 3

27 6

28 7 CONSIDERAÇÕES FINAIS A árvore de decisão é uma importante ferramenta para auxilio tomada de decisão. A sua elaboração permite uma melhor identificação dos caminhos a serem seguidos. Observa-se uma forte relação entre as variáveis RDPCn, RENOCUPn, PRENTRABn, RMPOBn com as variáveis RDPCn, PRENTRABn, RMPOBn, RENOCUPn respectivamente.

29 PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÕES DEMOGRAFIA E HABITAÇÃO Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Cleonice Nazaré do Nascimento 1º Semestre 2014

30 2 1. INTRODUÇÃO O presente trabalho tem por objetivo efetuar uma análise discriminante e verificar principais componentes para as dimensões Demografia e Habitação, baseado no Índice de Desenvolvimento Humano Municipal Brasileiro do banco de dados original do Atlas Brasileiro Para tal, iniciamos com o entendimento dos dados, incluindo a definição dos indivíduos e das variáveis, suas classificações em variáveis categóricas ou quantitativas, os significados e unidades de medida, além da apresentação da tabela de dados, gráficos e mapas. Apresentamos na sequência Comparação de Médias, Intervalos de Confiança, Variâncias, Análise Discriminante, Regressão Logística, Árvores de Classificação e Análise de Correspondência de dados quantitativos sobre duas dimensões, sendo Demografia e Habitação dos Municípios do Brasil, respectivamente. O processo lógico é a analise discriminante nas funções linear e quadrática considerando as regiões brasileiras agrupadas no trabalho anterior (nº 08). Em seguida um agrupamento de dados apresentado x Brasis. Neste trabalho abordaremos as variáveis referentes ESPVIDA(1), MORT1(i) e MORT5(i) na dimensão Demografia e T_BANAGUA, T_DENS e T_AGUA na dimensão Habitação O software estatístico utilizado é o MINITAB16 e SPSS. 2. ENTENDENDO OS DADOS 2.1 Os Indivíduos Os indivíduos desta análise são os municípios brasileiros, nas dimensões Demografia e Habitação, com origem no Banco de Dados Atlas Brasil 2013, com dados referentes ao ano de Trata-se de um total de 5565 municípios brasileiros e os dados analisados de cada município são as variáveis que descrevemos a seguir. ( 2.2 As Variáveis São 13 as variáveis desta pesquisa, sendo 08 na Dimensão Demografia e 05 na Dimensão Habitação, sendo a variável categórica o nome do Município. Todos os dados desta pesquisa são referentes ao ano de 2010 e a tabela 1, logo abaixo, apresenta a descrição de cada uma das variáveis, tipo e respectiva unidade de medida.

31 3 Tabela 1. As Variáveis DIMENSÃO VARIAVEL SIGNIFICADO TIPO UNIDADE DE MEDIDA Ambas Município Nome do Município Categórica N/A Demografia ESPVIDA Esperança de Vida ao Nascer Quantitativa Anos Demografia MORT1_pt Mortalidade Infantil Quantitativa Percentual Demografia MORT5-pt Mortalidade até os 5 Quantitativa Percentual anos de idade Demografia T_ENV_pt Taxa de Quantitativa Percentual Envelhecimento Demografia RAZDEP_pt Razão de Índice Dependência Quantitativa Demografia FECTOT Taxa de Percentual Fecundidade Total Quantitativa Demografia SOBRE40 Probabilidade de Percentual sobrevivência até 40 anos Quantitativa Demografia SOBRE60 Probabilidade de Percentual sobrevivência até 60 anos Quantitativa Habitação T_BANAGUA % da população em domicílios com Quantitativa Percentual banheiro e água encanada Habitação T_LUZ % da população em domicílios com Quantitativa Percentual energia elétrica Habitação T_DENS_pt % da população em domicílios com Quantitativa Percentual densidade > 2 Habitação T_AGUA % da população em Percentual domicílios com água encanada Quantitativa Habitação T_LIXO % da população em domicílios com coleta de lixo Quantitativa Percentual 2.3 A Tabela de Dados Results for: Demografia (1).MTW Descriptive Statistics: ESPVIDA; FECTOT; MORT1; MORT5; RAZDEP; SOBRE40; SOBRE60, T_ENV_pt Variable Mean Minimum Q1 Median Q3 Maximum ESPVIDA 73,089 65,300 71,150 73,470 75,160 78,640 FECTOT 2,1901 1,2100 1,8500 2,1300 2,4600 4,8900

32 4 MORT1 19,247 8,490 13,800 16,900 23,800 46,800 MORT5 21,533 9,980 16,040 19,420 25,825 50,940 RAZDEP 51,486 29,170 44,880 49,590 56, ,040 SOBRE40 93,781 88,830 92,950 93,890 94,680 97,090 SOBRE60 82,755 71,980 81,040 82,920 84,595 90,810 Results for: Habitação (1).MTW Descriptive Statistics: T_AGUA; T_BANAGUA; T_DENS; T_LIXO; T_LUZ Variable Mean Minimum Q1 Median Q3 Maximum T_AGUA 85,598 0,150 79,635 90,280 96, ,000 T_BANAGUA 80,872 3,260 67,770 91,250 98, ,000 T_DENS 25,127 0,650 15,410 23,070 32,580 88,640 T_LIXO 94,047 0,000 93,720 98,030 99, ,000 T_LUZ 97,190 27,410 97,645 99,390 99, , ANÁLISE DAS VARIÁVEIS 3.1 Variáveis Categóricas Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo pie chart e/ou barras Variável: Município Nossa amostra totaliza 5565 municípios. Veremos nos mapas abaixo a distribuição dos municípios no território brasileiro. O Gráfico 1 demonstra a distribuição dos municípios nas Regiões Brasileiras. Pie Chart of Região 33,0% 8,0% 8,9% Category N CO S SE NE 20,6% 29,5% Podemos observar no Gráfico 1 que as maiores concentrações de municípios brasileiros estão nas regiões do Nordeste com 33,0% e Sudeste com 29,5% somando juntas mais de 50% dos municípios pesquisados (62,50%).

33 5 O Gráfico 2 demonstra a distribuição dos municípios pelas Unidades Federais Brasileiras. 15,3% Pie Chart of UFN 3,0% 3,3% 3,3% 18,3% 3,9% 4,0% 4,0% 4,4% Category RN CE PE MA PB PI GO SC PR BA RS SP MG Other 5,3% 7,2% 11,6% 7,5% 8,9% Podemos observar no Gráfico 2 que as Unidades Federais mais representativas são Minas Gerais (15,3%), São Paulo (11,6%) e Rio Grande do Sul (8,9%). As menos expressivas são as Unidades Federais de Roraima, Amapá e Acre tendendo a zero pontos percentuais. O Mapa 1 (conforme Atlas 2013), apresenta o IDHM (Índice de Desenvolvimento Humano Municipal) dos municípios brasileiros em 1991, 2000 e Observa-se que existe a concentração dos municípios que possuem IDHM elevados na região centro-sul do Brasil. Por outro lado, as regiões Norte concentram os municípios que apresentam Muito Baixo o índice e a maioria dos municípios que possuem Baixo Desenvolvimento Humano.

34 6 A tabela 2, ilustrada pelo gráfico 1, apresenta a evolução, entre 1991 e 2010, da classificação dos municípios brasileiros para as faixas de desenvolvimento humano propostas pelo Atlas Brasil A variação está entre Muito Baixo Desenvolvimento Humano (IDHM inferior a 0,500) a Muito Alto Desenvolvimento Humano (IDHM igual ou superior a 0,800). Em 1991, mais de 85% dos municípios encontravam-se na faixa de Muito Baixo Desenvolvimento Humano. Já nos anos 2000, pouco mais que 70% deles encontravam-se nas faixas de Baixo e Muito Baixo Desenvolvimento Humano. Na última análise referente a 2010, apenas um quarto (25%) dos municípios brasileiros encontrava-se nessas faixas e mais de 70% deles já figuravam nas faixas de Médio e Alto Desenvolvimento Humano. Segundo o Atlas Brasileiro 2013 isso ilustra os avanços do desenvolvimento humano no país nas últimas duas décadas. 3.2 VARIAVEIS QUANTITATIVAS Veremos a seguir a utilização da Analise Discriminante separadamente para as Dimensões Demografia e Habitação, nos Métodos Linear e Quadrático. Partimos do princípio da parcimônia, onde se busca a simplicidade na análise, sendo assim caso a diferença seja irrelevante entre os métodos adotaremos o Método Linear como base ANÁLISE DISCRIMINANTE LINEAR POR REGIÃO (DIMENSÃO DEMOGRAFIA) A análise discriminante é uma técnica da estatística multivariada utilizada para discriminar e classificar objetos, e estuda a separação de objetos de uma população em duas ou mais classes. Neste caso queremos discriminar os valores das variáveis ESPVIDA(1), MORT1(i) e MORT5(i) do Brasil, e utilizaremos inicialmente a variável categórica Região. Para geração de análise discriminante utilizaremos o comando do Minitab: STAT >> MULTIVARIATE >> DISCRIMINANT ANALISYS

35 7 Discriminant Analysis: Região versus MORT1(i); MORT5(i); ESPVIDA(1) Linear Method for Response: Região Predictors: MORT1(i); MORT5(i); ESPVIDA(1) Group CO N NE S SE Count Summary of classification True Group Put into Group CO N NE S SE CO N NE S SE Total N N correct Proportion 0,471 0,596 0,513 0,531 0,427 N = 5564 N Correct = 2747 Proportion Correct = 0,494 Squared Distance Between Groups CO N NE S SE CO 0, , , , ,56339 N 4, , , , ,48452 NE 4, , , , ,66362 S 0, , , , ,31082 SE 0, , , , ,00000 AGRUPAMENTO= SUL+SUDESTE Linear Discriminant Function for Groups CO N NE S SE Constant -18,36-19,21-14,28-21,29-18,18 MORT1(i) 86,21-42,48-35,94 30,85 34,39 MORT5(i) 18,94 155,97 134,29 81,74 66,74 ESPVIDA(1) -69,57-77,82-67,75-72,95-64,04 Com base nas informações apresentadas acima pode ser notado que a região que acertou mais é Norte (0,596), seguida pela região Sul (0,531). A região com maior erro é a Sudeste (0,427). As informações ainda exibem o cruzamento de dados entre as regiões, por exemplo, a região Nordeste possui 1813 municípios e apenas 930 correspondem a região. Essa matriz é denominada confusion matrix ( matriz de confusão). Podemos analisar a possibilidade de agrupar regiões com maior similaridade ANÁLISE DISCRIMINANTE LINEAR POR 4 BRASIS (Demografia) Esta segunda análise está interessada em verificar os possíveis agrupamentos dos dados utilizando a variável 4 Brasis, calculada a partir do exercício anterior, e demonstra os agrupamentos do Brasil segundo sua proximidade de dados de demografia. Para esta análise

36 8 foram agrupadas as regiões de Sul, Sudeste como SSE, e as regiões de Norte e Nordeste e Centro_Oeste separadamente. Discriminant Analysis: 4 BRASIS versus ESPVIDA(1); MORT1(i); MORT5(i) Linear Method for Response: 4 BRASIS Predictors: ESPVIDA(1); MORT1(i); MORT5(i) Group CO N NE SSE Count Summary of classification True Group Put into Group CO N NE SSE CO N NE SSE Total N N correct Proportion 0,590 0,599 0,513 0,568 N = 5564 N Correct = 3083 Proportion Correct = 0,554 Squared Distance Between Groups CO N NE SSE CO 0, , , ,64201 N 4, , , ,22938 NE 4, , , ,78369 SSE 0, , , ,00000 Linear Discriminant Function for Groups CO N NE SSE Constant -17,85-18,55-13,79-18,86 ESPVIDA(1) -66,45-74,27-64,69-64,44 MORT1(i) 87,47-41,08-34,73 34,24 MORT5(i) 13,68 150,00 129,14 67,40 Existem duas possibilidades de realizar a análise discriminante que são a linear e a quadrática. Dependendo da variável deve-se dar mais peso e mais atenção a um método em detrimento do outro. Neste caso a linear não apresenta dados satisfatórios. Podemos observar que alguns estados e municípios da região SSE tem características da região CO, visto pelo número 828 municípios foram encontrados na intersecção entre os dois agrupamentos (regiões) ANÁLISE DISCRIMINANTE QUADRÁTICA POR 4 BRASIS (Demografia) Esta segunda análise está interessada em verificar os agrupamentos dos dados utilizando a variável 4 Brasis, utilizando o Método Quadrático para Análise Discriminante. Foram mantidos os agrupamentos utilizados no item anterior, no Método Linear. Discriminant Analysis: 4 BRASIS versus ESPVIDA(1); MORT1(i); MORT5(i)

37 9 Quadratic Method for Response: 4 BRASIS Predictors: ESPVIDA(1); MORT1(i); MORT5(i) Group CO N NE SSE Count Summary of classification True Group Put into Group CO N NE SSE CO N NE SSE Total N N correct Proportion 0,345 0,687 0,370 0,783 N = 5564 N Correct = 3365 Proportion Correct = 0,605 From Generalized Squared Distance to Group Group CO N NE SSE CO -17,46-14,58-14,76-17,82 N -15,37-18,99-17,69-15,57 NE -14,56-18,12-18,16-14,89 SSE -17,08-16,97-16,06-18,76 No modelo quadrático a proporção subiu de forma inexpressiva saindo de 0,554 na linear atingindo o índice de 0,605 na quadrática. Como comentamos anteriormente decidimos escolher o método linear por sua simplicidade.

38 ANÁLISE DISCRIMINANTE LINEAR PARA DADOS AGRUPADOS (Dimensão Demografia) Dendrogama Media por Estado ESPVIDA, MORT1i, MORT5i 84,62 Similarity 89,74 94,87 100,00 RO AP PA AM PI PE SE PB BA RN CE AC TO ES RR Observations AL MS SC RS MT MG RJ SP PR GO MA Grafico3. Dendrograma da Média ESPVIDA x MORT1x MORT5 por grupos do Brasil (classificação supervisionada) Neste exemplo abaixo vamos através do dendrograma pesquisar o grau de similaridade das médias das variáveis ESPVIDA(1), MORT1(i) e MORT5(i) nos agrupamentos. Com base na análise discriminante poderemos verificar a proporção correta dos agrupamentos. Discriminant Analysis: Agrupamentos versus M_ESPVIDA; M_MORT1i; M_MORT5i Linear Method for Response: Agrupamentos Predictors: M_ESPVIDA; M_MORT1i; M_MORT5i Group G1 G2 G3 G4 Count Summary of classification True Group Put into Group G1 G2 G3 G4 G G G G Total N N correct Proportion 1,000 1,000 1,000 1,000 N = 26 N Correct = 26 Proportion Correct = 1,000

39 11 Squared Distance Between Groups G1 G2 G3 G4 G1 0,000 14,247 17, ,577 G2 14,247 0,000 60, ,125 G3 17,541 60,340 0,000 62,305 G4 131, ,125 62,305 0,000 Linear Discriminant Function for Groups G1 G2 G3 G4 Constant -97,8-54,4-164,4-302,0 M_ESPVIDA 11,5 41,9 45,2 138,1 M_MORT1i 1347,1 1038,1 1709,1 2733,4 M_MORT5i -973,2-782,8-1247,1-2164,4 No mapa abaixo apresentamos visualmente a divisão dos Grupos G1, G2, G3 e G4 divididos por cores dos Estados, conforme o agrupamento por similaridade. Nesta representação observamos a concentração nos estados do meio ao sul do país com significativa concentração. Quanto aos estados de Maranhão e Alagoas aparecem de forma isolada e seria interessante se aprofundar para melhores informações e características que justifiquem tais números. Mapa(2). Brasil por Agrupamentos Média Variáveis ESPVIDA(1), MORT1(i) e MORT5(i) Legenda: G1= Azul, G2= Laranja, G3= Verde, G4= Rosa

40 ANÁLISE DISCRIMINANTE LINEAR POR REGIÃO (DIMENSÃO HABITAÇÃO) A análise discriminante é uma técnica da estatística multivariada utilizada para discriminar e classificar objetos, e estuda a separação de objetos de uma população em duas ou mais classes. Neste caso queremos discriminar os valores das variáveis T_BANAGUA, T_DENS e T_AGUA do Brasil, e utilizaremos inicialmente a variável categórica Região. Para geração de análise discriminante utilizaremos o comando do Minitab: STAT >> MULTIVARIATE >> DISCRIMINANT ANALISYS Results for: Habitação_OFICIAL.MTW Discriminant Analysis: Região versus T_AGUA(1); T_BANAGUA(1); T_DENS(1) Linear Method for Response: Região Predictors: T_AGUA(1); T_BANAGUA(1); T_DENS(1) Group CO N NE S SE Count Summary of classification True Group Put into Group CO N NE S SE CO N NE S SE Total N N correct Proportion 0,095 0,541 0,384 0,592 0,450 N = 5564 N Correct = 2427 Proportion Correct = 0,436 Squared Distance Between Groups CO N NE S SE CO 0, , , , ,08375 N 2, , , , ,59706 NE 1, , , , ,40630 S 0, , , , ,27337 SE 0, , , , ,00000 Com base nas informações apresentadas acima pode ser notado que a região que acertou mais é Sul (0,592), seguida pela região Norte (0,541). A região com maior erro é o Centro Oeste (0,095). As informações ainda exibem o cruzamento de dados entre as regiões, por exemplo, a região Nordeste possui 1813 municípios e apenas 696 correspondem a região. Essa matriz é denominada confusion matrix ( matriz de confusão). Podemos analisar a possibilidade de agrupar regiões com maior similaridade ANÁLISE DISCRIMINANTE LINEAR POR 4 BRASIS (Habitação)

41 13 Esta segunda análise está interessada em verificar os possíveis agrupamentos dos dados utilizando a variável 4 Brasis, calculada a partir do exercício anterior, e demonstra os agrupamentos do Brasil segundo sua proximidade de dados de habitação. Para esta análise foram agrupadas as regiões de Sul, Sudeste como SSE, e as regiões de Norte e Nordeste e Centro_Oeste separadamente. Discriminant Analysis: Agrupamentos versus T_AGUA(1); T_BANAGUA(1);... Linear Method for Response: 4 BRASIS Predictors: T_AGUA(1); T_BANAGUA(1); T_DENS(1) Group CO N NE SSE Count Summary of classification True Group Put into Group CO N NE SSE CO N NE SSE Total N N correct Proportion 0,273 0,548 0,396 0,676 N = 5564 N Correct = 3014 Proportion Correct = 0,542 Squared Distance Between Groups CO N NE SSE CO 0, , , ,07310 N 2, , , ,95637 NE 1, , , ,46262 SSE 0, , , ,00000 Linear Discriminant Function for Groups CO N NE SSE Constant -38,295-40,682-34,113-38,140 T_AGUA(1) 34,328 36,771 31,840 32,656 T_BANAGUA(1) 35,256 31,806 31,967 36,898 T_DENS(1) 62,536 70,978 64,008 62,102 Existem duas possibilidades de realizar a análise discriminante que são a linear e a quadrática. Dependendo da variável deve-se dar mais peso e mais atenção a um método em detrimento do outro. Neste caso a linear não apresenta dados satisfatórios. Podemos observar que alguns estados e municípios da região SSE tem características da região CO, visto pelo número 463 municípios foram encontrados na intersecção entre os dois agrupamentos (regiões) ANÁLISE DISCRIMINANTE QUADRÁTICA POR 4 BRASIS (Habitação)

42 14 Esta segunda análise está interessada em verificar os agrupamentos dos dados utilizando a variável 4 Brasis, utilizando o Método Quadrático para Análise Discriminante. Foram mantidos os agrupamentos utilizados no item anterior, no Método Linear. Discriminant Analysis: Agrupamentos versus T_AGUA(1); T_BANAGUA(1);... Quadratic Method for Response: 4 Brasis Predictors: T_AGUA(1); T_BANAGUA(1); T_DENS(1) Group CO N NE SSE Count Summary of classification True Group Put into Group CO N NE SSE CO N NE SSE Total N N correct Proportion 0,200 0,513 0,373 0,718 N = 5564 N Correct = 3044 Proportion Correct = 0,547 From Generalized Squared Distance to Group Group CO N NE SSE CO -13,35-10,40-11,10-13,44 N -11,02-11,32-11,19-9,48 NE -12,01-10,58-11,97-11,40 SSE -13,25-10,02-10,75-13,55 No modelo quadrático a proporção subiu de forma inexpressiva saindo de 0,542 na linear atingindo o índice de 0,547 na quadrática. Decidimos escolher o método linear por sua simplicidade.

43 ANÁLISE DISCRIMINANTE LINEAR PARA DADOS AGRUPADOS (Habitação) Dendrograma Medias de Estado M_TBANAGUA, M_TDENS, M_TAGUA 73,10 Similarity 82,07 91,03 100,00 AC SE RN BA PE PB CE AL RR AP PA MA TO PI ES PR Observations SP MG SC RS GO AM RO MT RJ MS Grafico4. Dendrograma da Média T_BANAGUA x T_DENS x T_AGUA por grupos do Brasil (classificação supervisionada) Neste exemplo abaixo vamos através do dendrograma pesquisar o grau de similaridade das médias das variáveis T_BANAGUA, T_DENS e T_AGUA nos agrupamentos. Com base na análise discriminante poderemos verificar a proporção correta dos agrupamentos. Discriminant Analysis: Grupos versus M_TABANAGUA; M_TDENS; M_TAGUA (Amazonas incluído no G1, por não ser possível realizar análise apenas com 01 variavel por agrupamento) Linear Method for Response: Grupos Predictors: M_TABANAGUA; M_TDENS; M_TAGUA Group G1 G2 G3 Count Summary of classification True Group Put into Group G1 G2 G3 G G G Total N N correct Proportion 1,000 1,000 1,000 N = 26 N Correct = 26 Proportion Correct = 1,000

44 16 Squared Distance Between Groups G1 G2 G3 G1 0,000 40, ,193 G2 40,141 0,000 21,348 G3 108,193 21,348 0,000 Linear Discriminant Function for Groups G1 G2 G3 Constant -159,16-122,85-165,70 M_TABANAGUA 14,13 97,16 160,99 M_TDENS 220,38 148,55 120,80 M_TAGUA 226,58 168,25 168,88 No mapa abaixo apresentamos visualmente a divisão dos Grupos G1, G2 e G3 divididos por cores dos Estados, conforme o agrupamento por similaridade. Nesta representação observamos uma divisão bem estruturada não apresentando uma concentração significativa em determinado estado. Mapa(3). Brasil por Agrupamentos Média Variáveis T_BANAGUA, T_DENS e T_AGUA Legenda: G1= Azul, G2= Laranja, G3= Verde

45 REGRESSÃO LOGÍSTICA A regressão logística é um método estatístico que produz a partir de um conjunto de variáveis e observações a predição de valores. A seguir apresentamos a Regressão Logística para as Dimensões Demografia e Habitação, mantendo as variáveis que estão sendo utilizadas regularmente nesta apresentação DIMENSÃO DEMOGRAFIA ANOVA das Variáveis One-way ANOVA: ESPVIDA(1) versus Região Source DF SS MS F P Região 4 62, , ,46 0,000 Error ,2892 0,0292 Total ,5843 S = 0,1709 R-Sq = 27,74% R-Sq(adj) = 27,69% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 461 0,6358 0,1531 (-*-) N 431 0,5215 0,1644 (-*--) NE ,4433 0,1895 (*) S ,6871 0,1658 (*-) SE ,6647 0,1589 (*) ,490 0,560 0,630 0,700 One-way ANOVA: MORT1(i) versus Região Source DF SS MS F P Região 4 57, , ,09 0,000 Error ,1823 0,0243 Total ,0673 S = 0,1559 R-Sq = 29,98% R-Sq(adj) = 29,93% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 461 0,7731 0,1417 (-*-) N 431 0,6798 0,1513 (-*-) NE ,5817 0,1911 (*) S ,8284 0,1410 (*-) SE ,7861 0,1256 (*) ,630 0,700 0,770 0,840 Pooled StDev = 0,1559 One-way ANOVA: MORT5(i) versus Região

46 18 Source DF SS MS F P Região 4 48, , ,80 0,000 Error ,4453 0,0233 Total ,7683 S = 0,1526 R-Sq = 27,18% R-Sq(adj) = 27,13% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 461 0,7550 0,1382 (-*-) N 431 0,6917 0,1467 (-*-) NE ,5920 0,1875 (*) S ,8216 0,1373 (*-) SE ,7775 0,1231 (*) ,630 0,700 0,770 0,840 Pooled StDev = 0,1526 Variável x Região CO N NE S SE ESPVIDA(1) MORT1(i) MORT5(i) Total Nova Ordem Tabela(3) Sequencia de Regiões por Variável (Ordem Crescente) ESPVIDA(1), MORT1(i) e MORT5(i) Podemos observar na tabela (3) que nesta dimensão, as três variáveis apresentaram sequencia idêntica nos níveis, por região.

47 Regressão Logística (nova sequencia crescente, ordinal) Ordinal Logistic Regression: C50 versus ESPVIDA(1); MORT1(i); MORT5(i) Link Function: Logit Response Information Variable Value Count C Total 5564 Logistic Regression Table 95% CI Predictor Coef SE Coef Z P Odds Ratio Lower Const(1) -0, , ,69 0,489 Const(2) 2, , ,02 0,000 Const(3) 3, , ,05 0,000 Const(4) 4, , ,98 0,000 ESPVIDA(1) -0, , ,47 0,639 0,80 0,31 MORT1(i) -34,4719 1, ,49 0,000 0,00 0,00 MORT5(i) 30,5612 1, ,30 0,000 1,87312E+13 7,10191E+11 Predictor Upper Const(1) Const(2) Const(3) Const(4) ESPVIDA(1) 2,06 MORT1(i) 0,00 MORT5(i) 4,94031E+14 Log-Likelihood = -7247,892 Test that all slopes are zero: G = 1756,823, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 22286, ,000 Deviance 12997, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,9 Somers' D 0,43 Discordant ,1 Goodman-Kruskal Gamma 0,43 Ties ,9 Kendall's Tau-a 0,32 Total ,0

48 20 Comparativamente aos resultados observados na Analise discriminante Linear podemos verificar um crescimento significativo no percentual de concordância, que passa de 49,40% na Analise Discriminante Linear para 70,90% na Regressão Logística. A regressão logística se apresentou de uma forma mais confiável no que se refere ao comportamento destas variáveis Regressão Logística por Agrupamento 4 BRASIS Ordinal Logistic Regression: C51 versus ESPVIDA(1); MORT1(i); MORT5(i) Link Function: Logit Response Information Variable Value Count C Total 5564 Logistic Regression Table 95% CI Predictor Coef SE Coef Z P Odds Ratio Lower Const(1) -1, , ,12 0,000 Const(2) 1, , ,02 0,000 Const(3) 2, , ,05 0,000 ESPVIDA(1) -3, , ,09 0,000 0,02 0,01 MORT1(i) -36,9104 1, ,87 0,000 0,00 0,00 MORT5(i) 37,4295 1, ,24 0,000 1,80062E+16 3,97670E+14 Predictor Upper Const(1) Const(2) Const(3) ESPVIDA(1) 0,06 MORT1(i) 0,00 MORT5(i) 8,15309E+17 Log-Likelihood = -5299,827 Test that all slopes are zero: G = 1774,976, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 17605, ,000 Deviance 9441, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,0 Somers' D 0,47 Discordant ,4 Goodman-Kruskal Gamma 0,47 Ties ,6 Kendall's Tau-a 0,29 Total ,0 Comparativamente aos resultados observados na Analise discriminante Linear podemos verificar um crescimento significativo no percentual de concordância, que passa de 55,40% na Analise Discriminante Linear para 73,00% na Regressão Logística. A regressão logística se apresentou de uma forma mais confiável no que se refere ao comportamento destas variáveis.

49 Regressão Logística para Dados Agrupados (Média- 4 Brasis) Link Function: Logit Response Information Variable Value Count Agrup_n Total 26 Logistic Regression Table Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Const(1) 1396, ,78 0,21 0,837 Const(2) 1436, ,83 0,21 0,836 Const(3) 1506, ,2 0,03 0,976 M_ESPVIDA 7329, ,0 0,20 0,839 * 0,00 * M_MORT1i ,21 0,837 0,00 0,00 * M_MORT5i ,21 0,837 * 0,00 * Log-Likelihood = -0,000 Test that all slopes are zero: G = 63,454, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 0, ,000 Deviance 0, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,0 Somers' D 1,00 Discordant 0 0,0 Goodman-Kruskal Gamma 1,00 Ties 0 0,0 Kendall's Tau-a 0,70 Total ,0 Comparativamente aos resultados observados na Analise discriminante Linear podemos verificar o resultado idêntico nas duas situações com percentual de concordância, em ambos os casos, de 100% DIMENSÃO HABITAÇÃO ANOVA das Variáveis One-way ANOVA: T_BANAGUA(1) versus Região Source DF SS MS F P Região 4 73, , ,37 0,000 Error ,9401 0,0372 Total ,2562 S = 0,1929 R-Sq = 26,16% R-Sq(adj) = 26,11%

50 22 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 461 0,8628 0,1729 (-*-) N 431 0,6343 0,2610 (-*--) NE ,6706 0,2259 (*) S ,9047 0,1567 (*) SE ,8988 0,1592 (*-) ,640 0,720 0,800 0,880 Pooled StDev = 0,1929 One-way ANOVA: T_DENS(1) versus Região Source DF SS MS F P Região 4 29,3622 7, ,24 0,000 Error ,0622 0,0166 Total ,4244 S = 0,1287 R-Sq = 24,18% R-Sq(adj) = 24,13% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 461 0,2453 0,1310 (-*-) N 431 0,4317 0,2138 (-*) NE ,3414 0,1254 (*) S ,1900 0,1147 (*) SE ,2416 0,1106 (* ,210 0,280 0,350 0,420 Pooled StDev = 0,1287 One-way ANOVA: T_AGUA(1) versus Região Source DF SS MS F P Região 4 15,9635 3, ,36 0,000 Error ,9649 0,0189 Total ,9284 S = 0,1374 R-Sq = 13,20% R-Sq(adj) = 13,14% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 461 0,8982 0,1140 (---*--) N 431 0,8307 0,1576 (--*---) NE ,7831 0,1673 (-*-) S ,8951 0,1157 (--*-) SE ,9013 0,1140 (-*) ,805 0,840 0,875 0,910 Pooled StDev = 0,1374

51 23 Variável x Região CO N NE S SE T_BANAGUA T_DENS T_AGUA Total Nova Ordem Tabela(4) Sequencia de Regiões por Variável (Ordem Crescente) T_BANAGUA, T_DENS e T_AGUA Podemos observar na tabela (4) que nesta dimensão as três variáveis apresentaram sequencias diferenciadas nos níveis, por região. Desta forma por meio do calculo de média aritmética encontramos uma nova ordem para a composição da análise das três variáveis Regressão Logística (nova sequência crescente, ordinal) Ordinal Logistic Regression: Prioridade versus T_BANAGUA(1); T_AGUA(1);... Link Function: Logit Response Information Variable Value Count Prioridade Total 5564 Logistic Regression Table Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Const(1) 3, , ,72 0,000 Const(2) 4, , ,38 0,000 Const(3) 5, , ,40 0,000 Const(4) 5, , ,97 0,000 T_BANAGUA(1) -4, , ,10 0,000 0,01 0,01 0,02 T_AGUA(1) -0, , ,93 0,003 0,44 0,26 0,76 T_DENS(1) -1, , ,54 0,000 0,29 0,17 0,49 Log-Likelihood = -7521,262 Test that all slopes are zero: G = 1210,084, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 23396, ,000 Deviance 15042, ,000

52 24 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,2 Somers' D 0,43 Discordant ,2 Goodman-Kruskal Gamma 0,43 Ties ,6 Kendall's Tau-a 0,32 Total ,0 Comparativamente aos resultados observados na Analise Discriminante Linear podemos verificar um crescimento significativo no percentual de concordância, que passa de 43,60% na Análise Discriminante para 71,20% na Regressão Logística. A Regressão Logística se apresentou de uma forma mais confiável no que se refere ao comportamento destas variáveis Regressão Logística por Agrupamento 4 BRASIS Ordinal Logistic Regression: Agrup_1 versus T_BANAGUA(1); T_AGUA(1);... Link Function: Logit Response Information Variable Value Count Agrup_ Total 5564 Logistic Regression Table Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Const(1) 2, , ,73 0,000 Const(2) 3, , ,41 0,000 Const(3) 6, , ,38 0,000 T_BANAGUA(1) -3, , ,67 0,000 0,04 0,03 0,07 T_AGUA(1) -1, , ,69 0,000 0,26 0,15 0,46 T_DENS(1) 0, , ,96 0,003 2,38 1,34 4,24 Log-Likelihood = -5586,663 Test that all slopes are zero: G = 1201,303, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 20141, ,000 Deviance 11173, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,5 Somers' D 0,46 Discordant ,9 Goodman-Kruskal Gamma 0,46 Ties ,6 Kendall's Tau-a 0,28

53 25 Total ,0 Comparativamente aos resultados observados na Analise Discriminante Linear podemos verificar um crescimento significativo no percentual de concordância, que passa de 54,20% na Análise Discriminante para 72,5% na Regressão Logística. A Regressão Logística se apresentou de uma forma mais confiável no que se refere ao comportamento destas variáveis Regressão Logística para Dados Agrupados (Média 3 BRASIS junção Amazonas Ordinal Logistic Regression: Grup2 versus M_TABANAGUA; M_TDENS; M_TAGUA Link Function: Logit Response Information Variable Value Count Grup Total 26 Logistic Regression Table 95% CI Predictor Coef SE Coef Z P Odds Ratio Lower Upper Const(1) -3, ,3-0,00 1,000 Const(2) 71, ,0 0,00 0,999 M_TABANAGUA -105, ,4-0,00 0,997 0,00 0,00 * M_TDENS 229, ,6 0,00 0,997 7,48755E+99 0,00 * M_TAGUA -69, ,6-0,00 0,998 0,00 0,00 * Log-Likelihood = -0,000 Test that all slopes are zero: G = 55,616, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 0, ,000 Deviance 0, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,0 Somers' D 1,00 Discordant 0 0,0 Goodman-Kruskal Gamma 1,00 Ties 0 0,0 Kendall's Tau-a 0,67 Total ,0 Comparativamente aos resultados observados na Analise discriminante linear podemos verificar o resultado idêntico nas duas situações com percentual de concordância, em ambos os casos, de 100%.

54 Classification Tree DIMENSÃO DEMOGRAFIA Classification Tree Warnings Gain summary Tables are not displayed because profits are undefined. Target category gains tables are not displayed because target categories are undefined. Model Summary Specifications Growing Method CHAID Dependent Variable Independent Variables Validation Região ESPVIDAn, MORTum, MORTcinco None Maximum Tree Depth 3 Minimum Cases in Parent Node 100 Minimum Cases in Child Node 50 Results Independent Variables Included MORTum, MORTcinco, ESPVIDAn Number of Nodes 41 Number of Terminal Nodes 29 Depth 3

55 27

56 28 Risk Estimate Std. Error Growing Method: CHAID,430,007 Dependent Variable: Região Classification Observed Predicted CO N NE S SE Percent Correct CO ,0% N ,0% NE ,3% S ,7% SE ,0% Overall Percentage,0%,0% 34,7% 25,8% 39,5% 57,0% Growing Method: CHAID Dependent Variable: Região DIMENSÃO HABITAÇÃO Classification Tree Warnings Gain summary Tables are not displayed because profits are undefined. Target category gains tables are not displayed because target categories are undefined. Model Summary Specifications Growing Method CHAID Dependent Variable Independent Variables Validation Região T_AGUA, T_BANAGUA, T_DENS None Maximum Tree Depth 3 Minimum Cases in Parent Node 100 Minimum Cases in Child Node 50 Results Independent Variables Included T_BANAGUA, T_AGUA, T_DENS Number of Nodes 50 Number of Terminal Nodes 34 Depth 3

57 29

58 30 Risk Estimate Std. Error Growing Method: CHAID,491,007 Dependent Variable: Região Classification Observed Predicted CO N NE S SE Percent Correct CO ,5% N ,4% NE ,0% S ,5% SE ,5% Overall Percentage 1,0% 1,6% 41,0% 25,9% 30,4% 50,9% Growing Method: CHAID Dependent Variable: Região

59 Análise de Correspondência Dimensão Demografia por Estado Análise de Correspondência da Média por Estado das Variáveis M_ESPVIDA; M_MORT1i; M_MORT5i 0,10 Symmetric Plot 0,05 Component 2 0,00 m5 TO SP SC CE PEPBSE RR RO RS RNPI BAPA AC MAL RJ MG es AM AP m1 PR GO ES MT MS -0,05-0,05 0,00 0,05 Component 1 0,10 Simple Correspondence Analysis: M_ESPVIDA; M_MORT1i; M_MORT5i Relative Inertias es m1 m5 Total AC 0,005 0,000 0,003 0,009 AL 0,000 0,000 0,000 0,000 AM 0,057 0,005 0,020 0,081 AP 0,040 0,003 0,015 0,059 BA 0,016 0,001 0,008 0,025 CE 0,036 0,003 0,013 0,052 ES 0,015 0,000 0,008 0,023 GO 0,006 0,000 0,005 0,010 MA 0,001 0,000 0,000 0,001 MG 0,039 0,003 0,015 0,057 MS 0,139 0,007 0,061 0,206 MT 0,033 0,000 0,027 0,060 PA 0,012 0,000 0,006 0,019 PB 0,020 0,001 0,009 0,030 PE 0,028 0,001 0,012 0,041 PI 0,016 0,001 0,006 0,024 PR 0,000 0,001 0,001 0,002 RJ 0,001 0,000 0,001 0,002 RN 0,027 0,002 0,011 0,040 RO 0,010 0,000 0,005 0,015 RR 0,011 0,000 0,006 0,017 RS 0,026 0,002 0,009 0,037 SC 0,063 0,007 0,018 0,089 SE 0,016 0,001 0,007 0,024 SP 0,051 0,006 0,015 0,072 TO 0,002 0,000 0,002 0,005 Total 0,671 0,044 0,285 1,000

60 32 Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0020 0,9889 0,9889 ****************************** 2 0,0000 0,0111 1,0000 Total 0,0020 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 AC 1,000 0,032 0,009-0,023 0,983 0,008 0,003 0,017 0,013 2 AL 1,000 0,022 0,000-0,003 0,513 0,000 0,003 0,487 0,008 3 AM 1,000 0,034 0,081-0,069 0,996 0,082-0,004 0,004 0,026 4 AP 1,000 0,040 0,059-0,055 0,999 0,059-0,002 0,001 0,006 5 BA 1,000 0,031 0,025-0,040 0,997 0,025 0,002 0,003 0,007 6 CE 1,000 0,032 0,052-0,057 0,998 0,053-0,003 0,002 0,009 7 ES 1,000 0,048 0,023 0,031 0,995 0,023-0,002 0,005 0,010 8 GO 1,000 0,049 0,010 0,020 0,927 0,010-0,006 0,073 0,067 9 MA 1,000 0,023 0,001-0,009 0,951 0,001 0,002 0,049 0, MG 1,000 0,046 0,057 0,050 0,999 0,058 0,001 0,001 0, MS 1,000 0,042 0,206 0,099 1,000 0,208-0,002 0,000 0, MT 1,000 0,044 0,060 0,051 0,929 0,057-0,014 0,071 0, PA 1,000 0,035 0,019-0,033 0,997 0,019 0,002 0,003 0, PB 1,000 0,030 0,030-0,045 1,000 0,030 0,001 0,000 0, PE 1,000 0,030 0,041-0,053 1,000 0,042 0,000 0,000 0, PI 1,000 0,027 0,024-0,042 1,000 0,024-0,001 0,000 0, PR 1,000 0,048 0,002 0,005 0,313 0,001-0,007 0,687 0, RJ 1,000 0,047 0,002 0,009 0,999 0,002-0,000 0,001 0, RN 1,000 0,032 0,040-0,050 1,000 0,040-0,001 0,000 0, RO 1,000 0,040 0,015-0,028 0,986 0,015 0,003 0,014 0, RR 1,000 0,043 0,017-0,028 0,985 0,017 0,003 0,015 0, RS 1,000 0,052 0,037 0,038 0,994 0,038 0,003 0,006 0, SC 1,000 0,052 0,089 0,058 0,985 0,088 0,007 0,015 0, SE 1,000 0,029 0,024-0,041 1,000 0,025-0,000 0,000 0, SP 1,000 0,049 0,072 0,054 0,986 0,072 0,006 0,014 0, TO 1,000 0,039 0,005-0,015 0,869 0,004 0,006 0,131 0,057 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 es 1,000 0,281 0,671 0,070 0,999 0,678 0,002 0,001 0,041 2 m1 1,000 0,358 0,044-0,015 0,847 0,038-0,006 0,153 0,604 3 m5 1,000 0,361 0,285-0,040 0,986 0,284 0,005 0,014 0,355

61 Análise de Correspondência do Desvio Padrão por Estado das Variáveis M_ESPVIDA; M_MORT1i; M_MORT5i 0,3 Symmetric Plot 0,2 Component 2 0,1 0,0 m1 AP SE RNTO RO RR PI CEPA AL MA PB BA m5 PE AC AM MS RJ es SP MGPR GOES SCRS MT -0,1-0,2-0,2-0,1 0,0 0,1 Component 1 0,2 0,3 Simple Correspondence Analysis: DP_ESPVIDA; DP_MORT1i; DP_MORT5i Relative Inertias es m1 m5 Total AC 0,010 0,004 0,002 0,017 AL 0,042 0,014 0,011 0,066 AM 0,006 0,003 0,001 0,009 AP 0,000 0,000 0,001 0,001 BA 0,016 0,004 0,005 0,025 CE 0,004 0,002 0,001 0,007 ES 0,043 0,015 0,010 0,069 GO 0,036 0,013 0,008 0,056 MA 0,033 0,011 0,008 0,052 MG 0,046 0,017 0,010 0,073 MS 0,015 0,009 0,001 0,026 MT 0,021 0,011 0,003 0,035 PA 0,002 0,001 0,000 0,003 PB 0,018 0,005 0,005 0,028 PE 0,017 0,005 0,005 0,027 PI 0,020 0,007 0,004 0,032 PR 0,039 0,015 0,008 0,062 RJ 0,043 0,014 0,011 0,068 RN 0,006 0,003 0,001 0,009 RO 0,000 0,000 0,000 0,000 RR 0,001 0,000 0,000 0,001 RS 0,074 0,025 0,018 0,117 SC 0,087 0,030 0,020 0,137 SE 0,017 0,007 0,004 0,027 SP 0,032 0,012 0,007 0,050 TO 0,003 0,002 0,000 0,004 Total 0,629 0,228 0,143 1,000 Analysis of Contingency Table

62 34 Axis Inertia Proportion Cumulative Histogram 1 0,0190 0,9958 0,9958 ****************************** 2 0,0001 0,0042 1,0000 Total 0,0190 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 AC 1,000 0,048 0,017-0,081 1,000 0,017 0,001 0,000 0,000 2 AL 1,000 0,062 0,066-0,143 0,999 0,066-0,005 0,001 0,017 3 AM 1,000 0,045 0,009-0,062 0,984 0,009 0,008 0,016 0,036 4 AP 1,000 0,030 0,001 0,013 0,274 0,000 0,021 0,726 0,172 5 BA 1,000 0,053 0,025-0,094 0,988 0,025-0,010 0,012 0,072 6 CE 1,000 0,037 0,007-0,058 0,987 0,007 0,007 0,013 0,021 7 ES 1,000 0,020 0,069 0,255 1,000 0,069 0,001 0,000 0,000 8 GO 1,000 0,018 0,056 0,242 1,000 0,057-0,000 0,000 0,000 9 MA 1,000 0,053 0,052-0,136 0,999 0,052-0,005 0,001 0, MG 1,000 0,037 0,073 0,195 1,000 0,073-0,003 0,000 0, MS 1,000 0,032 0,026 0,121 0,969 0,025-0,022 0,031 0, MT 1,000 0,023 0,035 0,169 0,980 0,034-0,024 0,020 0, PA 1,000 0,035 0,003-0,041 0,972 0,003 0,007 0,028 0, PB 1,000 0,054 0,028-0,098 0,996 0,028-0,006 0,004 0, PE 1,000 0,061 0,027-0,091 0,992 0,027-0,008 0,008 0, PI 1,000 0,050 0,032-0,109 1,000 0,032 0,001 0,000 0, PR 1,000 0,025 0,062 0,216 0,999 0,062-0,005 0,001 0, RJ 1,000 0,021 0,068 0,248 0,998 0,068 0,011 0,002 0, RN 1,000 0,044 0,009-0,062 0,991 0,009 0,006 0,009 0, RO 1,000 0,038 0,000-0,007 0,276 0,000 0,011 0,724 0, RR 1,000 0,023 0,001 0,026 0,835 0,001 0,011 0,165 0, RS 1,000 0,025 0,117 0,301 1,000 0,117 0,004 0,000 0, SC 1,000 0,033 0,137 0,281 1,000 0,137 0,002 0,000 0, SE 1,000 0,050 0,027-0,102 1,000 0,027 0,002 0,000 0, SP 1,000 0,027 0,050 0,188 1,000 0,051-0,003 0,000 0, TO 1,000 0,056 0,004-0,038 0,961 0,004 0,008 0,039 0,040 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 es 1,000 0,365 0,629 0,181 1,000 0,632 0,001 0,000 0,004 2 m1 1,000 0,313 0,228-0,117 0,992 0,227 0,011 0,008 0,460 3 m5 1,000 0,322 0,143-0,091 0,984 0,142-0,011 0,016 0,536

63 Dimensão Demografia por Região ANOVA por região das Variáveis M_ESPVIDA; M_MORT1i; M_MORT5i One-way ANOVA: M_ESPVIDA versus REGIAO_N Source DF SS MS F P REGIAO_N 4 0, , ,61 0,000 Error 21 0, ,00204 Total 25 0,58734 S = 0,04520 R-Sq = 92,69% R-Sq(adj) = 91,30% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 3 0, ,01835 (---*----) N 7 0, ,05601 (--*--) NE 9 0, ,03815 (--*-) S 3 0, ,06200 (----*---) SE 4 0, ,03689 (---*---) ,36 0,48 0,60 0,72 Pooled StDev = 0,04520 One-way ANOVA: M_MORT1i versus REGIAO_N Source DF SS MS F P REGIAO_N 4 0, , ,75 0,000 Error 21 0, ,00368 Total 25 0,58885 S = 0,06066 R-Sq = 86,88% R-Sq(adj) = 84,38% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 3 0, ,06832 (---*----) N 7 0, ,06756 (---*--) NE 9 0, ,06887 (--*-) S 3 0, ,02301 (----*----) SE 4 0, ,02276 (---*---) ,60 0,75 0,90 1,05 Pooled StDev = 0,06066 One-way ANOVA: M_MORT5i versus REGIAO_N Source DF SS MS F P REGIAO_N 4 0, , ,07 0,000 Error 21 0, ,00427 Total 25 0,51813 S = 0,06536 R-Sq = 82,69% R-Sq(adj) = 79,39%

64 36 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 3 0, ,08185 (------*-----) N 7 0, ,07000 (---*----) NE 9 0, ,07404 (--*---) S 3 0, ,02483 (------*-----) SE 4 0, ,02457 (-----*----) ,48 0,60 0,72 0,84 Pooled StDev = 0, Analise de Correspondência da Média por região das Variáveis M_ESPVIDA; M_MORT1i; M_MORT5i Symmetric Plot 0,050 0,025 Component 2 0,000 NE N m5 m1 SE CO es -0,025-0,050-0,050-0,025 0,000 0,025 Component 1 0,050 Symmetric Plot Simple Correspondence Analysis: M_ESPVIDA1_reg; M_MORT1i_reg; M_MORT5i_reg Relative Inertias es m1 m5 Total CO 0,137 0,001 0,092 0,230 N 0,226 0,009 0,111 0,346 NE 0,204 0,010 0,093 0,307 S 0,039 0,004 0,013 0,056 SE 0,043 0,005 0,014 0,062 Total 0,648 0,029 0,323 1,000 Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0014 0,9937 0,9937 ****************************** 2 0,0000 0,0063 1,0000 Total 0,0014

65 37 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 CO 1,000 0,215 0,230 0,038 0,985 0,228-0,005 0,015 0,547 2 N 1,000 0,180 0,346-0,052 1,000 0,348-0,000 0,000 0,000 3 NE 1,000 0,136 0,307-0,056 0,999 0,308-0,002 0,001 0,049 4 S 1,000 0,243 0,056 0,018 0,979 0,055 0,003 0,021 0,189 5 SE 1,000 0,226 0,062 0,019 0,978 0,061 0,003 0,022 0,215 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 es 1,000 0,288 0,648 0,056 0,999 0,652 0,001 0,001 0,060 2 m1 1,000 0,357 0,029-0,010 0,866 0,025-0,004 0,134 0,618 3 m5 1,000 0,355 0,323-0,036 0,994 0,323 0,003 0,006 0, Análise de Correspondência do Desvio Padrão por região das Variáveis M_ESPVIDA; M_MORT1i; M_MORT5i 0,75 Symmetric Plot 0,50 Component 2 0,25 0,00 CO m1 NE m5 N SE es S -0,25-0,50-0,50-0,25 0,00 0,25 Component 1 0,50 0,75 Simple Correspondence Analysis: DP_ESPVIDA1_reg; DP_MORT1i_reg; DP_MORT5i_reg Relative Inertias es m1 m5 Total CO 0,225 0,026 0,069 0,320 N 0,000 0,001 0,001 0,002 NE 0,044 0,011 0,007 0,062 S 0,358 0,067 0,077 0,502

66 38 SE 0,081 0,015 0,018 0,114 Total 0,709 0,118 0,173 1,000 Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,1114 0,9956 0,9956 ****************************** 2 0,0005 0,0044 1,0000 Total 0,1119 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 CO 1,000 0,229 0,320-0,395 0,994 0,320-0,030 0,006 0,415 2 N 1,000 0,263 0,002 0,007 0,070 0,000 0,024 0,930 0,319 3 NE 1,000 0,246 0,062-0,168 0,990 0,062 0,017 0,010 0,141 4 S 1,000 0,149 0,502 0,614 0,999 0,504-0,019 0,001 0,114 5 SE 1,000 0,114 0,114 0,334 1,000 0,115-0,007 0,000 0,012 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 es 1,000 0,287 0,709 0,526 1,000 0,712-0,001 0,000 0,001 2 m1 1,000 0,340 0,118-0,195 0,980 0,116 0,028 0,020 0,544 3 m5 1,000 0,373 0,173-0,226 0,988 0,172-0,025 0,012 0, Dimensão Habitação por Estado Análise de Correspondência da Média por estado das Variáveis M_TBANAGUA; M_TAGUA; M_TDENS 0,4 Symmetric Plot Component 2 0,2 0,0-0,2-0,4 AM MA AC PA AP de RR PI TOba CE SE RN BA AL PE PB RO MT GO SP RS MS PR SC RJ MG ES ag -0,6-0,8-0,8-0,6-0,4-0,2 0,0 Component 1 0,2 0,4 Simple Correspondence Analysis: M_TABANAGUA; M_TDENS; M_TAGUA

67 39 Relative Inertias ag de ba Total AC 0,039 0,061 0,000 0,101 AL 0,001 0,008 0,001 0,010 AM 0,035 0,160 0,008 0,204 AP 0,026 0,067 0,000 0,093 BA 0,000 0,001 0,000 0,001 CE 0,001 0,002 0,000 0,003 ES 0,012 0,027 0,000 0,039 GO 0,010 0,032 0,001 0,043 MA 0,029 0,029 0,002 0,059 MG 0,010 0,022 0,000 0,033 MS 0,005 0,009 0,000 0,014 MT 0,003 0,009 0,000 0,012 PA 0,023 0,043 0,000 0,066 PB 0,000 0,001 0,001 0,002 PE 0,000 0,001 0,001 0,002 PI 0,002 0,003 0,000 0,005 PR 0,012 0,030 0,000 0,042 RJ 0,006 0,009 0,000 0,015 RN 0,000 0,000 0,000 0,001 RO 0,001 0,010 0,002 0,013 RR 0,023 0,067 0,001 0,091 RS 0,015 0,044 0,001 0,060 SC 0,018 0,044 0,000 0,062 SE 0,000 0,000 0,000 0,000 SP 0,009 0,019 0,000 0,028 TO 0,000 0,000 0,001 0,001 Total 0,283 0,698 0,019 1,000 Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0720 0,9735 0,9735 ***************************** 2 0,0020 0,0265 1,0000 Total 0,0740 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 AC 1,000 0,034 0,101-0,459 0,968 0,100 0,083 0,032 0,120 2 AL 1,000 0,035 0,010-0,132 0,862 0,009-0,053 0,138 0,050 3 AM 1,000 0,034 0,204-0,657 0,968 0,203-0,120 0,032 0,249 4 AP 1,000 0,040 0,093-0,417 1,000 0,096 0,001 0,000 0,000 5 BA 1,000 0,035 0,001 0,040 1,000 0,001 0,001 0,000 0,000 6 CE 1,000 0,036 0,003-0,075 0,989 0,003-0,008 0,011 0,001 7 ES 1,000 0,042 0,039 0,262 0,999 0,040-0,010 0,001 0,002 8 GO 1,000 0,041 0,043 0,276 0,996 0,044 0,017 0,004 0,006 9 MA 1,000 0,034 0,059-0,341 0,890 0,054 0,119 0,110 0, MG 1,000 0,040 0,033 0,245 0,997 0,034-0,014 0,003 0, MS 1,000 0,043 0,014 0,155 0,990 0,014-0,015 0,010 0, MT 1,000 0,042 0,012 0,144 1,000 0,012 0,003 0,000 0, PA 1,000 0,036 0,066-0,366 0,987 0,067 0,042 0,013 0, PB 1,000 0,033 0,002-0,033 0,236 0,001-0,060 0,764 0, PE 1,000 0,034 0,002-0,047 0,550 0,001-0,043 0,450 0, PI 1,000 0,032 0,005-0,103 0,898 0,005 0,035 0,102 0, PR 1,000 0,042 0,042 0,273 1,000 0,043 0,001 0,000 0, RJ 1,000 0,044 0,015 0,156 0,947 0,015-0,037 0,053 0, RN 1,000 0,038 0,001 0,028 0,711 0,000-0,018 0,289 0, RO 1,000 0,040 0,013 0,141 0,830 0,011 0,064 0,170 0, RR 1,000 0,040 0,091-0,408 0,998 0,093-0,017 0,002 0, RS 1,000 0,040 0,060 0,333 0,998 0,062 0,014 0,002 0,004

68 40 23 SC 1,000 0,040 0,062 0,339 1,000 0,063-0,004 0,000 0, SE 1,000 0,039 0,000 0,025 0,834 0,000-0,011 0,166 0, SP 1,000 0,044 0,028 0,217 0,998 0,029-0,009 0,002 0, TO 1,000 0,040 0,001 0,006 0,019 0,000 0,042 0,981 0,036 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 ag 1,000 0,373 0,283 0,233 0,968 0,281-0,043 0,032 0,346 2 de 1,000 0,191 0,698-0,520 0,996 0,714-0,031 0,004 0,095 3 ba 1,000 0,436 0,019 0,028 0,237 0,005 0,050 0,763 0, Análise de Correspondência do Desvio Padrão por estado das Variáveis M_TBANAGUA; M_TAGUA; M_TDENS Component 2 0,4 0,2 0,0-0,2-0,4 SP Symmetric Plot ES SC RJ RS ba PR GO PB PI de PE AC BA PA AM MG CE AL MS RR RN SE MA ag MT AP TO RO -0,6-0,6-0,4-0,2 0,0 Component 1 0,2 0,4 Simple Correspondence Analysis: DP_TBANAGUA; DP_TDENS; DP_TAGUA Relative Inertias ag de ba Total AC 0,001 0,001 0,000 0,003 AL 0,008 0,057 0,013 0,078 AM 0,000 0,003 0,001 0,004 AP 0,020 0,011 0,003 0,035 BA 0,000 0,011 0,006 0,017 CE 0,002 0,010 0,002 0,014 ES 0,034 0,029 0,002 0,066 GO 0,009 0,014 0,000 0,022 MA 0,008 0,001 0,005 0,014 MG 0,000 0,000 0,000 0,000 MS 0,002 0,049 0,023 0,073 MT 0,002 0,008 0,017 0,027 PA 0,001 0,004 0,001 0,006 PB 0,000 0,043 0,026 0,069 PE 0,001 0,028 0,013 0,042 PI 0,000 0,044 0,028 0,073 PR 0,007 0,013 0,000 0,021

69 41 RJ 0,025 0,026 0,001 0,052 RN 0,003 0,003 0,000 0,005 RO 0,019 0,014 0,062 0,095 RR 0,000 0,007 0,007 0,014 RS 0,016 0,016 0,001 0,032 SC 0,016 0,002 0,009 0,027 SE 0,003 0,001 0,001 0,005 SP 0,048 0,111 0,003 0,162 TO 0,006 0,009 0,028 0,044 Total 0,232 0,515 0,253 1,000 Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0369 0,6999 0,6999 ****************************** 2 0,0158 0,3001 1,0000 ************ Total 0,0527 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 AC 1,000 0,052 0,003-0,042 0,621 0,002 0,033 0,379 0,004 2 AL 1,000 0,055 0,078 0,272 0,997 0,111 0,014 0,003 0,001 3 AM 1,000 0,049 0,004 0,066 0,944 0,006 0,016 0,056 0,001 4 AP 1,000 0,040 0,035 0,138 0,415 0,021-0,164 0,585 0,068 5 BA 1,000 0,046 0,017 0,135 0,901 0,022 0,045 0,099 0,006 6 CE 1,000 0,040 0,014 0,135 0,998 0,019-0,006 0,002 0,000 7 ES 1,000 0,018 0,066-0,333 0,566 0,053 0,291 0,434 0,095 8 GO 1,000 0,025 0,022-0,197 0,814 0,026 0,094 0,186 0,014 9 MA 1,000 0,045 0,014 0,038 0,090 0,002-0,122 0,910 0, MG 1,000 0,034 0,000 0,015 0,803 0,000-0,008 0,197 0, MS 1,000 0,031 0,073-0,340 0,925 0,097-0,097 0,075 0, MT 1,000 0,032 0,027-0,141 0,441 0,017-0,159 0,559 0, PA 1,000 0,058 0,006-0,071 0,991 0,008 0,007 0,009 0, PB 1,000 0,054 0,069 0,242 0,858 0,085 0,098 0,142 0, PE 1,000 0,051 0,042 0,201 0,929 0,056 0,055 0,071 0, PI 1,000 0,057 0,073 0,240 0,851 0,088 0,101 0,149 0, PR 1,000 0,022 0,021-0,205 0,847 0,025 0,087 0,153 0, RJ 1,000 0,023 0,052-0,278 0,652 0,048 0,203 0,348 0, RN 1,000 0,041 0,005 0,064 0,602 0,005-0,052 0,398 0, RO 1,000 0,025 0,095-0,211 0,220 0,030-0,397 0,780 0, RR 1,000 0,064 0,014-0,088 0,661 0,013-0,063 0,339 0, RS 1,000 0,024 0,032-0,209 0,626 0,029 0,161 0,374 0, SC 1,000 0,024 0,027-0,066 0,074 0,003 0,234 0,926 0, SE 1,000 0,035 0,005 0,041 0,214 0,002-0,078 0,786 0, SP 1,000 0,021 0,162-0,613 0,911 0,211 0,191 0,089 0, TO 1,000 0,038 0,044-0,140 0,324 0,020-0,202 0,676 0,098 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 ag 1,000 0,392 0,232 0,108 0,374 0,124-0,140 0,626 0,484 2 de 1,000 0,264 0,515-0,321 1,000 0,735 0,007 0,000 0,001 3 ba 1,000 0,344 0,253 0,123 0,389 0,140 0,154 0,611 0,515

70 Dimensão Habitação por Região ANOVA por região das Variáveis M_TBANAGUA; M_TAGUA; M_TDENS One-way ANOVA: M_TABANAGUA versus REGIAO_N Source DF SS MS F P REGIAO_N 4 0,8865 0, ,65 0,000 Error 21 0,2975 0,0142 Total 25 1,1839 S = 0,1190 R-Sq = 74,88% R-Sq(adj) = 70,09% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 3 0,9068 0,0325 (------*------) N 7 0,5094 0,1778 (---*----) NE 9 0,6152 0,1138 (---*---) S 3 0,9531 0,0019 (------*------) SE 4 0,9501 0,0259 (------*-----) ,60 0,80 1,00 1,20 Pooled StDev = 0,1190 One-way ANOVA: M_TDENS versus REGIAO_N Source DF SS MS F P REGIAO_N 4 0,5071 0, ,02 0,000 Error 21 0,2415 0,0115 Total 25 0,7486 S = 0,1072 R-Sq = 67,74% R-Sq(adj) = 61,59% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 3 0,2507 0,0639 ( * ) N 7 0,5583 0,1816 (----*----) NE 9 0,3773 0,0582 (----*---) S 3 0,1496 0,0315 ( * ) SE 4 0,2368 0,0463 (------*------) ,16 0,32 0,48 0,64 Pooled StDev = 0,1072 One-way ANOVA: M_TAGUA versus REGIAO_N Source DF SS MS F P REGIAO_N 4 0, , ,72 0,001 Error 21 0, ,00538 Total 25 0,25771 S = 0,07337 R-Sq = 56,14% R-Sq(adj) = 47,78% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 3 0,9307 0,0052 ( * ) N 7 0,8065 0,1172 (------*------)

71 43 NE 9 0,7517 0,0573 (-----*-----) S 3 0,9117 0,0212 ( * ) SE 4 0,9239 0,0335 ( * ) ,720 0,800 0,880 0,960 Pooled StDev = 0, Análise de Correspondência da Média por região das Variáveis M_TBANAGUA; M_TAGUA; M_TDENS 0,3 Symmetric Plot 0,2 Component 2 0,1 0,0-0,1-0,2-0,3 de N NE ba CO SEag S -0,4-0,5-0,6-0,6-0,5-0,4-0,3-0,2-0,1 0,0 Component 1 0,1 0,2 0,3 Simple Correspondence Analysis: M_TBAN_r; M_TDEN_r; M_TAGU_r Relative Inertias ag de ba Total CO 0,011 0,039 0,000 0,050 N 0,144 0,416 0,001 0,561 NE 0,018 0,065 0,001 0,084 S 0,050 0,173 0,001 0,224 SE 0,025 0,056 0,000 0,081 Total 0,248 0,749 0,003 1,000 Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0544 0,9985 0,9985 ****************************** 2 0,0001 0,0015 1,0000 Total 0,0545 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 CO 1,000 0,212 0,050 0,114 0,998 0,050-0,005 0,002 0,056 2 N 1,000 0,191 0,561-0,400 1,000 0,562-0,006 0,000 0,080 3 NE 1,000 0,177 0,084-0,160 0,998 0,084 0,008 0,002 0,134 4 S 1,000 0,205 0,224 0,244 0,998 0,224-0,010 0,002 0,270 5 SE 1,000 0,215 0,081 0,143 0,991 0,080 0,013 0,009 0,460

72 44 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 ag 1,000 0,400 0,248 0,184 0,998 0,248 0,009 0,002 0,352 2 de 1,000 0,160 0,749-0,505 1,000 0,750 0,007 0,000 0,090 3 ba 1,000 0,440 0,003 0,016 0,722 0,002-0,010 0,278 0, Análise de Correspondência do Desvio Padrão por região das Variáveis M_TBANAGUA; M_TAGUA; M_TDENS 0,50 Symmetric Plot S ba 0,25 SE Component 2 0,00-0,25 de N ag NE CO -0,50-0,50-0,25 0,00 Component 1 0,25 0,50 Simple Correspondence Analysis: DP_TBAN_r; DP_TDEN_r; DP_TAGU_r Relative Inertias ag de ba Total CO 0,006 0,166 0,179 0,350 N 0,001 0,002 0,000 0,004 NE 0,130 0,134 0,001 0,264 S 0,189 0,054 0,056 0,299 SE 0,048 0,006 0,028 0,082 Total 0,374 0,362 0,264 1,000 Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0577 0,6519 0,6519 ****************************** 2 0,0308 0,3481 1,0000 **************** Total 0,0886 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 CO 1,000 0,105 0,350-0,327 0,361 0,194-0,435 0,639 0,643 2 N 1,000 0,492 0,004 0,026 0,919 0,006 0,008 0,081 0,001 3 NE 1,000 0,237 0,264 0,314 1,000 0,405 0,007 0,000 0,000 4 S 1,000 0,056 0,299-0,583 0,722 0,331 0,362 0,278 0,239 5 SE 1,000 0,109 0,082-0,184 0,508 0,064 0,181 0,492 0,116

73 45 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 ag 1,000 0,364 0,374 0,282 0,875 0,502-0,107 0,125 0,134 2 de 1,000 0,394 0,362-0,270 0,895 0,497-0,092 0,105 0,109 3 ba 1,000 0,242 0,264 0,015 0,002 0,001 0,310 0,998 0, CONSIDERAÇÕES FINAIS Realizar a análise discriminante dos dados busca verificar qual dos métodos entre as funções linear e quadrática, demonstra maior assertividade nos agrupamentos e grupos de similaridade. Foram realizadas análises nas dimensões Demografia e Habitação, utilizando agrupamentos em 4 Brasis. Para a dimensão Habitação foi necessário agrupar o estado do Amazonas no Grupo 1 pois o software necessidade de pelo menos dois registros dentro de cada grupo para gerar a devida análise discriminante. Na dimensão Demografia as variáveis ESPVIDA1, MORT1(i) e MORT5(i) utilizamos a análise discriminante linear e conseguimos um resultado de 49,40% de proporção correta, valor muito baixo para confiança nos dados em analise. Para análise Discriminante Linear para os 4 Brasis obtivemos o percentual de 55,40% enquanto no método quadrático 60,50%. Na análise regressão logística apresenta-se um ganho significativo de confiabilidade atingindo o percentual de 70,90% para as variáveis ESPVIDA1, MORT1(i) e MORT5(i) e 73,00% para os 4 Brasis. Na análise realizada por agrupamentos de regiões apresentado no dendrograma, e na regressão logística com o cenário 4 Brasis, a proporcionalidade ficou em 100%, para os dois modelos. Na dimensão Habitação as variáveis T_BANAGUA, T_DENS e T_AGUA utilizamos a análise discriminante linear e conseguimos um resultado de 43,60% de proporção correta, valor muito baixo para confiança nos dados em analise. Para análise Discriminante Linear para os 4 Brasis obtivemos o percentual de 54,20% enquanto no método quadrático 54,70%. Na análise regressão logística apresenta-se um ganho significativo de confiabilidade atingindo o percentual de 71,20% para as variáveis T_BANAGUA, T_DENS e T_AGUA e 72,50% para os 4 Brasis. Na análise realizada por agrupamentos apresentado no dendrograma, e na regressão logística com o cenário 3 Brasis (junção do AM), a proporcionalidade ficou em 100%, para os dois modelos. Para a análise realizada pela metodologia Classification Tree, por meio do software SPSS, a mesma apresentou uma queda na confiabilidade dos índices também não apresentando índices satisfatórios. Para a Dimensão Demografia apresentou o percentual de 57,00% como Percent Correct enquanto na Dimensão Habitação 50,9%.

74 PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 ALGUMAS VARIÁVEIS DA DIMENSÃO EDUCAÇÃO Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Dione Fagundes Nunes Gomes 1º Semestre 2014

75 2 1. INTRODUÇÃO A análise discriminante é uma técnica da estatística multivariada utilizada para discriminar e classificar objetos. É uma técnica da estatística multivariada que estuda a separação de objetos de uma população em duas ou mais classes. A discriminação ou separação é a primeira etapa, sendo a parte exploratória da análise e consiste em se procurar características capazes de serem utilizadas para alocar objetos em diferentes grupos previamente definidos. A classificação ou alocação pode ser definida como um conjunto de regras que serão usadas para alocar novos objetos. O presente trabalho tem por objetivo efetuar uma análise comparativa de médias, intervalos de confiança e regressões de dados de indicadores relacionados ao desenvolvimento humano dos municípios do Brasil. Utilizamos a análise discriminante para tentar predizer ou explicar os indicadores relacionados ao desenvolvimento da educação dos municípios do Brasil. Contudo, a função que separa objetos pode também servir para alocar, e o inverso, regras que alocam objetos podem ser usadas para separar. Normalmente, discriminação e classificação se sobrepõem na análise, e a distinção entre separação e alocação é confusa. O problema da discriminação entre dois ou mais grupos, visando posterior classificação consiste em obter funções matemáticas capazes de classificar um indivíduo X (uma observação X) em uma de várias populações, com base em medidas de um número p de características, buscando minimizar a probabilidade de má classificação. Os dados são originários da pesquisa da Atlas Brasil 2013 com base nos dados sobre a dimensão Desenvolvimento Humano dos municípios do Brasil. Neste trabalho abordaremos as variáveis referentes IDHM, IDHM_R e ESPVIDA dos municípios. O software estatístico utilizado é o MINITAB ENTENDENDO OS DADOS 2.1 Os Indivíduos Os indivíduos deste trabalho são os municípios brasileiros, que serão analisados pelos seus indicadores relativos ao Desenvolvimento Humano presentes no relatório Atlas Brasil 2013, dados referentes ao ano de Este sujeito da análise é composto por um total de 5565 municípios brasileiros e os dados analisados de cada município são as variáveis que serão descritas na próxima seção. A dimensão Educação (acesso ao conhecimento) é uma das três dimensões que compõem o IDHM, juntamente com Longevidade e Renda. Ela é medida pela composição de dois subíndices: a escolaridade da população adulta e o fluxo escolar da população jovem.

76 3 Portanto, é preciso que o crescimento econômico seja transformado em conquistas concretas para as pessoas, por meio de ações que proporcionem uma realidade que apresente crianças mais saudáveis, educação universal e de qualidade, ampliação da participação política dos cidadãos, preservação ambiental, equilíbrio da renda e das oportunidades entre toda a população, maior liberdade de expressão, entre outras. Além disso, ao colocar as pessoas no centro da análise, a abordagem de desenvolvimento humano redefine a maneira com que pensamos e lidamos com o desenvolvimento de forma nacional e local, ou seja, no âmbito dos municípios. 2.2 As Variáveis São oito as variáveis desta pesquisa (extraídas do total de 59 variáveis disponibilizadas pelo Atlas na dimensão Educação), além de Município, Unidade da Federação (UF) e Região. As mesmas são melhor explicadas na Tabela 1. Ressalta-se que todos os dados desta pesquisa são referentes ao ano de Tabela 1 As Variáveis VARIÁVEL SIGNIFICADO TIPO T_ANALF15M T_ANALF25M T_FREQ6A17 T_FUND25M T_FLMED T_FLSUPER T_MED18M Razão entre a população de 15 anos ou mais de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Razão entre a população de 25 anos ou mais de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Razão entre população de 6 a 17 anos de idade que estava frequentando a escola, em qualquer nível ou série e a população total nesta faixa etária multiplicado por 100. Razão entre a população de 25 anos ou mais de idade que concluiu o ensino fundamental, em quaisquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo) e o total de pessoas nesta faixa etária multiplicado por 100. Razão entre o número de pessoas na faixa etária de 15 a 17 anos frequentando o ensino médio regular seriado e a população total dessa mesma faixa etária multiplicado por 100. As pessoas de 15 a 17 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. Razão entre o número de pessoas na faixa etária de 18 a 24 anos frequentando o ensino superior (graduação, especialização, mestrado ou doutorado) e a população total dessa mesma faixa etária multiplicado por 100. Razão entre a população de 18 anos ou mais de idade que concluiu o ensino médio, em quaisquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo) e o total de pessoas nesta faixa etária multiplicado por 100. Foram consideradas como tendo concluído o ensino médio as pessoas frequentando a 4ª série desse nível. Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa UNIDADE DE MEDIDA Percentual Percentual Percentual Percentual Percentual Percentual Percentual

77 4 T_SUPER25M Razão entre a população de 25 anos ou mais de idade que concluiu pelo menos a graduação do ensino superior e o total de pessoas nesta faixa etária multiplicado por 100. MUNICÍPIO Nome do Município Variável Categórica Variável Quantitativa UF Código utilizado pelo IBGE para identificação do Estado. Variável Categórica REGIÃO Código utilizado pelo IBGE para identificação da Região. Variável Categórica Fonte: Atlas Brasil, Percentual n/a n/a n/a 3. ANÁLISE DAS VARIÁVEIS 3.1 Variáveis Categóricas Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo pie chart e/ou barras Variável: Estado Fazem parte desta pesquisa os 27 estados brasileiros e suas cidades. O gráfico abaixo exibe o número de cidades por estado Cidades por Estado Count PA RN CE PE MA PB PI GO SC PR BA RS SP MG MT UFN SE MS ES RJ AL TO DF RR AP AC RO AM A variação no número de cidades por estado é acentuada. Considerando que o Distrito Federal é um estado brasileiro, é o estado com o menor número de cidades (1), enquanto o Mato Grosso possui mais de 852 cidades.

78 Variável: Região Figura 3. Número de Cidades por Estado e Região do Brasil 35 CIDADES POR REGIÃO Percent NE SE S Região CO N Percent within all data. Podemos verificar no gráfico acima que a Região Nordeste é a que possui o maior número de cidades do Brasil (1790) e seguido pela Região Sudeste (1669). A Região que possui o menor número de cidades é a Norte, com 447 cidades, muito próxima da Região Centro-Oeste (468). A Região Sul possui 1191 cidades. A ilustração a seguir monstra a divisão do Brasil por região e por estado

79 Variável: Município A amostra totaliza 5565 municípios, que pode ser verificada na distribuição no território nacional de acordo com a região no gráfico 1. Gráfico 1 - distribuição dos municípios nas Regiões Brasileiras. Gráfico de Setores de Região NE 1794; 32,2% N 449; 8,1% CO 466; 8,4% Categoria N CO S SE NE S 1188; 21,3% SE 1668; 30,0% Fonte: elaborado pelo autor, 2014 (Atlas Brasil, 2014) De acordo com gráfico 1 pode-se observar que as maiores concentrações de municípios brasileiros estão nas regiões do Nordeste com 32,20% e Sudeste com 30% somando juntas mais de 50% dos municípios pesquisados (62,20%). O Gráfico 2 demonstra a distribuição dos municípios pelas Unidades Federativas do Brasil.

80 7 Gráfico 2 Representação dos municípios nas Unidades da Federação SP 11,6% RS 8,9% Gráfico de Setores de UFN MG 15,3% BA 7,5% AM SE ES MS RJ Other 1,1% 1,3% 1,4% 1,4% 1,7% AL 1,9% 1,8% TO 2,5% MT 2,5% PA 2,6% RN 3,0% CE 3,3% PR 7,2% SC 5,3% GO 4,4% PE 3,3% MA 3,9% PB 4,0% PI 4,0% Categoria AM SE ES MS RJ AL TO MT PA RN CE PE MA PB PI GO SC PR BA RS SP MG Outros Fonte: elaborado pelo autor, 2014 (Atlas Brasil, 2014) Conforme pode ser observado no Gráfico 2, as Unidades da Federação mais representativas são Minas Gerais (15,3%), São Paulo (11,6%) e Rio Grande do Sul (8,9%). As menos expressivas são de Amazonas, Sergipe, Espírito Santos, entre outros. O Mapa 1 (Atlas Brasil, 2014) apresenta o IDHM (Índice de Desenvolvimento Humano Municipal) dos municípios brasileiros em 1991, 2000 e Com base nesta representação pode se observar que, com relação IDHM, existe uma concentração de índices mais altos nos municípios da região centro-sul do Brasil. Contudo, também pode ser percebido que as regiões Norte e Nordeste que concentravam os municípios que apresentavam índices muito baixos de desenvolvimento humano, conseguiram reverter para índices baixos e médios de desenvolvimento.

81 8 Mapa 1 - IDHM evolução 1991, 2000 e 2010 Fonte: Atlas Brasil, Para entender esta evolução do IDHM dos municípios brasileiros são apresentadas informações na tabela 2, ilustrada pelo gráfico 1. A classificação IDHM proposta pelo Atlas Brasil tem sua variação entre Muito Baixo Desenvolvimento Humano (IDHM inferior a 0,500) a Muito Alto Desenvolvimento Humano (IDHM igual ou superior a 0,800).

82 9 Conforme estas informações pode-se perceber a evolução dos municípios entre o período de 1991 e Em 1991, mais de 85% dos municípios encontravam-se na faixa de Muito Baixo Desenvolvimento Humano. Já nos anos 2000, pouco mais que 70% deles encontravam-se nas faixas de Baixo e Muito Baixo Desenvolvimento Humano. Na última análise referente a 2010, apenas um quarto (25%) dos municípios brasileiros encontravam-se nessas faixas e mais de 70% deles já figuravam nas faixas de Médio e Alto Desenvolvimento Humano. Segundo as informações constantes no Atlas Brasil 2013 isso ilustra os avanços do desenvolvimento humano no país nas últimas duas décadas. Com relação ao IDHM Educação: É o que menos contribui para o IDHM do Brasil Saiu de 0,279 (1991) para 0,637 (2010). É a dimensão que mais avançou nos últimos 20 anos Em termos absolutos: 0,358 Em termos relativos: 128,3% Movimento puxado pelo fluxo escolar de jovens 2,5 vezes maior em 2010, em relação a 1991 Crescimento de 156% neste subíndice Porém É o componente com maior hiato: 0,363 É o único subíndice classificado na faixa Médio Desenvolvimento Humano 3.2 Variáveis Quantitativas A análise deste tipo de variável permite a utilização de uma maior gama de ferramentas de análise como histogramas, curvas de densidade, gráfico de ramos, box-plot e dot-plot, além de informações numéricas como média, desvio-padrão, mediana, quartis, 5 números, intervalo de confiança e teste de normalidade de Anderson-Darling. Também podemos fazer classificações supervisionadas das variáveis quantitativas, através da análise discriminante Análise discriminante linear por região A análise discriminante é uma técnica da estatística multivariada utilizada para discriminar e classificar objetos, e estuda a separação de objetos de uma população em duas ou mais classes. Neste caso queremos discriminar os valores das variáveis T_ANALF15Mnp 1 e T_ANALF25Mnp dos municípios 2 do Brasil, e utilizaremos inicialmente a variável categórica Região. Para geração de análise discriminante utilizaremos o comando do Minitab: STAT >> MULTIVARIATE >> DISCRIMINANT ANALISYS 1 As letras np no final das variáveis representam que as mesmas foram normalizadas e positivadas. 2 Para está análise excluiu-se o DF Distrito Federal.

83 10 Discriminant Analysis: Região versus T_ANALF15M_np; T_ANALF25M_np Linear Method for Response: Região Predictors: T_ANALF15M_np; T_ANALF25M_np Group CO N NE S SE Count Summary of classification True Group Put into Group CO N NE S SE CO N NE S SE Total N N correct Proportion 0,424 0,503 0,798 0,769 0,216 N = 5564 N Correct = 2908 Proportion Correct = 0,523 Squared Distance Between Groups CO N NE S SE CO 0,0000 1,4673 7,2759 1,0006 0,0750 N 1,4673 0,0000 3,2749 4,4480 1,9595 NE 7,2759 3,2749 0, ,6695 8,7574 S 1,0006 4, ,6695 0,0000 0,5485 SE 0,0750 1,9595 8,7574 0,5485 0,0000 Linear Discriminant Function for Groups CO N NE S SE Constant -16,530-11,534-4,664-22,782-18,078 T_ANALF15M_np -21,484 31,766-6,500-24,523-16,908 T_ANALF25M_np 65,693 5,175 30,015 76,428 63,182 Summary of Misclassified Observations Figura 2. Resultado do comando STAT >> MULTIVARIATE >> DISCRIMINANT ANALISYS Com base nas informações apresentadas na figura 2 pode ser notado que a região que acertou mais é Nordeste (0,798) e a que errou mais foi a região Sudeste (0,216). As informações ainda exibem o cruzamento de dados entre as regiões, por exemplo, a região Nordeste possui 1794 municípios e apenas 1432 correspondem a região. O nome desta matriz é confusion matrix ou matriz de confusão. Podemos concluir que o agrupamento por região não é uma boa escolha segundo esta avaliação.

84 ANÁLISE DISCRIMINANTE LINEAR POR 2 BRASIS Esta segunda análise está interessada em verificar os possíveis agrupamentos dos dados utilizando a variável 2 Brasis, calculada a partir do exercício anterior, e demonstra os agrupamentos do Brasil segundo sua proximidade de dados de educação. Para esta análise foram agrupadas as regiões de Sul, Sudeste e Centro-Oeste como COSSE, e as regiões de Norte e Nordeste como NNE. Discriminant Analysis: Reclassifica versus T_ANALF15M_n; T_ANALF25M_n Linear Method for Response: Reclassificação Regiões Predictors: T_ANALF15M_np; T_ANALF25M_np Group COSSE NNE Count Summary of classification True Group Put into Group COSSE NNE COSSE NNE Total N N correct Proportion 0,922 0,830 N = 5564 N Correct = 4925 Proportion Correct = 0,885 Squared Distance Between Groups COSSE NNE COSSE 0, ,12526 NNE 6, ,00000 Linear Discriminant Function for Groups COSSE NNE Constant -15,078-4,579 T_ANALF15M_np -37,141-8,871 T_ANALF25M_np 74,702 29,623 Summary of Misclassified Observations Existem duas possibilidades de realizar a análise discriminante que são a linear e a quadrática. Dependendo da variável deve-se dar mais peso e mais atenção a um método em detrimento do outro. Neste caso a linear já nos apresenta informações satisfatórias. Podemos observar que alguns estados e municípios da região COSSE tem características da região NNE, visto pelo número 638 municípios foram encontrados na intersecção entre COSSE e NNE.

85 ANÁLISE DISCRIMINANTE QUADRÁTICA POR 3 BRASIS Uma boa classificação deve resultar em pequenos erros, isto é, deve haver pouca probabilidade de classificação inadequada, e para que isso ocorra a regra de classificação deve considerar as probabilidades a priori e os custos de classificação errada. Outro fator que uma regra de classificação deve considerar é se as variâncias das populações são iguais ou não. Quando a regra de classificação assume que as variâncias das populações são iguais, as funções discriminantes são ditas lineares e quando não são funções discriminantes quadráticas. Vamos agora verificar a função quadrática para os 2 Brasis apresentado na análise anterior. Discriminant Analysis: Reclassifica versus T_ANALF15M_n; T_ANALF25M_n Quadratic Method for Response: Reclassificação Regiões Predictors: T_ANALF15M_np; T_ANALF25M_np Group COSSE NNE Count Summary of classification True Group Put into Group COSSE NNE COSSE NNE Total N N correct Proportion 0,919 0,840 N = 5564 N Correct = 4937 Proportion Correct = 0,887 From Generalized Squared Distance to Group Group COSSE NNE COSSE -13,60-7,14 NNE -4,89-11,41 Summary of Misclassified Observations No modelo quadrático a proporção apresentou uma diferença de 0,002. Seguindo o princípio da simplicidade, vamos escolher o método linear, pois este é o mais simples. Em Ciência, a parcimônia é a preferência pela explicação mais simples para uma observação. Esta geralmente é considerada a melhor maneira de julgar as hipóteses. Parcimônia também é um conceito utilizado na sistemática moderna que estabelece que ao construir e selecionar árvores filogenéticas, ou seja, os dados, o melhor critério é baseado em seus princípios: normalmente é correto o relacionamento mais simples encontrado entre dois indivíduos, aquele que apresente o menor número de passos intermediários ou mudanças evolucionárias. Portanto, é mínima a diferença entre o método linear e o quadrático, o que não justifica a utilização do método quadrático.

86 ANÁLISE DISCRIMINANTE LINEAR PARA DADOS AGRUPADOS Dendograma média por estado T_ANALF15Mnp x T_ANALF25Mnp 82,69 Similarity 88,46 94,23 100,00 CE BA AC AL PI PB SE RN PE MA PA RR TO AP AM Observations SC RS SP RJ PR RO Gráfico2. Dendograma da variáveis T_ANALF15Mnp x T_ANALF25Mnp por estados do Brasil (classificação não supervisionada) No gráfico 2 acima é possível verificar cinco grupos de variáveis, agrupadas pela similaridade dos dados. Os estados que possuem maior similaridade são Mato Grosso e Rondônia, no grupo laranja; e Rio de Janeiro e São Paulo, mais Rio Grande do Sul e Santa Catarina, no grupo rosa. O nível de similaridade dos dados destes estados está acima de 99 %, conforme indicado na escala apresentada no eixo Y do gráfico. MG ES MT MS GO

87 14 No mapa acima pode ser percebido a divisão por cores dos estados de acordo com seu agrupamento por similaridade. Nesta representação vale destacar há certa coerência com as particularidades de cada estado, com o exemplo do agrupamento dos estados na cor rosa se justifica por aparentemente apresentarem resultados positivos de educação em relação aos outros estados. Neste exemplo abaixo vamos através do dendograma pesquisar o grau de similaridade das médias das variáveis T_ANALF15Mnp e T_ANALF25Mnp agrupamentos. Com base na análise discriminante poderemos verificar a proporção correta dos agrupamentos. Discriminant Analysis: Agrupamentos versus MÉDIA T_ANAL; MÉDIA T_ANAL Linear Method for Response: Agrupamentos de Estados Predictors: MÉDIA T_ANALF15Mnp; MÉDIA T_ANALF25Mnp Group G1 G2 G3 G4 Count Summary of classification

88 15 True Group Put into Group G1 G2 G3 G4 G G G G Total N N correct Proportion 1,000 1,000 1,000 1,000 N = 26 N Correct = 26 Proportion Correct = 1,000 Squared Distance Between Groups G1 G2 G3 G4 G1 0,000 25,006 69, ,256 G2 25,006 0,000 11,227 39,892 G3 69,699 11,227 0,000 9,043 G4 127,256 39,892 9,043 0,000 Linear Discriminant Function for Groups G1 G2 G3 G4 Constant -43,81-103,05-156,76-212,96 MÉDIA T_ANALF15Mnp -170,88-229,01-289,60-427,86 MÉDIA T_ANALF25Mnp 393,40 570,36 710,61 918,17 Neste caso a proporção correta é de 100%, ou seja, os agrupamentos gerados anteriormente pelo agrupamento em 4 Brasis gerou a mesma proporção do método linear utilizado na análise discriminante. 4. REGRESSÃO LOGÍSTICA ORDINAL PARA AS VARIÁVEIS: T_ANALF15Mnp e T_ANALF25Mnp. Inicialmente foram classificadas pela análise ANOVA as regiões para as variáveis: T_ANALF15Mnp e T_ANALF25Mnp. One-way ANOVA: T_ANALF15M_np versus Região Source DF SS MS F P Região 4 191, , ,35 0,000 Error ,1849 0,0169 Total ,2556 S = 0,1302 R-Sq = 66,98% R-Sq(adj) = 66,96% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 465 0,7390 0,0939 (*) N 449 0,6251 0,1534 (* NE ,3938 0,1535 *) S 789 0,8678 0,0746 (* SE ,7744 0,1262 (* ,45 0,60 0,75 0,90 Pooled StDev = 0,1302

89 16 One-way ANOVA: T_ANALF25M_np versus Região Source DF SS MS F P Região 4 194, , ,70 0,000 Error ,5621 0,0168 Total ,2402 S = 0,1297 R-Sq = 67,54% R-Sq(adj) = 67,52% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 465 0,7449 0,0903 (* N 449 0,6205 0,1503 *) NE ,3960 0,1523 *) S 789 0,8746 0,0712 *) SE ,7795 0,1284 * ,45 0,60 0,75 0,90 Pooled StDev = 0,1297 Após esta análise chegou-se à classificação das regiões de acordo com as médias: NE (1); N (2); CO (3); SE (4) e S (5). Neste momento é realizado a Regressão Logística Ordinal. Ordinal Logistic Regression: Regiões codi versus T_ANALF15M_n; T_ANALF25M_n Link Function: Logit Response Information Variable Value Count Regiões codificadas Total 5564 Logistic Regression Table 95% CI Predictor Coef SE Coef Z P Odds Ratio Lower Const(1) 6, , ,14 0,000 Const(2) 7, , ,81 0,000 Const(3) 8, , ,86 0,000 Const(4) 11,5514 0, ,91 0,000 T_ANALF15M_np 15,0270 2, ,22 0, , ,26 T_ANALF25M_np -27,2779 2, ,22 0,000 0,00 0,00 Predictor Upper Const(1) Const(2) Const(3) Const(4) T_ANALF15M_np 3,82555E+08 T_ANALF25M_np 0,00 Log-Likelihood = -5219,760

90 17 Test that all slopes are zero: G = 5366,115, DF = 2, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 24647, ,000 Deviance 10400, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,1 Somers' D 0,76 Discordant ,8 Goodman-Kruskal Gamma 0,76 Ties ,2 Kendall's Tau-a 0,55 Total ,0 Destaca-se que esta análise é confiável, pois o valor de P foi de 0. O modelo apresentou nível de concordância de 88,1% (acerto). Foi aplicada também a análise de Regressão Logística Ordinal para os dados agrupados em região, no entanto, este não se mostrou confiável por causa do número de dados analisados serem muito baixos. Ordinal Logistic Regression: Grupos versus MÉDIA T_ANAL; MÉDIA T_ANAL * WARNING * Algorithm has not converged after 20 iterations. * WARNING * Convergence has not been reached for the parameter estimates criterion. * WARNING * The results may not be reliable. * WARNING * Try increasing the maximum number of iterations. Link Function: Logit Response Information Variable Value Count Grupos Total 26 Logistic Regression Table 95% CI Predictor Coef SE Coef Z P Odds Ratio Lower Upper Const(1) 260, ,0 0,02 0,988 Const(2) 321, ,4 0,02 0,987 Const(3) 400, ,5 0,02 0,986 MÉDIA T_ANALF15Mnp 335, ,00 0,999 7,70028E+145 0,00 * MÉDIA T_ANALF25Mnp -823, ,00 0,998 0,00 0,00 * Log-Likelihood = -0,000 Test that all slopes are zero: G = 67,918, DF = 2, P-Value = 0,000 Goodness-of-Fit Tests

91 18 Method Chi-Square DF P Pearson 0, ,000 Deviance 0, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,0 Somers' D 1,00 Discordant 0 0,0 Goodman-Kruskal Gamma 1,00 Ties 0 0,0 Kendall's Tau-a 0,74 Total ,0 5. CONSIDERAÇÕES FINAIS A tarefa da análise discriminante é encontrar a melhor função discriminante linear ou quadrática de um conjunto de variáveis que reproduza, tanto quanto possível, um agrupamento a priori de casos considerados. Um procedimento em passos é utilizado nesse programa, e em cada passo a variável mais poderosa é introduzida na função discriminante. A função critério para selecionar a próxima variável depende do número de grupos especificados (o número de grupos varia de 2 a 20). Quando o número de variáveis é maior do que dois, então o critério de seleção de variáveis é o traço do produto da matriz de covariância para as variáveis envolvidas e a matriz de covariância interclasse em um passo particular. Os cálculos podem ser realizados em toda a população ou em amostra de dados ou mesmo em dados previamente agrupados. Em nossas análises com as variáveis T_ANALF15Mnp e T_ANALF25Mnp, utilizamos a análise discriminante linear e conseguimos um resultado de 0,885 de proporção correta. Isto demonstra coerência na divisão em dois grupos. Além disso, é relevante ressaltar a similaridade destes grupos (municípios) com base nestas variáveis, levando em conta inclusive sua situação geográfica. Na outra análise realizada com base no agrupamento apresentado no dendograma, onde pode ser percebido 4 Brasis, a proporcionalidade ficou em 100%.

92 PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Luciano Ferreira da Silva 1º Semestre 2014

93 2 1. INTRODUÇÃO A análise discriminante é uma técnica da estatística multivariada utilizada para discriminar e classificar objetos. É uma técnica da estatística multivariada que estuda a separação de objetos de uma população em duas ou mais classes. A discriminação ou separação é a primeira etapa, sendo a parte exploratória da análise e consiste em se procurar características capazes de serem utilizadas para alocar objetos em diferentes grupos previamente definidos. A classificação ou alocação pode ser definida como um conjunto de regras que serão usadas para alocar novos objetos. O presente trabalho tem por objetivo efetuar uma análise comparativa de médias, intervalos de confiança e regressões de dados de indicadores relacionados ao desenvolvimento humano dos municípios do Brasil. Utilizamos a análise discriminante para tentar predizer ou explicar os indicadores relacionados ao desenvolvimento da educação dos municípios do Brasil. Contudo, a função que separa objetos pode também servir para alocar, e o inverso, regras que alocam objetos podem ser usadas para separar. Normalmente, discriminação e classificação se sobrepõem na análise, e a distinção entre separação e alocação é confusa. O problema da discriminação entre dois ou mais grupos, visando posterior classificação consiste em obter funções matemáticas capazes de classificar um indivíduo X (uma observação X) em uma de várias populações, com base em medidas de um número p de características, buscando minimizar a probabilidade de má classificação. Os dados são originários da pesquisa da Atlas Brasil 2013 com base nos dados sobre a dimensão Desenvolvimento Humano dos municípios do Brasil. Neste trabalho abordaremos as variáveis referentes IDHM, IDHM_R e ESPVIDA dos municípios. O software estatístico utilizado é o MINITAB ENTENDENDO OS DADOS 2.1 Os indivíduos Os indivíduos deste trabalho são os municípios brasileiros, que serão analisados pelos seus indicadores relativos à dimensão Desenvolvimento Humano presentes no relatório Atlas Brasil 2013, dados referentes ao ano de Este sujeito da análise é composto por um total de 5565 municípios brasileiros e os dados analisados de cada município são as variáveis que serão descritas na próxima seção. Quanto à dimensão Desenvolvimento Humano, esta está relacionada ao processo de ampliação das liberdades das pessoas, no que tange as suas capacidades e as oportunidades a seu dispor, para que elas possam escolher a vida que desejam ter. O processo de expansão destas liberdades inclui as dinâmicas sociais, econômicas, políticas e ambientais necessárias para garantir uma variedade de oportunidades, bem como o ambiente propício para cada um exercer na plenitude o seu potencial. Deste modo, o Desenvolvimento Humano deve estar centrado nas pessoas e na ampliação do seu bem-estar. Nesta abordagem, a renda e a riqueza não são fins em si mesmas, mas meios para que as pessoas possam viver a vida que desejam. Assim, o crescimento econômico de uma sociedade não se traduz automaticamente em qualidade de vida e, muitas vezes, o que se observa é o reforço das desigualdades. Portanto, é preciso que o crescimento econômico seja transformado em conquistas concretas para as pessoas, por meio de ações que proporcionem uma realidade que apresente

94 3 crianças mais saudáveis, educação universal e de qualidade, ampliação da participação política dos cidadãos, preservação ambiental, equilíbrio da renda e das oportunidades entre toda a população, maior liberdade de expressão, entre outras. Além disso, ao colocar as pessoas no centro da análise, a abordagem de desenvolvimento humano redefine a maneira com que pensamos e lidamos com o desenvolvimento de forma nacional e local, ou seja, no âmbito dos municípios. 2.2 As Variáveis São 13 as variáveis desta pesquisa, incluindo a Unidade da Federação (UF). As mesmas são melhor explicadas na Tabela 1. Ressalta-se que todos os dados desta pesquisa são referentes ao ano de Tabela 1 Variáveis Dimensão Desenvolvimento Humano VARIÁVEL SIGNIFICADO TIPO ESPVIDA IDHM_L IDHM_R IDHM_E IDHM RDPC Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. Índice da dimensão Longevidade que é um dos 3 componentes do IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do indicador) - (valor mínimo)] / [(valor máximo) - (valor mínimo)], onde os valores mínimo e máximo são 25 e 85 anos, respectivamente. Índice da dimensão Renda que é um dos 3 componentes do IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado do indicador) - ln (valor mínimo)] / [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). Índice sintético da dimensão Educação que é um dos 3 componentes do IDHM. É obtido através da média geométrica do subíndice de frequência de crianças e jovens à escola, com peso de 2/3, e do subíndice de escolaridade da população adulta, com peso de 1/3. Índice de Desenvolvimento Humano Municipal. Média geométrica dos índices das dimensões Renda, Educação e Longevidade, com pesos iguais. Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Valores em reais de 01/agosto de Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa UNIDADE DE MEDIDA Anos Índice Índice Índice Índice Percentual T_FUND11A13 Razão entre a população de 11 a 13 anos de idade que frequenta os quatro anos finais do fundamental (do 6º ao 9º ano desse nível de ensino) ou que já concluiu o fundamental e a população total nesta faixa etária multiplicado por 100. Variável Quantitativa Percentual

95 4 T_FUND15A17 Razão entre a população de 15 a 17 anos de idade que concluiu o ensino fundamental, em quaisquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo) e o total de pessoas nesta faixa etária multiplicado por 100. Variável Quantitativa Percentual T_FUND18M Razão entre a população de 18 anos ou mais de idade que concluiu o ensino fundamental, em quaisquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo) e o total de pessoas nesta faixa etária multiplicado por 100. Variável Quantitativa Percentual I_FREQ_PROP T_MED18A20 T_FREQ5A6 Subíndice selecionado para compor o IDHMEducação, representando a frequência de crianças e jovens à escola em séries adequadas à sua idade. É obtido através da média aritmética simples de 4 indicadores: % de crianças de 5 a 6 anos na escola, % de crianças de 11 a 13 anos no 2º ciclo do fundamental, % de jovens de 15 a 17 anos com o fundamental completo e % de jovens de 18 a 20 anos com o médio completo. Razão entre a população de 18 a 20 anos de idade que já concluiu o ensino médio em quaisquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo) e o total de pessoas nesta faixa etária multiplicado por 100. As pessoas de 18 a 20 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. Razão entre a população de 5 a 6 anos de idade que estava frequentando a escola, em qualquer nível ou série e a população total nesta faixa etária multiplicado por 100. Variável Quantitativa Variável Quantitativa Variável Quantitativa Índice Percentual Percentual UF Código utilizado pelo IBGE para identificação do Estado. Variável Categórica n/a Fonte: Atlas Brasil, ANÁLISE DAS VARIÁVEIS 3.1 VARIÁVEIS CATEGÓRICAS Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo pie chart e barras Variável: Estado Fazem parte desta pesquisa os 27 estados brasileiros e suas cidades. O gráfico abaixo exibe o número de cidades por estado.

96 5 Cidades por Estado Count PA RN CE PE MA PB PI GO SC PR BA RS SP MG MT UFN TO AL RJ ES MS SE AM RO AC AP RR DF A variação no número de cidades por estado é acentuada. Considerando que o Distrito Federal é um estado brasileiro, é o estado com o menor número de cidades (1), enquanto o Mato Grosso possui mais de 852 cidades Variável: REGIÃO Gráfico 3. Número de Cidades por Estado e Região do Brasil 35 CIDADES POR REGIÃO Percent NE SE S Região CO N Percent within all data. Podemos verificar no gráfico acima que a Região Nordeste é a que possui o maior número de cidades do Brasil (1790) e seguido pela Região Sudeste (1669). A Região que possui o menor número de cidades é a Norte, com 447 cidades, muito próxima da Região Centro-Oeste (468). A Região Sul possui 1191 cidades. A ilustração a seguir monstra a divisão do Brasil por região e por estado

97 Variável: Município A amostra totaliza 5565 municípios, que pode ser verificada na distribuição no território nacional de acordo com a região no gráfico 1. Gráfico 1 - Distribuição dos municípios nas Regiões Brasileiras. Gráfico de Setores de Região NE 1794; 32,2% N 449; 8,1% CO 466; 8,4% Categoria N CO S SE NE S 1188; 21,3% SE 1668; 30,0% Fonte: elaborado pelo autor, 2014 (Atlas Brasil, 2014) De acordo com gráfico 1 pode-se observar que as maiores concentrações de municípios brasileiros estão nas regiões do Nordeste com 32,20% e Sudeste com 30% somando juntas mais de 50% dos municípios pesquisados (62,20%). O Gráfico 2 demonstra a distribuição dos municípios pelas Unidades Federativas do Brasil.

98 7 Gráfico 2 Representação dos municípios nas Unidades da Federação SP 11,6% RS 8,9% Gráfico de Setores de UFN MG 15,3% BA 7,5% AM SE ES MS RJ Other 1,1% 1,3% 1,4% 1,4% 1,7% AL 1,9% 1,8% TO 2,5% MT 2,5% PA 2,6% RN 3,0% CE 3,3% PR 7,2% SC 5,3% GO 4,4% PE 3,3% MA 3,9% PB 4,0% PI 4,0% Categoria AM SE ES MS RJ AL TO MT PA RN CE PE MA PB PI GO SC PR BA RS SP MG Outros Fonte: elaborado pelo autor, 2014 (Atlas Brasil, 2014) Conforme pode ser observado no Gráfico 2, as Unidades da Federação mais representativas são Minas Gerais (15,3%), São Paulo (11,6%) e Rio Grande do Sul (8,9%). As menos expressivas são de Amazonas, Sergipe, Espírito Santos, entre outros. O Mapa 1 (Atlas Brasil, 2014) apresenta o IDHM (Índice de Desenvolvimento Humano Municipal) dos municípios brasileiros em 1991, 2000 e Com base nesta representação pode se observar que, com relação IDHM, existe uma concentração de índices mais altos nos municípios da região centro-sul do Brasil. Contudo, também pode ser percebido que a região Norte e Nordeste que concentrava os municípios que apresentavam índices muito baixo de desenvolvimento humano, conseguiram reverter para índices baixos e médios de desenvolvimento. Mapa 1 - IDHM evolução 1991, 2000 e 2010

99 8 Fonte: Atlas Brasil, Para entender esta evolução do IDHM dos municípios brasileiros são apresentadas informações na tabela 2, ilustrada pelo gráfico 1. A classificação IDHM proposta pelo Atlas Brasil tem sua variação entre Muito Baixo Desenvolvimento Humano (IDHM inferior a 0,500) a Muito Alto Desenvolvimento Humano (IDHM igual ou superior a 0,800). Conforme estas informações pode-se perceber a evolução dos municípios entre o período de 1991 e Em 1991, mais de 85% dos municípios encontravam-se na faixa de Muito Baixo Desenvolvimento Humano. Já nos anos 2000, pouco mais que 70% deles encontravam-se nas faixas de Baixo e Muito Baixo Desenvolvimento Humano.

100 9 Na última análise referente a 2010, apenas um quarto (25%) dos municípios brasileiros encontravam-se nessas faixas e mais de 70% deles já figuravam nas faixas de Médio e Alto Desenvolvimento Humano. Segundo as informações constantes no Atlas Brasil 2013 isso ilustra os avanços do desenvolvimento humano no país nas últimas duas décadas. 3.2 VARIÁVEIS QUANTITATIVAS A análise deste tipo de variável permite a utilização de uma maior gama de ferramentas de análise como histogramas, curvas de densidade, gráfico de ramos, box-plot e dot-plot, além de informações numéricas como média, desvio-padrão, mediana, quartis, 5 números, intervalo de confiança e teste de normalidade de Anderson-Darling. Também podemos fazer classificações supervisionadas das variáveis quantitativas, através da análise discriminante ANÁLISE DISCRIMINANTE LINEAR POR REGIÃO A análise discriminante é uma técnica da estatística multivariada utilizada para discriminar e classificar objetos, e estuda a separação de objetos de uma população em duas ou mais classes. Neste caso queremos discriminar os valores das variáveis IDHMn 1, IDHM_Rn e ESPVIDAn dos municípios 2 do Brasil, e utilizaremos inicialmente a variável categórica Região. Para geração de análise discriminante utilizaremos o comando do Minitab: STAT >> MULTIVARIATE >> DISCRIMINANT ANALISYS Discriminant Analysis: Região versus ESPVIDAn; IDHMn; IDHM_Rn Linear Method for Response: Região Predictors: ESPVIDAn; IDHMn; IDHM_Rn Group CO N NE S SE Count Summary of classification True Group Put into Group CO N NE S SE CO N NE S SE Total N N correct Proportion 0,320 0,483 0,700 0,550 0,415 N = 5564 N Correct = 2967 Proportion Correct = 0,533 1 A letra n no final das variáveis representa que as mesmas foram normalizadas. 2 Para está análise excluiu-se o DF Distrito Federal.

101 10 Squared Distance Between Groups CO N NE S SE CO 0,0000 3,6130 7,9941 0,3673 0,3226 N 3,6130 0,0000 1,3618 6,2756 4,1179 NE 7,9941 1,3618 0, ,6629 8,2410 S 0,3673 6, ,6629 0,0000 0,6902 SE 0,3226 4,1179 8,2410 0,6902 0,0000 Linear Discriminant Function for Groups CO N NE S SE Constant -19,774-9,782-6,975-23,662-20,753 ESPVIDAn 25,071 19,245 9,337 26,926 26,327 IDHMn 13,714 13,055 27,423 12,880 23,887 IDHM_Rn 24,528 11,655-0,554 29,640 13,734 Figura 2. Resultado do comando STAT >> MULTIVARIATE >> DISCRIMINANT ANALISYS Com base nas informações apresentadas na figura 2 pode ser notado que a região que acertou mais é Nordeste (0,700) e a que errou mais foi a região Centro Oeste (0,320). As informações ainda exibem o cruzamento de dados entre as regiões, por exemplo, a região Nordeste possui 1794 municípios e apenas 1255 correspondem a região. O nome desta matriz é confusion matrix ou matriz de confusão. Podemos concluir que o agrupamento por região não é uma boa escolha segundo esta avaliação ANÁLISE DISCRIMINANTE LINEAR POR 2 BRASIS Esta segunda análise está interessada em verificar os possíveis agrupamentos dos dados utilizando a variável 2 Brasis, calculada a partir do exercício anterior, e demonstra os agrupamentos do Brasil segundo sua proximidade de dados de educação. Para esta análise foram agrupadas as regiões de Sul, Sudeste e Centro-Oeste como COSSE, e as regiões de Norte e Nordeste como NNE. Discriminant Analysis: Reclassificação versus ESPVIDAn; IDHMn; IDHM_Rn Linear Method for Response: Reclassificação das Regiões Predictors: ESPVIDAn; IDHMn; IDHM_Rn Group COSSE NNE Count Summary of classification True Group Put into Group COSSE NNE COSSE NNE Total N N correct

102 11 Proportion 0,911 0,892 N = 5564 N Correct = 5027 Proportion Correct = 0,903 Squared Distance Between Groups COSSE NNE COSSE 0, ,41307 NNE 7, ,00000 Linear Discriminant Function for Groups COSSE NNE Constant -20,237-7,107 ESPVIDAn 23,084 9,743 IDHMn 25,254 27,548 IDHM_Rn 13,132-1,640 Existem duas possibilidades de realizar a análise discriminante que são a linear e a quadrática. Dependendo da variável deve-se dar mais peso e mais atenção a um método em detrimento do outro. Neste caso a linear já nos apresenta informações satisfatórias. Podemos observar que alguns estados e municípios da região COSSE tem características das região NNE, visto pelo número 537 municípios foram encontrados na intersecção entre COSSE e NNE ANÁLISE DISCRIMINANTE QUADRÁTICA POR 3 BRASIS Uma boa classificação deve resultar em pequenos erros, isto é, deve haver pouca probabilidade de classificação inadequada, e para que isso ocorra a regra de classificação deve considerar as probabilidades a priori e os custos de classificação errada. Outro fator que uma regra de classificação deve considerar é se as variâncias das populações são iguais ou não. Quando a regra de classificação assume que as variâncias das populações são iguais, as funções discriminantes são ditas lineares e quando não são funções discriminantes quadráticas. Vamos agora verificar a função quadrática para os 2 Brasis apresentado na análise anterior. Discriminant Analysis: Reclassificação versus ESPVIDAn; IDHMn; IDHM_Rn Quadratic Method for Response: Reclassificação das Regiões Predictors: ESPVIDAn; IDHMn; IDHM_Rn Group COSSE NNE Count Summary of classification True Group Put into Group COSSE NNE COSSE NNE

103 12 Total N N correct Proportion 0,911 0,893 N = 5564 N Correct = 5027 Proportion Correct = 0,903 From Generalized Squared Distance to Group Group COSSE NNE COSSE -15,43-7,65 NNE -7,44-14,73 No modelo quadrático a proporção não foi alterada permanecendo em Seguindo o princípio da simplicidade, vamos escolher o método linear, pois este é o mais simples. Em Ciência, a parcimônia é a preferência pela explicação mais simples para uma observação. Esta geralmente é considerada a melhor maneira de julgar as hipóteses. Parcimônia também é um conceito utilizado na sistemática moderna que estabelece que ao construir e selecionar árvores filogenéticas, ou seja, os dados, o melhor critério é baseado em seus princípios: normalmente é correto o relacionamento mais simples encontrado entre dois indivíduos, aquele que apresente o menor número de passos intermediários ou mudanças evolucionárias. Portanto, não há diferença entre o método linear e o quadrático, o que não justifica a utilização do método quadrático ANÁLISE DISCRIMINANTE LINEAR PARA DADOS AGRUPADOS Na figura 2 acima podem-se verificar quatro grandes grupos de variáveis, agrupadas pela similaridade dos dados. Os estados que possuem maior similaridade são Pernambuco e Sergipe no grupo vermelho e Espírito Santo e Goiás no grupo azul. O nível de similaridade dos dados destes estados está acima de 95 %, conforme indicado na escala apresentada no eixo Y do gráfico.

104 13 Dendograma média de estado ESPVIDAn x IDHMn x IDHM_Rn 0,00 Similarity 33,33 66,67 100,00 PA AC MA PI AL RN CE PB SE PE BA AM RJ PR MT MS GO ES RR RO TO AP Observations SP SC RS MG Gráfico2. Dendograma da variáveis ESPVIDA x IDHM x IDHM_R por estados do Brasil (classificação não supervisionada)

105 14 No mapa acima pode ser percebido a divisão por cores dos Estados de acordo com seu agrupamento por similaridade. Nesta representação vale destacar há certa coerência com as particularidades de cada estado, com o exemplo do agrupamento dos estados na cor verde se justifica por aparentemente apresentarem baixa capacidade de infraestrutura entre outras particularidades. Neste exemplo abaixo vamos através do dendograma pesquisar o grau de similaridade das médias das variáveis IDHMn, IDHM_Rn e ESPVIDAn nos agrupamentos. Com base na análise discriminante poderemos verificar a proporção correta dos agrupamentos. Discriminant Analysis: Agrupamentos versus Media ESPVID; Media IDHM_R;... Linear Method for Response: Agrupamentos do Estado Predictors: Media ESPVIDA EST; Media IDHM_Rest; Media IDHM est Group G1 G2 G3 G4 Count Summary of classification True Group Put into Group G1 G2 G3 G4 G G G G Total N N correct Proportion 1,000 1,000 1,000 1,000 N = 26 N Correct = 26 Proportion Correct = 1,000 Squared Distance Between Groups G1 G2 G3 G4 G1 0,000 23,795 99, ,650 G2 23,795 0,000 26,239 70,698 G3 99,405 26,239 0,000 10,919 G4 175,650 70,698 10,919 0,000 Linear Discriminant Function for Groups G1 G2 G3 G4 Constant -104,80-186,10-296,92-382,84 Media ESPVIDA EST 268,04 372,72 467,54 528,56 Media IDHM_Rest 5,81 18,52 50,02 55,92 Media IDHM est 274,51 339,90 408,31 467,03

106 15 Neste caso a proporção correta é de 100%, ou seja, os agrupamentos gerados anteriormente pelo agrupamento em 4 Brasis gerou a mesma proporção do método linear utilizado na análise discriminante. 4. REGRESSÃO LOGÍSTICA ORDINAL PARA AS VARIÁVEIS: IDHMn, IDHM_Rn E ESPVIDAn. Inicialmente foram classificadas pela análise ANOVA as regiões para as variáveis: IDHMn, IDHM_Rn e ESPVIDAn. One-way ANOVA: IDHMn versus Região Source DF SS MS F P Região 4 82, , ,58 0,000 Error ,7714 0,0115 Total ,1652 S = 0,1071 R-Sq = 56,37% R-Sq(adj) = 56,34% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 465 0,6108 0,0829 (*-) N 449 0,4278 0,1355 (*-) NE ,3889 0,0975 (* S ,6669 0,0937 *) SE ,6328 0,1223 (*) ,400 0,480 0,560 0,640 Pooled StDev = 0,1071 One-way ANOVA: IDHM_Rn versus Região Source DF SS MS F P Região 4 90, , ,97 0,000 Error ,9768 0,0106 Total ,9605 S = 0,1030 R-Sq = 60,67% R-Sq(adj) = 60,64% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 465 0,5786 0,0857 (*) N 449 0,3927 0,1261 (*) NE ,3305 0,0939 *) S ,6384 0,0900 (*) SE ,5726 0,1175 (* ,400 0,480 0,560 0,640 Pooled StDev = 0,1030

107 16 One-way ANOVA: ESPVIDAn versus Região Source DF SS MS F P Região 4 140, , ,16 0,000 Error ,1530 0,0151 Total ,5843 S = 0,1230 R-Sq = 62,53% R-Sq(adj) = 62,50% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 465 0,6772 0,0825 (*) N 449 0,4886 0,1292 (*) NE ,3714 0,1356 *) S ,7358 0,1177 (* SE ,7036 0,1202 *) ,40 0,50 0,60 0,70 Pooled StDev = 0,1230 Após esta análise chegou-se a classificação das regiões de acordo com as médias: NE (1); N (2); CO (3); SE (4). Neste momento é realizado a Regressão Logística Ordinal. Ordinal Logistic Regression: REGIÕES CODIFICA versus IDHM_Rn; IDHMn;... Link Function: Logit Response Information Variable Value Count REGIÕES CODIFICADAS Total 5564 Logistic Regression Table 95% CI Predictor Coef SE Coef Z P Odds Ratio Lower Upper Const(1) 5, , ,98 0,000 Const(2) 6, , ,85 0,000 Const(3) 6, , ,73 0,000 Const(4) 9, , ,89 0,000 IDHM_Rn -10,9720 0, ,25 0,000 0,00 0,00 0,00 IDHMn 5, , ,00 0, ,09 106, ,96 ESPVIDAn -7, , ,22 0,000 0,00 0,00 0,00 Log-Likelihood = -5768,113 Test that all slopes are zero: G = 4781,031, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 18090, ,000

108 17 Deviance 11536, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,0 Somers' D 0,70 Discordant ,8 Goodman-Kruskal Gamma 0,70 Ties ,1 Kendall's Tau-a 0,52 Total ,0 Destaca-se que esta análise é confiável, pois o valor de P foi de 0. O modelo apresentou nível de concordância de 85% (acerto). Foi aplicada também a análise de Regressão Logística Ordinal para os dados agrupados em região, no entanto, este não se mostrou confiável por causa do número de dados analisados serem muito baixos. Ordinal Logistic Regression: grupos versus Media ESPVID; Media IDHM_R;... * WARNING * Algorithm has not converged after 20 iterations. * WARNING * Convergence has not been reached for the parameter estimates criterion. * WARNING * The results may not be reliable. * WARNING * Try increasing the maximum number of iterations. Link Function: Logit Response Information Variable Value Count grupos Total 26 Logistic Regression Table Odds 95% CI Predictor Coef SE Coef Z P Ratio Lower Upper Const(1) 234, ,1 0,01 0,992 Const(2) 287, ,5 0,01 0,989 Const(3) 351, ,3 0,01 0,990 Media ESPVIDA EST -276, ,7-0,00 0,996 0,00 0,00 * Media IDHM_Rest -110, ,1-0,00 0,999 0,00 0,00 * Media IDHM est -127, ,0-0,00 0,998 0,00 0,00 * Log-Likelihood = -0,000 Test that all slopes are zero: G = 64,858, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 0, ,000 Deviance 0, ,000

109 18 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,0 Somers' D 1,00 Discordant 0 0,0 Goodman-Kruskal Gamma 1,00 Ties 0 0,0 Kendall's Tau-a 0,70 Total ,0 5. ÁRVORE DE DECISÃO PARA AS VARIÁVEIS: IDHMn, IDHM_Rn E ESPVIDAn. Nesta utilizou-se o programa SPSS para as análises Classification Tree Warnings Gain summary Tables are not displayed because profits are undefined. Target category gains tables are not displayed because target categories are undefined. Model Summary Specifications Growing Method CHAID Dependent Variable Independent Variables Validation Região ESPVIDAn, IDHMn, IDHM_Rn None Maximum Tree Depth 3 Results Minimum Cases in Parent Node Minimum Cases in Child Node Independent Variables Included ESPVIDAn, IDHM_Rn, IDHMn Number of Nodes 57 Number of Terminal Nodes 44 Depth 3

110 19

111 20 Risk Estimate Std. Error,412,007 Growing Method: CHAID Dependent Variable: Região Classification Observed Predicted CO N NE S SE Percent Correct CO ,6% N ,0% NE ,4% S ,7% SE ,0% Overall Percentage,9%,0% 37,3% 14,7% 47,1% 58,8% Growing Method: CHAID Dependent Variable: Região 5. CONSIDERAÇÕES FINAIS A tarefa da análise discriminante é encontrar a melhor função discriminante linear ou quadrática de um conjunto de variáveis que reproduza, tanto quanto possível, um agrupamento a priori de casos considerados. Um procedimento em passos é utilizado nesse programa, e em cada passo a variável mais poderosa é introduzida na função discriminante. A função critério para selecionar a próxima variável depende do número de grupos especificados (o número de grupos varia de 2 a 20). Quando o número de variáveis é maior do que dois, então o critério de seleção de variáveis é o traço do produto da matriz de covariância para as variáveis envolvidas e a matriz de covariância interclasse em um passo particular. Os cálculos podem ser realizados em toda a população ou em amostra de dados ou mesmo em dados previamente agrupados. Em nossas análises com as variáveis IDHMn, IDHM_Rn e ESPVIDAn, utilizamos a análise discriminante linear e conseguimos um resultado de 0,903 de proporção correta. Isto demonstra coerência na divisão em dois grupos. Além disso, é relevante ressaltar a similaridade destes grupos (municípios) com base nestas variáveis, levando em conta inclusive sua situação geográfica. Na outra análise realizada com base no agrupamento apresentado no dendograma, onde pode ser percebido 4 Brasis, a proporcionalidade ficou em 100%.

112 PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO TRABALHO Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Maria Carolina Mirabella Belloque 1º Semestre 2014

113 2 1. INTRODUÇÃO Na segunda parte do presente trabalho tem como seguimos analisando os dados da dimensão do Trabalho do Atlas Brasil Os temas e as variáveis dessa dimensão são: Temas: Ocupação/Desocupação Características dos ocupados: Posição na ocupação Escolaridade Setor Rendimento Indicadores: Selecionar todos % de empregados com carteira - 18 anos ou mais % de empregados sem carteira - 18 anos ou mais % de trabalhadores do setor público - 18 anos ou mais % de trabalhadores por conta própria - 18 anos ou mais % de empregadores - 18 anos ou mais Grau de formalização dos ocupados - 18 anos ou mais % dos ocupados no setor agropecuário - 18 anos ou mais % dos ocupados no setor extrativo mineral - 18 anos ou mais % dos ocupados na indústria de transformação - 18 anos ou mais % dos ocupados no SIUP - 18 anos ou mais % dos ocupados no setor de construção - 18 anos ou mais % dos ocupados no setor comércio - 18 anos ou mais % dos ocupados no setor serviços - 18 anos ou mais Rendimento médio dos ocupados - 18 anos ou mais % dos ocupados sem rendimento - 18 anos ou mais % dos ocupados com rendimento de até 1 s.m anos ou mais % dos ocupados com rendimento de até 2 s.m anos ou mais % dos ocupados com rendimento de até 3 s.m anos ou mais % dos ocupados com rendimento de até 5 s.m anos ou mais Índice de Theil-L dos rendimentos do trabalho - 18 anos ou mais Dentre essa vasta lista de opções de variáveis as selecionadas para este trabalho seguem as mesmas da primeira parte do trabalho, elas são apresentadas no quadro 1, a seguir:

114 SIGLA NOME CURTO NOME LONGO UFN Nome da Unidade da Nome da Unidade da Federação Federação CPR % de trabalhadores por conta própria - 18 anos ou mais Percentual de ocupados de 18 anos ou mais que são trabalhadores por conta própria. EMP % de empregadores - 18 anos ou mais Percentual de ocupados de 18 anos ou mais que são empregadores P_FORMAL P_FUND P_MED P_SUPER RENOCUP T_ATIV Grau de formalização dos ocupados - 18 anos ou mais % dos ocupados com fundamental completo - 18 anos ou mais % dos ocupados com médio completo - 18 anos ou mais % dos ocupados com superior completo - 18 anos ou mais Rendimento médio dos ocupados - 18 anos ou mais Taxa de atividade - 10 anos ou mais Grau de formalização do trabalho das pessoas ocupadas Percentual dos ocupados com fundamental completo Percentual dos ocupados com médio completo Percentual dos ocupados com superior completo Rendimento médio dos ocupados Taxa de atividade das pessoas de 10 anos ou mais de idade Quadro 1: Variáveis selecionadas do Atlas Brasil A seguir iniciamos a segunda etapa da análise dessas variáveis utilizando as ferramentas de análise de componente principais, análise de conglomerados, análise discriminante, regressão logística, análise de correspondências e a árvore de classificação. Essa última feita com o software SPSS, rodado pelo colega de curso Luciano Ferreira. 2. COMPONENTES PRINCIPAIS Principal Component Analysis: P_FORMALn; P_FUNDn; P_MEDn; P_SUPERn; RENOCUPn; T Eigenanalysis of the Correlation Matrix Eigenvalue 4,3569 0,8807 0,3451 0,2395 0,1474 0,0303 Proportion 0,726 0,147 0,058 0,040 0,025 0,005 Cumulative 0,726 0,873 0,930 0,970 0,995 1,000 Variable PC1 PC2 PC3 PC4 PC5 PC6 P_FORMALn 0,418 0,176-0,646-0,365-0,491 0,051 P_FUNDn 0,450-0,221-0,188 0,424 0,163-0,712 P_MEDn 0,438-0,325-0,054 0,475 0,047 0,687 P_SUPERn 0,405-0,300 0,673-0,302-0,436-0,108 RENOCUPn 0,440 0,143 0,060-0,498 0,726 0,087 T_ATIVn 0,270 0,839 0,295 0,349-0,115 0,014

115 5 Score Plot of P_FORMALn;...; T_ATIVn 4 3 Second Component ,0-2,5 0,0 2,5 5,0 First Component 7,5 10,0 12,5 5 Scree Plot of P_FORMALn;...; T_ATIVn 4 Eigenvalue Component Number 5 6

116 1,0 0,8 Loading Plot of P_FORMALn;...; T_ATIVn T_ATIVn Second Component 0,6 0,4 0,2 0,0 P_FORMALn RENOCUPn -0,2 P_FUNDn P_SUPERn P_MEDn -0,4 0,0 0,1 0,2 0,3 First Component 0,4 0,5 Pode-se verificar que na população, a participação das variáveis no indicador é relativamente equilibrada. O Eigenvalue de 4,3569 mostra que o indicador apresenta um grau significativo de confiabilidade. A Proportion de 0,726 mostra que o primeiro componente representa 73% do indicador deixando assim os outros componentes quase que desnecessários. Neste primeiro componente a variável que tem mais representatividade é a P_FORMALn (Grau de formalização das pessoas ocupadas) com 0,418, porém, como já foi dito anteriormente elas estão com valores bem equilibrados, com exceção da T_ATIVn (Taxa de atividade das pessoas de 10 anos ou mais de idade).

117 3. ANALISE DE CONGLOMERADOS Cluster Analysis of Observations: média; desvio Euclidean Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,9788 0, ,6019 0, ,0873 0, ,8630 0, ,8415 0, ,4900 0, ,8009 0, ,5987 0, ,4520 0, ,8419 0, ,7658 0, ,7177 0, ,5893 0, ,1860 0, ,1649 0, ,8581 0, ,5626 0, ,2453 0, ,7212 0, ,6628 0, ,9562 0, ,4493 0, ,7359 0, ,9806 0, ,5891 0, Final Partition 28 Number of clusters: Maximum 32 Within Average distance 33 Number of cluster sum distance from from 34 observations of squares centroid centroid 35 Cluster1 16 0, , , Cluster2 5 0, , , Cluster3 4 0, , , Cluster4 1 0, , , Cluster Centroids Grand 44 Variable Cluster1 Cluster2 Cluster3 Cluster4 centroid 45 média 0, , , , , desvio 0, , , , , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4

118 52 Cluster1 0, , , , Cluster2 0, , , , Cluster3 0, , , , Cluster4 0, , , , Dendrogram Single Linkage; Euclidean Distance 85,59 Similarity 90,39 95,20 100,00 RO TO AP RN AC MA PA PB CE RR BA AM PI AL SE PE ES Observations MT MG SP SC RJ PR MS RS GO Para realizar essa análise, inicialmente foram extraídos a média e o desvio padrão de cada estado e o dendrograma foi feito a partir do agrupamento de estados. Verifica-se que SP é um outlier e que as regiões Norte e Nordeste formam um grande agrupamento. 4. ANÁLISE DISCRIMINANTE Discriminant Analysis: cluster versus médiat_ativn; médiap_formaln Linear Method for Response: cluster Predictors: médiat_ativn; médiap_formaln Group Count Summary of classification True Group Put into Group

119 Total N N correct Proportion 1,000 0,400 1,000 0,333 N = 26 N Correct = 21 Proportion Correct = 0,808 Squared Distance Between Groups ,0000 8, ,3291 8, ,8784 0,0000 3,8480 0, ,3291 3,8480 0,0000 2, ,3206 0,3020 2,9379 0,0000 Linear Discriminant Function for Groups Constant -7,82-23,31-35,82-23,23 médiat_ativn -0,01-0,01-0,02-0,01 médiap_formaln 55,42 92,59 118,43 94,32 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 7** ,259 0, ,459 0, ,640 0, ,039 0,511 8** , , , , , , , ,495 12** ,6276 0, ,9637 0, ,7287 0, ,7697 0,459 25** ,186 0, ,755 0, ,105 0, ,068 0,098 26** ,552 0, ,894 0, ,785 0, ,026 0,266 a. REGRESSÃO LOGISITICA Regression Analysis: cluster versus médiat_ativn; médiap_formaln The regression equation is cluster = - 0,352-0,00086 médiat_ativn + 5,52 médiap_formaln Predictor Coef SE Coef T P

120 Constant -0,3523 0,4323-0,81 0,423 médiat_ativn -0, , ,54 0,594 médiap_formaln 5,522 1,132 4,88 0,000 S = 0, R-Sq = 56,3% R-Sq(adj) = 52,5% Analysis of Variance Source DF SS MS F P Regression 2 16,5345 8, ,80 0,000 Residual Error 23 12,8501 0,5587 Total 25 29,3846 Source DF Seq SS médiat_ativn 1 3,2476 médiap_formaln 1 13,2869 Unusual Observations Obs médiat_ativn cluster Fit SE Fit Residual St Resid ,000 2,108 0,476-0,108-0,19 X ,000 1,987 0,196 2,013 2,79R ,000 1,706 0,161 2,294 3,14R R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage. b. ANALISE DE CORRESPONDENCIAS Simple Correspondence Analysis: médiap_forma; médiat_ativn; médiarenocup; desvi Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0154 0,9825 0,9825 ****************************** 2 0,0003 0,0175 1,0000 Total 0,0156 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 Row1 1,000 0,003 0,154-0,884 1,000 0,157 0,010 0,000 0,001 2 Row2 1,000 0,013 0,027-0,174 0,928 0,025-0,048 0,072 0,110 3 Row3 1,000 0,008 0,012-0,140 0,833 0,010-0,063 0,167 0,111 4 Row4 1,000 0,003 0,255-1,239 0,999 0,259 0,029 0,001 0,008 5 Row5 1,000 0,066 0,013 0,056 0,980 0,013-0,008 0,020 0,015 6 Row6 1,000 0,025 0,000-0,004 0,089 0,000-0,012 0,911 0,013 7 Row7 1,000 0,017 0,033-0,176 0,999 0,033 0,006 0,001 0,002 8 Row8 1,000 0,049 0,000 0,008 0,586 0,000 0,007 0,414 0,009 9 Row9 1,000 0,026 0,001 0,014 0,622 0,000-0,011 0,378 0, Row10 1,000 0,156 0,045 0,067 0,999 0,046-0,002 0,001 0, Row11 1,000 0,015 0,053-0,229 0,950 0,052 0,053 0,050 0, Row12 1,000 0,026 0,011-0,079 0,977 0,011 0,012 0,023 0, Row13 1,000 0,020 0,002-0,030 0,594 0,001-0,024 0,406 0, Row14 1,000 0,032 0,001 0,019 0,855 0,001-0,008 0,145 0, Row15 1,000 0,026 0,002-0,025 0,440 0,001-0,028 0,560 0,076

121 16 Row16 1,000 0,029 0,001 0,024 0,965 0,001-0,005 0,035 0, Row17 1,000 0,084 0,006 0,034 0,953 0,006 0,008 0,047 0, Row18 1,000 0,018 0,053-0,210 0,939 0,051 0,053 0,061 0, Row19 1,000 0,022 0,003-0,044 0,988 0,003-0,005 0,012 0, Row20 1,000 0,010 0,050-0,278 0,996 0,051 0,017 0,004 0, Row21 1,000 0,002 0,192-1,186 0,993 0,194-0,102 0,007 0, Row22 1,000 0,120 0,022 0,054 0,999 0,023-0,001 0,001 0, Row23 1,000 0,070 0,001 0,014 0,796 0,001 0,007 0,204 0, Row24 1,000 0,012 0,034-0,211 0,961 0,034-0,043 0,039 0, Row25 1,000 0,129 0,021 0,050 0,971 0,021 0,009 0,029 0, Row26 1,000 0,020 0,007-0,071 0,999 0,007 0,002 0,001 0,000 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 Column1 1,000 0,004 0,415-1,273 0,997 0,421 0,072 0,003 0,075 2 Column2 1,000 0,991 0,009 0,012 1,000 0,009-0,000 0,000 0,000 3 Column3 1,000 0,004 0,415-1,273 0,997 0,421 0,072 0,003 0,075 4 Column4 1,000 0,001 0,161-1,317 0,908 0,149-0,420 0,092 0,850 Component 2 5,0 2,5 0,0-2,5-5,0 Asymmetric Column Plot ,5-10,0-10,0-7,5-5,0-2,5 0,0 Component 1 2,5 5,0 No gráfico os estados são apresentados com seus respectivos números da lista e não a suas siglas. E os indicadores se encontram bem centralizados com relação ao posicionamento dos estados.

122 c. ARVORES DE CLASSIFICAÇÃO Nessa sessão, foram selecionadas quatro variáveis com maior valor de f, através da função one way anova. Montou-se uma tabela e com o auxílio do colega Luciano Ferreira, processamos a árvore de classificação no SPSS. Classification Tree [DataSet0] C:\Users\Usuario\Documents\2014\Hoyos\arvore SPSS Carol.sav Warnings Gain summary Tables are not displayed because profits are undefined. Target category gains tables are not displayed because target categories are undefined. Model Summary Specifications Growing Method CHAID Dependent Variable Independent Variables Validation Regiões P_FORMALn, RENOCUPn, T_ATIVn None Maximum Tree Depth 3 Results Minimum Cases in Parent Node Minimum Cases in Child Node Independent Variables Included T_ATIVn, RENOCUPn, P_FORMALn Number of Nodes 11 Number of Terminal Nodes 7 Depth 3

123 Risk Estimate Std. Error,629,006 Growing Method: CHAID Dependent Variable: Regiões Classification Observed Predicted CO N NE S SE Percent Correct CO ,0% N ,0% NE ,0% S ,6% SE ,1% Overall Percentage,0%,0% 40,5% 10,0% 49,5% 37,1% Growing Method: CHAID Dependent Variable: Regiões

124 PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO LIBERDADE ECONÔMICA Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Renato Almeida Santos 1º Semestre 2014

125 2 1. INTRODUÇÃO O presente trabalho tem por objetivo efetuar uma análise comparativa de três dados dimensionadores do nível de Liberdade Econômica entre países. O principal propósito é comparar demonstrar a correlação de amostragem desses dados. Os dados são compilados pela Organização The Heritage Foundation. O software estatístico utilizado é o MINITAB versão ENTENDENDO OS DADOS 2.1 Os indivíduos Os indivíduos desta análise são países que constam na base de dados da Organização The Heritage Foundation quanto a seus indicadores. 2.2 As variáveis São três as variáveis selecionadas para esta pesquisa, além do nome dos países. As mesmas são melhores explicadas na Tabela 1. Variável Significado Tipo Unidade de Medida É o nome das regiões Variável N/A Regiões Categóri ca Liberdade 1: liberdade de corrupção Variável Quantitat iva Liberdade 2: liberdade de trabalho Liberdade 3: liberdade de investimento Com base em informação quantitativa que avalia a percepção da corrupção no ambiente das empresas e inclui os níveis de corrupção jurídicos, administrativos e judiciais É uma medida composta da capacidade de inter-relação entre os trabalhadores de e as empresas, sem restrições por parte do estado É a avaliação do livre fluxo de capitais, especialmente capital no estrangeiro Variável Quantitat iva Variável Quantitat iva Os dados são um ponto de estimativa que vai de 0 a 100 Os dados são um ponto de estimativa que vai de 0 a 100 Os dados são um ponto de estimativa que vai de 0 a 100

126 3 3. A Tabela de Dados Coun World Country Name tryid Rank 2014 Score Property Rights Freedom from Corruption Fiscal Freedom Gov't Spending Business Freedom Labor Monetary Freedom Freedom Trade Investmen Financial Freedom t Freedom Freedom 1 Afghanistan N/A N/A N/A 10,0 91,2 84,2 63,1 75,0 74,3 N/A 65 N/A 2 Albania 54 66, ,4 92,7 75,6 78,1 49,7 80,0 87, Algeria , ,7 80,5 51,0 66,3 48,3 67,8 60, Angola , ,7 87,7 55,3 47,5 40,1 63,6 70, Argentina , ,5 63,5 49,9 53,9 44,9 60,0 68, Armenia 41 68, ,7 86,5 81,3 83,1 78,5 77,0 85, Australia 3 82, ,7 64,2 62,6 94,6 79,2 80,5 86, Austria 24 72, ,5 51,0 23,5 76,3 80,5 79,5 87, Azerbaijan 81 61, ,7 88,1 64,8 73,5 77,9 78,8 77, Bahamas 36 69, ,6 97,3 84,1 70,7 81,5 75,1 52, Bahrain 13 75, ,4 99,9 71,4 76,3 82,0 78,4 78, Bangladesh , ,3 72,5 92,3 70,8 51,9 65,9 59, Barbados 45 68, ,9 74,0 49,8 72,8 78,4 74,6 60, Belarus , ,6 89,2 61,2 73,4 77,7 33,9 81, Belgium 35 69, ,2 44,8 14,8 89,9 72,7 79,5 87, Belize ,7 30 6,7 82,1 74,2 71,6 67,2 77,6 67, Benin , ,5 68,3 86,1 51,0 50,5 75,4 60, Bhutan , ,8 82,9 57,2 59,4 83,6 65,8 49, Bolivia , ,1 87,1 62,5 53,4 29,9 70,0 77, Bosnia and Herz , ,9 82,9 27,4 55,5 62,4 80,1 86, Botswana 27 72, ,2 81,0 69,8 68,5 69,7 72,4 82, Brazil , ,9 68,8 54,1 53,8 49,8 69,9 69, Bulgaria 61 65, ,2 91,2 64,5 73,5 80,2 79,6 87, Burkina Faso 98 58, ,3 83,0 82,3 60,7 55,0 78,8 67, Burma , ,6 86,9 89,2 28,3 75,7 64,8 73, Burundi , ,9 73,5 51,9 59,8 63,1 68,2 71, Cambodia , ,7 90,8 88,4 36,6 50,2 77,9 71, Cameroon , ,9 71,7 86,0 45,0 56,1 69,4 61, Canada 6 80, ,7 79,7 47,3 89,3 83,1 76,3 88, Cape Verde 60 66, ,9 77,4 68,6 63,8 48,0 79,1 69, Central African R , ,6 65,1 92,6 33,9 40,4 72,5 51, Chad , ,9 46,2 80,0 24,9 43,3 69,8 55, Chile 7 78, ,3 76,5 83,8 69,3 69,3 84,1 82, China , ,0 69,9 82,9 49,7 61,9 73,3 71, Colombia 34 70, ,2 80,6 74,9 85,2 80,5 78,8 78, Comoros , ,1 64,5 85,3 49,4 50,1 74,5 72, Congo, Democra , ,6 69,4 74,6 30,0 38,5 63,0 63, Congo, Republic , ,6 67,5 79,6 35,1 47,0 72,0 55, Costa Rica 53 66, ,9 80,0 90,0 64,9 53,3 76,3 83, Côte d'ivoire , ,1 79,1 79,8 55,1 59,0 80,6 71, Croatia 87 60, ,1 69,4 45,8 61,4 39,4 79,2 87, Cuba , ,2 60,0 0,0 20,0 20,0 65,8 60, Cyprus 46 67, ,0 79,7 36,2 79,7 70,2 78,8 82, Czech Republic 26 72, ,3 81,7 43,8 70,1 84,0 79,4 87, Denmark 10 76, ,7 39,3 0,5 98,1 91,2 80,0 87, Djibouti , ,9 80,6 62,8 42,7 65,1 77,2 54, Dominica 63 65, ,5 72,9 61,7 75,0 70,7 85,8 72, Dominican Repu 80 61, ,3 83,7 92,3 56,1 55,2 75,7 77, Ecuador , ,0 79,8 41,8 52,8 52,0 66,1 71, Egypt , ,6 85,6 69,6 62,7 45,7 60,5 71, El Salvador 59 66, ,3 79,6 85,8 59,6 63,3 80,0 79, Equatorial Guine , ,6 75,5 62,6 43,4 41,5 75,4 53, Eritrea , ,9 57,0 66,1 18,6 63,6 57,6 69,1 0 20

127 4 54 Estonia 11 75, ,2 80,4 56,0 77,6 55,9 76,9 87, Ethiopia , ,0 77,5 89,9 57,8 54,7 59,0 64, Fiji 99 58, ,0 82,3 76,2 64,9 73,1 75,2 70, Finland 19 73, ,4 65,1 8,9 93,6 46,5 78,9 87, France 70 63, ,9 48,4 5,6 79,9 51,8 76,1 82, Gabon , ,1 74,5 81,7 58,9 63,0 75,1 61, Gambia 92 59, ,7 79,0 79,8 57,4 65,8 71,3 65, Georgia 22 72, ,8 87,3 69,7 87,8 91,2 78,4 88, Germany 18 73, ,1 61,2 38,2 89,9 46,4 80,8 87, Ghana 66 64, ,4 85,4 83,3 62,6 60,2 65,8 64, Greece , ,2 65,9 19,2 75,8 53,9 76,3 82, Guatemala 83 61, ,7 79,6 93,6 58,4 49,3 76,7 85, Guinea , ,2 69,3 86,2 51,8 73,4 64,1 61, Guinea-Bissau , ,2 89,0 86,6 40,5 61,4 74,4 61, Guyana , ,4 68,4 71,8 64,3 72,6 78,1 72, Haiti , ,9 80,3 66,3 33,3 68,5 73,6 70, Honduras , ,7 84,9 79,8 55,4 26,5 75,1 75, Hong Kong SAR 1 90, ,3 93,0 89,7 98,9 95,5 82,0 90, Hungary 51 67, ,6 81,1 26,8 79,3 65,7 75,6 87, Iceland 23 72, ,2 72,9 32,9 91,2 59,1 76,0 87, India , ,5 79,4 77,8 37,7 74,0 65,5 65, Indonesia , ,0 83,4 89,8 54,8 47,8 76,4 74, Iran , ,4 80,6 85,9 62,3 41,7 47,3 41, Iraq N/A N/A N/A 13,7 95,5 40,3 56,9 73,4 70,0 N/A N/A N/A 78 Ireland 9 76, ,8 74,0 30,6 83,4 79,5 81,7 87, Israel 44 68, ,3 60,1 40,3 73,2 63,0 80,6 82, Italy 86 60, ,5 55,5 25,6 75,5 52,5 78,9 87, Jamaica 56 66, ,0 77,2 69,4 84,6 75,6 77,3 75, Japan 25 72, ,8 69,2 47,1 80,0 79,8 87,5 82, Jordan 39 69, ,6 94,0 66,9 62,0 72,9 81,3 79, Kazakhstan 67 63, ,7 92,9 85,0 74,4 86,7 74,4 78, Kenya , ,0 78,0 74,6 55,8 64,0 74,9 72, Kiribati , ,2 71,4 0,0 57,0 83,6 81,3 55, Korea, North 178 1,0 5 5,0 0,0 0,0 0,0 0,0 0,0 0, Korea, South 31 71, ,0 72,6 72,6 92,8 47,8 79,6 72, Kuwait 76 62, ,7 97,7 55,6 57,7 63,6 73,2 76, Kyrgyz Republic 85 61, ,2 94,6 60,2 74,2 83,8 73,7 75, Lao P.D.R , ,6 86,6 86,7 60,7 54,9 75,5 58, Latvia 42 68, ,6 84,6 54,9 82,5 68,5 79,7 87, Lebanon 96 59, ,5 90,9 73,7 55,6 58,7 74,5 75, Lesotho , ,1 67,4 0,0 54,0 62,4 75,5 68, Liberia , ,8 83,6 70,5 62,3 47,0 72,9 64, Libya N/A N/A 10 18,3 95,0 0,0 50,1 77,9 66,9 N/A Liechtenstein N/A N/A N/A N/A N/A N/A N/A N/A N/A 90, Lithuania 21 73, ,9 92,9 55,9 85,7 59,0 78,6 87, Luxembourg 16 74, ,1 62,8 47,6 72,6 43,1 78,9 87, Macau 29 71, ,7 71,4 91,7 60,0 55,0 79,8 90,

128 5 101 Macedonia 43 68, ,6 91,4 70,7 81,0 78,8 83,5 85, Madagascar 79 61, ,3 90,8 92,3 62,8 43,9 77,6 77, Malawi , ,9 78,0 63,0 38,9 60,3 64,1 72, Malaysia 37 69, ,3 84,6 75,6 85,6 78,5 81,0 76, Maldives , ,9 97,4 43,8 87,4 71,7 69,4 43, Mali , ,7 69,8 81,7 48,0 63,2 76,7 73, Malta 58 66, ,8 63,7 47,2 62,4 53,2 79,1 87, Mauritania , ,9 81,7 75,8 38,0 53,1 75,5 69, Mauritius 8 76, ,4 92,2 81,8 74,4 78,0 76,7 88, Mexico 55 66, ,7 80,9 78,9 76,8 58,3 77,4 85, Micronesia , ,0 97,5 0,0 51,7 77,9 75,2 81, Moldova , ,5 85,8 54,4 70,1 37,9 75,0 80, Mongolia 97 58, ,2 81,8 39,1 71,8 81,1 72,4 74, Montenegro 68 63, ,8 92,5 42,6 77,6 68,6 78,6 83, Morocco , ,3 71,3 64,1 76,2 31,5 78,1 58, Mozambique , ,2 75,7 64,6 65,2 36,7 80,8 75, Namibia 94 59, ,2 66,9 58,8 64,4 81,9 75,0 82, Nepal , ,3 85,9 89,6 58,5 43,8 76,3 61, Netherlands 15 74, ,0 51,7 25,6 89,7 59,6 79,9 87, New Zealand 5 81, ,0 71,2 32,3 96,1 90,2 86,3 86, Nicaragua , ,1 78,6 80,0 52,6 60,3 72,8 85, Niger , ,0 76,8 88,4 35,2 45,4 88,3 65, Nigeria , ,7 85,0 74,5 48,0 66,4 73,1 63, Norway 32 70, ,1 50,6 42,2 90,9 44,6 78,7 89, Oman 48 67, ,2 98,5 56,0 68,3 75,5 73,6 78, Pakistan , ,7 80,6 88,3 69,4 47,3 68,5 64, Panama 71 63, ,0 84,3 78,7 73,0 39,4 75,1 74, Papua New Guin , ,2 66,7 75,4 57,0 73,7 75,5 85, Paraguay 78 62, ,5 96,2 89,0 58,0 28,9 80,9 81, Peru 47 67, ,0 79,1 89,1 70,6 61,4 83,3 87, Philippines 89 60, ,1 79,2 92,3 59,9 49,7 78,0 75, Poland 50 67, ,8 76,1 43,2 70,1 60,4 77,8 87, Portugal 69 63, ,1 60,1 26,8 84,9 34,6 79,3 87, Qatar 30 71, ,4 99,9 72,1 71,7 70,0 81,2 79, Romania 62 65, ,7 87,0 59,2 71,0 65,2 77,1 87, Russia , ,1 85,6 61,5 70,0 55,8 69,4 74, Rwanda 65 64, ,9 80,3 78,2 69,6 84,1 74,8 77, Saint. Lucia 33 70, ,6 75,7 63,6 83,1 84,5 82,7 71, Saint. Vincent an 52 67, ,1 73,7 72,4 76,3 78,7 79,8 67, Samoa 84 61, ,0 79,9 42,2 73,7 80,3 76,1 75, São Tomé and P , ,5 86,9 27,9 52,6 44,7 68,3 75, Saudi Arabia 77 62, ,7 99,7 63,1 67,3 75,8 68,7 74, Senegal , ,5 65,1 75,4 47,5 41,5 81,8 73, Serbia 95 59, ,0 83,1 38,6 59,3 70,1 66,9 77, Seychelles , ,5 76,8 61,8 67,6 68,5 75,1 33, Sierra Leone , ,6 80,7 85,7 55,3 28,7 70,2 70, Singapore 2 89, ,9 91,2 91,2 96,8 96,5 81,5 90, Slovak Republic 57 66, ,8 80,2 56,0 67,0 53,6 78,1 87, Slovenia 74 62, ,0 58,9 22,6 85,4 51,0 80,3 87, Solomon Islands , ,0 61,4 21,3 65,2 65,2 75,4 73,

129 6 151 South Africa 75 62, ,6 68,7 69,1 74,5 54,4 75,3 76, Spain 49 67, ,6 54,0 38,7 77,3 52,2 79,9 87, Sri Lanka 90 60, ,4 84,9 86,3 74,4 59,2 68,0 73, Sudan N/A N/A N/A 9,8 85,1 90,3 54,5 49,1 55,8 55,6 15 N/A 155 Suriname , ,9 69,0 78,3 41,8 81,8 71,8 66, Swaziland 82 61, ,6 74,7 70,9 64,2 71,7 72,3 81, Sweden 20 73, ,3 42,9 21,4 91,1 52,9 82,5 87, Switzerland 4 81, ,1 68,9 65,7 75,4 87,4 85,2 90, Syria N/A N/A 10 23,3 N/A N/A 60,4 55,1 N/A N/A Taiwan 17 73, ,7 80,3 84,7 93,9 53,1 81,7 85, Tajikistan , ,4 92,3 78,1 58,4 45,5 67,7 73, Tanzania , ,8 79,7 78,3 47,0 61,1 66,0 76, Thailand 72 63, ,6 79,7 83,6 71,4 61,6 68,6 75, Timor-Leste , ,4 64,7 0,0 45,4 79,2 68,3 64, Togo , ,8 69,7 82,4 43,3 42,8 79,3 62, Tonga , ,6 86,7 74,8 74,6 91,2 71,3 79, Trinidad and Tob 73 62, ,0 84,8 62,5 59,4 76,4 71,7 78, Tunisia , ,2 74,3 63,8 80,7 72,6 75,9 61, Turkey 64 64, ,0 77,5 63,5 67,6 59,7 71,8 84, Turkmenistan ,2 5 13,4 95,2 93,0 30,0 30,0 65,9 79, Uganda 91 59, ,8 79,1 87,3 45,1 87,4 71,0 75, Ukraine , ,9 79,1 37,5 59,8 49,8 78,7 86, United Arab Emi 28 71, ,4 99,6 83,1 74,4 82,9 84,6 82, United Kingdom 14 74, ,4 56,6 29,5 92,0 73,1 73,5 87, United States 12 75, ,0 65,8 48,1 89,2 97,2 75,4 86, Uruguay 38 69, ,6 77,4 68,0 74,5 68,1 72,1 82, Uzbekistan , ,4 90,3 70,4 75,7 60,8 63,1 66, Vanuatu 93 59, ,5 97,3 81,7 54,8 56,8 82,7 48, Venezuela ,3 5 16,5 75,3 51,8 43,4 33,7 49,7 62, Vietnam , ,9 77,0 71,4 62,0 68,3 63,6 78, Yemen , ,4 91,7 74,9 59,2 54,9 62,1 82, Zambia 88 60, ,3 71,8 82,9 74,9 50,1 68,0 84, Zimbabwe , ,3 63,3 64,0 34,5 22,2 73,0 54, Somalia N/A N/A N/A 5,0 N/A N/A N/A N/A N/A N/A N/A N/A 185 Kosovo N/A N/A 30 28,6 92,7 73,0 58,1 71,3 72,7 N/A 65 N/A Todos os dados desta pesquisa foram obtidos em:

130 Análise de dados: Liberdade para Corrupção Mean 15 Summary for Freedom from Corruption % Confidence Intervals A nderson-darling Normality Test A -Squared 8.16 P-V alue < Mean StDev V ariance Skew ness Kurtosis N 179 Minimum st Q uartile Median rd Q uartile Maximum % C onfidence Interv al for Mean % C onfidence Interv al for Median % C onfidence Interv al for StDev Median O histograma não apresenta uma distribuição normal, adotando-se para esta análise o padrão de 5%, com média de 40,3 e mediana de 33. Os três outliers (Dinamarca, Irlanda e Cingapura) foram desconsiderados para a análise de amostragem Análise de dados: Liberdade de Trabalho Summary for Labor Freedom % Confidence Intervals Mean A nderson-darling Normality Test A -Squared 0.36 P-V alue Mean StDev V ariance Skew ness Kurtosis N 179 Minimum st Q uartile Median rd Q uartile Maximum % C onfidence Interv al for Mean % C onfidence Interv al for Median % C onfidence Interv al for StDev Median

131 8 O histograma apresenta uma distribuição normal, adotando-se para esta análise o padrão de 5%, com média de 61,2 e mediana de 61,2. O outlier Korea do Norte foi desconsiderado para a análise de amostragem Análise de dados: Liberdade de Investimento Summary for Investment Freedom A nderson-darling Normality Test A -Squared 2.96 P-V alue < Mean StDev V ariance Skew ness Kurtosis N Minimum st Q uartile Median rd Q uartile Maximum % C onfidence Interv al for Mean 95% Confidence Intervals % C onfidence Interv al for Median % C onfidence Interv al for StDev Mean Median O histograma não apresenta uma distribuição normal, adotando-se para esta análise o padrão de 5%, com média de 48,7 e mediana de

132 Legal and Political Environment Summary for Legal and Political Environment A nderson-darling Normality Test A -Squared 1.56 P-V alue < Mean StDev V ariance Skew ness Kurtosis N Minimum st Q uartile Median rd Q uartile Maximum % C onfidence Interv al for Mean 95% Confidence Intervals % C onfidence Interv al for Median % C onfidence Interv al for StDev Mean Median O histograma não apresenta uma distribuição normal, adotando-se para esta análise o padrão de 5%, com média de 5,13 e mediana de 4, Physical Property Rights Summary for Physical Property Rights A nderson-darling Normality Test A -Squared 0.88 P-V alue Mean StDev V ariance Skew ness Kurtosis N Minimum st Q uartile Median rd Q uartile Maximum % C onfidence Interv al for Mean 95% Confidence Intervals % C onfidence Interv al for Median % C onfidence Interv al for StDev Mean Median O histograma não apresenta uma distribuição normal, adotando-se para esta análise o padrão de 5%, com média de 5,76 e mediana de

133 Intellectual Property Rights Summary for Intellectual Property Rights A nderson-darling Normality Test A -Squared 1.27 P-V alue < Mean StDev V ariance Skew ness Kurtosis N Minimum st Q uartile Median rd Q uartile Maximum % C onfidence Interv al for Mean 95% Confidence Intervals % C onfidence Interv al for Median % C onfidence Interv al for StDev Mean Median O histograma não apresenta uma distribuição normal, adotando-se para esta análise o padrão de 5%, com média de 5,55 e mediana de 4, Cluster Analysis of Variables: Investment F, Freedom from, Labor Freedo, Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number Number of obs. of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster A tabela acima nos indica que não há grande similaridade de todas as observações. Os indicadores de distância em relação ao centróide indicam que há relativa similaridade entre as variáveis. No Dendograma abaixo podemos visualizar a disposição das variáveis e verificar o nível de similaridade entre elas.

134 11 Dendrogram with Single Linkage and Correlation Coefficient Distance Similarity Investment Freedom Freedom from Corruption Legal and Political Environment International Property Rights I Intellectual Property Rights Variables Physical Property Rights Labor Freedom 5. COMPARAÇÃO DE MÉDIA, ANÁLISE DE VARIÂNCIA E INTERVALO DE CONFIANÇA. Segue abaixo os resultados da One-Way ANOVA para cada variável. A comparação é sempre entre Investiment Freedom e Labor Freedom AMÉRICA LATINA One-way ANOVA: Source DF SS MS F P Factor Error Total S = R-Sq = 1.17% R-Sq(adj) = 0.00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Investment Freed ( * ) Labor Freedom_ ( * ) Pooled StDev = 19.36

135 12 Boxplot of Investment Freedom_1, Labor Freedom_ Data Investment Freedom_1 Labor Freedom_ OECD One-way ANOVA: Source DF SS MS F P Factor Error Total S = R-Sq = 4.38% R-Sq(adj) = 1.20% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Investment Freed ( * ) Labor Freedom_1_ ( * ) Pooled StDev = 15.15

136 Boxplot of Investment Freedom_1_1, Labor Freedom_1_ Data Investment Freedom_1_1 Labor Freedom_1_ ÁFRICA One-way ANOVA: Source DF SS MS F P Factor Error Total S = R-Sq = 21.18% R-Sq(adj) = 18.37% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Investment Freed ( * ) Labor Freedom_1_ ( * ) Pooled StDev = 14.46

137 14 Boxplot of Investment Freedom_1_1_1, Labor Freedom_1_1_ Data Investment Freedom_1_1_1 Labor Freedom_1_1_1 6. REGRESSÃO LOGÍSTICA E ANÁLISE DISCRIMINANTE A variável dependente de nossa análise serão as três regiões e para tentar explicar em qual região um determinado país caí, utilizamos as 6 variáveis. Segue abaixo o resultado da regressão logística: 6.1. ANÁLISE DISCRIMINANTE DE TODOS OS PAÍSES Análise Discriminante Linear: Investment Freedom Linear Method for Response: C9 Predictors: Investment Freedom Group Count Summary of classification True Group Put into Group Total N N correct Proportion 0,400 0,455 0,750 N = 46 N Correct = 26 Proportion Correct = 0,565 Squared Distance Between Groups

138 , , , , , , , , ,00000 Linear Discriminant Function for Groups Constant -3,965-4,754-10,764 Investment Freedom 0,180 0,197 0,297 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 6** ,0485 0, ,5721 0, ,6400 0,351 8** , , , , , ,156 10** ,0485 0, ,5721 0, ,6400 0,351 13** , , , , , ,156 15** ,0485 0, ,5721 0, ,6400 0,351 25** , , , , , ,156 26** , , , , , ,611 27** , , , , , ,156 28** , , , , , ,156 29** , , , , , ,156 31** , , , , , ,156 32** ,0485 0, ,5721 0, ,6400 0,351 33** , , , , , ,156 34** , , , , , ,156 37** ,359 0, ,253 0, ,289 0,007 39** ,3081 0, ,1465 0, ,2304 0,820 41** ,8028 0, ,3540 0, ,3980 0,021

139 16 42** , , , , , ,059 45** , , , , , ,611 46** ,735 0, ,971 0, ,999 0,002 Análise Discriminante Quadrática: C9 versus Investment Freedom Quadratic Method for Response: C9 Predictors: Investment Freedom Group Count Summary of classification True Group Put into Group Total N N correct Proportion 0,733 0,182 0,900 N = 46 N Correct = 31 Proportion Correct = 0,674 From Generalized Squared Distance to Group Group ,419 6,162 10, ,497 6,123 9, ,018 7,419 4,984 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 8** ,579 0, ,131 0, ,450 0,119 13** ,579 0, ,131 0, ,450 0,119 21** ,971 0, ,864 0, ,856 0,000 26** ,414 0, ,166 0, ,027 0,655 32** ,553 0, ,429 0,318

140 17 3 6,054 0,383 35** ,541 0, ,318 0, ,729 0,000 36** ,579 0, ,131 0, ,450 0,119 38** ,579 0, ,131 0, ,450 0,119 39** ,161 0, ,342 0, ,369 0,780 40** ,553 0, ,429 0, ,054 0,383 41** ,288 0, ,848 0, ,351 0,002 42** ,490 0, ,270 0, ,216 0,020 43** ,553 0, ,429 0, ,054 0,383 44** ,553 0, ,429 0, ,054 0,383 45** ,414 0, ,166 0, ,027 0,655 Análise Discriminante Linear: Labor Freedom Linear Method for Response: C9 Predictors: Labor Freedom Group Count Summary of classification True Group Put into Group Total N N correct Proportion 0,200 0,545 0,500 N = 46 N Correct = 19 Proportion Correct = 0,413 Squared Distance Between Groups , , , , , , , , ,000000

141 18 Linear Discriminant Function for Groups Constant -7,0694-5,6326-8,8942 Labor Freedom 0,2418 0,2158 0,2712 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 6** , , , , , ,284 7** ,9402 0, ,3202 0, ,0366 0,196 8** , , , , , ,344 11** , , , , , ,345 12** ,6033 0, ,1391 0, ,5233 0,218 13** , , , , , ,331 15** , , , , , ,331 16** ,3664 0, ,5854 0, ,6452 0,176 17** , , , , , ,233 18** , , , , , ,292 21** ,9277 0, ,3129 0, ,0183 0,197 22** , , , , , ,419 23** , , , , , ,258 25** , , , , , ,362 26** ,6439 0, ,1589 0, ,5874 0,215 28** , , , , , ,369 29** ,2488 0, ,5094 0, ,4806 0,181 30** ,086 0, ,667 0, ,688 0,581 32** , , , ,404

142 19 3 1, ,245 33** ,578 0, ,269 0, ,057 0,600 34** , , , , , ,254 35** , , , , , ,256 38** , , , , , ,358 39** ,1283 0, ,1491 0, ,3657 0,478 40** , , , , , ,390 42** , , , , , ,382 45** ,9577 0, ,9111 0, ,2716 0,465 Análise Discriminante Quadrática: Labor Freedom Quadratic Method for Response: C9 Predictors: Labor Freedom Group Count Summary of classification True Group Put into Group Total N N correct Proportion 0,600 0,545 0,450 N = 46 N Correct = 24 Proportion Correct = 0,522 From Generalized Squared Distance to Group Group ,259 5,815 5, ,464 5,680 6, ,522 6,293 5,528 Summary of Misclassified Observations Observation True Pred Squared Group Group Group Distance Probability

143 6** ,341 0, ,698 0, ,017 0,280 7** ,442 0, ,945 0, ,486 0,206 8** ,297 0, ,957 0, ,604 0,333 11** ,300 0, ,963 0, ,601 0,334 12** ,018 0, ,795 0, ,992 0,225 13** ,268 0, ,877 0, ,661 0,321 14** ,379 0, ,101 0, ,549 0,351 15** ,268 0, ,877 0, ,661 0,321 16** ,978 0, ,164 0, ,071 0,188 17** ,798 0, ,732 0, ,717 0,237 18** ,305 0, ,717 0, ,933 0,287 21** ,426 0, ,939 0, ,468 0,207 22** ,834 0, ,643 0, ,574 0,406 26** ,069 0, ,811 0, ,054 0,222 29** ,830 0, ,101 0, ,913 0,193 30** ,142 0, ,533 0, ,151 0,598 33** ,762 0, ,030 0, ,505 0,622 38** ,351 0, ,057 0, ,561 0,346 39** ,678 0, ,454 0, ,879 0,470 40** ,553 0, ,330 0, ,528 0,376 42** ,494 0, ,257 0, ,528 0,369 45** ,464 0, ,258 0, ,789 0,456 20

144 21 Podemos notar nas análises acima, entre linear e quadrática, e os números em destaque, que embora os percentuais sejam próximos, a quadrática se apresenta melhor 6.2 REGRESSÃO LOGÍSTICA DE TODOS OS PAÍSES Ordinal Logistic Regression: Country versus Investment F, Freedom from,... Link Function: Logit Response Information Logistic Regression Table Odds Predictor Coef SE Coef Z P Ratio Investment Freedom Freedom from Corruption Labor Freedom International Property Rights I Legal and Political Environment Physical Property Rights Intellectual Property Rights % CI Predictor Lower Upper Investment Freedom Freedom from Corruption Labor Freedom International Property Rights I Legal and Political Environment Physical Property Rights Intellectual Property Rights Log-Likelihood = Test that all slopes are zero: G = 3.547, DF = 7, P-Value = Goodness-of-Fit Tests Method Chi-Square DF P Pearson Deviance Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant Somers' D 0.21 Discordant Goodman-Kruskal Gamma 0.21 Ties Kendall's Tau-a 0.21 Total De acordo com os resultados encontrados acima, podemos comentar que:

145 22 Na análise acima podemos notar que a concordância é de 60% e a discordância é de 39,3%, em comparação às análises discriminantes, se apresenta um pouco melhor os percentuais, na média, as análises discriminantes ficaram em torno de 0,56 (56%) REGRESSÃO LOGÍSTICA AMÉRICA LATINA Ordinal Logistic Regression: C10 versus Investment F, Labor Freedo,... Predictor Coef SE Coef Z P Investment Freedom_ Labor Freedom_ Freedom from Corruption_ International Property Rights_ Legal and Political Environme_ Physical Property Rights_ Intellectual Property Rights_ % CI Predictor Odds Ratio Lower Upper Investment Freedom_ Labor Freedom_ Freedom from Corruption_ International Property Rights_ E+08 Legal and Political Environme_ Physical Property Rights_ Intellectual Property Rights_ Log-Likelihood = Test that all slopes are zero: G = 9.513, DF = 7, P-Value = Goodness-of-Fit Tests Method Chi-Square DF P Pearson Deviance Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant Somers' D 0.62 Discordant Goodman-Kruskal Gamma 0.63 Ties Kendall's Tau-a 0.62 Total REGRESSÃO LOGÍSTICA OECD Ordinal Logistic Regression: C19 versus Investment F, Freedom from,... Predictor Coef SE Coef Z P Investment Freedom_1_ Freedom from Corruption_1_ Labor Freedom_1_ International Property Rights_ Physical Property Rights_1_ Intellectual Property Rights Legal and Political Environme_ % CI

146 23 Predictor Odds Ratio Lower Upper Investment Freedom_1_ Freedom from Corruption_1_ Labor Freedom_1_ International Property Rights_ Physical Property Rights_1_ Intellectual Property Rights Legal and Political Environme_ Log-Likelihood = Test that all slopes are zero: G = , DF = 7, P-Value = Goodness-of-Fit Tests Method Chi-Square DF P Pearson Deviance Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant Somers' D 0.57 Discordant Goodman-Kruskal Gamma 0.57 Ties Kendall's Tau-a 0.57 Total REGRESSÃO LOGÍSTICA ÁFRICA Ordinal Logistic Regression: C28 versus Investment F, Freedom from,... Odds Predictor Coef SE Coef Z P Ratio Investment Freedom_1_1_ Freedom from Corruption_1_1_ Labor Freedom_1_1_ International Property Rights_ Legal and Political Environme_ Physical Property Rights_1_1_ Intellectual Property Rights % CI Predictor Lower Upper Investment Freedom_1_1_ Freedom from Corruption_1_1_ Labor Freedom_1_1_ International Property Rights_ E+19 Legal and Political Environme_ E+08 Physical Property Rights_1_1_ E+08 Intellectual Property Rights E+08 Log-Likelihood = Test that all slopes are zero: G = 3.156, DF = 7, P-Value = Goodness-of-Fit Tests Method Chi-Square DF P Pearson Deviance

147 24 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant Somers' D 0.31 Discordant Goodman-Kruskal Gamma 0.31 Ties Kendall's Tau-a 0.31 Total Análise de Dendogramas: 7.1. Dendograma das Variáveis de Liberdade Econômica: Cluster Analysis of Variables: Business Fre, Trade Freedo, Fiscal Freed,... Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number Number of obs. of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster

148 25 Dendrogram with Single Linkage and Correlation Coefficient Distance Similarity Business Freedom_1 Freedom from Corruption_1 Investment Freedom_1 Financial Freedom_1 Trade Freedom_1 Variables Monetary Freedom_1 Labor Freedom_1 Fiscal Freedom_ Dendograma das Variáveis de Direito à Propriedade: Cluster Analysis of Variables: Legal and Po, Physical Pro, Intellectual Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number Number of obs. of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster

149 26 Dendrogram with Single Linkage and Correlation Coefficient Distance Similarity Legal and Political Environme_1 Physical Property Rights_1 Variables Intellectual Property Rights_ Dendograma de todas as variáveis: Liberdade Econômica e Direito à Propriedade: Cluster Analysis of Variables: Business Fre, Trade Freedo, Fiscal Freed,... Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number Number of obs. of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster

150 27 Dendrogram with Single Linkage and Correlation Coefficient Distance Similarity Business Freedom_1 Freedom from Corruption_1 Legal and Political Environme_1 Intellectual Property Rights_1 Physical Property Rights_1 Investment Freedom_1 Financial Freedom_1 Variables Trade Freedom_1 Monetary Freedom_1 Labor Freedom_1 Fiscal Freedom_1 Cluster Analysis of Observations: Business Fre; Govt Size_1; Monetary Fre;... Euclidean Distance, Single Linkage Amalgamation Steps Number Number of obs. of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,5235 4, ,3977 8, ,3436 8, ,2823 8, ,9525 8, ,9077 8, ,5319 9, ,1649 9, , , , , , , , , , , , , , , , , , , , , , , , , , ,

151 , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , Final Partition Number of clusters: 7 Within Average Maximum cluster distance distance Number of sum of from from observations squares centroid centroid

152 29 Cluster1 2 65,8 5,7379 5,7379 Cluster ,6 25, ,4485 Cluster ,9 30, ,9517 Cluster ,5 11, ,1234 Cluster5 1 0,0 0,0000 0,0000 Cluster6 1 0,0 0,0000 0,0000 Cluster7 1 0,0 0,0000 0,0000 Cluster Centroids Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Business Freedom_1 95,510 65, , ,195 66,28 Govt Size_1 93,425 79, , ,735 90,06 Monetary Freedom_1 86,510 74, , ,735 77,30 Investment Freedom_1 85,000 50, , ,000 80,00 Property Rights_1 90,000 37, , ,500 90,00 Physical Property Rights_1 8,000 5,5318 6,8828 3,750 7,00 Grand Variable Cluster6 Cluster7 centroid Business Freedom_1 34,38 85,80 70,6953 Govt Size_1 55,76 61,12 64,8881 Monetary Freedom_1 72,69 93,64 76,4270 Investment Freedom_1 40,00 60,00 58,0000 Property Rights_1 30,00 70,00 53,2500 Physical Property Rights_1 4,20 7,20 6,0613 Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0,000 72, , ,874 31, ,814 47,0571 Cluster2 72,029 0, , ,911 60,949 41,039 47,7534 Cluster3 59,520 60,4800 0, ,428 54,635 73,570 28,2793 Cluster4 121,874 51, ,4285 0, ,613 37,667 90,2439 Cluster5 31,250 60, , ,613 0,000 86,158 47,8078 Cluster6 104,814 41, , ,667 86,158 0,000 71,5587 Cluster7 47,057 47, , ,244 47,808 71,559 0, Análise de ANOVA: One-way ANOVA: Business Freedom_1 versus cluster Source DF SS MS F P cluster ,86 0,000 Error Total S = 12,69 R-Sq = 36,98% R-Sq(adj) = 34,49% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,77 17,10 (------*------) ,01 11,11 (-*) ,30 14,64 (-*-) ,92 8,23 (------* ) Pooled StDev = 12,69

153 30 Boxplot of Business Freedom_1 by cluster 100 Boxplot of Business Freedom_1 by cluster 90 Business Freedom_ cluster 3 4 One-way ANOVA: Govt Size_1 versus cluster Source DF SS MS F P cluster ,63 0,000 Error Total S = 11,90 R-Sq = 73,04% R-Sq(adj) = 71,98% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,30 1,97 (------*------) ,59 10,31 (-*-) ,84 14,49 (-*--) ,41 6,76 (------*------) Pooled StDev = 11,90

154 31 Boxplot of Govt Size_1 by cluster Boxplot of Govt Size_1 by cluster Govt Size_ cluster 3 4 One-way ANOVA: Monetary Freedom_1 versus cluster Source DF SS MS F P cluster ,3 456,8 15,09 0,000 Error ,7 30,3 Total ,0 S = 5,501 R-Sq = 37,34% R-Sq(adj) = 34,86% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,440 5,325 (-----*------) ,244 5,322 (*-) ,298 5,392 (-*-) ,720 9,531 (------*-----) Pooled StDev = 5,501

155 32 Boxplot of Monetary Freedom_1 by cluster Boxplot of Monetary Freedom_1 by cluster 90 Japan Monetary Freedom_ Serbia Malawi Sri Lanka cluster 3 4 One-way ANOVA: Investment Freedom_1 versus cluster Source DF SS MS F P cluster ,70 0,000 Error Total S = 15,94 R-Sq = 38,27% R-Sq(adj) = 35,83% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,33 5,77 (------* ) ,68 16,62 (-*-) ,67 15,42 (-*-) ,33 15,28 (------* ) Pooled StDev = 15,94

156 33 Boxplot of Investment Freedom_1 by cluster Boxplot of Investment Freedom_1 by cluster Investment Freedom_ cluster 3 4 One-way ANOVA: Property Rights_1 versus cluster Source DF SS MS F P cluster ,13 0,000 Error Total S = 16,12 R-Sq = 63,00% R-Sq(adj) = 61,54% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,00 0,00 (-----*-----) ,73 14,12 (-*) ,83 19,35 (-*-) ,33 12,58 (-----*-----) Pooled StDev = 16,12

157 34 Boxplot of Property Rights_1 by cluster 100 Boxplot of Property Rights_1 by cluster 80 Property Rights_ Croatia cluster 3 4 One-way ANOVA: Physical Property Rights_1 versus cluster Source DF SS MS F P cluster 3 54,85 18,28 14,76 0,000 Error 76 94,14 1,24 Total ,99 S = 1,113 R-Sq = 36,81% R-Sq(adj) = 34,32% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ,667 0,611 ( * ) ,532 1,052 (--*-) ,893 1,239 (-*--) 4 3 3,900 0,794 ( * ) ,2 4,8 6,4 8,0 Pooled StDev = 1,113

158 35 Boxplot of Physical Property Rights_1 by cluster 9 Boxplot of Physical Property Rights_1 by cluster 8 Physical Property Rights_ cluster Análise Discriminante: 9.1. LINEAR Discriminant Analysis: cluster versus Business Freedom; Govt Size_1;... Linear Method for Response: cluster Predictors: Business Freedom_1; Govt Size_1; Monetary Freedom_1; Investment Freedom_1; Property Rights_1; Physical Property Rights_1 Group Count Summary of classification True Group Put into Group Total N N correct Proportion 1,000 0,955 0,867 1,000 N = 80 N Correct = 74 Proportion Correct = 0,925

159 36 Squared Distance Between Groups , , , , ,7901 0, , , , ,5774 0, , , , ,2668 0,0000 Linear Discriminant Function for Groups Constant -164,09-133,07-128,06-90,65 Business Freedom_1 0,52 0,52 0,45 0,38 Govt Size_1 0,72 0,61 0,31 0,44 Monetary Freedom_1 2,51 2,41 2,60 2,15 Investment Freedom_1 0,10 0,08-0,01-0,02 Property Rights_1-0,32-0,51-0,29-0,40 Physical Property Rights_1 3,57 3,63 3,18 2,84 Summary of Misclassified Observations True Pred Squared Observation Group Group Group Distance Probability 8** ,70 0, ,11 0, ,91 0, ,98 0,604 24** ,568 0, ,436 0, ,407 0, ,048 0,000 27** ,66 0, ,11 0, ,47 0, ,00 0,515 55** ,235 0, ,647 0, ,219 0, ,470 0,963 58** ,125 0, ,869 0, ,309 0, ,073 0,000 75** ,954 0, ,329 0, ,601 0, ,764 0, QUADRÁTICA Discriminant Analysis: cluster versus Business Freedom; Govt Size_1;... * ERROR * Physical Property Rights_1 is highly correlated with other predictors in group 1. * ERROR * Calculations for discriminant analysis cannot be done.

160 Análise de Regressão Logística: Ordinal Logistic Regression: cluster versus Business Fre; Govt Size_1;... Link Function: Logit Response Information Variable Value Count cluster Total 80 Logistic Regression Table 95% Odds CI Predictor Coef SE Coef Z P Ratio Lower Const(1) -23,1517 5, ,44 0,000 Const(2) -16,7628 4, ,58 0,000 Const(3) -10,7716 4, ,49 0,013 Business Freedom_1 0, , ,58 0,113 1,06 0,99 Govt Size_1 0, , ,38 0,000 1,15 1,09 Monetary Freedom_1 0, , ,41 0,682 1,02 0,92 Investment Freedom_1 0, , ,16 0,031 1,06 1,01 Property Rights_1-0, , ,02 0,043 0,95 0,90 Physical Property Rights_1 0, , ,74 0,457 1,36 0,61 Predictor Upper Const(1) Const(2) Const(3) Business Freedom_1 1,14 Govt Size_1 1,21 Monetary Freedom_1 1,14 Investment Freedom_1 1,12 Property Rights_1 1,00 Physical Property Rights_1 3,04 Log-Likelihood = -37,731 Test that all slopes are zero: G = 75,398, DF = 6, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 215, ,754 Deviance 75, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,9 Somers' D 0,88

161 38 Discordant 106 6,0 Goodman-Kruskal Gamma 0,88 Ties 3 0,2 Kendall's Tau-a 0,49 Total , Análise em Componentes Principais: (variáveis em escala 0-100): Segue abaixo o resultado das análises dos componentes principais juntamente com o gráfico de EigenValue por grupo de variáveis: Liberdade Econômica; Direito à Propriedade e o 2 índices juntos. LIBERDADE ECONÔMICA Principal Component Analysis: Business Fre, Trade Freedo, Fiscal Freed, Monetar Eigenanalysis of the Correlation Matrix Eigenvalue Proportion Cumulative Variable PC1 PC2 PC3 Business Freedom_ Trade Freedom_ Fiscal Freedom_ Monetary Freedom_ Investment Freedom_ Financial Freedom_ Freedom from Corruption_ Labor Freedom_ Loading Plot of Business Freedom_1,..., Labor Freedom_1 Second Component Freedom from Corruption_1 0.2 Investment Freedom_1 Financial Business Freedom_1 Freedom_ Monetary Freedom_1 Trade Freedom_1 Labor Freedom_1-0.8 Fiscal Freedom_ First Component

162 39 5 Scree Plot of Business Freedom_1,..., Labor Freedom_1 4 Eigenvalue Component Number Score Plot of Business Freedom_1,..., Labor Freedom_1 3 2 Second Component First Component Pela análise dos detalhes e gráficos acima percebemos que se juntarmos as 9 variáveis em apenas 1 (PC1) teremos um proporção de 55%, com 2 (PC1 e PC2) chegamos a 70%, com 3 (PC1, PC2 e PC3) em 80% e assim por diante. Isto é algo extremamente significativo, pois ao invés de trabalharmos com 9 variáveis poderíamos trabalhar, por exemplo, com o índice PC3, que já explica 80% das variáveis.

163 40 Pela análise dos valores / participação de cada variável no índice PC3, poderíamos denominá-lo baixa, uma vez que as participações não são tão equitativas e possuem não possuem o mesmo sinal, parte negativo e parte positivo. DIREITO À PROPRIEDADE Principal Component Analysis: Legal and Po, Physical Pro, Intellectual Eigenanalysis of the Correlation Matrix Eigenvalue Proportion Cumulative Variable PC1 PC2 PC3 Legal and Political Environme_ Physical Property Rights_ Intellectual Property Rights_ ading Plot of Legal and Political Environme_1,..., Intellectual Property Rights 0.8 Physical Property Rights_1 0.6 Second Component Legal and Political Environme_ Intellectual Property Rights_ First Component

164 41 cree Plot of Legal and Political Environme_1,..., Intellectual Property Rights_ Eigenvalue Component Number 3 core Plot of Legal and Political Environme_1,..., Intellectual Property Rights_ 1.0 Second Component First Component Pela análise dos detalhes e gráficos acima percebemos que se juntarmos as 3 variáveis em apenas 1 (PC1) teremos um proporção de 89,7% e com 2 (PC1 e PC2) chegamos a 96%. Isto é algo extremamente significativo, pois ao invés de trabalharmos com 3 variáveis poderíamos trabalhar, por exemplo, com o índice PC1, que já explica 89,7% das variáveis.

165 42 Pela análise dos valores / participação de cada variável no índice PC1, poderíamos denominá-lo alta, uma vez que as participações são extremamente equitativas e possuem o mesmo sinal, negativo. LIBERDADE ECONÔMICA e DIREITO À PROPRIEDADE Principal Component Analysis: Business Fre, Trade Freedo, Fiscal Freed, Monetar Eigenanalysis of the Correlation Matrix Eigenvalue Proportion Cumulative Eigenvalue Proportion Cumulative Variable PC1 PC2 PC3 Business Freedom_ Trade Freedom_ Fiscal Freedom_ Monetary Freedom_ Investment Freedom_ Financial Freedom_ Freedom from Corruption_ Labor Freedom_ Legal and Political Environme_ Physical Property Rights_ Intellectual Property Rights_ Loading Plot of Business Freedom_1,..., Intellectual Property Rights_1 0.8 Fiscal Freedom_1 0.6 Second Component Physical Property Rights_1 Legal and Political Environme_1 Freedom from Corruption_1-0.2 Labor Freedom_1 Trade Freedom_1 Monetary Freedom_1 Financial Freedom_1 Investment Business Freedom_1 Intellectual Property Rights_ First Component

166 43 Scree Plot of Business Freedom_1,..., Intellectual Property Rights_ Eigenvalue Component Number Score Plot of Business Freedom_1,..., Intellectual Property Rights_1 3 2 Second Component First Component Pela análise dos detalhes e gráficos acima percebemos que se juntarmos as 12 variáveis em apenas 1 (PC1) teremos um proporção de 61%, com 2 (PC1 e PC2) chegamos a 73%, com 3 (PC1, PC2 e PC3) temos 81%, e assim por diante. Isto é algo extremamente significativo, pois ao invés de trabalharmos com 12 variáveis poderíamos trabalhar, por exemplo, com o índice PC3, que já explica 81% das variáveis.

167 44 Pela análise dos valores / participação de cada variável no índice PC3, poderíamos denominá-lo baixa, uma vez que as participações não são tão equitativas e possuem o sinal negativo e sinal positivo. 10. Análise de Correspondência A análise de correspondência é um método de análise fatorial para variáveis categóricas. A AC, basicamente, converte uma tabela de dados não negativos de duas ou múltiplas entradas em um tipo de representação gráfica em que as linhas e as colunas são simultaneamente representadas em dimensão reduzida, isto é, por pontos no gráfico. Este método permite mostrar como as variáveis dispostas em linhas e colunas estão relacionadas e não somente se a relação existe. A seguir, é apresentado o resultado da análise de correspondência para a tabela a seguir: BF_1 TF_1 FF_1 GS_1 MF_1 IF_1 FR_1 PR_1 FC_1 LF_1 LE_1 PF_1 IP_1 AFN AFS ASP EU LA Simple Correspondence Analysis: BF_1, TF_1, FF_1, GS_1, MF_1, IF_1, FR_1, PR_1, Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram ****************************** ** Total Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 AFN AFS ASP EU LA Component 3 ID Name Coord Corr Contr 1 AFN AFS ASP EU LA Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 BF TF FF GS MF IF

168 45 7 FR PR FC LF LE PF IP Component 3 ID Name Coord Corr Contr 1 BF TF FF GS MF IF FR PR FC LF LE PF IP Gráfico 4.1 Mostra a associação entre a categoria linha e coluna conforme a proximidade dos seus pontos no Biplot. Symmetric Plot Component EU FCPR IF IP LE FR ASP BF PF TF MF LA AFN FF AFS LF GS Component Do total da inércia da matriz de dados, 87,37% é contabilizada no primeiro componente, 8,46% é contabilizada no segundo componente e assim por diante.

169 PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Sandra Rocio Parada Castiblanco 1º Semestre 2014

170 2 1. INTRODUÇÃO. O bem-estar de uma sociedade não pode ser calculado só medindo a riqueza ou os recursos de um país através do PIB, é assim como o Programa das Nações Unidas para o Desenvolvimento Humano criou em 1990 o Indicador IDH Índice de Desenvolvimento Humano. Este indicador resume em um só dado às três dimensões mais importantes para o desenvolvimento das pessoas em um país: a) Oportunidade de vida longa e saudável, b) Acesso ao conhecimento e c) Padrão de vida digno. Além da renda, são estudadas as condições de Saúde e Educação para medir o progresso da sociedade. No Brasil foi criado o indicador IDHM Índice de Desenvolvimento Humano Municipal o qual tem sete dimensões: Desenvolvimento Humano, Demografia, Educação, Trabalho, Renda, Habitação e Vulnerabilidade. O presente trabalho tem por objetivo efetuar análises discriminantes para tentar predizer ou explicar os indicadores relacionados ao desenvolvimento da desvulnerabilidade dos municípios do Brasil com dados do ano 2010 segundo a Pesquisa Atlas Brasil Iniciamos com o entendimento dos dados, incluindo a definição dos indivíduos e das variáveis, suas classificações em variáveis categóricas ou quantitativas, os significados e unidades de medida, além da apresentação da tabela de dados. Depois de fazer a Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade baixo o método linear e quadrático, o objetivo e comparar através da Regressão Logística Ordinal qual pode ser aquela analise que permita explicar o país por agrupamento o menor grau de erros. Por fim, fazemos as considerações finais. O software estatístico utilizado é o MINITAB ENTENDENDO OS DADOS 2.1 Os indivíduos Os indivíduos desta análise são os 5564 (-DF) municípios das cinco regiões do país, (Centro Oeste, Nordeste, Norte, Sudeste e o Sul). Os dados foram tomados da fonte Atlas de Desenvolvimento Humano Brasil 2013, dimensão Vulnerabilidade, dados Esta dimensão apresenta a sua vez quatro áreas de estudo: i) Mulheres, ii) Crianças, iii) Educação, iv) Trabalho e Renda e Habitação. 2.2 As Variáveis Como foi citada anteriormente, a dimensão Vulnerabilidade, apresenta quatro tópicos de estudo Mulheres, Crianças, Educação e Trabalho e Renda e Habitação, as quais apresentam em sua totalidade 17 variáveis numéricas e 2 categóricas, para um total de 19 variáveis. Ver tabela número 1.

171 3 Tabela 1. As Variáveis Tema Variável NOME CURTO Tipo Municipio (5565) UFN T-M10A14CF VULNERABILIDADE variável Categorica NA % de mulheres de 10 a 14 anos que tiveram filhos variável Numérica Unidade de Medida NA Percentual Mulheres (3) T-M15A17CF T_MULHCHEFEFIF014 % de mulheres de 15 a 17 anos que tiveram filhos % de mães chefes de família sem fundamental completo e com filhos menores de 15 anos variável Numérica variável Numérica Percentual Percentual MORT1 Mortalidade infantil variável Numérica Taxa PINDCRI % de crianças extremamente pobres variável Numérica Percentual Crianças (5) T_CRIFUNDIN_TODOS T_FORA4A5 % de crianças em domicílios em que ninguém tem fundamental completo variável Numérica Percentual % de crianças de 4 a 5 anos fora da escola variável Numérica Percentual T_FORA6A14 % de crianças de 6 a 14 fora da escola variável Numérica Percentual T_FUNDIN_TODOS_MMEIO % de pessoas em domicílios vulneráveis à pobreza e em que ninguém tem fundamental completo. variável Numérica Percentual Educação, Trabalho e Renda (6) T_NESTUDA_NTRAB_MMEIO T_FUNDIN18MINF T_FUNDIN_TODOS % de pessoas de 15 a 24 anos que não estudam nem trabalham e são vulneráveis à pobreza. variável Numérica Percentual % de pessoas de 18 anos ou mais sem fundamental completo e em ocupação informal variável Numérica Percentual % de pessoas em domicílios em que ninguém tem fundamental completo variável Numérica Percentual T_RMAXIDOSO % de pessoas em domicílios vulneráveis à pobreza e dependentes de idosos variável Numérica Percentual T_OCUPDESLOC_1 % de pessoas vulneráveis à pobreza e que gastam mais de uma hora até o trabalho variável Numérica Percentual T_SLUZ % de pessoas em domicílios sem energia elétrica variável Numérica Percentual Habitação (3) PAREDE AGUA_ESGOTO % de pessoas em domicílios com paredes inadequadas variável Numérica Percentual % de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados variável Numérica Percentual Fonte.

172 A Tabela de Dados Tabela 2. Descriptive Statistics: PINDCRI. AGUA_ESGOTO. T_FORA6A14. T_FUNDIN_TOD.. Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum MORT1_n , ,0025 0, , , , PINDCRI_n , , , ,0417 0, , AGUA_ESGOTO_n ,1078 0, , , , , PAREDE_n , , , , , , T_CRIFUNDIN_TODOS_n , , , , , , T_FORA4A5_n , , , , , , T_FORA6A14_n , , , , , , T_FUNDIN_TODOS_n , , , , , , T_FUNDIN_TODOS_MMEIO_n , ,0023 0, , , , T_FUNDIN18MINF_n ,5184 0, , , , , T_M10A14CF_n , , , , T_M15A17CF_n , , , , , , T_MULCHEFEFIF014_n , , , , , , T_NESTUDA_NTRAB_MMEIO_n , , , , , , T_OCUPDESLOC1_n , , , , , , T_RMAXIDOSOn , , , ,0787 0, , T_SLUZn , , , , ,0084 0, Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab ANÁLISE DAS VARIÁVEIS 3.1 Variáveis Categóricas. São variáveis de tipo qualitativo que podem ser classificadas como de Nominais ou Ordinais. Estes tipos de variáveis indicam que o foco de concentração deve ser a análise de gráficos do tipo pie chart e barras Variável: Estado Fazem parte desta pesquisa os 27 estados brasileiros e suas cidades. O gráfico abaixo exibe o número de municípios por estado Gráfica 1. Municípios por Estado. Cidades por Estado Count PA RN CE PE MA PB PI GO SC PR BA RS SP MG MT UFN SE MS ES RJ AL TO AM RO AC AP RR DF Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab16.

173 5 A variação na quantidade de municípios por estado é alta. O Mato Grosso possui mais de 852 municípios, só seguido por São Paulo Variável: REGIÃO Segundo o pie chart por região, das cinco regiões a maior concentração de municípios para a dimensão vulnerabilidade são Sudeste (SE) com 30%, Nordeste (NE) com 32,2% e Sul (S) com 21,3%. Só estas três regiões concentram o 83,5% dos municípios do país. Gráfico 2. Distribuição Percentual dos municípios por regiões Gráfico por Regiões SE 30,0% CO 8,4% N 8,1% Category CO N NE S SE NE 32,2% S 21,3% Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab16.

174 6 A ilustração a seguir monstra a divisão do Brasil por região e por estado Variável: Munícipio Unidades Federais Nacionais mais representativas são: Minas Gerais com o 15,3% dos municípios, São Paulo 11,6% e Rio Grande do Sul 8,9%. Embora o 18,3% seja aparentemente um valor representativo, na verdade quando se representa graficamente este percentual a segmentação é amplia, se divide em várias UFN representando valores muito pequenos. Gráfico 3. Munícipios por regiões Municipios do Brasil por Região Count NE SE S Região CO N

175 7 Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab16. Gráfico 4. Distribuição dos Municípios pelas UFN Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab Variáveis Quantitativas. Todas as variáveis quantitativas ou numéricas são indicadores, porque estão normalizadas, de fato também estão positivadas, o que quer dizer que o nome deveria mudar e expressar seu conceito de forma positiva. Para maior detalhe destas 17 variáveis ver a tabela numero 1 apresentada anteriormente. Indicador de mulheres de 10 a 14 anos que tiveram filhos Indicador de mulheres de 15 a 17 anos que tiveram filhos Indicador de mães chefes de família sem fundamental completo e com filhos menores de 15 anos Indicador Mortalidade infantil menos de um ano. Indicador de crianças extremamente pobres Indicador de crianças em domicílios em que ninguém tem fundamental completo Indicador de crianças de 4 a 5 anos fora da escola Indicador de crianças de 6 a 14 fora da escola Indicador de pessoas em domicílios vulneráveis à pobreza e em que ninguém tem fundamental completo. Indicador de pessoas de 15 a 24 anos que não estudam nem trabalham e são vulneráveis à pobreza. Indicador de pessoas de 18 anos ou mais sem fundamental completo e em ocupação informal Indicador de pessoas em domicílios em que ninguém tem fundamental completo Indicador de pessoas em domicílios vulneráveis à pobreza e dependentes de idosos

176 8 Indicador de pessoas vulneráveis à pobreza e que gastam mais de uma hora até o trabalho Indicador de pessoas em domicílios sem energia elétrica Indicador de pessoas em domicílios com paredes inadequadas Indicador de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequado A análise deste tipo de variável permite a utilização de uma maior gama de ferramentas de análise como histogramas, curvas de densidade, gráfico de ramos, box-plot e dot-plot, além de informações numéricas como média, desvio-padrão, mediana, quartis, intervalo de confiança e teste de normalidade de Anderson-Darling. A continuação os gráficos das três variáveis mais representativas da Dimensão Vulnerabilidade do Indicador IDHM do Brasil. (MORTI, PINDRI, NESTUDA) Fonte:

177 9 Fonte: Fonte: A Tabela de Dados Para as análises os dados foram normalizados e transformados em dados positivos, gerando desta forma uma nova dimensão chamada Invulnerabilidade. Results for: DESVULNERABILIDADE.MTW Tabela 3. Estatística Descritiva Desvulnerabilidade: MORT1_np. PINDCRI_np. AGUA_ESGOTO_. PAREDE_np....

178 10 Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum MORT1_np , ,0025 0, , , , , PINDCRI_np , , , , , , , AGUA_ESGOTO_np ,8922 0, , , , , , PAREDE_np , , , , ,9296 0, , T_CRIFUNDIN_TODOS_np , , , , , , , T_FORA4A5_np , , , , , , , T_FORA6A14_np , , , , , , , T_FUNDIN_TODOS_np , , , , , , , T_FUNDIN_TODOS_MMEIO_np , ,0023 0, , , , , T_FUNDIN18MINF_np ,4816 0, , , , , , T_M10A14CF_np , , , , , T_M15A17CF_np , , ,1162 0, , , , T_MULCHEFEFIF014_np , , , , , , , T_NESTUDA_NTRAB_MMEIO_np , , ,1584 0, , , , T_OCUPDESLOC1_np , , ,0953 0, , , , T_RMAXIDOSOnp , , , , , , , T_SLUZnp , , , , , ,9916 0, Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab ANÁLISE DISCRIMINANTE LINEAR POR REGIÃO A análise multivariada é utilizada para analisar dados quando tem-se feito multiplex medições onde se pode escolher: Analisar a covariância para entendê-la ou para reduzir a dimensão dos dados. Assignar observações aos grupos Explorar relações dentro das variáveis categóricas Interpretar os resultados é subjetivo já que a ferramenta Minitab não compara testes de significância para processos multivariados. A análise discriminante classifica observações em dois ou mais grupos. Neste caso o objetivo é discriminar os valores de dimensão Desvulnerabilidade dos municípios do Brasil, começando com a variável categórica Região.

179 11 Tabela 4. Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Linear. Discriminant Analysis: Região versus MORT1_np. PINDCRI_np. T_NESTUDA_NT Linear Method for Response: Região Predictors: MORT1_np. PINDCRI_np. T_NESTUDA_NTRAB_MMEIO_np Group CO N NE S SE Count Summary of classification True Group Put into Group CO N NE S SE CO N NE S SE Total N N correct Proportion 0,206 0,486 0,638 0,745 0,382 N = 5564 N Correct = 2980 Proportion Correct = 0,536 Squared Distance Between Groups CO N NE S SE CO 0,0000 4, ,2475 1,0214 0,0141 N 4,6286 0,0000 1,8985 8,4913 5,1062 NE 10,2475 1,8985 0, , ,8586 S 1,0214 8, ,9265 0,0000 0,9697 SE 0,0141 5, ,8586 0,9697 0,0000 Linear Discriminant Function for Groups CO N NE S SE Constant -45,502-28,526-21,196-54,292-46,316 MORT1_np 50,002 43,595 30,350 55,438 50,056 PINDCRI_np 10,207 1,200 1,664 6,245 11,098 T_NESTUDA_NTRAB_MMEIO_np 51,956 44,344 44,580 61,263 51,916 A tabela anterior permite estabelecer um cruzamento de dados entre as regiões. A região que acertou mais foi Nordeste com 63,8% e a que errou mais foi CO com 20,6%. Já que o Nordeste possui 1794 municípios dos quais 1144 são corretos, mas o Centro-Este com 465 municípios só acertou 96 deles apresentando uma margem de erro alta. Segundo esta analise a avaliação o agrupamento por região não é uma boa escolha porque a proporção correta é só 53,6%.

180 12 Tabela 5. Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Quadratico. Discriminant Analysis: Região versus MORT1_np. PINDCRI_np. T_NESTUDA_NT Quadratic Method for Response: Região Predictors: MORT1_np. PINDCRI_np. T_NESTUDA_NTRAB_MMEIO_np Group CO N NE S SE Count Summary of classification True Group Put into Group CO N NE S SE CO N NE S SE Total N N correct Proportion 0,282 0,508 0,602 0,757 0,392 N = 5564 N Correct = 2992 Proportion Correct = 0,538 Comparada com a proporção correta do método linear que foi de 53,6%, a Análise Discriminante do método quadrático não representou uma porcentagem melhor, já que foi só de 53,8% ANÁLISE DISCRIMINANTE LINEAR POR 4 BRASIS A segunda parte da tabela 4 representa o distancia entre os grupos, encontrando que as regiões Centro-Oeste e Sudeste podem conformar um agrupamento chamado COSE, assim ficariam 4 regiões i) COSE ii) N iii) NE iv) S

181 13 Tabela 6. Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Linear. Quatro Brasis. Discriminant Analysis: Regiões Codifica versus MORT1_np. PINDCRI_np.... Linear Method for Response: Regiões Codificadas Predictors: MORT1_np. PINDCRI_np. T_NESTUDA_NTRAB_MMEIO_np Group COSE N NE S Count Summary of classification True Group Put into Group COSE N NE S COSE N NE S Total N N correct Proportion 0,548 0,499 0,638 0,753 N = 5564 N Correct = 3431 Proportion Correct = 0,617 Squared Distance Between Groups COSE N NE S COSE 0,0000 4, ,7186 0,9787 N 4,9967 0,0000 1,8986 8,4883 NE 10,7186 1,8986 0, ,9222 S 0,9787 8, ,9222 0,0000 Ainda assim o COSE não é a região com menor grau de erros, as melhores são Sul com 75,3% e Nordeste com 63,8% em quanto COSE tem 54,8% e Norte 49,9% Segundo esta analise a avaliação o agrupamento por região (4 Brasis) é melhor porque a proporção correta passou de 53,6% no método anterior a 61,7%

182 ANÁLISE DISCRIMINANTE QUADRÁTICA POR 4 BRASIS Tabela 7. Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Quadratico. Quatro Brasis. Discriminant Analysis: Regiões Codifica versus MORT1_np. PINDCRI_np.... Quadratic Method for Response: Regiões Codificadas Predictors: MORT1_np. PINDCRI_np. T_NESTUDA_NTRAB_MMEIO_np Group COSE N NE S Count Summary of classification True Group Put into Group COSE N NE S COSE N NE S Total N N correct Proportion 0,531 0,528 0,602 0,782 N = 5564 N Correct = 3379 Proportion Correct = 0,607 Segundo a tabela 4, a melhor analise para avaliação o agrupamento por região (4 Brasis) é para Análise Discriminante linear que apresenta uma proporção correta de 61,7% em quanto a quadrática é de 60,7% ANÁLISE DISCRIMINANTE LINEAR PARA DADOS AGRUPADOS Para procurar uma Análise Discriminante com uma porcentagem de proporção mais correta, foi realizado o dendrograma do Cluster Analysis of Observations (9 clusters) sem considerar DF, para as três variáveis com maior F da dimensão Desvulnerabilidade. Com base na similaridade poderemos definimos agrupamento de dados e após utilizamos a análise discriminante para verificar a proporção correta dos agrupamentos.

183 15 Grafico 5. Dendrograma Média por Estado para as três variáveis com maior F. Dendrograma Média por Estado para Morti_np x Pindcri_np x Nestuda_np 75,18 Similarity 83,45 91,73 100,00 9 clusters (-DF) AM RJ AL RR AP AC PE CE SE MS ES RO RN MT PA TO Observations MG SP RS PR BA SC PI PB MA GO Depois de tentar com diferentes números de clusters este é o dendrograma que permite fazer uma melhor análise discriminante e aumentar assim a porcentagem de proporção correta de agrupamento de municípios, sem considerar DF. Comando: STAT > MULTIVARIATE > DISCRIMINANT ANALISYS. Tabela 8. Análise Discriminante por Agrupamento para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Linear Discriminant Analysis: Agrupamento versus Mean_Morti_n. Mean_Pindcri.... Linear Method for Response: Agrupamento do Estado Predictors: Mean_Morti_np. Mean_Pindcri_np. Mean_Nestuda_np Group G1 G2 G3 G4 Count Summary of classification True Group Put into Group G1 G2 G3 G4 G G G G Total N N correct Proportion 0,667 0,444 0,800 0,750 N = 26 N Correct = 17 Proportion Correct = 0,654

184 16 Existem duas possibilidades análise discriminante que são a linear e a quadrática. Dependendo da variável deve-se dar mais peso e mais atenção a um método que outro. Até o momento a melhor avaliação de Análise Discriminante para agrupamento de regiões era a Linear que apresentava uma proporção correta de 61,7%, mas com esta nova análise baseada na similaridade pode-se definir que a Análise Discriminante por agrupamento e método linear é melhor com um 65,4% de proporção Correta. Para seguir com a comparação a continuação se apresenta a regressão logística. 4. COMPARAÇÃO DE MÉDIA, ANÁLISE DE VARIÂNCIA E INTERVALO DE CONFIANÇA. Segue abaixo os resultados da One-Way ANOVA para cada uma das três variáveis MORTI_np X PINDRI_np X NESTUDA_np para verificar a ordem das regiões One-way ANOVA: MORT1_np versus Região Source DF SS MS F P Região 4 130, , ,93 0,000 Error ,9600 0,0113 Total ,0673 S = 0,1064 R-Sq = 67,39% R-Sq(adj) = 67,37% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 465 0,8110 0,0706 (*) N 449 0,6584 0,1230 (*) NE ,5119 0,1529 *) S ,8823 0,0558 *) SE ,8167 0,0705 (* ,60 0,70 0,80 0,90 Pooled StDev = 0,1064 Depois de fazer a analise das três ANOVAS se determina que a classificação das regiões é: NE (1) N (2) CO (3) S (4).

185 17 5. REGRESSÃO LOGÍSTICA Ordinal Logistic Regression: Regiões Codi versus MORT1_np. PINDCRI_np.... Link Function: Logit Response Information Variable Value Count Regiões Codificadas COSE 2133 N 449 NE 1794 S 1188 Total 5564 Logistic Regression Table 95% Odds CI Predictor Coef SE Coef Z P Ratio Lower Const(1) -0, , ,69 0,000 Const(2) -0, , ,69 0,091 Const(3) 1, , ,75 0,000 MORT1_np 0, , ,57 0,117 1,41 0,92 PINDCRI_np 3, , ,08 0,000 27,21 17,18 T_NESTUDA_NTRAB_MMEIO_np -3, , ,57 0,000 0,02 0,01 Predictor Upper Const(1) Const(2) Const(3) MORT1_np 2,17 PINDCRI_np 43,09 T_NESTUDA_NTRAB_MMEIO_np 0,04 Log-Likelihood = -6873,010 Test that all slopes are zero: G = 334,281, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 16740, ,375 Deviance 13746, ,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,3 Somers' D 0,27 Discordant ,2 Goodman-Kruskal Gamma 0,27 Ties ,5 Kendall's Tau-a 0,19 Total ,0

186 18 A análise de Regressão Logística Ordinal por região apresenta um valor de P-Value de zero o que significa que a análise é confiável, o modelo apresentou nível de concordância de 63,3% de acerto. Results for: COMPONENTES PRINCIPALES Y OTROS DATOS NORMAL. E POSITIVA.MTW Ordinal Logistic Regression: Grupos versus Mean_Morti_n. Mean_Pindcri.... Link Function: Logit Response Information Variable Value Count Grupos Total 26 Logistic Regression Table Predictor Coef SE Coef Z P Odds Ratio 95% CI Lower Const(1) 3, , ,31 0,190 Const(2) 5, , ,94 0,052 Const(3) 5, , ,04 0,041 Const(4) 6, , ,35 0,019 Const(5) 7, , ,64 0,008 Const(6) 8, , ,75 0,006 Const(7) 8, , ,89 0,004 Const(8) 9, , ,05 0,002 Mean_Morti_np 7, , ,56 0, ,19 0,14 Mean_Pindcri_np 4, , ,57 0,566 58,12 0,00 Mean_Nestuda_np -20, ,3062-1,78 0,075 0,00 0,00 Predictor Upper Const(1) Const(2) Const(3) Const(4) Const(5) Const(6) Const(7) Const(8) Mean_Morti_np ,96 Mean_Pindcri_np ,89 Mean_Nestuda_np 7,36 Log-Likelihood = -46,728 (Test that all slopes are zero: G = 6,766, DF = 3, P-Value = 0,080) Goodness-of-Fit Tests Method Chi-Square DF P Pearson 164, ,958 Deviance 93, ,000 Measures of Association:(Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant ,2 Somers' D 0,28 Discordant ,8 Goodman-Kruskal Gamma 0,28 Ties 0 0,0 Kendall's Tau-a 0,24 Total ,0

187 19 A análise de Regressão Logística Ordinal por região apresenta um valor de P-Value de zero o que significa que a análise é confiável, o modelo apresentou nível de concordância de 63,3% de acerto. A análise de Regressão Logística Ordinal para os dados agrupados por região apresenta um P- Value de 0,080 com um nível de concordância de 64,2%. Através da Regressão Logística Ordinal se classificam novas observações em uma ou duas categorias, esta regressão pode ser superior do que o a análise discriminante e este foi o caso do anterior exercício. 6. TRABAJO ARVOLES DE CLASSIFICAÇÃO Advertencia No se muestran las tablas de resúmenes de ganancias ya que no se han definido los beneficios. No se muestran las tablas de ganancias de las categorías objetivo ya que no se han definido las categorías objetivo. Resumen del modelo Especificações Método de crecimiento CHAID Variable dependiente Variables independientes Validación Região MORT1_np, PINDCRI_np, NESTUDA_np Ninguna Máxima profundidad de árbol 3 Mínimo de casos en un nodo filial 100 Mínimo de casos en un nodo parental 50 Resultados Variables independientes incluidas MORT1_np, NESTUDA_np, PINDCRI_np Número de nodos 53 Número de nodos terminales 37 Profundidad 3

188 20 Gráfica 6. Arvore de Classificação. Riesgo Estimación Típ. Error,352,006 Métodos de crecimiento: CHAID Variable dependiente: Região

189 21 Clasificación Observado Pronosticado CO N NE S SE Porcentaje correcto CO ,1% N ,0% NE ,7% S ,8% SE ,4% Porcentaje global 1,0%,0% 34,2% 15,5% 49,4% 64,8% Métodos de crecimiento: CHAID Variable dependiente: Região A porcentagem de acerto deste modelo é de 64,8%. El árbol no consigue distinguir CO de SE (pronostico todo en esta última), ni N y NE. A árvore considera que as variáveis mais importantes são: em primeiro lugar Supervivência Infantil de até um ano. (Morti_np). Sem considerar o valor F, este tipo de análise determina que as regiões com maior concentração para Morti_np são NE com 32,2% e 1794 municípios seguida de SE com 30% com 1668 munícipios. O nodo um tem 558 municípios, apresentando que as duas regiões mais misturadas são NE e S com 31,4% e 28% respectivamente tomando a variarei NESTUDA_np como aquela que entre as 6 variáveis melhor pode ajudar a separar os dados.

190 Gráfica 7. Ampliação Arvore de Classificação. (parte esquerda) 22

191 Gráfica 7. Ampliação Arvore de Classificação. (parte direita) 23

192 24 CONSIDERAÇÕES FINAIS Sem considerar o F, o sistema determina por níveis de classificação as variáveis mais representativas para classificar os municípios em grupos, estabelecendo para isto o numero de casos por intervalos fazendo uma régua logica. Entre mais separa melhor. Em um primeiro nível, a variável que melhor separa a Dimensão Desvulnerabilidade é Supervivência Infantil (morti_np). Este modelo de arvores de classificação oferece uma porcentagem de 64,8% de acerto.

193 PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO GESTÃO FISCAL DOS MUNICÍPIOS Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Silmara C. Gomes 1º Semestre 2014

194 2 1. INTRODUÇÃO O presente trabalho tem por objetivo efetuar uma análise Multivariada, uma análise de conglomerados, análise discriminante, regressão lógica, análise de correspondências e arvores de classificação dos dados da Pesquisa Firjan/FGV sobre o Desenvolvimento dos Municípios nos períodos de 2000 e Inicia-se com o entendimento dos dados, incluindo a definição dos indivíduos e das variáveis, suas classificações em variáveis categóricas ou quantitativas, os significados e unidades de medida, além da apresentação da tabela de dados. O software estatístico utilizado é o MINITAB ENTENDENDO OS DADOS 2.1 Os Indivíduos Os indivíduos desta análise são os municípios brasileiros ano Trata-se de um total de 5565 munícipios distribuídos em 27 unidades federativas, sendo 26 estados e um distrito federal. Os dados analisados de cada munícipio são as variáveis que descrevemos a seguir. 2.2 As Variáveis São 7 as variáveis desta pesquisa, incluindo o nome dos municípios. As mesmas são melhor explicadas na Tabela 1. Ressaltamos que todos os dados desta pesquisa são referentes ao ano de Tabela 1. As Variáveis Variável Significado Tipo UF Município Abreviação de Unidade Federativa (ou Unidade da Federação) do Brasil. As UF do Brasil são entidades autônomas, com governo e constituição próprias, que em seu conjunto constituem a República Federativa do Brasil. (IBGE, 2013) O município é a divisão administrativa autônoma da UF. São as unidades de menor hierarquia dentro da organização político administrativa do Brasil, criadas através de leis ordinárias das Assembléias Legislativas de cada Unidade da Federação e sancionadas pelo Governador. (IBGE, 2013) Variável Categórica Variável Categórica Unidade de Medida N/A N/A

195 3 UF2 Apresenta a sigla que representa as Unidades Federativas (ou Unidades da Federação) do Brasil. IFGF Índice Firjan de Gestão Fiscal. O IFGF é composto por cinco indicadores: Receita Própria, Gastos com Pessoal, Investimentos, Liquidez e Custo da Dívida. Os quatro primeiros possuem peso 22,5% e o último 10,0% no resultado final do Índice. A seguir, a descrição de cada um deles. (FIRJAN, 2013) Receita É, de acordo com a FIRJAN (2013), a Própria dependência de transferências intergovernamentais engessa o orçamento dos municípios, uma vez que é pautada por incertezas e está sujeita á programação das administrações superiores. Assim, um município deve ser capaz de gerar um alto nível de receita própria para ter condições de colocar em prática projetos de longo prazo. Este indicador tem o objetivo de verificar o grau de autonomia das receitas do município. A receita própria do município é formada por IPTU, ISS, IRFF e Outras Receitas Próprias". Pessoal Refere-se aos Gastos com Pessoal, ou seja, é "a despesa com pessoal é o principal item da despesa do setor público. Este indicador busca avaliar o comprometimento das receitas com as despesas de pessoal, a formula de cálculo leva em consideração, bases da Lei de Responsabilidade Fiscal LRF". (FIRJAN, 2013) Investimentos o objetivo deste indicador é medir a parcela dos investimentos nos orçamentos municipais. Estabeleceu-se que a nota de corte seria investir 20% da RCL Receita Corrente Líquida. Liquidez Custo da Dívida (FIRJAN, 2013) "o indicador procura verificar se o município possui recursos financeiros suficientes para fazer frente ao montante de restos a pagar. Se o município apresentar mais restos a pagar do que ativos financeiros disponíveis a pontuação será zero". (FIRJAN, 2013) "este indicador avalia o peso dos encargos da dívida em relação às receitas líquidas reais, destacando-se que o limite é de 13%". (FIRJAN, 2013) Variável Categórica Variável Quantitátiva Variável Quantitátiva Variável Quantitátiva Variável Quantitátiva Variável Quantitátiva Variável Quantitátiva N/A 0-1 (qto + próx. de 1 melhor) 0-1 (qto + próx. de 1 melhor) 0-1 (qto + próx. de 1 melhor) 0-1 (qto + próx. de 1 melhor) 0-1 (qto + próx. de 1 melhor) 0-1 (qto + próx. de 1 melhor) 2.3 A Tabela de Dados

196 4 Tabela 2. Tabela de Dados UF Município UF2 IFGF Receita Própria Pessoal Investimentos Liquidez Custo da Dívida Goiás Abadia de GO 0,68 0,36 0,45 0,84 0,93 1,00 Goiás Minas Gerais Abadia dos MG 0,35 0,22 0,43 0,55 0,00 0,82 Dourados Goiás Abadiânia GO 0,54 0,48 0,61 0,16 0,75 0,86 Minas Gerais Abaeté MG 0,35 0,28 0,45 0,41 0,07 0,83 Pará Abaetetuba PA 0,16 0,13 0,00 0,20 0,00 0,81 Ceará Abaiara CE 0,46 0,06 0,85 0,77 0,00 0,80 Bahia Abaíra BA 0,53 0,13 0,55 0,29 0,99 0,93 Bahia Abaré BA 0,21 0,11 0,00 0,42 0,00 0,88 Paraná Abatiá PR 0,46 0,27 0,52 0,19 0,80 0,61 Santa Abdon SC 0,69 0,09 0,86 0,90 0,80 0,93 Catarina Batista Pará Abel PA 0,51 0,22 0,60 0,88 0,22 0,80 Figueiredo Santa Abelardo SC 0,53 0,29 0,61 1,00 0,13 0,75 Catarina Luz Minas Gerais Abre Campo MG 0,41 0,35 0,67 0,48 0,00 0,69 Pernambuco Abreu e PE 0,36 0,22 0,71 0,32 0,00 0,83 Lima Tocantins Abreulândia TO 0,40 0,15 0,82 0,43 0,00 0,81 Minas Gerais Acaiaca MG 0,41 0,10 0,46 0,06 0,80 0,88 Maranhão Açailândia MA 0,45 0,26 0,73 0,61 0,09 0,67 Bahia Acajutiba Pará Acará PA 0,19 0,10 0,00 0,39 0,00 0,74 Ceará Acarape CE 0,27 0,09 0,41 0,36 0,00 0,76 Ceará Acaraú CE 0,39 0,18 0,58 0,52 0,00 1,00 Rio Grande Acari RN 0,54 0,12 0,46 0,44 0,96 0,89 do Norte Piauí Acauã PI 0,38 0,03 0,49 0,72 0,00 1,00 Rio Grande Aceguá RS 0,69 0,17 0,54 1,00 0,93 0,97 do Sul Ceará Acopiara CE 0,38 0,17 0,58 0,57 0,10 0,62 3. ANÁLISE DAS VARIÁVEIS 3.1 Variáveis Categóricas Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo pie chart e barras.

197 Variável: UF e UF2 Nossa amostra totaliza 26 unidades federativas e 1 distrito federal. As unidades federativas estão distribuídas em 5 regiões. Distribuição das Unidades Federativas em Regiões Sul 3; 11,5% Centro-Oeste 3; 11,5% Category Centro-Oeste Nordeste Norte Sudeste Sul Sudeste 4; 15,4% Nordeste 9; 34,6% Norte 7; 26,9% Variável: Munícipios Os gráficos abaixo nos ajudam a entender melhor o comportamento desta variável Distiribuição das cidades por região - População Sul 1191; 21,4% Centro-Oeste 468; 8,4% Category Centro-Oeste Nordeste Norte Sudeste Sul Nordeste 1790; 32,2% Sudeste 1669; 30,0% Norte 447; 8,0% No que diz respeito a relação regiões e cidades pode-se observar no gráfico acima que as regiões Nordeste (32,2%), Sudeste (30,0%) e Sul (21,4%) concentram 83, 6% dos municípios do território nacional, enquanto as demais regiões, Norte (8,0%) e Centro-Oeste (8,4%) somam apenas 16, 4% dos munícipios. Além da concentração dos municípios brasileiros, as três regiões tem em comum o fato de serem as três regiões banhadas

198 6 significativamente pelo oceano Atlântico. Fato este, que ajuda a entender a concentração nestas regiões.. Qtde de Cidades DF RR AP AC RO 0 Distribuição das Cidades por Unidades da Federação (ordem crescente) mediana RJ MS ES SE AM TO AL PI PB MA PE CE RN PA MT Unidades Federativas (UF2) SP RS BA PR SC GO 852 MG UF 2 A C A L A M A P BA C E DF ES GO MA MG MS MT PA PB PE PI PR RJ RN RO RR RS SC SE SP TO

199 7 3.2 VARIÁVEIS QUANTITATIVAS A análise deste tipo de variável permite a utilização de uma maior gama de ferramentas de análise como histogramas, curvas de densidade, gráfico de ramos, box-plot e dot-plot, além de informações numéricas como média, desvio-padrão, mediana, quartis, 5 números, intervalo de confiança e teste de normalidade de Anderson-Darling CORRELAÇÃO LINEAR CORRELAÇÃO DA VARIÁVEL IFGF E VARIÁVEIS RP, PES, INVEST, LIQ e CD. A matriz de correlação, apresentada abaixo, inclui o teste de significância P-Value. Nesta matriz foi relacionado, o índice de Pearson. Este índice de correlação não implica em haver uma relação de causa e efeito entre as variáveis. Para melhor apresentação dos dados na matriz, adotou-se o uso de abreviações para o desenvolvimento da matriz, a saber: IFGF (IFGF), Receita Própria (RP), Despesa com Pessoal (PES), Investimentos (INVEST), Custo da Dívida (CD) e Liquidez (LIQ). Correlations: IFGF; RP; PES; INVEST; LIQ; CD IFGF RP PES INVEST LIQ RP 0,463 0,000 PES 0,557 0,123 0,000 0,000 INVEST 0,602 0,074 0,201 0,000 0,000 0,000 LIQ 0,766 0,229 0,216 0,173 0,000 0,000 0,000 0,000 CD 0,138-0,146 0,080 0,038 0,043 0,000 0,000 0,000 0,004 0,001 Cell Contents: Pearson correlation P-Value As correlações marcadas em amarelo são significativas de acordo com o P-Value (para este trabalho consideraremos significativo P-Value >= 0,050). Apenas as variáveis INVEST e LIQ possuem um coeficiente de correlação satisfatoriamente forte com a variável dependente IFGF.

200 8 A correlação é sempre um número entre zero e um, e mede a intensidade de relações lineares. A correlação entre as variáveis analisadas é positiva praticamente em todos os casos. No que tange as correlações entre as variáveis da Gestão Fiscal dos munícipios, as que apresentam índices de correlação mais fortes e positivos, são entre as variáveis o IFGF e as demais variáveis, exceção feita ao Custo da Divida (CD), sendo as mais expressivas LIQ (Liquidez) e INVEST (Investimentos). Portanto, podemos afirmar que IFGF e as variáveis LIQ e INVEST são relações lineares DENDOGRAMA Um Dendrograma (dendr(o) = árvore) é um tipo específico de diagrama ou representação icônica que organiza determinados fatores e variáveis. É um diagrama de similaridade. A interpretação de um dendrograma de similaridade entre amostras fundamenta-se na intuição: duas amostras próximas devem ter também valores semelhantes para as variáveis medidas. Ou seja, elas devem ser próximas matematicamente no espaço multidimensional. Portanto, quanto maior a proximidade entre as medidas relativas às amostras, maior a similaridade entre elas o dendrograma hierarquiza esta similaridade de modo que podemos ter uma visão bidimensional da similaridade ou dissimilaridade de todo o conjunto de amostras utilizado no estudo. Segue abaixo o Dendrograma das variáveis analisadas: Figura 2 Dendograma das variáveis da Gestão Fiscal

201 9 Pode-se concluir pelo Dendograma que toda a variável, exceto CD (Custo da Dívida), tem um grau significativo de similaridade entre elas, sendo em ordem decrescente: IFGF (IFGF), Liquidez (LIQ), Investimentos (INVEST). Despesa com Pessoal (PES) e Receita Própria (RP). Podemos concluir então segundo esta visão do Dendograma, que a variável do primeiro grupo tem uma relação mais próxima da variável: IFGF (IFGF), Liquidez (LIQ), Investimentos (INVEST). Despesa com Pessoal (PES) e Receita Própria (RP).. Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,3036 0, ,0923 0, ,8700 0, ,1337 0, ,8961 0,

202 10 Dendrogram Single Linkage; Correlation Coefficient Distance 56,90 Similarity 71,26 85,63 100,00 IFGF Liquidez Investimentos Pessoal Receita Própria Custo da Dívida Variables Dendograma dos agrupamentos das variáveis por similaridade Neste gráfico pode-se visualizar que as variáveis que possuem um percentual de similaridade forte, na faixa de 80% são IFGF, LIQUIDEZ, INVESTIMENTOS E PESSOAL, que se encontram em um nível de similaridade pouco abaixo de 80% PRINCIPAIS COMPONENTES

203 11 Gráfico Loadin Plot com as variáveis de IFGF Podemos observar 3 grupos de dados sendo o primeiro composto pelas variáveis: Liquidez, Investimentos e Despesa com Pessoal, o segundo pela variável: Receita própria, e o terceiro pela variável: Custo da Divida. Scree Plot das variáveis de IFGF Existe um peso muito grande da primeira variável e as demais estão distantes. A variável 2 possui peso maior que 1, e as demais não dá para aproveitar pois estão abaixo de 1.

204 12 Principal Component Analysis: Receita Próp; Pessoal; Investimento; Liquidez; Custo de dívida Eigenanalysis of the Correlation Matrix Eigenvalue 1,5162 1,1371 0,8694 0,7758 0,7016. Proportion 0,303 0,227 0,174 0,155 0,140 Cumulative 0,303 0,531 0,705 0,860 1,000 (*) Eigenvalue maior que 1 (um) Variable PC1 PC2 PC3 PC4 Receita Própria 0,431 0,549 0,299-0,081 Pessoal 0,526-0,232-0,037 0,817 Investimentos 0,460-0,219-0,749-0,385 Liquidez 0,569 0,032 0,380-0,367 Custo da Dívida 0,042-0,772 0,452-0,209 Os gráficos abaixo apresentam uma visão tridimensional dos agrupamentos das colunas em 3 variáveis CP1, CP2 e CP3, e está agrupado por região. Dentro do minitab é possível movimentar o gráfico ou girá-lo em várias rotações, para encontrar a melhor visualização. Como os dados dos municípios são muito grandes (5565), dificulta um pouco a visualização.

205 13 4. DENDOGRAMA DE IFGF POR ESTADO (-DF) O Dendograma permite uma análise do grau de similaridade dos dados para geramos o Dendrograma de IFGF por Estado Dendograma da variável IFGF por estados do Brasil (classificação não supervisionada) Na figura acima podemos verificar três grandes grupos de variáveis, agrupadas pela similaridade dos dados. O nível de similaridade dos dados destes estados está entre 73,48 a 81,68%, conforme indicado na escala apresentada no eixo Y do gráfico. Os 3 grandes agrupamentos de dados, compostos pelos grupos de 5 a 9 estados do Brasil, além de cinco estados que ficaram isolados por não terem seus dados em similaridade com os outros estados. Estes estados isolados são: Goiás, Amazonas, Paraná, além da Paraíba e Pernambuco que apresentaram certa similaridade. Na classificação não supervisionada não se tem informações prévias sobre estes grupos. Não se tem informações sobre os por quês ou os critérios de agrupamento utilizados neste agrupamento. Podemos observar estados com alto nível de similaridade o que significa que a desigualdade é baixa. O menor nível de desigualdade se encontra nos estados mais próximos

206 14 do eixo X, por exemplo, Mato Grosso e Mato Grosso do Sul, que tem um nível de similaridade próximo de 92,88%. Mapa do Brasil representando os três grupos de estados por similaridades de IFGF (classificação não supervisionada) Quando o nível de desigualdade é baixo poderíamos erroneamente dizer que a situação é boa. Isso não é verdade. Baixa desigualdade não significa que as coisas vão bem, e sim que existe um padrão nos municípios do estado em termos de IFGF, uma maior similaridade entre estes municípios, e não é possível responder se esta similaridade é boa ou não. Na figura acima (figura 3) podemos observar o agrupamento por similaridade de IFGF do dendrograma no mapa político do Brasil.

207 ANÁLISES DAS VARIANCIAS DE LIQUIDEZ E IFGF POR UF ( DF) A análise das variâncias permite a verificação e visualização das médias e desvios padrões da variável a ser analisada. O gráfico BOXPLOT ilustra os agrupamentos, o seu tamanho (largura) varia de acordo com a quantidade de dados de cada grupo e amplitude dos dados (comprimento), e também é possível visualizar as ocorrências de outliers (marcas fora das caixas) dentro de um grupo de dados. Gráfico BOXPLOT de LIQUIDEZ por Unidade Federativa Pode-se visualizar no gráfico da figura 4, uma grande variabilidade sobre as médias de liquidez por unidades federativas. A UF que apresenta maior variabilidade dos dados é Acre. E o Rio Grande do Sul apresenta uma baixa variabilidade dos dados de liquidez, embora tenha muitos outliers (o maior de todos) que são os dados muito distantes das médias. O resultado deste comando não fica armazenado na base de dados, é necessário copiar da área session para a área worksheet, para cada variável gerada. Com isso tem-se os dados dos 5565 municípios do Brasil, resumidos pela média e pelo desvio padrão. A partir destes dados resumidos, fica mais fácil trabalhar os dados, uma vez que estando resumido se torna mais simples a sua manipulação e análise.

208 16 Gráfico BOXPLOT de IFGF por Unidade Federativa Podemos verificar na figura 5 que existe uma variação grande entre as médias das UFs do Brasil, no que diz respeito à IFGF. O tamanho das caixas de cada estado representa a variância dos dados de IFGF de cada UF, e os sinais * representam o outliers ou pontos fora da curva, que são dados ou muito acima ou abaixo da média dos dados do estado. O estado que apresenta a maior média de IFGF é também o Rio Grande do Sul (acima de 0,6579), e o estado que apresenta a menor média é Pará, pouco acima de 0,3604. Abaixo podemos visualizar os dados descritivos gerados pelo comando, para a variável IFGF e, na sequência, pela liquidez. One-way ANOVA: IFGF versus UF2 Source DF SS MS F P UF ,5810 1, ,53 0,000 Error ,1359 0,0147 Total ,7169 S = 0,1210 R-Sq = 33,34% R-Sq(adj) = 33,03% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev AC 22 0,4782 0,1469 (---*---) AL 101 0,4261 0,1260 (-*) AM 62 0,5373 0,1164 (--*-) AP 16 0,4687 0,1373 (----*----) BA 416 0,4302 0,1245 (*) CE 184 0,4723 0,1106 (*-)

209 17 ES 78 0,6003 0,1236 (-*-) GO 247 0,5211 0,1259 (*-) MA 217 0,4778 0,1177 (-*) MG 852 0,5269 0,1219 (*) MS 78 0,6129 0,1069 (-*-) MT 142 0,5961 0,1232 (-*) PA 142 0,4340 0,1254 (*-) PB 222 0,3605 0,1403 (*) PE 185 0,3889 0,1436 (*-) PI 223 0,4387 0,1200 (-*) PR 399 0,5381 0,1260 (*) RJ 92 0,6103 0,1189 (-*-) RN 167 0,4215 0,1220 (*-) RO 52 0,6110 0,0969 (--*--) RR 15 0,5300 0,0951 (----*----) RS 497 0,6579 0,0966 (*) SC 295 0,6484 0,1013 (*) SE 75 0,4292 0,1261 (--*-) SP 647 0,5965 0,1271 (* TO 138 0,5872 0,1235 (-*-) ,24 0,36 0,48 0,60 Pooled StDev = 0,1210 One-way ANOVA: Liquidez versus UF2 Source DF SS MS F P UF ,708 5,873 52,16 0,000 Error ,566 0,113 Total ,273 S = 0,3356 R-Sq = 19,67% R-Sq(adj) = 19,29% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev AC 22 0,4900 0,4254 (---*---) AL 101 0,5701 0,3498 (-*-) AM 62 0,6944 0,3493 (--*-) AP 16 0,5431 0,4026 (----*---) BA 416 0,4112 0,3619 (*) CE 184 0,3382 0,3003 (-*) ES 78 0,7490 0,2362 (-*--) GO 247 0,5982 0,3644 (*) MA 217 0,3574 0,3702 (*) MG 852 0,5086 0,3546 (* MS 78 0,7309 0,3222 (-*-) MT 142 0,7122 0,2921 (*-) PA 142 0,2875 0,3342 (*-) PB 222 0,3267 0,3626 (*-) PE 185 0,2934 0,3351 (*-) PI 223 0,4294 0,3816 (*-) PR 399 0,5773 0,3704 *) RJ 92 0,7050 0,3188 (-*-) RN 167 0,3163 0,3277 (*) RO 52 0,8375 0,2003 (--*--) RR 15 0,4433 0,3241 (----*----) RS 497 0,8415 0,2155 (*) SC 295 0,7900 0,2556 (-*) SE 75 0,5369 0,3428 (-*--) SP 647 0,6149 0,3581 (* TO 138 0,6392 0,3470 (*-) ,35 0,00 0,35 0,70 Pooled StDev = 0,3356

210 18 Assim como podemos observar nos gráficos de Boxplot, nas tabelas de dados, as unidades da federação que apresentam maior amplitude dos dados, ou seja, possuem alta variabilidade dos dados em relação à média, e os que se destacam nestes casos são: AC, PB e PE, enquanto as que apresentaram menor variabilidade do IFGF são: RS, SC e RO. No que tange a liquidez, os maiores desvios padrãos ficaram com os estados do AP e AC, enquanto os menores foram dos estados de RO e RS.. Observando ainda os dados descritivos, notamos que alguns estados possuem valores médios maiores do IFGF, como RS, e outros com menor média PB. O mesmo pode ser notado com os dados da liquidez, onde a maior média é do RS e a menor média é do AC. As análises comparativas dos dados permitem um resumo dos dados através de cálculos específicos como médias e desvios padrões, tornando a análise dos dados mais fácil e simples. Os gráficos de Boxplot e Dendograma são excelentes figuras visuais para que se possa analisar e interpretar os diferentes comportamentos dos dados. No dendograma pode-se analisar as similaridades dos dados e no Boxplot pode-se ver as relações entre as médias e as variâncias dos agrupamentos analisados. Trata-se de ferramentas úteis para análise de grandes volumes de dados. 5. ANÁLISE DISCRIMINANTE LINEAR POR REGIÃO A análise discriminante é uma técnica da estatística multivariada utilizada para discriminar e classificar objetos, e estuda a separação de objetos de uma população em duas ou mais classes. Neste caso queremos discriminar os valores de IFGF dos municípios do Brasil, e utilizaremos inicialmente a variável categórica Região. Para geração de análise discriminante utilizaremos o comando do Minitab: STAT >> MULTIVARIATE >> DISCRIMINANT ANALISYS Obtendo como resultado os seguintes dados: Discriminant Analysis: Região versus IFGF; Receita Própria;... After subtracting group means, IFGF is highly correlated with other predictors. After subtracting group means, Liquidez is highly correlated with other predictors. Linear Method for Response: Região Predictors: IFGF; Receita Própria; Pessoal; Investimentos; Liquidez; Custo da Dívida Group Centro-Oeste Nordeste Norte Sudeste Sul Count

211 19 Summary of classification True Group Put into Group Centro-Oeste Nordeste Norte Sudeste Sul Centro-Oeste Nordeste Norte Sudeste Sul Total N N correct Proportion 0,335 0,542 0,300 0,214 0,567 N = 5565 N Correct = 2295 Proportion Correct = 0,412 A região que errou mais é Sudeste (0,214 ou 21,4%) e a que acertou mais é o Sul (0,675 ou 67,5%). O gráfico exibe o cruzamento de dados entre as regiões. Por exemplo, a região Sudeste possui 1669 municípios e apenas 352 correspondem a região, sendo que 391 são semelhantes aos dados da região Sul. O nome desta matriz é confusion matrix ou matriz de confusão. Pode-se concluir que o agrupamento por região não é uma boa escolha segundo esta avaliação, pois o percentual de acerto é muito baixo ANÁLISE DISCRIMINANTE LINEAR POR 4 BRASIS Esta segunda análise está interessada em verificar os possíveis agrupamento de dados utilizando a variável 4 Brasis, calculada no exercício anterior, e demonstra os agrupamentos do Brasil segundo sua proximidade de dados de Gestão Fiscal. Em decorrência da análise do dendrograma do exercício anterior, chegou-se a quatro grupos por níveis de similaridade, os quais agrupam as unidades federativas como descritas abaixo: Grupo Unidades Federativas Obs. 1 AC, AL, SE, AP, MG, PI, BA Nível de similaridade é de 79,17% 2 CE, MA, RR, PA, RN Nível de similaridade é de 79,06% 3 ES, MS, MT, RJ, SP, RO, TO, RS, SC Nível de similaridade é de 81,68% 4 GO, AM, PB, PE, PR São as UF que não formaram clusters, similaridade um pouco maior que 73%. Seguindo o procedimento descrito no item anterior no MiniTab, encontrou-se o seguinte resultado: Discriminant Analysis: 4Brasis versus IFGF; Receita Própria;... After subtracting group means, IFGF is highly correlated with other predictors. After subtracting group means, Liquidez is highly correlated with other predictors. Linear Method for Response: 4Brasis

212 20 Predictors: IFGF; Receita Própria; Pessoal; Investimentos; Liquidez; Custo da Dívida Group Count cases used, 1 cases contain missing values Summary of classification True Group Put into Group Total N N correct Proportion 0,260 0,546 0,680 0,299 N = 5564 N Correct = 2545 Proportion Correct = 0,457 Apesar do maior nível de similaridade geral, 45,7%, dos 4Brasis quando comparado com a das Regiões, o nível de similaridade contínua muito baixo, principalmente, nos grupos 1 e 4, respectivamente, 26% e 29,9% ANÁLISE DISCRIMINANTE LINEAR POR 3 BRASIS Esta terceira análise está interessada em verificar os possíveis agrupamento de dados utilizando a variável 4 Brasis, reduzidas em 3Brasis, calculada com base nos dados do item anterior, ela demonstra os agrupamentos do Brasil segundo sua proximidade de dados de Gestão Fiscal. Em decorrência da análise dos dados do item anterior, chegou-se a 3 grupos por níveis de similaridade, agrupando o grupo 1 e 4, cujos o nível de acerto foram os mais baixos. As unidades federativas ficaram distribuídas em 3 grupos como descritas abaixo: Grupo Unidades Federativas Obs. 1 AC, AL, SE, AP, MG, PI, BA - GO, AM, PB, PE, PR Nível de similaridade entre 73% e 79,17% 2 CE, MA, RR, PA, RN Nível de similaridade é de 79,06% 3 ES, MS, MT, RJ, SP, RO, TO, RS, SC Nível de similaridade é de 81,68% Seguindo o procedimento descrito nos itens anteriores no MiniTab, encontramos o seguinte resultado: Discriminant Analysis: test versus IFGF; Receita Própria;...

213 21 After subtracting group means, IFGF is highly correlated with other predictors. After subtracting group means, Liquidez is highly correlated with other predictors. Linear Method for Response: test Predictors: IFGF; Receita Própria; Pessoal; Investimentos; Liquidez; Custo da Dívida Group Count cases used, 1 cases contain missing values Summary of classification True Group Put into Group Total N N correct Proportion 0,401 0,603 0,721 N = 5564 N Correct = 3025 Proportion Correct = 0,544 A tarefa da análise discriminante é encontrar a melhor função discriminante linear de um conjunto de variáveis que reproduza, tanto quanto possível, um agrupamento a priori de casos considerados. Um procedimento em passos é utilizado nesse programa, e em cada passo a variável mais poderosa é introduzida na função discriminante. A função critério para selecionar a próxima variável depende do número de grupos especificados (o número de grupos varia de 2 a 20). Quando o número de variáveis é maior do que dois, então o critério de seleção de variáveis é o traço do produto da matriz de covariância para as variáveis envolvidas e a matriz de covariância interclasse em um passo particular. Os cálculos podem ser realizados em toda a população ou em amostra de dados ou mesmo em dados previamente agrupados. Nos nossos exemplos com as variáveis de gestão fiscal, utiliza-se a análise discriminante linear e conseguimos um resultado de 54,4% de proporção correta.

214 22 6. REGRESSÃO LOGÍSTICA Stat >> Regression >> Nominal Logistical Regression Nominal Logistic Regression: Região versus IFGF; Receita Própria;... Response Information Variable Value Count Região Sul 1191 (Reference Event) Sudeste 1669 Norte 447 Nordeste 1790 Centro-Oeste 468 Total 5565 Logistic Regression Table Predictor Coef SE Coef Z P Odds Ratio Logit 1: (Sudeste/Sul) Constant 0, , ,42 0,015 IFGF -6, , ,90 0,370 0,00 Receita Própria 2, , ,65 0,098 13,70 Pessoal -2, , ,38 0,167 0,10 Investimentos 1, , ,73 0,466 3,14 Liquidez -0, , ,13 0,898 0,82 Custo da Dívida 4, , ,46 0,000 73,64 Logit 2: (Norte/Sul) Constant 0, , ,28 0,780 IFGF 21,0740 8, ,62 0,009 1,42009E+09 Receita Própria -7, , ,33 0,000 0,00 Pessoal -9, , ,99 0,000 0,00 Investimentos -5, , ,86 0,004 0,01 Liquidez -6, , ,42 0,001 0,00 Custo da Dívida 2, , ,38 0,017 10,19 Logit 3: (Nordeste/Sul) Constant 5, , ,85 0,000 IFGF -10,8124 6, ,59 0,113 0,00 Receita Própria -4, , ,87 0,004 0,01 Pessoal -3, , ,00 0,046 0,04 Investimentos 0, , ,39 0,700 1,79 Liquidez 0, , ,08 0,935 1,13 Custo da Dívida 3, , ,23 0,000 27,49 Logit 4: (Centro-Oeste/Sul) Constant -1, , ,22 0,001 IFGF 2, , ,23 0,816 7,78 Receita Própria 0, , ,16 0,875 1,36 Pessoal -4, , ,16 0,031 0,01 Investimentos -2, , ,02 0,306 0,13 Liquidez -1, , ,64 0,522 0,29 Custo da Dívida 5, , ,01 0, ,26

215 23 95% CI Predictor Lower Upper Logit 1: (Sudeste/Sul) Constant IFGF 0, ,08 Receita Própria 0,62 304,09 Pessoal 0,00 2,58 Investimentos 0,14 68,39 Liquidez 0,04 17,63 Custo da Dívida 15,71 345,09 Logit 2: (Norte/Sul) Constant IFGF 206,61 9,76062E+15 Receita Própria 0,00 0,01 Pessoal 0,00 0,00 Investimentos 0,00 0,20 Liquidez 0,00 0,08 Custo da Dívida 1,51 68,98 Logit 3: (Nordeste/Sul) Constant IFGF 0,00 12,76 Receita Própria 0,00 0,24 Pessoal 0,00 0,94 Investimentos 0,09 34,79 Liquidez 0,06 21,70 Custo da Dívida 5,93 127,46 Logit 4: (Centro-Oeste/Sul) Constant IFGF 0,00 2,52569E+08 Receita Própria 0,03 64,83 Pessoal 0,00 0,66 Investimentos 0,00 6,30 Liquidez 0,01 13,04 Custo da Dívida 23, ,57 Log-Likelihood = -6845,829 Test that all slopes are zero: G = 2632,996, DF = 24, P-Value = 0,000 Enquanto método de predição para variáveis categóricas, a regressão logística é comparável às técnicas supervisionadas propostas em aprendizagem automática (árvores de decisão, redes neuronais, etc.), ou ainda a análise discriminante preditiva em estatística exploratória. É possível de colocá-la em concorrência para escolha do modelo mais adaptado para certo problema preditivo a resolver. 7. ANÁLISE DE CORRESPONDÊNCIA DAS VARIÁVEIS DE GESTÃO FISCAL Nesta análise serão trabalhados os estados e as médias dos indicadores de gestão fiscal por unidades federativas (-DF). Na análise de correspondência será gerado um mapa contendo quais estados estão mais próximos e quais variáveis tem a ver entre si. O comando para gerar o gráfico é: STAT >> MULTIVARIATE >> SIMPLE CORRESPONDENCE ANALISYS

216 24 Nesta análise trabalhamos com as variáveis IFGF (If), Receita Própria (R), Despesas com Pessoal (P), Investimentos (I), Liquidez (L), e Custo da Dívida (C), representadas pelos quadrados azuis. Os círculos vermelhos são as médias das variáveis de gestão fiscal por estado, e podem ser identificados pela sigla. Observa-se Tocantins, e Minas Gerais levemente afastada, ocupando uma posição central no gráfico, e a esquerda, em torno do eixo X, um agrupamento de estados (RO, MT, MS, GO, RS, SC, PR, ES, SP, RJ), predominantemente das regiões Centro-oeste, Sul e Sudeste, exceção feita a Rondônia, os quais ficam equidistantes de três indicadores (If, L e R), e no lado direito do gráfico, muito mais disperso, os demais estados, sendo estes da região Norte e Nordeste, próximos dos outros três indicadores (I, P e C).

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo

Leia mais

ATLAS BRASIL 2013 DIMENSÕES DEMOGRAFIA E HABITAÇÃO

ATLAS BRASIL 2013 DIMENSÕES DEMOGRAFIA E HABITAÇÃO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÕES DEMOGRAFIA E HABITAÇÃO Disciplina: Métodos Quantitativos Professor:

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados

Leia mais

ATLAS BRASIL 2013 ALGUMAS VARIÁVEIS DA DIMENSÃO EDUCAÇÃO

ATLAS BRASIL 2013 ALGUMAS VARIÁVEIS DA DIMENSÃO EDUCAÇÃO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 ALGUMAS VARIÁVEIS DA DIMENSÃO EDUCAÇÃO Disciplina: Métodos Quantitativos

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO Disciplina: Métodos Quantitativos Professor:

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE Disciplina: Métodos Quantitativos Professor:

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP MÉTODOS QUANTITATIVOS DE PESQUISA EMPÍRICA Prof. Dr. ARNOLDO HOYOS ENADE 9 Exame Nacional de Desempenho de Estudantes Instituições do Ensino Superior

Leia mais

ATLAS BRASIL 2013 ANALISE DE ALGUMAS DIMENSÕES DO ATLAS E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 ANALISE DE ALGUMAS DIMENSÕES DO ATLAS E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 213 ANALISE DE ALGUMAS DIMENSÕES DO ATLAS E OUTRAS VARIÁVEIS Disciplina: Métodos

Leia mais

REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL

REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA Faculdade de Economia e Administração Programa de Estudos Pós Graduados em Administração REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL Disciplina:

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

CLASSIFICAÇÃO DO BRASIL. Focando principalmente indicadores relacionados a habitação, educação, trabalho e muito particularmente SAÚDE

CLASSIFICAÇÃO DO BRASIL. Focando principalmente indicadores relacionados a habitação, educação, trabalho e muito particularmente SAÚDE PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados a habitação, educação, trabalho

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

UM ESTUDO DAS RELAÇÕES ENTRE INDICADORES DE DESENVOVLIMENTO HUMANO-HDI E INDICADORES DE INOVAÇÃO-GII

UM ESTUDO DAS RELAÇÕES ENTRE INDICADORES DE DESENVOVLIMENTO HUMANO-HDI E INDICADORES DE INOVAÇÃO-GII PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UM ESTUDO DAS RELAÇÕES ENTRE INDICADORES DE DESENVOVLIMENTO HUMANO-HDI E INDICADORES DE INOVAÇÃO-GII

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

ATLAS BRASIL 2013 DIMENSÃO GESTÃO FISCAL DOS MUNICÍPIOS

ATLAS BRASIL 2013 DIMENSÃO GESTÃO FISCAL DOS MUNICÍPIOS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO GESTÃO FISCAL DOS MUNICÍPIOS Disciplina: Métodos Quantitativos

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados

Leia mais

ATLAS BRASIL 2013 DIMENSÃO RENDA

ATLAS BRASIL 2013 DIMENSÃO RENDA PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO RENDA Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração METODOS QUANTITATIVOS TRABALHO FINAL Análise de indicadores

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO. Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO. Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO:

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando

Leia mais

CLASSIFICAÇÃO DO BRASIL. Focando principalmente indicadores relacionados a. habitação, educação, trabalho e muito particularmente o

CLASSIFICAÇÃO DO BRASIL. Focando principalmente indicadores relacionados a. habitação, educação, trabalho e muito particularmente o PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

PONTÍFICA UNIVERSIDADE CATÓLICA DE SÃO PAULO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO/ PUC-SP

PONTÍFICA UNIVERSIDADE CATÓLICA DE SÃO PAULO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO/ PUC-SP PONTÍFICA UNIVERSIDADE CATÓLICA DE SÃO PAULO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO/ PUC-SP MÉTODOS QUANTITAIVOS TRABALHO FINAL º SEMESTRE PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA

Leia mais

UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS

UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS Aluna: Erika Camila Buzo

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO ARVORES DE DECISÃO E INDICADORES DE GOVERANÇA MUNDIAL

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO ARVORES DE DECISÃO E INDICADORES DE GOVERANÇA MUNDIAL PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO ARVORES DE DECISÃO E INDICADORES DE GOVERANÇA MUNDIAL Beatriz Marcos Telles Maria Carolina Mirabella Belloque Mestrado em Administração Empresas Disciplina

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL focando principalmente indicadores

Leia mais

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos Professor:

Leia mais

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES

Leia mais

Tabela 2: PIB Brasil e unidades da federação a preços constantes - R$ de 2000(mil) - Deflacionado pelo Deflator Implícito do PIB nacional

Tabela 2: PIB Brasil e unidades da federação a preços constantes - R$ de 2000(mil) - Deflacionado pelo Deflator Implícito do PIB nacional 56 ANEXOS Tabela 1: Investimentos em Educação e Cultura dos Estados da Região Norte do Brasil 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 AC 41,14 82,62924 97,71488217 112,0076867 169,2800564

Leia mais

CAEN-UFC RELATÓRIO DE PESQUISA Nº 02

CAEN-UFC RELATÓRIO DE PESQUISA Nº 02 RELATÓRIO DE PESQUISA Nº 02 EVOLUÇÃO DOS INDICADORES DE RENDA, DESIGUALDADE E POBREZA PARA O CEARÁ E REGIÃO METROPOLITANA DE FORTALEZA Uma Visão Comparativa Nacional Pós-Plano Real Autores da Pesquisa

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

Evolução das estatísticas de acidentes por Estado

Evolução das estatísticas de acidentes por Estado Evolução das estatísticas de acidentes por Estado Data: 1/8/218 FILTROS: Acidentes: Todos Veículos: Todos Valores: Absolutos Estado: Todos BR: Todas Este material destaca a evolução das estatísticas de

Leia mais

PROCESSO SELETIVO UFAL SiSU GERAL (5.168 vagas ofertadas)

PROCESSO SELETIVO UFAL SiSU GERAL (5.168 vagas ofertadas) PROCESSO SELETIVO UFAL 2014 - SiSU 2014.1 - GERAL (5.168 vagas ofertadas) ALAGOAS AL 2.918 56,46% BAHIA BA 306 5,92% SERGIPE SE 96 1,86% PERNAMBUCO PE 627 12,13% PARAÍBA PB 24 0,46% RIO GRANDE DO NORTE

Leia mais

FONTE DE DADOS. Cadastro Nacional de Estabelecimentos de Saúde: Dados de todos os estabelecimentos de saúde do Brasil.

FONTE DE DADOS. Cadastro Nacional de Estabelecimentos de Saúde: Dados de todos os estabelecimentos de saúde do Brasil. CENSO AMIB 2016 OBJETIVO O objetivo desta proposta é prestar serviços de consultoria para a extração e análise de dados do CNES a respeito de leitos de UTI e profissionais da saúde intensivistas, bem como

Leia mais

ATLAS BRASIL 2013 DIMENSÃO LIBERDADE ECONÔMICA

ATLAS BRASIL 2013 DIMENSÃO LIBERDADE ECONÔMICA PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO LIBERDADE ECONÔMICA Disciplina: Métodos Quantitativos Professor:

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

Empoderando vidas. Fortalecendo nações.

Empoderando vidas. Fortalecendo nações. Empoderando vidas. Fortalecendo nações. INTRODUÇÃO O Atlas do Desenvolvimento Humano no Brasil é baseado exclusivamente nos Censos Demográficos, realizados de 10 em 10 anos, pelo Instituto Brasileiro de

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados a habitação, trabalho, saúde e muito particularmente EDUCAÇÃO.

CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados a habitação, trabalho, saúde e muito particularmente EDUCAÇÃO. PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados

Leia mais

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO Aluno: Claudemir

Leia mais

ANEXO I BICICLETA ESCOLAR. Modelo de ofício para adesão à ata de registro de preços (GRUPO 1)

ANEXO I BICICLETA ESCOLAR. Modelo de ofício para adesão à ata de registro de preços (GRUPO 1) ANEXO I BICICLETA ESCOLAR Modelo de ofício para adesão à ata de registro de preços (GRUPO 1) Assunto: Adesão à ata de registro de preços nº 70/2010 do pregão eletrônico nº 40/2010. 1 2 BICICLETA 20 - AC,

Leia mais

Números revelam avanços e desafios

Números revelam avanços e desafios dados e indicadores Números revelam avanços e desafios Mais de 70% dos municípios brasileiros conseguiram alcançar ou superar as metas estabelecidas pelo Inep/MEC no último biênio. Essa evolução teve reflexos

Leia mais

CLASSIFICAÇÃO DE PAISES CONFORME INDICADORES DA LIBERDADE ECONÔMICA E DE DIREITO DE PROPRIEDADE OTÁVIA T. M. SALA

CLASSIFICAÇÃO DE PAISES CONFORME INDICADORES DA LIBERDADE ECONÔMICA E DE DIREITO DE PROPRIEDADE OTÁVIA T. M. SALA CLASSIFICAÇÃO DE PAISES CONFORME INDICADORES DA LIBERDADE ECONÔMICA E DE DIREITO DE PROPRIEDADE OTÁVIA T. M. SALA PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

1. Porcentagem de estudantes com aprendizado adequado em Língua Portuguesa e Matemática nível Brasil, Unidades da Federação e Municípios

1. Porcentagem de estudantes com aprendizado adequado em Língua Portuguesa e Matemática nível Brasil, Unidades da Federação e Municípios 1. Porcentagem de estudantes com aprendizado adequado em Língua Portuguesa e Matemática nível Brasil, Unidades da Federação e Municípios 2. Porcentagem de estudantes com aprendizado adequado em Língua

Leia mais

8ª Pesquisa Nacional de Ataques a Bancos (2014)

8ª Pesquisa Nacional de Ataques a Bancos (2014) 8ª Pesquisa Nacional de Ataques a Bancos (2014) Elaboração: Contraf-CUT, CNTV e Federação dos Vigilantes do Paraná Fonte: Notícias da imprensa, SSP e sindicatos Apoio: Sindicato dos Vigilantes de Curitiba

Leia mais

Estudo. Desenvolvimento habitacional e políticas públicas. Fernando Garcia, Ana Maria Castelo e Euclides Pedrozo

Estudo. Desenvolvimento habitacional e políticas públicas. Fernando Garcia, Ana Maria Castelo e Euclides Pedrozo Estudo Desenvolvimento habitacional e políticas públicas Fernando Garcia, Ana Maria Castelo e Euclides Pedrozo Publicadas as bases de dados que geram as estatísticas de condições de moradia no país, revela-se

Leia mais

Mortos e Acidentes por Unidade Federativa

Mortos e Acidentes por Unidade Federativa e Acidentes por Unidade Federativa - 2016 Data: 23/05/2017 FILTROS: Veículos: Todos, Caminhões, Ônibus Valores: Absolutos Estado: Todos BR: Todas Estados com maior número de mortes e acidentes - 2016 Este

Leia mais

SECRETARIA DE EDUCAÇÃO BÁSICA MEC

SECRETARIA DE EDUCAÇÃO BÁSICA MEC SECRETARIA DE EDUCAÇÃO BÁSICA MEC A EVOLUÇÃO DA EDUCAÇÃO BÁSICA O movimento Constitucional; O processo de discussão que antecedeu a LDB nº9394/96; A concepção de Educação Básica e a universalização do

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL focando

Leia mais

Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua. Mercado de Trabalho Brasileiro 1º trimestre de de maio de 2018

Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua. Mercado de Trabalho Brasileiro 1º trimestre de de maio de 2018 Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua Mercado de Trabalho Brasileiro 1º trimestre de 2018 17 de maio de 2018 P R I N C I P A L O B J E T I V O Produzir informações contínuas

Leia mais

UM ESTUDO DO ICUR ÍNDICE DE COMPETITIVIDADE URBANA DE 2010 BASEADO EM ANALISE DE CONGLOMERADOS

UM ESTUDO DO ICUR ÍNDICE DE COMPETITIVIDADE URBANA DE 2010 BASEADO EM ANALISE DE CONGLOMERADOS Pontifícia Universidade Católica de São Paulo PUC/SP Programa Strictu Sensu Mestrado em Administração Disciplina: Método Quantitativos na Pesquisa Empírica Prof. Dr. Arnoldo Hoyos Guevara UM ESTUDO DO

Leia mais

7ª Pesquisa Nacional de Ataques a Bancos. (1º semestre de 2014)

7ª Pesquisa Nacional de Ataques a Bancos. (1º semestre de 2014) 7ª Pesquisa Nacional de Ataques a Bancos (1º semestre de 2014) Elaboração: Contraf-CUT, CNTV e Federação dos Vigilantes do Paraná Fonte: Notícias da imprensa, SSP e sindicatos Apoio: Sindicato dos Vigilantes

Leia mais

4ª Pesquisa Nacional de Ataques a Bancos 2012

4ª Pesquisa Nacional de Ataques a Bancos 2012 4ª Pesquisa Nacional de Ataques a Bancos 2012 Fonte: Notícias da imprensa, SSP e sindicatos Apoio: Sindicato dos Vigilantes de Curitiba e Região Sindicato dos Bancários de Curitiba e Região Fetec-CUT(PR)

Leia mais

Educação Superior Enade e IGC dos Estados e DF

Educação Superior Enade e IGC dos Estados e DF Educação Superior Enade e IGC dos Estados e DF Enade 2015 O Conceito Enade é um indicador de qualidade que avalia o desempenho dos estudantes a partir dos resultados obtidos anualmente para os cursos que

Leia mais

PROJETO ORIBER. TEMA: Bem Estar e Qualidade de Vida ANÁLISE DISCRIMINANTE

PROJETO ORIBER. TEMA: Bem Estar e Qualidade de Vida ANÁLISE DISCRIMINANTE PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PROJETO ORIBER TEMA: Bem Estar e Qualidade de Vida ANÁLISE DISCRIMINANTE

Leia mais

Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua. Rio de Janeiro, 23 de fevereiro de 2017

Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua. Rio de Janeiro, 23 de fevereiro de 2017 Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua Rio de Janeiro, 23 de fevereiro de 2017 P R I N C I P A L O PNAD Contínua B J E T I Produzir informações contínuas Sobre a inserção da

Leia mais

MERCADO BRASILEIRO DE SUPLEMENTOS MINERIAS 2014

MERCADO BRASILEIRO DE SUPLEMENTOS MINERIAS 2014 MERCADO BRASILEIRO DE SUPLEMENTOS MINERIAS 2014 ASSOCIAÇÃO BRASILEIRA DAS INDUSTRIAS DE SUPLEMENTOS MINERAIS RUA AUGUSTA, 2676 13 ANDAR SALA 132 CEP 01412-100 SÃO PAULO SP Telefone: (011) 3061-9077 e-mail:

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA José Evandeilton Lopes GRR20096740 CE083 - ESTATÍSTICA COMPUTACIONAL Análise descritiva dos dados de fecundação do Brasil no ano 1991 e das rendas

Leia mais

Renato Almeida Santos

Renato Almeida Santos ÍNDICE DE ANÁLISE DE ADERÊNCIA À ÉTICA ORGANIZACIONAL UM ESTUDO SOBRE AS SUAS RELAÇÕES Renato Almeida Santos PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa

Leia mais

UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL

UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL LOURENÇO AUGUSTO C. GRANATO PONTIFÍCIA UNIVERSIDADE CATÓLICA

Leia mais

Estado de São Paulo tem a maior quantidade de POS a cada mil habitantes; Maranhão, a menor

Estado de São Paulo tem a maior quantidade de POS a cada mil habitantes; Maranhão, a menor INFORMATIVO PARA A IMPRENSA ML&A Comunicações Fernanda Elen fernanda@mla.com.br (11) 3811-2820 ramal 833 Cresce a aceitação de cartões em 2015, aponta a Boanerges & Cia. Estado de São Paulo tem a maior

Leia mais

ÍNDICE DE TRANSPARÊNCIA DO CONTENCIOSO ADMINISTRATIVO TRIBUTÁRIO DOS ESTADOS BRASILEIROS

ÍNDICE DE TRANSPARÊNCIA DO CONTENCIOSO ADMINISTRATIVO TRIBUTÁRIO DOS ESTADOS BRASILEIROS icat 15.5.213 ÍNDICE DE TRANSPARÊNCIA DO CONTENCIOSO ADMINISTRATIVO TRIBUTÁRIO DOS ESTADOS BRASILEIROS PONTUAÇÃO RESULTADO DOS ESTADOS BRASILEIROS 6 5 4 3 2 1 AC AL AP AM BA CE DF GO ES MA MT MS MG PA

Leia mais

Racionamento de água. Abril/2017

Racionamento de água. Abril/2017 Racionamento de água Abril/2017 Objetivo da Pesquisa Metodologia Tópicos da Pesquisa Informações técnicas Levantar informações sobre temas importantes no contexto atual dos Pequenos Negócios. TEMA ANALISADO

Leia mais

CONFEDERAÇÃO BRASILEIRA DE FUTEBOL

CONFEDERAÇÃO BRASILEIRA DE FUTEBOL CAMPEONATO BRASILEIRO DA SÉRIE D TABELA BÁSICA / EDIÇÃO 2016 PRIMEIRA FASE REF ROD DATA - DIA HORA GR JOGO ESTÁDIO CIDADE 1ª 12/06 - Dom A1 Rondônia RO x Amazonas AM A1 Acre AC x Amapá AP A2 Tocantins

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO CLASSIFICAÇÃO DO BRASIL. em base a Indicadores Municipais. ISDM/FGV, IFDM e IFGF/FIRJAN.

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO CLASSIFICAÇÃO DO BRASIL. em base a Indicadores Municipais. ISDM/FGV, IFDM e IFGF/FIRJAN. BA STA BOLETIM DE ANÁLISE ESTATÍSTICO CLASSIFICAÇÃO DO BRASIL em base a Indicadores Municipais ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 v1 Classificação do Brasil focando principalmente indicadores relacionados

Leia mais

Rio de Janeiro, 18/05/2017. Mercado de Trabalho Brasileiro 1º trimestre de 2017

Rio de Janeiro, 18/05/2017. Mercado de Trabalho Brasileiro 1º trimestre de 2017 1 Rio de Janeiro, 18/05/2017 Mercado de Trabalho Brasileiro estre de 2017 O B J P R I N C I P A L Produzir informações contínuas PNAD Contínua Produzir informações anuais E T I sobre a inserção da população

Leia mais

Programa Nacional de Suplementação de Vitamina A Divulgação dos resultados parciais do programa em 2013.

Programa Nacional de Suplementação de Vitamina A Divulgação dos resultados parciais do programa em 2013. Programa Nacional de Suplementação de Vitamina A Divulgação dos resultados parciais do programa em 2013. O Programa Nacional de Suplementação de Vitamina A tem por objetivo a prevenção e controle da hipovitaminose

Leia mais

IMPACTOS DO PROGRAMA DE ACELERAÇÃO

IMPACTOS DO PROGRAMA DE ACELERAÇÃO DOI: http://dx.doi.org/10.21452/rde.v14i25.1940 IMPACTOS DO PROGRAMA DE ACELERAÇÃO DO CRESCIMENTO SOBRE O DESENVOLVIMENTO ECONÔMICO NO BRASIL ROSEMEIRY MELO CARVALHO 1 JOSÉ CESAR VIEIRA PINHEIRO 2 Resumo

Leia mais

Caracterização do território

Caracterização do território Itapema, SC Caracterização do território Dados do mapa 2016 Google Informar erro no mapa Área 55,67 km² IDHM 2010 0,796 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 45.797 hab. Densidade

Leia mais

TÊNIS DE MESA Nº 03 04/09/2015

TÊNIS DE MESA Nº 03 04/09/2015 ! TÊNIS DE MESA Nº 03 04/09/2015! Jogos Escolares da Juventude 2015 12 a 14 anos Boletim Oficial de Resultados 04/09/2015 CENTRO DE FORMAÇÃO OLÍMPICA - QUADRA 1 TÊNIS DE MESA - EQUIPE - Feminino 1 09:00

Leia mais

Movimentação das Empresas do Segmento Julho 2011

Movimentação das Empresas do Segmento Julho 2011 Movimentação das Empresas do Segmento Julho 2011 Índice 1. Consolidado Brasil... 03 2. Acumulado Brasil... 06 3. Consolidado por Região... 08 4. Consolidado por Estado... 14 5. Consolidado Brasil Comparativo

Leia mais

Movimentação das Empresas do Segmento Abril 2011

Movimentação das Empresas do Segmento Abril 2011 Movimentação das Empresas do Segmento Abril 2011 Índice 1. Consolidado Brasil... 03 2. Acumulado Brasil... 06 3. Consolidado por Região... 08 4. Consolidado por Estado... 14 5. Consolidado Brasil Comparativo

Leia mais

TABELA I - OPERAÇÕES REALIZADAS PELAS DISTRIBUIDORAS

TABELA I - OPERAÇÕES REALIZADAS PELAS DISTRIBUIDORAS TABELA I - OPERAÇÕES REALIZADAS PELAS DISTRIBUIDORAS UF Gasolina Automotiva e Álcool Anidro Álcool Hidratado Óleo Combustível Gás Natural Veicular Internas Interesta-duais Internas Interestaduais Internas

Leia mais

Pesquisa Hábitos de Consumo Dia Mundial do Consumidor Copyright Boa Vista SCPC 1

Pesquisa Hábitos de Consumo Dia Mundial do Consumidor Copyright Boa Vista SCPC 1 Pesquisa Hábitos de Consumo Dia Mundial do Consumidor 0 0 Copyright Boa Vista SCPC Índice o Objetivo, metodologia e amostra... 0 o Perfil dos respondentes... 0 o Percepção da Economia Brasileira (0 contra

Leia mais

Planilha1 FUNC PROGRAMATICA PROGRAMA/ACAO/SUBTITULO/PRODUTO S N P O U T VALOR 0909 OPERACOES ESPECIAIS: OUTROS ENCARGOS ESPECIAIS

Planilha1 FUNC PROGRAMATICA PROGRAMA/ACAO/SUBTITULO/PRODUTO S N P O U T VALOR 0909 OPERACOES ESPECIAIS: OUTROS ENCARGOS ESPECIAIS ORGAO : 32000 - MINISTERIO DE MINAS E ENERGIA UNIDADE : 32265 - AGENCIA NACIONAL DO PETROLEO, GAS NATURAL E BIOCOMBUSTIVEIS - ANP 0909 OPERACOES ESPECIAIS: OUTROS ENCARGOS ESPECIAIS 178435832 OPERACOES

Leia mais

Nota de Acompanhamento de Beneficiários Edição: Nº Data base: Junho de 2018

Nota de Acompanhamento de Beneficiários Edição: Nº Data base: Junho de 2018 Nota de Acompanhamento de Beneficiários Edição: Nº 25-2018 Data base: Junho de 2018 Sumário Executivo Número de beneficiários de planos médico-hospitalares (Jun/18): 47.236.348; Variação do número de beneficiários

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

Metas Educacionais As 5 Metas do Todos Pela Educação. Rio de Janeiro, 27 de abril de 2009

Metas Educacionais As 5 Metas do Todos Pela Educação. Rio de Janeiro, 27 de abril de 2009 s Educacionais As 5 s do Todos Pela Educação Rio de Janeiro, 27 de abril de 2009 Construção das metas Pesquisa do meio copo cheio : consensos para avançar Documento de mobilização inicial Entrevistas e

Leia mais

Estatísticas sobre Analfabetismo no Brasil

Estatísticas sobre Analfabetismo no Brasil Ministério da Educação Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira Estatísticas sobre Analfabetismo no Brasil Audiência pública Comissão de Direitos Humanos e Legislação Participativa

Leia mais

6ª Pesquisa Nacional de Ataques a Bancos (2013)

6ª Pesquisa Nacional de Ataques a Bancos (2013) 6ª Pesquisa Nacional de Ataques a Bancos (2013) Elaboração: Contraf-CUT, CNTV e Federação dos Vigilantes do Paraná Fonte: Notícias da imprensa, SSP e sindicatos Apoio: Sindicato dos Vigilantes de Curitiba

Leia mais

UNIVERSIDADE FEDERAL DO VALE DO SÃO FRANCISCO SECRETARIA DE REGISTRO E CONTROLE ACADÊMICO SRCA

UNIVERSIDADE FEDERAL DO VALE DO SÃO FRANCISCO SECRETARIA DE REGISTRO E CONTROLE ACADÊMICO SRCA Estatísticas 2010 1 EQUIPE: SECRETÁRIO DE REGISTRO E CONTROLE ACADÊMICO Prof. D. Sc. Luiz Mariano Pereira COORD. DE REGISTRO ACADÊMICO CRA Alane Pereira de Oliveira COORD. DE ADMINISTRAÇÃO DA SRCA CAD

Leia mais

TRANSPORTE RODOVIÁRIO DE CARGAS: Análise do processo de consolidação e transferência de cargas via unidade centralizadora Um Estudo de Caso

TRANSPORTE RODOVIÁRIO DE CARGAS: Análise do processo de consolidação e transferência de cargas via unidade centralizadora Um Estudo de Caso UNIVERSIDADE FEDERAL DE MINAS GERAIS ESCOLA DE ENGENHARIA DEPARTAMENTO DE ENGENHARIA DE TRANSPORTES E GEOTECNIA CURSO DE ESPECIALIZAÇÃO EM LOGÍSTICA ESTRATÉGICA E SISTEMAS DE TRANSPORTE TRANSPORTE RODOVIÁRIO

Leia mais

Nova Pesquisa Nacional de Ataques a Bancos

Nova Pesquisa Nacional de Ataques a Bancos Nova Pesquisa Nacional de Ataques a Bancos (e outras ocorrências envolvendo a atividade bancária) (2017-2018) Elaboração: Contraf-CUT e CONTRASP Fonte: Notícias da imprensa, SSP dos Estados e Sindicatos

Leia mais

JOVENS AUTORIDADES LOCAIS NO BRASIL Área Técnica de Cultura/CNM Setembro de Introdução

JOVENS AUTORIDADES LOCAIS NO BRASIL Área Técnica de Cultura/CNM Setembro de Introdução JOVENS AUTORIDADES LOCAIS NO BRASIL Área Técnica de Cultura/CNM Setembro de 2018 1. Introdução O estudo Jovens Autoridades Locais no Brasil trata do universo de prefeitos, prefeitas, e vereadoras eleitos,

Leia mais

Impactos da Crise Financeira Internacional nas MPEs Brasileiras. Junho de 2009

Impactos da Crise Financeira Internacional nas MPEs Brasileiras. Junho de 2009 Impactos da Crise Financeira Internacional nas MPEs Brasileiras Junho de 2009 Introdução Objetivos: - Avaliar o impacto da crise financeira internacional no universo das micro e pequenas empresas (MPEs)

Leia mais

O DESEMPENHO DO ESPÍRITO SANTO NO PROGRAMA INTERNACIONAL DE AVALIAÇÃO DE ESTUDANTES (PISA) EM 2009

O DESEMPENHO DO ESPÍRITO SANTO NO PROGRAMA INTERNACIONAL DE AVALIAÇÃO DE ESTUDANTES (PISA) EM 2009 R E S E N H A D E C O N J U N T U R A O DESEMPENHO DO ESPÍRITO SANTO NO PROGRAMA INTERNACIONAL DE AVALIAÇÃO DE ESTUDANTES (PISA) EM 2009 Em 2009, o Espírito Santo aparece na 6ª posição no Programa Internacional

Leia mais

III Encontro dos Coordenadores de Saúde do Trabalhador Estratégia e Agenda Renast

III Encontro dos Coordenadores de Saúde do Trabalhador Estratégia e Agenda Renast III Encontro dos Coordenadores de Saúde do Trabalhador Estratégia e Agenda Renast Coordenação Geral de Saúde do Trabalhador Departamento de Vigilância em Saúde Ambiental e Saúde do Trabalhador Secretaria

Leia mais

Dados sobre o Programa de Educação Tutorial PET atualizados em abril de Fonte: SESu/MEC Apresentação: Diretoria da CENAPET

Dados sobre o Programa de Educação Tutorial PET atualizados em abril de Fonte: SESu/MEC Apresentação: Diretoria da CENAPET Dados sobre o Programa de Educação Tutorial PET atualizados em abril de 05 Fonte: SESu/MEC Apresentação: Diretoria da CENAPET Informações Gerais Número de Grupos: 84 Número de IES: Categoria Administrativa

Leia mais

DADOS ESTATÍSTICOS DE PRETENDENTES - BRASIL TOTAL % 1. Total de Pretendentes cadastrados: ,00%

DADOS ESTATÍSTICOS DE PRETENDENTES - BRASIL TOTAL % 1. Total de Pretendentes cadastrados: ,00% DADOS ESTATÍSTICOS DE PRETENDENTES - BRASIL TOTAL % 1. Total de Pretendentes cadastrados: 8346 100,00%. Total de Pretendentes que somente aceitam crianças da Raça Branca: 10834 38,% 3. Total de Pretendentes

Leia mais

CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados a habitação, educação, saúde e muito particularmente TRABALHO

CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados a habitação, educação, saúde e muito particularmente TRABALHO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados a habitação, educação, saúde e muito particularmente TRABALHO MÉTODOS QUANTITATIVOS

Leia mais

Boletim Informativo - Campanha Nacional de Vacinação contra a Poliomielite e contra o Sarampo

Boletim Informativo - Campanha Nacional de Vacinação contra a Poliomielite e contra o Sarampo Boletim Informativo - Campanha Nacional de Vacinação contra a Poliomielite e contra o Sarampo - 2018 O Ministério da Saúde, juntamente com as Secretarias Estaduais e Municipais de Saúde, realizou no período

Leia mais

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO. Pesquisas Relacionadas a Indicadores Municipais no Brasil. ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO. Pesquisas Relacionadas a Indicadores Municipais no Brasil. ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2 BA STA BOLETIM DE ANÁLISE ESTATÍSTICO Pesquisas Relacionadas a Indicadores Municipais no Brasil ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2 Pesquisa socio-economica ao nível municipal no Brasil focando

Leia mais