BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

Tamanho: px
Começar a partir da página:

Download "BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs"

Transcrição

1 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL ATLAS BRASIL A Importância e Impacto do Ensino Médio no País DISCIPLINA: MÉTODOS QUALITATIVOS E QUANTITATIVOS DA PESQUISA EMPÍRICA PROF. ARNOLDO JOSÉ DE HOYOS GUEVARA Danilo Nunes 1º SEMESTRE São Paulo SP 2017

2 SUMÁRIO INTRODUÇÃO... 4 CAPITULO 1. O Portal Atlas no Brasil Entendendo os Dados Os Indivíduos As Variáveis... 5 CAPÍTULO 2. ESTATÍSTICA DESCRITIVA DAS VARIÁVEIS Análise das Variáveis Variáveis Categóricas Variáveis Municípios Variáveis Quantitativas Comparações da Análise Descritíva CAPÍTULO 3. RELAÇÃO ENTRE AS VARIÁVEIS Correlação dos Valores Gráfico das Dispersões Dendograma CAPITULO 4. ANÁLISES DE TENDÊNCIAS Entendendo o Conceito dos Indicadores Entendendo os Conceitos dos Gráficos CAPITULO 5. REGRESSÃO LINEAR Correlações das Variáveis Validades Variável Dependente Variável Independente Utilizando e demonstrando no Minitab Resultado das variáveis estudadas Regressão Utilizando a Response com a Predictor de maior Representativa Dendograma das Variáveis Correlacionadas

3 CAPÍTULO 6. TESTES DE HIPÓTESES E INTERVALOR DE CONFIANÇA Análise de Dados Resgatando as Variáveis CAPITULO 7. AMOSTRAGEM Pesquisa por Amostragem Amostra Aleatória Construção no Minitab CAPITULO 8. COMPONENTES PRINCIPAIS Análise de Dados Criando os Principais Componentes CAPITULO 9. ANÁLISES DE CONGLOMERADOS Base de Dados Nova Base de Dados Considerada com as Médias por Estado Distribuição no Mapa do Brasil O Novo Mapa dos Clusters CAPITULO 10. ANÁLISE DISCRIMINANTE Busca de proximidade de Distância CAPITULO 11. REGRESSÃO LOGÍSTICA CAPÍTULO 12. ANÁLISE DE CORRESPONDÊNCIAS Análise de Correspondência Simples Rodando a Análise de Correspondência CAPÍTULO 13. ÁRVORES DE CLASSIFICAÇÃO Preparação das Cinco Variáveis no SPSS Árvore Classificatória CAPITULO 14. RANKING POR ESTADO CONSIDERAÇÕES FINAIS REFERÊNCIAS

4 INTRODUÇÃO O presente trabalho tem por finalidade efetuar uma análise exploratória, utilizando os dados disponibilizados no portal Atlas Brasil tomando como base o Atlas de Desenvolvimento Humano no Brasil, dos municípios pertencentes aos 27 estados e 01 distrito federal do Brasil. A abertura e dimensão dos dados disponibilizados nos oferecem uma dimensão muito grande das várias formas e enfoques de, sob a perspectiva do pesquisador, conhecer, avaliar e interpretar as informações. Esclarece-se que a base adotada refere-se exclusivamente aos relatórios de 2010, incluindo a definição das variáveis, classificadas em categóricas ou qualitativas e as unidades de medida utilizadas. Para melhor entendimento, das 08 dimensões exploradas no relatório, ou seja: demografia, educação, renda, trabalho, habitação, vulnerabilidade, população e o IDHM propriamente dito, por metodologia adotada pelo professor, foram escolhidas por identidade de estudo, duas variáveis das sete primeiras dimensões mais as quatro variáveis que compõem os IDHM (longevidade, educação, renda e geral) que serão apresentados no desenvolvimento do trabalho. Os indicadores escolhidos e as respectivas aberturas nos municípios brasileiros foram trabalhados utilizando-se o software estatístico MINITAB 16, ferramenta esta que nos permite trabalhar com gráficos, medidas numéricas, testes de normalidade e intervalos de confiança. CAPÍTULO 1. O PORTAL ATLAS NO BRASIL Concebido como uma ferramenta simples e amigável de disponibilização de informações, o Atlas Brasil facilita o manuseio de dados e estimula análises. A ferramenta oferece um panorama do desenvolvimento humano e da desigualdade interna dos municípios, estados e regiões metropolitanas. A relevância do Atlas do Desenvolvimento Humano nos Municípios vem justamente da capacidade de fornecer informações sobre a unidade político-administrativa mais próxima do cotidiano dos cidadãos: o município. Por sua vez, o Atlas do Desenvolvimento Humano nas Regiões Metropolitanas permite conhecer as desigualdades intramunicipais, entre bairros de uma mesma região metropolitana (atlasbrasil.org.br) Entendendo os Dados Os Indivíduos O foco de estudo deste trabalho são todos os municípios brasileiros, com os 232 indicadores disponibilizados no portal Atlas Brasil, dados de 2010, abertos em 08 categorias, a saber: Demografia Educação 4

5 Renda Trabalho Habitação Vulnerabilidade População IDHM (Longevidade, Renda e Educação O IDHM demonstrado no Atlas de Desenvolvimento Humano é baseado exclusivamente nos dados dos Censos Geográficos e tem por objetivo disponibilizar informações aos gestores público e privado, bem como, professores, alunos e todas as pessoas interessadas em conhecer e poder atuar em ações que nos levem a melhorar nossos referenciais de cidadania. Por proposta de estudo, o objetivo focou-se nos resultados que expressam os indicadores referentes à formação do Ensino Médio no cenário nacional, e na escolha das variáveis de certa forma, buscou-se uma associação direta com este foco de estudo, bem como, com as diretrizes estipuladas para cada exercício desenvolvido As variáveis Dos 232 indicadores que compõem a base de dados disponibilizada no Atlas Brasil, por metodologia previamente definida, foram escolhidas 02 variáveis de cada uma das 07 classificações que somadas aos 04 indicadores dos IDHM, perfazem o total de 18 (dezoito) variáveis a serem abordadas, exploradas e analisadas neste trabalho. Na busca por esses indicadores procurou-se, mesmo que de forma empírica, uma provável associação que possa nos levar a conhecer melhor a composição dos dados e, consequentemente, ter mais subsídios em ações que possam ser adotadas. Quadro 01 As variáveis Código Indicador Abrangência Tipo Medida ESPVIDA Esperança de vida ao nascer Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. T_ENV Taxa de envelhecimento Razão entre a população de 65 anos ou mais de idade e a população total multiplicado por 100. Variável Quantitativa Variável Quantitativa Anos Percentual 5

6 T_FUND15A17 Percentual da população de 15 a 17 anos com fundamental completo Razão entre a população de 15 a 17 anos de idade que concluiu o ensino fundamental, em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. T_MED18a20 Percentual da população de 18 Razão entre a população a 20 anos de idade com o de 18 a 20 anos de idade ensino médio completo que já concluiu o ensino médio em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. As pessoas de 18 a 20 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. RIND Renda domiciliar per capita Média da renda domiciliar média dos extremamente per capita das pessoas com pobres renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, a preços de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. RDPC Renda per capita média Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Percentual Percentual Absoluto Absoluto 6

7 Valores em reais de 01/agosto de TRABCC Percentual de ocupados de 18 Razão entre o número de Variável Percentual anos ou mais que são empregados de 18 anos ou Quantitativa empregados com carteira mais de idade com carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. TRABSC Percentual de ocupados de 18 Razão entre o número de Variável Percentual anos ou mais que são empregados de 18 anos ou Quantitativa empregados sem carteira mais de idade sem carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. T_AGUA Percentual da população que Razão entre a população Variável Percentual vive em domicílios com água que vive em domicílios Quantitativa encanada particulares permanentes com água canalizada para um ou mais cômodos e a população total residente em domicílios particulares permanentes, multiplicada por 100. A água pode ser proveniente de rede geral, de poço, de nascente ou de reservatório abastecido por água das chuvas ou carropipa. T_LUZ Percentual da população que Razão entre a população Variável Percentual vive em domicílios com energia que vive em domicílios Quantitativa elétrica particulares permanentes com iluminação elétrica e a população total residente em domicílios particulares permanentes, multiplicada por 100. Considera-se iluminação proveniente ou não de uma rede geral, com ou sem medidor. 7

8 AGUA_ESGOTO Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados Razão entre as pessoas que vivem em domicílios cujo abastecimento de água não provem de rede geral e cujo esgotamento sanitário não é realizado por rede coletora de esgoto ou fossa séptica e a população total residente em domicílios particulares permanentes, multiplicada por 100. São considerados apenas os domicílios particulares permanentes. T_SLUZ % de pessoas em domicílios Razão entre as pessoas sem energia elétrica que vivem em domicílios sem energia elétrica e população total residente em domicílios particulares permanentes multiplicado por 100. PESORUR População rural População residente na área rural PESOURB População urbana População residente na área urbana IDHM Índice de Desenvolvimento Humano Municipal Índice de Desenvolvimento Humano Municipal. Média geométrica dos índices das dimensões Renda, Educação e Longevidade, com pesos iguais. IDHM_E Índice de Desenvolvimento Índice sintético da Humano Municipal - Dimensão dimensão Educação, é um Educação dos 3 índices que compõem o IDHM. É obtido através da média geométrica do subíndice de frequência escolar, com peso de 2/3, e do subíndice de escolaridade, com peso de 1/3. Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Percentual Percentual Absoluto Absoluto Índice Índice 8

9 IDHM_R Índice de Desenvolvimento Índice da dimensão Renda, Variável Índice Humano Municipal - Dimensão Renda é um dos 3 índices que compõem o IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado do indicador) - ln (valor mínimo)] / [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). Quantitativa IDHM_L Índice de Desenvolvimento Índice da dimensão Variável Índice Humano Municipal - Dimensão Longevidade Longevidade, é um dos 3 índices que compõem o IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do indicador) - (valor mínimo)] / [(valor máximo) - (valor mínimo)], onde os valores mínimo e máximo são 25 e 85 anos, respectivamente. Quantitativa Município Nome do Município Nome do Município Categórica n/a UF Unidade da Federação Unidade da Federação Categórica n/a (Estado) (Estado) Fonte: Atlas Brasil, 2010 CAPÍTULO 2. ESTATÍSTICA DESCRITIVA DAS VARIÁVEIS Descriptive Statistics: ESPVIDA; T_ENV; T_FUND15A17; T_MED18A20; RDPC;... Variable N N* Mean SE Mean StDev Minimum Q1 Median ESPVIDA ,089 0,0359 2,681 65,300 71,150 73,470 T_ENV ,3973 0,0325 2,4230 1,4600 6,7800 8,3800 T_FUND15A ,754 0,208 15,505 6,890 42,915 55,420 T_MED18A ,091 0,195 14,575 1,910 24,990 35,140 RDPC ,61 3,26 243,27 96,25 281,09 467,65 RIND ,036 0,129 9,603 0,000 27,435 32,510 TRABCC ,250 0,242 18,053 0,900 14,860 26,760 9

10 TRABSC ,224 0,132 9,853 3,030 17,640 24,750 T_AGUA ,598 0,197 14,721 0,150 79,635 90,280 T_LUZ ,190 0,0808 6,024 27,410 97,645 99,390 AGUA_ESGOTO ,202 0,172 12,839 0,000 0,530 3,260 T_SLUZ ,8104 0,0808 6,0244 0,0000 0,1300 0,6100 pesorur , , pesourb IDHM , , , , , ,66500 IDHM_E , , , , , ,56000 IDHM_L , , , , , ,80800 IDHM_R , , , , , ,65400 Variable Q3 Maximum ESPVIDA 75,160 78,640 T_ENV 9, ,4200 T_FUND15A17 66,815 96,810 T_MED18A20 46,325 88,030 RDPC 650, ,74 RIND 37,090 70,000 TRABCC 44,620 83,210 TRABSC 32,045 62,230 T_AGUA 96, ,000 T_LUZ 99, ,000 AGUA_ESGOTO 13,035 85,360 T_SLUZ 2, ,5900 pesorur pesourb IDHM 0, ,86200 IDHM_E 0, ,82500 IDHM_L 0, ,89400 IDHM_R 0, , Análise das Variáveis Variáveis categóricas Como indica o foco de concentração, a análise deve ser feita preferencialmente por gráficos tipo pie chart ou barras Variável Município Os dados correspondem ao municípios brasileiros distribuído pelas 05 regiões conforme demonstrado no gráfico a seguir 10

11 Norte 1794 Nordeste 1668 Centro- Oeste 466 Gráfico 01 Municípios por região Fonte: elaborado pelo autor, com base no Atlas Brasil, 2010 O maior percentual de municípios está localizado na região Nordeste, com 32,3% seguida da região Sudeste com 30,0 e, respectivamente, Sul, Centro-Oeste e Norte, com 21,3%, 8,4% e 8,1%. Se analisarmos por Unidade Federativa, 05 estados têm cerca da metade dos municípios do Brasil, conforme demonstramos: Municípios Minas Gerais São Paulo RS do Sul Bahia Paraná Outros Gráfico 02 Municípios por Estado Fonte: elaborado pelo autor, com base no Atlas Brasil, 2010 Para que possamos ter uma visão geral do IDHM de todos os municípios do Brasil, a figura abaixo retrata essa distribuição. 11

12 Figura 01 IDHM dos municípios do Brasil Fonte: Atlas Brasil, 2010 A Atlas Brasil propõem a seguinte classificação: Muito baixo: inferior a Baixo: de a Médio: de a Alto: de a Muito alto: acima de Variáveis Quantitativas Permitem a utilização de várias ferramentas como histogramas, curvas de densidade, box-plot, nos subsidiando com dados numéricos que compõem as médias, medianas, intervalos e testes de normalidade como Anderson-Darling. Neste estudo exploraremos 18 variáveis conforme demonstrações a seguir: Variável ESPVIDA: Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano. 12

13 Summary for ESPVIDA A nderson-darling Normality Test A -Squared 34,95 P-Value < 0,005 Mean 73,089 StDev 2,681 V ariance 7,186 Skew ness -0, Kurtosis -0, N Minimum 65,300 1st Q uartile 71,150 Median 73,470 3rd Q uartile 75,160 Maximum 78,640 95% C onfidence Interv al for Mean 73,019 73,159 95% C onfidence Interv al for Median 73,380 73,550 95% Confidence Intervals 95% C onfidence Interv al for StDev 2,632 2,731 Mean Median 73,0 73,1 73,2 73,3 73,4 73,5 73,6 Gráfico 3 Variável Expectativa de Vida Fonte: Minitab 16 Forma: Há uma maior distribuição concentrada na faixa de 73 a 75 anos e o posicionamento da mediana está no inicio desse intervalo, ou seja, estabelecido entre 73,3 e 73,5 anos, o que é demonstrado pelo box-plot. Valores atípicos: não houve a indicação nesta análise de valores atípicos significativos, mas ressaltam-se os dois extremos, Cacimbas (PB) e Roteiro (AL) com expectativa de 65,3 anos e Blumenau e Brusque, ambas em SC, com 78,64 anos. Centro e Dispersão: A mediana nos indica que municípios estão divididos proporcionalmente entre os dois lados, sendo que seu valor para a ESPVIDA. é de 73,47 A média dos municípios é de 73,089, tendo um desvio-padrão de 2,681, com intervalo entre 2,632 e 2,731. Com 95% de confiança, podemos afirmar que a média encontra-se entre os índices de 73,019 e 73,159. Variável T_ENV: Razão entre a população de 65 anos ou mais de idade e a população total multiplicado por

14 Summary for T_ENV A nderson-darling Normality Test A -Squared 1,52 P-V alue < 0,005 Mean 8,3973 StDev 2,4230 V ariance 5,8709 Skew ness 0, Kurtosis 0, N Minimum 1,4600 1st Q uartile 6,7800 Median 8,3800 3rd Q uartile 9,9650 Maximum 20, % C onfidence Interv al for Mean 8,3337 8, % C onfidence Interv al for Median 8,3100 8, % Confidence Intervals 95% C onfidence Interv al for StDev 2,3788 2,4689 Mean Median 8,30 8,35 8,40 8,45 Gráfico 4: Varíável Taxa de Envelhecimento Fonte: Minitab 16 Forma: Há uma maior distribuição concentrada na faixa de 07 e 10 e o posicionamento da mediana está no intervalo, entre 8,3100 e 8,4700, demonstrado pelo box-plot. Valores atípicos: Esse tipo de concentração sinaliza que há valores atípicos que podem ser melhor estudados. Pode-se citar com exemplo, pois estão muito distantes da média e da mediana, os seguintes municípios: Santa Rosa do Purus (AC), Luis Eduardo Magalhães (BA), Campos de Júlio (MT) e Sapezal (MT), com taxas de 1,75; 1,50; 1,61 e 1,46 respectivamente Centro e Dispersão: A mediana nos indica que há uma distribuição proporcional de municípios entre os dois lados, sendo que o seu valor é de 8,3800. A média dos municípios é de 8,3973, tendo um desvio-padrão de 2,4230. Com 95% de confiança, podemos afirmar que a média encontra-se entre os índices de 8,3337 e 8,4610. Variável T_FUND15A17: Razão entre a população de 15 a 17 anos de idade que concluiu o ensino fundamental, em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por

15 Summary for T_FUND15A17 A nderson-darling Normality Test A -Squared 15,87 P-Value < 0,005 Mean 54,754 StDev 15,505 V ariance 240,407 Skew ness -0, Kurtosis -0, N Minimum 6,890 1st Q uartile 42,915 Median 55,420 3rd Q uartile 66,815 Maximum 96,810 95% C onfidence Interv al for Mean 54,346 55,161 95% C onfidence Interv al for Median 54,819 55,852 95% Confidence Intervals 95% C onfidence Interv al for StDev 15,222 15,799 Mean Median 54,50 54,75 55,00 55,25 55,50 55,75 56,00 Gráfico 5: Variável Taxa Ensino Fundamental Fonte: Minitab 16 Forma: Há uma maior distribuição na faixa de 42,9 a 66,8 e o posicionamento da mediana sinaliza maior concentração dos municípios entre 54,8 e 55,8, demonstrado pelo box-plot. Valores atípicos: não houve a indicação nesta análise de valores atípicos significativos, mas ressaltam-se os dois extremos, Jacareacanga (PA) e Melgaço (PA) com índices de 9,9 e 6,89 respectivamente e Monções (SP) e Várzea (PB), com 96,81 e 96,56 respectivamente. Centro e Dispersão: A mediana nos indica que há uma distribuição proporcional de municípios entre os dois lados, sendo que o seu valor é de 55,420. A média dos municípios é de 54,7540, tendo um desvio-padrão de 15,5050. Com 95% de confiança, podemos afirmar que a média encontra-se entre os índices de 54,346 e 55,161. Ressaltam-se os valores próximos da média e mediana com um desvio padrão relativamente alto o que pode significar uma maior dispersão dos dados obtidos. Variável RDPC: Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Valores em reais de 01/agosto de

16 Summary for RDPC A nderson-darling Normality Test A -Squared 80,55 P-V alue < 0,005 Mean 493,61 StDev 243,27 V ariance 59179,97 Skew ness 0,95965 Kurtosis 1,65248 N Minimum 96,25 1st Q uartile 281,09 Median 467,65 3rd Q uartile 650,64 Maximum 2043,74 95% C onfidence Interv al for Mean 487,21 500,00 95% C onfidence Interv al for Median 456,26 478,34 95% Confidence Intervals 95% C onfidence Interv al for StDev 238,83 247,88 Mean Median Gráfico 06: Variável Renda Per Capita Fonte: Minitab 16 Forma: Há uma distribuição concentrada na faixa entre 281,09 e 650,64. O Box-Plot demonstra a concentração na faixa acima citada, o posicionamento da mediana confirma essa análise Valores Atípicos: Há a indicação nesta análise de valores atípicos o que sugere uma análise mais aprofundada, mas ressaltam-se os dois extremos, Marajá do Sena e Fernando Falcão, ambos no MA, com respectivamente 96,25 e 106,99 e com indicadores de 2.000,29 e 2.043,74 respectivamente Niterói (RJ) e São Caetano do Sul (SP) Centro e Dispersão: A mediana nos indica que os municípios se concentram entre 456,26 e 478,34 e a média dos municípios é de 493,61, tendo um desvio-padrão de 243,27. Com 95% de confiança, podemos afirmar que a média encontra-se entre os índices de 487,21 e 500,00. Variável RIND: Média da renda domiciliar per capita das pessoas com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, a preços de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. 16

17 Summary for RIND A nderson-darling Normality Test A -Squared 60,66 P-V alue < 0,005 Mean 32,036 StDev 9,603 V ariance 92,215 Skew ness -0,28293 Kurtosis 2,37275 N Minimum 0,000 1st Q uartile 27,435 Median 32,510 3rd Q uartile 37,090 Maximum 70,000 95% C onfidence Interv al for Mean 31,783 32,288 95% C onfidence Interv al for Median 32,280 32,730 95% Confidence Intervals 95% C onfidence Interv al for StDev 9,428 9,785 Mean Median 31,8 32,0 32,2 32,4 32,6 32,8 Gráfico 07: Renda Individual Fonte: Minitab 16 Forma: Há uma maior distribuição concentrada na faixa entre 27,435 e 37,090 e o posicionamento da mediana está no intervalo, entre 32, ,730, demonstrado pelo box-plot Valores atípicos: Não houve a indicação nesta análise de valores atípicos significativos, mas ressaltam-se os dois extremos, com um dado de fato atípico, o menor índice está numa cidade de Santa Catarina, Luzerna, com 1,40 e o maior em 05 cidades, sendo 03 em Santa Catarina, por exemplo, Ibirama, com 70,0. Centro e Dispersão: A mediana nos indica que há uma distribuição maior de municípios na faixa de 32,280 e 32,730, sendo que o seu valor é de 32,510. A média dos municípios é de 32,036, tendo um desvio-padrão de 9,603, que pode ser considerado de grau baixo. Com 95% de confiança, podemos afirmar que a média encontra-se entre os índices de 31,783 e 32,288 Variável TRABOCC: Razão entre o número de empregados de 18 anos ou mais de idade com carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por

18 Summary for TRABCC A nderson-darling Normality Test A -Squared 94,28 P-Value < 0,005 Mean 30,250 StDev 18,053 V ariance 325,895 Skew ness 0, Kurtosis -0, N Minimum 0,900 1st Q uartile 14,860 Median 26,760 3rd Q uartile 44,620 Maximum 83,210 95% C onfidence Interv al for Mean 29,775 30,724 95% C onfidence Interv al for Median 25,958 27,401 95% Confidence Intervals 95% C onfidence Interv al for StDev 17,723 18,394 Mean Median Gráfico 08: Trabalhador com carteira assinada Fonte: Minitab 16 Forma: o histograma sinaliza uma distribuição mais concentrada na faixa de 14,860 e 44,620. O Box-Plot demostra a consideração na faixa acima e o posicionamento da mediana praticamente valida essa tendência. Valores Atípicos: Apesar da concentração, há evidências de valores atípicos em virtude do distanciamento da moda e mediana. Nos dois extremos temos, Sebastião Barros (PI) com indicador de 0,9 e Pedra Bonita (MG) com 1,19 contra Palmares Paulista e Dobrada, ambas em SP, com 82,27 e 83,21 respectivamente. Centro e Dispersão: A mediana nos indica que há uma concentração à esquerda, com boa parte dos municípios variando entre os índices 25,958 e 27,401. A média dos municípios brasileiros é de 30,250 tendo um desvio padrão de 18,053. Com 95% de confiança nos intervalos apurados, podemos afirmar que a média encontra-se entre os valores 29,775 e 30,724. Variável TRABSC: Razão entre o número de empregados de 18 anos ou mais de idade sem carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por

19 Summary for TRABSC A nderson-darling Normality Test A -Squared 11,46 P-Value < 0,005 Mean 25,224 StDev 9,853 V ariance 97,081 Skew ness 0, Kurtosis -0, N Minimum 3,030 1st Q uartile 17,640 Median 24,750 3rd Q uartile 32,045 Maximum 62,230 95% C onfidence Interv al for Mean 24,965 25,483 95% C onfidence Interv al for Median 24,460 25,071 95% Confidence Intervals 95% C onfidence Interv al for StDev 9,673 10,040 Mean Median 24,50 24,75 25,00 25,25 25,50 Gráfico 09: Variável Trabalhador sem carteira assinada Fonte: Minitab 16 Forma: o histograma sinaliza uma distribuição mais concentrada na faixa de 17,640 e 32,045. O Box-Plot demostra a consideração na faixa acima e o posicionamento da mediana, praticamente nosso centro dessa distribuição, valida essa tendência. Valores Atípicos: Pela distribuição e indicadores, não há valores atípicos relativamente significativos, mas ressalta-se pontos de estudos em municípios mais críticos tais como: Caparaó (MG) com 66,86 e Luciara (MT) 62,23 Centro e Dispersão: A mediana nos indica que há uma concentração à esquerda, com boa parte dos municípios variando entre os índices 24,460 e 25,071. A média dos municípios brasileiros é de 25,224 tendo um desvio padrão de 9,853. Com 95% de confiança nos intervalos apurados, podemos afirmar que a média encontra-se entre os valores 24,965 e 25,483. Variável T_AGUA: Razão entre a população que vive em domicílios particulares permanentes com água canalizada para um ou mais cômodos e a população total residente em domicílios particulares permanentes, multiplicada por 100. A água pode ser proveniente de rede geral, de poço, de nascente ou de reservatório abastecido por água das chuvas ou carropipa. 19

20 Summary for T_AGUA A nderson-darling Normality Test A -Squared 270,99 P-V alue < 0,005 Mean 85,598 StDev 14,721 V ariance 216,717 Skew ness -1,89166 Kurtosis 4,71167 N Minimum 0,150 1st Q uartile 79,635 Median 90,280 3rd Q uartile 96,260 Maximum 100,000 95% C onfidence Interv al for Mean 85,211 85,985 95% C onfidence Interv al for Median 89,870 90,701 95% Confidence Intervals 95% C onfidence Interv al for StDev 14,453 15,000 Mean Median Gráfico 10: Domicílios com água canalizada Fonte: Minitab 16 Forma: o histograma sinaliza uma distribuição mais concentrada na faixa de 79,635 e 96,260. O Box-Plot demostra a consideração na faixa acima e o posicionamento da mediana, praticamente nosso centro dessa distribuição, valida essa tendência. Valores Atípicos: A julgar pelos valores próximos e altos da média e mediana, entende-se que há vários valores atípicos a serem considerados, preponderantemente, os municípios alocados na faixa esquerda do histograma. Ressaltam-se os mais críticos: Baraúna (PB) com 0,15; Marcolândia (PI) com 0,50 e Assunção (PB) com 0,77 Centro e Dispersão: A mediana nos indica que há uma concentração à direita, com boa parte dos municípios variando entre os índices 89,870 e 90,701. A média dos municípios brasileiros é de 85,598 tendo um desvio padrão de 14,721. Com 95% de confiança nos intervalos apurados, podemos afirmar que a média encontra-se entre os valores 85,211 e 85,985. Variável T_LUZ: Razão entre a população que vive em domicílios particulares permanentes com iluminação elétrica e a população total residente em domicílios particulares permanentes, multiplicada por 100. Considera-se iluminação proveniente ou não de uma rede geral, com ou sem medidor. 20

21 Summary for T_LUZ A nderson-darling Normality Test A -Squared 938,37 P-V alue < 0,005 Mean 97,190 StDev 6,024 V ariance 36,293 Skew ness -4,2167 Kurtosis 23,1543 N Minimum 27,410 1st Q uartile 97,645 Median 99,390 3rd Q uartile 99,870 Maximum 100,000 95% C onfidence Interv al for Mean 97,031 97,348 95% C onfidence Interv al for Median 99,350 99,430 95% Confidence Intervals 95% C onfidence Interv al for StDev 5,915 6,138 Mean Median 97,0 97,5 98,0 98,5 99,0 99,5 Gráfico 11: Domicílios com iluminação elétrica Fonte: Minitab 16 Forma: Bastante parecida com a análise anterior, mas com um grão ainda maior de concentração, agora na faixa de 97,645 e 99,870. O Box-Plot demostra a consideração na faixa acima e o posicionamento da mediana, praticamente nosso centro dessa distribuição, valida essa tendência. Valores Atípicos: A julgar pelos valores próximos e altos da média e mediana, entende-se que há vários valores atípicos a serem considerados, preponderantemente, os municípios alocados na faixa esquerda do histograma. Ressaltam-se os mais críticos: Uiramutã (RR), com a taxa mais critica entre todos os municípios brasileiros, 27,41 e Jordão (AC), Dom Inocêncio (PI) e São Lourenço do Piau (PI), com 41,83, 44,16 e 44,27 respectivamente. Centro e Dispersão: A mediana nos indica que há uma concentração à direita, com boa parte dos municípios variando entre os índices 99,350 e 99,430. A média dos municípios brasileiros é de 97,190 tendo um desvio padrão de Com 95% de confiança nos intervalos apurados, podemos afirmar que a média encontra-se entre os valores 97,031 e 97,348. Variável ÁGUA_ESGOTO: Razão entre as pessoas que vivem em domicílios cujo abastecimento de água não provem de rede geral e cujo esgotamento sanitário não é realizado por rede coletora de esgoto ou fossa séptica e a população total residente em domicílios particulares permanentes, multiplicada por 100. São considerados apenas os domicílios particulares permanentes. 21

22 Summary for AGUA_ESGOTO A nderson-darling Normality Test A -Squared 500,69 P-V alue < 0,005 Mean 9,2017 StDev 12,8392 V ariance 164,8446 Skew ness 1,99895 Kurtosis 4,21350 N Minimum 0,0000 1st Q uartile 0,5300 Median 3,2600 3rd Q uartile 13,0350 Maximum 85, % C onfidence Interv al for Mean 8,8643 9, % C onfidence Interv al for Median 2,9400 3, % Confidence Intervals 95% C onfidence Interv al for StDev 12, ,0823 Mean Median Gráfico 12: Domicílios com abastecimento de água sem rede geral Fonte: Minitab 16 Forma: Contrapõe, de forma quase proporcional, os dados e análise do indicador T_ÁGUA. Quanto mais concentrada à esquerda, próximos do eixo vertical, melhor seriam os resultados. Neste indicador, os dados estão concentrados entre 0,5300 e 13,0350 O Box-Plot demostra a consideração na faixa acima e o posicionamento da mediana, praticamente dentro dessa distribuição, valida essa tendência. Valores Atípicos: A julgar pelos valores relativos próximos da média e mediana, considerando a população deste estudo, entende-se que há valores atípicos a serem considerados, preponderantemente, os municípios alocados na faixa direita do histograma. Ressaltam-se os mais críticos: Chaves e Melgaço (PA) com, respectivamente, 85,36 e 78,93 Centro e Dispersão: A mediana nos indica que há uma concentração à esquerda, com boa parte dos municípios variando entre os índices 2,9400 e 3,5910. A média dos municípios brasileiros é de 9,2017 tendo um desvio padrão de 12,8392. Com 95% de confiança nos intervalos apurados, podemos afirmar que a média encontra-se entre os valores 8,8643 e 9,5391. Variável T_LUZ: Razão entre as pessoas que vivem em domicílios sem energia elétrica e população total residente em domicílios particulares permanentes multiplicado por

23 Summary for T_SLUZ A nderson-darling Normality Test A -Squared 938,10 P-V alue < 0,005 Mean 2,8104 StDev 6,0244 V ariance 36,2931 Skew ness 4,2167 Kurtosis 23,1543 N Minimum 0,0000 1st Q uartile 0,1300 Median 0,6100 3rd Q uartile 2,3550 Maximum 72, % C onfidence Interv al for Mean 2,6521 2, % C onfidence Interv al for Median 0,5700 0, % Confidence Intervals 95% C onfidence Interv al for StDev 5,9145 6,1384 Mean Median 0,5 1,0 1,5 2,0 2,5 3,0 Gráfico 13: Domicílios sem energia elétrica Fonte: Minitab 16 Forma: Muito similar à análise do indicador anterior. Quanto mais concentrada à esquerda, próximos do eixo vertical, melhor seriam os resultados. Neste indicador, os dados estão concentrados entre 0,1300 e 2,3550 O Box-Plot demostra a consideração na faixa acima e o posicionamento da mediana, praticamente dentro dessa distribuição, valida essa tendência. Valores Atípicos: Como na análise anterior, se observamos a macro distribuição, sem muito variação, não teríamos valores atípicos significativos, mas a julgar pelos valores relativos próximos da média e mediana, considerando a população deste estudo e o indicador propriamente dito, entendese que há valores atípicos a serem considerados, preponderantemente, os municípios alocados na faixa direita do histograma. Ressaltam-se os mais críticos: Uiramutâ (RR) e Jordão (AC) com, respectivamente, 72,59 e 58,17. Centro e Dispersão: A mediana nos indica que há uma concentração à esquerda, com boa parte dos municípios variando entre os índices 0,5700 e 0, A média dos municípios brasileiros é de 9,2017 tendo um desvio padrão de 2,8104. Com 95% de confiança nos intervalos apurados, podemos afirmar que a média encontra-se entre os valores 2,6521 e 2,9687. Variável pesorur: População residente na área rural. 23

24 Summary for pesorur A nderson-darling Normality Test A -Squared 457,97 P-Value < 0,005 Mean 5360 StDev 6642 V ariance Skew ness 4,6970 Kurtosis 45,1552 N Minimum 0 1st Q uartile 1599 Median rd Q uartile 6769 Maximum % C onfidence Interv al for Mean % C onfidence Interv al for Median % Confidence Intervals 95% C onfidence Interv al for StDev Mean Median Gráfico 14: População residente na área rural Fonte: Minitab 16 Forma: Neste indicador, os dados estão concentrados entre e O Box-Plot demostra a consideração na faixa acima e o posicionamento da mediana, dentro dessa distribuição, valida essa tendência. Valores Atípicos: Por ser indicador absoluto e atendendo às características das cidades brasileiras, entende-se por não haver valores atípicos neste indicador, mesmo considerando o alto desvio padrão. Centro e Dispersão: A mediana nos indica que há uma concentração à esquerda, com boa parte dos municípios variando com população rural entre e A média dos municípios brasileiros é de tendo um desvio padrão de Com 95% de confiança nos intervalos apurados, podemos afirmar que a média encontra-se entre os valores e Variável pesourb: População residente na área urbana. 24

25 Summary for pesourb A nderson-darling Normality Test A -Squared 1664,44 P-Value < 0,005 Mean StDev V ariance Skew ness 37,77 Kurtosis 1858,03 N Minimum 174 1st Q uartile 2838 Median rd Q uartile Maximum % C onfidence Interv al for Mean % C onfidence Interv al for Median % Confidence Intervals 95% C onfidence Interv al for StDev Mean Median Gráfico 15: População residente na área urbana Fonte: Minitab 16 Forma: Neste indicador, os dados estão concentrados entre e O Box-Plot demostra a consideração na faixa acima e o posicionamento da mediana, dentro dessa distribuição, valida essa tendência. Não há praticamente, distorção de distribuição neste indicador Valores Atípicos: Por ser indicador absoluto e atendendo às características das cidades brasileiras, entende-se por não haver valores atípicos neste indicador, mesmo considerando o alto desvio padrão. Centro e Dispersão: A mediana nos indica que há uma concentração à esquerda, com boa parte dos municípios variando com população urbana entre e A média dos municípios brasileiros é de tendo um desvio padrão de Com 95% de confiança nos intervalos apurados, podemos afirmar que a média encontra-se entre os valores e Variável IDHM: Índice de Desenvolvimento Humano Municipal. Média geométrica dos índices das dimensões Renda, Educação e Longevidade, com pesos iguais. 25

26 Summary for IDHM A nderson-darling Normality Test A -Squared 40,51 P-Value < 0,005 Mean 0,65916 StDev 0,07200 V ariance 0,00518 Skew ness -0, Kurtosis -0, N ,42 0,49 0,56 0,63 0,70 0,77 0,84 Minimum 0, st Q uartile 0,59900 Median 0, rd Q uartile 0,71800 Maximum 0, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,07336 Mean Median 0,658 0,660 0,662 0,664 0,666 0,668 0,670 Gráfico 16: Variável IDHM Fonte: Minitab 16 Forma: O histograma nos apresenta uma distribuição concentrada na faixa entre os índices 0,5990 e 0,7180. O Box-Plot demonstra a concentração na faixa acima citada, o posicionamento da mediana confirma o posicionamento. Valores Atípicos: Não há valores atípicos considerados neste indicador Centro e Dispersão: A mediana nos indica que há uma distribuição dos municípios proporcional entre os lados, sendo que o seu valor para IDHM é de 0,6650. O IDHM médio dos municípios é de 0,6591, tendo um desvio-padrão de 0, Com 95% de confiança, podemos afirmar que a média encontra-se entre os índices de 0,6572 e 0,6610. Destacam-se os municípios que estão nos dois extremos desta análise: Extremo inferior: Melgaço (PA) com 0,418 e Fernando Falcão (MA) com 0,443 Extremo superior: Águas de São Pedro (SP) com 0,854 e São Caetano do Sul (SP) com 0,862 Variável IDHM_L: Índice da dimensão Longevidade, é um dos 3 índices que compõem o IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do indicador) - (valor mínimo)] / [(valor máximo) - (valor mínimo)], onde os valores mínimos e máximos são 25 e 85 anos, respectivamente. 26

27 Summary for IDHM_L A nderson-darling Normality Test A -Squared 35,06 P-Value < 0,005 Mean 0,80156 StDev 0,04468 V ariance 0,00200 Skew ness -0, Kurtosis -0, N ,69 0,72 0,75 0,78 0,81 0,84 0,87 Minimum 0, st Q uartile 0,76900 Median 0, rd Q uartile 0,83600 Maximum 0, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,04553 Mean Median 0,800 0,802 0,804 0,806 0,808 0,810 Gráfico 17: Variável IDHM_L Fonte: Minitab 16 Forma: Por serem indicadores que englobam várias dimensões, o IDHM e os outros três indicadores que o compõem, neste caso o IDHM_L têm uma análise muito similar. O histograma nos apresenta uma distribuição concentrada na faixa entre os índices 0,7690 e 0,8360. O Box-Plot demonstra a concentração na faixa acima citada, o posicionamento da mediana confirma o posicionamento. Valores Atípicos: Não há valores atípicos considerados neste indicador Centro e Dispersão: A mediana nos indica que há uma distribuição dos municípios proporcional entre os lados, sendo que o seu valor para IDHM_L é de 0,8080. O IDHM_L médio dos municípios é de 0,8015, tendo um desvio-padrão de 0,0446. Com 95% de confiança, podemos afirmar que a média encontra-se entre os índices de 0,8003 e 0,8017. Destacam-se os municípios que estão nos dois extremos desta análise: Extremo inferior: Cacimbas (PB) e Roteiro (AL), ambos com 0,672 Extremo superior: Balneário Camboriú, Blumenau, Brusque e Rio do Sul, todas de SC e com índice de 0,894. Variável IDHM_R: Índice da dimensão Renda, é um dos 3 índices que compõem o IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado do indicador) - ln (valor mínimo)] / [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). 27

28 Summary for IDHM_R A nderson-darling Normality Test A -Squared 55,08 P-Value < 0,005 Mean 0,64287 StDev 0,08066 V ariance 0,00651 Skew ness -0, Kurtosis -0, N ,42 0,49 0,56 0,63 0,70 0,77 0,84 Minimum 0, st Q uartile 0,57200 Median 0, rd Q uartile 0,70700 Maximum 0, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,08219 Mean Median 0,640 0,644 0,648 0,652 0,656 Gráfico 18: Variável IDHM_R Fonte: Minitab 16 Forma: Por serem indicadores que englobam várias dimensões, o IDHM e os outros três indicadores que o compõem, neste caso o IDHM_R têm uma análise muito similar. O histograma nos apresenta uma distribuição concentrada na faixa entre os índices 0,5720 e 0,7070. O Box-Plot demonstra a concentração na faixa acima citada, o posicionamento da mediana confirma o posicionamento. Valores Atípicos: Não há valores atípicos considerados neste indicador Centro e Dispersão: A mediana nos indica que há uma distribuição dos municípios proporcional entre os lados, sendo que o seu valor para IDHM_R é de 0,0,6540. O IDHM_R médio dos municípios é de 0,6428, tendo um desvio-padrão de 0,0806. Com 95% de confiança, podemos afirmar que a média encontra-se entre os índices de 0,6407 e 0,6449. Destacam-se os municípios que estão nos dois extremos desta análise: Extremo inferior: Marajá do Sena com 0,400 e Fernando Falcão e Belágua com 0,417, todas do MA Extremo superior: Niterói (RJ) com 0,887 e São Caetano do Sul (SP) com 0,891. Variável IDHM_E: Índice sintético da dimensão Educação, é um dos 3 índices que compõem o IDHM. É obtido através da média geométrica do subíndice de frequência escolar, com peso de 2/3, e do subíndice de escolaridade, com peso de 1/3. 28

29 Summary for IDHM_E A nderson-darling Normality Test A -Squared 9,32 P-Value < 0,005 Mean 0,55909 StDev 0,09333 V ariance 0,00871 Skew ness -0, Kurtosis -0, N ,27 0,36 0,45 0,54 0,63 0,72 0,81 Minimum 0, st Q uartile 0,49000 Median 0, rd Q uartile 0,63100 Maximum 0, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,09509 Mean Median 0,557 0,558 0,559 0,560 0,561 0,562 0,563 Gráfico 19: Variável IDHM_E Fonte: Minitab 16 Forma: Por serem indicadores que englobam várias dimensões, o IDHM e os outros três indicadores que o compõem, neste caso o IDHM_E, têm uma análise muito similar. O histograma nos apresenta uma distribuição concentrada na faixa entre os índices 0,4900 e 0,6410. O Box-Plot demonstra a concentração na faixa acima citada, o posicionamento da mediana confirma o posicionamento. Valores Atípicos: Não há valores atípicos considerados neste indicador Centro e Dispersão: A mediana nos indica que há uma distribuição dos municípios proporcional entre os lados, sendo que o seu valor para IDHM_E é de 0,5600. O IDHM_E médio dos municípios é de 0,5590, tendo um desvio-padrão de 0, Com 95% de confiança, podemos afirmar que a média encontra-se entre os índices de 0,5566 e 0,5615. Destacam-se os municípios que estão nos dois extremos desta análise: Extremo inferior: Melgaço (PA) com 0,0,207 e Chaves (PA) com 0,234 Extremo superior: São Caetano do Sul (SP) com 0,811 e Águas de São Pedro (SP) com 0,825. Variável T_MED18A20: Razão entre a população de 18 a 20 anos de idade que já concluiu o ensino médio em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. As pessoas de 18 a 20 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. 29

30 Summary for T_MED18A20 A nderson-darling Normality Test A -Squared 13,93 P-Value < 0,005 Mean 36,091 StDev 14,575 V ariance 212,425 Skew ness 0, Kurtosis -0, N Minimum 1,910 1st Q uartile 24,990 Median 35,140 3rd Q uartile 46,325 Maximum 88,030 95% C onfidence Interv al for Mean 35,708 36,474 95% C onfidence Interv al for Median 34,609 35,621 95% Confidence Intervals 95% C onfidence Interv al for StDev 14,309 14,851 Mean Median 34,5 35,0 35,5 36,0 36,5 Gráfico 20: Variável Ensino Médio Fonte: Minitab 16 Forma: Há uma distribuição concentrada na faixa entre 24,990 e 46,325. O box-plot demonstra a concentração dessa faixa e o posicionamento da mediana praticamente confirma essa tendência. Valores atípicos: Esse tipo de concentração sinaliza que há valores atípicos que podem ser melhor estudados. Pode-se citar com exemplo, pois estão muito distantes da média e da mediana, os seguintes municípios: Chaves (PA) com 1,91; Porto de Pedras (AL) com 3,08 e Jacareacanga (PA) com 3,37 Centro e Dispersão: A mediana nos indica que há leve concentração, com um pouco mais da metade dos municípios variando entre os índices 34,609 e 35,621. A média apurada foi de 36,091 tendo um desvio padrão de 14,575, aparentemente não expressivo.com 95% de confiança, podemos afirmar que a média encontra-se entre os valores de 35,708 e 36,474. Considerações: Há uma distribuição bastante diferente se compararmos o IDHM_E, que é o indicador geral da educação, com os que expressam os indicadores especifico do Ensino Médio, o que sinaliza uma possível adoção de políticas não uniformes entre este ensino e os demais que compõem o IDHM_E. Ambos apresentam intervalos de confiança de 95%, mas com distribuição diferentes das médias e medianas Comparações da Análise Descritiva Apresentamos, a seguir, quadro comparando histograma, Box-Plot, Curva de densidade, Média, Desvio Padrão, Mediana e P-value do teste de normalidade Anderson-Darling, das variáveis analisadas. 30

31 VARIÁVEL GRÁFICO MÉDIA DESVIO PADRÃO MEDIANA P-VALUE ESPVIDA 73,089 2,681 73,47 0,005 T_ENV 8,3973 2,423 8,38 0,005 T_FUND15A17 54,754 15,505 55,42 0,005 T_MED18a20 36,091 14,575 35,14 0,005 RDPC 493,61 243,27 467,65 0,005 RIND 32,036 9,603 32,51 0,005 31

32 TRABCC 30,25 18,053 26,76 0,005 TRABSC 25,224 9,853 24,75 0,005 T_AGUA 85,598 14,721 90,28 0,005 T_LUZ 97,19 6,024 99,39 0,005 AGUA_ESGOTO 9, ,8392 3,26 0,005 T_SLUZ 2,8104 6,0244 0,61 0,005 PESORUR ,005 32

33 PESOURB ,005 IDHM 0,6591 0,072 0,665 0,005 IDHM_E 0,559 0,0933 0,56 0,005 IDHM_L 0,8015 0,0446 0,808 0,005 IDHM_R 0,6428 0,0806 0,654 0,005 Quadro 02 Análise comparativa das variáveis Fonte: Minitab 16, complementado pelo autor CAPÍTULO 3.RELAÇÃO ENTRE AS VARIÁVEIS 3.1 Correlação dos Valores Um coeficiente de correlação mede o grau pelo qual duas variáveis tendem a mudar juntas. O coeficiente descreve a força e a direção da relação. A correlação de Pearson avalia a relação linear entre duas variáveis contínuas. Uma relação é linear quando a mudança em uma variável é associada a uma mudança proporcional na outra variável. Os dados a seguir representam a correlação entre as 18 variáveis selecionadas para este estudo e abordadas nas análises das variáveis quantitativas Variáveis e correlações: Correlations: ESPVIDA; T_ENV; T_FUND15A17; T_MED18A20; RDPC; RIND; TRABCC;... 33

34 ESPVIDA T_ENV T_FUND15A17 T_MED18A20 RDPC T_ENV 0,223 0,000 T_FUND15A17 0,666 0,365 0,000 0,000 T_MED18A20 0,660 0,388 0,833 0,000 0,000 0,000 RDPC 0,784 0,204 0,671 0,717 0,000 0,000 0,000 0,000 RIND -0,000 0,104 0,034 0,076 0,040 0,981 0,000 0,010 0,000 0,003 TRABCC 0,601-0,070 0,495 0,524 0,664 0,000 0,000 0,000 0,000 0,000 TRABSC -0,519-0,056-0,449-0,473-0,615 0,000 0,000 0,000 0,000 0,000 T_AGUA 0,549 0,088 0,528 0,515 0,564 0,000 0,000 0,000 0,000 0,000 T_LUZ 0,341 0,302 0,438 0,436 0,386 0,000 0,000 0,000 0,000 0,000 AGUA_ESGOTO -0,604-0,340-0,593-0,582-0,587 0,000 0,000 0,000 0,000 0,000 T_SLUZ -0,341-0,302-0,438-0,436-0,386 0,000 0,000 0,000 0,000 0,000 pesorur -0,245-0,284-0,293-0,298-0,216 0,000 0,000 0,000 0,000 0,000 pesourb 0,091-0,063 0,050 0,075 0,217 0,000 0,000 0,000 0,000 0,000 IDHM 0,852 0,238 0,832 0,851 0,908 0,000 0,000 0,000 0,000 0,000 IDHM_E 0,704 0,212 0,855 0,877 0,791 0,000 0,000 0,000 0,000 0,000 IDHM_L 1,000 0,223 0,666 0,660 0,784 0,000 0,000 0,000 0,000 0,000 IDHM_R 0,834 0,229 0,721 0,748 0,962 0,000 0,000 0,000 0,000 0,000 RIND TRABCC TRABSC T_AGUA T_LUZ TRABCC 0,046 0,001 TRABSC 0,057-0,555 0,000 0,000 T_AGUA 0,066 0,549-0,295 0,000 0,000 0,000 T_LUZ 0,168 0,373-0,197 0,408 0,000 0,000 0,000 0,000 AGUA_ESGOTO -0,095-0,523 0,303-0,640-0,423 0,000 0,000 0,000 0,000 0,000 T_SLUZ -0,168-0,373 0,197-0,408-1,000 0,000 0,000 0,000 0,000 * 34

35 pesorur -0,044-0,197 0,099-0,256-0,193 0,001 0,000 0,000 0,000 0,000 pesourb 0,046 0,142-0,090 0,083 0,046 0,001 0,000 0,000 0,000 0,001 IDHM 0,072 0,727-0,571 0,659 0,490 0,000 0,000 0,000 0,000 0,000 IDHM_E 0,098 0,692-0,505 0,615 0,491 0,000 0,000 0,000 0,000 0,000 IDHM_L -0,000 0,601-0,519 0,549 0,341 0,977 0,000 0,000 0,000 0,000 IDHM_R 0,051 0,700-0,587 0,641 0,448 0,000 0,000 0,000 0,000 0,000 AGUA_ESGOTO T_SLUZ pesorur pesourb IDHM T_SLUZ 0,423 0,000 pesorur 0,379 0,193 0,000 0,000 pesourb -0,053-0,046 0,220 0,000 0,001 0,000 IDHM -0,668-0,490-0,272 0,149 0,000 0,000 0,000 0,000 IDHM_E -0,590-0,491-0,249 0,147 0,951 0,000 0,000 0,000 0,000 0,000 IDHM_L -0,604-0,341-0,245 0,091 0,852 0,000 0,000 0,000 0,000 0,000 IDHM_R -0,671-0,448-0,260 0,157 0,948 0,000 0,000 0,000 0,000 0,000 IDHM_E IDHM_L 0,704 0,000 IDHM_L IDHM_R 0,820 0,834 0,000 0,000 Cell Contents: Pearson correlation P-Value Como base na análise das correlações obtidas, nota-se que as variáveis elencadas na tabela a seguir apresentam forte relação, mas que necessariamente não significa que podem apresentar causalidade, ou seja, sentido direto entre elas. Percebe-se que quase todas as correlações têm como pelo menos um indicador o IDHM ou os outros três indicadores que o compõem: IDHM_L; IDHM_R e IDHM_E. Premissas: 1) Foram invalidadas as correlações que apresentaram indicadores (denominadores) diferentes de 0,000 35

36 Y-Data 2) Correlações utilizadas considerando variáveis maior ou igual a 0,800, positiva ou negativa. Variável Variável Grau de Correlação T_MED18A20 T_FUND15A17 0,833 IDHM ESPVIDA 0,852 IDHM T_FUND15A17 0,832 IDHM T_MED18A20 0,851 IDHM RDPC 0,908 IDHM_E T_FUND15A17 0,855 IDHM_E T_MED18A20 0,877 IDHM_L ESPVIDA 1,000 IDHM_R ESPVIDA 0,834 IDHM_R RDPC 0,962 IDHM_E IDHM 0,951 IDHM_L IDHM 0,852 IDHM_R IDHM 0,948 IDHM_R IDHM_E 0,820 IDHM_R IDHM_L 0,834 Quadro 03: Correlações das variáveis validadas Fonte: elaborador pelo autor Para efeito do foco deste estudo, têm-se como principais correlações, conforme segue, sendo a principal delas entre ensino médio e IDHM_E. 3.2 Gráfico das Dispersões Variável Variável Grau de Correlação T_MED18A20 T_FUND15A17 0,833 IDHM T_MED18A20 0,851 IDHM_E T_MED18A20 0,877 Quadro 04: Correlações das variáveis validadas com Ensino Médio Nos gráficos a seguir serão demonstradas as relações entre as variáveis destacadas no quadro anterior e a composição das dispersões. Scatterplot of ESPVIDA vs T_FUND15A17; IDHM vs ESPVIDA; IDHM vs T_FUND Variable ESPVIDA * T_FUND15A17 IDHM * ESPVIDA IDHM * T_FUND15A17 IDHM * T_MED18A20 IDHM * RDPC IDHM_E * T_FUND15A17 IDHM_E * T_MED18A20 IDHM_L * ESPVIDA IDHM_R * ESPVIDA IDHM_R * RDPC IDHM_E * IDHM IDHM_L * IDHM IDHM_R * IDHM IDHM_R * IDHM_E IDHM_R * IDHM_L X-Data Gráfico 21: Scatterplot das variáveis correlacionadas Fonte: Minitab 16 36

37 Scatterplot of ESPVIDA vs T_FUND15A17; IDHM vs ESPVIDA; IDHM vs T_FUND ES P V IDA * T_F U N D15A IDHM * ES P V IDA IDHM * T_F U N D15A IDHM * T_M ED18A IDHM * RDP C IDHM _E* T_F U N D15A 17 IDHM _E* T_M ED18A 20 IDHM _L* ES P V IDA IDHM _R* ES P V IDA IDHM _R* RDP C IDHM _E* IDHM IDHM _L* IDHM IDHM _R* IDHM 80 IDHM _R* IDHM _E 0 IDHM _R* IDHM _L Gráfico 22: Scatterplot das variáveis correlacionadas agrupadas Fonte: Minitab 16 Scatterplot of T_MED18A20 vs T_FUND15A17; IDHM vs ESPVIDA; IDHM vs T_F 100 T_MED18A20*T_FUND15A ,75 0, ,75 0,75 0,75 0,50 0,50 0, ,6 0,3 0, IDHM_R*RDPC 1,00 0,75 0,75 0,50 0, IDHM_L*IDHM 0,9 0,8 0,7 0,6 IDHM_R*IDHM_E 0,8 0,4 0,6 0,8 IDHM_R*IDHM_L 1,00 1,00 0,75 0,75 0,50 0,50 0,8 100 IDHM_E*IDHM 0,4 0,75 0, ,7 50 0, IDHM_L*ESPVIDA 0,9 0, ,8 0 1,00 0, ,6 0 IDHM_R*IDHM 50 IDHM_E*T_MED18A20 0,9 0,6 1, IDHM_E*T_FUND15A17 IDHM_R*ESPVIDA 65 IDHM*T_MED18A20 1,00 0,9 1,00 IDHM*T_FUND15A17 1, IDHM*RDPC 0 IDHM*ESPVIDA 1,00 0,50 0,3 0,6 0,9 0,7 0,8 0,9 Gráfico 23: Scatterplot simples, utilizando linha de regressão Fonte Minitab 16 As análises dos gráficos de dispersão devem ser feitas considerando os padrões gerais os desvios relativos ao padrão. Os padrões são definidos quanto à direção, intensidade e forma. 37

38 a) Quanto à direção: Todas as correlações analisados possuem associações positivas, ou seja, a alteração ou crescimento e uma variável implica crescimento ou alteração da variável correlacionada. b) Quanto à intensidade: Pela análise dos dados apresentados nos gráficos acima, Configura-se uma relação linear, com intensidade mais moderada (ou menor) nas correlações IDHM_L x ESPVIDA; IDHM_R x RDPC, IDHM x RDPC c) Quanto à forma: Os gráficos apresentam conglomerados que sugerem relações lineares, ressaltando à análise no item anterior. 3.3 Dendograma É um tipo específico de diagrama ou representação icônica que organiza determinados fatores e variáveis. Sua representação apresenta-se na forma de um diagrama de similaridade. A interpretação de um Dendrograma de similaridade entre amostras fundamenta-se na intuição: duas amostras próximas devem ter também valores semelhantes para as variáveis medidas. Ou seja, elas devem ser próximas matematicamente no espaço multidimensional. Quanto maior a proximidade entre as medidas relativas às amostras, maior a similaridade entre elas. O dendrograma hierarquiza esta similaridade de modo que podemos ter uma visão bidimensional da similaridade ou dissimilaridade de todo o conjunto de amostras utilizado no estudo. Seguem os dendogramas das variáveis analisadas: Cluster Analysis of Variables: ESPVIDA; T_ENV; T_FUND15A17; T_MED18A20;... Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,9990 0, ,0832 0, ,5438 0, ,4161 0, ,8680 0, ,7329 0, ,6074 0, ,3509 0, ,9637 0, ,5288 0, ,1341 0, ,4151 0, ,9679 0, ,1619 0, ,9778 0, ,8659 0, ,4009 0, Final Partition Cluster 1 ESPVIDA T_FUND15A17 T_MED18A20 RDPC TRABCC T_AGUA T_LUZ IDHM IDHM_E 38

39 Similarity Similarity IDHM_L IDHM_R Cluster 2 T_ENV Cluster 3 RIND Cluster 4 TRABSC Cluster 5 AGUA_ESGOTO T_SLUZ Cluster 6 pesorur Cluster 7 pesourb Dendograma 01, com a utilização de 01 cluster Dendrogram Single Linkage; Correlation Coefficient Distance 58,40 72,27 86,13 ESPVIDA IDHM_L T_FUND15A17 T_MED18A20 RDPC IDHM_R IDHM IDHM_E TRABCC T_AGUA 100,00 T_LUZ T_ENV TRABSC AGUA_ESGOTO T_SLUZ pesorur pesourb RIND Variables Gráfico 24: Dendograma das variáveis com 01 cluster Fonte: Minitab 16 Dendograma 02, com a utilização de 4 clusters Dendrogram Single Linkage; Correlation Coefficient Distance 58,40 72,27 86,13 100,00 ESPVIDA IDHM_L T_FUND15A17 T_MED18A20 RDPC IDHM_R IDHM IDHM_E TRABCC T_AGUA T_LUZ T_ENV TRABSC AGUA_ESGOTO T_SLUZ pesorur pesourb RIND Variables Gráfico 25: Dendograma das variáveis com 04 clusteres Fonte: Minitab 16 39

40 Dendograma 03, com a utilização de 7 clusters Dendrogram Single Linkage; Correlation Coefficient Distance 58,40 Similarity 72,27 86,13 100,00 ESPVIDA IDHM_L T_FUND15A17 T_MED18A20 RDPC IDHM_R IDHM IDHM_E TRABCC T_AGUA Variables T_LUZ T_ENV TRABSC AGUA_ESGOTO T_SLUZ pesorur pesourb RIND Gráfico 26: Dendograma das variáveis com 07 clusteres Fonte: Minitab 16 Considerações: Quando analisamos a distribuição com 01 cluster, observa-se que as variáveis com maior similaridade são as que seguem. As demais variáveis se relacionam entre si, confirmando as análises anteriores. ESPVIDA e IDHM_L RDPC e IDHM_R IDHM e IDHM_E ÁGUA_ESGOTO e T_LUZ Quando analisamos a distribuição com 04 clusters, observa-se que as variáveis com maior similaridade se mantém como na distribuição anterior. As demais variáveis se relacionam entre si, confirmando as análises anteriores. Quando analisamos a distribuição com 07 clusters, observa-se que novamente as variáveis com maior similaridade se mantém. As demais variáveis se relacionam entre si, confirmando as análises anteriores. CAPÍTULO 4. ANÁLISES DE TENDÊNCIAS O presente trabalho tem por objetivo efetuar uma análise de tendência e projeções das variáveis temporais e quantitativas: Pessoas de 5 anos ou mais de idade alfabetizadas, por grupos de Idade; Número médio aluno por turma no ensino fundamental, na rede pública e Número médio aluno por turma no ensino fundamental, na rede privada. Todos os dados utilizados são referentes ao Brasil. Estas variáveis integram à Plataforma utilizada: IBGE SÉRIES HISTÓRICAS E ESTATÍSTICAS. A análise de cada variável está dividida em três partes. A primeira refere-se a análise do comportamento histórico através de gráficos. A segunda trata da análise de tendências, buscando 40

41 encontrar a função que melhor se adapte à cada uma das séries de variáveis analisadas. A terceira busca a elaboração e análise de projeções através de extrapolações estatísticas. O software estatístico utilizado é o MINITAB. 1ª Base de dados: Temas e subtemas» crianças, adolescentes e jovens» educação» educação» alfabetização e instrução» Pessoas de 5 anos ou mais de idade alfabetizadas, por grupos de Idade Tabela 01: Pessoas alfabetizadas com 05 anos ou mais Pessoas de 5 anos ou mais de idade Período Alfabetizadas , , , , , , , , , ,17 Fonte: IBGE.gov.br acesso em 31/03/2017 LINEAR Trend Analysis for Alfabetizadas Data Alfabetizadas Length 10 NMissing 0 Fitted Trend Equation Yt = 84, ,491*t Accuracy Measures MAPE 0, MAD 0, MSD 0,

42 Alfabetizadas Forecasts Period Forecast , , , , , , , , , , ,0 92,5 90,0 Trend Analysis Plot for Alfabetizadas Linear Trend Model Yt = 84, ,491*t Variable Actual Fits Forecasts Accuracy Measures MAPE 0, MAD 0, MSD 0, ,5 85, Index Gráfico 27: Trend Analysis for Alfabetizadas - linear Fonte: Minitab 16 QUADRATIC Trend Analysis for Alfabetizadas Data Alfabetizadas Length 10 NMissing 0 Fitted Trend Equation Yt = 85, ,178*t + 0,0284*t**2 Accuracy Measures MAPE 0, MAD 0, MSD 0, Forecasts Period Forecast , , , , , , ,551 42

43 Alfabetizadas , , ,244 Trend Analysis Plot for Alfabetizadas Quadratic Trend Model Yt = 85, ,178*t + 0,0284*t**2 100,0 97,5 95,0 92,5 Variable Actual Fits Forecasts Accuracy Measures MAPE 0, MAD 0, MSD 0, ,0 87,5 85, Index Gráfico 28: Trend Analysis for Alfabetizadas - Quadratic Fonte: Minitab 16 EXPONENTIAL Trend Analysis for Alfabetizadas Data Alfabetizadas Length 10 NMissing 0 Fitted Trend Equation Yt = 84,7086 * (1,00563**t) Accuracy Measures MAPE 0, MAD 0, MSD 0, Forecasts Period Forecast , , , , , , , , , ,

44 Alfabetizadas Trend Analysis Plot for Alfabetizadas Growth Curve Model Yt = 84,7086 * (1,00563**t) 95,0 92,5 90,0 Variable Actual Fits Forecasts Accuracy Measures MAPE 0, MAD 0, MSD 0, ,5 85, Index Gráfico 29: Trend Analysis for Alfabetizadas - Exponential Fonte: Minitab 16 S-CURVE Trend Analysis for Alfabetizadas Data Alfabetizadas Length 10 NMissing 0 Fitted Trend Equation Yt = (10**3) / (12,2919-0,545654*(1,07812**t)) Accuracy Measures MAPE 0, MAD 0, MSD 0, Forecasts Period Forecast , , , , , , , , , ,669 44

45 Alfabetizadas 102,5 100,0 97,5 95,0 92,5 90,0 87,5 Trend Analysis Plot for Alfabetizadas S-Curve Trend Model Yt = (10**3) / (12,2919-0,545654*(1,07812**t)) Variable Actual Fits Forecasts Curve Parameters Intercept 77,8964 Asymptote 81,3544 Asym. Rate 1,0781 Accuracy Measures MAPE 0, MAD 0, MSD 0, , Index Gráfico 30: Trend Analysis for Alfabetizadas S-Curve Fonte: Minitab 16 Pessoas de 5 anos ou mais de idade alfabetizadas, por grupos de Idade Indicador LINEAR QUADRATIC EXPONENTIAL S- CURVE MAPE 0, , , , MAD 0, , , , MSD 0, , , , Quadro 05: Comparativo pessoas alfabetizadas Fonte: elaborado pelo autor 4.1. Entendendo o Conceito dos Indicadores Análise: Erro percentual absoluto médio (MAPE) Expressa precisão como porcentagem do erro. Como esse número é uma porcentagem, ele pode ser mais fácil de compreender do que outras estatísticas. Desvio absoluto médio (MAD) Expressa precisão nas mesmas unidades dos dados, o que ajuda a conceituar a magnitude do erro. Desvio quadrado médio (MSD) Uma medida comumente usada da exatidão dos valores de séries temporais ajustados Entendendo os Conceitos dos Gráficos Análise: Linear: Análise de tendências por padrão. 45

46 Quadratic: O modelo de tendência quadrática explicar a curvatura simples dos dados Exponential: O modelo exponencial de tendência de crescimento explica o crescimento exponencial ou decadência. S-curve: O modelo de tendência da curva S se ajusta ao modelo de tendência logística Pearl-Reed. Ao analisarmos os índices apresentados no MAPE, MAD e MSD, sugere-se, para esta base de dados, a aplicação da matriz S-CURVE, pois, por se tratar de indicadores relacionados a erros, os resultados apresentados nessa matriz são menores quando comparados com as demais. 2ª Base de dados: Temas e Subtemas» educação» qualidade da oferta de ensino» Número médio aluno por turma no ensino fundamental, na rede pública. Tabela 02: Média por aluno no fundamental rede pública Número médio aluno por turma Período Rede publica de ensino , , , , , , , ,4 Fonte: IBGE.gov.br acesso em 31/03/2017 LINEAR Trend Analysis for Rede publica de ensino Data Rede publica de ensino Length 8 NMissing 0 Fitted Trend Equation Yt = 34,09-0,959524*t Accuracy Measures MAPE 3,48682 MAD 1,

47 Rede publica de ensino MSD 1,41577 Forecasts Period Forecast , , , , , , , , , , Trend Analysis Plot for Rede publica de ensino Linear Trend Model Yt = 34,09-0,959524*t Variable Actual Fits Forecasts Accuracy Measures MAPE 3,48682 MAD 1,05000 MSD 1, Index QUADRATIC Gráfico 31: Trend analysis media aluno fundamental rede pública - Linear Fonte: Minitab 16 Trend Analysis for Rede publica de ensino Data Rede publica de ensino Length 8 NMissing 0 Fitted Trend Equation Yt = 37,11-2,770*t + 0,2012*t**2 Accuracy Measures MAPE 2,01593 MAD 0,60655 MSD 0,56574 Forecasts Period Forecast , , , , , ,

48 Rede publica de ensino , , , , Trend Analysis Plot for Rede publica de ensino Quadratic Trend Model Yt = 37,11-2,770*t + 0,2012*t**2 Variable Actual Fits Forecasts Accuracy Measures MAPE 2,01593 MAD 0,60655 MSD 0, Index Gráfico 32: Trend analysis media aluno fundamental rede pública Quadratic Fonte: Minitab 16 EXPONENTIAL Trend Analysis for Rede publica de ensino Data Rede publica de ensino Length 8 NMissing 0 Fitted Trend Equation Yt = 34,1682 * (0,96916**t) Accuracy Measures MAPE 3,27351 MAD 0,99170 MSD 1,30120 Forecasts Period Forecast , , , , , , , , , ,

49 Rede publica de ensino Trend Analysis Plot for Rede publica de ensino Growth Curve Model Yt = 34,1682 * (0,96916**t) Variable Actual Fits Forecasts Accuracy Measures MAPE 3,27351 MAD 0,99170 MSD 1, Index Gráfico 33: Trend analysis media aluno fundamental rede pública - Exponential Fonte: Minitab 16 S-CURVE Trend Analysis for Rede publica de ensino Data Rede publica de ensino Length 8 NMissing 0 Fitted Trend Equation Yt = (10**3) / (30, ,64557*(1,10115**t)) Accuracy Measures MAPE 3,29506 MAD 1,11651 MSD 4,82774 Forecasts Period Forecast , , , , , , , , , ,

50 Rede publica de ensino Trend Analysis Plot for Rede publica de ensino S-Curve Trend Model Yt = (10**3) / (30, ,64557*(1,10115**t)) Variable Actual Fits Forecasts Curve Parameters Intercept 29,9770 Asymptote 32,5591 Asym. Rate 1,1011 Accuracy Measures MAPE 3,29506 MAD 1,11651 MSD 4, Index Gráfico 34: Trend analysis media aluno fundamental rede pública S-Curve Aluno fundamental rede pública QUADRO COMPARATIVO Número médio aluno por turma rede pública de ensino Indicador LINEAR QUADRATIC EXPONENTIAL S-CURVE MAPE 3, , , ,29506 MAD 1, , , ,11651 MSD 1, , , ,82774 Fonte: Elaborado pelo autor Análise: Tomando-se como base os conceitos abordados no estudo anterior, e ao analisarmos os índices apresentados no MAPE, MAD e MSD sugere-se, para esta base de dados, a aplicação da matriz QUADRATIC, pois, por se tratar de indicadores relacionados a erros, os resultados apresentados nessa matriz são menores quando comparados com as demais. 3ª Base de dados : Temas e subtemas» educação» qualidade da oferta de ensino» Número médio aluno por turma no ensino fundamental, na rede privada Tabela 03: Média aluno fundamental rede privada Número médio aluno por turma Período Rede privada de ensino , ,8 50

51 Rede privada de ensino , , , , ,3 Fonte: IBGE.gov.br acesso em 31/03/2017 LINEAR Trend Analysis for Rede privada de ensino Data Rede privada de ensino Length 8 NMissing 0 Fitted Trend Equation Yt = 22,757-0,207143*t Accuracy Measures MAPE 1,02564 MAD 0,22500 MSD 0,06911 Forecasts Period Forecast , , , , , , , , , ,0286 Trend Analysis Plot for Rede privada de ensino Linear Trend Model Yt = 22,757-0,207143*t Variable Actual Fits Forecasts Accuracy Measures MAPE 1,02564 MAD 0,22500 MSD 0, Index Gráfico 35: Trend Analysis média aluno fundamental rede privada - Linear Fonte: Minitab 16 51

52 Rede privada de ensino QUADRATIC Trend Analysis for Rede privada de ensino Data Rede privada de ensino Length 8 NMissing 0 Fitted Trend Equation Yt = 23,525-0,668*t + 0,0512*t**2 Accuracy Measures MAPE 0, MAD 0, MSD 0, Forecasts Period Forecast , , , , , , , , , , Trend Analysis Plot for Rede privada de ensino Quadratic Trend Model Yt = 23,525-0,668*t + 0,0512*t**2 Variable Actual Fits Forecasts Accuracy Measures MAPE 0, MAD 0, MSD 0, Index Gráfico 36: Trend Analysis média aluno fundamental rede privada - Quadratic Fonte: Minitab 16 EXPONENTIAL Trend Analysis for Rede privada de ensino Data Rede privada de ensino Length 8 NMissing 0 Fitted Trend Equation 52

53 Rede privada de ensino Yt = 22,7601 * (0,99065**t) Accuracy Measures MAPE 1,00751 MAD 0,22115 MSD 0,06708 Forecasts Period Forecast , , , , , , , , , ,2207 Trend Analysis Plot for Rede privada de ensino Growth Curve Model Yt = 22,7601 * (0,99065**t) Variable Actual Fits Forecasts Accuracy Measures MAPE 1,00751 MAD 0,22115 MSD 0, Index S-CURVE Gráfico 37: Trend Analysis média aluno fundamental rede privada - Exponential Fonte: Minitab 16 Trend Analysis for Rede privada de ensino Data Rede privada de ensino Length 8 NMissing 0 Fitted Trend Equation Yt = (10**2) / (4, ,279419*(0,714531**t)) Accuracy Measures MAPE 0, MAD 0, MSD 0, Forecasts Period Forecast ,

54 Rede privada de ensino , , , , , , , , ,2987 Trend Analysis Plot for Rede privada de ensino S-Curve Trend Model Yt = (10**2) / (4, ,279419*(0,714531**t)) 23,0 22,5 22,0 Variable Actual Fits Forecasts Curve Parameters Intercept 20,0997 Asymptote 21,2957 Asym. Rate 0,7145 Accuracy Measures MAPE 0, MAD 0, MSD 0, , Index Gráfico 38: Trend Analysis média aluno fundamental rede privada S-Curve Fonte: Minitab 16 Número médio aluno por turma rede privada de ensino Indicador LINEAR QUADRATIC EXPONENTIAL S- CURVE MAPE 1, , , , MAD 0, , , , MSD 0, , , , Quadro 07: Comparativo média aluno fundamental rede privada Análise: Tomando-se como base os conceitos abordados nos estudos anteriores, e ao analisarmos os índices apresentados no MAPE, MAD e MSD sugere-se, para esta base de dados, a aplicação da matriz QUADRATIC, pois, por se tratar de indicadores relacionados a erros, os resultados apresentados nessa matriz são menores quando comparados com as demais. Considerações: O objetivo deste estudo foi mapear alguns indicadores da educação brasileira e verificar que tipos de matrizes tendem a ser mais adequadas para tal análise. Os resultados apurados são de uma certa forma, incompatíveis com o que se esperaria da educação em nosso país. A educação básica compreende três níveis, o infantil, o fundamental e o médio. A tendência é que o ensino médio, de forma direta, acabe refletindo os problemas que veem das séries iniciais. Buscando um recorte desse cenário, no caso pontual a formação de professores,têm-se: 54

55 acesso em 17/06/2017 Brasil OPCAO Brasil Privado 89,4 89,1 89,9 90,1 91,3 93,2 96,9 95,9 Brasil Publico 87,6 88,2 88, ,8 91,7 95,3 95,3 Quadro 08: Professores do ensino médio com formação superior Fonte: IBGE.gov.br, adaptado pelo autor Os dados acima referem-se ao percentual de professores com formação superior que lecionam no ensino médio. Entendendo-se que o ideal (e legal) é 100%, melhoramos bastante nos últimos anos, mas ainda não atingimos esse percentual. O fato relativamente positivo é que não há discrepância entre os ensinos público e privado. CAPÍTULO 5. REGRESSÃO LINEAR Tem por objetivo efetuar uma análise de regressões multivariadas tomando como base as variáveis com maior grau de correlação, conforme análise feita na parte 02. Iniciamos, na primeira parte, com o entendimento dos dados, incluindo a definição dos indivíduos e das variáveis, suas classificações em variáveis categóricas ou quantitativas, os significados e unidades de medida, além da apresentação da tabela de dados. Na segunda parte, analisamos as variáveis quanto à sua forma de distribuição. Na sequência passamos para a análise da relação entre variáveis, incluindo gráficos de dispersão e matrizes de correlação, buscando encontrar as equações de regressão linear. O software estatístico utilizado é o MINITAB. Resgatando a análise de dados anterior: Para um melhor entendimento deste estudo, buscou-se as variáveis que entre sim, apresentaram maior grau de correlação, conforme abordado nos estudos anteriores. Para determinação desse grau de correlação, adotou-se as seguintes premissas: Foram invalidadas as correlações que apresentaram indicadores (denominadores) diferentes de 0,000 Correlações utilizadas considerando variáveis maior ou igual a 0,800, positiva ou negativa. Atendidas às condições anteriores, chegou-se nas seguintes correlações: 5.1. Correlações das Variáveis Validades Variável Variável Grau de Correlação T_MED18A20 T_FUND15A17 0,833 IDHM ESPVIDA 0,852 IDHM T_FUND15A17 0,832 IDHM T_MED18A20 0,851 IDHM RDPC 0,908 55

56 IDHM_E T_FUND15A17 0,855 IDHM_E T_MED18A20 0,877 IDHM_L ESPVIDA 1,000 IDHM_R ESPVIDA 0,834 IDHM_R RDPC 0,962 IDHM_E IDHM 0,951 IDHM_L IDHM 0,852 IDHM_R IDHM 0,948 IDHM_R IDHM_E 0,820 IDHM_R IDHM_L 0,834 Devido à abrangência dos indicadores IDHM, IDHM_E, IDHM_R e IDHM_L, com o alto grau de correlação entre eles e entre as variáveis, adotou-se, então, como premissa para a análise de regressão, a exclusão desses indicadores, permanecendo, então, as seguintes variáveis: Código Indicador Abrangência ESPVIDA Esperança de vida ao nascer Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. T_FUND15A17 Percentual da população de 15 a Razão entre a população de 15 a 17 anos de idade que concluiu 17 anos com fundamental o ensino fundamental, em qualquer de suas modalidades completo (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. T_MED18a20 Percentual da população de 18 a Razão entre a população de 18 a 20 anos de idade que já 20 anos de idade com o ensino concluiu o ensino médio em qualquer de suas modalidades médio completo (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. As pessoas de 18 a 20 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. RDPC Renda per capita média Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Valores em reais de 01/agosto de Quadro 09: Variáveis com grau de correlação sem os indicadores IDHM Fonte: Elaborador pelo autor 5.2. Variável Dependente Tipo Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Medida Anos Percentual Percentual Absoluto São as Variáveis de interesse em um experimento (aquelas medidas ou observadas). São também chamadas de variáveis de resposta. Nesta análise, trabalharemos com a variável ESPVIDA Expectativa de vida ao nascer, que nas demonstrações e alimentações no Minitab será denominada RESPONSE 5.3. Variável Independente São as outras variáveis no experimento que afetam a resposta e podem ser definidas ou medidas pelo experimentado. São também chamadas variáveis explanatórias. Na alimentação no Minitab serão denominadas predictors (preditoras) Utilizando e demonstrando no Minitab Regression Analysis: ESPVIDA versus T_FUND15A17; T_MED18A20; RDPC The regression equation is ESPVIDA = 67,4 + 0,0406 T_FUND15A17 + 0,00576 T_MED18A20 + 0,00666 RDPC Predictor Coef SE Coef T P 56

57 Constant 67,3735 0, ,66 0,000 T_FUND15A17 0, , ,07 0,000 T_MED18A20 0, , ,02 0,044 RDPC 0, , ,20 0,000 S = 1,58447 R-Sq = 65,1% R-Sq(adj) = 65,1% Analysis of Variance Source DF SS MS F P Regression ,0 8674,3 3455,14 0,000 Residual Error ,2 2,5 Total ,2 Source DF Seq SS T_FUND15A ,7 T_MED18A ,9 RDPC ,4 Unusual Observations Obs T_FUND15A17 ESPVIDA Fit SE Fit Residual St Resid ,4 66, ,8765 0,0443-3,2665-2,06R ,3 73, ,3692 0,0511 4,5308 2,86R ,6 73, ,1935 0,0465 3,5865 2,26R... R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage. Esta análise apresenta um grau de acerto (probabilidade estatística) de 65,1%, muito provável em virtude da correlação que existe entre as varáveis selecionadas, lembrando que a maior associação foi o indicador IDHM e suas variáveis, não contempladas neste estudo. SCATERPLOT Explora a relação potencial entre um par de variáveis contínuas. Esses padrões podem revelar uma associação entre as variáveis e ajudar a determinar o próximo passo das suas análises de dados Response (ESPVIDA) com as 03 variáveis Predictors 57

58 Scatterplot of ESPVIDA vs T_FUND15A17; T_MED18A20; RDPC T_FUND15A17 T_MED18A ESPVIDA RDPC Gráfico 39: Scatterplot com predictor ESPVIDA Fonte: Minitab 16 A visualização gráfica nos permite ratificar a correlação e significância que a variável RDPC tem em relação à ESPVIDA. Percebemos que a distribuição das outras duas variáveis apresenta um grau maior de dispersão. Podemos observar, por exemplo, que o ponto com maior distribuição nessa variável, é a cidade de São Caetano do Sul/SP, que tem a maior renda per capita dentre todos os municípios do Brasil, R$ 2.043,74 e é o 19º em Expectativa de Vida. REGRESSÃO STEPWISE É uma ferramenta automática usada nos estágios exploratórios da construção de modelos para identificar um subconjunto útil de preditores. O processo sistematicamente adiciona a variável mais significante ou remove a variável menos significante durante cada etapa. acesso em 07/04/ Resultado das variáveis estudadas Stepwise Regression: ESPVIDA versus T_FUND15A17; T_MED18A20; RDPC Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is ESPVIDA on 3 predictors, with N = 5565 Step Constant RDPC T-Value P-Value T_FUND15A17 T-Value 1 68, , ,37 0, ,25 0,000 0, ,39 0,000 0, ,20 0,000 0, ,82 0, ,07 58

59 P-Value 0,000 0,000 T_MED18A20 0,0058 T-Value 2,02 P-Value 0,044 S 1,66 1,58 1,58 R-Sq 61,49 65,06 65,08 R-Sq(adj) 61,49 65,05 65,06 Mallows Cp 571,8 6,1 4,0 * NOTE * Command canceled. Percebemos que a variável de maior impacto sobre a response ESPVIDA (expectativa de vida) é a RDPC (renda per capita média, com representatividade de 61,49% Regressão Utilizando a Response com a Predictor de maior Representativa Regression Analysis: ESPVIDA versus RDPC The regression equation is ESPVIDA = 68,8 + 0,00864 RDPC Predictor Coef SE Coef T P Constant 68,8236 0, ,18 0,000 RDPC 0, , ,25 0,000 S = 1,66364 R-Sq = 61,5% R-Sq(adj) = 61,5% Analysis of Variance Source DF SS MS F P Regression ,82 0,000 Residual Error Total Unusual Observations Obs RDPC ESPVIDA Fit SE Fit Residual St Resid , ,7886 0,0331-3,5486-2,13R , ,4998 0,0354-3,8898-2,34R , ,8720 0,0408 4,0280 2,42R. R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage. O baixo valor do P-value nos mostra que as variáveis são significativas para a regressão Dendograma das Variáveis Correlacionadas É utilizado para ilustrar as informações de uma tabela de amalgamação (o que liga uma ou mais variáveis) na forma de um diagrama de árvore. Cluster Analysis of Variables: ESPVIDA; T_FUND15A17; T_MED18A20; RDPC Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new 59

60 Similarity Step clusters level level joined cluster cluster ,6586 0, ,2088 0, ,8414 0, Dendrogram Single Linkage; Correlation Coefficient Distance 85,84 90,56 95,28 100,00 ESPVIDA RDPC T_FUND15A17 Variables T_MED18A20 Gráfico 40: Dendograma das variáveis com similaridades Fonte: Minitab 16 Considerações: Constata-se, a correlação existente a Response (ESPVIDA) e a Preditora com maior impacto (RDPC). Em virtude da pequena amostra da base de dados estudada, quando se observou a maior similaridade entre os IDHM, IDHM_L, IDHM_R e IDHM_E e sendo que por opção, estes foram retirados da análise de regressão, constatou-se que a correlação com maior impacto está na response ESPVIDA com a predictor RDPC. No gráfico, o ponto (cidade) com maior distribuição é a cidade de São Caetano do Sul /SP, que validada essa correlação, pois é a maior renda per capita dentre todos os municípios do Brasil e uma das primeiras em expectativa de vida. Olhando os indicadores do ensino médio neste agrupamento, verificou-se que a similaridade com a response Expectativa de Vida é pequena (0, ) e sua maior correlação é com a variável Ensino Fundamental, conforme pode-se observar no dendograma anterior, com cerca de 92% de similiaridade entre ambas, reforçando, neste tipo de análise, com estas variáveis. CAPÍTULO 6. TESTES DE HIPÓTESES E INTERVALOR DE CONFIANÇA Tem por objetivo efetuar uma análise de comparação utilizando os testes de hipóteses e intervalos de confiança. O principal propósito é comparar as varáveis escolhidas na base de dados original, tendo como principal referência o IDHM_L (Longevidade) e outros 05 variáveis que tem correlação com esse indicador. Os fatores a serem analisados são as regiões do Brasil. O software estatístico utilizado é o MINITAB Análise de Dados 60

61 Buscando um foco direto nos indicadores que interessam a este pesquisador, sobretudo àqueles que podem ter uma ligação direta com o desenvolvimento da futura tese, foram selecionadas as seguintes variáveis, que de forma direta ou indireta também podem ter ligação com o foco de estudo (ensino médio) incluindo-se a variável categórica REGIÃO Resgatando as Variáveis Código Indicador Abrangência ESPVIDA Esperança de vida ao nascer Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. T_ENV Taxa de envelhecimento Razão entre a população de 65 anos ou mais de idade e a população total multiplicado por 100. RDPC Renda per capita média Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Valores em reais de 01/agosto de AGUA_ESGOTO Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados T_SLUZ IDHM_L % de pessoas em domicílios sem energia elétrica Índice de Desenvolvimento Humano Municipal - Dimensão Longevidade Razão entre as pessoas que vivem em domicílios cujo abastecimento de água não provem de rede geral e cujo esgotamento sanitário não é realizado por rede coletora de esgoto ou fossa séptica e a população total residente em domicílios particulares permanentes, multiplicada por 100. São considerados apenas os domicílios particulares permanentes. Razão entre as pessoas que vivem em domicílios sem energia elétrica e população total residente em domicílios particulares permanentes multiplicado por 100. Índice da dimensão Longevidade, é um dos 3 índices que compõem o IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do indicador) - (valor mínimo)] / [(valor máximo) - (valor mínimo)], onde os valores mínimo e máximo são 25 e 85 anos, respectivamente. Tipo Variável Quantitativa Medida Anos Variável Percentual Quantitativa Variável Absoluto Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Município Nome do Município Nome do Município Categórica n/a Percentual Percentual Índice UF Unidade da Federação (Estado) Unidade da Federação (Estado) Categórica n/a Região Nome das regiões do Brasil Norte, Nordeste, Centro-Oeste, Sudeste e Sul Categórica n/a Variável Dependente São as Variáveis de interesse em um experimento (aquelas medidas ou observadas). São também chamadas de variáveis de resposta, ou RESPONSE A saber: ESPVIDA, T_ENV, RDPC, AGUA_ESGOTO, T_SLUZ e IDHM_l Variável Independente 61

62 ESPVIDA São as outras variáveis no experimento que afetam a resposta e podem ser definidas ou medidas pelo experimentado. São também chamadas variáveis explanatórias. Na alimentação no Minitab, para este tipo de análise, são denominadas FACTOR A saber: NORTE, NORDESTE, CENTRO-OESTE, SUDESTE e SUL Variável ESPVIDA - Esperança de vida ao nascer One-way ANOVA: ESPVIDA versus Região Source DF SS MS F P Região , , ,02 0,000 Error ,57 2,70 Total ,19 S = 1,642 R-Sq = 62,52% R-Sq(adj) = 62,50% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste ,340 1,108 (*) Nordeste ,255 1,809 *) Norte ,818 1,724 (*) Sudeste ,686 1,604 (* Sul ,116 1,570 (* ,5 72,0 73,5 75,0 Pooled StDev = 1,642 80,0 Boxplot of ESPVIDA 77,5 75,0 72,5 70,0 67,5 65,0 Centro-Oeste Nordeste Norte Região Sudeste Sul Gráfico 41: Boxplot da variável ESPVIDA Fonte: Minitab 16 Indicadores Expoente (+) SUL, n=1188 Expoente (-) NORDESTE, n=1794 Q1 74, ,05 Mediana 75,15 70,445 Q3 76, ,49 Média 75, ,

63 T_ENV Percebe-se que na leitura por região, os melhores indicadores estão na região SUL e os mais críticos na região NORDESTE e, na análise individual dos municípios, e nesta região que estão os dois com a menor taxa de perspectiva de envelhecimento ao nascer, a saber: Cacimbas (Paraíba) e Roteiro (Alagoas) com taxa de 65,30. Na região SUL, as médias e medianas estão muitos próximas, assim como os quartis, o que sinaliza que não há muita dispersão entre todos os municípios dessa região. Essa mesma distribuição encontramos na região Nordeste, mas com taxas bem inferiores se comparadas com as outras regiões. Variável T_ENV - Taxa de envelhecimento One-way ANOVA: T_ENV versus Região Source DF SS MS F P Região , ,36 439,95 0,000 Error ,31 4,46 Total ,76 S = 2,112 R-Sq = 24,04% R-Sq(adj) = 23,99% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 466 7,146 2,314 (-*) Nordeste ,087 1,869 *) Norte 449 5,237 1,637 (-*) Sudeste ,083 2,116 (*) Sul ,588 2,496 (*) ,0 7,2 8,4 9,6 Pooled StDev = 2,112 Boxplot of T_ENV Centro-Oeste Nordeste Norte Região Sudeste Sul Gráfico 42: Boxplot da variável T_ENV Fonte: Minitab 16 63

64 RDPC Indicadores Expoente (+) SUL, n=1188 Expoente (-) NORTE, n=449 Q1 7,8525 3,915 Mediana 9,43 5,18 Q3 11,11 6,36 Média 9, ,2374 Percebe-se que na leitura por região, os melhores indicadores estão na região SUL e os mais críticos na região NORTE e, mas na análise individual dos municípios, o de pior resultado está localizado na região Nordeste, a saber: Luis Eduardo Magalhães (Bahia), com índice de 1,50. Na região SUL, as médias e medianas estão muitos próximas, o que sinaliza que há distribuição relativamente uniforme entre os municípios dessa região. Essa mesma distribuição encontramos na região Norte, mas com taxas bem inferiores se comparadas com as outras regiões. Variável RDPC Renda per capita One-way ANOVA: RDPC versus Região Source DF SS MS F P Região ,18 0,000 Error Total S = 171,1 R-Sq = 50,59% R-Sq(adj) = 50,55% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste ,6 161,9 (*) Nordeste ,9 97,7 (*) Norte ,1 141,1 (-*) Sudeste ,6 214,9 *) Sul ,2 200,0 (* Pooled StDev = 171,1 Boxplot of RDPC Centro-Oeste Nordeste Norte Região Sudeste Sul Gráfico 43: Boxplot da variável RDPC Fonte: Minitab 16 64

65 AGUA_ESGOTO Indicadores Expoente (+) SUL, n=1188 Expoente (-) NORDESTE, n=1794 Q1 560, ,967 Mediana 675, ,295 Q3 823, ,005 Média 704, ,919 Percebe-se que na leitura por região, os melhores indicadores estão na região SUL e os mais críticos na região NORDESTE e, na análise individual dos municípios, o de pior resultado está localizado nessa mesma região, a saber: Marajá do Sena (Maranhão), com índice de 96,25. Na região SUL, há uma dispersão relativamente significativa, ou seja, os números de média e mediana e, sobretudo, os desvios padrões, sinalizam que há uma pequena dispersão entre os municípios, mas mesmo assim, os de menor resultado, apresentam rendas maiores que a média de outros estados/regiões. Variável ÁGUA_ESGOTO - Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados One-way ANOVA: AGUA_ESGOTO versus Região Source DF SS MS F P Região , ,7 1151,14 0,000 Error ,4 90,2 Total ,1 S = 9,499 R-Sq = 45,30% R-Sq(adj) = 45,26% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 466 4,738 5,732 (*) Nordeste ,733 12,951 *) Norte ,888 18,225 (*) Sudeste ,231 4,066 *) Sul ,550 2,808 (*) ,0 14,0 21,0 28,0 Pooled StDev = 9, Boxplot of AGUA_ESGOTO Centro-Oeste Nordeste Norte Região Sudeste Sul Gráfico 44: Boxplot da variável ÁGUA_ESGOTO Fonte: Minitab 16 65

66 T_SLUZ Indicadores Expoente (+) SUL, n=1188 Expoente (-) NORTE, n=449 Q1 0,19 9,69 Mediana 0,64 22,2 Q3 1,74 38,69 Média 1, ,8822 Novamente, percebe-se que na leitura por região, os melhores indicadores estão na região SUL e os mais críticos, desta vez, na região NORTE e, na análise individual dos municípios, o de pior resultado está localizado nessa região, a saber: Chaves (Pará), com 85,36. Na região SUL, há uma distância relativamente grande entre a mediana e a média, sendo que a média está muito próxima do Quartil 03 o que sinaliza que não há uma distribuição relativamente uniforme entre os municípios dessa região. O valor da mediana valida essa leitura. Essa mesma distribuição encontramos na região Norte, mas com taxas bem superiores se comparadas com as outras regiões, ou seja, há muito mais municípios com pessoas morando com condições de água e esgoto em condições inadequadas. Variável T_LUZ - % de pessoas em domicílios sem energia elétrica One-way ANOVA: T_SLUZ versus Região Source DF SS MS F P Região , ,5 456,34 0,000 Error ,1 27,3 Total ,9 S = 5,229 R-Sq = 24,72% R-Sq(adj) = 24,66% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 466 2,323 4,979 (-*) Nordeste ,214 6,737 (*) Norte ,386 10,850 (-*-) Sudeste ,763 1,744 (* Sul ,515 1,052 (*) ,0 6,0 9,0 12,0 Pooled StDev = 5, Boxplot of T_SLUZ Centro-Oeste Nordeste Norte Região Sudeste Sul Gráfico 45: Boxplot da variável T_SLUZ Fonte: Minitab 16 66

67 IDHM_L Indicadores Expoente (+) SUL, n=1188 Expoente (-) NORTE, n=449 Q1 0,0125 3,3 Mediana 0,19 7,8 Q3 0,56 16,81 Média 0, ,3856 Novamente, percebe-se que na leitura por região, os melhores indicadores estão na região SUL e os mais críticos, desta vez, na região NORTE e, na análise individual dos municípios, o de pior resultado está localizado nessa região, a saber: Uirimatã (Roraima), com 72,59, indicador muito alto e muito distante, inclusive da média da região. Evidencia-se um ponto muito fora da curva. Variável IDHM_L - Índice de Desenvolvimento Humano Municipal - Dimensão Longevidade One-way ANOVA: IDHM_L versus Região Source DF SS MS F P Região 4 6, , ,02 0,000 Error , ,00075 Total ,10785 S = 0,02737 R-Sq = 62,51% R-Sq(adj) = 62,49% Level N Mean StDev Centro-Oeste 466 0, ,01846 Nordeste , ,03016 Norte 449 0, ,02871 Sudeste , ,02674 Sul , ,02616 Individual 95% CIs For Mean Based on Pooled StDev Level Centro-Oeste (*) Nordeste (* Norte (*) Sudeste *) Sul *) ,775 0,800 0,825 0,850 Pooled StDev = 0, ,90 Boxplot of IDHM_L 0,85 0,80 0,75 0,70 Centro-Oeste Nordeste Norte Região Sudeste Sul Fonte: M Gráfico 46: Boxplot da variável IDHM_L Minitab 16 67

68 Indicadores Expoente (+) SUL, n=1188 Expoente (-) NORDESTE, n=1794 Q1 0,817 0,734 Mediana 0,836 0,7575 Q3 0,853 0,775 Média 0,8353 0,7543 Como nos outros indicadores, a Região SUL apresenta o melhor índice de Longevidade, comparando-a com as outras regiões do Brasil e a região Nordeste apresenta os indicadores mais críticos. Pelos resultados e indicadores estudados, podemos validar as hipóteses de que os factors abordados (renda, expectativa de vida, envelhecimento, condições de água, saneamento e luz) convergem entre si e têm correlação e relação de causa com o IDHM-L Em outro recorte para análise, faremos a comparação com os testes de hipóteses, agora abordando os estados brasileiros. One-way ANOVA: IDHM_L versus UF Source DF SS MS F P UF 26 7, , ,70 0,000 Error , ,00069 Total ,10785 S = 0,02619 R-Sq = 65,79% R-Sq(adj) = 65,63% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Acre 22 0, ,02769 (-*--) Alagoas 102 0, ,03242 (*) Amapá 16 0, ,01969 (--*-) Amazonas 62 0, ,02660 (*) Bahia 417 0, ,03016 (* Brasilia 1 0,87300 * ( * ) Ceará 184 0, ,02209 *) Esp. Santo 78 0, ,01743 (*) Góias 246 0, ,01567 (*) Maranhão 217 0, ,02812 (*) Mato Grosso 141 0, ,01800 *) MG do Sul 78 0, ,02399 (*) Minas Gerais 853 0, ,02985 (* Pará 143 0, ,02121 (*) Paraíba 223 0, ,03064 (*) Paraná 399 0, ,02097 *) Pernambuco 185 0, ,03498 (*) Piaui 224 0, ,02803 (*) RG do Sul 496 0, ,02227 *) Rio de Janeiro 92 0, ,01816 (*) RN do Norte 167 0, ,02651 (* Rondônia 52 0, ,02439 (-*) Roraima 15 0, ,01531 (--*-) São Paulo 645 0, ,02195 *) Sergipe 75 0, ,02831 (*) Sta Catarina 293 0, ,02933 *) Tocantins 139 0, ,03438 (*) ,750 0,800 0,850 0,900 Pooled StDev = 0,

69 IDHM_L 0,90 Boxplot of IDHM_L 0,85 0,80 0,75 0,70 Acre Alagoas Amapá Amazonas Bahia Brasilia Ceará Esp. Santo Góias Maranhão Mato Grosso MG do Sul Minas Gerais UF Pará Paraíba Paraná Pernambuco Piaui RG do Sul Rio de Janeiro Gráfico 47: Boxplot da variável IDHM_L por Estado Fonte: Minitab 16 RN do Norte Rondônia Roraima São Paulo Sergipe Sta Catarina Tocantins Considerações: Observando o boxplot do IDHM_L (Longevidade) e traçando uma linha aleatória, praticamente dividindo o eixo vertical em duas partes, encontramos na parte superior (cidades com melhores índices de longevidade) praticamente os estados das regiões SUL, SUDESTE e CENTR- OESTE, e na parte inferior (cidades com piores índices de longevidade), os da região NORTE e NORDESTE. Essa análise valida as hipóteses de relação existentes entre os responses escolhidos ESPVIDA, T_ENV, RDPC, AGUA_ESGOTO, T_SLUZ e IDHM_l com os factors explorados, as regiões brasileiras. Considerando a variável Ensino Médio: One-way ANOVA: T_MED18A20 versus Região Source DF SS MS F P Região ,15 0,000 Error Total S = 11,05 R-Sq = 42,59% R-Sq(adj) = 42,55% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste ,68 10,19 (*-) Nordeste ,96 8,78 (* Norte ,02 10,81 (*-) Sudeste ,14 12,77 (* Sul ,54 11,88 *) ,0 35,0 42,0 49,0 Pooled StDev = 11,05 69

70 T_MED18A20 Boxplot of T_MED18A Centro-Oeste Nordeste Norte Região Sudeste Sul Gráfico 48: Boxplot da variável Ensino Médio Fonte: Minitab 16 O resultado apresentado não é diferente da análise feita com o outro grupo de variáveis, ou seja, os melhores resultados encontram-se na região SUL (média 46,53), Sudeste (média 43,14), Centro-Oeste (36,68), Nordeste (24,02) e Norte (24,02). O outlier de maior expressão na região Sudeste é o munícipio de Monções no estado de SP e o de menor expressão da região SUL é o munícipio Dr. Ulysses, no estado do Paraná. 7. AMOSTRAGEM Tem por objetivo efetuar uma pesquisa por amostragem de dados dimensionadores do IDHM, representado pelos índices IDHM_L, EspVida, T_Env, RDPC, Agua_Esgoto, T_SLuz,, das cidades do Brasil, indicadores publicados pelo IBGE, senso 2010, portal Atlas Brasil. O software estatístico utilizado é o MINITAB. 7.1 Pesquisa por amostragem A pesquisa por amostragem foi feita com três amostras aleatórias: uma com 25 municípios, outra com 100 munícipios e a terceira com 400 municípios. Para cada amostra foram efetuadas análises exploratória de dados, utilizando a ferramenta BoxPlot, com o objetivo de ver com das amostragens tem mais peso quando validada. Utilizou-se como referência, os indicadores totais das 06 variáveis estudadas. 7.2 Amostra aleatória em 22/04/

71 Data Uma amostra aleatória é um subconjunto de uma população selecionado por um processo que torna todas as amostras de um determinado tamanho igualmente prováveis de ocorrer. Em estatística, amostras aleatórias são usadas pata fazer generalizações ou inferências sobre uma população. As amostras devem ser aleatórias para eliminar vícios de seleção. Vício de seleção significa que alguns sujeitos têm mais probabilidade de estarem na amostra do que outros sujeitos. Se a amostra for viciada você só poderá fazer inferências sobre assuntos na amostra, não para toda a população. 7.3 Construção no Minitab CALC / RANDOM DATE / SAMPLE FROM Variável ESPVIDA - Esperança de vida ao nascer One-way ANOVA: ESPVIDA; EspV25; EspV100; EspV400 Source DF SS MS F P Factor 3 49,25 16,42 2,28 0,077 Error ,62 7,19 Total ,87 S = 2,681 R-Sq = 0,11% R-Sq(adj) = 0,06% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ESPVIDA ,089 2,681 (*) EspV ,592 3,063 ( * ) EspV ,639 2,656 ( * ) EspV ,291 2,667 (----*---) ,60 73,20 73,80 74,40 Pooled StDev = 2,681 80,0 Boxplot of ESPVIDA; EspV25; EspV100; EspV400 77,5 75,0 72,5 70,0 67,5 65,0 ESPVIDA EspV25 EspV100 EspV400 Gráfico 49: Boxplot da variável ESPVIDA com 3 graus de amostragem Fonte: Minitab 16 71

72 Data Indicadores EspVida EspVida25 EspVida100 EspVida400 Média 73, , , ,2905 Mediana 73,47 74,02 74,2 73,7 Q1 71,15 71,46 72, ,4225 Q3 75,16 75,98 75,32 75,275 Para esta variável aleatória, observando os municípios nela contemplados, conforme podemos observar no gráfico, como não há uma dispersão uniforme atentando para a distribuição nos Quartil superior e Quartil Inferior, a amostragem que melhor reflete o resultado, tomando como base os indicadores absolutos desta variável (ESPVIDA), é a amostragem que utiliza 400 municípios, pois apresenta a menor diferença entre as médias e medianas (EspVida400 / EspVida), respectivamente 0,27 % e 0,31 % o que representaria uma pequena margem de erro, se assim fosse adotada. Variável T_Env - Taxa de envelhecimento One-way ANOVA: T_ENV; TEnv25; TEnv100; TEnv400 Source DF SS MS F P Factor 3 7,98 2,66 0,45 0,715 Error ,43 5,87 Total ,42 S = 2,424 R-Sq = 0,02% R-Sq(adj) = 0,00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev T_ENV ,397 2,423 (*) TEnv ,316 1,763 ( * ) TEnv ,675 2,587 ( * ) TEnv ,428 2,424 (----*---) ,50 8,00 8,50 9,00 Pooled StDev = 2,424 Boxplot of T_ENV; TEnv25; TEnv100; TEnv T_ENV TEnv25 TEnv100 TEnv400 Gráfico 50: Boxplot da variável T_ENV com 3 graus de amostragem Fonte: Minitab 16 72

73 Data Indicadores T_Env T_Env25 T_Env100 T_Env400 Média 8,3973 8,316 8,6745 8,4277 Mediana 8,38 8,33 8,45 8,375 Q1 6,78 7,105 7,075 6,9425 Q3 9,965 9,15 10,365 9,96 Para esta variável aleatória, observando os municípios nela contemplados, conforme podemos observar no gráfico, há uma dispersão bem uniforme nos Quartil superior e Quartil Inferior. A amostragem que melhor reflete o resultado, tomando como base os indicadores absolutos desta variável (T_Env), é a amostragem que utiliza 400 municípios, pois apresenta a menor diferença entre as médias e medianas (T_Env400 / T_Env), respectivamente 0,36 % e 0,01 % o que representaria uma pequena margem de erro, se assim fosse adotada. Variável RDPC Renda per capita média One-way ANOVA: RDPC; Rpc25; Rpc100; Rpc400 Source DF SS MS F P Factor ,27 0,283 Error Total S = 243,1 R-Sq = 0,06% R-Sq(adj) = 0,01% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev RDPC ,6 243,3 (-*) Rpc ,0 193,0 ( * ) Rpc ,2 237,7 ( * ) Rpc ,2 244,4 (----*----) Pooled StDev = 243,1 Boxplot of RDPC; Rpc25; Rpc100; Rpc RDPC Rpc25 Rpc100 Rpc400 Gráfico 51: Boxplot da variável RDPC com 3 graus de amostragem Fonte: Minitab 16 73

74 Data Indicadores RDPC RDPC25 RDPC100 RDPC400 Média 493, , , ,246 Mediana 467,65 380,52 372, ,565 Q1 281, ,36 262, ,485 Q3 650, , , ,085 Para esta variável aleatória, observando os municípios nela contemplados, conforme podemos observar no gráfico, como não há uma dispersão uniforme atentando para a distribuição nos Quartil superior e Quartil Inferior, a amostragem que melhor reflete o resultado, tomando como base os indicadores absolutos desta variável (RDPC), é a amostragem que utiliza 400 municípios, pois apresenta a menor diferença entre as médias e medianas (RDPC400 / RDPC), respectivamente 1,49 % e 4,29 % o que representaria a margem de erro, se assim fosse adotada. Variável ÁGUA_ESGOTO - Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados One-way ANOVA: AGUA_ESGOTO; AgEs25; AgEs100; AgEs400 Source DF SS MS F P Factor ,72 0,539 Error Total S = 12,86 R-Sq = 0,04% R-Sq(adj) = 0,00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev AGUA_ESGOTO ,20 12,84 (*) AgEs ,45 17,27 ( * ) AgEs ,92 11,69 ( * ) AgEs ,61 13,08 (---*---) ,0 9,0 12,0 15,0 Pooled StDev = 12,86 90 Boxplot of AGUA_ESGOTO; AgEs25; AgEs100; AgEs AGUA_ESGOTO AgEs25 AgEs100 AgEs400 Gráfico 52: Boxplot da variável ÁGUA_ESGOTO Com 3 graus de amostragem Fonte: Minitab 16 74

75 Indicadores AG_ESG AG_ESG25 AG_ESG100 AG_ESG400 Média 9, ,4452 7,9152 9,61265 Mediana 3,26 2,46 2,595 4,144 Q1 0,53 0,31 0,325 0,4925 Q3 13,035 15,645 10,99 13,495 Para esta variável aleatória, observando os municípios nela contemplados, conforme podemos observar no gráfico, há uma grande dispersão atentando para a distribuição nos Quartil superior e Quartil Inferior. Neste caso especifico, a amostragem que melhor reflete o resultado, tomando como base os indicadores absolutos desta variável (Agua_Esgoto), é a amostragem que utiliza 100 municípios, pois apresenta a menor diferença entre as medianas (AG_ESG100 / AG_ESG), 20,3% % o que representaria uma alta margem de erro, se assim fosse adotada. Indica-se uma nova amostragem para ver como os novos municípios se comportariam nesta variável. Numa nova amostragem teste realizada, com a mesma quantidade de municípios, o percentual da diferença da mediana foi de 21,6%, o que aumentou ainda mais a margem de erro. T_SLuz - % de pessoas em domicílios sem energia elétrica One-way ANOVA: T_SLUZ; TSluz25; TSluz100; TSluz400 Source DF SS MS F P Factor 3 39,1 13,0 0,37 0,778 Error ,8 35,7 Total ,9 S = 5,978 R-Sq = 0,02% R-Sq(adj) = 0,00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev T_SLUZ ,810 6,024 (*-) TSluz ,985 3,220 ( * ) TSluz ,451 4,152 ( * ) TSluz ,639 5,831 (----*----) ,0 1,2 2,4 3,6 Pooled StDev = 5,978 Boxplot of T_SLUZ; TSluz25; TSluz100; TSluz400 75

76 Data 80 Boxplot of T_SLUZ; TSluz25; TSluz100; TSluz T_SLUZ TSluz25 TSluz100 TSluz400 Gráfico 53: Boxplot da variável T_ SLUZ com 3 graus de amostragem Fonte: Minitab 16 Indicadores T_SLuz T_SLuz25 T_SLuz100 T_SLuz400 Média 2, ,9848 2,4514 2,6386 Mediana 0,61 1,21 0,805 0,5 Q1 0,13 0,165 0,15 0,1225 Q3 2,225 2,2 3,2075 2,16 Para esta variável aleatória, observando os municípios nela contemplados, conforme podemos observar no gráfico, como não há uma dispersão uniforme atentando para a distribuição nos Quartil superior e Quartil Inferior, a amostragem que melhor reflete o resultado, tomando como base os indicadores absolutos desta variável (T_SLuz), é a amostragem que utiliza 400 municípios, pois apresenta a menor diferença entre as médias e medianas (T_SLuz400 / T_SLuz), respectivamente 6,10 % e 18,03 % o que representaria a margem de erro, se assim fosse adotada. Variável IDHM_L índice de desenvolvimento humano - longevidade One-way ANOVA: IDHM_L; IDHML25; IDHML100; IDHML400 Source DF SS MS F P Factor 3 0, , ,32 0,811 Error , ,00200 Total ,18205 S = 0,04474 R-Sq = 0,02% R-Sq(adj) = 0,00% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev IDHM_L , ,04468 (-*) IDHML , ,04662 ( * ) IDHML , ,04566 ( * ) IDHML , ,04516 (---*---) 76

77 ,790 0,800 0,810 0,820 Pooled StDev = 0,04474 Boxplot of IDHM_L; IDHML25; IDHML100; IDHML400 0,90 Boxplot of IDHM_L; IDHML25; IDHML100; IDHML400 0,85 Data 0,80 0,75 0,70 IDHM_L IDHML25 IDHML100 IDHML400 Gráfico 54: Boxplot da variável IDHM_L com 3 graus de amostragem Fonte: Minitab 16 Indicadores IDHM_L IDHM_L 25 IDHM_L100 IDHM_L400 Média 0,8015 0,7996 0,8044 0,7999 Mediana 0,808 0,808 0,8145 0,806 Q1 0,769 0,762 0,7707 0,77 Q3 0,836 0,831 0,8397 0,8337 Para esta variável aleatória, observando os municípios nela contemplados, conforme podemos observar no gráfico, há uma grande dispersão atentando para a distribuição nos Quartil superior e Quartil Inferior, a amostragem que melhor reflete o resultado, tomando como base os indicadores absolutos desta variável (IDHM_L), é a amostragem que utiliza 400 municípios, pois, apesar de não apresentar nenhuma distorção na média se tomarmos em conta a amostragem com 25 municípios, apresenta a menor diferença entre as medianas (IDHM_L400 / IDHM_L), de 0,2% o que representaria a margem pequena de erro, se assim fosse adotada. Considerações: Assim, podemos concluir que para as variáveis ESPVIDA, T_ENV, RDPC, T_SLuz e IDHM_L foram bem representadas pelas amostras aleatórias de 400 municípios. A variável AGUA_ESGOTO foi melhor representada pela amostra aleatória de 100 municípios. Percebeu-se, também, que tão importante quanto observar as amostras se afastam da média e mediana da variável 77

78 Data dependente, é observar a distribuição nos quartis, superior e inferior, até para escolher qual o melhor caminho para escolha da amostra representativa. Considerando a variável Ensino Médio Boxplot of T_MED18A20; EMedio100; EMedio400; EMedio T_MED18A20 EMedio100 EMedio400 EMedio25 Gráfico 55: Boxplot da variável Ensino Médio com 3 graus de amostragem Fonte: Minitab 16 Indicadores EnsMédio EnsMedio25 EnsMedio100 EnsMedio400 Média 36, ,73 36,94 36,08 Mediana 35,14 37,65 36,86 34,91 Q1 24,99 28,80 26,36 25,25 Q3 46,32 42,97 49,59 46,86 A amostra que melhor representa esta variável é a de 400 munícipios, pois apresenta dados muito próximos da variável principal, quer seja na média, mediana e quartis. 8. COMPONENTES PRINCIPAIS Tem por objetivo efetuar uma análise das correlações e dos componentes principais (análise multivariada) de dados dimensionadores do IDHM, Plataforma Atlas Brasil, Base IBGE. Para tal, iniciamos com análise da estatística descritiva. Em seguida passamos para a análise das correlações e dendogramas. Na terceira parte utilizamos a análise dos componentes principais utilizando o stepwise. 8.1 Análise de Dados 78

79 Buscando um foco direto nos indicadores que interessam a este pesquisador, sobretudo àqueles que podem ter uma ligação direta com o desenvolvimento da tese, foram selecionadas as seguintes variáveis para o estudo dos componentes principais: Código Indicador Abrangência ESPVIDA Esperança de vida ao nascer Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. T_ENV Taxa de envelhecimento Razão entre a população de 65 anos ou mais de idade e a população total multiplicado por 100. T_FUND15A17 Percentual da população de 15 a 17 Razão entre a população de 15 a 17 anos de idade que anos com fundamental completo concluiu o ensino fundamental, em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. T_MED18a20 Percentual da população de 18 a 20 anos de idade com o ensino médio completo RIND Renda domiciliar per capita média dos extremamente pobres Razão entre a população de 18 a 20 anos de idade que já concluiu o ensino médio em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. As pessoas de 18 a 20 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. Média da renda domiciliar per capita das pessoas com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, a preços de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. RDPC Renda per capita média Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Valores em reais de 01/agosto de TRABCC TRABSC T_AGUA T_LUZ Percentual de ocupados de 18 anos ou mais que são empregados com carteira Percentual de ocupados de 18 anos ou mais que são empregados sem carteira Percentual da população que vive em domicílios com água encanada Percentual da população que vive em domicílios com energia elétrica AGUA_ESGOTO Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados T_SLUZ % de pessoas em domicílios sem energia elétrica Razão entre o número de empregados de 18 anos ou mais de idade com carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. Razão entre o número de empregados de 18 anos ou mais de idade sem carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. Razão entre a população que vive em domicílios particulares permanentes com água canalizada para um ou mais cômodos e a população total residente em domicílios particulares permanentes, multiplicada por 100. A água pode ser proveniente de rede geral, de poço, de nascente ou de reservatório abastecido por água das chuvas ou carro-pipa. Razão entre a população que vive em domicílios particulares permanentes com iluminação elétrica e a população total residente em domicílios particulares permanentes, multiplicada por 100. Considera-se iluminação proveniente ou não de uma rede geral, com ou sem medidor. Razão entre as pessoas que vivem em domicílios cujo abastecimento de água não provem de rede geral e cujo esgotamento sanitário não é realizado por rede coletora de esgoto ou fossa séptica e a população total residente em domicílios particulares permanentes, multiplicada por 100. São considerados apenas os domicílios particulares permanentes. Razão entre as pessoas que vivem em domicílios sem energia elétrica e população total residente em domicílios particulares permanentes multiplicado por 100. Tipo Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa PESORUR População rural População residente na área rural Variável Quantitativa PESOURB População urbana População residente na área urbana Variável Quantitativa Resgatando as variáveis selecionadas Fonte: Atlas Brasil, 2010 Medida Anos Percentual Percentual Percentual Absoluto Absoluto Percentual Percentual Percentual Percentual Percentual Percentual Absoluto Absoluto 79

80 8.1.1 Base de dados A base de dados normalizada para a análise deste trabalho teve como referência as 14 variáveis descritas na tabela acima, sendo que, 03 delas, foram positivadas, a saber: TRABSC Percentual de ocupados de 18 anos ou mais que são empregados sem carteira AGUA_ESGOTO Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados T_SLUZ % de pessoas em domicílios sem energia elétrica Razão entre o número de empregados de 18 anos ou mais de idade sem carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. Razão entre as pessoas que vivem em domicílios cujo abastecimento de água não provem de rede geral e cujo esgotamento sanitário não é realizado por rede coletora de esgoto ou fossa séptica e a população total residente em domicílios particulares permanentes, multiplicada por 100. São considerados apenas os domicílios particulares permanentes. Razão entre as pessoas que vivem em domicílios sem energia elétrica e população total residente em domicílios particulares permanentes multiplicado por 100. Variável Quantitativa Variável Quantitativa Variável Quantitativa Percentual Percentual Percentual Fórmulas utilizadas: Passos no Minitab: CALC / CALCULADORA Para normalização: Construir equação selecionando na caixa de opções funções a opção MINIMO e MAXIMO. A equação: (c9-min(c9))/(max(c9)-min(c9)) Para positivação: Para os dados que representam valores: A Equação: 1-((c8-MIN(c8))/(MAX(c8)-MIN(c8))) 8.2 Criando os principais componentes Passos no Minitab: STAT / MULTIVARIATE / PRINCIPAL COMPONENTS Correlations: EVIDA_N; TENVE_N; FUND15_N; MED18_N; RENDA_N; RENDOM_N;... EVIDA_N TENVE_N FUND15_N MED18_N RENDA_N TENVE_N 0,223 0,000 FUND15_N 0,666 0,365 0,000 0,000 MED18_N 0,660 0,388 0,833 0,000 0,000 0,000 80

81 RENDA_N 0,784 0,204 0,671 0,717 0,000 0,000 0,000 0,000 RENDOM_N -0,000 0,104 0,034 0,076 0,040 0,981 0,000 0,010 0,000 0,003 EMPCREG_N 0,601-0,070 0,495 0,524 0,664 0,000 0,000 0,000 0,000 0,000 EMPSREG_NP 0,519 0,056 0,449 0,473 0,615 0,000 0,000 0,000 0,000 0,000 CÁGUA_N 0,549 0,088 0,528 0,515 0,564 0,000 0,000 0,000 0,000 0,000 CLUZ_N 0,341 0,302 0,438 0,436 0,386 0,000 0,000 0,000 0,000 0,000 AESGINAD_NP 0,604 0,340 0,593 0,582 0,587 0,000 0,000 0,000 0,000 0,000 SLUZ_NP 0,341 0,302 0,438 0,436 0,386 0,000 0,000 0,000 0,000 0,000 PORURAL_N -0,245-0,284-0,293-0,298-0,216 0,000 0,000 0,000 0,000 0,000 POURB_N 0,091-0,063 0,050 0,075 0,217 0,000 0,000 0,000 0,000 0,000 RENDOM_N EMPCREG_N EMPSREG_NP CÁGUA_N CLUZ_N EMPCREG_N 0,046 0,001 EMPSREG_NP -0,057 0,555 0,000 0,000 CÁGUA_N 0,066 0,549 0,295 0,000 0,000 0,000 CLUZ_N 0,168 0,373 0,197 0,408 0,000 0,000 0,000 0,000 AESGINAD_NP 0,095 0,523 0,303 0,640 0,423 0,000 0,000 0,000 0,000 0,000 SLUZ_NP 0,168 0,373 0,197 0,408 1,000 0,000 0,000 0,000 0,000 * PORURAL_N -0,044-0,197-0,099-0,256-0,193 0,001 0,000 0,000 0,000 0,000 POURB_N 0,046 0,142 0,090 0,083 0,046 0,001 0,000 0,000 0,000 0,001 AESGINAD_NP SLUZ_NP PORURAL_N SLUZ_NP 0,423 0,000 PORURAL_N -0,379-0,193 0,000 0,000 POURB_N 0,053 0,046 0,220 0,000 0,001 0,000 Cell Contents: Pearson correlation P-Value 81

82 Similarity Dendograma com 01 cluster Pelos dados apurados, as duas variáveis que apresentam uma correlação com representatividade, estabelecendo-se como diretriz, indicador maior ou igual a 0,800, foram MED18_N com FUND15_N. Este resultado sinaliza que, provavelmente, não haverá elementos que permitam uma análise significativa nos resultados frutos deste estudo, ou seja, a análise de dos componentes principais. Dendograma análise considerando 01 cluster Cluster Analysis of Variables: EVIDA_N; TENVE_N; FUND15_N; MED18_N;... Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,000 0, ,659 0, ,209 0, ,841 0, ,222 0, ,000 0, ,744 0, ,188 0, ,924 0, ,415 0, ,978 0, ,866 0, ,401 0, Cluster Analysis of Variables: EVIDA_N; TENVE_N; FUND15_N; MED18_N;... Dendrogram Single Linkage; Correlation Coefficient Distance 58,40 72,27 86,13 100,00 EVIDA_N RENDA_N FUND15_N MED18_N EMPCREG_N EMPSREG_NP CÁGUA_N AESGINAD_NP CLUZ_N Variables SLUZ_NP TENVE_N PORURAL_N POURB_N RENDOM_N Gráfico 56: Dendograma das variáveis normalizadas com 01 cluster Fonte: Minitab 16 82

83 Similarity Dendograma considerando 04 clusters: Cluster Analysis of Variables: EVIDA_N; TENVE_N; FUND15_N; MED18_N;... Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,000 0, ,659 0, ,209 0, ,841 0, ,222 0, ,000 0, ,744 0, ,188 0, ,924 0, ,415 0, ,978 0, ,866 0, ,401 0, Final Partition Cluster 1 EVIDA_N TENVE_N FUND15_N MED18_N RENDA_N EMPCREG_N EMPSREG_NP CÁGUA_N CLUZ_N AESGINAD_NP SLUZ_NP Cluster 2 RENDOM_N Cluster 3 PORURAL_N Cluster 4 POURB_N Dendrogram Dendrogram Single Linkage; Correlation Coefficient Distance 58,40 72,27 86,13 100,00 EVIDA_N RENDA_N FUND15_N MED18_N EMPCREG_N EMPSREG_NP CÁGUA_N AESGINAD_NP Variables CLUZ_N SLUZ_NP TENVE_N PORURAL_N POURB_N Gráfico 57: Dendograma das variáveis normalizadas com 04 clusteres Minitab 16 RENDOM_N Fonte: 83

84 Quando analisamos a distribuição com 01 cluster, observa-se que as variáveis com maior similaridade são as que seguem. As demais variáveis se relacionam entre si. EVIDA / RENDA FUND15 / MED18 CAGUA / AESGINAD POPRURAL / POPURB CLUZ / SLUZ Quando analisamos a distribuição com 04 clusters, observa-se que as variáveis com maior similaridade se mantém como na distribuição anterior. As demais variáveis se relacionam entre si. Ratificando o estudo feito nas análises anteriores, a variável Ensino Médio tem maior correlação com a Variável Ensino Fundamental Componentes Principais: No Minitab: STAT / MULTIVARIATE / PRINCIPAL COMPONENTS O que é análise dos componentes principais? acesso em 28/04/2017 A análise de componentes principais é usada comumente em ciências sociais, pesquisa de mercado e outros setores que usam grandes conjuntos de dados. A meta da análise de componentes principais é explicar a maior quantidade de variância com o menor número de componentes principais. A análise de componentes principais é usada comumente nas ciências sociais, pesquisa de mercado e outros setores que usam grandes conjuntos de dados. A análise de componentes principais é comumente usada como uma etapa em uma série de análises. Você pode usar a análise de componentes principais para reduzir o número de variáveis e evitar multicolinearidade, ou quando existem muitos preditores associados ao número de observações. Principal Component Analysis: EVIDA_N; TENVE_N; FUND15_N; MED18_N; RENDA_N; REN Eigenanalysis of the Correlation Matrix Eigenvalue 5,9312 1,6707 1,3185 0,9825 0,9344 0,7819 0,6203 0,4554 Proportion 0,424 0,119 0,094 0,070 0,067 0,056 0,044 0,033 Cumulative 0,424 0,543 0,637 0,707 0,774 0,830 0,874 0,907 Eigenvalue 0,3645 0,3251 0,2712 0,1961 0,1483 0,0000 Proportion 0,026 0,023 0,019 0,014 0,011 0,000 84

85 Cumulative 0,933 0,956 0,975 0,989 1,000 1,000 Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 EVIDA_N 0,334 0,198-0,102-0,053-0,004-0,026-0,125-0,082 TENVE_N 0,150-0,406-0,291-0,526-0,279-0,020 0,020-0,431 FUND15_N 0,342 0,013-0,144-0,165-0,120-0,058-0,209 0,494 MED18_N 0,346 0,021-0,129-0,211-0,090-0,108-0,138 0,455 RENDA_N 0,349 0,232 0,016-0,105-0,011-0,076 0,039-0,035 RENDOM_N 0,044-0,269 0,250-0,348 0,766-0,385-0,035 0,012 EMPCREG_N 0,299 0,267 0,137 0,274 0,187-0,066 0,145-0,075 EMPSREG_NP 0,240 0,351-0,015 0,041-0,136-0,523 0,327-0,334 CÁGUA_N 0,295 0,055 0,041 0,206 0,252 0,403-0,337-0,121 CLUZ_N 0,267-0,421 0,369 0,236-0,206-0,054 0,079 0,017 AESGINAD_NP 0,319-0,055-0,124-0,012 0,183 0,351-0,147-0,412 SLUZ_NP 0,267-0,421 0,369 0,236-0,206-0,054 0,079 0,017 PORURAL_N -0,157 0,231 0,486-0,171-0,269-0,211-0,688-0,214 POURB_N 0,048 0,249 0,511-0,507-0,069 0,465 0,411 0,085 Variable PC9 PC10 PC11 PC12 PC13 PC14 EVIDA_N -0,650-0,349-0,073 0,441 0,262 0,000 TENVE_N 0,064 0,040 0,414 0,086-0,054 0,000 FUND15_N 0,174 0,135-0,172 0,376-0,556-0,000 MED18_N 0,155 0,154 0,063-0,313 0,650 0,000 RENDA_N -0,271-0,238 0,084-0,696-0,428-0,000 RENDOM_N -0,001-0,051-0,037 0,041-0,016-0,000 EMPCREG_N -0,107 0,573 0,560 0,157-0,043 0,000 EMPSREG_NP 0,449-0,143-0,253 0,121 0,079-0,000 CÁGUA_N 0,474-0,453 0,278 0,062 0,028-0,000 CLUZ_N -0,046-0,047-0,062-0,003 0,015 0,707 AESGINAD_NP -0,013 0,444-0,563-0,125 0,037 0,000 SLUZ_NP -0,046-0,047-0,062-0,003 0,015-0,707 PORURAL_N 0,009 0,141 0,017-0,017 0,003 0,000 POURB_N 0,063-0,017-0,038 0,114 0,045-0,000 Scree Plot of EVIDA_N;...; POURB_N Loading Plot of EVIDA_N;...; POURB_N 85

86 Second Component 0,4 Loading Plot of EVIDA_N;...; POURB_N EMPSREG_NP 0,3 0,2 PORURAL_N POURB_N EMPCREG_N RENDA_N EVIDA_N 0,1 0,0-0,1 CÁGUA_N FUND15_N MED18_N AESGINAD_NP -0,2-0,3 RENDOM_N -0,4 TENVE_N SLUZ_NP CLUZ_N -0,5-0,2-0,1 0,0 0,1 First Component 0,2 0,3 0,4 Gráfico 58: Loading Plot das Variáveis Normalizadas Fonte: Minitab 16 Utilizando o Scree Plot: Um gráfico scree exibe os autovalores associados a um componente ou fator em ordem decrescente versus o número do componente ou fator. Gráficos scree podem ser usados em análise de componentes principais e análise de fatores para avaliar visualmente quais componentes ou fatores explicam a maior parte da variabilidade dos dados. 86

87 Eigenvalue Scree Plot of EVIDA_N;...; POURB_N Component Number Gráfico 59: Scree Plot das Variáveis Normalizadas Fonte: Minitab 16 Percebe-se, provavelmente pela baixa correlação existente entre as variáveis selecionadas, que foram abertos 14 componentes e a relação de poder exploratório, entendido este referencial em torno de 90%, se dá somente no conjunto do 8º componente, quando atingido o percentual acumulado de 90,7 % A análise do Scree Plot ratifica essa distribuição, onde percebemos que há uma diferença relativamente grande entre o primeiro e segundo componente (na proporcionalidade, cerca de 43%), mas a partir desse há pequenos desvios entre os componentes, mantendo-se, praticamente uma tendência de reta somente nos últimos componentes. Montando o Scatterplot com 03 componentes Principal Component Analysis: EVIDA_N; TENVE_N; FUND15_N; MED18_N; RENDA_N; REN Eigenanalysis of the Correlation Matrix Eigenvalue 5,9312 1,6707 1,3185 0,9825 0,9344 0,7819 0,6203 0,4554 Proportion 0,424 0,119 0,094 0,070 0,067 0,056 0,044 0,033 Cumulative 0,424 0,543 0,637 0,707 0,774 0,830 0,874 0,907 Eigenvalue 0,3645 0,3251 0,2712 0,1961 0,1483 0,0000 Proportion 0,026 0,023 0,019 0,014 0,011 0,000 Cumulative 0,933 0,956 0,975 0,989 1,000 1,000 Variable PC1 PC2 PC3 EVIDA_N 0,334 0,198-0,102 87

88 Second Component TENVE_N 0,150-0,406-0,291 FUND15_N 0,342 0,013-0,144 MED18_N 0,346 0,021-0,129 RENDA_N 0,349 0,232 0,016 RENDOM_N 0,044-0,269 0,250 EMPCREG_N 0,299 0,267 0,137 EMPSREG_NP 0,240 0,351-0,015 CÁGUA_N 0,295 0,055 0,041 CLUZ_N 0,267-0,421 0,369 AESGINAD_NP 0,319-0,055-0,124 SLUZ_NP 0,267-0,421 0,369 PORURAL_N -0,157 0,231 0,486 POURB_N 0,048 0,249 0,511 Scree Plot of EVIDA_N;...; POURB_N Loading Plot of EVIDA_N;...; POURB_N 0,4 Loading Plot of EVIDA_N;...; POURB_N EMPSREG_NP 0,3 0,2 PORURAL_N POURB_N EMPCREG_N RENDA_N EVIDA_N 0,1 0,0-0,1 CÁGUA_N FUND15_N MED18_N AESGINAD_NP -0,2-0,3 RENDOM_N -0,4 TENVE_N SLUZ_NP CLUZ_N -0,5-0,2-0,1 0,0 0,1 First Component 0,2 0,3 0,4 Gráfico 60: Loading Plot das Variáveis Normalizadas com 03 componentes Fonte: Minitab 16 88

89 Eigenvalue Scree Plot of EVIDA_N;...; POURB_N Component Number Gráfico 61: Scree Plot das Variáveis Normalizadas com 03 componentes Fonte: Minitab 16 A composição considerando 03 componentes, praticamente não alterou o resultado apresentado nos gráficos anteriores. Utilizando o Scatterplot tendo como categoria as regiões do Brasil: 3D Scatterplot of C47 vs C48 vs C49 Região Centro-Oeste Nordeste Norte Sudeste Sul 5 C C C Gráfico 62: Scatterplot 3D das Variáveis Normalizadas por região Fonte: Minitab 16 A distribuição e concentração demonstrada no gráfico acima ratificam as análises anteriores, percebendo-se uma maior concentração dos municípios das regiões norte e nordeste próximos ao eixo inferior (o que resulta em piores resultados) e os da região sul e sudeste e centro-oeste, próximos do eixo superior (o que resulta em melhores resultados). 89

90 Pesquisou-se quais os três municípios que aparecem como outliers e, tratam-se de, na ordem: São Paulo/SP Rio de Janeiro / RJ Brasília /DF Utilizando o STEPWISE Stepwise Regression: EVIDA_N versus C47; C48; C49 Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is EVIDA_N on 3 predictors, with N = 5565 Step Constant 0,5839 0,5839 0,5839 C47 0, , ,06711 T-Value 104,27 116,06 119,05 P-Value 0,000 0,000 0,000 C48 0,0397 0,0397 T-Value 36,46 37,40 P-Value 0,000 0,000 C49-0,0204 T-Value -17,08 P-Value 0,000 S 0,117 0,105 0,102 R-Sq 66,15 72,68 74,04 R-Sq(adj) 66,15 72,67 74,03 Mallows Cp 1690,5 293,7 4,0 Ao considerarmos a variável ESPVIDA (de maior impacto), como variável dependente, constata-se que o agrupamento PC1 tem representatividade de 66,15%. Somando-se os 03 agrupamentos de componentes, chega-se no acumulado de 74,03, quando o aceitável, para este tipo de análise, estaria próximo de 90%. Rodando ANOVA/OneWay/Boxplots Comparando a principal variável, por região, com os resultados obtidos na base inicial com os da base normalizada Variável EVIDA - Esperança de vida ao nascer base normalizada One-way ANOVA: EVIDA_N versus Região Source DF SS MS F P Região 4 140, , ,02 0,000 Error ,2040 0,0151 Total ,

91 EVIDA_N S = 0,1231 R-Sq = 62,52% R-Sq(adj) = 62,50% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 466 0,6777 0,0831 (*) Nordeste ,3714 0,1356 *) Norte 449 0,4886 0,1292 (*) Sudeste ,7036 0,1202 *) Sul ,7358 0,1177 (* ,40 0,50 0,60 0,70 Pooled StDev = 0,1231 Boxplot of EVIDA_N (base normalizada) 1,0 Boxplot of EVIDA_N 0,8 0,6 0,4 0,2 0,0 Centro-Oeste Nordeste Norte Região Sudeste Sul Gráfico 63: Boxplot da Variável EVIDA Normalizada por região Fonte: Minitab 16 Variável ESPVIDA - Esperança de vida ao nascer base original One-way ANOVA: ESPVIDA versus Região Source DF SS MS F P Região , , ,02 0,000 Error ,57 2,70 Total ,19 S = 1,642 R-Sq = 62,52% R-Sq(adj) = 62,50% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste ,340 1,108 (*) Nordeste ,255 1,809 *) Norte ,818 1,724 (*) Sudeste ,686 1,604 (* Sul ,116 1,570 (* ,5 72,0 73,5 75,0 Pooled StDev = 1,642 91

92 ESPVIDA Boxplot of ESPVIDA (base inicial) 80,0 Boxplot of ESPVIDA 77,5 75,0 72,5 70,0 67,5 65,0 Centro-Oeste Nordeste Norte Região Sudeste Sul Gráfico 64: Boxplot da Variável EVIDA Inicial por região Fonte: Minitab 16 Base Inicial Indicadores Expoente (+) SUL, n=1188 Expoente (-) NORDESTE, n=1794 Q1 74, ,05 Mediana 75,15 70,445 Q3 76, ,49 Média 75, ,2549 Base Normalizada Indicadores Expoente (+) SUL, n=1188 Expoente (-) NORDESTE, n=1794 Q1 0, , Mediana 0, , Q3 0, , Média 0, , Comparando os dois gráficos, percebe-se o mesmo R-Sq (62,5%), mas há alteração na composição das médias, medianas e Quartis superior e inferior, consequentemente, na distribuição. Por exemplo, na base inicial, região sul, a diferença percentual entre os quartis inferior e superior era de 2,9% passando a 24,6% na base normalizada. Na região Nordeste essa diferença é maior ainda, passando de 3,5% na base inicial, para 65% na base normalizada. Considerações: Como a análise de componentes principais objetiva reduzir o número de variáveis e evitar a multicolinearidade, ou quando existem muitos preditores associados ao número de observações, neste estudo percebeu-se que a base de dados escolhida não trouxe um valor significativa para esta análise, pois o poder exploratório aceitável aconteceu quando do conjunto do 92

93 8º grupo de componentes, portanto, um dimensionamento relativamente grande considerando que o estudo contemplou 14 variáveis. 9. ANÁLISES DE CONGLOMERADOS Tem por objetivo efetuar uma análise de dendogramas e cluster (análise multivariada) de dados dimensionadores do IDHM, Plataforma Atlas Brasil, Base IBGE. Por fim, após as análises fazemos as considerações finais, com a distribuição demonstrada no mapa do Brasil, considerados os Estados correlacionados. O software estatístico utilizado é o MINITAB 9.1 Base de dados A base de dados normalizada para a análise deste trabalho teve como referência as 14 variáveis descritas nas análises anteriores Para determinar as variáveis que compuseram esta análise, utilizou-se o estudo dos Componentes Principais. Principal Component Analysis: EVIDA_N; TENVE_N; FUND15_N; MED18_N; RENDA_N; REN Eigenanalysis of the Correlation Matrix Eigenvalue 5,9312 1,6707 1,3185 0,9825 0,9344 0,7819 0,6203 0,4554 Proportion 0,424 0,119 0,094 0,070 0,067 0,056 0,044 0,033 Cumulative 0,424 0,543 0,637 0,707 0,774 0,830 0,874 0,907 Eigenvalue 0,3645 0,3251 0,2712 0,1961 0,1483 0,0000 Proportion 0,026 0,023 0,019 0,014 0,011 0,000 Cumulative 0,933 0,956 0,975 0,989 1,000 1,000 Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 EVIDA_N 0,334 0,198-0,102-0,053-0,004-0,026-0,125-0,082 TENVE_N 0,150-0,406-0,291-0,526-0,279-0,020 0,020-0,431 FUND15_N 0,342 0,013-0,144-0,165-0,120-0,058-0,209 0,494 MED18_N 0,346 0,021-0,129-0,211-0,090-0,108-0,138 0,455 RENDA_N 0,349 0,232 0,016-0,105-0,011-0,076 0,039-0,035 RENDOM_N 0,044-0,269 0,250-0,348 0,766-0,385-0,035 0,012 EMPCREG_N 0,299 0,267 0,137 0,274 0,187-0,066 0,145-0,075 EMPSREG_NP 0,240 0,351-0,015 0,041-0,136-0,523 0,327-0,334 CÁGUA_N 0,295 0,055 0,041 0,206 0,252 0,403-0,337-0,121 CLUZ_N 0,267-0,421 0,369 0,236-0,206-0,054 0,079 0,017 AESGINAD_NP 0,319-0,055-0,124-0,012 0,183 0,351-0,147-0,412 SLUZ_NP 0,267-0,421 0,369 0,236-0,206-0,054 0,079 0,017 PORURAL_N -0,157 0,231 0,486-0,171-0,269-0,211-0,688-0,214 POURB_N 0,048 0,249 0,511-0,507-0,069 0,465 0,411 0,085 Variable PC9 PC10 PC11 PC12 PC13 PC14 EVIDA_N -0,650-0,349-0,073 0,441 0,262 0,000 TENVE_N 0,064 0,040 0,414 0,086-0,054 0,000 FUND15_N 0,174 0,135-0,172 0,376-0,556-0,000 MED18_N 0,155 0,154 0,063-0,313 0,650 0,000 RENDA_N -0,271-0,238 0,084-0,696-0,428-0,000 RENDOM_N -0,001-0,051-0,037 0,041-0,016-0,000 EMPCREG_N -0,107 0,573 0,560 0,157-0,043 0,000 EMPSREG_NP 0,449-0,143-0,253 0,121 0,079-0,000 93

94 CÁGUA_N 0,474-0,453 0,278 0,062 0,028-0,000 CLUZ_N -0,046-0,047-0,062-0,003 0,015 0,707 AESGINAD_NP -0,013 0,444-0,563-0,125 0,037 0,000 SLUZ_NP -0,046-0,047-0,062-0,003 0,015-0,707 PORURAL_N 0,009 0,141 0,017-0,017 0,003 0,000 POURB_N 0,063-0,017-0,038 0,114 0,045-0,000 Quadro 10: Variáveis com maior relevância no CP1 Variable PC1 EVIDA_N 0,334 TENVE_N 0,150 FUND15_N 0,342 MED18_N 0,346 RENDA_N 0,349 RENDOM_N 0,044 EMPCREG_N 0,299 EMPSREG_NP 0,240 CÁGUA_N 0,295 CLUZ_N 0,267 AESGINAD_NP 0,319 SLUZ_NP 0,267 PORURAL_N -0,157 POURB_N 0,048 Fonte: Minitab 16, adaptado pelo autor Portanto, as variáveis normalizadas e positivadas escolhidas para este estudo foram : Quadro 11: Variáveis com maior relevância no CP1 para análise EVIDA_N 0,334 FUND15_N 0,342 MED18_N 0,346 RENDA_N 0,349 AESGINAD_NP 0,319 Fonte: Minitab 16, adaptado pelo autor Criando a nova base de dados com as médias por Estado One-way ANOVA: EVIDA_N versus UF Source DF SS MS F P UF ,8366 5, ,75 0,000 Error ,8498 0,0139 Total ,6863 S = 0,1178 R-Sq = 65,80% R-Sq(adj) = 65,64% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Acre 22 0,4267 0,1243 (-*-) Alagoas 102 0,3049 0,1457 (*) Amapá 16 0,5044 0,0891 (-*-) Amazonas 62 0,4216 0,1196 (*) 94

95 Bahia 417 0,3951 0,1356 (* Brasilia 1 0,9033 * ( * ) Ceará 184 0,4029 0,0993 (*) Esp. Santo 78 0,6924 0,0784 (*) Góias 246 0,6914 0,0705 (* Maranhão 217 0,3097 0,1264 *) Mato Grosso 141 0,6547 0,0810 (*) MG do Sul 78 0,6733 0,1079 (*) Minas Gerais 853 0,6840 0,1342 *) Pará 143 0,4621 0,0955 *) Paraíba 223 0,3777 0,1378 (*) Paraná 399 0,6690 0,0943 (* Pernambuco 185 0,3774 0,1576 (*) Piaui 224 0,3500 0,1261 (*) RG do Sul 496 0,7587 0,1003 *) Rio de Janeiro 92 0,6491 0,0816 (*) RN do Norte 167 0,4093 0,1192 *) Rondônia 52 0,5266 0,1099 (*) Roraima 15 0,5685 0,0690 (--*-) São Paulo 645 0,7387 0,0987 (* Sergipe 75 0,3782 0,1274 (*) Sta Catarina 293 0,7880 0,1319 (* Tocantins 139 0,5308 0,1547 (*) ,50 0,75 1,00 1,25 Pooled StDev = 0,1178 Boxplot of EVIDA_N One-way ANOVA: FUND15_N versus UF Source DF SS MS F P UF ,9806 3, ,41 0,000 Error ,4522 0,0111 Total ,4327 S = 0,1053 R-Sq = 62,85% R-Sq(adj) = 62,68% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Acre 22 0,3787 0,1324 (--*-) Alagoas 102 0,2928 0,0898 (*-) Amapá 16 0,4213 0,0982 (--*---) Amazonas 62 0,2856 0,1098 (-*) Bahia 417 0,3733 0,0986 *) Brasilia 1 0,6609 * ( * ) Ceará 184 0,5340 0,0895 (*) Esp. Santo 78 0,5980 0,0860 (*-) Góias 246 0,6084 0,1100 (*) Maranhão 217 0,3888 0,1132 (*) Mato Grosso 141 0,5720 0,1100 (*) MG do Sul 78 0,4896 0,0798 (-*) Minas Gerais 853 0,5602 0,1135 * Pará 143 0,2974 0,1115 (*) Paraíba 223 0,3707 0,1069 (*) Paraná 399 0,6492 0,1055 (* Pernambuco 185 0,3881 0,0970 (*) Piaui 224 0,3527 0,1147 (*) RG do Sul 496 0,6492 0,1204 (* Rio de Janeiro 92 0,5027 0,0811 (*-) RN do Norte 167 0,4025 0,1128 (*) Rondônia 52 0,4898 0,0863 (-*) Roraima 15 0,4122 0,1203 (---*--) São Paulo 645 0,7315 0,0924 (* Sergipe 75 0,3231 0,0771 (*-) Sta Catarina 293 0,6822 0,0952 (* 95

96 Tocantins 139 0,5000 0,1194 (*) ,32 0,48 0,64 0,80 Pooled StDev = 0,1053 One-way ANOVA: MED18_N versus UF Source DF SS MS F P UF 26 88,3997 3, ,34 0,000 Error ,9625 0,0128 Total ,3622 S = 0,1132 R-Sq = 55,47% R-Sq(adj) = 55,26% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Acre 22 0,2157 0,1047 (--*-) Alagoas 102 0,1853 0,0768 (*) Amapá 16 0,2511 0,0986 (--*-) Amazonas 62 0,1869 0,0853 (*-) Bahia 417 0,2643 0,0881 *) Brasilia 1 0,5988 * ( * ) Ceará 184 0,3587 0,0841 (*) Esp. Santo 78 0,4529 0,0966 (-*) Góias 246 0,4562 0,1194 (*) Maranhão 217 0,2339 0,0967 (* Mato Grosso 141 0,4078 0,1075 (*) MG do Sul 78 0,3673 0,1035 (*-) Minas Gerais 853 0,4004 0,1183 * Pará 143 0,1765 0,0903 (*) Paraíba 223 0,2841 0,1016 (*) Paraná 399 0,5027 0,1262 *) Pernambuco 185 0,2720 0,0916 (* Piaui 224 0,2244 0,0951 (*) RG do Sul 496 0,5086 0,1478 *) Rio de Janeiro 92 0,4461 0,0854 (*) RN do Norte 167 0,3123 0,1039 (* Rondônia 52 0,3407 0,1053 (-*-) Roraima 15 0,2935 0,1159 (--*--) São Paulo 645 0,5903 0,1243 (* Sergipe 75 0,2433 0,0848 (*) Sta Catarina 293 0,5556 0,1296 (* Tocantins 139 0,3425 0,1096 (*) ,20 0,40 0,60 0,80 Pooled StDev = 0,1132 One-way ANOVA: RENDA_N versus UF Source DF SS MS F P UF 26 51, , ,30 0,000 Error , ,00637 Total ,81832 S = 0,07980 R-Sq = 59,37% R-Sq(adj) = 59,18% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Acre 22 0, ,06561 (-*) Alagoas 102 0, ,04063 *) Amapá 16 0, ,06830 (*-) Amazonas 62 0, ,05045 (*) 96

97 Bahia 417 0, ,05234 * Brasilia 1 0,83125 * (-----*------) Ceará 184 0, ,03920 (* Esp. Santo 78 0, ,10448 (*) Góias 246 0, ,07613 * Maranhão 217 0, ,04627 (* Mato Grosso 141 0, ,08512 (* MG do Sul 78 0, ,07552 *) Minas Gerais 853 0, ,08887 * Pará 143 0, ,06123 *) Paraíba 223 0, ,04728 (* Paraná 399 0, ,07717 (* Pernambuco 185 0, ,06033 *) Piaui 224 0, ,03903 *) RG do Sul 496 0, ,10680 *) Rio de Janeiro 92 0, ,11173 (* RN do Norte 167 0, ,05081 *) Rondônia 52 0, ,06326 (*) Roraima 15 0, ,08286 (-*) São Paulo 645 0, ,10136 (* Sergipe 75 0, ,05442 (*) Sta Catarina 293 0, ,10255 (* Tocantins 139 0, ,06787 (* ,25 0,50 0,75 1,00 Pooled StDev = 0,07980 One-way ANOVA: AESGINAD_NP versus UF Source DF SS MS F P UF 26 75,2167 2, ,24 0,000 Error ,6622 0,0091 Total ,8789 S = 0,09565 R-Sq = 59,75% R-Sq(adj) = 59,56% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Acre 22 0,5912 0,1339 (-*-) Alagoas 102 0,7628 0,1761 (*) Amapá 16 0,6018 0,1521 (-*-) Amazonas 62 0,5595 0,1748 (*) Bahia 417 0,8329 0,1078 (* Brasilia 1 0,9916 * ( * ) Ceará 184 0,7948 0,1165 (* Esp. Santo 78 0,9841 0,0203 (*) Góias 246 0,9626 0,0401 *) Maranhão 217 0,6525 0,1838 (* Mato Grosso 141 0,9191 0,0797 (*) MG do Sul 78 0,9327 0,0903 (*) Minas Gerais 853 0,9602 0,0604 * Pará 143 0,5443 0,1889 (*) Paraíba 223 0,7720 0,1614 (* Paraná 399 0,9818 0,0274 *) Pernambuco 185 0,7851 0,1394 *) Piaui 224 0,8777 0,1196 (*) RG do Sul 496 0,9810 0,0375 * Rio de Janeiro 92 0,9722 0,0315 (*) RN do Norte 167 0,7986 0,1377 (*) Rondônia 52 0,8671 0,0924 (*-) Roraima 15 0,7223 0,1331 (-*--) São Paulo 645 0,9910 0,0174 (* Sergipe 75 0,8127 0,1181 (*) Sta Catarina 293 0,9833 0,0314 *) Tocantins 139 0,8758 0,0943 (*) ,60 0,80 1,00 1,20 97

98 Pooled StDev = 0, Nova base de dados considerada com as médias por estado Quadro 12: Base de dados com as médias por Estado MeanEVIDA MeanFUND15 MeanMED18 MeanRENDA MeanAESFINAD UF ESTADOS 0,4267 0,3787 0,2157 0, ,5912 Acre 0,3049 0,2928 0,1853 0, ,7628 Alagoas 0,5044 0,4213 0,2511 0,1541 0,6018 Amapá 0,4216 0,2856 0,1869 0, ,5595 Amazonas 0,3951 0,3733 0,2643 0, ,8329 Bahia 0,9033 0,6609 0,5988 0, ,9916 Brasilia 0,4029 0,534 0,3587 0,088 0,7948 Ceará 0,6924 0,598 0,4529 0,2463 0,9841 Esp. Santo 0,6914 0,6084 0,4562 0, ,9626 Góias 0,3097 0,3888 0,2339 0, ,6525 Maranhão 0,6547 0,572 0,4078 0, ,9191 Mato Grosso 0,6733 0,4896 0,3673 0, ,9327 MG do Sul 0,684 0,5602 0,4004 0, ,9602 Minas Gerais 0,4621 0,2974 0,1765 0, ,5443 Pará 0,3777 0,3707 0,2841 0, ,772 Paraíba 0,669 0,6492 0,5027 0, ,9818 Paraná 0,3774 0,3881 0,272 0, ,7851 Pernambuco 0,35 0,3527 0,2244 0, ,8777 Piaui 0,7587 0,6492 0,5086 0, ,981 RG do Sul 0,6491 0,5027 0,4461 0, ,9722 Rio de Janeiro 0,4093 0,4025 0,3123 0, ,7986 RN do Norte 0,5266 0,4898 0,3407 0,2041 0,8671 Rondônia 0,5685 0,4122 0,2935 0, ,7223 Roraima 0,7387 0,7315 0,5903 0, ,991 São Paulo 0,3782 0,3231 0,2433 0, ,8127 Sergipe 0,788 0,6822 0,5556 0,3444 0,9833 Sta Catarina 0,5308 0,5 0,3425 0, ,8758 Tocantins Fonte: Minitab 16, adaptado pelo autor Determinar os clusters (com distribuição = 01) STAT / MULTIVARIATE / CLUSTERS OBSERVATIONS Variables: todas as 05 variáveis com as médias Case: Estado Linkage: Single Distance: Euclidean Cluster Analysis of Observations: MeanEVIDA; MeanFUND15; MeanMED18;... 98

99 Euclidean Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,8561 0, ,5840 0, ,3625 0, ,2851 0, ,1492 0, ,6844 0, ,5201 0, ,2256 0, ,8856 0, ,8498 0, ,8073 0, ,7801 0, ,7163 0, ,6438 0, ,3015 0, ,9781 0, ,4704 0, ,0864 0, ,0518 0, ,5956 0, ,5060 0, ,9986 0, ,8740 0, ,4479 0, ,9459 0, ,8113 0, Final Partition Number of clusters: 1 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 27 2, , , Dendrogram 99

100 Similarity Medias 55,81 70,54 85,27 100,00 Acre Amapá Amazonas Pará Maranhão Roraima Alagoas Bahia Paraíba Pernambuco RN do Norte Sergipe Piaui Ceará Rondônia Tocantins Observations Gráfico 65: Dendograma das médias por Estado com 01 cluster Fonte: Minitab 16 Esp. Santo Góias Paraná Mato Grosso Minas Gerais MG do Sul Rio de Janeiro RG do Sul Sta Catarina São Paulo Brasilia Determinar os clusters (com distribuição = 07) STAT / MULTIVARIATE / CLUSTERS OBSERVATIONS Variables: todas as 05 variáveis com as médias Case: Estado Linkage: Single Distance: Euclidean Cluster Analysis of Observations: MeanEVIDA; MeanFUND15; MeanMED18;... Euclidean Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,8561 0, ,5840 0, ,3625 0, ,2851 0, ,1492 0, ,6844 0, ,5201 0, ,2256 0, ,8856 0, ,8498 0, ,8073 0, ,7801 0, ,7163 0, ,6438 0, ,3015 0, ,9781 0,

101 ,4704 0, ,0864 0, ,0518 0, ,5956 0, ,5060 0, ,9986 0, ,8740 0, ,4479 0, ,9459 0, ,8113 0, Final Partition Number of clusters: 7 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 4 0, , , Cluster2 8 0, , , Cluster3 1 0, , , Cluster4 10 0, , , Cluster5 1 0, , , Cluster6 2 0, , , Cluster7 1 0, , , Cluster Centroids Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 MeanEVIDA 0, , , , , , MeanFUND15 0, , , , , , MeanMED18 0, , , , , , MeanRENDA 0, , , , , , MeanAESFINAD 0, , , , , , Grand Variable Cluster7 centroid MeanEVIDA 0, , MeanFUND15 0, , MeanMED18 0, , MeanRENDA 0, , MeanAESFINAD 0, , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0, , , , , , , Cluster2 0, , , , , , , Cluster3 1, , , , , , , Cluster4 0, , , , , , , Cluster5 0, , , , , , , Cluster6 0, , , , , , , Cluster7 0, , , , , , , Dendrogram 101

102 Similarity Medias 55,81 70,54 85,27 100,00 Acre Amapá Amazonas Pará Maranhão Roraima Alagoas Bahia Paraíba Pernambuco RN do Norte Sergipe Piaui Ceará Rondônia Tocantins Observations Gráfico 66: Dendograma das médias por Estado com 07 clusteres Fonte: Minitab 16 Esp. Santo Góias Paraná Mato Grosso Minas Gerais MG do Sul Rio de Janeiro RG do Sul Sta Catarina São Paulo Brasilia Determinar os clusters (com distribuição = 07) STAT / MULTIVARIATE / CLUSTERS OBSERVATIONS Variables: todas as 05 variáveis com as médias Case: Estado Linkage: Centroid Distance: Manhathan Utilizando Linkage = Centroid e Distance = Manhathan Cluster Analysis of Observations: MeanEVIDA; MeanFUND15; MeanMED18;... Manhattan Distance, Centroid Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,3797 0, ,7779 0, ,5094 0, ,4721 0, ,1598 0, ,7727 0, ,7645 0, ,9446 0, ,5485 0, ,4798 0, ,5442 0, ,5767 0, ,5684 0, ,3675 0,

103 ,9415 0, ,6560 0, ,2284 0, ,5842 0, ,4385 0, ,6640 0, ,1254 0, ,2028 0, ,5649 0, ,3486 0, ,8438 0, ,0639 1, Final Partition Number of clusters: 7 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 12 0, , , Cluster2 1 0, , , Cluster3 1 0, , , Cluster4 7 0, , , Cluster5 3 0, , , Cluster6 2 0, , , Cluster7 1 0, , , Cluster Centroids Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 MeanEVIDA 0, , ,4029 0, , , MeanFUND15 0, , ,5340 0, , , MeanMED18 0, , ,3587 0, , , MeanRENDA 0, , ,0880 0, , , MeanAESFINAD 0, , ,7948 0, , , Grand Variable Cluster7 centroid MeanEVIDA 0, , MeanFUND15 0, , MeanMED18 0, , MeanRENDA 0, , MeanAESFINAD 0, , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0, , , , , , , Cluster2 1, , , , , , , Cluster3 0, , , , , , , Cluster4 0, , , , , , , Cluster5 0, , , , , , , Cluster6 0, , , , , , , Cluster7 0, , , , , , , Dendrogram 103

104 Similarity Medias 47,06 64,71 82,35 100,00 Acre Amazonas Pará Amapá Alagoas Bahia Paraíba Pernambuco RN do Norte Sergipe Piaui Maranhão Roraima Ceará Rondônia Tocantins Observations Gráfico 67: Dendograma das médias por Estado com 07 cluster observation Fonte: Minitab 16 Esp. Santo Góias Paraná Mato Grosso Minas Gerais Rio de Janeiro MG do Sul RG do Sul Sta Catarina São Paulo Brasilia Analisando os gráficos, mesmo a distribuição com 01 cluster, ou a distribuição com 07 clusters utilizando linkages e distances diferentes, praticamente não há alteração na distribuição dos grupos e similaridade entre os Estados. Quando a linkage= single e a distance=euclidean, tanto na distribuição de cluster= 01 quanto na distribuição de cluster= 07, as similaridades estão entre: Acre a Amapá Amazonas e Pará Paraíba e Pernambuco Rondônia e Tocantis Espírito Santo e Góias Mato Grosso e Minas Gerais Rio Grande do Sul e Santa Catarina Quando a linkage= Centroid e a distance=manhatan, somente utilizada na distribuição de cluster= 07, as similaridades estão entre: Amazonas e Pará Paraíba e Pernambuco Rondônia e Tocantis 104

105 Espírito Santo e Góias Rio Grande do Sul e Santa Catarina Diminuindo, assim, o número de agrupamentos. Em todas as 03 análises o nível de similaridade está acima de 85%, conforme indicado na escala apresentada no eixo Y do gráfico. Gerando nova coluna por estado e grupo. Com o objetivo de demonstrar no mapa o grau de similaridade entre os Estados no que diz respeito ao estudo das médias das 05 variáveis estudadas, utilizou-se: Variables: todas as 05 variáveis com as médias Case: Estado Linkage: Single Distance: Euclidean Storage: nova coluna de dados Quadro 13: Distribuição dos Estados em 03 novos clusteres UF ESTADOS Cluster Observation UF ESTADOS Cluster Observation Acre 1 Paraíba 2 Alagoas 2 Paraná 4 Amapá 1 Pernambuco 2 Amazonas 1 Piaui 2 Bahia 2 RG do Sul 4 Brasilia 3 Rio de Janeiro 4 Ceará 2 RN do Norte 2 Esp. Santo 4 Rondônia 6 Góias 4 Roraima 7 Maranhão 5 São Paulo 4 Mato Grosso 4 Sergipe 2 MG do Sul 4 Sta Catarina 4 Minas Gerais 4 Tocantins 6 Pará 1 Fonte: Elaborado pelo autor 9.3 Distribuição no mapa do Brasil 105

106 Figura 02: Mapa do Brasil com a formação dos 03 clusteres Fonte: Elaborado pelo autor Com o objetivo de averiguar o quanto o distrito federal (Brasilia) interfere nesta análise, rodarse-á um novo Dendograma e distribuição no cluster sem considerar os resultados dessa cidade, a saber: Cluster Analysis of Observations: MEVsBR; MFUNsBR; MMEDsBR; MRENsBR; MAESIsBR Euclidean Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,0947 0, ,7259 0, ,7155 0, ,6106 0, ,4264 0, ,7966 0, ,5739 0, ,1748 0, ,7140 0, ,6655 0, ,2528 0, ,2159 0, ,1295 0, ,6761 0, ,2123 0, ,7740 0, ,0860 0, ,5656 0,

107 ,5187 0, ,1901 0, ,0687 0, ,3811 0, ,2123 0, ,2797 0, ,5995 0, Final Partition Number of clusters: 7 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 4 0, , , Cluster2 7 0, , , Cluster3 1 0, , , Cluster4 10 0, , , Cluster5 1 0, , , Cluster6 2 0, , , Cluster7 1 0, , , Cluster Centroids Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 MEVsBR 0, , ,4029 0, , , ,56850 MFUNsBR 0, , ,5340 0, , , ,41220 MMEDsBR 0, , ,3587 0, , , ,29350 MRENsBR 0, , ,0880 0, , , ,11713 MAESIsBR 0, , ,7948 0, , , ,72230 Grand Variable centroid MEVsBR 0, MFUNsBR 0, MMEDsBR 0, MRENsBR 0, MAESIsBR 0, Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0, , , , , , , Cluster2 0, , , , , , , Cluster3 0, , , , , , , Cluster4 0, , , , , , , Cluster5 0, , , , , , , Cluster6 0, , , , , , , Cluster7 0, , , , , , , Dendrogram 107

108 Similarity Medias 79,60 86,40 93,20 100,00 Acre Amapá Amazonas Pará Maranhão Roraima Alagoas Bahia Paraíba Pernambuco RN do Norte Sergipe Piaui Ceará Rondônia Observations Gráfico 68: Dendograma das médias por Estado com 07 cluster - Centroids Fonte: Minitab 16 Tocantins Esp. Santo Góias Paraná Mato Grosso Minas Gerais MG do Sul Rio de Janeiro RG do Sul Sta Catarina São Paulo As similaridades se mantém entre os estados a seguir, mas altera a distribuição e o percentual. O que antes girara em torno de 85%, agora está por volta dos 90%. O Estado do Ceará teve o maior reflexo dessa nova análise. Acre a Amapá Amazonas e Pará Paraíba e Pernambuco Rondônia e Tocantis Espírito Santo e Góias Mato Grosso e Minas Gerais Rio Grande do Sul e Santa Catarina 108

109 Quadro 14: Nova distribuição dos Estados pelos clusteres sem Brasilia UF ESTADOS Cluster Observation UF ESTADOS Cluster Observation Acre 1 Paraíba 2 Alagoas 2 Paraná 4 Amapá 1 Pernambuco 2 Amazonas 1 Piaui 2 Bahia 2 RG do Sul 4 Ceará 3 Rio de Janeiro 4 Esp. Santo 4 RN do Norte 2 Góias 4 Rondônia 6 Maranhão 5 Roraima 7 Mato Grosso 4 São Paulo 4 MG do Sul 4 Sergipe 2 Minas Gerais 4 Sta Catarina 4 Pará 1 Tocantins 6 Fonte: Elaborado pelo autor 9.4 O novo mapa dos clusters Figura 03: Mapa do Brasil com a formação dos 03 clusteres sem Brasilia Fonte: Elaborado pelo autor Não houve alteração significativa com a exclusão de Brasília, passando o estado do Ceará a ficar sem similaridade no cluster, assim como Maranhão e Roraima. Considerações: Dada a similaridade dentre os Estados, tanto pela análise dos dendogramas, como pela análise do mapa geográfico, como os focos de estudo são as média das variáveis utilizadas de maior expressão quando da análise dos componentes principais, a saber: EVIDA, FUND15, MEDIO18, RENDA E AESGINAD, fica evidente que mesmo com o parâmetro utilizado de sete clusters, há um recorte de duas grandezas: o Brasil do Norte e Nordeste, com indicadores mais baixos, e um Brasil do Centro, Sul e Sudeste, com indicadores mais altos. 109

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO. Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO. Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO:

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos Professor:

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL focando

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL focando principalmente indicadores

Leia mais

PESQUISA NOSSA SÃO PAULO QUALIDADE DE VIDA URBANA EM. SÃO PAULO Um estudo de correlações entre trabalho e renda e violência.

PESQUISA NOSSA SÃO PAULO QUALIDADE DE VIDA URBANA EM. SÃO PAULO Um estudo de correlações entre trabalho e renda e violência. PESQUISA NOSSA SÃO PAULO QUALIDADE DE VIDA URBANA EM SÃO PAULO Um estudo de correlações entre trabalho e renda e violência urbana DANIEL RODRIGUES PIRES BEZERRA PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO

Leia mais

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO. Pesquisas Relacionadas a Indicadores Municipais no Brasil. ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO. Pesquisas Relacionadas a Indicadores Municipais no Brasil. ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2 BA STA BOLETIM DE ANÁLISE ESTATÍSTICO Pesquisas Relacionadas a Indicadores Municipais no Brasil ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2 Pesquisa socio-economica ao nível municipal no Brasil focando

Leia mais

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO Aluno: Claudemir

Leia mais

UM ESTUDO DO ICUR ÍNDICE DE COMPETITIVIDADE URBANA DE 2010 BASEADO EM ANALISE DE CONGLOMERADOS

UM ESTUDO DO ICUR ÍNDICE DE COMPETITIVIDADE URBANA DE 2010 BASEADO EM ANALISE DE CONGLOMERADOS Pontifícia Universidade Católica de São Paulo PUC/SP Programa Strictu Sensu Mestrado em Administração Disciplina: Método Quantitativos na Pesquisa Empírica Prof. Dr. Arnoldo Hoyos Guevara UM ESTUDO DO

Leia mais

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES

Leia mais

PUC - SP VARIÁVEIS SÓCIO-ECONÔMICAS E TAXA DE SUICÍDIOS NO BRASIL

PUC - SP VARIÁVEIS SÓCIO-ECONÔMICAS E TAXA DE SUICÍDIOS NO BRASIL PUC - SP VARIÁVEIS SÓCIO-ECONÔMICAS E TAXA DE SUICÍDIOS NO BRASIL MICHEL WIAZOWSKI ROCHA RUTHELLE MARIA DE CARVALHO SOUSA MESTRANDO EM ADMINISTRAÇÃO MÉTODOS QUANTITATIVOS PROF. DR. ARNOLDO HOYOS SÃO PAULO

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO ANÁLISE EXPLORATÓRIA DE PARÂMETROS DE ÍNDICE DE DESENVOLVIMENTO HUMANO NAS 100 CIDADES BRASILEIRAS COM MAIOR POPULAÇÃO Rafael Fortes Gatto PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade

Leia mais

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP MÉTODOS QUANTITATIVOS DE PESQUISA EMPÍRICA Prof. Dr. ARNOLDO HOYOS ENADE 9 Exame Nacional de Desempenho de Estudantes Instituições do Ensino Superior

Leia mais

METODOS ANÁLISE EXPLORATÓRIA DE DADOS

METODOS ANÁLISE EXPLORATÓRIA DE DADOS PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração METODOS Trabalho ANÁLISE EXPLORATÓRIA DE DADOS PROJETO ORIBER

Leia mais

Caracterização do território

Caracterização do território Itapema, SC Caracterização do território Dados do mapa 2016 Google Informar erro no mapa Área 55,67 km² IDHM 2010 0,796 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 45.797 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Barão de Melgaço, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 11217,65 km² IDHM 2010 0,600 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 7591 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Curitiba, PR 08/07/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 437,42 km² IDHM 2010 0,823 Faixa do IDHM Muito Alto (IDHM entre 0,8 e 1) (Censo 2010) 1751907

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Várzea Grande, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 940,83 km² IDHM 2010 0,734 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 252596 hab. Densidade

Leia mais

TEMA 5. DESIGUALDADE E INCLUSÃO DE GENERO

TEMA 5. DESIGUALDADE E INCLUSÃO DE GENERO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração METODOS TRABALHO FINAL PROJETO ORIBER TEMA 5. DESIGUALDADE E

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Rosário Oeste, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 8061,98 km² IDHM 2010 0,650 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 17679 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Novo Santo Antônio, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 4386,24 km² IDHM 2010 0,653 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 2005 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Alto Araguaia, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 5557,93 km² IDHM 2010 0,704 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 15644 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Canarana, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 10877,15 km² IDHM 2010 0,693 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 18754 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Pedra Preta, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 4205,57 km² IDHM 2010 0,679 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 15755 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Novo São Joaquim, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 5039,25 km² IDHM 2010 0,649 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 6042 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Barra do Garças, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 9176,17 km² IDHM 2010 0,748 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 56560 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Alto Garças, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 3670,07 km² IDHM 2010 0,701 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 10350 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Bom Jesus do Araguaia, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 4299,96 km² IDHM 2010 0,661 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5314 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São Pedro da Cipa, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 344,84 km² IDHM 2010 0,660 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 4158 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Rondonópolis, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 4181,58 km² IDHM 2010 0,755 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 195476 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Campo Verde, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 4810,5 km² IDHM 2010 0,750 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 31589 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Jaciara, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1663,25 km² IDHM 2010 0,735 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 25647 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Confresa, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 5819,29 km² IDHM 2010 0,668 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 25124 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Vila Rica, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 7468,7 km² IDHM 2010 0,688 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 21382 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São Félix do Araguaia, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 16915,81 km² IDHM 2010 0,668 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 10625

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Bertioga, SP 30/07/2013 - Pág 1 de 14 Caracterização do território Área 492,82 km² IDHM 2010 0,730 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 47645 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São José do Xingu, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 7493,63 km² IDHM 2010 0,657 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5240 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Guarujá, SP 30/07/2013 - Pág 1 de 14 Caracterização do território Área 143,71 km² IDHM 2010 0,751 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 290752 hab. Densidade

Leia mais

INDICADORES BÁSICOS NOSSA SÃO PAULO UM ESTUDO DE SUAS RELAÇÕES. Fabíola Dapuzzo Vinhas e Nathalie Perret

INDICADORES BÁSICOS NOSSA SÃO PAULO UM ESTUDO DE SUAS RELAÇÕES. Fabíola Dapuzzo Vinhas e Nathalie Perret INDICADORES BÁSICOS NOSSA SÃO PAULO UM ESTUDO DE SUAS RELAÇÕES Fabíola Dapuzzo Vinhas e Nathalie Perret PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO Disciplina: Métodos Quantitativos Professor:

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Esperança, PB 01/08/2013 - Pág 1 de 14 Caracterização do território Área 166,54 km² IDHM 2010 0,623 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 31095 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Alta Floresta, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 8983,98 km² IDHM 2010 0,714 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 49164 hab. Densidade

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Campo Novo do Parecis, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 9480,98 km² IDHM 2010 0,734 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 27577

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Paranatinga, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 24272,24 km² IDHM 2010 0,667 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 19290 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Mongaguá, SP 30/07/2013 - Pág 1 de 14 Caracterização do território Área 144,21 km² IDHM 2010 0,754 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 46293 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Patos, PB 02/08/2013 - Pág 1 de 14 Caracterização do território Área 515,74 km² IDHM 2010 0,701 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 100674 hab. Densidade demográfica

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Cuiabá, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 3552,82 km² IDHM 2010 0,785 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 551098 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Rio Branco, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 530,1 km² IDHM 2010 0,707 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 5070 hab. Densidade

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Porto dos Gaúchos, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 7036,6 km² IDHM 2010 0,685 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5449 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Maringá, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 11554,5 km² IDHM 2010 0,663 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 6590 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Gaúcha do Norte, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 16962,36 km² IDHM 2010 0,615 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 6293 hab. Densidade

Leia mais

ENSAIOS EXPERIMENTAIS NO LABORATÓRIO DE METROLOGIA PARA PROMOVER A INTERDISCIPLINARIEDADE

ENSAIOS EXPERIMENTAIS NO LABORATÓRIO DE METROLOGIA PARA PROMOVER A INTERDISCIPLINARIEDADE ENSAIOS EXPERIMENTAIS NO LABORATÓRIO DE METROLOGIA PARA PROMOVER A INTERDISCIPLINARIEDADE Raphaelly Antunes Alves¹; Paulo Henrique Paulista². 1 Centro Universitário de Itajubá FEPI, Engenharia de Produção,

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Sinop, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 3204,92 km² IDHM 2010 0,754 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 113099 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Cáceres, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 24478,87 km² IDHM 2010 0,708 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 87942 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Castanheira, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 3966,38 km² IDHM 2010 0,665 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 8231 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Diamantino, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 7657,48 km² IDHM 2010 0,718 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 20341 hab. Densidade

Leia mais

ATLAS BRASIL 2013 DIMENSÃO RENDA E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO RENDA E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO RENDA E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos Professor:

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Guarabira, PB 01/08/2013 - Pág 1 de 14 Caracterização do território Área 166,77 km² IDHM 2010 0,673 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 55326 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Monte Verde, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 6528,7 km² IDHM 2010 0,691 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 8093 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nobres, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 3874,39 km² IDHM 2010 0,699 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 15002 hab. Densidade demográfica

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Canaã do Norte, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 5996,71 km² IDHM 2010 0,686 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 12127 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Guarita, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1091,25 km² IDHM 2010 0,688 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 4932 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Marilândia, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1946,65 km² IDHM 2010 0,704 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 2951 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Juara, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 21474,36 km² IDHM 2010 0,682 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 32791 hab. Densidade demográfica

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Bandeirantes, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 9573,21 km² IDHM 2010 0,650 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 11643 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Poconé, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 17319,01 km² IDHM 2010 0,652 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 31779 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Guarantã do Norte, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 4732,38 km² IDHM 2010 0,703 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 32216 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Feliz Natal, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 11491,38 km² IDHM 2010 0,692 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 10933 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Pontes E Lacerda, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 8455,3 km² IDHM 2010 0,703 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 41408 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Matupá, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 5172,94 km² IDHM 2010 0,716 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 14174 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Peixoto de Azevedo, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 14457,35 km² IDHM 2010 0,649 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 30812 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Chapada dos Guimarães, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 5657,43 km² IDHM 2010 0,688 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 17821 hab.

Leia mais

Empoderando vidas. Fortalecendo nações.

Empoderando vidas. Fortalecendo nações. Empoderando vidas. Fortalecendo nações. INTRODUÇÃO O Atlas do Desenvolvimento Humano no Brasil é baseado exclusivamente nos Censos Demográficos, realizados de 10 em 10 anos, pelo Instituto Brasileiro de

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PESQUISA IRBEM INDICADORES DE REFERÊNCIA DE BEM-ESTAR NO MUNICÍPIO

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Lucas do Rio Verde, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 3674,76 km² IDHM 2010 0,768 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 45556 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Santo Antônio do Leverger, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 12301,06 km² IDHM 2010 0,656 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 18463

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Tapurah, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 11644,27 km² IDHM 2010 0,714 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 10392 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Taperoá, PB 02/08/2013 - Pág 1 de 14 Caracterização do território Área 664,9 km² IDHM 2010 0,578 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010) 14936 hab. Densidade demográfica

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Roteiro, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 129,89 km² IDHM 2010 0,505 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010) 6656

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Mãe D'Água, PB 02/08/2013 - Pág 1 de 14 Caracterização do território Área 243,65 km² IDHM 2010 0,542 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010) 4019 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Denise, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 1306,42 km² IDHM 2010 0,683 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 8523 hab. Densidade demográfica

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Pirpirituba, PB 02/08/2013 - Pág 1 de 14 Caracterização do território Área 79,64 km² IDHM 2010 0,595 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010) 10326 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Olímpia, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1572,86 km² IDHM 2010 0,682 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 17515 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de União dos Palmares, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 429,08 km² IDHM 2010 0,593 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo

Leia mais