BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

Tamanho: px
Começar a partir da página:

Download "BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs"

Transcrição

1 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL ATLAS BRASIL A Importância e Impacto da Esperança de Vida e o Analfabetismo no País. DISCIPLINA: MÉTODOS QUALITATIVOS E QUANTITATIVOS DA PESQUISA EMPÍRICA PROF. ARNOLDO JOSÉ DE HOYOS GUEVARA Fernanda Cardoso Romão Freitas 1º SEMESTRE São Paulo SP 2017

2 2 SUMÁRIO INTRODUÇÃO... 5 CAPÍTULO I. ANÁLISE EXPLORATÓRIA DOS DADOS Entendendo os dados As variáveis A Tabela de Dados Variáveis Categóricas Variáveil Muncipio Variáveis Quantitativa ANÁLISE DAS VARIÁVEIS Variável: ESPVIDA (Dimensão Demografia) Variável: MORT1 (Dimensão Demografia) Variável: T_ANALF11A14 (Educação) Variável: T_ANALF15M (Educação) Variável: PIND (Renda) Variável: RIND (Renda) Variável: REN3 (Trabalho) Variável: RENOCUP (Trabalho) Variável: T_AGUA (Habitação) Variável: T_LIXO (Habitação) Variável: T_FORA6A14 (Vulnerabilidade) Variável: T_M10A14CF (Vulnerabilidade) Variável: PESORUR (População) Variável: PESOURB (População) Variável: IDHM (Índice de Desenvolvimento Humano) Variável: IDHM_E (Índice de Desenvolvimento Humano) Variável: IDHM_L (Índice de Desenvolvimento Humano) Variável: IDHM_R (Índice de Desenvolvimento Humano) Análise comparativa e considerações Finais CAPÍTULO II. ANÁLISE DAS CORRELAÇÕES Objetivos das Correlações As Variáveis que se correlacionam Gráfico de Dispersão Dendograma CAPÍTULO III. ANÁLISE DE TENDÊNCIAS Apresentação e Objetivos Os indivíduos As Variáveis A Tabela de dados A Análise Das Variáveis A Análise de tendência - Variável Natalidade A análise de tendência Variável ESP VIDA A análise de tendência Variável MORT INF CAPÍTULO IV. ANÁLISE DE REGRESSÃO LINEAR E STEPWISE Regressão Linear Regressão Stepwise Considerações e Análises CAPÍTULO V. COMPARAÇÕES Apresentação e Objetivos... 61

3 5.2 Anova por Região Box Plot por Região e Estado Análises e Considerações CAPÍTULO VI. Amostragem Apresentação e Objetivos As variáveis Análise Exploratória para Amostra de 25,100 e 400 Indivíduos Amostras Variável ESPVIDA Amostras Variável MORT Amostras para a Variável T_ANALF15M Amostras para a Variável IDHM_L Amostras para a Variável IDHM_R Considerações e Análises CAPÍTULO VII. ANÁLISE DOS COMPONENTES PRINCIPAIS Apresentação e Objetivos Análise dos componentes Scaterplot por região Considerações e Análises CAPÍTULO VIII. ANÁLISE DE CLUSTERS Apresentação e Objetivos Análise do agrupamento das observações Mapa do Brasil com 7 Clusters Mapa do Brasil com 3 Clusters Considerações e Análises CAPÍTULO IX. CLASSIFICAÇÃO SUPERVISIONADA Apresentação e Objetivos Classificação não supervisionada Classificação Supervisionada Anova Considerações e Análises CAPÍTULO X. REGRESSÃO LOGISTICA Apresentação e Objetivos Regressão Logística ESP VIDA, MORT1, T_ANALF11A14 e T_ANALF15M Regressão Logística ESP VIDA e MORT Regressão Logística ESP VIDA Regressão Logística T_ANALF11A Regressão Logística T_ANALF15M Considerações e Análises CAPÍTULO XI. ANÁLISE DE CORRESPONDÊNCIA Apresentações e Objetivos As Análises de Correspondência Análise de Correspondência por ESTADOS das variáveis ESPVIDA, MORT1 e T_ANALF15M Análise de Correspondência por REGIÃO das variáveis ESPVIDA, MORT1 e T_ANALF15M Análise de Correspondência por GRUPO das variáveis ESPVIDA, MORT1 e T_ANALF15M E T_ANALF11Á Análise de Correspondência por GRUPO das variáveis ESPVIDA, MORT1 e T_ANALF15M Considerações e Análises CAPÍTULO XII. ÁRVORE DE CLASSIFICAÇÃO Apresentações e Objetivos Análise Discriminante Stepwise

4 12.3 Árvore de Classificação Modelo de arvore com limitadores de 3 e Considerações e Análises CAPÍTULO XIII. RANKING O NOVO INDICADOR Apresentações e Objetivos Componentes Principais Regressão Stepwise O Ranking CONSIDERAÇÕES FINAIS REFERÊNCIAS

5 INTRODUÇÃO O Atlas Brasil do Desenvolvimento Humano O Atlas Brasil do Desenvolvimento Humano é uma plataforma de consulta ao Índice do Desenvolvimento Humano Municipal (IDHM). O Atlas traz o IDHM e mais 200 indicadores de desenvolvimento nas dimensões de demografia, educação,renda,trabalho,habitação e vulnerabilidade através dos dados extraídos dos censos demográficos. Este trabalho tem por objetivo realizar uma análise exploratória na dimensão do IDHM dos dados disponibilizados na plataforma Atlas. A Base de dados do Atlas Brasil apresenta o Índice de Desenvolvimento Humano Municipal de municípios, 27 unidades de Federação (UF) e 20 Regiões Metropolitanas. Para iniciar a compreensão dos dados faremos a apresentação das variáveis escolhidas incluindo suas definições, significados, unidade de medida e faremos a apresentação da tabela de dados. Em seguida será apresentada a análise de cada uma das variáveis. Para a análise contaremos com a o auxílio de gráficos e dados numéricos como histograma, Box-plot, curva de densidade, teste de normalidade de Anderson Darling, média,mediana,quartis,desvio padrão, variância e intervalo de confiança. Por fim faremos uma análise sobre todas as variáveis estudadas. O Software estatístico utilizado neste trabalho foi o MINITAB 17. Estrutura do trabalho Final Como o estudo envolve o conjunto de 12 trabalhos que foram desenvolvidos ao longo do semestre, podemos resumir cada um deles no Quadro 1 com o título e o respectivo conteúdo: Quadro 1- Os 12 trabalhos Título Conteúdo Análise Exploratória dos Dados Estatística Descritiva das Variáveis Quantitativas e Média, Mínimo e Máximo das variáveis Relação entre as Variáveis Stem-and-Leaf Display, Análise de Regressão, correlação, regressão e teste qui-quadrado Análise de Tendências Modelo curva S,curva quadrática,curva exponencial e curva linear. Regressão Stepwise Analise de Variancia, Cluster Variable e Dendograma Comparações Teste de Hipóteses e Intervalo de Confiança, BoxPlot, Análise pela Oneway ANOVA, Análise pelo Two-Sample T- Test and CI Amostragem Amostragem Ramdon date e Boxplot Análise dos componentes Principais Loading Plot, Principal Component Analysis, Scree plot, One-way ANOVA Análise de Cluster Loading Plot, Scree plot Classificação supervisionada Dendograma, análsie discriminante Regressão Logistica Média, Análise de Variancia, Intervalo de Confiança, Análise Discriminante, Fitted Line Plot, Loading Plot, Scree plot 5

6 Análise de Correspondência Análise de correspondência simples e gráfico de simetria Árvore de Cassificação oftware SPSS árvore de decisão (Tree) com Chad Extendido Componentes Principais, Regressão Ranking Stepwise e Ranking Elaborado pela autora No Trabalho 12 foi empregado o Software estatístico SPSS porque ele gera a Árvore de Decisão. De acordo com a IBM SPSS: Decision Tree Árvore de decisão é uma ferramenta que nos ajuda a identificar grupos, descobrir relacionamentos entre eles e predizer eventos futuros. O modelo gráfico gerado se assemelha a um organograma, muito embora seja chamado de árvore de decisão. Os trabalhos de 1 ao 12, exceto o 12, foi empregado o software MINITAB. Para o trabalho final esse software será utilizado em mais de 95% e apenas 5% para o SPSS. CAPÍTULO I. ANÁLISE EXPLORÁTÓRIA DOS DADOS 1.1 Entendendo os dados Os indivíduos estudados neste trabalho são os municípios brasileiros que serão analisados pela dimensão do Desenvolvimento Humano e seus indicadores, presentes no relatório do Atlas Brasil Os dados analisados são do ano de Quando a dimensão do Desenvolvimento Humano Municipal Brasileiro, este considera as mesmas três dimensões do IDH- Global que são longevidade, educação e renda. A importância do IDHM se dá, pois sintetiza uma realidade complexa em um único número e viabiliza a comparação entre os municípios ao longo do tempo. Ele também populariza a visão do desenvolvimento voltado para pessoas e não apenas para o progresso econômico. O Crescimento econômico seja transformado em outras conquistas além da renda e da riqueza e que alcance a qualidade de vida de cada indivíduo. 1.2 As Variáveis São 18 as variáveis desta pesquisa. As mesmas são melhores explicadas na tabela 1. Ressalta-se que todos os dados desta pesquisa são referentes ao ano de Quadro2. As Variáveis 6 ESPVIDA MORT1 Variável Significado Tipo Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. Número de crianças que não deverão sobreviver ao primeiro ano de vida em cada 1000 crianças nascidas vivas. Variável Quantitativa Variável Quantitativa Unidade de Medida Índice Índice

7 7 T_ANALF11A14 T_ANALF15M PIND RIND REN3 RENOCUP T_AGUA Razão entre a população de 11 a 14 anos de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Razão entre a população de 15 anos ou mais de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Proporção dos indivíduos com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, em reais de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. Média da renda domiciliar per capita das pessoas com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, a preços de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. Razão entre o número de pessoas de 18 anos ou mais de idade ocupadas e com rendimento mensal de todos os trabalhos inferior a 3 salários mínimos de julho de 2010 e o número total de pessoas ocupadas nessa faixa etária multiplicado por 100. Média dos rendimentos de todos os trabalhos das pessoas ocupadas de 18 anos ou mais de idade. Valores em reais de agosto de Razão entre a população que vive em domicílios particulares permanentes com água canalizada para um ou mais cômodos e a população total residente em domicílios particulares permanentes multiplicado por 100. A água pode ser proveniente de rede geral, de poço, de nascente ou de reservatório abastecido por água das chuvas ou carro-pipa. Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Índice Índice Percentual Índice Percentual Índice Percentual

8 8 T_LIXO T_FORA6A14 T_M10A14CF PESORUR PESOURB IDHM IDHM_ E Razão entre a população que vive em domicílios com coleta de lixo e a população total residente em domicílios particulares permanentes multiplicado por 100. Estão incluídas as situações em que a coleta de lixo realizada diretamente por empresa pública ou privada, ou o lixo é depositado em caçamba, tanque ou depósito fora do domicílio, para posterior coleta pela prestadora do serviço. São considerados apenas os domicílios particulares permanentes localizados em área urbana. Razão entre as crianças de 6 a 14 anos que não frequenta a escola e o total de crianças nesta faixa etária multiplicado por 100. Razão entre as mulheres de 10 a 14 anos de idade que tiveram filhos e o total de mulheres nesta faixa etária multiplicado por 100. População residente na área rural População residente na área urbana Índice de Desenvolvimento Humano Municipal. Média geométrica dos índices das dimensões Renda, Educação e Longevidade, com pesos iguais. Índice sintético da dimensão Educação que é um dos 3 componentes do IDHM. É obtido através da média geométrica do subíndice de frequência de crianças e jovens à escola, com peso de 2/3, e do subíndice de escolaridade da população adulta, com peso de 1/3. Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Percentual Percentual Percentual Índice Índice Índice Índice

9 9 IDHM_L IDHM_R Índice da dimensão Longevidade que é um dos 3 componentes do IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do indicador) - (valor mínimo)] / [(valor máximo) - (valor mínimo)], onde os valores mínimo e máximo são 25 e 85 anos, respectivamente. Índice da dimensão Renda que é um dos 3 componentes do IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado do indicador) - ln (valor mínimo)] / [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). Fonte: Atlas Brasil 2013 Variável Quantitativa Variável Quantitativa Índice Índice A Tabela de Dados Estatísticas Descritivas: ANO; UF; Codmun6; Codmun7; ESPVIDA; MORT1; T_ANALF11A14;... Variável N N* Média EP Média DesvPad Mínimo Q1 Mediana Q3 ANO ,0 0, , ,0 2010,0 2010,0 2010,0 UF ,372 0,132 9,830 11,000 25,000 31,000 41,000 Codmun Codmun ESPVIDA ,968 0,0525 3,920 1,000 71,140 73,470 75,160 MORT ,293 0,0966 7,213 8,490 13,800 17,000 23,900 T_ANALF11A ,6888 0,0508 3,7925 0,0000 1,1900 2,0200 5,2400 T_ANALF15M ,159 0,132 9,840 0,950 8,080 13,120 24,320 PIND ,341 0,158 11,764 0,000 1,640 6,240 19,065 RIND ,036 0,129 9,603 0,000 27,435 32,510 37,090 REN ,932 0,0789 5,889 51,450 87,275 91,940 95,840 RENOCUP ,11 4,58 341,68 136,42 488,59 761, ,08 T_AGUA ,598 0,197 14,721 0,150 79,635 90,280 96,260 T_LIXO ,047 0,148 11,050 0,000 93,720 98,030 99,490 T_FORA6A ,8632 0,0357 2,6653 0,0000 1,5200 2,3800 3,4350 T_M10A14CF , , , , , , ,67000 pesorur , , pesourb

10 10 IDHM , , , , , , ,71800 IDHM_E , , , , , , ,63100 IDHM_L , , , , , , ,83600 IDHM_R , , , , , , , Variáveis Categóricas Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo pie chart e barras Variável: Município A amostra totaliza 5565 municípios, que pode ser verificada na distribuição no território nacional de acordo com a região no gráfico 1. Gráfico 1- Municípios por região Brasileira. Fonte: elaborado pelo autor, 2017 (Atlas Brasil) Observando o gráfico 1 notamos que a maior concentração dos municípios está na região Nordeste com 32% dos Municípios seguida pela região Sudeste com 30% dos municípios. O Gráfico 2 demonstra a distribuição dos Municípios pelas Unidades Federativas do Brasil.

11 Unidades Federativas Gráfico 2- Distribuição dos Municípios pelas Unidades Federativas do Brasil. Fonte: Elaborado pelo autor, 2017 (Atlas Brasil) O Gráfico 2 traz uma análise mais analítica sobre a distribuição dos municípios pelas Unidades Federativas do Brasil. Podemos observar que as Unidades Federativas com maior concentração de Municípios são Minas Gerais, com municípios, seguido por São Paulo com municípios e Rio Grande do Sul com Municípios Variáveis Quantitativas A análise deste tipo de variável permite a utilização de uma maior gama de ferramentas de análise como histogramas, curvas de densidade, gráfico de ramos, box-plot e dot-plot, além de informações numéricas como média, desvio-padrão, mediana, quartis, 5 números, intervalo de confiança e teste de normalidade de Anderson-Darling Análise das Variáveis Variável: ESPVIDA (Dimensão Demografia) Categoria Rio de Janeiro São Paulo Bahia Santa Catarina Minas Gerais Paraná Pernambuco Rio Grande do Norte Goiás Rio Grande do Sul Sergipe Espírito Santo Ceará Paraíba Tocantins Mato Grosso Piauí Alagoas Pará Maranhão Rondônia Mato Grosso do Sul Amapá Amazonas Roraima

12 12 Relatório Resumo para ESPVIDA Teste de normalidade de Anderson-Darling A-Quadrado 34,95 Valor-p <0,005 Média 73,089 DesvPad 2,681 Variância 7,186 Assimetria -0, Curtose -0, N Mínimo 65,300 1o. Quartil 71,150 Mediana 73,470 3o Quartil 75,160 Máximo 78,640 Intervalo de 95% de Confiança para Média 73,019 73,159 Intervalo de 95% de Confiança para Mediana 73,380 73,550 Intervalo de 95% de Confiança para DesvPad 2,632 2,731 Intervalos de 95% de Confiança Média Mediana 73,0 73,1 73,2 73,3 73,4 73,5 Gráfico 3 Análise exploratória ESPVIDA Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável ESPVIDA. Forma: Através do histograma podemos verificar que se trata de uma distribuição simétrica. O teste de normalidade de Anderson- Darling demonstra normalidade na distribuição. Centro e Dispersão: Podemos notar que a mediana indica que metades dos municípios estudados possuem expectativa de vida menor que 73,470 anos e a outra metade da amostra maior que 73,470. A média dos municípios é de 73,089 com desvio padrão de 2,681, oque não considerado um valor significativo para desvio padrão.

13 Variável: MORT1 (Dimensão Demografia) Gráfico 4 Análise exploratória MORT1 Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável MORT1. Forma: O histograma nos mostra uma distribuição assimétrica. Existe uma discrepância na distribuição da amostra devido ao fato de uma pequena quantidade de municípios possuírem um elevado índice de mortalidade infantil, enquanto que em 50% dos municípios a mortalidade está na faixa de 16,900 de acordo com histograma, sendo confirmado pelo Box-Plot. Centro e Dispersão: Podemos notar que a mediana indica que na metade dos municípios estudados a taxa de mortalidade infantil é de 16,900 para cada mil crianças nascidas vivas. A média dos municípios é de 19,247 com desvio padrão de 7,137. O desvio padrão indica o quanto os dados estão dispersos da média, neste caso o desvio padrão é significativo tento em vista que o número mínimo de crianças que não sobrevivem após o nascimento é de 8,490.

14 Variável: T_ANALF11A14 (Educação) Relatório Resumo para T_ANALF11A14 Teste de normalidade de Anderson-Darling A-Quadrado 372,64 Valor-p <0,005 Média 3,6888 DesvPad 3,7925 Variância 14,3828 Assimetria 2,16674 Curtose 7,33616 N Mínimo 0,0000 1o. Quartil 1,1900 Mediana 2,0200 3o Quartil 5,2400 Máximo 38,9800 Intervalo de 95% de Confiança para Média 3,5892 3,7885 Intervalo de 95% de Confiança para Mediana 1,9500 2,0900 Intervalo de 95% de Confiança para DesvPad 3,7233 3,8643 Intervalos de 95% de Confiança Média Mediana 2,0 2,5 3,0 3,5 4,0 Gráfico 5 Análise exploratória T_ANALF11A14 Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável T_ANALF11A14. Forma: O Histograma indica uma distribuição assimétrica da amostra para a direita. A distribuição tem um único pico Centro e Dispersão: Podemos notar que a mediana indica que na metade dos municípios a razão entre a população de 11 a 14 anos de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100.é de 2,0200. A média dos municípios é de 3,6888 com desvio padrão de 3,7925. O desvio padrão indica o quanto os dados estão dispersos da média.

15 Variável: T_ANALF15M (Educação) 6 12 Relatório Resumo para T_ANALF15M Teste de normalidade de Anderson-Darling A-Quadrado 140,31 Valor-p <0,005 Média 16,159 DesvPad 9,840 Variância 96,818 Assimetria 0, Curtose -0, N 5565 Mínimo 0,950 1o. Quartil 8,080 Mediana 13,120 3o Quartil 24,320 Máximo 44,400 Intervalo de 95% de Confiança para Média 15,900 16,417 Intervalo de 95% de Confiança para Mediana 12,859 13,481 Intervalo de 95% de Confiança para DesvPad 9,660 10,026 Intervalos de 95% de Confiança Média Mediana Gráfico 6 Análise exploratória T_ANALF15M Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável T_ANALF15M. Forma: O Histograma indica uma distribuição simétrica da amostra. A sua assimetria é de 0, Centro e Dispersão: Podemos notar que a mediana indica que na metade dos municípios cuja razão entre a população de 15 anos ou mais de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100 é de 13,120. A média dos municípios é de 16,159 com desvio padrão de 9,840.

16 Variável: PIND (Renda) Relatório Resumo para PIND Teste de normalidade de Anderson-Darling A-Quadrado 291,12 Valor-p <0,005 Média 11,341 DesvPad 11,764 Variância 138,393 Assimetria 1,10865 Curtose 0,49609 N 5565 Mínimo 0,000 1o. Quartil 1,640 Mediana 6,240 3o Quartil 19,065 Máximo 69,670 Intervalo de 95% de Confiança para Média 11,032 11,651 Intervalo de 95% de Confiança para Mediana 5,739 6,860 Intervalo de 95% de Confiança para DesvPad 11,550 11,987 Intervalos de 95% de Confiança Média Mediana 5,0 7,5 10,0 12,5 Gráfico 7 Análise exploratória PIND Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável PIND. Forma: O histograma nos mostra uma distribuição assimétrica para a direita. Existe esta assimetria na distribuição da amostra devido ao fato de uma pequena quantidade de municípios possuírem uma proporção elevada dos indivíduos com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, em reais de agosto de 2010.A análise do Box-Plot confirma esta assimetria de 1, Centro e Dispersão: Podemos notar que a mediana indica que na metade dos municípios estudados a proporção dos indivíduos com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais é de 6,240. A média dos municípios é de 11,341 com desvio padrão de 11,764.

17 Variável: RIND (Renda) Relatório Resumo para RIND Teste de normalidade de Anderson-Darling A-Quadrado 60,66 Valor-p <0,005 Média 32,036 DesvPad 9,603 Variância 92,215 Assimetria -0,28293 Curtose 2,37275 N 5565 Mínimo 0,000 1o. Quartil 27,435 Mediana 32,510 3o Quartil 37,090 Máximo 70,000 Intervalo de 95% de Confiança para Média 31,783 32,288 Intervalo de 95% de Confiança para Mediana 32,280 32,730 Intervalo de 95% de Confiança para DesvPad 9,428 9,785 Intervalos de 95% de Confiança Média Mediana 31,8 32,0 32,2 32,4 32,6 32,8 Gráfico 8 Análise exploratória RIND Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável RIND. Forma: O histograma nos mostra uma distribuição simétrica, sendo sua taxa de assimetria de -0, O Histograma apresenta uma distribuição concentrada nas faixas entre 0 e 70. Centro e Dispersão: De acordo com a mediana em metade dos municípios estudados a renda per capta dos extremamente mais pobres é de 32,510 sendo que o máximo é de 70 e o mínimo é 00. A média dos municípios é de 32,036 mostrando a simetria existente também confirmada pelo Box-Plot.

18 Frequência Variável: REN3 (Trabalho) Relatório Resumo para REN REN Teste de normalidade de Anderson-Darling A-Quadrado 88,87 Valor-p <0,005 Média 90,932 DesvPad 5,889 Variância 34,675 Assimetria -1,03727 Curtose 1,55098 N 5565 Mínimo 51,450 1o. Quartil 87,275 Mediana 91,940 3o Quartil 95,840 Máximo 100,000 Intervalo de 95% de Confiança para Média 90,777 91,087 Intervalo de 95% de Confiança para Mediana 91,740 92,170 Intervalo de 95% de Confiança para DesvPad 5,781 6,000 Intervalos de 95% de Confiança Média Mediana 91,0 91,5 92,0 Gráfico 9 Análise exploratória REN3 Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável REN3. Forma: O histograma diferente dos anteriores analisados até este momento possui uma assimetria para a esquerda. Neste caso a distribuição aponta para a esquerda produzindo um valor de assimetria negativo de -1, Centro e Dispersão De acordo com a mediana, em 50% da amostragem 91% dos indivíduos ocupados acima dos 18 anos de idade possuem rendimento de até 3 salários mínimos, a média é de 90,932.

19 Frequência Variável: RENOCUP (Trabalho) Relatório Resumo para RENOCUP RENOCUP Teste de normalidade de Anderson-Darling A-Quadrado 35,59 Valor-p <0,005 Média 780,11 DesvPad 341,68 Variância ,92 Assimetria 0,72362 Curtose 1,27435 N 5565 Mínimo 136,42 1o. Quartil 488,59 Mediana 761,72 3o Quartil 1008,08 Máximo 3177,26 Intervalo de 95% de Confiança para Média 771,13 789,09 Intervalo de 95% de Confiança para Mediana 745,23 776,58 Intervalo de 95% de Confiança para DesvPad 335,45 348,15 Intervalos de 95% de Confiança Média Mediana Gráfico 10 Análise exploratória RENOCUP Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável RENOCUP. Forma: O histograma indica uma leve assimetria para a direita. Dados sobre renda salarial normalmente possuem este tipo de assimetria, pois poucos são os indivíduos que possuem uma renda mais elevada e muitos os indivíduos de baixa renda. A leve assimetria neste caso é de 0, Centro e Dispersão: A mediana é de 761,72, muito próxima da média que é de 780,11. O desvio padrão é de 341,68 oque considero significativo tendo em vista que o valor mínimo do rendimento médio dos ocupados acima de 18 anos foi de 136,42.

20 Frequência Variável: T_AGUA (Habitação) Relatório Resumo para T_AGUA T_AGUA Teste de normalidade de Anderson-Darling A-Quadrado 270,99 Valor-p <0,005 Média 85,598 DesvPad 14,721 Variância 216,717 Assimetria -1,89166 Curtose 4,71167 N 5565 Mínimo 0,150 1o. Quartil 79,635 Mediana 90,280 3o Quartil 96,260 Máximo 100,000 Intervalo de 95% de Confiança para Média 85,211 85,985 Intervalo de 95% de Confiança para Mediana 89,870 90,701 Intervalo de 95% de Confiança para DesvPad 14,453 15,000 Intervalos de 95% de Confiança Média Mediana 85,0 87,5 90,0 Gráfico 11 Análise exploratória T_AGUA Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável T_AGUA. Forma: O histograma é assimétrico para a esquerda e produz um valor de assimetria negativa de - 1, Isto demonstra que o mínimo da população que vive em domicílios não possui água encanada, a grande maioria possui. Centro e Dispersão: A mediana é de 90,28 os que nos mostra que em 50% da amostra 90,28% da população que vive em domicilio possuem água encanada A média é de 85,598. O desvio padrão é de 14,721.

21 Frequência Variável: T_LIXO (Habitação) Relatório Resumo para T_LIXO T_LIXO Teste de normalidade de Anderson-Darling A-Quadrado 776,69 Valor-p <0,005 Média 94,047 DesvPad 11,050 Variância 122,092 Assimetria -3,9658 Curtose 20,1407 N 5565 Mínimo 0,000 1o. Quartil 93,720 Mediana 98,030 3o Quartil 99,490 Máximo 100,000 Intervalo de 95% de Confiança para Média 93,757 94,338 Intervalo de 95% de Confiança para Mediana 97,900 98,190 Intervalo de 95% de Confiança para DesvPad 10,848 11,259 Intervalos de 95% de Confiança Média Mediana Gráfico 12 Análise exploratória T_LIXO Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável T_LIXO. Forma: O Histograma nos permite analisar que trata-se de uma distribuição visivelmente assimétrica para a esquerda. A distribuição tem um único grande pico que indica que aproximadamente que 98%da população em domicílios possui coleta de lixo. Porém, alguns municípios possuem uma taxa significativamente baixa. Centro e Dispersão: A mediana é de 98,030 os que nos mostra que em 50% da amostra 98,030% da população que vive em domicilio possuem coleta de lixo A média é de 94,047. O desvio padrão é de 11,050.

22 Frequência Variável: T_FORA6A14 (Vulnerabilidade) Relatório Resumo para T_FORA6A T_FORA6A Teste de normalidade de Anderson-Darling A-Quadrado 379,51 Valor-p <0,005 Média 2,8632 DesvPad 2,6653 Variância 7,1037 Assimetria 5,9599 Curtose 63,8513 N 5565 Mínimo 0,0000 1o. Quartil 1,5200 Mediana 2,3800 3o Quartil 3,4350 Máximo 48,2300 Intervalo de 95% de Confiança para Média 2,7932 2,9333 Intervalo de 95% de Confiança para Mediana 2,3300 2,4200 Intervalo de 95% de Confiança para DesvPad 2,6167 2,7157 Intervalos de 95% de Confiança Média Mediana 2,40 2,55 2,70 2,85 3,00 Gráfico 13 Análise exploratória T_FORA6A14 Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável T_FORA6A14. Forma: Trata-se de um histograma visivelmente assimétrico para a direita indicando que na grande maioria dos municípios uma pequena porcentagem de crianças de 6 á 14 anos não frequentam a escola. Se valor de assimetria neste caso é de 5,9599. Centro e Dispersão: A mediana indica que em 50% da amostra apenas 2,38% das crianças de 6 a 14 anos não frequentam a escola. A média é de 2,86%. O Box-Plot confirma esta afirmação. O desvio padrão é de 2,6653.

23 Frequência Variável: T_M10A14CF (Vulnerabilidade) ,0 1,2 2,4 Relatório Resumo para T_M10A14CF ,6 4,8 T_M10A14CF 6,0 7,2 1 8,4 Teste de normalidade de Anderson-Darling A-Quadrado 711,83 Valor-p <0,005 Média 0,39929 DesvPad 0,69120 Variância 0,47776 Assimetria 2,5712 Curtose 10,1685 N 5565 Mínimo 0, o. Quartil 0,00000 Mediana 0, o Quartil 0,67000 Máximo 8,38000 Intervalo de 95% de Confiança para Média 0, ,41745 Intervalo de 95% de Confiança para Mediana 0, ,00000 Intervalo de 95% de Confiança para DesvPad 0, ,70429 Intervalos de 95% de Confiança Média Mediana 0,0 0,1 0,2 0,3 0,4 Gráfico 14 Análise exploratória T_M10A14CF Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável T_M10A14CF. Forma: O histograma é extremamente assimétrico para a direita o que indica que é muito baixo o porcentual de mulheres entre 10 e 14 anos que tiveram filhos. A assimetria é de 2,5712. Centro e Dispersão: Neste caso a assimetria para a direita é tão grande que a mediana ficou em 0,00000 e a média 0,39929 sendo confirmado pelo Box-Plot.O desvio padrão foi de 0,69120.

24 Frequência Variável: PESORUR (População) Relatório Resumo para pesorur pesorur Teste de normalidade de Anderson-Darling A-Quadrado 457,97 Valor-p <0,005 Média 5360 DesvPad 6642 Variância Assimetria 4,6970 Curtose 45,1552 N 5565 Mínimo 0 1o. Quartil 1599 Mediana o Quartil 6769 Máximo Intervalo de 95% de Confiança para Média Intervalo de 95% de Confiança para Mediana Intervalo de 95% de Confiança para DesvPad Intervalos de 95% de Confiança Média Mediana Gráfico 15 Análise exploratória T_PESORUR Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável PESORUR. Forma: O histograma é extremamente assimétrico para a direita com um grande pico que mostra que em 1857 municípios a população rural esta na entre e habitantes. A assimetria é de 4,6970. Centro e Dispersão: A mediana é de 3233, a média é de5360 com desvio padrão de 6642.

25 Variável: PESOURB (População) Relatório Resumo para pesourb Teste de normalidade de Anderson-Darling A-Quadrado 1664,44 Valor-p <0,005 Média DesvPad Variância Assimetria 37,77 Curtose 1858,03 N 5565 Mínimo 174 1o. Quartil 2838 Mediana o Quartil Máximo Intervalo de 95% de Confiança para Média Intervalo de 95% de Confiança para Mediana Intervalo de 95% de Confiança para DesvPad Intervalos de 95% de Confiança Média Mediana Gráfico 16 Análise exploratória PESOURB Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável PESOURB. Forma: Este é o mais assimétrico dos histogramas analisados até aqui. A Assimetria para a direita é de 37,77 com um único grande pico de distribuição. Centro e Dispersão: A Mediana é de 6263 e a média é de mostrando um elevado desvio padrão de

26 Frequência Variável: IDHM (Índice de Desenvolvimento Humano) ,42 0, , Relatório Resumo para IDHM ,63 IDHM , , ,84 Teste de normalidade de Anderson-Darling A-Quadrado 40,51 Valor-p <0,005 Média 0,65916 DesvPad 0,07200 Variância 0,00518 Assimetria -0, Curtose -0, N 5565 Mínimo 0, o. Quartil 0,59900 Mediana 0, o Quartil 0,71800 Máximo 0,86200 Intervalo de 95% de Confiança para Média 0, ,66105 Intervalo de 95% de Confiança para Mediana 0, ,66900 Intervalo de 95% de Confiança para DesvPad 0, ,07336 Intervalos de 95% de Confiança Média Mediana 0,658 0,660 0,662 0,664 0,666 0,668 Gráfico 17 Análise exploratória IDHM Fonte : Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável IDHM. Forma: O Histograma é simétrico conforme demonstra sua taxa de assimetria de -0, Os lados do histograma quase refletem um ao outro. Notamos que a curtose da amostra é de- 0, Centro e Dispersão: A Mediana é de 0,66500 confirmado pelo Box-Plot e a média é de 0, A mediana informa que no caso do IDHM pelo em metade dos municípios o IDHM é de 0,65916, valor este muito próximo da média.o desvio padrão é mínimo com taxa de 0,07200.

27 Variável: IDHM_E (Índice de Desenvolvimento Humano) Relatório Resumo para IDHM_E Teste de normalidade de Anderson-Darling A-Quadrado 9,32 Valor-p <0,005 Média 0,55909 DesvPad 0,09333 Variância 0,00871 Assimetria -0, Curtose -0, N ,27 0,36 0,45 0,54 0,63 0,72 0,81 Mínimo 0, o. Quartil 0,49000 Mediana 0, o Quartil 0,63100 Máximo 0,82500 Intervalo de 95% de Confiança para Média 0, ,56155 Intervalo de 95% de Confiança para Mediana 0, ,56300 Intervalo de 95% de Confiança para DesvPad 0, ,09509 Intervalos de 95% de Confiança Média Mediana 0,556 0,558 0,560 0,562 Gráfico 18 Análise exploratória IDHM_E Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável IDHM_E. Forma: O Histograma é simétrico conforme demonstra sua taxa de assimetria de -0, Os lados do histograma quase refletem um ao outro. Notamos que a curtose da amostra é de- 0, Centro e Dispersão: A Mediana é de 0,56000 confirmado pelo Box-Plot e a média é de 0, A mediana informa que no caso do IDHE em metade dos municípios o IDHE é de 0,56000, valor este muito próximo da média.o desvio padrão é mínimo com taxa de 0,09333.

28 Frequência Variável: IDHM_L (Índice de Desenvolvimento Humano) , , ,75 Relatório Resumo para IDHM_L ,78 IDHM_L ,81 0, , Teste de normalidade de Anderson-Darling A-Quadrado 35,06 Valor-p <0,005 Média 0,80156 DesvPad 0,04468 Variância 0,00200 Assimetria -0, Curtose -0, N 5565 Mínimo 0, o. Quartil 0,76900 Mediana 0, o Quartil 0,83600 Máximo 0,89400 Intervalo de 95% de Confiança para Média 0, ,80274 Intervalo de 95% de Confiança para Mediana 0, ,80900 Intervalo de 95% de Confiança para DesvPad 0, ,04553 Intervalos de 95% de Confiança Média Mediana 0,800 0,802 0,804 0,806 0,808 0,810 Gráfico 19 Análise exploratória IDHM_L Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável IDHM_L. Forma: Notamos que o histograma é simétrico, se passarmos uma linha no meio deste histograma os dois lados quase refletem um ao outro, A assimetria é de -0, Centro e Dispersão: A mediana é de 0,80800 o que indica que 50% das observações estão abaixo deste número e 50% estão acima dele. A média é 0,80156 com um pequeno desvio padrão de 0,04468.

29 Variável: IDHM_R (Índice de Desenvolvimento Humano) 0,42 0,49 0,56 Relatório Resumo para IDHM_R 0,63 0,70 0,77 0,84 Teste de normalidade de Anderson-Darling A-Quadrado 55,08 Valor-p <0,005 Média 0,64287 DesvPad 0,08066 Variância 0,00651 Assimetria -0, Curtose -0, N 5565 Mínimo 0, o. Quartil 0,57200 Mediana 0, o Quartil 0,70700 Máximo 0,89100 Intervalo de 95% de Confiança para Média 0, ,64499 Intervalo de 95% de Confiança para Mediana 0, ,65700 Intervalo de 95% de Confiança para DesvPad 0, ,08219 Intervalos de 95% de Confiança Média Mediana 0,640 0,644 0,648 0,652 0,656 Gráfico 20 Análise exploratória IDHM_R Fonte: Minitab17 Este relatório contém Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, desvio-padrão, variância, valores mínimos, máximos e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável IDHM_R. Forma: O Histograma é mais simétrico do que assimétrico, se passarmos uma linha no meio deste histograma os dois lados quase refletem um ao outro, porém podemos notar uma pequena assimetria entre o 0,56 e o 0,63. A assimetria é de -0, Centro e Dispersão: A mediana é de 0,65400 e a média 0,64287 com desvio padrão de 0,08066.

30 Análise Comparativa E Considerações Finais Quadro3 Comparação entre as variáveis.

31 31

32 32 Fonte: Elaborado pela autora. Acima encontra-se uma tabela comparando Histograma, Box-Plot, Curva de Densidade, média, desvio-padrão, mediana e P-Value do teste de normalidade de Anderson-Darling, das variáveis quantitativas analisadas. A tabela nos permite perceber de maneira rápida o que já foi explicitado nos tópicos anteriores, quando analisamos individualmente as variáveis. As variáveis T_AGUA e T_LIXO derivadas da dimensão Habitação possuem um comportamento similar entre si com uma cauda bastante assimétrica para a esquerda e um pico bastante elevado. A variável T-FOR6A14 e T-M10A14CF da dimensão Vulnerabilidade também possuem comportamentos similares com uma cauda para a direita. As variáveis PESORUR e PESOURB são similares com uma grande assimetria para a direita. Já a variável IDHM e os demais IDHM_E, IDHM_L e IDHM_R também possuem certa similaridade, pois ambos são histogramas mais simétricos do que assimétricos mostrando assim que seus valores de assimetria são mais próximos de zero. Vale ressaltar que a falta de assimetria não indica necessariamente normalidade. Vale ressaltar que a simetria ou não das distribuições não necessariamente tem relação com a qualidade ou validade dos dados trabalhados. Distribuições assimétricas podem, por exemplo, nos indicar onde devemos focar ou concentrar esforços para a obtenção de resultados esperados de forma mais eficiente. CAPÍTULO II. ANÁLISE DAS CORRELAÇÕES 2.1 Objetivos das Correlações Este trabalho tem como objetivo realizar uma análise das correlações entre as variáveis selecionadas, comparados a partir de dezoito variáveis quantitativas, A análise exploratória dos dados foi realizada através dos dados obtidos nas fontes de cada variável. Empregou-se o Minitab17 para as análises estatísticas.

33 33 Resultados de: Plan1 Correlação: ESPVIDA; MORT1; T_ANALF11A14; T_ANALF15M; PIND; RIND; REN3; RENOCUP;... ESPVIDA MORT1 T_ANALF11A14 T_ANALF15M PIND MORT1-0,763 0,000 T_ANALF11A14-0,667 0,692 0,000 0,000 T_ANALF15M -0,824 0,825 0,757 0,000 0,000 0,000 PIND -0,760 0,765 0,771 0,813 0,000 0,000 0,000 0,000 RIND -0,000 0,005-0,073-0,010-0,132 0,981 0,736 0,000 0,442 0,000 REN3-0,701 0,661 0,510 0,753 0,656 0,000 0,000 0,000 0,000 0,000 RENOCUP 0,741-0,704-0,561-0,794-0,737 0,000 0,000 0,000 0,000 0,000 T_AGUA 0,549-0,546-0,554-0,631-0,662 0,000 0,000 0,000 0,000 0,000 T_LIXO 0,416-0,441-0,456-0,409-0,563 0,000 0,000 0,000 0,000 0,000 T_FORA6A14-0,207 0,196 0,500 0,242 0,367 0,000 0,000 0,000 0,000 0,000 T_M10A14CF -0,148 0,150 0,223 0,155 0,196 0,000 0,000 0,000 0,000 0,000 pesorur -0,245 0,249 0,302 0,219 0,333 0,000 0,000 0,000 0,000 0,000 pesourb 0,091-0,073-0,045-0,114-0,079 0,000 0,000 0,001 0,000 0,000

34 34 IDHM 0,852-0,829-0,744-0,884-0,863 0,000 0,000 0,000 0,000 0,000 IDHM_E 0,704-0,684-0,680-0,789-0,756 0,000 0,000 0,000 0,000 0,000 IDHM_L 1,000-0,967-0,667-0,824-0,760 0,000 0,000 0,000 0,000 0,000 IDHM_R 0,834-0,814-0,714-0,878-0,884 0,000 0,000 0,000 0,000 0,000 RIND REN3 RENOCUP T_AGUA T_LIXO REN3-0,017 0,203 RENOCUP 0,020-0,947 0,142 0,000 T_AGUA 0,066-0,549 0,599 0,000 0,000 0,000 T_LIXO 0,091-0,350 0,394 0,278 0,000 0,000 0,000 0,000 T_FORA6A14-0,164 0,142-0,148-0,243-0,198 0,000 0,000 0,000 0,000 0,000 T_M10A14CF 0,028 0,080-0,088-0,079-0,142 0,034 0,000 0,000 0,000 0,000 pesorur -0,044 0,139-0,173-0,256-0,184 0,001 0,000 0,000 0,000 0,000 pesourb 0,046-0,241 0,233 0,083 0,039 0,001 0,000 0,000 0,000 0,004 IDHM 0,072-0,839 0,869 0,659 0,468 0,000 0,000 0,000 0,000 0,000 IDHM_E 0,098-0,753 0,764 0,615 0,393 0,000 0,000 0,000 0,000 0,000 IDHM_L -0,000-0,701 0,741 0,549 0,416 0,977 0,000 0,000 0,000 0,000

35 35 IDHM_R 0,051-0,872 0,915 0,641 0,499 0,000 0,000 0,000 0,000 0,000 T_FORA6A14 T_M10A14CF pesorur pesourb IDHM T_M10A14CF 0,246 0,000 pesorur 0,215 0,085 0,000 0,000 pesourb 0,012 0,003 0,220 0,353 0,820 0,000 IDHM -0,368-0,181-0,272 0,149 0,000 0,000 0,000 0,000 IDHM_E -0,415-0,176-0,249 0,147 0,951 0,000 0,000 0,000 0,000 0,000 IDHM_L -0,206-0,148-0,245 0,091 0,852 0,000 0,000 0,000 0,000 0,000 IDHM_R -0,289-0,165-0,260 0,157 0,948 0,000 0,000 0,000 0,000 0,000 IDHM_E IDHM_L 0,704 0,000 IDHM_L IDHM_R 0,820 0,834 0,000 0,000 Conteúdo da Célula: Correlação de Pearson Valor-p 2.2. As variáveis que se correlacionam Quadro 4- Variáveis que se correlacionam. Variável Variável Grau de Correlação ESPVIDA T_ANALF15M -0,824

36 36 MORT1 T_ANALF15M 0,825 T_ANALF15M PIND 0,813 ESPVIDA IDHM 0,852 MORT1 IDHM -0,829 T_ANALF15M IDHM -0,884 PIND IDHM -0,863 MORT1 IDHM_L -0,967 T_ANALF15M IDHM_L -0,824 ESPVIDA IDHM_R 0,834 MORT1 IDHM_R -0,814 T_ANALF15M IDHM_R -0,878 PIND IDHM_R -0,884 REN3 RENOCUP -0,947 REN3 IDHM_R -0,872 RENOCUP IDHM_R 0,915 IDHM IDHM_E 0,951 IDHM IDHM_L 0,852 IDHM IDHM_R 0,948 IDHM_E IDHM_R 0,820 IDHM_L IDHM_R 0,834 ESPVIDA IDHM_L 1,000 Fonte: Elaborada pelo autor, 2017.

37 MORT1 ESPVIDA Gráfico de Dispersão Nos gráficos abaixo vamos demonstrar as relações entre as variáveis. 80,0 Gráfico de Dispersão de ESPVIDA versus T_ANALF15M 77,5 75,0 72,5 70,0 67,5 65, T_ANALF15M Gráfico de Dispersão de MORT1 versus T_ANALF15M T_ANALF15M

38 ESPVIDA T_ANALF15M 38 Gráfico de Dispersão de T_ANALF15M versus PIND PIND Gráfico de Dispersão de ESPVIDA versus IDHM 80,0 77,5 75,0 72,5 70,0 67,5 65,0 0,4 0,5 0,6 IDHM 0,7 0,8 0,9

39 T_ANALF15M MORT1 39 Gráfico de Dispersão de MORT1 versus IDHM ,4 0,5 0,6 IDHM 0,7 0,8 0,9 Gráfico de Dispersão de T_ANALF15M versus IDHM ,4 0,5 0,6 IDHM 0,7 0,8 0,9

40 PIND MORT1 40 Gráfico de Dispersão de MORT1 versus IDHM_L ,70 0,75 0,80 0,85 0,90 IDHM_L Gráfico de Dispersão de PIND versus IDHM ,4 0,5 0,6 0,7 0,8 0,9 IDHM

41 MORT1 T_ANALF15M 41 Gráfico de Dispersão de T_ANALF15M versus IDHM_L ,70 0,75 0,80 0,85 0,90 IDHM_L Gráfico de Dispersão de MORT1 versus IDHM_R ,4 0,5 0,6 0,7 0,8 0,9 IDHM_R

42 T_ANALF15M ESPVIDA 42 Gráfico de Dispersão de ESPVIDA versus IDHM_R 80,0 77,5 75,0 72,5 70,0 67,5 65,0 0,4 0,5 0,6 IDHM_R 0,7 0,8 0,9 Gráfico de Dispersão de T_ANALF15M versus IDHM_R ,4 0,5 0,6 IDHM_R 0,7 0,8 0,9

43 REN3 REN3 43 Gráfico de Dispersão de REN3 versus RENOCUP RENOCUP Gráfico de Dispersão de REN3 versus IDHM ,4 0,5 0,6 0,7 0,8 0,9 IDHM

44 REN3 RENOCUP 44 Gráfico de Dispersão de RENOCUP versus IDHM ,4 0,5 0,6 IDHM 0,7 0,8 0,9 Gráfico de Dispersão de REN3 versus IDHM_R ,4 0,5 0,6 IDHM_R 0,7 0,8 0,9

45 IDHM_E RENOCUP 45 Gráfico de Dispersão de RENOCUP versus IDHM_R ,4 0,5 0,6 IDHM_R 0,7 0,8 0,9 Gráfico de Dispersão de IDHM_E versus IDHM_R 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,4 0,5 0,6 IDHM_R 0,7 0,8 0,9

46 PIND IDHM_L 46 Gráfico de Dispersão de IDHM_L versus IDHM_R 0,90 0,85 0,80 0,75 0,70 0,4 0,5 0,6 IDHM_R 0,7 0,8 0,9 Gráfico de Dispersão de PIND versus IDHM_R ,4 0,5 0,6 IDHM_R 0,7 0,8 0,9

47 IDHM IDHM 47 Gráfico de Dispersão de IDHM versus IDHM_E 0,9 0,8 0,7 0,6 0,5 0,4 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 IDHM_E Gráfico de Dispersão de IDHM versus IDHM_L 0,9 0,8 0,7 0,6 0,5 0,4 0,70 0,75 0,80 0,85 0,90 IDHM_L

48 IDHM_E IDHM 48 Gráfico de Dispersão de IDHM versus IDHM_R 0,9 0,8 0,7 0,6 0,5 0,4 0,4 0,5 0,6 IDHM_R 0,7 0,8 0,9 Gráfico de Dispersão de IDHM_E versus IDHM_R 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,4 0,5 0,6 IDHM_R 0,7 0,8 0,9

49 ESPVIDA IDHM_L 49 Gráfico de Dispersão de IDHM_L versus IDHM_R 0,90 0,85 0,80 0,75 0,70 0,4 0,5 0,6 0,7 0,8 0,9 IDHM_R Gráfico de Dispersão de ESPVIDA versus IDHM_L 80,0 77,5 75,0 72,5 70,0 67,5 65,0 0,70 0,75 0,80 0,85 0,90 IDHM_L Os gráficos de dispersão devem ser analisados quanto a seu padrão geral e seus desvios relativos ao padrão. A descrição do padrão geral pode ser feita pela verificação de sua forma, direção e intensidade. Direção: Da análise das correlações acima percebemos que existem associações positivas e negativas, o crescimento de uma variável é acompanhado do crescimento da outra ou acontece a relação inversa. Intensidade: Os gráficos acima apresentam uma relação linear, mas os gráficos que relacionam ESPVIDA x MORT1; IDHM_E x IDHM; IDHM_R x IDHM; e, IDHM_E x T_FUNDIN_TODOS_MEIO possuem uma relação mais forte que as demais, sendo que a maior

50 Similaridade intensidade encontrada foi entre as variáveis ESPVIDA x IDHM_L, ou seja, a medida que que aumenta a variável ESPVIDA aumenta diretamente a variável IDHM_L. Forma: Os gráficos apresentam conglomerados que sugerem relações lineares, no entanto vale salientar a relação dos gráficos MORT1 x IDHM_L, REN3 x RENOCUP, RENOCUP x IDHM_R, IDHM x IDHM_E, IDHM x IDHM_R e ESPVIDA x IDHM_L que apresentam um agrupamento mais intenso. Valores Atípicos: Os gráficos indicam a existência de valores atípicos Dendograma Um Dendrograma (dendr(o) = árvore) é um tipo específico de diagrama ou representação icônica que organiza determinados fatores e variáveis. Isto quer dizer que sua representação apresenta um diagrama de similaridade. A interpretação de um Dendrograma de similaridade entre amostras fundamenta-se na intuição: duas amostras próximas devem ter também valores semelhantes para as variáveis medidas. Ou seja, elas devem ser próximas matematicamente no espaço multidimensional. Portanto, quanto maior a proximidade entre as medidas relativas às amostras, maior a similaridade entre elas. O dendrograma hierarquiza esta similaridade de modo que podemos ter uma visão bidimensional da similaridade ou dissimilaridade de todo o conjunto de amostras utilizado no estudo. Através do dendrograma abaixo podemos notar que a maior similaridade encontrada está nas variáveis ESPVIDA x IDHM_L que estão rente a linha do eixo. Dendrograma Ligação Completa; Distância do Coeficiente de Correlação 1,65 34,43 67,22 100,00 ESPVIDA IDHM_L RENOCUP IDHM_R IDHM IDHM_E T_AGUA T_LIXO RIND MORT1 T_ANALF15M T_ANALF11A14 PIND REN3 T_FORA6A14 T_M10A14CF pesorur pesourb Variáveis CAPÍTULO III. ANÁLISE DE TENDÊNCIAS 3.1 Apresentação e Objetivos O presente trabalho tem por objetivo realizar a análise de tendências das variáveis temporais TAXA DE NATALIDADE, EXPECTATIVA DE VIDA e MORTALIDADE INFANTIL. Todas as variáveis mencionadas neste trabalho serão a nível mundial. Tais variáveis integram a série estatistica do Banco Mundial. O banco de dados do Banco Mundial é uma ferramenta de análise que consiste em uma coleção de dados e séries cronológicas sobre diversos temas. Todos os dados disponibilizados pelo Banco Mundial são usados como indicadores do desenvolvimento mundial e nos permite realizar um acompanhamento real deste desenvolvimento.

51 3.2 Os Indivíduos Os dados são séries históricas Mundiais, portanto, tratam-se de séries temporais. As séries vão de 1995 á 2014 para todas as variávies estudadas. 3.3 As Variáveis São 4 as variáveis desta pesquisa, incluindo o ano a que se referem os dados. As mesmas são melhores explicadas na Tabela 1. Quadro 5- As variáveis Variável Significado Tipo Unidade de Medida Ano É o ano que se refere Variável Categórica Formato: AAAA 51 Taxa de Natalidade Espectativa de Vida ao nascer Taxa de Mortalidade Infantil Nascidos vidos para cada mil pesoas Número médio de anos que as pessoas deverão viver a partir do nascimento Número de crianças que não deverão sobreviver ao primeiro ano de vida em cada 1000 crianças nascidas vivas. 3.4 A Tabela de Dados Quadro 6 Tabela de dados Ano Taxa de Natalidade Quantitativa Quantitativa Quantitativa Fonte: Elaborado pela autora Espec. Vida ÍNDICE ÍNDICE ÍNDICE Taxa de Mortalidade Infantil ,327 66, ,04 66, ,71 66,857 57, ,229 67,101 56, ,874 67,339 54, ,616 67,606 53, ,272 67,903 51, ,023 68,158 49, ,804 68,423 47, ,651 68, ,522 69,013 44,3

52 ,379 69,339 42, ,301 69,642 41, ,212 69,915 40, ,045 70,22 38, ,854 70,485 37, ,695 70,765 36, ,611 71,005 34, ,415 71,243 33,7 Fonte: Elaborado pela autora 3.5 Análise Das Variáveis Conforme mencionado acima, cada variável será analisada utilizando gráficos para demonstrar o comportamento histórico da série, linhas de tendência, funções, erros das funções, além de extrapolações estatísticas A análise de tendência - Variável Natalidade Nesta seção analisaremos a tendência da série de dados, buscando encontrar a função (linear, quadrática, exponencial ou s-curve) que melhor a represente. Para medir a eficiência da função ou da curva de tendência, analisaremos os erros: MAPE (Mean Average Percentual Error), MAD (Mean Absolute Deaviation) e MSD (Mean Standard Deviation).

53 Para podermos visualizar qual a melhor função para representar a série de dados acima, podemos analisar a tabela abaixo, que compara os três tipos de erros para cada uma das quatro funções: 53 TAXA DE NATALIDADE MUNDIAL Quadro 7 Natalidade Mundial LINEAR QUADRATICA EXPONENCIAL CURVA S EPAM 6,267 6,573 7,196 6,336 DAM 0,934 1,061 1,146 1,057 DPM 3,059 2,684 3,268 2,609 Fonte: Elaborada pela autora Percebemos claramente que a função linear é a que melhor se adapta à nossa série de dados Taxa de Natalidade, uma que possui os menores valores para os três erros. Assim, esta será a função utilizada para as projeções dos próximos 10 anos ( ). Utilizando a equação da função linear apresentada no gráfico acima, temos os seguintes valores previstos para os próximos 10 anos em relação ao desemprego no Brasil. Year Taxa mundial de Natalidade Quadro 8 Tendência de natalidade , , , , , , , , , ,047 Fonte: Elaborada pela autora Os valores acima podem ser melhor ilustrados de forma gráfica, conforme abaixo:

54 3.5.2 Análise de tendência - Variável ESPC VIDA 54

55 TAXA DE ESPECTATIVA DE VIDA MUNDIAL Quadro 9 - Expectativa de vida mundial LINEAR QUADRATICA EXPONENCIAL CURVA S EPAM 0,054 0,054 0,051 0,055 DAM 0,038 0,037 0,035 0,038 DPM 0,001 0,002 0,002 0,002 Fonte: Elaborada pela autora Percebemos claramente que a função exponencial é a que melhor se adapta à nossa série de dados Taxa de ESPEC. VIDA, uma que possui os menores valores para os três erros. Assim, esta será a função utilizada para as projeções dos próximos 10 anos ( ). Utilizando a equação da função linear apresentada no gráfico acima, temos os seguintes valores previstos para os próximos 10 anos em relação a expectativa de vida mundial. 55 Year Taxa mundial de expectativa de vida Quadro 10 Tendência expectativa de vida , , , , , , , , , ,53 Fonte: Elaborada pela autora Os valores acima podem ser melhor ilustrados de forma gráfica, conforme abaixo:

56 Análise de tendência - MORT INF TAXA DE MORTALIDADE INFANTIL MUNDIAL Quadro 11- Mortalidade Infantil mundial LINEAR QUADRATICA EXPONENCIAL CURVA S EPAM 1,132 0,670 0,701 0,709 DAM 0,489 0,323 0,362 0,394 DPM 0,307 0,160 0,328 0,708 Fonte: Elaborada pela autora Percebemos claramente que a função exponencial é a que melhor se adapta à nossa série de dados Taxa de ESPEC. VIDA, uma que possui os menores valores para os três erros. Assim, esta será a função utilizada para as projeções dos próximos 10 anos ( ). Utilizando a equação da função linear apresentada no gráfico acima, temos os seguintes valores previstos para os próximos 10 anos em relação mortalidade infantil mundial. Year Taxa de mortalidade infantil mundial Quadro 12 Tendência para mortalidade Infantil , ,774

57 , , , , , , , ,882 Fonte: Elaborada pela autora Os valores acima podem ser melhor ilustrados de forma gráfica, conforme abaixo: CAPÍTULO IV. ANÁLISE DE REGRESSÃO LINERAR E STEPWISE Este trabalho tem como objetivo construir um modelo de regressão múltipla entre as variáveis dependente e de variáveis dependentes explicativas. Empregou-se o Minitab para as análises estatísticas. 4.1 Regressão Linear Análise de Regressão: ESPVIDA versus MORT1; T_ANALF11A14; T_ANALF15M; PIND; RIND; REN3;... Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Regressão ,4 2904, ,32 0,000 MORT ,5 8911, ,95 0,000 T_ANALF11A ,6 24,57 61,19 0,000

58 58 T_ANALF15M 1 3,1 3,10 7,73 0,005 PIND 1 1,0 0,96 2,40 0,121 RIND 1 0,0 0,01 0,03 0,863 REN3 1 2,4 2,40 5,99 0,014 RENOCUP 1 28,7 28,71 71,50 0,000 T_AGUA 1 2,6 2,56 6,38 0,012 T_LIXO 1 17,3 17,32 43,13 0,000 T_FORA6A ,6 26,65 66,36 0,000 T_M10A14CF 1 0,4 0,42 1,06 0,304 pesorur 1 1,5 1,46 3,63 0,057 pesourb 1 0,1 0,07 0,18 0,667 Erro ,8 0,40 Total ,2 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,43% 94,41% 94,40% Coeficientes Termo Coef EP de Coef Valor-T Valor-P VIF Constante 80,886 0, ,97 0,000 MORT1-0, , ,98 0,000 3,61 T_ANALF11A14 0, , ,82 0,000 3,73 T_ANALF15M -0, , ,78 0,005 6,06 PIND -0, , ,55 0,121 5,75 RIND 0, , ,17 0,863 1,07 REN3-0, , ,45 0,014 10,55 RENOCUP 0, , ,46 0,000 13,44 T_AGUA -0, , ,53 0,012 1,97 T_LIXO -0, , ,57 0,000 1,54 T_FORA6A14-0, , ,15 0,000 1,55 T_M10A14CF -0,0132 0,0128-1,03 0,304 1,09 pesorur -0, , ,90 0,057 1,24 pesourb -0, , ,43 0,667 1,16 Equação de Regressão ESPVIDA = 80,886-0,33682 MORT1 + 0,03386 T_ANALF11A14-0,00591 T_ANALF15M - 0,00268 PIND + 0, RIND - 0,01147 REN3 + 0, RENOCUP - 0, T_AGUA - 0, T_LIXO - 0,03237 T_FORA6A14-0,0132 T_M10A14CF - 0, pesorur - 0, pesourb

59 Regressão Stepwise 1. Regression Stepwise 2. Stepwise Regression: ESPVIDA versus MORT1; T_ANALF11A14; Alpha-to-Enter: 0,15 Alpha-to-Remove: 0, Response is ESPVIDA on 13 predictors, with N = Step Constant 80,08 78,74 79,37 79,47 79,40 79, MORT1-0,3633-0,3315-0,3347-0,3337-0,3409-0, T-Value -283,48-195,05-191,49-190,59-171,40-152, P-Value 0,000 0,000 0,000 0,000 0,000 0, RENOCUP 0, , , , , T-Value 26,53 27,37 27,47 28,37 22, P-Value 0,000 0,000 0,000 0,000 0, T_LIXO -0, , , , T-Value -7,28-7,99-6,56-6, P-Value 0,000 0,000 0,000 0, T_FORA6A14-0,0195-0,0339-0, T-Value -5,91-8,90-9, P-Value 0,000 0,000 0, T_ANALF11A14 0,0278 0, T-Value 7,46 8, P-Value 0,000 0, T_ANALF15M -0, T-Value -3, P-Value 0, S 0,682 0,643 0,640 0,638 0,635 0, R-Sq 93,53 94,25 94,31 94,34 94,40 94, R-Sq(adj) 93,52 94,25 94,30 94,34 94,39 94, Mallows Cp 886,4 164,4 112,4 78,9 25,2 18, Step

60 44. Constant 80,46 80,54 80,63 80, MORT1-0,3380-0,3375-0,3375-0, T-Value -152,91-152,15-152,19-149, P-Value 0,000 0,000 0,000 0, RENOCUP 0, , , , T-Value 9,22 9,09 9,34 8, P-Value 0,000 0,000 0,000 0, T_LIXO -0, , , , T-Value -6,16-6,24-6,36-6, P-Value 0,000 0,000 0,000 0, T_FORA6A14-0,0344-0,0337-0,0342-0, T-Value -8,99-8,76-8,88-8, P-Value 0,000 0,000 0,000 0, T_ANALF11A14 0,0324 0,0334 0,0323 0, T-Value 7,74 7,92 7,63 7, P-Value 0,000 0,000 0,000 0, T_ANALF15M -0,0058-0,0060-0,0067-0, T-Value -2,85-2,94-3,25-2, P-Value 0,004 0,003 0,001 0, REN3-0,0098-0,0104-0,0098-0, T-Value -2,15-2,28-2,14-2, P-Value 0,031 0,023 0,032 0, pesorur -0, , , T-Value -2,09-2,35-2, P-Value 0,037 0,019 0, T_AGUA -0, , T-Value -2,25-2, P-Value 0,024 0, PIND -0, T-Value -1, P-Value 0, S 0,634 0,634 0,634 0, R-Sq 94,41 94,42 94,42 94, R-Sq(adj) 94,41 94,41 94,41 94, Mallows Cp 15,4 13,1 10,0 9,3 60

61 Considerações e Análises Neste trabalho fizemos uso da Análise de Regressão com suporte do software estatístico Mininat17. A Análise de Regressão possibilita encontrar uma relação entre as variáveis dependentes e independentes. O objetivo desta análise é explicar um determinado comportamento de uma variável. Como as variáveis independentes explicam a variável dependente. Em um primeiro momento foi realizado a análise de regressão onde a variável dependente (Y) foi a variável ESPVIDA. Notamos que esta variável dependente tem seu comportamento explicado em 94% pelas suas variáveis independentes. Foi possível notar também que as variáveis com menor poder explicativo foram RIND, PESOURB, cujos valores de P excederam o limite aceitável e estipulado para este trabalho de no máximo 0,05. Posteriormente aplicamos o teste de Stepwise cuja função é adicionar a variável mais significante ou remover do modelo a variável menos significante. Neste caso a variável MORT1 explica 93,53% o comportamento da variável dependente ESPVIDA. Todas as demais variáveis independentes acrescentam apenas mais 0,88, sendo assim, o uso das demais variável independente pode ser dispensado deste modelo. CAPÍTULO V. COMPARAÇÕES 5.1 Apresentação e Objetivos O objetivo de nosso trabalho é comparar a o comportamento de cada variável em cada região do Brasil l. Assim, cada variável será separada por região. Em outras palavras, os dados de cada variável poderão ser comparados com as demais regiões do Brasil. A princípio fizemos o teste ANOVA para todas as variáveis e posteriormente fizemos o BoxPlot para análise apenas das variáveis que apresentaram o maior valor de F. A análise de variância (ANOVA) testa a hipótese de que as médias de duas ou mais populações são iguais. Análises ANOVA testam a importância de um ou mais fatores comparando as médias das variáveis de resposta em diferentes níveis dos fatores. A hipótese nula afirma que todas as médias das populações (médias dos níveis dos fatores) são iguais, enquanto a hipótese alternativa afirma que pelo menos uma é diferente. Para as comparações serão analisados: a média, o intervalo de confiança para a média e a variância. 5.2 Anova por Região ANOVA com um fator: ESPVIDA versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores

62 62 REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO , ,02 0,000 Erro ,70 Total Sumário do Modelo S R2 R2(aj) R2(pred) 1, ,52% 62,50% 62,46% Médias REGIÃO N Média DesvPad IC de 95% CO ,3405 1,1079 (74,1914; 74,4896) N ,8179 1,7239 (71,6660; 71,9698) NE ,2549 1,8094 (70,1789; 70,3309) S ,1156 1,5697 (75,0222; 75,2090) SE ,6863 1,6038 (74,6075; 74,7651) DesvPad Combinado = 1,64167 ANOVA com um fator: MORT1 versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P

63 63 REGIÃO ,2 2871,93 0,000 Erro ,6 Total Sumário do Modelo S R2 R2(aj) R2(pred) 4, ,39% 67,37% 67,34% Médias REGIÃO N Média DesvPad IC de 95% CO ,731 2,705 ( 15,361; 16,102) N ,578 4,713 ( 21,200; 21,955) NE ,188 5,856 ( 26,999; 27,376) S ,9988 2,1379 (12,7669; 13,2307) SE ,5123 2,6997 (15,3166; 15,7080) DesvPad Combinado = 4,07705 ANOVA com um fator: T_ANALF11A14 versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO , ,42 0,000 Erro ,31 Total

64 64 Sumário do Modelo S R2 R2(aj) R2(pred) 2, ,21% 49,17% 49,08% Médias REGIÃO N Média DesvPad IC de 95% CO 465 1,865 2,407 ( 1,619; 2,110) N 449 6,264 5,779 ( 6,014; 6,514) NE ,0717 3,3820 (6,9466; 7,1968) S ,2412 0,7275 (1,0874; 1,3950) SE ,6106 1,0546 (1,4809; 1,7404) DesvPad Combinado = 2,70392 ANOVA com um fator: T_ANALF15M versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO ,8 2738,11 0,000 Erro ,6 Total Sumário do Modelo

65 65 S R2 R2(aj) R2(pred) 5, ,33% 66,31% 66,28% Médias REGIÃO N Média DesvPad IC de 95% CO ,290 4,081 (11,771; 12,809) N ,239 6,664 (16,711; 17,768) NE ,288 6,670 (27,024; 27,552) S ,929 3,865 ( 7,604; 8,254) SE ,846 5,806 (10,572; 11,120) DesvPad Combinado = 5,71103 ANOVA com um fator: PIND versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO ,42 0,000 Erro Total Sumário do Modelo S R2 R2(aj) R2(pred) 7, ,44% 58,41% 58,36%

66 66 Médias REGIÃO N Média DesvPad IC de 95% CO 465 5,476 6,015 ( 4,786; 6,166) N ,104 12,468 (20,402; 21,806) NE ,538 9,765 (22,187; 22,890) S ,079 3,476 ( 2,648; 3,511) SE ,196 5,378 ( 3,832; 4,560) DesvPad Combinado = 7,58661 ANOVA com um fator: RIND versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO ,03 54,94 0,000 Erro ,78 Total Sumário do Modelo S R2 R2(aj) R2(pred) 9, ,80% 3,73% 3,63% Médias

67 67 REGIÃO N Média DesvPad IC de 95% CO ,479 9,582 (27,622; 29,335) N ,398 6,581 (26,526; 28,270) NE ,080 4,614 (32,644; 33,516) S ,056 13,348 (31,521; 32,592) SE ,135 10,445 (32,683; 33,587) DesvPad Combinado = 9,42247 ANOVA com um fator: REN3 versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO ,3 806,30 0,000 Erro ,9 Total Sumário do Modelo S R2 R2(aj) R2(pred) 4, ,72% 36,67% 36,60% Médias REGIÃO N Média DesvPad IC de 95%

68 68 CO ,264 4,358 ( 86,839; 87,689) N ,859 4,307 ( 91,426; 92,292) NE ,7904 2,8993 (95,5740; 96,0069) S ,258 4,963 ( 86,992; 87,524) SE ,113 6,008 ( 88,888; 89,337) DesvPad Combinado = 4,67687 ANOVA com um fator: RENOCUP versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO ,86 0,000 Erro Total Sumário do Modelo S R2 R2(aj) R2(pred) 257,888 42,80% 42,76% 42,70% Médias REGIÃO N Média DesvPad IC de 95%

69 69 CO ,2 241,6 ( 991,7; 1038,6) N ,1 250,0 ( 684,3; 732,0) NE ,69 192,11 (461,75; 485,62) S ,08 257,35 (965,41; 994,75) SE ,03 319,19 (907,65; 932,41) DesvPad Combinado = 257,888 ANOVA com um fator: T_AGUA versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO ,7 569,31 0,000 Erro ,9 Total Sumário do Modelo S R2 R2(aj) R2(pred) 12, ,06% 29,01% 28,94% Médias REGIÃO N Média DesvPad IC de 95% CO ,196 6,824 (92,068; 94,324) N ,815 16,751 (80,668; 82,963) NE ,796 16,832 (74,222; 75,370) S ,444 7,579 (90,739; 92,150) SE ,945 8,891 (91,349; 92,540)

70 70 DesvPad Combinado = 12,4039 ANOVA com um fator: T_LIXO versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO ,0 270,57 0,000 Erro ,3 Total Sumário do Modelo S R2 R2(aj) R2(pred) 10, ,30% 16,24% 16,16% Médias REGIÃO N Média DesvPad IC de 95% CO ,464 3,133 ( 96,544; 98,383) N ,476 13,469 ( 86,540; 88,411) NE ,949 15,434 ( 88,481; 89,417) S ,2790 2,6361 (97,7038; 98,8542) SE ,330 5,332 ( 96,845; 97,816) DesvPad Combinado = 10,1136

71 71 ANOVA com um fator: T_FORA6A14 versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO ,57 251,97 0,000 Erro ,02 Total Sumário do Modelo S R2 R2(aj) R2(pred) 2, ,35% 15,29% 15,07% Médias REGIÃO N Média DesvPad IC de 95% CO 465 3,031 2,752 ( 2,808; 3,254) N 449 6,115 6,254 ( 5,888; 6,342) NE ,0283 1,8439 (2,9148; 3,1419) S ,0248 1,4232 (1,8852; 2,1643) SE ,3609 1,5336 (2,2432; 2,4787) DesvPad Combinado = 2,45332

72 72 ANOVA com um fator: T_M10A14CF versus REGIÃO Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO 4 125,9 31, ,09 0,000 Erro ,4 0,4555 Total ,3 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,74% 4,67% 4,53% Médias REGIÃO N Média DesvPad IC de 95% CO 465 0,4787 0,9363 (0,4174; 0,5401) N 449 0,7663 0,8675 (0,7039; 0,8288) NE ,4913 0,6793 (0,4600; 0,5225) S ,2812 0,6341 (0,2428; 0,3196) SE ,2636 0,5388 (0,2312; 0,2960) DesvPad Combinado = 0, ANOVA com um fator: pesorur versus REGIÃO

73 73 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO ,32 0,000 Erro ,06606E Total ,38616E+11 Sumário do Modelo S R2 R2(aj) R2(pred) 6096,40 13,41% 13,35% 13,24% Médias REGIÃO N Média DesvPad IC de 95% CO (2644; 3752) N (8790; 9918) NE (7667; 8231) S (3126; 3820) SE (3106; 3691) DesvPad Combinado = 6096,40 ANOVA com um fator: pesourb versus REGIÃO

74 74 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO 4 6,46741E+11 1,61685E+11 4,10 0,003 Erro ,19359E Total ,20006E+14 Sumário do Modelo S R2 R2(aj) R2(pred) ,29% 0,22% 0,16% Médias REGIÃO N Média DesvPad IC de 95% CO ( 3448; 39566) N ( 7601; 44357) NE (12445; 30834) S ( 8282; 30878) SE (35247; 54317) DesvPad Combinado = ANOVA com um fator: IDHM versus REGIÃO

75 75 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO 4 16,24 4, ,58 0,000 Erro ,57 0,00226 Total ,81 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,37% 56,34% 56,29% Médias REGIÃO N Média DesvPad IC de 95% CO 465 0, ,03680 (0,68486; 0,69350) N 449 0, ,06016 (0,60355; 0,61235) NE , ,04327 (0,58848; 0,59288) S , ,04159 (0,71141; 0,71682) SE , ,05428 (0,69670; 0,70127) DesvPad Combinado = 0, ANOVA com um fator: IDHM_E versus REGIÃO Método

76 76 Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO 4 18,84 4, ,60 0,000 Erro ,59 0,00532 Total ,43 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,89% 38,85% 38,78% Médias REGIÃO N Média DesvPad IC de 95% CO 465 0, ,05977 (0,57717; 0,59044) N 449 0, ,09066 (0,48368; 0,49718) NE , ,06579 (0,48504; 0,49180) S , ,06520 (0,60887; 0,61716) SE , ,08287 (0,60469; 0,61169) DesvPad Combinado = 0, ANOVA com um fator: IDHM_L versus REGIÃO Método Hipótese nula Todas as médias são iguais

77 77 Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO 4 6,941 1, ,18 0,000 Erro ,161 0,00075 Total ,103 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,52% 62,49% 62,46% Médias REGIÃO N Média DesvPad IC de 95% CO 465 0, , (0,819848; 0,824823) N 449 0, ,02871 ( 0,77785; 0,78291) NE , , (0,753064; 0,755596) S , , (0,833775; 0,836888) SE , , (0,826873; 0,829499) DesvPad Combinado = 0, ANOVA com um fator: IDHM_R versus REGIÃO Método Hipótese nula Todas as médias são iguais

78 78 Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores REGIÃO 5 CO; N; NE; S; SE Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P REGIÃO 4 21,93 5, ,97 0,000 Erro ,22 0,00256 Total ,15 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,67% 60,64% 60,60% Médias REGIÃO N Média DesvPad IC de 95% CO 465 0, ,04209 (0,67951; 0,68870) N 449 0, ,06194 (0,58815; 0,59750) NE , ,04611 (0,55992; 0,56460) S , ,04419 (0,71057; 0,71632) SE , ,05769 (0,67873; 0,68358) DesvPad Combinado = 0, Box Plot das Regiões e Estados Foram selecionadas para análise as variáveis com maior valor de F. São elas: ESPVIDA, MORT1, T_ANALF15M, IDHM_L e IDHM_R. Segue abaixo os gráficos Box-Plot considerando todas as regiões para cada uma das variáveis. Eles apenas corroboram visualmente o que o P-value e as demais análises acima já nos indicavam

79 ESPVIDA ESPVIDA 79 Boxplot de ESPVIDA 80,0 77,5 75,0 72,5 70,0 67,5 65,0 CO N NE S SE REGIÃO Na região N, linha 131 com espvida 66,61 é a cidade de TAPAUÁ e a linha 423 com espvida 66,46 é a cidade de Sampaio. 80,0 Boxplot de ESPVIDA 77,5 75,0 72,5 70,0 67,5 65,0 AC AL AM AP BA CE ES GO MA MG MS MT PA PB ESTADO PE PI PR RJ RN RO RR RS SC SE TO SP

80 MORT1 MORT1 80 Boxplot de MORT CO N NE REGIÃO S SE Na região NE, a linha 1733 é a cidade de Roteiro com MORT1 46,40, a linha 1713 é a cidade de Olivença com MORT1 de 45, Boxplot de MORT AL AC AM ES CE BA AP GO MA MG MS MT PA PB PE PI PR RJ ESTADO RN RO RR RS SC SE SP TO

81 T_ANALF15M T_ANALF15M 81 Boxplot de T_ANALF15M CO N NE S SE REGIÃO Na região N, a linha 138 é a cidade de Alto Alegre com T_ANALF15M de 40, Boxplot de T_ANALF15M AL AC AP AM CE BA ES GO MA MG MS MT PA PB ESTADO PE PI PR RJ RN RO RR SC RS SE TO SP

82 IDHM_L IDHM_L 82 Boxplot de IDHM_L 0,90 0,85 0,80 0,75 0,70 CO N NE S SE REGIÃO Na região CO, a linha 5504 refere-se a cidade de Piranhas com IDHL de 0,88 e na região NE, a linha 1733 é a cidade de Roteiro com IDHM-L de 0,67 e a linha 1287 é a cidade de Cacimbas com IDHM_L é 0,67. 0,90 Boxplot de IDHM_L 0,85 0,80 0,75 0,70 AL AC AM ES CE BA AP GO MA MG MS MT PA PB ESTADO RN RJ PR PI PE RO TO SP SE SC RS RR

83 IDHM_R IDHM_R 83 Boxplot de IDHM_R 0,9 0,8 0,7 0,6 0,5 0,4 CO N NE REGIÃO S SE Na região SE, a linha 3222 refere-se a a cidade de Niterói com IDHM_R de 0,891, já a outlier 560 na região NE refere-se a cidade de Marajá do Sena com IDHM_R de 0,40. 0,9 Boxplot de IDHM_R 0,8 0,7 0,6 0,5 0,4 AL AC AM AP ES CE BA GO MA MG MS MT PE PB PA ESTADO PI PR RJ RN RO TO SP SE SC RS RR 5.4 Análises e Considerações O presente trabalho efetuou uma análise das médias amostrais, intervalos de confiança para a média populacional e análise de variância referente a 5 variáveis do IBGE separados por região. O objetivo foi comparar as variáveis nos diferentes estados e regiões do Brasil. Percebemos a existência de uma clara distinção entre as diferentes regiões do Brasil.

84 Identificamos também Outliers que são cidades muito acima da média ou muito abaixo da média nos possibilitando fazer a reflexão de que o Brasil ainda é um país com diferentes situações e realidades em seus diferentes municípios e regiões. CAPÍTULO VI. AMOSTRAGEM 6.1 Apresentação e Objetivos O objetivo de nosso trabalho é comparar a o comportamento de cada variável de acordo com a amostragem escolhida para demonstrar como os resultados de uma pesquisa modem ser significativamente distintos dependendo da amostra escolhida. Para tanto, o Minitab escolheu aleatoriamente os municípios para a amostragem de 25, 100 e 400 municípios. Para cada amostra foram efetuadas uma análise exploratória de dados, a análise descritiva e boxplot para serem comparadas as médias, medianas e desvio padrão de cada variável por amostra As variáveis Para esta análise foram consideradas apenas cinco variáveis que estão relacionadas no quadro abaixo: Quadro 13 - Variáveis utilizadas para amostragem. 84 ESPVIDA MORT1 Variável Significado Tipo T_ANALF15M IDHM_L Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. Número de crianças que não deverão sobreviver ao primeiro ano de vida em cada 1000 crianças nascidas vivas. Razão entre a população de 15 anos ou mais de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Índice da dimensão Longevidade que é um dos 3 componentes do IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do indicador) - (valor mínimo)] / [(valor máximo) - (valor mínimo)], onde os valores mínimo e máximo são 25 e 85 anos, respectivamente. Variável Quantitativa Variável Quantitativa Variável Quantitativa Variável Quantitativa Unidade de Medida Índice Índice Índice Índice

85 85 IDHM_R Índice da dimensão Renda que é um dos 3 componentes do IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado do indicador) - ln (valor mínimo)] / [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). Fonte: Elaborada pela autora Variável Quantitativa Índice 6.3 Análise Exploratória para Amostra de 25,100 e 400 Indivíduos A amostra de 25 indivíduos foi feita de duas maneiras: Amostra Aleatória: foi feita através a funcionalidade Random Data do MINITAB Amostras Variável ESPVIDA Relatório Resumo para ESPVIDA Teste de normalidade de Anderson-Darling A-Quadrado 34,97 Valor-p <0,005 Média 73,088 DesvPad 2,680 Variância 7,184 Assimetria -0, Curtose -0, N 5564 Mínimo 65,300 1o. Quartil 71,150 Mediana 73,470 3o Quartil 75,160 Máximo 78,640 Intervalo de 95% de Confiança para Média ,018 73,159 Intervalo de 95% de Confiança para Mediana População Total Média: 73,08 Desvio Padrão: 2,68 Mínimo: 65,300 Mediana: 73,470 Máximo: 78,64 73,380 73,550 Intervalo de 95% de Confiança para DesvPad 2,631 2,731 Intervalos de 95% de Confiança Média Mediana 73,0 73,1 73,2 73,3 73,4 73, Relatório Resumo para esp25 Teste de normalidade de Anderson-Darling A-Quadrado 0,91 Valor-p 0,017 Média 73,877 DesvPad 2,923 Variância 8,545 Assimetria -0,46838 Curtose -1,20511 N 25 Mínimo 68,540 1o. Quartil 71,400 Mediana 75,100 3o Quartil 76,365 Máximo 77,620 Intervalo de 95% de Confiança para Média ,671 75,084 Intervalo de 95% de Confiança para Mediana 71,543 75,822 População Total Média: 73,87 Desvio Padrão: 2,92 Mínimo: 68,54 Mediana: 75,100 Máximo: 77,62 Intervalo de 95% de Confiança para DesvPad 2,283 4,067 Intervalos de 95% de Confiança Média Mediana

86 Dados Relatório Resumo para esp100 Teste de normalidade de Anderson-Darling A-Quadrado 0,94 Valor-p 0,017 Média 72,880 DesvPad 2,656 Variância 7,056 Assimetria -0, Curtose -0, N 100 Mínimo 67,030 1o. Quartil 71,023 Mediana 73,410 3o Quartil 74,817 Máximo 77,690 Intervalo de 95% de Confiança para Média ,353 73,407 Intervalo de 95% de Confiança para Mediana População Total Média: 72,88 Desvio Padrão: 2,65 Mínimo: 67,03 Mediana: 73,41 Máximo: 77,69 72,477 73,980 Intervalo de 95% de Confiança para DesvPad 2,332 3,086 Intervalos de 95% de Confiança Média Mediana 72,5 73,0 73,5 74,0 Relatório Resumo para esp400 Teste de normalidade de Anderson-Darling A-Quadrado 2,80 Valor-p <0,005 Média 73,170 DesvPad 2,651 Variância 7,027 Assimetria -0, Curtose -0, N 400 Mínimo 66,120 1o. Quartil 71,352 Mediana 73,500 3o Quartil 75,140 Máximo 78,440 População Total Média: 73,17 Desvio Padrão: 2,65 Mínimo: 66,12 Mediana: 73,50 Máximo: 78,44 Intervalo de 95% de Confiança para Média ,909 73,431 Intervalo de 95% de Confiança para Mediana 73,259 73,781 Intervalo de 95% de Confiança para DesvPad 2,479 2,849 Intervalos de 95% de Confiança Média Mediana 73,0 73,2 73,4 73,6 73,8 80,0 Boxplot de ESPVIDA; esp25; ,5 75,0 72,5 70,0 67,5 65,0 ESPVIDA esp25 esp100 esp400 Neste caso, as amostra aleatóriade 400 municipíos teve valores e de distribuição de dados, média, mediana, mínimo e máximo próximos da amostra de municiíos. Portanto, a amostra aleatória de 400 foi representativa para a variável ESPVIDA. O Box Plot representa o comportamento da população e a amostra, a média, mediana e os quartis dos valores de ESPVIDA.

87 Amostras para a Variável MORT1 Relatório Resumo para MORT1 Teste de normalidade de Anderson-Darling A-Quadrado 158,73 Valor-p <0, Média 19,248 DesvPad 7,137 Variância 50,936 Assimetria 1,00602 Curtose 0,43190 N 5564 Mínimo 8,490 1o. Quartil 13,800 Mediana 16,905 3o Quartil 23,800 Máximo 46,800 Intervalo de 95% de Confiança para Média 19,060 19,435 Intervalo de 95% de Confiança para Mediana 16,700 17,188 Intervalo de 95% de Confiança para DesvPad 7,007 7,272 População Total Média: 19,24 Desvio Padrão: 7,13 Mínimo: 8,49 Mediana: 16,90 Máximo: 46,80 Intervalos de 95% de Confiança Média Mediana 17,0 17,5 18,0 18,5 19,0 19,5 15 Relatório Resumo para mort25 Teste de normalidade de Anderson-Darling A-Quadrado 0,61 Valor-p 0,098 Média 18,644 DesvPad 5,033 Variância 25,334 Assimetria 0, Curtose -0, N 25 Mínimo 11,300 1o. Quartil 14,700 Mediana 17,100 3o Quartil 22,800 Máximo 31,000 Intervalo de 95% de Confiança para Média ,566 20,722 Intervalo de 95% de Confiança para Mediana 15,000 20,841 Intervalo de 95% de Confiança para DesvPad 3,930 7,002 População Total Média: 18,64 Desvio Padrão: 5,03 Mínimo: 11,30 Mediana: 17,100 Máximo: 31,00 Intervalos de 95% de Confiança Média Mediana 15,0 16,5 18,0 19,5 21,0 Relatório Resumo para mort100 Teste de normalidade de Anderson-Darling A-Quadrado 2,39 Valor-p <0,005 Média 19,905 DesvPad 7,228 Variância 52,248 Assimetria 1,09429 Curtose 1,06967 N 100 Mínimo 8,930 1o. Quartil 14,250 Mediana 18,100 3o Quartil 24,675 Máximo 42,600 Intervalo de 95% de Confiança para Média População Total Média: 19,90 Desvio Padrão: 7,22 Mínimo: 8,93 Mediana: 18,100 Máximo: 42, ,470 21,339 Intervalo de 95% de Confiança para Mediana 16,323 20,000 Intervalo de 95% de Confiança para DesvPad 6,346 8,397 Intervalos de 95% de Confiança Média Mediana

88 Dados Relatório Resumo para mort Teste de normalidade de Anderson-Darling A-Quadrado 13,86 Valor-p <0,005 Média 19,119 DesvPad 7,244 Variância 52,480 Assimetria 0, Curtose 0, N 400 Mínimo 8,900 1o. Quartil 13,400 Mediana 16,400 3o Quartil 23,900 Máximo 44,300 Intervalo de 95% de Confiança para Média 18,406 19,831 Intervalo de 95% de Confiança para Mediana 15,700 17,609 Intervalo de 95% de Confiança para DesvPad 6,775 7,784 População Total Média: 19,11 Desvio Padrão: 7,24 Mínimo: 8,90 Mediana: 16,400 Máximo: 44,30 Intervalos de 95% de Confiança Média Mediana Boxplot de MORT1; mort25; MORT1 mort25 mort100 mort 400 Neste caso, as amostra aleatóriade 400 municiíos teve valores e de distribuição de dados, média, mediana, mínimo e máximo próximos da amostra de municiíos. Portanto, a amostra aleatória de 400 foi representativa para a variável MORT!. O Box Plot representa o comportamento da população e a amostra, a média, mediana e os quartis dos valores de MORT Amostras para a Variável T_ANALF15M 6 12 Relatório Resumo para T_ANALF15M Teste de normalidade de Anderson-Darling A-Quadrado 140,28 Valor-p <0,005 Média 16,161 DesvPad 9,839 Variância 96,807 Assimetria 0, Curtose -0, N 5564 Mínimo 0,950 1o. Quartil 8,080 Mediana 13,120 3o Quartil 24,320 Máximo 44,400 Intervalo de 95% de Confiança para Média ,903 16,420 Intervalo de 95% de Confiança para Mediana 12,860 13,486 População Total Média: 16,16 Desvio Padrão: 9,83 Mínimo: 0,95 Mediana: 13,12 Máximo: 44,40 Intervalo de 95% de Confiança para DesvPad 9,660 10,025 Intervalos de 95% de Confiança Média Mediana

89 Dados Relatório Resumo para ANAL15 25 Teste de normalidade de Anderson-Darling A-Quadrado 0,52 Valor-p 0,168 Média 17,889 DesvPad 9,799 Variância 96,016 Assimetria 0,03180 Curtose -1,29346 N 25 Mínimo 2,640 1o. Quartil 7,505 Mediana 17,420 3o Quartil 25,870 Máximo 34,330 Intervalo de 95% de Confiança para Média ,844 21,934 Intervalo de 95% de Confiança para Mediana População Total Média: 17,88 Desvio Padrão: 9,79 Mínimo:2,64 Mediana: 17,42 Máximo: 34,33 11,573 24,920 Intervalo de 95% de Confiança para DesvPad 7,651 13,632 Intervalos de 95% de Confiança Média Mediana Relatório Resumo para ANAL Teste de normalidade de Anderson-Darling A-Quadrado 1,29 Valor-p <0,005 Média 16,101 DesvPad 9,396 Variância 88,285 Assimetria 0, Curtose -0, N 100 Mínimo 2,270 1o. Quartil 8,078 Mediana 14,510 3o Quartil 22,883 Máximo 44,400 Intervalo de 95% de Confiança para Média ,236 17,965 Intervalo de 95% de Confiança para Mediana 11,642 18,153 Intervalo de 95% de Confiança para DesvPad 8,250 10,915 População Total Média: 16,10 Desvio Padrão: 9,39 Mínimo:2,27 Mediana: 14,51 Máximo: 44,40 Intervalos de 95% de Confiança Média Mediana 12,0 13,5 15,0 16,5 18, Relatório Resumo para ANALF Teste de normalidade de Anderson-Darling A-Quadrado 10,80 Valor-p <0,005 Média 15,918 DesvPad 9,449 Variância 89,287 Assimetria 0, Curtose -0, N 400 Mínimo 2,450 1o. Quartil 8,492 Mediana 13,035 3o Quartil 23,093 Máximo 40,350 Intervalo de 95% de Confiança para Média ,989 16,847 Intervalo de 95% de Confiança para Mediana População Total Média: 15,91 Desvio Padrão: 9,44 Mínimo:2,45 Mediana: 13,03 Máximo: 40,35 12,278 13,656 Intervalo de 95% de Confiança para DesvPad 8,837 10,154 Intervalos de 95% de Confiança Média Mediana Boxplot de T_ANALF15M; ANAL15 25; T_ANALF15M ANAL15 25 ANAL ANALF Neste caso, as amostra aleatórias tiveram valores e de distribuição de dados, média, mediana, mínimo bem divergentes da amostra de municiíos. O Box Plot representa o comportamento da população e a amostra, a média, mediana e os quartis dos valores de T_ANALF15M.

90 Amostras para a Variável IDHM_L 0,69 0,72 0,75 Relatório Resumo para IDHM_L Teste de normalidade de Anderson-Darling A-Quadrado 35,08 Valor-p <0,005 Média 0,80155 DesvPad 0,04467 Variância 0,00200 Assimetria -0, Curtose -0, N 5564 Mínimo 0, o. Quartil 0,76900 Mediana 0, o Quartil 0,83600 Máximo 0,89400 Intervalo de 95% de Confiança para Média 0,78 0,81 0,84 0,87 0, ,80273 Intervalo de 95% de Confiança para Mediana 0, ,80900 Intervalo de 95% de Confiança para DesvPad População Total Média: 0,80 Desvio Padrão: 0,04 Mínimo:0,67 Mediana:0,80 Máximo: 0,89 0, ,04552 Intervalos de 95% de Confiança Média Mediana 0,800 0,802 0,804 0,806 0,808 0,810 0,72 0,76 Relatório Resumo para IDHML 25 Teste de normalidade de Anderson-Darling A-Quadrado 0,37 Valor-p 0,393 Média 0,79108 DesvPad 0,04535 Variância 0,00206 Assimetria -0, Curtose -0, N 25 Mínimo 0, o. Quartil 0,75000 Mediana 0, o Quartil 0,82650 Máximo 0,87800 Intervalo de 95% de Confiança para Média 0,80 0,84 0,88 0, ,80980 Intervalo de 95% de Confiança para Mediana 0, ,82300 Intervalo de 95% de Confiança para DesvPad População Total Média: 0,79 Desvio Padrão: 0,04 Mínimo:0,71 Mediana:0,79 Máximo: 0,87 0, ,06309 Intervalos de 95% de Confiança Média Mediana 0,77 0,78 0,79 0,80 0,81 0,82 0,68 0,72 Relatório Resumo para IDHML 100 Teste de normalidade de Anderson-Darling A-Quadrado 0,82 Valor-p 0,032 Média 0,79674 DesvPad 0,04472 Variância 0,00200 Assimetria -0, Curtose -0, N 100 Mínimo 0, o. Quartil 0,76650 Mediana 0, o Quartil 0,82900 Máximo 0,87800 Intervalo de 95% de Confiança para Média 0,76 0,80 0,84 0,88 0, ,80561 Intervalo de 95% de Confiança para Mediana 0, ,81500 Intervalo de 95% de Confiança para DesvPad População Total Média: 0,79 Desvio Padrão: 0,04 Mínimo:0,68 Mediana:0,80 Máximo: 0,87 0, ,05195 Intervalos de 95% de Confiança Média Mediana 0,790 0,795 0,800 0,805 0,810 0,815 0,69 0,72 Relatório Resumo para IDHML 400 Teste de normalidade de Anderson-Darling A-Quadrado 2,46 Valor-p <0,005 Média 0,80314 DesvPad 0,04448 Variância 0,00198 Assimetria -0, Curtose -0, N 400 Mínimo 0, o. Quartil 0,77100 Mediana 0, o Quartil 0,83775 Máximo 0,89400 Intervalo de 95% de Confiança para Média 0,75 0,78 0,81 0,84 0,87 0, ,80751 Intervalo de 95% de Confiança para Mediana 0, ,81309 Intervalo de 95% de Confiança para DesvPad População Total Média: 0,80 Desvio Padrão: 0,04 Mínimo:0,67 Mediana:0,80 Máximo: 0,89 0, ,04780 Intervalos de 95% de Confiança Média Mediana 0,8000 0,8025 0,8050 0,8075 0,8100 0,8125

91 Dados 91 Boxplot de IDHM_L; IDHML 25;... 0,90 0,85 0,80 0,75 0,70 IDHM_L IDHML 25 IDHML 100 IDHML 400 Neste caso, todas as amostras, a de 25,100 e 400 possuem valores de distribuição de dados, média, mediana, mínimo e máximo próximos da amostra de municiíos. Portanto, a todas são representativas para a variável IDHM_L. O Box Plot representa o comportamento da população e a amostra, a média, mediana e os quartis dos valores de IDHM_L Amostras para a Variável IDHM_R 0,42 0,49 0,56 Relatório Resumo para IDHM_R Teste de normalidade de Anderson-Darling A-Quadrado 55,30 Valor-p <0,005 Média 0,64283 DesvPad 0,08061 Variância 0,00650 Assimetria -0, Curtose -0, N 5564 Mínimo 0, o. Quartil 0,57200 Mediana 0, o Quartil 0,70700 Máximo 0,89100 Intervalo de 95% de Confiança para Média 0,63 0,70 0,77 0,84 0, ,64495 Intervalo de 95% de Confiança para Mediana População Total Média: 0,64 Desvio Padrão: 0,08 Mínimo:0,40 Mediana:0,65 Máximo: 0,89 0, ,65700 Intervalo de 95% de Confiança para DesvPad 0, ,08214 Intervalos de 95% de Confiança Média Mediana 0,640 0,644 0,648 0,652 0,656 0,50 0,55 Relatório Resumo para IDHMR 25 Teste de normalidade de Anderson-Darling A-Quadrado 0,43 Valor-p 0,284 Média 0,65008 DesvPad 0,08417 Variância 0,00708 Assimetria -0, Curtose -0, N 25 Mínimo 0, o. Quartil 0,59250 Mediana 0, o Quartil 0,71400 Máximo 0,81300 Intervalo de 95% de Confiança para Média 0,60 0,65 0,70 0,75 0,80 0, ,68482 Intervalo de 95% de Confiança para Mediana População Total Média: 0,65 Desvio Padrão: 0,08 Mínimo:0,48 Mediana:0,66 Máximo: 0,81 0, ,70542 Intervalo de 95% de Confiança para DesvPad 0, ,11709 Intervalos de 95% de Confiança Média Mediana 0,60 0,62 0,64 0,66 0,68 0,70

92 Dados 92 0,50 0,55 Relatório Resumo para IDHMR 100 Teste de normalidade de Anderson-Darling A-Quadrado 2,62 Valor-p <0,005 Média 0,65680 DesvPad 0,08090 Variância 0,00654 Assimetria -0, Curtose -0, N 100 Mínimo 0, o. Quartil 0,58100 Mediana 0, o Quartil 0,72250 Máximo 0,80400 Intervalo de 95% de Confiança para Média 0,60 0,65 0,70 0,75 0,80 0, ,67285 População Total Média: 0,65 Desvio Padrão: 0,08 Mínimo:0,47 Mediana:0,68 Máximo: 0,80 Intervalo de 95% de Confiança para Mediana 0, ,70026 Intervalo de 95% de Confiança para DesvPad 0, ,09398 Intervalos de 95% de Confiança Média Mediana 0,64 0,66 0,68 0,70 0,48 Relatório Resumo para IDHMR 400 Teste de normalidade de Anderson-Darling A-Quadrado 3,94 Valor-p <0,005 Média 0,64483 DesvPad 0,08099 Variância 0,00656 Assimetria -0, Curtose -0, N 400 Mínimo 0, o. Quartil 0,57500 Mediana 0, o Quartil 0,70775 Máximo 0,86400 Intervalo de 95% de Confiança para Média 0,56 0,64 0,72 0,80 0, ,65279 Intervalo de 95% de Confiança para Mediana 0, ,66918 Intervalo de 95% de Confiança para DesvPad 0, ,08703 População Total Média: 0,64 Desvio Padrão: 0,08 Mínimo:0,41 Mediana:0,65 Máximo: 0,86 Intervalos de 95% de Confiança Média Mediana 0,64 0,65 0,66 0,67 Boxplot de IDHM_R; IDHMR 25;... 0,9 0,8 0,7 0,6 0,5 0,4 IDHM_R IDHMR 25 IDHMR 100 IDHMR 400 Neste caso, as amostra aleatóriade 400 municiíos teve valores e de distribuição de dados, média, mediana, mínimo e máximo próximos da amostra de municiíos. Portanto, a amostra aleatória de 400 foi representativa para a variável IDHMR O Box Plot representa o comportamento da população e a amostra, a média, mediana e os quartis dos valores deidhm_r. 6.4 Considerações e Análises À medida que o tamanho da amostra aleatória aumenta, o valor da análise exploratória de dados também aumenta. Foi possível verificar esta premissa, pela comparação dos valores de média, desvio padrão, mediana, mínimo e máximo entre os dados da população e da amostra, nas variáveis analisadas. Apenas a variável TANALF15M valores bem distintos entre as amostras.

93 Apesar do acréscimo de indivíduos na amostra trazer mais representatividade na amostra, é preciso comparar se este acréscimo é acompanhado de um acréscimo significativo de representividade da população. CAPÍTULO VII. ANÁLISE DOS COMPONENTES PRINCIPAIS. 7.1 Apresentação e Objetivos O objetivo deste tópico é, através da análise dos componentes principais, tentarmos reduzir o número de variáveis, ou seja, percebermos as relações entre as variáveis e a possibilidade de agruparmos as mesmas. Certamente a análise de correlações e dendogramas já demonstrados anteriormente nos dão uma ideia de que a possibilidade de agrupamento é grande pelos elevados índices de correlação entre todas as variáveis. 7.2 Análise dos componentes 93 Análise de Componentes Principais: ESP VIDA N; MORT1 NP; T_ANALF11A14; T_ANALF15MNP; PIND NP; Autoanálise (Autovalores e Autovetores) da Matriz de Correlação Autovalor 6,4868 1,4987 1,1388 0,9788 0,7903 0,7304 0,6941 0,5380 0,4884 0,2894 Proporção 0,463 0,107 0,081 0,070 0,056 0,052 0,050 0,038 0,035 0,021 Acumulado 0,463 0,570 0,652 0,722 0,778 0,830 0,880 0,918 0,953 0,974 Autovalor 0,1656 0,1278 0,0439 0,0290 Proporção 0,012 0,009 0,003 0,002 Acumulado 0,986 0,995 0,998 1,000 Variável CP1 CP2 CP3 CP4 CP5 CP6 CP7 CP8 CP9 ESP VIDA N 0,351 0,095 0,123 0,045-0,089 0,082-0,128-0,404-0,046 MORT1 NP 0,349 0,073 0,136 0,050-0,124 0,048-0,137-0,427-0,130 T_ANALF11A14NP 0,322-0,218-0,038 0,063 0,106-0,214-0,160-0,143-0,171 T_ANALF15MNP 0,360 0,090 0,053 0,034 0,027 0,055-0,141-0,075-0,044 PIND NP 0,358-0,095-0,023-0,061-0,061-0,065 0,001 0,070-0,120 RIND NP -0,029 0,245 0,554 0,624 0,232-0,396 0,115 0,118 0,001 REN3 NP 0,321 0,286-0,040-0,029 0,058 0,166 0,065 0,232 0,508 RENOCUP N 0,339 0,259-0,020-0,041 0,036 0,142 0,074 0,227 0,391 T_AGUA N 0,282 0,007 0,026-0,152 0,313 0,105-0,026 0,572-0,589 T_LIXO N 0,217-0,139-0,070-0,023-0,687-0,517 0,252 0,262 0,007 T_FORA6A14 NP 0,143-0,502-0,294 0,101 0,445-0,363-0,220 0,006 0,357 T_M10A14CF NP 0,084-0,337-0,240 0,697-0,187 0,512 0,156 0,106-0,058 PESORUR N -0,134 0,400-0,367 0,250-0,210-0,129-0,721 0,182-0,072 PESOURB N 0,054 0,408-0,607 0,115 0,237-0,214 0,490-0,253-0,205 Variável CP10 CP11 CP12 CP13 CP14 ESP VIDA N -0,383-0,070 0,094-0,095 0,696 MORT1 NP -0,323-0,092 0,076 0,087-0,701 T_ANALF11A14NP 0,642-0,420 0,347-0,018 0,047 T_ANALF15MNP 0,327 0,113-0,841-0,019 0,022 PIND NP 0,148 0,829 0,298 0,179 0,022

94 Autovalor Segundo Componente 94 RIND NP -0,017 0,068 0,028 0,013 0,004 REN3 NP 0,017-0,210 0,084 0,642 0,041 RENOCUP N 0,051 0,024 0,164-0,733-0,133 T_AGUA N -0,284-0,180-0,016 0,007 0,007 T_LIXO N -0,132-0,156-0,121-0,015 0,021 T_FORA6A14 NP -0,326 0,044-0,120-0,029-0,034 T_M10A14CF NP -0,005-0,020 0,003-0,005-0,002 PESORUR N -0,018 0,041 0,065-0,000 0,003 PESOURB N -0,011 0,016-0,024 0,006 0,001 Gráfico de Loading (Carga Fatorial) de ESP VIDA N;...; PESOURB N 0,50 PESORUR N PESOURB N 0,25 RIND NP REN3 NP RENOCUP N 0,00 T_LIXO N T_ANALF15MNP ESP VIDA N MORT1 NP T_AGUA N PIND NP -0,25 T_M10A14CF NP T_ANALF11A14NP -0,50 T_FORA6A14 NP -0,2-0,1 0,0 0,1 0,2 Primeiro Componente 0,3 0,4 Scree Plot - gráfico de perfil de autovalores de ESP VIDA N;...; PESOURB N Número do Componente Pela análise dos detalhes e gráfico acima percebemos que se juntarmos as 14 variáveis em apenas 1 (PC1) teremos uma proporção de explicação de apenas de 43%, para se atingir um nível de pelo menos 90% precisaríamos de oito componentes (PC1 a PC8) chegamos a 91% e assim por diante.

95 PC Scaterplot por região Gráfico de Dispersão de PC1 versus PC2 5 REGIÃO CO N NE S SE PC2 7.4 Análises e Considerações De acordo com todas as análises acima, percebemos claramente o agrupamento das variáveis antes mesmo de aplicarmos o teste de componentes principais. Observamos que através dos componentes principais o CP1 explica grande parte do comportamento das variáveis, sendo a representatividade de 46%, porém teremos representatividade de 91% apenas no oitavo componente CP8.O gráfico de looding e o screen plot nos ajuda a enxergar com mais clareza esta afirmação. CAPÍTULO VIII. ANÁLISE DE CLUSTER 8.1 Apresentação e Objetivos A análise de variância (ANOVA) testa a hipótese de que as médias de duas ou mais populações são iguais. Análises ANOVA testam a importância de um ou mais fatores comparando as médias das variáveis de resposta em diferentes níveis dos fatores. A hipótese nula afirma que todas as médias das populações (médias dos níveis dos fatores) são iguais, enquanto a hipótese alternativa afirma que pelo menos uma é diferente. O objetivo do presente trabalho é através da ANOVA obter as médias por estado de cada uma das quatro variáveis ESPVIDA, MORT1, T_ANALF11A14 e T_ANALF15M para que posteriormente pudéssemos realizar uma análise de cluster das médias por estado a fim de agrupar os munícipios e sintetizar os dados. Neste trabalho faremos o agrupamento dos estados com maior similaridade em clusters. 8.2 Análise do agrupamento das observações Análise de Agrupamentos de Observações: ESP VIDA M; MORT 1 M; T_ANALF11á14 M; T_ANALF15M M Distância Euclideana, Ligação Completa Passos de Amalgamação

96 96 Número de obs. no Número de Nível de Nível de Agrupados Novo novo Passo agrupados similaridade distância reunidos agrupado agrupado ,4715 0, ,8539 0, ,9615 0, ,3665 0, ,5533 0, ,8399 0, ,2765 0, ,1685 0, ,8375 0, ,7920 0, ,9409 0, ,7477 0, ,2976 0, ,1785 0, ,4686 0, ,1159 0, ,9018 0, ,4348 0, ,1887 0, ,9190 0, ,3522 0, ,8182 0, ,0913 0, ,8568 0, ,0000 0, Partição Final Número de agrupados: 7 Dentro da soma de quadrados Distância Distância Número de do média do máxima do observações agrupado centróide centróide Agrupado1 8 0, , , Agrupado2 2 0, , , Agrupado3 2 0, , , Agrupado4 3 0, , , Agrupado5 7 0, , , Agrupado6 1 0, , ,000000

97 Similaridade 97 Agrupado7 3 0, , , Centróides do grupo Variável Agrupado1 Agrupado2 Agrupado3 Agrupado4 Agrupado5 Agrupado6 Agrupado7 ESP VIDA M 0, , , , , ,5685 0, MORT 1 M 0, , , , , ,7608 0, T_ANALF11á14 M 0, , , , , ,7615 0, T_ANALF15M M 0, , , , , ,5976 0, Centróide Variável global ESP VIDA M 0, MORT 1 M 0, T_ANALF11á14 M 0, T_ANALF15M M 0, Distâncias Entre Centróides do Grupo Agrupado1 Agrupado2 Agrupado3 Agrupado4 Agrupado5 Agrupado6 Agrupado7 Agrupado1 0, , , , , , , Agrupado2 0, , , , , , , Agrupado3 0, , , , , , , Agrupado4 0, , , , , , , Agrupado5 0, , , , , , , Agrupado6 0, , , , , , , Agrupado7 0, , , , , , , Média por estados 0,00 33,33 66,67 100,00 AC CE BA PB SE PE RN AL PI MA AM PA RR AP TO RO Observações ES PR GO RJ MG MT MS SP SC RS

98 Similaridade Notamos analisando o dendograma que podemos separar o Brasil em 7 grandes grupos de estados com mesma similaridade de média destas variáveis. Os grupos cujos estados são mais similares entre si são Grupo 5, sendo os estados mais similares ES e GO e grupo 7 composto por RS, SC e SP, sendo os estados mais similares RS e SC Mapa do Brasil com 7 clusters 98 Média por estados 0,00 33,33 66,67 100,00 CE BA AC PB SE PE RN AL PI MA AM PA RR AP RO TO Observações ES PR GO RJ MG MT MS SP SC RS Neste segundo os dados dos estados foram divididos em três grandes grupos, o que é perfeitamente possível de acordo com a similaridade dos dados. Abaixo vemos a distribuição dos estados de acordo com a similaridade.

99 Mapa do Brasil com três Clusters 8.3 Considerações e análises Dada a similaridade dos dados entre alguns estados foi possível realizar o agrupamento das vinte e seis unidades federativas do Brasil a princípio em 7 grandes grupos. Posteriormente, analisando o cluster com 7grupos foi possível sintetizar ainda mais os dados dividindo o país em três grupos com alto grau de similaridade conforme demonstrado no segundo mapa acima. Através da formação destes clusters foi possível a sintetização dos dados de municípios em estados e grupos mostrando a grande diferença de realidade nos diferentes estados e regiões do Brasil conforme demonstramos através do mapa acima. Esta análise apenas corroborou a ideia de termos mais de um Brasil já antes mencionadas em trabalhos anteriores. CAPÍTULO IX. CLASSIFICAÇÃO SUPERVISIONADA. 9.1 Apresentação e Objetivos Neste trabalho faremos o agrupamento dos estados com maior similaridade em clusters.a princípio foi realizada uma classificação não supervisionada com a formação de 7 clusters, posteriormente fizemos uma classificação supervisionada com o propósito de reagrupar os grupos de acordo com as distâncias centroides de cada grupo e chegamos a um novo agrupamento de 4 clusters. 9.2 Classificação não supervisionada Análise de Agrupamentos de Observações: ESP VIDA M; MORT 1 M; T_ANALF11á14 M; T_ANALF15M M

100 100 Distância Euclideana, Ligação Completa Passos de Amalgamação Número de obs. no Número de Nível de Nível de Agrupados Novo novo Passo agrupados similaridade distância reunidos agrupado agrupado ,4715 0, ,8539 0, ,9615 0, ,3665 0, ,5533 0, ,8399 0, ,2765 0, ,1685 0, ,8375 0, ,7920 0, ,9409 0, ,7477 0, ,2976 0, ,1785 0, ,4686 0, ,1159 0, ,9018 0, ,4348 0, ,1887 0, ,9190 0, ,3522 0, ,8182 0, ,0913 0, ,8568 0, ,0000 0, Partição Final Número de agrupados: 7 Dentro da soma de quadrados Distância Distância Número de do média do máxima do observações agrupado centróide centróide Agrupado1 8 0, , , Agrupado2 2 0, , , Agrupado3 2 0, , , Agrupado4 3 0, , ,092354

101 101 Agrupado5 7 0, , , Agrupado6 1 0, , , Agrupado7 3 0, , , Centróides do grupo Variável Agrupado1 Agrupado2 Agrupado3 Agrupado4 Agrupado5 Agrupado6 Agrupado7 ESP VIDA M 0, , , , , ,5685 0, MORT 1 M 0, , , , , ,7608 0, T_ANALF11á14 M 0, , , , , ,7615 0, T_ANALF15M M 0, , , , , ,5976 0, Centróide Variável global ESP VIDA M 0, MORT 1 M 0, T_ANALF11á14 M 0, T_ANALF15M M 0, Distâncias Entre Centróides do Grupo Agrupado1 Agrupado2 Agrupado3 Agrupado4 Agrupado5 Agrupado6 Agrupado7 Agrupado1 0, , , , , , , Agrupado2 0, , , , , , , Agrupado3 0, , , , , , , Agrupado4 0, , , , , , , Agrupado5 0, , , , , , , Agrupado6 0, , , , , , , Agrupado7 0, , , , , , ,000000

102 Similaridade 102 Média por estados 0,00 33,33 66,67 100,00 AC CE BA PB SE PE RN AL PI MA AM PA RR AP TO RO Observações ES PR GO RJ MG MT MS SP SC RS 9.3 Classificação Supervisionada De acordo com a análise da distância dos centroides podemos extinguir 3 clusters que por sua proximidade com outros clusters puderam ser agrupados a estes. A classificação supervisionada foi realizada da seguinte forma: Número de observações Agrupado1 8 Agrupado foi para o grupo 1 Agrupado foi para o grupo 4 Agrupado4 3 Agrupado5 7

103 103 Agrupado foi para o grupo 4 Agrupado7 3 Recodificar Sumário Número Valor Valor de Original registrado Linhas Coluna de dados de origem CLUSTER OBS 7 Coluna de dados registrada Recodificado CLUSTER OBS 7 Número de linhas inalteradas: 21 Análise Discriminante: Recodificado CLU versus ESP VIDA M; MORT 1 M;... Método Linear para Resposta: Recodificado CLUSTER OBS 7 Preditores: ESP VIDA M; MORT 1 M; T_ANALF11á14 M; T_ANALF15M M Grupo Contagem Sumário de classificações Alocado no Grupo Verdadeiro Grupo Total de N N correto Proporção 1,000 1,000 1,000 1,000 N = 26 N Correto = 26 Proporção Correta = 1,000 Distância Quadrática Entre Grupos ,000 28,753 93, , ,753 0,000 30,151 71, ,396 30,151 0,000 10, ,945 71,862 10,602 0,000 Função Discriminante Linear para Grupos Constante -118,48-151,50-228,79-275,09 ESP VIDA M 84,26 179,43 415,68 542,74 MORT 1 M 37,14 20,71-81,35-135,34 T_ANALF11á14 M 245,86 195,58 198,35 169,98

104 Similaridade 104 T_ANALF15M M -27,56 53,97 71,27 105,78 Média por estados 0,00 33,33 66,67 100,00 AC AM CE BA AL SE PE PB RN MA PI AP RO TO Observações ES RR PA GO MG MS MT SP SC RS RJ PR Neste segundo os dados dos estados foram divididos em quatro grandes grupos, o que é perfeitamente possível de acordo com a similaridade dos dados. Abaixo vemos a distribuição dos estados de acordo com a similaridade Anova ANOVA com um fator: ESP VIDA M versus Recodificado CLUSTER OBS 7 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05

105 105 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores Recodificado CLUSTER OBS 7 4 1; 2; 3; 4 Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado CLUSTER OBS 7 3 0, , ,81 0,000 Erro 22 0, , Total 25 0,58732 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,98% 94,30% 93,22% Médias Recodificado CLUSTER OBS 7 N Média DesvPad IC de 95% 1 8 0, ,01987 (0,37177; 0,42544) 2 3 0,3215 0,0248 ( 0,2777; 0,3654) 3 5 0,5185 0,0390 ( 0,4845; 0,5524) ,6999 0,0464 ( 0,6759; 0,7239) DesvPad Combinado = 0, ANOVA com um fator: MORT 1 M versus Recodificado CLUSTER OBS 7 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores Recodificado CLUSTER OBS 7 4 1; 2; 3; 4 Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado CLUSTER OBS 7 3 0, , ,62 0,000 Erro 22 0, ,002232

106 106 Total 25 0,58887 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,66% 90,52% 88,13% Médias Recodificado CLUSTER OBS 7 N Média DesvPad IC de 95% 1 8 0,5576 0,0335 (0,5230; 0,5922) 2 3 0,4246 0,0523 (0,3680; 0,4811) 3 5 0,6993 0,0492 (0,6555; 0,7431) ,8294 0,0538 (0,7984; 0,8604) DesvPad Combinado = 0, ANOVA com um fator: T_ANALF11á14 M versus Recodificado CLUSTER OBS 7 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores Recodificado CLUSTER OBS 7 4 1; 2; 3; 4 Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado CLUSTER OBS 7 3 0, , ,93 0,000 Erro 22 0, , Total 25 0,19674 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,05% 70,51% 61,78% Médias Recodificado CLUSTER OBS 7 N Média DesvPad IC de 95% 1 8 0,8060 0,0560 ( 0,7707; 0,8413)

107 ,7637 0,0315 ( 0,7060; 0,8214) 3 5 0,8611 0,0809 ( 0,8164; 0,9058) , ,01043 (0,92705; 0,99024) DesvPad Combinado = 0, ANOVA com um fator: T_ANALF15M M versus Recodificado CLUSTER OBS 7 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores Recodificado CLUSTER OBS 7 4 1; 2; 3; 4 Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado CLUSTER OBS 7 3 0, , ,66 0,000 Erro 22 0, , Total 25 0,90652 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,05% 87,56% 84,46% Médias Recodificado CLUSTER OBS 7 N Média DesvPad IC de 95% 1 8 0,4368 0,0714 (0,3875; 0,4860) 2 3 0,3315 0,0664 (0,2511; 0,4119) 3 5 0,6636 0,0723 (0,6013; 0,7259) ,7892 0,0613 (0,7452; 0,8333) DesvPad Combinado = 0, Quadro 13 Médias e Valor de F ESPVIDA MORT1 T_ANALF11A14 T_ANALF15M

108 , ,5576 0,8060 0, ,3215 0,4246 0,7637 0, ,5185 0,6993 0,8611 0, ,6999 0,8294 0, ,7892 Valor de F 138,81 80,62 20,93 59,66 Fonte: Elaborado pela autora 9.5. Considerações e análises Dada a similaridade dos dados entre alguns estados foi possível realizar o agrupamento das vinte e seis unidades federativas do Brasil a princípio em 7 grandes grupos. Posteriormente, analisando o cluster com 7grupos foi possível sintetizar ainda mais os dados dividindo o país em quatro grupos com alto grau de similaridade conforme demonstrado no segundo mapa acima através da classificação supervisionada. Através da formação destes clusters foi possível a sintetização dos dados de municípios em estados e grupos mostrando a grande diferença de realidade nos diferentes estados e regiões do Brasil conforme demonstramos através do mapa acima. Esta análise apenas corroborou a ideia de termos mais de um Brasil já antes mencionadas em trabalhos anteriores. Por último realizamos a ANOVA que possibilita a comparação das variáveis entre os 4 novos grupos criados e como cada variável contribui em cada nova região. CAPÍTULO X. REGRESSÃO LOGISTICA Apresentação e Objetivos A regressão logística é um método cujo objetivo é produzir a partir de um conjunto de observações um modelo que possibilite a predição de valores a partir de uma série de variáveis. Enquanto método de predição para variáveis categóricas, a regressão logística é comparável às técnicas supervisionadas propostas em aprendizagem automática, como foi realizado no trabalho anterior a este ou ainda a análise discriminante preditiva em estatística exploratória. É possível as colocar em concorrência para escolha do modelo mais adaptado para um certo problema preditivo a resolver. Para este trabalho, faremos a regressão logística das seguintes variáveis: uma das quatro variáveis ESPVIDA, MORT1, T_ANALF11A14 e T_ANALF15M Regressão Logística ESP VIDA, MORT1, T_ANALF11A14 e T_ANALF15M. Resultados de: Plan1 Regressão Logística Ordinal: Recodificado versus ESP VIDA M; MORT 1 M;... Função de Ligação: Logito Informações da Resposta Variável Valor Contagem Recodificado CLUSTER OBS

109 109 Total 26 Tabela de Regressão Logística Razão de IC de 95% Preditor Coef. EP de Coef Z P Chances Inferior Superior Const(1) 12, ,6209 1,01 0,311 Const(2) 14, ,6400 1,17 0,243 Const(3) 22, ,2322 1,39 0,164 ESP VIDA M -133,357 57,8446-2,31 0,021 0,00 0,00 0,00 MORT 1 M 93, ,1506 2,27 0,023 4,15670E ,90 4,42834E+75 T_ANALF11á14 M -6, ,7972-0,41 0,680 0,00 0,00 4,12893E+10 T_ANALF15M M -12, ,0709-1,20 0,229 0,00 0, ,85 Log-verossimilhança = -9,748 Teste de que todas as inclinações são zero: G = 47,916, GL = 4, Valor-P = 0,000 Testes de Qualidade de Ajuste Método Qui-Quadrado GL P Pearson 26, ,000 Deviance 19, ,000 Medidas de Associação: (Entre a Variável de Resposta e as Probabilidades Preditas) Pares Número Percentual Medidas Sumárias Concordantes ,2 D de Somers 0,92 Discordantes 9 3,8 Gama de Goodman-Kruskal 0,92 Empates 0 0,0 Tau-a de Kendall 0,68 Total ,0 No quadro acima foi realizada regressão logística das 4 variáveis ESP VIDA, MORT1, T_ANALF11A14 e T_ANALF15M. Notamos que a porcentagem de concordância ficou em 96,2%. O Ideal é que o modelo possuía 100% de acerto. O Valor de P também ficou alto, valor P T_ANALF 1á14=0,680 e valor P T_ANALF15M = 0,229. O ideal para valor de P é de no máximo 0,1. Com o propósito de adequar a nossa análise, faremos a seguir uma regressão Logistica com as variáveis que possuem maior valor de F, valor este obtido quando realizado a ANOVA das variáveis. A tabela abaixo demonstra a média e valor de F de cada uma das variáveis: Quadro 14 Médias e valor de F ESPVIDA MORT1 T_ANALF11A14 T_ANALF15M 1 0, ,5576 0,8060 0,4368

110 ,3215 0,4246 0,7637 0, ,5185 0,6993 0,8611 0, ,6999 0,8294 0, ,7892 Valor de F 138,81 80,62 20,93 59,66 Fonte: Elaborada pela autora Vamos efetuar a regressão logística então com as variáveis ESPVIDA (Valor de F 138,81) e MORT1 (valor de F 80,62) Regressão Logística ESP VIDA e MORT1. Regressão Logística Ordinal: Recodificado versus ESP VIDA M; MORT 1 M Função de Ligação: Logito Informações da Resposta Variável Valor Contagem Recodificado CLUSTER OBS Total 26 Tabela de Regressão Logística Razão de IC de 95% Preditor Coef. EP de Coef Z P Chances Inferior Superior Const(1) 10,3511 4, ,37 0,018 Const(2) 11,9802 4, ,56 0,010 Const(3) 20,0007 8, ,48 0,013 ESP VIDA M -143,298 55,8167-2,57 0,010 0,00 0,00 0,00 MORT 1 M 85, ,0726 2,37 0,018 1,28827E ,42 6,53245E+67 Log-verossimilhança = -10,731 Teste de que todas as inclinações são zero: G = 45,950, GL = 2, Valor-P = 0,000 Testes de Qualidade de Ajuste Método Qui-Quadrado GL P Pearson 28, ,000 Deviance 21, ,000 Medidas de Associação: (Entre a Variável de Resposta e as Probabilidades Preditas)

111 111 Pares Número Percentual Medidas Sumárias Concordantes ,8 D de Somers 0,92 Discordantes 10 4,2 Gama de Goodman-Kruskal 0,92 Empates 0 0,0 Tau-a de Kendall 0,67 Total ,0 No quadro acima foi realizada regressão logística das 2 variáveis ESP VIDA E MORT1. Notamos que a porcentagem de concordância ficou em 95,8%. Menor que na análise anterior. O Ideal é que o modelo possuía 100% de acerto. Porém o valor de P ficou dentro do estabelecido. Valor de P ESP VIDA =0,010 e MORT1 = 0,018. Com o propósito de adequar a nossa análise, faremos a seguir uma regressão Logística com a variável que possui maior valor de F, valor este obtido quando realizado a ANOVA das variáveis. A Variável será ESPVIDA com valor de F = 138, Regressão Logística ESP VIDA. Regressão Logística Ordinal: Recodificado CLU versus ESP VIDA M Função de Ligação: Logito Informações da Resposta Variável Valor Contagem Recodificado CLUSTER OBS Total 26 Tabela de Regressão Logística Razão de IC de 95% Preditor Coef. EP de Coef Z P Chances Inferior Superior Const(1) 10,8377 3, ,50 0,000 Const(2) 12,2165 3, ,69 0,000 Const(3) 15,9317 4, ,54 0,000 ESP VIDA M -26,7732 7, ,63 0,000 0,00 0,00 0,00 Log-verossimilhança = -16,194 Teste de que todas as inclinações são zero: G = 35,025, GL = 1, Valor-P = 0,000 Testes de Qualidade de Ajuste Método Qui-Quadrado GL P

112 112 Pearson 55, ,944 Deviance 32, ,000 Medidas de Associação: (Entre a Variável de Resposta e as Probabilidades Preditas) Pares Número Percentual Medidas Sumárias Concordantes ,0 D de Somers 0,80 Discordantes 24 10,0 Gama de Goodman-Kruskal 0,80 Empates 0 0,0 Tau-a de Kendall 0,59 Total ,0 No quadro acima foi realizada regressão logística da variável ESP VIDA. Notamos que a porcentagem de concordância ficou em 90,0%. Menor que na análise anterior. O Ideal é que o modelo possuía 100% de acerto. O Valor de P ficou zerado. Vamos realizar abaixo a regressão logística separadamente das variáveis T_ANALF11A14 e T_ANALF15M Regressão Logística T_ANALF11A14. Regressão Logística Ordinal: Recodificado CLU versus T_ANALF11á14 M Função de Ligação: Logito Informações da Resposta Variável Valor Contagem Recodificado CLUSTER OBS Total 26 Tabela de Regressão Logística Razão de IC de 95% Preditor Coef. EP de Coef Z P Chances Inferior Superior Const(1) 19,1956 5, ,49 0,000 Const(2) 20,0174 5, ,56 0,000 Const(3) 21,9177 6, ,65 0,000 T_ANALF11á14 M -24,0254 6, ,63 0,000 0,00 0,00 0,00 Log-verossimilhança = -23,540 Teste de que todas as inclinações são zero: G = 20,333, GL = 1, Valor-P = 0,000

113 113 Testes de Qualidade de Ajuste Método Qui-Quadrado GL P Pearson 57, ,919 Deviance 47, ,994 Medidas de Associação: (Entre a Variável de Resposta e as Probabilidades Preditas) Pares Número Percentual Medidas Sumárias Concordantes ,1 D de Somers 0,69 Discordantes 37 15,5 Gama de Goodman-Kruskal 0,69 Empates 1 0,4 Tau-a de Kendall 0,50 Total , Regressão Logística T_ANALF15M. Regressão Logística Ordinal: Recodificado CLU versus T_ANALF15M M Função de Ligação: Logito Informações da Resposta Variável Valor Contagem Recodificado CLUSTER OBS Total 26 Tabela de Regressão Logística Razão de IC de 95% Preditor Coef. EP de Coef Z P Chances Inferior Superior Const(1) 7, , ,44 0,001 Const(2) 8, , ,61 0,000 Const(3) 10,9335 2, ,76 0,000 T_ANALF15M M -15,6231 4, ,81 0,000 0,00 0,00 0,00 Log-verossimilhança = -19,918 Teste de que todas as inclinações são zero: G = 27,576, GL = 1, Valor-P = 0,000 Testes de Qualidade de Ajuste

114 114 Método Qui-Quadrado GL P Pearson 60, ,870 Deviance 39, ,000 Medidas de Associação: (Entre a Variável de Resposta e as Probabilidades Preditas) Pares Número Percentual Medidas Sumárias Concordantes ,7 D de Somers 0,77 Discordantes 27 11,3 Gama de Goodman-Kruskal 0,77 Empates 0 0,0 Tau-a de Kendall 0,57 Total ,0 Analisando a regressão logística das variáveis T_ANALF11A14 e T_ANALF15M notamos que ambas possuem porcentual de acerto inferior a 100% e valor de P superior a 0,05, porém, de todas as variáveis observadas, T_ANALF15M foi a que possuiu maior porcentagem de acerto versus valor de P Considerações e Análises Neste trabalho foi realizada a regressão logística com objetivo de produzir um modelo a partir de um conjunto de observações das variáveis ESPVIDA, MORT1, T_ANALF11A14 e T_ANALF15M. Primeiramente foi realizada da regressão logística das 4 variáveis, tendo como resposta a reagrupamento dos municípios em 4 grupos. O modelo não apresentou os resultados esperados, pois não foi encontrado porcentual de acerto de 100% e o valor de P estava muito fora do estabelecido previamente neste trabalho. Posteriormente realizamos análise das variáveis com maior valor de F, neste caso o modelo apresentou os resultados esperados. O porcentual de acerto foi de 95,81% e o valor de P ESPVIDA 0,010 e MORT1 0,018. Por fim, vale ressaltar que seria adequado comparar a regressão logística com a análise discriminante. É possível que a segunda opção tenha porcentagem de acerto de 100%. CAPÍTULO XI. ANÁLISE DE CORRESPONDÊNCIA 11.1 Apresentação e Objetivos Explora relações em uma classificação com 2 fatores. Você pode usar este procedimento com tabelas de 3 e 4 fatores porque o Minitab pode reduzi-las a tabelas de 2 fatores. A análise de correspondência simples decompõe uma tabela de contingência de forma similar à análise de componentes principais em relação a dados contínuos multivariáveis. A análise de correspondência simples faz uma autoanálise dos dados, decompõe a variabilidade em dimensões subjacentes e associa variabilidade a linhas e/ou colunas Para este trabalho, faremos a análise de correspondência das seguintes variáveis: ESPVIDA, MORT1, T_ANALF11A14 e T_ANALF15M e posteriormente das variáveis ESPVIDA, MORT1 que obtiveram melhor resultados na regressão logística.

115 As Análises de Correspondência Análise de Correspondência por ESTADOS das variáveis ESPVIDA, MORT1 e T_ANALF15M. Análise de Correspondência Simples: ESP VIDA M; MORT 1 M; T_ANALF15M M Análise da Tabela de Contingência Eixo Inércia Proporção Acumulado Histograma 1 0,0034 0,7658 0,7658 ****************************** 2 0,0011 0,2342 1,0000 ********* Total 0,0045 Contribuições de Linha Componente 1 Componente 2 ID Nome Qual Massa Inerte Coord Corr Contr Coord Corr Contr 1 ac 1,000 0,031 0,007-0,030 0,903 0,008-0,010 0,097 0,003 2 al 1,000 0,021 0,056-0,108 0,955 0,070 0,023 0,045 0,011 3 am 1,000 0,034 0,041 0,035 0,225 0,012-0,064 0,775 0,135 4 ap 1,000 0,042 0,080 0,072 0,608 0,063-0,058 0,392 0,133 5 ba 1,000 0,030 0,006-0,004 0,021 0,000-0,030 0,979 0,025 6 ce 1,000 0,029 0,082-0,109 0,941 0,101-0,027 0,059 0,021 7 es 1,000 0,048 0,009-0,015 0,244 0,003 0,026 0,756 0,030 8 go 1,000 0,048 0,012-0,029 0,718 0,011 0,018 0,282 0,015 9 ma 1,000 0,024 0,019 0,057 0,912 0,023-0,018 0,088 0, mg 1,000 0,047 0,019-0,011 0,059 0,001 0,042 0,941 0, ms 1,000 0,046 0,064 0,053 0,446 0,037 0,059 0,554 0, mt 1,000 0,046 0,012 0,025 0,534 0,008 0,023 0,466 0, pa 1,000 0,037 0,047 0,066 0,751 0,046-0,038 0,249 0, pb 1,000 0,026 0,105-0,133 0,995 0,136-0,010 0,005 0, pe 1,000 0,028 0,037-0,073 0,869 0,042-0,028 0,131 0, pi 1,000 0,025 0,089-0,128 0,995 0,116-0,009 0,005 0, pr 1,000 0,049 0,001 0,010 0,897 0,002-0,004 0,103 0, rj 1,000 0,049 0,048 0,066 0,985 0,062-0,008 0,015 0, rn 1,000 0,030 0,061-0,093 0,944 0,075-0,023 0,056 0, ro 1,000 0,042 0,090 0,090 0,850 0,100-0,038 0,150 0, rr 1,000 0,041 0,028-0,054 0,974 0,035-0,009 0,026 0, rs 1,000 0,054 0,015 0,026 0,510 0,010 0,025 0,490 0, sc 1,000 0,054 0,030 0,024 0,235 0,009 0,043 0,765 0, se 1,000 0,028 0,009-0,027 0,487 0,006-0,027 0,513 0, sp 1,000 0,052 0,032 0,038 0,530 0,022 0,036 0,470 0, to 1,000 0,039 0,001-0,007 0,601 0,001-0,006 0,399 0,001 Contribuições de Coluna Componente 1 Componente 2 ID Nome Qual Massa Inerte Coord Corr Contr Coord Corr Contr

116 116 1 espv 1,000 0,293 0,190-0,023 0,185 0,046 0,049 0,815 0,662 2 mort 1,000 0,373 0,316-0,054 0,772 0,319-0,029 0,228 0,308 3 tanalf15m 1,000 0,334 0,494 0,081 0,986 0,635-0,010 0,014 0,031 Observando as 3 variáveis por estado é possível afirmar que o Estado que mais representa a variável T-ANALF 15M é o RJ.O Estado que mais representa MORT1 é PE e o Estado que mais representa ESPVIDA é MG Análise de Correspondência por REGIÃO das variáveis ESPVIDA, MORT1 e T_ANALF15M E T_ANALF11Á14. Análise de Correspondência por REGIÃO das variáveis ESPVIDA, MORT1, T_ANALF11A14 e T_ANALF15M Análise da Tabela de Contingência Eixo Inércia Proporção Acumulado Histograma 1 0,0063 0,9497 0,9497 ****************************** 2 0,0003 0,0475 0,9971 * 3 0,0000 0,0029 1,0000 Total 0,0067 Contribuições de Linha Componente 1 Componente 2 ID Nome Qual Massa Inerte Coord Corr Contr Coord Corr Contr 1 CO 0,961 0,217 0,026 0,024 0,699 0,019 0,015 0,262 0,145 2 N 0,998 0,180 0,040-0,011 0,079 0,003-0,037 0,919 0,782 3 NE 1,000 0,142 0,743-0,186 0,997 0,781 0,010 0,003 0,041

117 117 4 S 0,989 0,236 0,140 0,062 0,985 0,145 0,004 0,004 0,011 5 SE 0,998 0,224 0,051 0,038 0,978 0,052 0,005 0,020 0,021 Contribuições de Coluna Componente 1 Componente 2 ID Nome Qual Massa Inerte Coord Corr Contr Coord Corr Contr 1 espv 1,000 0,204 0,151 0,062 0,789 0,125 0,032 0,211 0,670 2 mort 0,837 0,253 0,012 0,013 0,514 0,006-0,010 0,323 0,079 3 tanal11a14 1,000 0,311 0,590-0,113 1,000 0,622 0,001 0,000 0,001 Observando as 4 variáveis por estado é possível afirmar que a Região que mais representa a variável T-ANALF 15M é o S.A região que mais representa MORT1 é CO. é NE. A região que mais representa ESPVIDA é S e a região que mais representa T_ANALF11A Análise de Correspondência por GRUPO das variáveis ESPVIDA, MORT1 e T_ANALF15M E T_ANALF11Á14. Análise de Correspondência Simples: ESPVIDA C M; MORT1 C M; T_ANALF 1114; T_ANALF15M C Análise da Tabela de Contingência

118 118 Eixo Inércia Proporção Acumulado Histograma 1 0,0102 0,9490 0,9490 ***************************** 2 0,0004 0,0379 0,9869 * 3 0,0001 0,0131 1,0000 Total 0,0107 Contribuições de Linha Componente 1 Componente 2 ID Nome Qual Massa Inerte Coord Corr Contr Coord Corr Contr 1 Um 0,924 0,219 0,113-0,072 0,919 0,110 0,005 0,005 0,014 2 Dois 0,993 0,183 0,488-0,168 0,989 0,509-0,011 0,004 0,054 3 Três 0,988 0,273 0,096 0,054 0,766 0,077 0,029 0,222 0,563 4 Quatro 1,000 0,326 0,303 0,098 0,954 0,304-0,022 0,046 0,370 Contribuições de Coluna Componente 1 Componente 2 ID Nome Qual Massa Inerte Coord Corr Contr Coord Corr Contr 1 espv 1,000 0,193 0,113 0,069 0,760 0,091-0,039 0,240 0,717 2 mort 0,724 0,250 0,030 0,028 0,613 0,020 0,012 0,111 0,089 3 tanal11a14 0,999 0,337 0,576-0,135 0,999 0,607 0,001 0,000 0,001 4 tanalf15m 0,986 0,221 0,280 0,114 0,960 0,283 0,019 0,026 0,194 Na análise das 4 variáveis por GRUPO, notamos que o grupo que mais representa a variável T_ANALF11á14 é o grupo Dois. O GRUPO que mais representa a variável T_ANALF15M é o grupo quatro. O grupo que mais representa a variável MORT é o grupo três e o que mais representa ESPVIDA é o grupo quatro.

119 Análise de Correspondência por GRUPO das variáveis ESPVIDA, MORT1 e T_ANALF15M. Análise de Correspondência Simples: ESPVIDA C M; MORT1 C M; T_ANALF15M C M Análise da Tabela de Contingência Eixo Inércia Proporção Acumulado Histograma 1 0,0016 0,7264 0,7264 ****************************** 2 0,0006 0,2736 1,0000 *********** Total 0, Contribuições de Linha Componente 1 Componente 2 ID Nome Qual Massa Inerte Coord Corr Contr Coord Corr Contr 1 Um 1,000 0,209 0,264-0,050 0,939 0,342-0,013 0,061 0,059 2 Dois 1,000 0,162 0,223-0,053 0,935 0,287 0,014 0,065 0,053 3 Três 1,000 0,282 0,264 0,032 0,515 0,187-0,031 0,485 0,468 4 Quatro 1,000 0,348 0,248 0,029 0,538 0,184 0,027 0,462 0,419 Contribuições de Coluna Componente 1 Componente 2 ID Nome Qual Massa Inerte Coord Corr Contr Coord Corr Contr 1 espv 1,000 0,291 0,195-0,004 0,010 0,003 0,038 0,990 0,707 2 mort 1,000 0,376 0,368-0,042 0,860 0,436-0,017 0,140 0,188 3 tanalf15m 1,000 0,333 0,437 0,051 0,934 0,561-0,014 0,066 0,106

120 Similaridade 120 Se fizermos a mesma análise com apenas três variáveis, ESPVIDA, MORT1 e T_ANALF15M podemos dizer que o grupo que mais representa ESPVIDA é o quatro, o grupo que mais representa T_ANALF15M é o três e o grupo que mais representa a MORT1 é o grupo 1. Média por estados 0,00 33,33 66,67 100,00 AC AM BA CE RN PB PE SE AL MA PI AP RO TO PA RR ES Observações GO MG MS MT PR RJ RS SC SP

121 121 Estados por grupo 11.3 Considerações e Análises Observamos que a representatividade de cada variável varia muito de acordo com a análise. Primeiramente realizamos uma análise de correspondência das variáveis de forma mais analítica, analisando por Estado o comportamento deste conjunto de variáveis. Posteriormente fizemos a mesma análise de forma mais sintética através do agrupamento por região e posteriormente pelos novos grupos criados anteriormente através da classificação supervisionada. Esta análise nos possibilitou visualizar com mais clareza a representatividade de cada variável frente ao Estrado, região e grupo. CAPÍTULO XII. ÁRVORE DE CLASSIFICAÇÃO Apresentação e Objetivos O Objetivo da árvore é identificar a classe à qual pertence uma determinada observação de uma base de dados, a partir de suas características (seus atributos). O procedimento de Árvore de decisão cria um modelo de classificação baseado em árvore. Ele classifica casos em grupos ou prevê valores de uma variável dependente (de destino) com base em valores de variáveis independentes (preditoras). O procedimento fornece ferramentas de validação para análise de classificação exploratória e confirmatória. Esta análise foi realizada através do software SPSS e não do Minitab 17 como as análises anteriores.

122 As variáveis utilizadas para esta análise foram: ESPVIDA, MORT1, T_ANALF11À14 e T_ANALF15M Análise Discriminante Stepwise. Resumo de processamento de caso de análise Casos não ponderados N Porcentagem Válido 16 61,5 Códigos de grupo ausentes ou fora do 10 38,5 Excluídos intervalo Pelo menos uma variável discriminante 0,0 ausente Códigos de grupo ausentes ou fora do intervalo e pelo menos uma variável discriminadora ausente 0,0 Total 10 38,5 Total ,0 GRUPOS Estatísticas de grupo N válido (de lista) Não ponderado Ponderado 1,00 ESPVIDA 8 8,000 MORT1 8 8,000 T_ANALF11 Á14 8 8,000 T_ANAF15M 8 8,000 2,00 ESPVIDA 3 3,000 MORT1 3 3,000 T_ANALF11 Á14 3 3,000 T_ANAF15M 3 3,000 3,00 ESPVIDA 5 5,000 MORT1 5 5,000 T_ANALF11 Á14 5 5,000 T_ANAF15M 5 5,000 Total ESPVIDA 16 16,000

123 123 MORT ,000 T_ANALF11 Á ,000 T_ANAF15M 16 16,000 Variáveis Inseridas/Remo vidas a,b,c,d,e Etapa Em cada etapa, a variável que maximiza a distância de Mahalanobis entre os dois grupos mais próximos é inserida. a. O número máximo de etapas é 8. b. O F parcial mínimo a ser inserido é c. O F parcial máximo a ser removido é d. Nível f, tolerância ou VIN insuficiente para cálculos adicionais. e. Nenhuma variável foi qualificada para a análise.

124 124 Etapa Variáveis não presentes na análise Tolerância Mín. Tolerância F a ser inserido Mín. D ao quadrado Entre Grupos 0 ESPVIDA 1,000 1,000,376,004 1,00 e 2,00 MORT1 1,000 1,000,334,000 1,00 e 2,00 T_ANALF11 Á14 1,000 1,000,933,107 1,00 e 2,00 T_ANAF15M 1,000 1,000,523,132 1,00 e 3,00 Lambda de Wilks a Etapa a. Nenhuma variável foi qualificada para a análise Árvore de Classificação Advertências As tabelas de resumo de ganhos não são exibidas porque os lucros não estão definidos. As tabelas de ganhos da categoria de destino não são exibidas porque as categorias de destino não estão definidas. Especificações Método crescente Resultados Variável dependente Variáveis independentes Validação Profundidade máxima de árvore Casos mínimos em nó pai Casos mínimos em nó filho Variáveis independentes incluídas Resumo do modelo CHAID EXAUSTIVO GRUPOS ESPVIDA, MORT1, T_ANALF11Á14, T_ANAF15M Nenhum T_ANALF11Á14 Número de nós

125 125 Número de nós de terminal Espessura 1 4 Risco Estimativa Erro Padrão,231,083 Método Crescente: CHAID EXAUSTIVO Variável Dependente: GRUPOS

126 Modelo de arvore com limitadores de 3 e 2. Profundidade máxima da árvore. Controla o número máximo de níveis de crescimento abaixo do nó raiz. A configuração Automático limita a árvore a três níveis abaixo do nó raiz para os métodos CHAID e CHAID Exaustivo e a cinco níveis para os métodos CRT e QUEST. Advertências As tabelas de resumo de ganhos não são exibidas porque os lucros não estão definidos. As tabelas de ganhos da categoria de destino não são exibidas porque as categorias de destino não estão definidas. Especificações Método crescente Resultados Variável dependente Variáveis independentes Validação Profundidade máxima de árvore Casos mínimos em nó pai Casos mínimos em nó filho Variáveis independentes incluídas Resumo do modelo CHAID EXAUSTIVO GRUPOS ESPVIDA, MORT1, T_ANALF11Á14, T_ANAF15M Nenhum T_ANALF11Á14 Número de nós 6 Número de nós de terminal 126 Espessura

127 127 Risco Estimativa Erro Padrão,154,071 Método Crescente: CHAID EXAUSTIVO Variável Dependente: GRUPOS Observado Classificação Previsto 1,00 2,00 3,00 4,00 Porcentagem Correta 1, ,5% 2, ,0% 3, ,0% 4, ,0% Porcentagem global 30,8% 19,2% 11,5% 38,5% 84,6% Método Crescente: CHAID EXAUSTIVO Variável Dependente: GRUPOS 12.4 Considerações e Análises Através da árvore de decisão ou árvore de classificação foi possível prevê valores de uma variável dependente (os quatro grupos) com base em valores de variáveis independentes (as

128 variáveis).a variável que se destacou nesta análise, tanto no modelo de árvore com limitadores de 5 e 3 como na segunda opção com limitadores de 3 e 2 foi a variável T_ANALF11À14.Sendo que na segunda opção, onde a profundidade máxima da árvore foi alterada para 3 e 2 podemos observar que ao que se refere ao nó 1 o grupo 1 possui 100%.No segundo nó, o grupo 3 possui 100%, o terceiro nó, o grupo 3 possui 60%, no quarto nó o grupo 1 possui 83,3% e por fim no quinto nó, o grupo quatro possui 90%. Nesta segunda árvore a porcentagem total de acerto foi de 84,6% e o erro padrão foi de 0,071. A análise discriminante stepwise neste caso foi inconclusiva. 128 CAPÍTULO XIII. RANKING - O NOVO INDICADOR 13.1 Apresentações e Objetivos Após a realização de todas as análises com a finalidade de entender o comportamento das variáveis que justificam o IDHM dos municípios, o próximo passo será elaborar um Ranking, que atuará como um novo indicador dos Estados em melhor situação do IDHM considerando as 4 últimas variáveis trabalhadas. São elas: ESPVIDA, MORT1, T_ANALF11À14 e T_ANALF15M. Primeiramente rodaremos um novo componente principal para estas quatro variáveis, em seguida faremos uma regressão stepwise com a finalidade de constatar a representatividade de cada variável frente ao seu componente e por último será apresentado o Ranking dos Estados Componentes Principais Análise de Componentes Principais: ESP VIDA M; MORT 1 M; T_ANALF11á14; T_ANALF15M M Autoanálise (Autovalores e Autovetores) da Matriz de Correlação Autovalor 3,6317 0,2586 0,0812 0,0285 Proporção 0,908 0,065 0,020 0,007 Acumulado 0,908 0,973 0,993 1,000 Variável CP1 CP2 CP3 CP4 ESP VIDA M 0,514 0,181 0,447-0,709 MORT 1 M 0,511 0,321 0,387 0,697 T_ANALF11á14 M 0,469-0,877-0,047 0,087 T_ANALF15M M 0,504 0,307-0,805-0,064 Notamos que na análise dos componentes principais, apenas o PC1 possui um valor maio de 1, então, utilizaremos neste caso apenas 1 PC Regressão Stepwise Análise de Regressão: pc ranking versus ESP VIDA M; MORT 1 M; T_ANALF11á14 M; T_ANALF15M M Seleção Stepwise de Termos α para entrada = 0,15; α para remoção = 0,15

129 129 Análise de Variância Fonte GL SQ Seq Contribuição SQ (Aj.) QM Seq. Valor F Valor-P Regressão 4 90, ,00% 90, ,6979 * * ESP VIDA M 1 87, ,10% 0, ,2476 * * MORT 1 M 1 0,8078 0,89% 0,3367 0,8078 * * T_ANALF11á14 M 1 1,9931 2,20% 1,6553 1,9931 * * T_ANALF15M M 1 0,7430 0,82% 0,7430 0,7430 * * Erro 21 0,0000 0,00% 0,0000 0,0000 Total 25 90, ,00% Testes usam as somas sequenciais dos quadrados Sumário do Modelo S R2 R2(aj) PRESQ R2(pred) 0 100,00% 100,00% 0, ,00% Coeficientes EP de Termo Coef Coef IC de 95% Valor-T Valor-P VIF Constante -10,22 0,00 (-10,22; -10,22) * * ESP VIDA M 3,356 0,000 ( 3,356; 3,356) * * 20,30 MORT 1 M 3,328 0,000 ( 3,328; 3,328) * * 19,37 T_ANALF11á14 M 5,292 0,000 ( 5,292; 5,292) * * 3,33 T_ANALF15M M 2,647 0,000 ( 2,647; 2,647) * * 8,55 Equação de Regressão pc ranking = -10,22 + 3,356 ESP VIDA M + 3,328 MORT 1 M + 5,292 T_ANALF11á14 M + 2,647 T_ANALF15M M Verifica-se que a variável que mais explica esta PC é ESPVIDA com 0,87, seguida de T_ANALF11Á14 com 0,0199, seguida de MORT1 com 0,008 e por fim T_ANALF15M com 0,0074. A partir destes resultados construímos uma equação utilizando a proportion do PC1 e o SQ Sequencie de cada variável obtida na regressão Stepwise. Desta forma a equação ficou da seguinte forma: Y=0,90*(0,87*ESPVIDA+0,008*MORT1+0,0199*T_ANALF11À14+0,0074*T_ANALF15M)

130 Esta formula gerou um ranking que calculou o valor de cada estado por ordem crescente de desempenho. Os resultados do Ranking foram normalizados O Ranking dos Estados (Variáveis ESPVIDA, MORT1, T_ANALF11A14 e T_ANALF15M) 130 CONSIDERAÇÕES FINAIS Este trabalho final analisou dos dados de municípios brasileiros, dos 26 estados e cinco regiões do país. Os indivíduos estudados neste trabalho foram os municípios brasileiros que serão analisados pela dimensão do Desenvolvimento Humano e seus indicadores, presentes no relatório do Atlas Brasil Os dados analisados são do ano de O Objetivo geral deste trabalho foi selecionar algumas variáveis das 8 dimensões existentes no Atlas Brasil de Desenvolvimento humano a fim de estudar de forma analítica não apenas o índice, mas, as características particulares de cada variável. Desta forma foi possível compor um novo ranking dos estados baseado no desempenho das variáveis estudadas.

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO. Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO. Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO:

Leia mais

Quantidade de Acessos / Plano de Serviço / Unidade da Federação - Novembro/2007

Quantidade de Acessos / Plano de Serviço / Unidade da Federação - Novembro/2007 Quantidade de Acessos / Plano de Serviço / Unidade da Federação - Novembro/2007 REGIÃO NORTE 5.951.408 87,35 861.892 12,65 6.813.300 RONDÔNIA 760.521 88,11 102.631 11,89 863.152 ACRE 298.081 85,86 49.094

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

Acre Previsão por Coeficiente no Estado

Acre Previsão por Coeficiente no Estado Acre 0,6 121.073,55 262.729,59 0,8 161.431,39 350.306,12 1,0 201.789,24 437.882,66 1,2 242.147,09 525.459,19 1,4 - - 1,6 322.862,79 700.612,25 1,8 363.220,64 788.188,78 2,0 - - 2,2 - - 2,4 - - 2,6 524.652,03

Leia mais

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos Professor:

Leia mais

Geografia. Demografia do Brasil. Professor Thomás Teixeira.

Geografia. Demografia do Brasil. Professor Thomás Teixeira. Geografia Demografia do Brasil Professor Thomás Teixeira www.acasadoconcurseiro.com.br Geografia Aula XX DEMOGRAFIA BRASILEIRA DEMOGRAFIA BRASILEIRA População estimada [2018] 208.494.900 pessoas Homem

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando

Leia mais

9, R$ , , R$ ,

9, R$ , , R$ , Rondônia 2005 R$ 601.575,17 2005 10.154 2004 1.027.983 2004 108.139 2004 10,52 2006 R$ 609.834,21 2006 10.757 2005 1.025.249 2005 101.539 2005 9,90 2007 R$ 1.229.490,00 2007 9.100 2006 1.047.004 2006 111.068

Leia mais

FNPETI FÓRUM NACIONAL DE PREVENÇÃO E ERRADICAÇÃO DO TRABALHO INFANTIL. Cenário do Trabalho Infantil Dados PNAD 2014

FNPETI FÓRUM NACIONAL DE PREVENÇÃO E ERRADICAÇÃO DO TRABALHO INFANTIL. Cenário do Trabalho Infantil Dados PNAD 2014 Cenário do Trabalho Infantil Dados PNAD 2014 Fonte: IBGE/Pnad. Elaboração própria. Nota: a PNAD até o ano de 2003 não abrangia a área rural da região Norte (exceto o Tocantins). Nos anos de 1994, 2000

Leia mais

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL focando

Leia mais

Caracterização do território

Caracterização do território Itapema, SC Caracterização do território Dados do mapa 2016 Google Informar erro no mapa Área 55,67 km² IDHM 2010 0,796 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 45.797 hab. Densidade

Leia mais

Estatísticas e Indicadores do Ensino Fundamental e Médio. Tiragem Limitada

Estatísticas e Indicadores do Ensino Fundamental e Médio. Tiragem Limitada Estatísticas e Indicadores do Ensino Fundamental e Médio Tiragem Limitada República Federativa do Brasil Fernando Henrique Cardoso Ministério da Educação e do Desporto - MEC Paulo Renato Souza Secretaria

Leia mais

Informações demográficas e socioeconômicas do Rio de Janeiro

Informações demográficas e socioeconômicas do Rio de Janeiro Novembro de 2009 Informações demográficas e socioeconômicas do Rio de Janeiro As informações abaixo foram retiradas da Síntese de Indicadores Sociais 2009 do IBGE, que tem como fonte a Pesquisa Nacional

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

Contabilizando para o Cidadão

Contabilizando para o Cidadão Gasto Médio por Deputado Estadual - Assembleias Legistativas Estaduais - Ano 2017 R$17,5 R$16,9 R$15,9 Gasto Médio Anual por Deputado Estadual (em Milhões de R$) Média Nacional - Gasto Anual por Deputado

Leia mais

Informações demográficas e socioeconômicas do Rio Grande do Sul

Informações demográficas e socioeconômicas do Rio Grande do Sul Outubro de 2009 Informações demográficas e socioeconômicas do Rio Grande do Sul Resumo Segundo uma análise geral dos indicadores gaúchos de 2008 é possível ver que o RS está muito bem em questões como

Leia mais

Alfabetização. Censo Demográfico 2010 Características da população e dos domicílios Resultados do universo

Alfabetização. Censo Demográfico 2010 Características da população e dos domicílios Resultados do universo Alfabetização A alfabetização é o primeiro passo para o acesso à informação escrita e a níveis de educação mais elevados. Assegurar que as crianças frequentem o ensino fundamental nas idades apropriadas

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Novo Santo Antônio, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 4386,24 km² IDHM 2010 0,653 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 2005 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Alto Araguaia, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 5557,93 km² IDHM 2010 0,704 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 15644 hab. Densidade

Leia mais

COMPILAÇÃO DE INDICADORES SOCIAIS

COMPILAÇÃO DE INDICADORES SOCIAIS COMPILAÇÃO DE INDICADORES SOCIAIS PNAD Pesquisa Nacional por Amostra de Domicílio última atualização da pesquisa: 2011 1 2 CARACTERÍSTICAS DOS DOMICÍLIOS 3 ACESSO A SERVIÇOS PÚBLICOS EVOLUÇÃO DO PERCENTUAL

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Canarana, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 10877,15 km² IDHM 2010 0,693 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 18754 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Pedra Preta, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 4205,57 km² IDHM 2010 0,679 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 15755 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Alto Garças, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 3670,07 km² IDHM 2010 0,701 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 10350 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Novo São Joaquim, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 5039,25 km² IDHM 2010 0,649 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 6042 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Barra do Garças, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 9176,17 km² IDHM 2010 0,748 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 56560 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Bom Jesus do Araguaia, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 4299,96 km² IDHM 2010 0,661 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5314 hab.

Leia mais

Ranking de salário dos Tribunais de Justiça nos Estados e DF - Junho 2018 SS JUSTIÇA MG

Ranking de salário dos Tribunais de Justiça nos Estados e DF - Junho 2018 SS JUSTIÇA MG Ranking de salário dos Tribunais de Justiça nos Estados e DF - Junho 2018 SS JUSTIÇA MG SS Justiça MG Junho 2018 Tabela 1 Tribunais de Justiça Estaduais posicionados conforme Vencimento Básico Vencimentos

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São Pedro da Cipa, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 344,84 km² IDHM 2010 0,660 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 4158 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Rondonópolis, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 4181,58 km² IDHM 2010 0,755 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 195476 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Campo Verde, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 4810,5 km² IDHM 2010 0,750 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 31589 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Jaciara, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1663,25 km² IDHM 2010 0,735 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 25647 hab. Densidade

Leia mais

Globalização e exclusão

Globalização e exclusão UNIDA DE Globalização e exclusão Métodos de mapeamento Tipos de dados Fenômenos qualitativos Fenômenos quantitativos Nominal Ordenado Relativo Absoluto Forma Pontual Forma Densidade de pontos Linear Zonal

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Confresa, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 5819,29 km² IDHM 2010 0,668 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 25124 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Vila Rica, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 7468,7 km² IDHM 2010 0,688 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 21382 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São Félix do Araguaia, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 16915,81 km² IDHM 2010 0,668 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 10625

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São José do Xingu, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 7493,63 km² IDHM 2010 0,657 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5240 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Curitiba, PR 08/07/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 437,42 km² IDHM 2010 0,823 Faixa do IDHM Muito Alto (IDHM entre 0,8 e 1) (Censo 2010) 1751907

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Alta Floresta, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 8983,98 km² IDHM 2010 0,714 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 49164 hab. Densidade

Leia mais

Contabilizando para o Cidadão

Contabilizando para o Cidadão 14,6% 14,5% 14,0% 14,0% 13,2% 13,1% 12,1% Contabilizando para o Cidadão Nº de Famílias Beneficiadas pelo Bolsa Família em Relação ao Total de Famílias do Estado - Ano 2017 50,00% 48,6% Nº de Famílias Beneficiadas

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Campo Novo do Parecis, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 9480,98 km² IDHM 2010 0,734 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 27577

Leia mais

Informações demográficas e socioeconômicas de Santa Catarina

Informações demográficas e socioeconômicas de Santa Catarina Novembro de 2009 Informações demográficas e socioeconômicas de Santa Catarina As informações abaixo foram retiradas da Síntese de Indicadores Sociais 2009 do IBGE, que tem como fonte a Pesquisa Nacional

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Paranatinga, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 24272,24 km² IDHM 2010 0,667 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 19290 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Cuiabá, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 3552,82 km² IDHM 2010 0,785 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 551098 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Rio Branco, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 530,1 km² IDHM 2010 0,707 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 5070 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Rosário Oeste, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 8061,98 km² IDHM 2010 0,650 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 17679 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Porto dos Gaúchos, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 7036,6 km² IDHM 2010 0,685 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5449 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Várzea Grande, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 940,83 km² IDHM 2010 0,734 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 252596 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Maringá, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 11554,5 km² IDHM 2010 0,663 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 6590 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Gaúcha do Norte, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 16962,36 km² IDHM 2010 0,615 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 6293 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Cáceres, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 24478,87 km² IDHM 2010 0,708 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 87942 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Sinop, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 3204,92 km² IDHM 2010 0,754 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 113099 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Castanheira, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 3966,38 km² IDHM 2010 0,665 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 8231 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Diamantino, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 7657,48 km² IDHM 2010 0,718 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 20341 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Monte Verde, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 6528,7 km² IDHM 2010 0,691 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 8093 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nobres, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 3874,39 km² IDHM 2010 0,699 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 15002 hab. Densidade demográfica

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Canaã do Norte, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 5996,71 km² IDHM 2010 0,686 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 12127 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Guarita, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1091,25 km² IDHM 2010 0,688 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 4932 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Marilândia, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1946,65 km² IDHM 2010 0,704 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 2951 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Juara, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 21474,36 km² IDHM 2010 0,682 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 32791 hab. Densidade demográfica

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Bandeirantes, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 9573,21 km² IDHM 2010 0,650 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 11643 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Poconé, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 17319,01 km² IDHM 2010 0,652 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 31779 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Guarantã do Norte, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 4732,38 km² IDHM 2010 0,703 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 32216 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Feliz Natal, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 11491,38 km² IDHM 2010 0,692 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 10933 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Pontes E Lacerda, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 8455,3 km² IDHM 2010 0,703 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 41408 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Matupá, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 5172,94 km² IDHM 2010 0,716 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 14174 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Peixoto de Azevedo, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 14457,35 km² IDHM 2010 0,649 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 30812 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Chapada dos Guimarães, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 5657,43 km² IDHM 2010 0,688 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 17821 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Lucas do Rio Verde, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 3674,76 km² IDHM 2010 0,768 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 45556 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Santo Antônio do Leverger, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 12301,06 km² IDHM 2010 0,656 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 18463

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Tapurah, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 11644,27 km² IDHM 2010 0,714 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 10392 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Barão de Melgaço, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 11217,65 km² IDHM 2010 0,600 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 7591 hab. Densidade

Leia mais

PROJEÇÕES POPULACIONAIS PARA O ESTADO DO RIO GRANDE DO SUL:

PROJEÇÕES POPULACIONAIS PARA O ESTADO DO RIO GRANDE DO SUL: PROJEÇÕES POPULACIONAIS PARA O ESTADO DO RIO GRANDE DO SUL: 2015-2050 Centro de Informações Estatísticas Núcleo de Indicadores Sociais e Ambientais Porto Alegre, 08 de Novembro de 2012 - Evoluções Populacionais

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Denise, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 1306,42 km² IDHM 2010 0,683 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 8523 hab. Densidade demográfica

Leia mais

O MAPA DA EXTREMA INDIGÊNCIA NO CEARÁ E O CUSTO FINANCEIRO DE SUA EXTINÇÃO

O MAPA DA EXTREMA INDIGÊNCIA NO CEARÁ E O CUSTO FINANCEIRO DE SUA EXTINÇÃO CAEN-UFC RELATÓRIO DE PESQUISA Nº5 O MAPA DA EXTREMA INDIGÊNCIA NO CEARÁ E O CUSTO FINANCEIRO DE SUA EXTINÇÃO (Apresenta um Comparativo com os Estados Brasileiros) Autores da Pesquisa Flávio Ataliba Barreto

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Olímpia, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1572,86 km² IDHM 2010 0,682 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 17515 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Salto do Céu, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1778,72 km² IDHM 2010 0,666 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 3908 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Planalto da Serra, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 2460,95 km² IDHM 2010 0,656 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 2726 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Ubiratã, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 12740,95 km² IDHM 2010 0,669 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 9218 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Bertioga, SP 30/07/2013 - Pág 1 de 14 Caracterização do território Área 492,82 km² IDHM 2010 0,730 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 47645 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Porto Esperidião, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 5833,71 km² IDHM 2010 0,652 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 11031 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Glória D'Oeste, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 850,55 km² IDHM 2010 0,710 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 3135 hab. Densidade

Leia mais

Noções Básicas sobre. Encontro Nacional de Coordenadores da Saúde do Idoso. População Idosa no Cenário Nacional: Transição Demográfica

Noções Básicas sobre. Encontro Nacional de Coordenadores da Saúde do Idoso. População Idosa no Cenário Nacional: Transição Demográfica Encontro Nacional de Coordenadores da Saúde do Idoso Noções Básicas sobre População Idosa no Cenário Nacional: Transição Demográfica Joilson Rodrigues de Souza Coordenador de Disseminação de Informações

Leia mais

Estatísticas do Registro Civil Data 17 / 12 / 2012

Estatísticas do Registro Civil Data 17 / 12 / 2012 Estatísticas do Registro Civil 2011 Data 17 / 12 / 2012 Em 2011, o total de registros foi 2,0% maior que em 2010, indicando a melhoria da cobertura do registro civil de nascimento no País. Houve acréscimo

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Mirassol D'Oeste, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1076,58 km² IDHM 2010 0,704 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 25299 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Guarujá, SP 30/07/2013 - Pág 1 de 14 Caracterização do território Área 143,71 km² IDHM 2010 0,751 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 290752 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Lambari D'Oeste, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1340,24 km² IDHM 2010 0,627 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5431 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Poço das Trincheiras, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 303,4 km² IDHM 2010 0,526 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo

Leia mais