PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO. Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM

Tamanho: px
Começar a partir da página:

Download "PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO. Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM"

Transcrição

1 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada, Utilizando 18 variáveis selecionadas do Atlas Brasil. Danilo Nunes CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada, Utilizando 23 variáveis selecionadas do Atlas Brasil. Diego Paulo Rhormens CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada, Utilizando 18 variáveis selecionadas do Atlas Brasil. Fernanda Cardoso Romão Freitas

2 CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada, Utilizando 20 variáveis selecionadas do Atlas Brasil. Fernando Fukunaga CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada, Utilizando 25 variáveis selecionadas do Atlas Brasil. Lauro Kuester Marin CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada, Utilizando 21 variáveis selecionadas do Atlas Brasil. Odair Gomes Salles

3 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada Utilizando 18 variáveis selecionadas do Atlas Brasil. DISCIPLINA: MÉTODOS QUALITATIVOS E QUANTITATIVOS EM ADMINISTRAÇÃO PROF. ARNOLDO JOSÉ DE HOYOS GUEVARA Danilo Nunes 1º SEMESTRE DE 2017 São Paulo SP 2017

4 2 SUMÁRIO INTRODUÇÃO... 3 CAPÍTULO I. ENTENDENDO OS DADOS Os Indivíduos As Variáveis Análise de dados Base de dados... 6 CAPÍTULO II. ANÁLISE DISCRIMINANTE... 7 CONSIDERAÇÕES FINAIS REFERÊNCIAS...;...21

5 3 INTRODUÇÃO O presente trabalho tem por objetivo efetuar a análise discriminante de dados dimensionadores do IDHM, Plataforma Atlas Brasil, Base IBGE. Por fim, após as análises fazemos as considerações finais, com a distribuição demonstrada no mapa do Brasil, considerados os Estados correlacionados. O software estatístico utilizado é o MINITAB CAPÍTULO I. ENTENDENDO OS DADOS 1.1 Os Indivíduos O foco de estudo deste trabalho são todos os municípios brasileiros, com os 232 indicadores disponibilizados no portal Atlas Brasil, dados de 2010, abertos em 08 categorias, a saber: Demografia Educação Renda Trabalho Habitação Vulnerabilidade População IDHM (Longevidade, Renda e Educação O IDHM demonstrado no Atlas de Desenvolvimento Humano é baseado exclusivamente nos dados dos Censos Geográficos e tem por objetivo disponibilizar informações aos gestores público e privado, bem como, professores, alunos e todas as pessoas interessadas em conhecer e poder atuar em ações que nos levem a melhorar nossos referenciais de cidadania As variáveis Dos 232 indicadores que compõem a base de dados disponibilizada no Atlas Brasil, por metodologia previamente definida, foram escolhidas 02 variáveis de cada uma das 07 classificações que somadas aos 04 indicadores dos IDHM, perfazem o total de 18 (dezoito) variáveis a serem abordadas, exploradas e analisadas neste trabalho. Na busca por esses indicadores procurou-se, mesmo que de forma empírica, uma provável associação que possa nos levar a conhecer melhor a composição dos dados e, consequentemente, ter mais subsídios em ações que possam ser adotadas. Quadro 01 As variáveis Código Indicador Abrangência ESPVIDA Esperança de vida ao nascer Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecente no ano do Censo. T_ENV Taxa de envelhecimento Razão entre a população de 65 anos ou mais de idade e a população total multiplicado por 100. T_FUND15A17 Percentual da população de 15 a Razão entre a população de 15 a 17 anos 17 anos com fundamental de idade que concluiu o ensino completo fundamental, em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. Tipo Medida Anos Percentual Percentual

6 4 T_MED18a20 RIND Percentual da população de 18 a 20 anos de idade com o ensino médio completo Renda domiciliar per capita média dos extremamente pobres Razão entre a população de 18 a 20 anos de idade que já concluiu o ensino médio em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. As pessoas de 18 a 20 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. Média da renda domiciliar per capita das pessoas com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, a preços de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. RDPC Renda per capita média Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Valores em reais de 01/agosto de TRABCC Percentual de ocupados de 18 anos ou mais que são empregados com carteira TRABSC Percentual de ocupados de 18 anos ou mais que são empregados sem carteira T_AGUA T_LUZ Percentual da população que vive em domicílios com água encanada Percentual da população que vive em domicílios com energia elétrica AGUA_ESGOTO Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados T_SLUZ % de pessoas em domicílios sem energia elétrica Razão entre o número de empregados de 18 anos ou mais de idade com carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. Razão entre o número de empregados de 18 anos ou mais de idade sem carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. Razão entre a população que vive em domicílios particulares permanentes com água canalizada para um ou mais cômodos e a população total residente em domicílios particulares permanentes, multiplicada por 100. A água pode ser proveniente de rede geral, de poço, de nascente ou de reservatório abastecido por água das chuvas ou carro-pipa. Razão entre a população que vive em domicílios particulares permanentes com iluminação elétrica e a população total residente em domicílios particulares permanentes, multiplicada por 100. Considera-se iluminação proveniente ou não de uma rede geral, com ou sem medidor. Razão entre as pessoas que vivem em domicílios cujo abastecimento de água não provem de rede geral e cujo esgotamento sanitário não é realizado por rede coletora de esgoto ou fossa séptica e a população total residente em domicílios particulares permanentes, multiplicada por 100. São considerados apenas os domicílios particulares permanentes. Razão entre as pessoas que vivem em domicílios sem energia elétrica e população total residente em domicílios particulares permanentes multiplicado por 100. PESORUR População rural População residente na área rural PESOURB População urbana População residente na área urbana IDHM Índice de Desenvolvimento Índice de Desenvolvimento Humano Humano Municipal Municipal. Média geométrica dos índices das dimensões Renda, Educação e Longevidade, com pesos iguais. Percentual Absoluto Absoluto Percentual Percentual Percentual Percentual Percentual Percentual Absoluto Absoluto Índice

7 5 IDHM_E IDHM_R IDHM_L Índice de Desenvolvimento Humano Municipal - Dimensão Educação Índice de Desenvolvimento Humano Municipal - Dimensão Renda Índice de Desenvolvimento Humano Municipal - Dimensão Longevidade Índice sintético da dimensão Educação, é um dos 3 índices que compõem o IDHM. É obtido através da média geométrica do subíndice de frequência escolar, com peso de 2/3, e do subíndice de escolaridade, com peso de 1/3. Índice da dimensão Renda, é um dos 3 índices que compõem o IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado do indicador) - ln (valor mínimo)] / [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). Índice da dimensão Longevidade, é um dos 3 índices que compõem o IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do indicador) - (valor mínimo)] / [(valor máximo) - (valor mínimo)], onde os valores mínimo e máximo são 25 e 85 anos, respectivamente. Município Nome do Município Nome do Município Categórica n/a Índice Índice Índice UF Unidade da Federação (Estado) Unidade da Federação (Estado) Categórica n/a Fonte: Atlas Brasil, Análise De Dados Buscando um foco direto nos indicadores que interessam a este pesquisador, sobretudo àqueles que podem ter uma ligação direta com o desenvolvimento da tese, foram selecionadas as seguintes variáveis para o estudo dos componentes principais: Código Indicador Abrangência ESPVIDA Esperança de vida ao nascer Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. T_ENV Taxa de envelhecimento Razão entre a população de 65 anos ou mais de idade e a população total multiplicado por 100. T_FUND15A17 Percentual da população de 15 a Razão entre a população de 15 a 17 anos 17 anos com fundamental de idade que concluiu o ensino completo fundamental, em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. T_MED18a20 Percentual da população de 18 a 20 anos de idade com o ensino médio completo Razão entre a população de 18 a 20 anos de idade que já concluiu o ensino médio em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. As pessoas de 18 a 20 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. Tipo Medida Anos Percentual Percentual Percentual

8 6 RIND Renda domiciliar per capita média dos extremamente pobres Média da renda domiciliar per capita das pessoas com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, a preços de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. RDPC Renda per capita média Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Valores em reais de 01/agosto de TRABCC Percentual de ocupados de 18 anos ou mais que são empregados com carteira TRABSC Percentual de ocupados de 18 anos ou mais que são empregados sem carteira T_AGUA T_LUZ Percentual da população que vive em domicílios com água encanada Percentual da população que vive em domicílios com energia elétrica AGUA_ESGOTO Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados T_SLUZ % de pessoas em domicílios sem energia elétrica Razão entre o número de empregados de 18 anos ou mais de idade com carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. Razão entre o número de empregados de 18 anos ou mais de idade sem carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. Razão entre a população que vive em domicílios particulares permanentes com água canalizada para um ou mais cômodos e a população total residente em domicílios particulares permanentes, multiplicada por 100. A água pode ser proveniente de rede geral, de poço, de nascente ou de reservatório abastecido por água das chuvas ou carro-pipa. Razão entre a população que vive em domicílios particulares permanentes com iluminação elétrica e a população total residente em domicílios particulares permanentes, multiplicada por 100. Considera-se iluminação proveniente ou não de uma rede geral, com ou sem medidor. Razão entre as pessoas que vivem em domicílios cujo abastecimento de água não provem de rede geral e cujo esgotamento sanitário não é realizado por rede coletora de esgoto ou fossa séptica e a população total residente em domicílios particulares permanentes, multiplicada por 100. São considerados apenas os domicílios particulares permanentes. Razão entre as pessoas que vivem em domicílios sem energia elétrica e população total residente em domicílios particulares permanentes multiplicado por 100. PESORUR População rural População residente na área rural PESOURB População urbana População residente na área urbana Fonte: Atlas Brasil, 2010 Absoluto Absoluto Percentual Percentual Percentual Percentual Percentual Percentual Absoluto Absoluto 1.4 Base de dados A base de dados normalizada para a análise deste trabalho teve como referência as 14 variáveis descritas na tabela acima, sendo que, 03 delas, foram positivadas, a saber: TRABSC Percentual de ocupados de 18 anos ou mais que Razão entre o número de empregados de 18 anos ou mais de idade sem carteira de trabalho assinada Percentual

9 7 são empregados sem carteira e o número total de pessoas ocupadas nessa faixa etária, multiplicada por 100. AGUA_ESGOTO Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados T_SLUZ % de pessoas em domicílios sem energia elétrica Fórmulas utilizadas Passos no Minitab: CALC / CALCULADORA Razão entre as pessoas que vivem em domicílios cujo abastecimento de água não provem de rede geral e cujo esgotamento sanitário não é realizado por rede coletora de esgoto ou fossa séptica e a população total residente em domicílios particulares permanentes, multiplicada por 100. São considerados apenas os domicílios particulares permanentes. Razão entre as pessoas que vivem em domicílios sem energia elétrica e população total residente em domicílios particulares permanentes multiplicado por 100. Percentual Percentual Para normalização Construir equação selecionando na caixa de opções funções a opção MINIMO e MAXIMO. A equação: (c9-min(c9))/(max(c9)-min(c9)) Para positivação Para os dados que representam valores A Equação: 1-((c8-MIN (c8)) /(MAX(c8)-MIN(c8))) CAPÍTULO II. ANÁLISE DISCRIMINANTE O primeiro passo para esta análise foi resgatar a base de dados utilizada no trabalho anterior, ou seja, análise de conglomerados, e as variáveis naquele nesse estudo consideradas e suas médias por Estado, a seguir, reforçando que já foram normalizadas e no caso da agua_esgoto, positivada. T_ENV Taxa de envelhecimento Razão entre a população de 65 anos ou mais de idade e a população total multiplicado por 100. T_FUND15A17 Percentual da população Razão entre a população de 15 a 17 anos de idade de 15 a 17 anos com que concluiu o ensino fundamental, em qualquer fundamental completo de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. T_MED18a20 Percentual da população de 18 a 20 anos de idade com o ensino médio completo Razão entre a população de 18 a 20 anos de idade que já concluiu o ensino médio em qualquer de suas modalidades (regular seriado, não seriado, EJA ou supletivo), e o total de pessoas nesta faixa etária, multiplicada por 100. As pessoas de 18 a 20 anos frequentando a 4ª série do ensino médio foram consideradas como já tendo concluído esse nível de ensino. RDPC Renda per capita média Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Valores em reais de 01/agosto de Percentual Percentual Percentual Absoluto AGUA_ESGOTO Percentual de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados Razão entre as pessoas que vivem em domicílios cujo abastecimento de água não provem de rede geral e cujo esgotamento sanitário não é realizado por rede coletora de esgoto ou fossa séptica e a população total residente em domicílios particulares permanentes, multiplicada por 100. Percentual

10 8 São considerados apenas os domicílios particulares permanentes. O Dendograma base desse estudo apresentou as características a seguir, reforçando que foram excluídos desta análise, os dados referentes ao Distrito Federal, Brasília. Cluster Analysis of Observations: MEVsBR; MFUNsBR; MMEDsBR; MRENsBR; MAESIsBR Euclidean Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,0947 0, ,7259 0, ,7155 0, ,6106 0, ,4264 0, ,7966 0, ,5739 0, ,1748 0, ,7140 0, ,6655 0, ,2528 0, ,2159 0, ,1295 0, ,6761 0, ,2123 0, ,7740 0, ,0860 0, ,5656 0, ,5187 0, ,1901 0, ,0687 0, ,3811 0, ,2123 0, ,2797 0, ,5995 0, Final Partition Number of clusters: 7 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 4 0, , , Cluster2 7 0, , , Cluster3 1 0, , , Cluster4 10 0, , , Cluster5 1 0, , , Cluster6 2 0, , , Cluster7 1 0, , ,000000

11 9 Cluster Centroids Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 MEVsBR 0, , ,4029 0, , , ,56850 MFUNsBR 0, , ,5340 0, , , ,41220 MMEDsBR 0, , ,3587 0, , , ,29350 MRENsBR 0, , ,0880 0, , , ,11713 MAESIsBR 0, , ,7948 0, , , ,72230 Grand Variable centroid MEVsBR 0, MFUNsBR 0, MMEDsBR 0, MRENsBR 0, MAESIsBR 0, Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0, , , , , , , Cluster2 0, , , , , , , Cluster3 0, , , , , , , Cluster4 0, , , , , , , Cluster5 0, , , , , , , Cluster6 0, , , , , , , Cluster7 0, , , , , , ,000000

12 Similarity 10 Dendrogram Medias 79,60 86,40 93,20 100,00 Acre Amapá Amazonas Pará Maranhão Roraima Alagoas Bahia Paraíba Pernambuco RN do Norte Sergipe Piaui Ceará Rondônia Observations Tocantins Esp. Santo Góias Paraná Mato Grosso Minas Gerais MG do Sul Rio de Janeiro RG do Sul Sta Catarina São Paulo Observa-se que as similaridades entre os Estados na distribuição com os 07 clusters está por volta dos 90%. O Estado do Ceará teve o maior reflexo dessa nova análise (com a exclusão de Brasília) Acre a Amapá Amazonas e Pará Paraíba e Pernambuco Rondônia e Tocantins Espírito Santo e Goiás Mato Grosso e Minas Gerais Rio Grande do Sul e Santa Catarina Para análise discriminante, o objetivo proposto foi trabalhar com 03 clusters, cabendo ao autor a construção das novas similaridades. O primeiro passo foi determinar com os 03 clusters principais que permaneceriam na análise, sendo que o critério estabelecido foi a escolha do que já continham o maior número de observações. Vejamos um recorte da distribuição anterior: Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 4 0, , , Cluster2 7 0, , , Cluster3 1 0, , ,000000

13 11 Cluster4 10 0, , , Cluster5 1 0, , , Cluster6 2 0, , , Cluster7 1 0, , , Respeitado os critérios estabelecidos, os clusters escolhidos foram os clusters 01, 02 e 04. O próximo passo é associar os clusters eliminados com os clusters escolhidos e o critério adotado foram as menores distâncias entre eles. Clusters a ser associados CLUSTER 3, COM 01 COMPONENTE DE OBSERVAÇÃO CLUSTER 5, COM 01 COMPONENTE DE OBSERVAÇÃO CLUSTER 6, COM 02 COMPONENTES DE OBSERVAÇÃO CLUSTER 7, COM 01 COMPONENTE DE OBSERVAÇÃO BUSCA DE PROXIMIDADE DE DISTÂNCIA Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0, , , , , , , Cluster2 0, , , , , , , Cluster3 0, , , , , , , Cluster4 0, , , , , , , Cluster5 0, , , , , , , Cluster6 0, , , , , , , Cluster7 0, , , , , , , Cluster 03 tem maior proximidade, dentre os clusters considerados, com o cluster 2 Cluster 05 tem maior proximidade, dentre os clusters considerados, com o cluster 2 Cluster 06 tem maior proximidade, dentre os clusters considerados, com o cluster 2 Cluster 07 tem maior proximidade, dentre os clusters considerados, com o cluster 1 Discriminant Analysis: AnDisc versus MEVsBR; MFUNsBR;... Linear Method for Response: AnDisc Predictors: MEVsBR; MFUNsBR; MMEDsBR; MRENsBR; MAESIsBR Group Count Summary of classification True Group Put into Group Total N N correct Proportion 1,000 1,000 1,000

14 12 N = 26 N Correct = 26 Proportion Correct = 1,000 Squared Distance Between Groups , , , ,0367 0, , , ,2981 0,0000 Linear Discriminant Function for Groups Constant -80,36-144,66-179,87 MEVsBR 42,73-167,44-82,32 MFUNsBR 158,22 219,70 204,26 MMEDsBR -238,04-245,92-257,69 MRENsBR -34,50 44,66 87,74 MAESIsBR 233,51 412,50 403,98 Percebe-se que, com a nova distribuição, o percentual de acerto (proportion= 1,000) entre os novos clusters definidos é de 100% O próximo passo é elaborar o novo Dendograma para verificar como fica a distribuição por Estados. CONSTRUÇÃO DO NOVO DENDOGRAMA COM 3 CLUSTERS Cluster Analysis of Observations: MEVsBR; MFUNsBR; MMEDsBR; MRENsBR; MAESIsBR Manhattan Distance, Complete Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,8348 0, ,0307 0, ,3357 0, ,3512 0, ,0216 0, ,2446 0, ,7249 0, ,6235 0, ,1375 0, ,4295 0, ,5845 0, ,9628 0, ,6217 0, ,9148 0, ,3092 0, ,1514 0, ,1510 0, ,6410 0, ,0300 0, ,0798 0, ,6455 0, ,7121 0, ,6524 0, ,2343 0,

15 ,0000 1, Final Partition Number of clusters: 3 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 10 0, , , Cluster2 6 0, , , Cluster3 10 0, , , Cluster Centroids Grand Variable Cluster1 Cluster2 Cluster3 centroid MEVsBR 0, , , , MFUNsBR 0, , , , MMEDsBR 0, , , , MRENsBR 0, , , , MAESIsBR 0, , , , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster1 0, , , Cluster2 0, , , Cluster3 0, , ,000000

16 Similarity 14 Dendrogram Medias 0,00 33,33 66,67 100,00 Acre Amapá Roraima Alagoas Maranhão Bahia Sergipe Piaui Amazonas Pará Ceará Paraíba Pernambuco RN do Norte Rondônia Observations Tocantins Esp. Santo Góias Paraná Mato Grosso Minas Gerais MG do Sul Rio de Janeiro RG do Sul Sta Catarina São Paulo Os Estados, dentre as variáveis analisadas, como maior similaridade são: Acre com Amapá; Alagoas com Maranhão; Bahia com Sergipe, Amazonas com Pará, Paraíba com Pernambuco, Rondônia com Tocantins, Espírito Santo com Goiás, Mato Grosso com Minas Gerais, Mato Grosso do Sul com Rio de Janeiro, Rio Grande do Sul com Santa Catarina. UF ESTADOS Cluster Observation UF ESTADOS Cluster Observation Acre 1 Paraíba 2 Alagoas 1 Paraná 3 Amapá 1 Pernambuco 2 Amazonas 1 Piaui 1 Bahia 1 RG do Sul 3 Ceará 2 Rio de Janeiro 3 Esp. Santo 3 RN do Norte 2 Góias 3 Rondônia 2 Maranhão 1 Roraima 1 Mato Grosso 3 São Paulo 3 MG do Sul 3 Sergipe 1 Minas Gerais 3 Sta Catarina 3 Pará 1 Tocantins 2

17 15 CONSIDERAÇÕES FINAIS Percebeu-se que com a nova distribuição dos clusters baseada na menor distância entre os clusters analisados, no início com 07, há mais estados em similaridades entre si, e uma boa parte delas próximas ao percentual de 80%. Observa-se, nitidamente, que há um recorte de 03 BRASIS diferentes, ficando todo NORTE e NORDESTE distribuídos em 02 clusters e o terceiro ocupado, integralmente, pelas regiões SUL, SUDESTE e CENTRO-OESTE Isto sinaliza, pelas variáveis estudadas, que as questões sociais e econômicas interferem diretamente nas condições de vida e pode demostrar uma ineficácia nas questões de políticas públicas, já que estamos falando de um único país. Com o objetivo de subsidiar as próximas análises, a seguir a construção e demonstração pelos BOXPLOTS, das ANOVAS das variáveis estudadas, obedecidas esta nova distribuição, abertas por regiões. : Expectativa de vida (dados normalizados) One-way ANOVA: MEVsBR versus EST REG Source DF SS MS F P EST REG 4 0, , ,02 0,000 Error 21 0, ,00324 Total 25 0,58734 S = 0,05695 R-Sq = 88,40% R-Sq(adj) = 86,19% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 3 0, ,01835 (-----*-----) Nordeste 8 0, ,03363 (--*---) Norte 8 0, ,08259 (--*---) Sudeste 4 0, ,03689 (----*----) Sul 3 0, ,06200 (-----*----)

18 MEVsBR ,36 0,48 0,60 0,72 Pooled StDev = 0,05695 Boxplot of MEVsBR Boxplot of MEVsBR 0,8 0,7 0,6 0,5 0,4 0,3 Centro-Oeste Nordeste Norte EST REG Sudeste Sul As relações não se alteraram em comparação com as análises anteriores, ou seja, a REGIÃO SUL com os melhores indicadores e a região NORDESTE com os piores indicadores. Não nota-se outliers nesta análise. : Taxa conclusão do ensino fundamental, de 15 a 17(dados normalizados) One-way ANOVA: MFUNsBR versus EST REG Source DF SS MS F Pll EST REG 4 0, , ,89 0,000 Error 21 0, ,00549 Total 25 0,42016 S = 0,07408 R-Sq = 72,57% R-Sq(adj) = 67,35% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 3 0, ,06087 (------* ) Nordeste 8 0, ,07172 (----*---) Norte 8 0, ,07817 (---*----) Sudeste 4 0, ,09718 (------*-----) Sul 3 0, ,01905 (------*------) ,36 0,48 0,60 0,72 Pooled StDev = 0,07408

19 MFUNsBR 17 Boxplot of MFUNsBR Boxplot of MFUNsBR 0,7 0,6 0,5 0,4 0,3 Centro-Oeste Nordeste Norte EST REG Sudeste Sul Segue a mesma distribuição da análise anterior, com a região SUL apresentando as melhores médias e a região nordeste as menores médias. Observa-se uma grande dispersão entre os municípios da região Norte, porém com a média e mediana próximas, mas no eixo inferior, ou seja, abaixo da média nacional. Essa mesma dispersão é encontrada na região SUL, mas no eixo superior, com pequeno distanciamento entre a média e a mediana. : Taxa conclusão do ensino médio, de 18 a 20(dados normalizados) One-way ANOVA: MMEDsBR versus EST REG Source DF SS MS F P EST REG 4 0, , ,89 0,000 Error 21 0, ,00357 Total 25 0,35868 S = 0,05973 R-Sq = 79,11% R-Sq(adj) = 75,14% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 3 0, ,04451 (------*------) Nordeste 8 0, ,05322 (----*---) Norte 8 0, ,06468 (----*---) Sudeste 4 0, ,08197 (-----*-----) Sul 3 0, ,02899 (------*------) ,30 0,40 0,50 0,60 Pooled StDev = 0,05973

20 MMEDsBR 18 Boxplot of MMEDsBR Boxplot of MMEDsBR 0,6 0,5 0,4 0,3 0,2 Centro-Oeste Nordeste Norte EST REG Sudeste Sul Segue a mesma distribuição da análise anterior, com a região SUL apresentando as melhores médias e neste item, a região norte apresenta a menor média. Observa-se uma distribuição não uniforme na região Sul, com uma concentração muito grande dos municípios entre a mediana e o quartil superior. As outras regiões apresentam uma distribuição mais uniforme. : Renda per capita (dados normalizados) One-way ANOVA: MRENsBR versus EST REG Source DF SS MS F P EST REG 4 0, , ,72 0,000 Error 21 0, ,00122 Total 25 0,20469 S = 0,03492 R-Sq = 87,49% R-Sq(adj) = 85,11% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 3 0, ,00464 (----*-----) Nordeste 8 0, ,01203 (--*--) Norte 8 0, ,04318 (--*---) Sudeste 4 0, ,05079 (---*----) Sul 3 0, ,04334 (----*----) ,080 0,160 0,240 0,320 Pooled StDev = 0,03492

21 MRENsBR 19 Boxplot of MRENsBR Boxplot of MRENsBR 0,35 0,30 0,25 0,20 0,15 0,10 Centro-Oeste Nordeste Norte EST REG Sudeste Sul Nesta análise evidencia-se a diferença do poder aquisitivo, pois a variável estudada é renda per capita, entre os Estados do SUL e os Estados do Norte do Brasil. Enquanto a região SUL apresenta a melhor média nacional, mas mesmo assim percebemos uma grande concentração dos municípios dos estados dessa região situados entre a mediana e o quartil inferior, a região Nordeste apresenta a menor média nacional, com o agravante de ter a maior parte dos seus municípios situados entre a mediana e o quartil inferior. : Domicílios sem água e saneamento (dados normalizados e positivados) One-way ANOVA: MAESIsBR versus EST REG Source DF SS MS F P EST REG 4 0, , ,04 0,000 Error 21 0, ,00637 Total 25 0,51729 S = 0,07983 R-Sq = 74,13% R-Sq(adj) = 69,20% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 3 0,9381 0,0223 ( * ) Nordeste 8 0,8046 0,0369 (----*----) Norte 8 0,6768 0,1324 (---*----) Sudeste 4 0,9769 0,0136 (------*------) Sul 3 0,9820 0,0012 ( * ) ,72 0,84 0,96 1,08

22 MAESIsBR 20 Pooled StDev = 0,0798 Boxplot of MAESIsBR One-way ANOVA: MAESIsBR versus EST REG Source DF SS MS F P EST REG 4 0, , ,04 0,000 Error 21 0, ,00637 Total 25 0,51729 S = 0,07983 R-Sq = 74,13% R-Sq(adj) = 69,20% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev Centro-Oeste 3 0,9381 0,0223 ( * ) Nordeste 8 0,8046 0,0369 (----*----) Norte 8 0,6768 0,1324 (---*----) Sudeste 4 0,9769 0,0136 (------*------) Sul 3 0,9820 0,0012 ( * ) ,72 0,84 0,96 1,08 Pooled StDev = 0,0798 Boxplot of MAESIsBR 1,0 Boxplot of MAESIsBR 0,9 0,8 0,7 0,6 0,5 Centro-Oeste Nordeste Norte EST REG Sudeste Sul Praticamente essa condição inexiste nos municípios da região SUL, o que seria excelente se acontecesse em todo o Brasil. Mas não é isso que observamos na análise. Há um percentual baixo nos municípios que compõem as regiões Sudeste e Centro- Oeste, porém alto nas regiões Nordeste e, principalmente na região NORTE e esta

23 21 ainda apresenta uma distribuição não uniforme observadas a média, a mediana e a distribuição entre os quartis. REFERÊNCIAS ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, ATLAS DO DESENVOLVIMENTO HUMANO NO BRASIL. Disponível em: < Acessado em: 17 mar IBGE, Instituto Brasileiro de Geografia e Estatística. Séries Históricas e Estatísticas. Disponível em: < Acessado em: 30 mar LAS CASAS A., DE HOYOS A. Pesquisa de Marketing

24 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada Utilizando 23 variáveis selecionadas do Atlas Brasil. DISCIPLINA: MÉTODOS QUALITATIVOS E QUANTITATIVOS EM ADMINISTRAÇÃO PROF. ARNOLDO JOSÉ DE HOYOS GUEVARA Diego Paulo Rhormens 1º SEMESTRE DE 2017 São Paulo SP 2017

25 SUMÁRIO INTRODUÇÃO Entendendo Os Dados Análise Descritiva Dos Dados E De Agrupamentos Análise Discriminante CONSIDERAÇÕES FINAIS REFERÊNCIA

26 INTRODUÇÃO O presente trabalho tem como objetivo dar continuidade ao estudo de dendograma e cluster dos dados provenientes das variáveis selecionadas do Atlas do Desenvolvimento Humano no Brasil, que apresentam indicadores de desenvolvimento humano dos 5565 municípios brasileiros. Este estudo teve início no Relatório VIII. Os dados são provenientes do Censo Demográfico de No Relatório VIII foi possível verificar na análise de agrupamentos, que alguns dos estados brasileiros ficaram sozinhos no agrupamento, e poderiam ser melhor realocados em grupos que tivessem mais similaridade. Desta maneira, este relatório irá realizar um estudo de análise discriminante, a fim de reduzir a quantidade de grupos de estados agrupados por similaridade, a fim de facilitar as análises e sintetizar melhor as informações. Com este estudo é possível perceber, a partir dos agrupamentos realizados, quais estados brasileiros possuem maior similaridade entre si e dividi-los em grupos. Para realizar as análises serão utilizadas as variáveis normalizadas e positivadas geradas no estudo realizado e apresentado no Relatório VII. No Relatório VII foram construídas três variáveis sintéticas, a PCRenLong, explicada 94,26% pela variável N_IDHM, a variável sintética PCHomem, explicada 96,46% pela variável N_HOMEM10A14, e no agregado 96,04% se adicionada a variável NP_T_DES18M, e a variável sintética PCTrab, explicada por N_T_LUZ em 32,18 %, no agregado a variável NP_TRABSC gera um poder de explicação de 66,01%, a variável NP_T_DES18M gera no agregado 82,87% e a variável NP_PAREDE gera um poder de explicação agregado de 91,05%. Portanto, para realizar as análises de agrupamentos que se seguem, serão utilizadas as variáveis N_IDHM, N_HOMEM10A14, NP_T_DES18M, N_T_LUZ, NP_TRABSC e NP_PAREDE. Será utilizado para análise o software estatístico MINITAB. Inicialmente, será apresentada a estatística descritiva de todas as variáveis selecionadas para estudo no Relatório I normalizadas (para aquelas que quanto maior o valor, melhor o indicador) e positivadas e normalizadas (para aquelas que quanto maior o valor, pior o indicador). CAPITULO 1. ENTENDENDO OS DADOS As variáveis selecionadas para a realização das análises das regressões múltiplas são os mesmos utilizados para a realização da análise do Relatório I. A Tabela 1 apresenta as variáveis selecionadas para a análise. Tabela 1: Variáveis Analisadas Significado Tipo Unidade de Medida NOMEMUN Nome do Município Qualitativa ESTADO Nome do Estado Qualitativa Dimensão Demográfica FECTOT Número médio de filhos que uma mulher deverá ter ao terminar o período reprodutivo (15 a 49 anos de idade). Unidade 3

27 MORT1 E_ANOSESTU DO T_ANALF15A1 7 PIND PINDCRI PPOBCRI P_SUPER T_DES18M TRABSC T_AGUA Número de crianças que não deverão sobreviver ao primeiro ano de vida de cada 1000 crianças nascidas vivas. Dimensão Educação Número médio de anos de estudos que uma criança que ingressa na escola deverá completar ao atingir 18 anos de idade, se os padrões atuais se mantiverem ao longo de sua vida escolar. Razão entre a população de 15 a 17 anos de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nessa faixa etária multiplicado por 100. Dimensão Renda Proporção dos indivíduos com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, em reais de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. Proporção dos indivíduos com até 14 anos de idade que têm renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, em reais de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. Proporção dos indivíduos com até 14 anos de idade que têm renda domiciliar per capita igual ou inferior a R$ 255,00 mensais, em reais de agosto de 2010, equivalente a 1/2 salário mínimo nessa data. O universo de indivíduos é limitado àqueles com até 14 anos e que vivem em domicílios particulares permanentes. Dimensão Trabalho Razão entre o número de pessoas de 18 anos ou mais de idade ocupadas e que já concluíram a graduação do ensino superior e o número total de pessoas ocupadas nessa faixa etária multiplicado por 100. Percentual da população economicamente ativa (PEA) com 18 anos ou mais que estava desocupada, ou seja, que não estava ocupada na semana anterior à data do Censo mas havia procurado trabalho ao longo do mês anterior à data dessa pesquisa. Razão entre o número de empregados de 18 anos ou mais de idade sem carteira de trabalho assinada e o número total de pessoas ocupadas nessa faixa etária multiplicado por 100. Dimensão Habitação Razão entre a população que vive em domicílios particulares permanentes com água canalizada para um ou mais cômodos e a população total residente em domicílios particulares permanentes multiplicado por 100. A água pode ser proveniente de rede geral, de Unidade Anos Percentual Percentual Percentual Percentual Percentual Percentual Percentual Percentual 4

28 T_LUZ PAREDE T_NESTUDA_ NTRAB_MMEI O poço, de nascente ou de reservatório abastecido por água das chuvas ou carro-pipa. Razão entre a população que vive em domicílios particulares permanentes com iluminação elétrica e a população total residente em domicílios particulares permanentes multiplicado por 100. Considera-se iluminação proveniente ou não de uma rede geral, com ou sem medidor. Razão entre as pessoas que vivem em domicílios cujas paredes não são de alvenaria nem de madeira aparelhada e a população total residente em domicílios particulares permanentes multiplicado por 100. São considerados apenas os domicílios particulares permanentes. Dimensão Vulnerabilidade Razão entre as pessoas de 15 a 24 anos que não estudam nem trabalham e são vulneráveis à pobreza e a população total nesta faixa etária multiplicado por 100. Define-se como vulneráveis à pobreza as pessoas que moram em domicílios com renda per capita inferior a 1/2 salário mínimo de agosto de São considerados apenas os domicílios particulares permanentes. Percentual Percentual Percentual T_MULCHEFE FIF014 Razão entre o número de mulheres que são responsáveis pelo domicílio, não têm o ensino fundamental completo e têm pelo menos 1 filho de idade inferior a 15 anos morando no domicílio e o número total de mulheres chefes de família multiplicado por 100. São considerados apenas os domicílios particulares permanentes. Dimensão População HOMEM10A14 População nesta faixa etária e do sexo masculino HOMEM70A74 População nesta faixa etária e do sexo masculino IDHM IDHM_ E Dimensão IDHM Índice de Desenvolvimento Humano Municipal. Média geométrica dos índices das dimensões Renda, Educação e Longevidade, com pesos iguais. Índice sintético da dimensão Educação que é um dos 3 componentes do IDHM. É obtido através da média geométrica do subíndice de frequência de crianças e jovens à escola, com peso de 2/3, e do subíndice de escolaridade da população adulta, com peso de 1/3. IDHM_L Índice da dimensão Longevidade que é um dos 3 componentes do IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do indicador) - (valor mínimo)] / Percentual Número Número Número Número Número 5

29 [(valor máximo) - (valor mínimo)], onde os valores mínimo e máximo são 25 e 85 anos, respectivamente. IDHM_R Índice da dimensão Renda que é um dos 3 componentes do IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado do indicador) - ln (valor mínimo)] / [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). Fonte: Atlas do Desenvolvimento Humano no Brasil Número CAPITULO 2. ANÁLISE DESCRITIVA DOS DADOS E DE AGRUPAMENTOS Inicialmente serão apresentados os resultados das análises descritivas das variáveis normalizadas ou normalizadas e positivadas. As variáveis que se iniciam por N foram apenas normalizadas, e as q ue se iniciam por NP foram normalizadas e positivadas. As Figuras apresentam a média, desvio padrão, variância, e box-plot de cada uma das variáveis. As Figuras de 1 a 22 representam as análises de cada uma das variáveis. Análises Estatísticas da NP_FECTOT A nderson-darling Normality Test A -Squared 42,50 P-V alue < 0,005 Mean 0,73367 StDev 0,13670 V ariance 0,01869 Skew ness -0,99172 Kurtosis 2,01757 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,66033 Median 0, rd Q uartile 0,82609 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,13928 Mean Median 0,730 0,735 0,740 0,745 0,750 0,755 Figura 1: Análise Estatística da NP_FECTOT Fonte: Atlas do Desenvolvimento Humano no Brasil 6

30 Análises Estatísticas da NP_MORT1 A nderson-darling Normality Test A -Squared 158,86 P-V alue < 0,005 Mean 0,71921 StDev 0,18629 V ariance 0,03470 Skew ness -1,00629 Kurtosis 0,43243 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,60037 Median 0, rd Q uartile 0,86139 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,18981 Mean Median 0,720 0,735 0,750 0,765 0,780 0,795 Figura 2: Análise Estatística da NP_MORT1 Fonte: Atlas do Desenvolvimento Humano no Brasil Análises Estatísticas da N_E_ANOSESTUDO A nderson-darling Normality Test A -Squared 1,38 P-V alue < 0,005 Mean 0,60349 StDev 0,12936 V ariance 0,01673 Skew ness -0, Kurtosis 0, N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,51943 Median 0, rd Q uartile 0,69140 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,13181 Mean Median 0,600 0,602 0,604 0,606 0,608 Figura 3: Análise Estatística da N_E_ANOSESTUDO Fonte: Atlas do Desenvolvimento Humano no Brasil 7

31 Análises Estatísticas da NP_T_ANALF15A17 A nderson-darling Normality Test A -Squared 298,69 P-V alue < 0,005 Mean 0,92065 StDev 0,07697 V ariance 0,00592 Skew ness -2,6774 Kurtosis 15,1659 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,88905 Median 0, rd Q uartile 0,97137 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,07843 Mean Median 0,920 0,925 0,930 0,935 0,940 0,945 0,950 Figura 4: Análise Estatística da NP_T_ANALF15A17 Fonte: Atlas do Desenvolvimento Humano no Brasil Análises Estatísticas da NP_PIND A nderson-darling Normality Test A -Squared 291,12 P-V alue < 0,005 Mean 0,83721 StDev 0,16885 V ariance 0,02851 Skew ness -1,10865 Kurtosis 0,49609 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,72635 Median 0, rd Q uartile 0,97646 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,17205 Mean Median 0,84 0,86 0,88 0,90 0,92 Figura 5: Análise Estatística da NP_PIND Fonte: Atlas do Desenvolvimento Humano no Brasil 8

32 Análises Estatísticas da NP_PINDCRI A nderson-darling Normality Test A -Squared 251,98 P-V alue < 0,005 Mean 0,77863 StDev 0,21198 V ariance 0,04493 Skew ness -0, Kurtosis -0, N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,62384 Median 0, rd Q uartile 0,95830 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,21599 Mean Median 0,76 0,78 0,80 0,82 0,84 0,86 0,88 Figura 6: Análise Estatística da NP_PINDCRI Fonte: Atlas do Desenvolvimento Humano no Brasil Análises Estatísticas da NP_PPOBCRI A nderson-darling Normality Test A -Squared 113,40 P-V alue < 0,005 Mean 0,39199 StDev 0,24538 V ariance 0,06021 Skew ness 0,29009 Kurtosis -1,16334 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,15975 Median 0, rd Q uartile 0,59937 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,25003 Mean Median 0,36 0,37 0,38 0,39 0,40 Figura 7: Análise Estatística da NP_PPOBCRI Fonte: Atlas do Desenvolvimento Humano no Brasil 9

33 Análises Estatísticas da N_P_SUPER A nderson-darling Normality Test A -Squared 84,72 P-V alue < 0,005 Mean 0,18048 StDev 0,09688 V ariance 0,00939 Skew ness 1,53911 Kurtosis 5,31372 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,11395 Median 0, rd Q uartile 0,22830 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,09872 Mean Median 0,160 0,165 0,170 0,175 0,180 0,185 Figura 8: Análise Estatística da N_P_SUPER Fonte: Atlas do Desenvolvimento Humano no Brasil Análises Estatísticas da NP_T_DES18M A nderson-darling Normality Test A -Squared 65,63 P-V alue < 0,005 Mean 0,83889 StDev 0,09508 V ariance 0,00904 Skew ness -1,26280 Kurtosis 3,45260 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,79220 Median 0, rd Q uartile 0,90377 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,09688 Mean Median 0,835 0,840 0,845 0,850 0,855 Figura 9: Análise Estatística da NP_T_DES18M Fonte: Atlas do Desenvolvimento Humano no Brasil 10

34 Análise Estatística da NP_TRABSC A nderson-darling Normality Test A -Squared 11,46 P-V alue < 0,005 Mean 0,62510 StDev 0,16644 V ariance 0,02770 Skew ness -0, Kurtosis -0, N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,50988 Median 0, rd Q uartile 0,75321 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,16959 Mean Median 0,620 0,625 0,630 0,635 0,640 Figura 10: Análise Estatística da NP_TRABSC Fonte: Atlas do Desenvolvimento Humano no Brasil Análise Estatística da N_T_AGUA A nderson-darling Normality Test A -Squared 270,99 P-V alue < 0,005 Mean 0,85576 StDev 0,14743 V ariance 0,02174 Skew ness -1,89166 Kurtosis 4,71167 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,79604 Median 0, rd Q uartile 0,96254 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,15023 Mean Median 0,85 0,86 0,87 0,88 0,89 0,90 0,91 Figura 11: Análise Estatística da N_T_AGUA Fonte: Atlas do Desenvolvimento Humano no Brasil 11

35 Análise Estatística da N_T_LUZ A nderson-darling Normality Test A -Squared 938,37 P-V alue < 0,005 Mean 0,96128 StDev 0,08299 V ariance 0,00689 Skew ness -4,2167 Kurtosis 23,1543 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,96756 Median 0, rd Q uartile 0,99821 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,08456 Mean Median 0,960 0,965 0,970 0,975 0,980 0,985 0,990 Figura 12: Análise Estatística da N_T_LUZ Fonte: Atlas do Desenvolvimento Humano no Brasil Análise Estatística da NP_PAREDE A nderson-darling Normality Test A -Squared 742,14 P-V alue < 0,005 Mean 0,93515 StDev 0,11373 V ariance 0,01294 Skew ness -3,2668 Kurtosis 12,9995 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,92960 Median 0, rd Q uartile 0,99504 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,11589 Mean Median 0,93 0,94 0,95 0,96 0,97 0,98 Figura 13: Análise Estatística da NP_PAREDE Fonte: Atlas do Desenvolvimento Humano no Brasil 12

36 Análise Estatística da NP_T_MULCHEFEFIF014 A nderson-darling Normality Test A -Squared 68,62 P-V alue < 0,005 Mean 0,74281 StDev 0,13303 V ariance 0,01770 Skew ness -0,99289 Kurtosis 1,37190 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,66665 Median 0, rd Q uartile 0,84122 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,13554 Mean Median 0,740 0,745 0,750 0,755 0,760 0,765 0,770 Figura 14: Análise Estatística da NP_T_MULCHEFEFIF014 Fonte: Atlas do Desenvolvimento Humano no Brasil Análise Estatística da NP_T_NESTUDA_NTRAB_MMEIO A nderson-darling Normality Test A -Squared 61,38 P-V alue < 0,005 Mean 0,73257 StDev 0,15840 V ariance 0,02509 Skew ness -0, Kurtosis -0, N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,60905 Median 0, rd Q uartile 0,86796 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,16140 Mean Median 0,730 0,735 0,740 0,745 0,750 0,755 0,760 Figura 15: Análise Estatística da NP_T_NESTUDA_NTRAB_MMEIO Fonte: Atlas do Desenvolvimento Humano no Brasil 13

37 Análise Estatística da N_HOMEM10A14 A nderson-darling Normality Test A -Squared 1517,21 P-V alue < 0,005 Mean 0,00351 StDev 0,01833 V ariance 0,00034 Skew ness 35,75 Kurtosis 1724,58 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,00050 Median 0, rd Q uartile 0,00266 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,01868 Mean Median 0,0010 0,0015 0,0020 0,0025 0,0030 0,0035 0,0040 Figura 16: Análise Estatística da N_HOMEM10A14 Fonte: Atlas do Desenvolvimento Humano no Brasil Análise Estatística da N_HOMEM70A74 A nderson-darling Normality Test A -Squared 1603,72 P-V alue < 0,005 Mean 0,00306 StDev 0,01833 V ariance 0,00034 Skew ness 40,13 Kurtosis 1962,24 N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,00056 Median 0, rd Q uartile 0,00233 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,01868 Mean Median 0,0010 0,0015 0,0020 0,0025 0,0030 0,0035 Figura 17: Análise Estatística da N_HOMEM70A74 Fonte: Atlas do Desenvolvimento Humano no Brasil 14

38 Análise Estatística da N_IDHM A nderson-darling Normality Test A -Squared 40,51 P-V alue < 0,005 Mean 0,54315 StDev 0,16216 V ariance 0,02629 Skew ness -0, Kurtosis -0, N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,40766 Median 0, rd Q uartile 0,67568 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,16523 Mean Median 0,540 0,545 0,550 0,555 0,560 0,565 Figura 18: Análise Estatística da N_IDHM Fonte: Atlas do Desenvolvimento Humano no Brasil Análise Estatística da N_IDHM_E A nderson-darling Normality Test A -Squared 9,32 P-V alue < 0,005 Mean 0,56973 StDev 0,15102 V ariance 0,02281 Skew ness -0, Kurtosis -0, N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,45793 Median 0, rd Q uartile 0,68608 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,15388 Mean Median 0,5650 0,5675 0,5700 0,5725 0,5750 0,5775 Figura 19: Análise Estatística da N_IDHM_E Fonte: Atlas do Desenvolvimento Humano no Brasil 15

39 Análise Estatística da N_IDHM_L A nderson-darling Normality Test A -Squared 35,06 P-V alue < 0,005 Mean 0,58362 StDev 0,20127 V ariance 0,04051 Skew ness -0, Kurtosis -0, N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,43694 Median 0, rd Q uartile 0,73874 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,20508 Mean Median 0,58 0,59 0,60 0,61 0,62 Figura 20: Análise Estatística da N_IDHM_L Fonte: Atlas do Desenvolvimento Humano no Brasil Análise Estatística da N_IDHM_R A nderson-darling Normality Test A -Squared 55,08 P-V alue < 0,005 Mean 0,49465 StDev 0,16428 V ariance 0,02699 Skew ness -0, Kurtosis -0, N ,00 0,14 0,28 0,42 0,56 0,70 0,84 0,98 Minimum 0, st Q uartile 0,35031 Median 0, rd Q uartile 0,62525 Maximum 1, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,16739 Mean Median 0,49 0,50 0,51 0,52 Figura 21: Análise Estatística da N_IDHM_R Fonte: Atlas do Desenvolvimento Humano no Brasil 16

40 NP_T_DES18M Para realizar as análises que se seguem, serão utilizadas apenas as variáveis N_IDHM, N_HOMEM10A14, NP_T_DES18M, N_T_LUZ, NP_TRABSC e NP_PAREDE. Foram traçados os box-plots de cada uma das seis variáveis selecionadas para a análise para os estados brasileiros. É possível verificar pela média e pela distribuição dos dados como se comporta cada um dos estados brasileiros para cada uma das variáveis selecionadas. As Figuras de 22 a 33 representam os box-plots de cada uma das variáveis para os estados brasileiros e para as cinco regiões, a fim de que que se possa perceber de maneira visual as similaridades e diferenças entre os valores da média, mediana, primeiro e terceiro quartil dos estados e seus outliers. 1,0 Boxplot of NP_T_DES18M 0,8 0,6 0,4 0,2 0,0 AL AC AM AP MA GO ES DF CE BA MT MS MG RN RJ PR PI PE PB PA ESTADO Figura 22: Box-plots da T_DES18M Normalizada e Positivada por Estado Fonte: Atlas do Desenvolvimento Humano no Brasil TO SP SE SC RS RR RO 17

41 NP_TRABSC NP_T_DES18M Boxplot of NP_T_DES18M 1,0 0,8 0,6 0,4 0,2 0,0 CO N NE REGIÃO S SE Figura 23: Box-plots da T_DES18M Normalizada e Positivada por Região Fonte: Atlas do Desenvolvimento Humano no Brasil Boxplot of NP_TRABSC 1,0 0,8 0,6 0,4 0,2 0,0 AL AC BA AP AM MA GO ES DF CE MT MS MG RN RJ PR PI PE PB PA ESTADO Figura 24: Box-plots da TRABSC Normalizada e Positivada por Estado Fonte: Atlas do Desenvolvimento Humano no Brasil TO SP SE SC RS RR RO 18

42 N_T_LUZ NP_TRABSC Boxplot of NP_TRABSC 1,0 0,8 0,6 0,4 0,2 0,0 CO N NE REGIÃO S SE Figura 25: Box-plots da TRABSC Normalizada e Positivada por Região Fonte: Atlas do Desenvolvimento Humano no Brasil Boxplot of N_T_LUZ 1,0 0,8 0,6 0,4 0,2 0,0 AL AC CE BA AP AM MA GO ES DF MT MS MG RN RJ PR PI PE PB PA ESTADO Figura 26: Box-plots da T_LUZ Normalizada por Estado Fonte: Atlas do Desenvolvimento Humano no Brasil TO SP SE SC RS RR RO 19

43 NP_PAREDE N_T_LUZ Boxplot of N_T_LUZ 1,0 0,8 0,6 0,4 0,2 0,0 CO N NE REGIÃO S SE Figura 27: Box-plots da T_LUZ Normalizada por Região Fonte: Atlas do Desenvolvimento Humano no Brasil Boxplot of NP_PAREDE 1,0 0,8 0,6 0,4 0,2 0,0 AL AC BA AP AM MA GO ES DF CE MT MS MG RN RJ PR PI PE PB PA ESTADO Figura 28: Box-plots da PAREDE Normalizada e Positivada por Estado Fonte: Atlas do Desenvolvimento Humano no Brasil TO SP SE SC RS RR RO 20

44 N_HOMEM10A14 NP_PAREDE Boxplot of NP_PAREDE 1,0 0,8 0,6 0,4 0,2 0,0 CO N NE REGIÃO S SE Figura 29: Box-plots da PAREDE Normalizada e Positivada por Região Fonte: Atlas do Desenvolvimento Humano no Brasil Boxplot of N_HOMEM10A14 1,0 0,8 0,6 0,4 0,2 0,0 AL AC CE BA AP AM MA GO ES DF MT MS MG RN RJ PR PI PE PB PA ESTADO Figura 30: Box-plots da HOMEM10A14 Normalizada por Estado Fonte: Atlas do Desenvolvimento Humano no Brasil TO SP SE SC RS RR RO 21

45 N_IDHM N_HOMEM10A14 Boxplot of N_HOMEM10A14 1,0 0,8 0,6 0,4 0,2 0,0 CO N NE REGIÃO S SE Figura 31: Box-plots da HOMEM10A14 Normalizada por Região Fonte: Atlas do Desenvolvimento Humano no Brasil Boxplot of N_IDHM 1,0 0,8 0,6 0,4 0,2 0,0 AL AC CE BA AP AM MA GO ES DF MT MS MG RN RJ PR PI PE PB PA ESTADO Figura 32: Box-plots da IDHM Normalizada por Estado Fonte: Atlas do Desenvolvimento Humano no Brasil TO SP SE SC RS RR RO 22

46 N_IDHM Boxplot of N_IDHM 1,0 0,8 0,6 0,4 0,2 0,0 CO N NE REGIÃO S SE Figura 33: Box-plots da IDHM Normalizada por Região Fonte: Atlas do Desenvolvimento Humano no Brasil Observando estes box-plots é possível verificar quais os estados que estão melhores em cada um dos seis indicadores. Pode-se perceber que os estados da Bahia, Rio Grande do Norte do Norte, Sergipe e Tocantins tem uma menor média para a variável referente a quantidade de indivíduos que trabalham sem carteira assinada. O acesso a luz é menor nas regiões do Norte, em especial nos estados do Acre, Amazonas e Pará. Neste indicador Roraima é o estado que possui a menor média. Na variável PAREDE, que se refere a quantidade de pessoas que moram em casas inadequadas, os estados do Maranhão e de Roraima apresentam menores índices, portanto condições mais precárias de moradia. A variável referente a quantidade de homens de 10 a 14 anos possuiu uma distribuição parecida nas diferentes regiões. Ao observar o box-plot da Figura 6, a variável referente ao IDHM apresenta distribuições diferentes. É possível verificar que os estados do Sul, sudeste e Centro-Oeste possuem uma média melhor do que os demais estados. As variáveis referentes a taxa de desocupação e ao número de trabalhadores sem carteira também possui valores de média diferentes para cada estado brasileiro e para cada região. É possível verificar que alguns estados são mais similares e outros menos nestas variáveis e que os as regiões Sul e Sudeste possuem indicadores melhores nestas variáveis. Para dar continuidade as análises, foi realizado um teste de ANOVA para verificar qual a média de cada uma das seis variáveis normatizadas e positivadas selecionadas para cada estado brasileiro. 23

47 Com os valores das médias, obtidos para cada uma das variáveis em relação a cada estado brasileiro, foi realizado o teste de cluster com o Linkage Mediun Single e a Distance Measure Euclidean para as seis variáveis selecionadas com oito clusters. Cluster Analysis of Observations: MediaNP_T_DE; MediaNP_TRAB; MediaN_T_LUZ;... Euclidean Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,2811 0, ,2669 0, ,6705 0, ,0269 0, ,4024 0, ,1329 0, ,9694 0, ,5190 0, ,5094 0, ,0572 0, ,9116 0, ,6338 0, ,4854 0, ,3302 0, ,1875 0, ,2062 0, ,7001 0, ,0060 0, ,6716 0, ,6305 0, ,1068 0, ,3511 0, ,4155 0, ,4674 0, ,1862 0, ,3788 0, Final Partition Number of clusters: 8 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 4 0, , , Cluster2 7 0, , , Cluster3 1 0, , , Cluster4 1 0, , , Cluster5 11 0, , , Cluster6 1 0, , , Cluster7 1 0, , , Cluster8 1 0, , , Cluster Centroids Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 MediaNP_T_DES18M 0, , , , , ,

48 MediaNP_TRABSC 0, , , , , ,55330 MediaN_T_LUZ 0, , , , , ,91600 MediaNP_PAREDE 0, , , , , ,59750 MediaN_HOMEM10A14 0, , , , , ,00379 MediaN_IDHM 0, , , , , ,35630 Grand Variable Cluster7 Cluster8 centroid MediaNP_T_DES18M 0, , , MediaNP_TRABSC 0, , , MediaN_T_LUZ 0, , , MediaNP_PAREDE 0, , , MediaN_HOMEM10A14 0, , , MediaN_IDHM 0, , , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0, , , , , , , Cluster2 0, , , , , , , Cluster3 0, , , , , , , Cluster4 0, , , , , , , Cluster5 0, , , , , , , Cluster6 0, , , , , , , Cluster7 0, , , , , , , Cluster8 0, , , , , , , Cluster8 Cluster1 0, Cluster2 0, Cluster3 0, Cluster4 0, Cluster5 0, Cluster6 0, Cluster7 0, Cluster8 0, A Figura 34 mostra de maneira visual o agrupamento dos estados em oito clusters. 25

49 Similarity Dendograma dos Estados 58,38 72,25 86,13 100,00 AC AM PA TO AP CE BA RN SE PE PB AL PI GO ES DF RR MA SC RS RJ RO SP PR MT MS MG Observations Figura 34: Dendograma dos Estados Com os Agrupamentos a Partir das 6 Variáveis Fonte: Atlas do Desenvolvimento Humano no Brasil A partir da observação da Figura 28, é possível perceber que é possível dividir o Brasil em oito grupos de estados similares entre si a partir das variáveis escolhidas para a análise. No primeiro grupo encontram-se os estados do Acre, Amazonas, Pará e Piauí, no segundo grupo os estados de Alagoas, Paraíba, Pernambuco, Sergipe, Rio Grande do Norte, Bahia e Ceará. O terceiro grupo é formado pelo estado do Amapá, o quarto pelo Tocantins. O quinto grupo é formado por uma grande quantidade de estados, sendo eles o Espírito Santo, Goiás, Minas Gerais, Mato Grosso do Sul, Mato Grosso, Paraná, São Paulo, Rondônia, Rio de Janeiro, Rio Grande do Sul e Santa Catarina. O sexto agrupamento é composto pelo Maranhão, o sétimo por Roraima e o oitavo pelo Distrito Federal. É possível perceber que o primeiro agrupamento é formado predominantemente pelos estados da região Norte, o segundo pelos estados da região Nordeste e no quinto se encontram os estados mais desenvolvidos. É possível perceber a partir da leitura dos dados obtidos, que os resultados com oito clusters possuem uma similaridade de 84,67%, adicionando-se mais um cluster mudaria pouco o grau de similaridade, e subtraindo-se um cluster não seria possível verificar visualmente com facilidade as diferenças entre os grupos 1 e 2. Existem cinco cluster que possuem apenas um estado. A Figura 35 representa o mapa do Brasil pintado de acordo com os agrupamentos gerados através da análise dos clusters. 26

50 Figura 35: Mapa do Brasil com os Estados Agrupados em 8 Clusters Fonte: Atlas do Desenvolvimento Humano no Brasil É possível perceber visualmente que as regiões Centro-Oeste, Sul e Sudeste formam um agrupamento, sendo estes os municípios mais desenvolvidos. Rondônia, apesar de pertencer a região Norte também faz parte deste agrupamento. Outro agrupamento está relacionado com os municípios da região Nordeste, exceto o Piauí e o Maranhão. Estes municípios, em geral, têm situação mais precárias do que o do agrupamento cor de rosa. A região Norte também gera um agrupamento, com os estados pintados de vermelho e o Piauí também está neste agrupamento. Percebe-se que o Maranhão é um estado a parte, e que este estado também possui situação precária. O Amapá e o Tocantins também fazem parte de um grupo com apenas um estado. O Distrito Federal também é único em seu grupo. CAPITULO 3. ANÁLISE DISCRIMINANTE Com esta maneira de se agrupar os dados, é possível perceber que muitos estados ficam sozinhos no agrupamento, e que o Distrito Federal também representa um agrupamento diferente. Para que seja possível melhorar e simplificar as análises, diminuindo o número de agrupamentos e fazendo com que estes consigam incluir os estados que ficaram sozinhos nos grupos mais similares, foram realizadas análises discriminantes para verificar se estes agrupamentos foram adequados. O Distrito Federal foi excluído das análises que se seguem. Inicialmente foi realizada uma análise de cluster com o Linkage Method Complete e o Distance Measure Manhattan com 8 agrupamentos para verificar em qual dos agrupamentos poderiam ser inseridos os estados que estavam sozinhos ou que possuem poucos estados no seu agrupamento, a fim de diminuir a quantidade de agrupamentos para se ter uma melhor visualização das diferenças regionais brasileiras e maior síntese. 27

51 Cluster Analysis of Observations: MediaNP_T_DE; MediaNP_TRAB; MediaN_T_LUZ;... Manhattan Distance, Complete Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,8087 0, ,6544 0, ,1878 0, ,8821 0, ,4059 0, ,1522 0, ,0119 0, ,6386 0, ,5922 0, ,0742 0, ,8266 0, ,4224 0, ,6111 0, ,3326 0, ,0328 0, ,8657 0, ,9207 0, ,2064 0, ,9270 0, ,0671 0, ,0810 0, ,4489 0, ,8743 0, ,1782 0, ,0000 1, Final Partition Number of clusters: 8 Maximum Within Average distance Number of cluster sum distance from from observations of squares centroid centroid Cluster1 4 0, , , Cluster2 7 0, , , Cluster3 2 0, , , Cluster4 6 0, , , Cluster5 1 0, , , Cluster6 3 0, , , Cluster7 1 0, , , Cluster8 2 0, , , Cluster Centroids Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 MediaNP_T_DES18M_1 0, , , , , , MediaNP_TRABSC_1 0, , , , , , MediaN_T_LUZ_1 0, , , , , ,

52 MediaNP_PAREDE_1 0, , , , , , MediaN_HOMEM10A14_1 0, , , , , , MediaN_IDHM_1 0, , , , , , Grand Variable Cluster7 Cluster8 centroid MediaNP_T_DES18M_1 0, , , MediaNP_TRABSC_1 0, , , MediaN_T_LUZ_1 0, , , MediaNP_PAREDE_1 0, , , MediaN_HOMEM10A14_1 0, , , MediaN_IDHM_1 0, , , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0, , , , , , , Cluster2 0, , , , , , , Cluster3 0, , , , , , , Cluster4 0, , , , , , , Cluster5 0, , , , , , , Cluster6 0, , , , , , , Cluster7 0, , , , , , , Cluster8 0, , , , , , , Cluster8 Cluster1 0, Cluster2 0, Cluster3 0, Cluster4 0, Cluster5 0, Cluster6 0, Cluster7 0, Cluster8 0, A figura 36 representa o dendograma desta análise. 29

53 Similarity Dendograma dos Estados 0,00 33,33 66,67 100,00 AC AM PE AL RR MA PI PA PB CE BA SE RN GO ES TO AP Observations MT MS MG Figura 36: Dendograma dos Estados com 8 Clusters Fonte: Atlas do Desenvolvimento Humano no Brasil SC RS RJ SP PR RO Para facilitar a visualização das análises que se seguem, os resultados das análises foram pintados de vermelho nos dados gerados pelo MINITAB. Pode-se perceber que o cluster 3 possui apenas 2 estados, AP e TO, e que ele está mais próximo do cluster 2, com 7 estados, AL, PE, SE, BA, CE, PB e RN. O Cluster 5 possui um estado, do MA, e está mais próximo do cluster 1, composto pelos estados AC, AM, PA e PI. O cluster 6 possui 3 estados, PR, SP e RJ, e está próximo do cluster 4, que conta com os estados do ES, GO, MG, MS, MT e RO. O cluster 7 possui 1 estado, RR, e este está mais próximo do cluster 1. O cluster 8 possui dois estados, RS e SC, e está mais perto do cluster 4. Após realizado estas análises, foi possível reagrupar os estados em apenas 3 clusters, desta forma, foi possível sintetizar os dados em 3 grupos. Após realizar este procedimento for realizada uma análise discriminante, para verificar se o agrupamento nestes três grupos era adequado. Discriminant Analysis: grupo4 versus MediaNP_T_DE; MediaNP_TRAB;... Linear Method for Response: grupo4 Predictors: MediaNP_T_DES18M_1; MediaNP_TRABSC_1; MediaN_T_LUZ_1; MediaNP_PAREDE_1; MediaN_HOMEM10A14_1; MediaN_IDHM_1 Group Count Summary of classification True Group Put into Group

54 Total N N correct Proportion 1,000 1,000 1,000 N = 26 N Correct = 26 Proportion Correct = 1,000 Squared Distance Between Groups , , , ,3531 0, , , ,0268 0,0000 Linear Discriminant Function for Groups Constant -500,9-569,8-706,6 MediaNP_T_DES18M_1 716,8 613,9 706,2 MediaNP_TRABSC_1-36,3-42,6-47,8 MediaN_T_LUZ_1 287,1 379,3 392,7 MediaNP_PAREDE_1 167,6 236,1 249,1 MediaN_HOMEM10A14_1 4459,3 3180,1 3713,4 MediaN_IDHM_1 181,6 232,7 302,9 Verifica-se que o primeiro grupo ficou com 6 estados, o segundo com 9 estados e o terceiro com 11 estados. O valor de Proportion dos três grupos foi 1,000, o que indica que estes agrupamentos são bons. Os três grupos possuem uma distância boa entre si, o que mostra que são diferentes. Realizou-se novamente uma análise de cluster dos resultados encontrados para apresentar o dendograma de modo mais visual, representado pela Figura 37. Cluster Analysis of Observations: MediaNP_T_DE; MediaNP_TRAB; MediaN_T_LUZ;... Manhattan Distance, Complete Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,8087 0, ,6544 0, ,1878 0, ,8821 0, ,4059 0, ,1522 0, ,0119 0, ,6386 0, ,5922 0, ,0742 0, ,8266 0, ,4224 0, ,6111 0, ,3326 0, ,0328 0, ,8657 0, ,9207 0, ,2064 0, ,9270 0,

55 ,0671 0, ,0810 0, ,4489 0, ,8743 0, ,1782 0, ,0000 1, Final Partition Number of clusters: 3 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 6 0, , , Cluster2 9 0, , , Cluster3 11 0, , , Cluster Centroids Grand Variable Cluster1 Cluster2 Cluster3 centroid MediaNP_T_DES18M_1 0, , , , MediaNP_TRABSC_1 0, , , , MediaN_T_LUZ_1 0, , , , MediaNP_PAREDE_1 0, , , , MediaN_HOMEM10A14_1 0, , , , MediaN_IDHM_1 0, , , , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster1 0, , , Cluster2 0, , , Cluster3 0, , ,

56 Similarity Dendograma dos Estados 0,00 33,33 66,67 100,00 AC AM PE AL RR MA PI PA PB CE BA SE RN GO ES TO AP Observations MT MS MG Figura 37: Dendograma dos Estados com 3 Clusters Fonte: Atlas do Desenvolvimento Humano no Brasil SC RS RJ SP PR RO Pode-se perceber, que o brasil pode ser dividido em três agrupamentos de estados similares, sendo um deles composto pelos estados do AC, AM, PA, PI, MA e RR, o segundo composto por AL, PE, SE, BA, CE, PB, RN, AP e TO e o terceiro formado por ES, GO, MG, MS, MT, RO, PR, SP, RJ, RS e SC. No terceiro agrupamento se encontram os estados mais desenvolvidos, situados na região Sul do país, e no primeiro e no segundo agrupamento se encontram os estados menos desenvolvidos situados nas regiões Norte e Nordeste. O estado de Rondônia, está situado no terceiro agrupamento apesar de pertencer a região Norte. Para melhorar a visualização dos resultados obtidos, a Figura 38 apresenta o mapa do Brasil colorido de forma a evidenciar os agrupamentos. 33

57 Figura 38: Mapa do Brasil Agrupado de Acordo com as 3 Regiões Encontradas. Fonte: Atlas do Desenvolvimento Humano no Brasil É possível verificar visualmente quais as regiões que necessitam de maiores investimentos em políticas públicas para melhorar de condição. A região Sul é a mais desenvolvida. CONSIDERAÇÕES FINAIS Com as análises realizadas foi possível dividir o Brasil em três regiões diferentes de acordo com sua similaridade. Cruzando-se os resultados obtidos com esta divisão e os obtidos a partir da comparação das médias dos estados para cada uma das seis variáveis utilizadas para a análise é possível chegar a algumas pistas de quais locais devem receber atendimento prioritário para reduzir os problemas de desigualdade e aumentar a qualidade de vida dos indivíduos. A partir das análises obtidas pela comparação da ANOVA das seis variáveis utilizadas nas análises, foi possível observar quais estados estão melhores e piores em cada uma das variáveis. Foi possível verificar que o acesso a luz é menor na região Norte, nos estados do Acre, Rio Grande do Norte, Sergipe e Tocantins, o que sugere a necessidade de maior investimento nesta região para que todos tenham acesso a luz, assim como os estados do Maranhão e Roraima possuem em maior quantidade indivíduos que não moram em casas com paredes adequadas, nesta região as variáveis referentes a estrutura são mais precárias. Já os estados do Nordeste como a Bahia, Rio Grande do Norte e Sergipe, além de Tocantins possuem menos indivíduos trabalhando com carteira assinada do que os demais, o que indica a necessidade de desenvolvimento da região. 34

58 O IDHM também é melhor nos Estados das regiões Sul, Sudeste e Centro-Oeste do que nas regiões Norte e Nordeste, o que indica a necessidade de buscar melhorar o IDHM nestas regiões. REFERÊNCIA ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, ATLAS DO DESENVOLVIMENTO HUMANO NO BRASIL. Disponível em: < Acessado em: 17 mar IBGE, Instituto Brasileiro de Geografia e Estatística. Séries Históricas e Estatísticas. Disponível em: < Acessado em: 30 mar LAS CASAS A., DE HOYOS A. Pesquisa de Marketing 35

59 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada, Utilizando 18 variáveis selecionadas do Atlas Brasil. DISCIPLINA: MÉTODOS QUALITATIVOS E QUANTITATIVOS EM ADMINISTRAÇÃO PROF. ARNOLDO JOSÉ DE HOYOS GUEVARA Fernanda Cardoso Romão Freitas 1º SEMESTRE DE 2017 São Paulo SP 2017

60 SUMÁRIO INTRODUÇÃO... 3 CAPÍTULO I. ENTENDENDO OS DADOS Os Indivíduos As Variáveis A tabela de Dados Variáveis Categóricas Município... 7 CAPÍTULO II. ANÁLISE DE CLUSTERS E DENDOGRAMA Mapa do Brasil com 7 Clusters CAPÍTULO III. DENDOGRAMA COM 4 CLUSTERS CLASSIFICAÇÃO SUPERVISIONADA Mapa do Brasil com 4 Clusters CAPÍTULO IV. ANOVA por região das variáveis ESPVIDA, MORT1, T_ANALF11á14 e T_ANALF15M CONSIDERAÇÕES FINAIS REFERÊNCIA

61 INTRODUÇÃO O Atlas Brasil do Desenvolvimento Humano é uma plataforma de consulta ao Índice do Desenvolvimento Humano Municipal (IDHM). O Atlas traz o IDHM e mais 200 indicadores de desenvolvimento nas dimensões de demografia, educação,renda,trabalho,habitação e vulnerabilidade através dos dados extraídos dos censos demográficos. Este trabalho tem por objetivo realizar uma análise exploratória na dimensão do IDHM dos dados disponibilizados na plataforma Atlas. A Base de dados do Atlas Brasil apresenta o Índice de Desenvolvimento Humano Municipal de municípios, 27 unidades de Federação (UF) e 20 Regiões Metropolitanas. Para iniciar a compreensão dos dados faremos a apresentação das variáveis escolhidas incluindo suas definições, significados, unidade de medida e faremos a apresentação da tabela de dados. Em seguida será apresentada a análise de cada uma das variáveis. Para a análise contaremos com a o auxílio de gráficos e dados numéricos como histograma, Box-plot, curva de densidade, teste de normalidade de Anderson Darling,média,mediana,quartis,desvio padrão, variância e intervalo de confiança. Por fim faremos uma análise sobre todas as variáveis estudadas. O Software estatístico utilizado neste trabalho foi o MINITAB 17. CAPÍTULO I. ENTENDENDO OS DADOS 1.1 Os Indivíduos Os indivíduos estudados neste trabalho são os municípios brasileiros que serão analisados pela dimensão do Desenvolvimento Humano e seus indicadores, presentes no relatório do Atlas Brasil Os dados analisados são do ano de Quando a dimensão do Desenvolvimento Humano Municipal Brasileiro, este considera as mesmas três dimensões do IDH- Global que são longevidade, educação e renda. A importância do IDHM se dá, pois sintetiza uma realidade complexa em um único número e viabiliza a comparação entre os municípios ao longo do tempo. Ele também populariza a visão do desenvolvimento voltado para pessoas e não apenas para o progresso econômico. O Crescimento econômico seja transformado em outras conquistas além da renda e da riqueza e que alcance a qualidade de vida de cada indivíduo. 1.2 As Variáveis São 18 as variáveis desta pesquisa. As mesmas são melhores explicadas na tabela 1. Ressalta-se que todos os dados desta pesquisa são referentes ao ano de Tabela 1. As Variáveis Significado Tipo ESPVIDA Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. Unidade de Medida Índice 3

62 MORT1 T_ANALF11A14 T_ANALF15M PIND RIND REN3 RENOCUP Número de crianças que não deverão sobreviver ao primeiro ano de vida em cada 1000 crianças nascidas vivas. Razão entre a população de 11 a 14 anos de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Razão entre a população de 15 anos ou mais de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100. Proporção dos indivíduos com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, em reais de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. Média da renda domiciliar per capita das pessoas com renda domiciliar per capita igual ou inferior a R$ 70,00 mensais, a preços de agosto de O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. Razão entre o número de pessoas de 18 anos ou mais de idade ocupadas e com rendimento mensal de todos os trabalhos inferior a 3 salários mínimos de julho de 2010 e o número total de pessoas ocupadas nessa faixa etária multiplicado por 100. Média dos rendimentos de todos os trabalhos das pessoas ocupadas de 18 anos ou mais de idade. Valores em reais de agosto de Índice Índice Índice Percentual Índice Percentual Índice 4

63 T_AGUA T_LIXO T_FORA6A14 T_M10A14CF PESORUR PESOURB IDHM Razão entre a população que vive em domicílios particulares permanentes com água canalizada para um ou mais cômodos e a população total residente em domicílios particulares permanentes multiplicado por 100. A água pode ser proveniente de rede geral, de poço, de nascente ou de reservatório abastecido por água das chuvas ou carro-pipa. Razão entre a população que vive em domicílios com coleta de lixo e a população total residente em domicílios particulares permanentes multiplicado por 100. Estão incluídas as situações em que a coleta de lixo realizada diretamente por empresa pública ou privada, ou o lixo é depositado em caçamba, tanque ou depósito fora do domicílio, para posterior coleta pela prestadora do serviço. São considerados apenas os domicílios particulares permanentes localizados em área urbana. Razão entre as crianças de 6 a 14 anos que não frequenta a escola e o total de crianças nesta faixa etária multiplicado por 100. Razão entre as mulheres de 10 a 14 anos de idade que tiveram filhos e o total de mulheres nesta faixa etária multiplicado por 100. População residente na área rural População residente na área urbana Índice de Desenvolvimento Humano Municipal. Média geométrica dos índices das dimensões Renda, Educação e Longevidade, com pesos iguais. Percentual Percentual Percentual Percentual Índice Índice Índice 5

64 IDHM_ E IDHM_L IDHM_R Índice sintético da dimensão Educação que é um dos 3 componentes do IDHM. É obtido através da média geométrica do subíndice de frequência de crianças e jovens à escola, com peso de 2/3, e do subíndice de escolaridade da população adulta, com peso de 1/3. Índice da dimensão Longevidade que é um dos 3 componentes do IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do indicador) - (valor mínimo)] / [(valor máximo) - (valor mínimo)], onde os valores mínimo e máximo são 25 e 85 anos, respectivamente. Índice da dimensão Renda que é um dos 3 componentes do IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado do indicador) - ln (valor mínimo)] / [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). Fonte: Atlas Brasil 2013 Índice Índice Índice 1.3 A Tabela de Dados Estatísticas Descritivas: ANO; UF; Codmun6; Codmun7; ESPVIDA; MORT1; T_ANALF11A14;... N N* Média EP Média DesvPad Mínimo Q1 Mediana Q3 ANO ,0 0, , ,0 2010,0 2010,0 2010,0 UF ,372 0,132 9,830 11,000 25,000 31,000 41,000 Codmun Codmun ESPVIDA ,968 0,0525 3,920 1,000 71,140 73,470 75,160 MORT ,293 0,0966 7,213 8,490 13,800 17,000 23,900 T_ANALF11A ,6888 0,0508 3,7925 0,0000 1,1900 2,0200 5,2400 T_ANALF15M ,159 0,132 9,840 0,950 8,080 13,120 24,320 PIND ,341 0,158 11,764 0,000 1,640 6,240 19,065 6

65 RIND ,036 0,129 9,603 0,000 27,435 32,510 37,090 REN ,932 0,0789 5,889 51,450 87,275 91,940 95,840 RENOCUP ,11 4,58 341,68 136,42 488,59 761, ,08 T_AGUA ,598 0,197 14,721 0,150 79,635 90,280 96,260 T_LIXO ,047 0,148 11,050 0,000 93,720 98,030 99,490 T_FORA6A ,8632 0,0357 2,6653 0,0000 1,5200 2,3800 3,4350 T_M10A14CF , , , , , , ,67000 pesorur , , pesourb IDHM , , , , , , ,71800 IDHM_E , , , , , , ,63100 IDHM_L , , , , , , ,83600 IDHM_R , , , , , , ,70700 Para esta análise usaremos apenas as varáveis, ESPVIDA, MORT1, T_ANALF15M e T_ANALF11A Variáveis Categóricas Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo pie chart e barras. 1.5 : Município A amostra totaliza 5565 municípios, que pode ser verificada na distribuição no território nacional de acordo com a região no gráfico Unidades Federativas Categoria Rio de Janeiro São Paulo Bahia Santa Catarina Minas Gerais Paraná Pernambuco Rio Grande do Norte Goiás Rio Grande do Sul Sergipe Espírito Santo Ceará Paraíba Tocantins Mato Grosso Piauí Alagoas Pará Maranhão Rondônia Mato Grosso do Sul Amapá Amazonas Roraima Gráfico 1- Distribuição dos Municípios pelas Unidades Federativas do Brasil. Fonte: Elaborado pelo autor, 2017 ( Atlas Brasil) O Gráfico 1 traz uma análise mais analítica sobre a distribuição dos municípios pelas Unidades Federativas do Brasil

66 Podemos observar que as Unidades Federativas com maior concentração de Municípios são Minas Gerais, com municípios, seguido por São Paulo com municípios e Rio Grande do Sul com Municípios. CAPÍTULO II. ANÁLISE DE CLUSTER E DENDOGRAMA A análise de variância (ANOVA) testa a hipótese de que as médias de duas ou mais populações são iguais. Análises ANOVA testam a importância de um ou mais fatores comparando as médias das variáveis de resposta em diferentes níveis dos fatores. A hipótese nula afirma que todas as médias das populações (médias dos níveis dos fatores) são iguais, enquanto a hipótese alternativa afirma que pelo menos uma é diferente. O objetivo do presente trabalho é através da ANOVA obter as médias por estado de cada uma das quatro variáveis ESPVIDA, MORT1, T_ANALF11A14 e T_ANALF15M para que posteriormente pudéssemos realizar uma análise de cluster das médias por estado a fim de agrupar os munícipios e sintetizar os dados. Neste trabalho faremos o agrupamento dos estados com maior similaridade em clusters.a princípio foi realizada uma classificação não supervisionada com a formação de 7 clusters, posteriormente fizemos uma classificação supervisionada com o propósito de reagrupar os grupos de acordo com as distâncias centroides de cada grupo e chegamos a um novo agrupamento de 4 clusters. Dendograma com 7 clusters - Classificação não supervisionada Análise de Agrupamentos de Observações: ESP VIDA M; MORT 1 M; T_ANALF11á14 M; T_ANALF15M M Distância Euclideana, Ligação Completa Passos de Amalgamação Número de obs. no Número de Nível de Nível de Agrupados Novo novo Passo agrupados similaridade distância reunidos agrupado agrupado ,4715 0, ,8539 0, ,9615 0, ,3665 0, ,5533 0, ,8399 0, ,2765 0, ,1685 0, ,8375 0, ,7920 0, ,9409 0, ,7477 0, ,2976 0, ,1785 0, ,4686 0, ,1159 0, ,9018 0, ,4348 0, ,1887 0, ,9190 0, ,3522 0, ,8182 0, ,0913 0, ,8568 0, ,0000 0,

67 Partição Final Número de agrupados: 7 Dentro da soma de quadrados Distância Distância Número de do média do máxima do observações agrupado centróide centróide Agrupado1 8 0, , , Agrupado2 2 0, , , Agrupado3 2 0, , , Agrupado4 3 0, , , Agrupado5 7 0, , , Agrupado6 1 0, , , Agrupado7 3 0, , , Centróides do grupo Agrupado1 Agrupado2 Agrupado3 Agrupado4 Agrupado5 Agrupado6 Agrupado7 ESP VIDA M 0, , , , , ,5685 0, MORT 1 M 0, , , , , ,7608 0, T_ANALF11á14 M 0, , , , , ,7615 0, T_ANALF15M M 0, , , , , ,5976 0, Centróide global ESP VIDA M 0, MORT 1 M 0, T_ANALF11á14 M 0, T_ANALF15M M 0, Distâncias Entre Centróides do Grupo Agrupado1 Agrupado2 Agrupado3 Agrupado4 Agrupado5 Agrupado6 Agrupado7 Agrupado1 0, , , , , , , Agrupado2 0, , , , , , , Agrupado3 0, , , , , , , Agrupado4 0, , , , , , , Agrupado5 0, , , , , , , Agrupado6 0, , , , , , , Agrupado7 0, , , , , , ,

68 Similaridade Média por estados 0,00 33,33 66,67 100,00 AC CE BA PB SE PE RN AL PI MA AM PA RR AP TO RO Observações ES PR GO RJ MG MT MS SP SC RS Figura 1: Média por estados. Notamos analisando o dendograma que podemos separar o Brasil em 7 grandes grupos de estados com mesma similaridade de média destas variáveis. Os grupos cujos estados são mais similares entre si são Grupo 5, sendo os estados mais similares ES e GO e grupo 7 composto por RS, SC e SP, sendo os estados mais similares RS e SC. Observamos através do relatório o que foi posteriormente confirmado pelo dendograma que o grupo 6, onde contém o estado RR, o grupo 2 com AL e MA e o grupo com AM e PA por conta das distâncias entre os centroides do grupo, podem ser reagrupados em um dos outros grupos já existentes como veremos na próxima etapa. 2.1 Mapa do Brasil com 7 clusters 10

69 CAPÍTULO III. DENDROGRAMA COM 4 CLUSTERS - CLASSIFICAÇÃO SUPERVISIONADA De acordo com a análise da distância dos centroides podemos extinguir 3 clusters que por sua proximidade com outros clusters puderam ser agrupados a estes. A classificação supervisionada foi realizada da seguinte forma: Número de observações Agrupado1 8 Agrupado foi para o grupo 1 Agrupado foi para o grupo 4 Agrupado4 3 Agrupado5 7 Agrupado foi para o grupo 4 Agrupado7 3 Recodificar Sumário Número Valor Valor de Original registrado Linhas Coluna de dados de origem CLUSTER OBS 7 Coluna de dados registrada Recodificado CLUSTER OBS 7 Número de linhas inalteradas: 21 Análise Discriminante: Recodificado CLU versus ESP VIDA M; MORT 1 M;... Método Linear para Resposta: Recodificado CLUSTER OBS 7 Preditores: ESP VIDA M; MORT 1 M; T_ANALF11á14 M; T_ANALF15M M Grupo Contagem Sumário de classificações Alocado no Grupo Verdadeiro Grupo Total de N N correto Proporção 1,000 1,000 1,000 1,000 N = 26 N Correto = 26 Proporção Correta = 1,000 Distância Quadrática Entre Grupos ,000 28,753 93, , ,753 0,000 30,151 71, ,396 30,151 0,000 10, ,945 71,862 10,602 0,000 Função Discriminante Linear para Grupos Constante -118,48-151,50-228,79-275,09 ESP VIDA M 84,26 179,43 415,68 542,74 MORT 1 M 37,14 20,71-81,35-135,34 T_ANALF11á14 M 245,86 195,58 198,35 169,98 T_ANALF15M M -27,56 53,97 71,27 105,78 11

70 Similaridade Média por estados 0,00 33,33 66,67 100,00 AC AM CE BA AL SE PE PB RN MA PI AP RO TO Observações ES RR PA GO MG MS MT SP SC RS RJ PR Figura 2: Média por estados. Neste segundo os dados dos estados foram divididos em quatro grandes grupos, o que é perfeitamente possível de acordo com a similaridade dos dados. Abaixo vemos a distribuição dos estados de acordo com a similaridade. 3.1 Mapa do Brasil com 4 clusters CAPÍTULO IV. ANOVA por região das variáveis ESPVIDA, MORT1, T_ANALF11á14 e T_ANALF15M ANOVA com um fator: ESP VIDA M versus Recodificado CLUSTER OBS 7 Método 12

71 Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores Recodificado CLUSTER OBS 7 4 1; 2; 3; 4 Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado CLUSTER OBS 7 3 0, , ,81 0,000 Erro 22 0, , Total 25 0,58732 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,98% 94,30% 93,22% Médias Recodificado CLUSTER OBS 7 N Média DesvPad IC de 95% 1 8 0, ,01987 (0,37177; 0,42544) 2 3 0,3215 0,0248 ( 0,2777; 0,3654) 3 5 0,5185 0,0390 ( 0,4845; 0,5524) ,6999 0,0464 ( 0,6759; 0,7239) DesvPad Combinado = 0, ANOVA com um fator: MORT 1 M versus Recodificado CLUSTER OBS 7 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores Recodificado CLUSTER OBS 7 4 1; 2; 3; 4 Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado CLUSTER OBS 7 3 0, , ,62 0,000 Erro 22 0, , Total 25 0,58887 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,66% 90,52% 88,13% Médias Recodificado CLUSTER OBS 7 N Média DesvPad IC de 95% 1 8 0,5576 0,0335 (0,5230; 0,5922) 2 3 0,4246 0,0523 (0,3680; 0,4811) 3 5 0,6993 0,0492 (0,6555; 0,7431) ,8294 0,0538 (0,7984; 0,8604) DesvPad Combinado = 0,

72 ANOVA com um fator: T_ANALF11á14 M versus Recodificado CLUSTER OBS 7 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores Recodificado CLUSTER OBS 7 4 1; 2; 3; 4 Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado CLUSTER OBS 7 3 0, , ,93 0,000 Erro 22 0, , Total 25 0,19674 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,05% 70,51% 61,78% Médias Recodificado CLUSTER OBS 7 N Média DesvPad IC de 95% 1 8 0,8060 0,0560 ( 0,7707; 0,8413) 2 3 0,7637 0,0315 ( 0,7060; 0,8214) 3 5 0,8611 0,0809 ( 0,8164; 0,9058) , ,01043 (0,92705; 0,99024) DesvPad Combinado = 0, ANOVA com um fator: T_ANALF15M M versus Recodificado CLUSTER OBS 7 Método Hipótese nula Todas as médias são iguais Hipótese alternativa No mínimo uma média é diferente Nível de significância α = 0,05 Assumiu-se igualdade de variâncias para a análise Informações dos Fatores Fator Níveis Valores Recodificado CLUSTER OBS 7 4 1; 2; 3; 4 Análise de Variância Fonte GL SQ (Aj.) QM (Aj.) Valor F Valor-P Recodificado CLUSTER OBS 7 3 0, , ,66 0,000 Erro 22 0, , Total 25 0,90652 Sumário do Modelo S R2 R2(aj) R2(pred) 0, ,05% 87,56% 84,46% Médias Recodificado CLUSTER OBS 7 N Média DesvPad IC de 95% 1 8 0,4368 0,0714 (0,3875; 0,4860) 14

73 2 3 0,3315 0,0664 (0,2511; 0,4119) 3 5 0,6636 0,0723 (0,6013; 0,7259) ,7892 0,0613 (0,7452; 0,8333) DesvPad Combinado = 0, ESPVIDA MORT1 T_ANALF11A14 T_ANALF15M 1 0, ,5576 0,8060 0, ,3215 0,4246 0,7637 0, ,5185 0,6993 0,8611 0, ,6999 0,8294 0, ,7892 Valor de F 138,81 80,62 20,93 59,66 Fonte: Elaborado pela autora CONSIDERAÇÕES FINAIS Dada a similaridade dos dados entre alguns estados foi possível realizar o agrupamento das vinte e seis unidades federativas do Brasil a princípio em 7 grandes grupos. Posteriormente, analisando o cluster com 7grupos foi possível sintetizar ainda mais os dados dividindo o país em quatro grupos com alto grau de similaridade conforme demonstrado no segundo mapa acima através da classificação supervisionada. Através da formação destes clusters foi possível a sintetização dos dados de municípios em estados e grupos mostrando a grande diferença de realidade nos diferentes estados e regiões do Brasil conforme demonstramos através do mapa acima. Esta análise apenas corroborou a ideia de termos mais de um Brasil já antes mencionadas em trabalhos anteriores. Por último realizamos a ANOVA que possibilita a comparação das variáveis entre os 4 novos grupos criados e como cada variável contribui em cada nova região. REFERÊNCIA ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, ATLAS DO DESENVOLVIMENTO HUMANO NO BRASIL. Disponível em: < Acessado em: 17 mar IBGE, Instituto Brasileiro de Geografia e Estatística. Séries Históricas e Estatísticas. Disponível em: < Acessado em: 30 mar LAS CASAS A., DE HOYOS A. Pesquisa de Marketing 15

74 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada, Utilizando 20 variáveis selecionadas do Atlas Brasil. DISCIPLINA: MÉTODOS QUALITATIVOS E QUANTITATIVOS EM ADMINISTRAÇÃO PROF. ARNOLDO JOSÉ DE HOYOS GUEVARA Fernando Fukunaga 1º SEMESTRE DE 2017 São Paulo SP 2017

75 SUMÁRIO INTRODUÇÃO... 3 CAPÍTULO I. DESENVOLVIMENTO HUMANO: IDHM, VARIÁVEIS E DADOS Conceito de Desenvolvimento Humano Índice de Desenvolvimento Humano Índice de Desenvolvimento Humano Municipal Brasileiro Análise Exploratória de Dados População Variáveis Dados... 7 CAPÍTULO II. ANÁLISE DAS VARIÁVEIS Variáveis Qualitativa ou Categórica : Município : M-IDHM_E-n (dimensão IDHM) : M-IDHM_R-n (dimensão IDHM) : M-ESPVIDA-n (Dimensão Demográfica) : M-SOBRE60-n (Dimensão Demográfica : M-E_ANOSESTUDO-n (Dimensão Educação) : M-FBSUPER-n (Dimensão Educação) : M-RDPC-n (Dimensão Renda) : M-P_SUPER-n (Dimensão educação) CAPÍTULO III. ANÁLISE DE CONGLOMERADOS CAPÍTULO IV. ANÁLISE DESCRIMINANTE Análise Comparativa entre as Regiões do Brasil versus Novos Conglomerados CONSIDERACÕES FINAIS REFERÊNCIA

76 INTRODUÇÃO O Atlas do Desenvolvimento Humano no Brasil, democratiza a informação no âmbito municipal e metropolitano. Seu objetivo é instrumentalizar a sociedade. Fortalece as capacidades locais, o aprimoramento da gestão pública e o empoderamento dos cidadãos. É constituído pelo Atlas do Desenvolvimento Humano nos Municípios e o Atlas do Desenvolvimento Humano nas Regiões Metropolitanas. Local de consulta ao Índice de Desenvolvimento Humano Municipal (IDHM) de munícipios brasileiros, 27 Unidades da Federação (UF), 20 Regiões Metropolitanas (RM) e suas respectivas Unidades de Desenvolvimento Humano (UDH). Além disso, fornece mais de 20 indicadores de demografia, educação, renda, trabalho, habitação e vulnerabilidade. Os dados dos Censos Demográficos, dos anos de 1991, 2000 e 2010 (ATLAS BRASIL, 2017). O Atlas consolida um diálogo informado e embasado sobre o desenvolvimento a partir de uma referência utilizada internacionalmente, o Índice do Desenvolvimento Humano (IDH). Desenvolvimento Humano é o processo de ampliação das liberdades das pessoas, com relação às suas capacidades e as suas oportunidades a seu dispor, para que elas possam escolher a vida que desejam ter. Tanto o conceito como sua medida o IDH, foram apresentados em 1990 no Programa das Nações Unidades para o Desenvolvimento (PNUD). Idealizado pelo o economista paquistanês Mahbub ul Haq e colaboração do economista Amartya Sen (ATLAS BRASIL, 2017). O Atlas permite transparência aos processos de desenvolvimento em importantes temas sociais. Possibilita o acompanhamento dos caminhos trilhados nos últimos 20 anos e análises para traçar o futuro. A audiência principal está organizada em cinco categorias: (1) gestores estaduais e municiais, uma forma de identificar regiões que necessitam de intervenções, políticas e ações especificas; (2) atores municipais, apoio ao diagnóstico aos principais desafios municipais; (3) pesquisadores, nosso caso, estudo das políticas públicas, identificação de programas bem-sucedidos e mapeamento de desafios e oportunidades; (4) sociedade civil e setor privado, orienta a alocação de recursos e definição de público-alvo para as ações de desenvolvimento; e (5) cidadãos, estimulo a participação social. Este trabalho tem como objetivo realizar o procedimento de análise de conglomerados, ou seja, análise comparativas das médias das variáveis do Atlas do Desenvolvimento Humano no Brasil por unidade da federação. Desta forma, comparamos as médias das variáveis de cada estado e análise dos agrupamentos das unidades federativas. Para este trabalho o principal propósito foi realizar a análise discriminante para tentar predizer ou explicar os indicadores relacionados ao desenvolvimento humano que explicam a posição dos estados brasileiros dispostos nos conglomerados. Para todas as etapas do trabalho foi utilizado como suporte ao software estatístico MiniTab (16.1.0). Embora haja diversas soluções de suporte estatístico ao pesquisador, este nos parece ser o que mais simplifica e facilita a produção de sentido e análise das informações. CAPÍTULO I. DESENVOLVIMENTO HUMANO: IDHM, VARIÁVEIS E DADOS. 1.1 Conceito de Desenvolvimento Humano O processo de expansão das liberdades inclui as dinâmicas sociais, econômicas, políticas e ambientais. Dinâmicas necessárias para garantir oportunidades as pessoas. Além do ambiente propício para que cada uma exerça seu potencial. O desenvolvimento humano deve ser centrado nas pessoas e na ampliação do seu bem-estar. Entendido como a ampliação do escopo das escolhas e da capacidade e da liberdade de escolher. Nesta abordagem, a renda e a riqueza não são meios para que as pessoas possam viver a vida que desejam (ATLAS BRASIL, 2017). O crescimento econômico de uma sociedade não se traduz automaticamente em qualidade de vida. Porém, observa-se em muitas vezes, as desigualdades. Este crescimento 3

77 necessita ser transformado em conquistas concretas para as pessoas: crianças mais saudáveis, educação universal e de qualidade, ampliação da participação política dos cidadãos, preservação ambiental, equilíbrio da renda e das oportunidades entre todas as pessoas, maior liberdade de expressão, entre outras. Dessa forma as pessoas estão no centro da análise do bemestar. Redefinindo a maneira como pensamos sobre e lidamos com o desenvolvimento (ATLAS BRASIL, 2017). A popularização da abordagem de desenvolvimento humano se deu com a criação e adoção do IDH como medida do grau de desenvolvimento humano de um país, em alternativa ao Produto Interno Bruto (PIB), hegemônico, à época, como medida de desenvolvimento (ATLAS BRASIL, 2017). 1.2 Índice de Desenvolvimento Humano O IDH reúne três dos requisitos mais importantes para a expansão das liberdades das pessoas: a oportunidade de se levar uma vida longa e saudável (longevidade), de ter acesso ao conhecimento (educação), e de poder desfrutar de um padrão de vida digno (renda), conforme Figura Figura Desenvolvimento Humano: 3 Dimensões Fonte: Atlas Brasil (2017) O IDH obteve grande repercussão mundial devido principalmente à sua simplicidade, fácil compreensão e pela forma mais holística e abrangente de mensurar o desenvolvimento. Transformando em um único número a complexidade de três importantes dimensões. A dimensão da longevidade, diz respeito a ampliação das oportunidades que as pessoas têm de evitar a morte prematura, garantias de ambiente saudável, acesso à saúde de qualidade, para que possam atingir o padrão mais elevado possível de saúde física e mental. A dimensão da educação, diz respeito ao acesso ao conhecimento, é um determinante crítico para o bem-estar e é essencial para o exercício das liberdades individuais, da autonomia e da autoestima. E a dimensão da renda, diz respeito ao padrão de vida. Renda é essencial para acessarmos 4

78 necessidades básicas como água, comida e abrigo. A renda é um meio para uma série de fins, possibilita nossa opção por alternativas disponíveis e sua ausência pode limitar as oportunidades de vida (ATLAS BRASIL, 2017). Em 2012, o PNUD Brasil, o Ipea e a Fundação João Pinheiro assumiram o desafio de adaptar a metodologia do IDH Global para calcular o IDH Municipal (IDHM). Posterior ao IDHM dos municípios brasileiros, as três instituições assumiram o novo desafio de calcular o IDHM a nível intramunicipal das regiões metropolitanas do país (ATLAS BRASIL, 2017). 1.3 Índice de Desenvolvimento Humano Municipal Brasileiro O IDHM brasileiro considera as mesmas três dimensões do IDH Global, mas, adequa a metodologia global ao contexto brasileiro e à disponibilidade de indicadores nacionais. O IDHM (três componentes: IDHM Longevidade; IDHM Educação; e IDHM Renda), conta um pouco da história dos municípios, estados e regiões metropolitanas em três importantes dimensões do desenvolvimento humano durante duas décadas da história brasileira. O IDHM é um número que varia entre 0 e 1. Quanto mais próximo de 1, maior o desenvolvimento humano de uma unidade federativa, município, região metropolitana ou UDH (ATLAS BRASIL, 2017). 1.4 Análise Exploratória de Dados A análise exploratória de dados, emprega certa variedade de técnicas gráficas e quantitativas. Consiste em organizar, resumir e apresentar de dados de uma determinada amostra. Antigamente era apenas conhecida como estatística descritiva até que John Wilder Tukey ( ) publicou o livro Exploratory Data Analisys em 1977, popularizando o termo. A AED utiliza-se de tabelas, gráficos e medidas descritivas como ferramentas, utilizadas na etapa inicial da análise para obter informações que indicam possíveis modelos. Numa fase final estes modelos são utilizados na inferência estatística População População é o conjunto formado pelo total de indivíduos que representam pelo menos uma característica comum, qual interessa inferir (analisar). Sendo o objetivo da generalização estatística, comunicar algo em relação as diversas características da população estudada. No nosso caso, os indivíduos são os municípios brasileiros contidos no Censo Demográfico do IBGE O critério de seleção foi utilizar o banco de dados o Atlas de Desenvolvimento Humano no Brasil que disponibiliza o IDHM e mais de 200 indicadores de demografia, educação, renda, trabalho, habitação e vulnerabilidade. Os dados analisados de cada município são as variáveis tratadas no próximo tópico Variáveis As variáveis são as características estudas de um determinado fenômeno. As variáveis podem ter tipos diferentes: qualitativas (não numéricas ou categóricas) e quantitativas (numérica). As variáveis quantitativas podem ser discretas, assumem apenas valores inteiros (ex.: número de irmãos, número de filhos, etc.); ou contínuas, assumem qualquer valor no intervalo dos números reais (ex.: peso, altura, etc.). As variáveis qualitativas podem ser nominais, quando as categorias não possuem uma ordem natural (ex.: nomes, cores, sexo, etc.); ou ordinais, quando as categorias podem ser ordenadas (ex.: tamanho pequeno, médio, grande; grau de instrução básico, médio, graduação, entre outros). Nosso estudo selecionou de forma aleatória 20 variáveis, incluindo o nome dos municípios. No Quadro , descrevemos e explicamos cada variável, ressaltamos que os dados desta pesquisa se referem ao ano de

79 Quadro Definição das Variáveis VARIÁVEL SIGNIFICADO TIPO UNIDADE DE MEDIDA MUNICÍPIO Nome do Município Qualitativa N/a UF Unidade da Federação N/a IDHM-n Índice de desenvolvimento humano municipal. Média geométrica dos índices das dimensões Renda, Índice Educação e Longevidade, com pesos iguais. IDHM_E-n Índice de Desenvolvimento Humano Municipal - Dimensão Educação. Índice sintético da dimensão Educação que é um dos 3 componentes do IDHM. É obtido através da média geométrica do subíndice de frequência de crianças e jovens à escola, com peso de 2/3, e do subíndice de escolaridade da população adulta, com peso de 1/3. Quantitativo Índice Índice de Desenvolvimento Humano Municipal - Dimensão Longevidade. Índice da dimensão IDHM_L-n Longevidade que é um dos 3 componentes do IDHM. É obtido a partir do indicador Esperança de vida ao nascer, através da fórmula: [(valor observado do Quantitativo Índice indicador) - (valor mínimo)] / [(valor máximo) - (valor mínimo)], onde os valores mínimo e máximo são 25 e 85 anos, respectivamente. IDHM_R-n Índice de Desenvolvimento Humano Municipal - Dimensão Renda. Índice da dimensão Renda que é um dos 3 componentes do IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado do indicador) - ln (valor mínimo)] / Índice [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). ESPVIDA-n Esperança de vida ao nascer. Anos SOBRE60-n Probabilidade de sobrevivência até 60 anos Percentual E_ANOSESTUDO-n Expectativa de anos de estudo Anos T_FBSUPER-n Taxa de frequência bruta ao ensino superior. Percentual GINI-np Índice de Gini. Mede o grau de desigualdade existente na distribuição de indivíduos segundo a renda domiciliar per capita. Seu valor varia de 0, quando não há desigualdade (a renda domiciliar per capita de todos os indivíduos tem o mesmo valor), a 1, quando a desigualdade é máxima (apenas um indivíduo detém toda a renda).o universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. RDPC-n Renda per capita média P_SERV-n P_SUPER-n T_LUZ-n T_LIXO-n T_SLUZ-n T_OCUPDESLOC_1-n Percentual dos ocupados no setor de serviços 18 anos ou mais Percentual dos ocupados com superior completo 18 anos ou mais Percentual da população que vive em domicílios com energia elétrica. Percentual da população que vive em domicílios urbanos com serviço de coleta de lixo. Percentual de pessoas em domicílios sem energia elétrica. Percentual de pessoas em domicílios vulneráveis à pobreza e que gastam mais de uma hora até o trabalho. Índice Absoluto (valor) Percentual Percentual Percentual Percentual Percentual Percentual 6

80 pesorur-n População residente na área rural. Valor pesourb-n População residente na área urbana. Valor Fonte: Atlas Brasil (2017) Dados Os dados são as informações de cada variável que caracterizam os indicadores que constituem a população do estudo. Os dados devem ser analisados e interpretados com auxílio de métodos estatísticos. Os dados podem ser observados na Tabela Tabela Tabela do Dados Descriptive Statistics: IDHM-N; IDHM_E-N; IDHM_L-N; IDHM_R-N; ESPVISA- N; Total Variable Count N N* Mean SE Mean StDev Variance IDHM-N , , , ,02629 IDHM_E-N , , , ,02281 IDHM_L-N , , , ,04051 IDHM_R-N , , , ,02699 ESPVISA-N , , , ,04038 SOBRE60-N , , , ,02139 E_ANOSESTUDO-N , , , ,01673 T_FBSUPER-N , , , ,01875 GINI-NP , , , ,01615 RDPC-NP , , , ,01560 P_SERV-N , , , ,01625 P_SUPER-N , , , ,00939 T_LUZ-N , , , ,00689 T_LIXO-N , , , ,01221 T_SLUZ-NP , , , ,00689 T_OCUPDESLOC_1-NP , , , ,00908 PESORUR-NP , , , ,00281 PESOURB-NP , , , , Variable CoefVar Minimum Q1 Median Q3 Maximum IDHM-N 29,85 0, , , , ,00000 IDHM_E-N 26,51 0, , , , ,00000 IDHM_L-N 34,49 0, , , , ,00000 IDHM_R-N 33,21 0, , , , ,00000 ESPVISA-N 34,42 0, , , , ,00000 SOBRE60-N 25,56 0, , , , ,00000 E_ANOSESTUDO-N 21,44 0, , , , ,00000 T_FBSUPER-N 57,23 0, , , , ,00000 GINI-NP 21,62 0, , , , ,00000 RDPC-NP 15,69 0, , , , ,00000 P_SERV-N 37,10 0, , , , ,00000 P_SUPER-N 53,68 0, , , , ,00000 T_LUZ-N 8,63 0, , , , ,00000 T_LIXO-N 11,75 0, , , , ,00000 T_SLUZ-NP 8,63 0, , , , ,00000 T_OCUPDESLOC_1-NP 10,41 0, , , , ,00000 PESORUR-NP 5,54 0, , , , ,00000 PESOURB-NP 1,81 0, , , , ,00000 Fonte: MiniTab (16.10) CAPÍTULO II. ANÁLISE DAS VARIÁVEIS 2.1 Variáveis qualitativa ou categórica Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo pie chart e/ou barras. 7

81 2.1.1 : Município A amostra totaliza municípios, que pode ser verificada na distribuição no território nacional de acordo com a Unidade Federal no Gráfico Distribuição de Municípios por Macro-Região Norte ; 449; 8% Sul ; 1188; 21% Sudeste ; 1668; 30% Nordeste ; 1794; 32% Norte Nordeste Centro-Oeste Sudeste Sul Centro-Oeste ; 466; 9% Gráfico Distribuição de Municípios por Região Fonte: Elaborado pelo autor (Atlas, 2016) De acordo com o Gráfico 3.1.1, observa-se que as maiores concentrações de municípios brasileiros estão nas regiões Nordeste (32%) e na região Sudeste (30%). Juntas somam mais de 60% dos municípios pesquisados, totalizando 62%. O Gráfico 3.1.2, apresenta a distribuição dos municípios brasileiros pelas Unidades da Federação do Brasil. 8

82 RR; 15; 0% RO; 52; 1% RM; 167; 3% RJ; 92; 2% Distribuição dos Municípios por Unidade da Federação SC; 293; 5% TO; 139; 2% SE; 75; 1% SP; 645; 12% RS; 496; 9% PR; 399; 7% PI; 224; 4% AL; 102; 2% AM; 62; 1% AC; 22; 0% AP; 16; 0% PE; 185; 3% BA; 417; 7% MG; 853; 15% PA; 143; 3% PB; 223; 4% CE; 184; 3% DF; 1; 0% MS; 78; 1% ES; 78; 1% GO; 246; 4% MA; 217; 4% MT; 141; 3% Gráfico Distribuição dos Municípios por Unidade da Federação Fonte: Elaborado pelo Autor (Atlas Brasil, 2016) Podemos observar no Gráfico 3.1.2, a Unidade Federativa mais populosa em números de municípios é Minas Gerais (15%), seguida por São Paulo (12%) e Rio Grande do Sul (9%). As menos populosas em número de municípios são Acre, Amazonas, Amapá, entre outras. A Figura apresenta o IDHM dos municípios brasileiros em 1999, 2000 e Com base nesta representação topográfica, observa-se que os índices mais altos de IDHM, estão concentrados na região centro-sul do Brasil. Nota-se também que a região Norte e Nordeste apresentava em 1999 índices muitos abaixo, nos 2000 e 2010 observa-se a significativa evolução dos índices nas regiões. AC AL AM AP BA CE DF ES GO MA MG MS Figura IDHM do Brasil (1991, 2000, 2010) Fonte: Atlas Brasil (2016) 2.2 quantitativa A análise desse tipo de variável permite a utilização de um número maior de ferramentas de análises como histogramas, curvas de densidades e box-plot, além de informações numéricas como média, desvio-padrão, mediana, intervalo de confiança e teste de normalidade de Anderson-Darling. 9

83 Para este procedimento estatístico foram necessárias a realização de etapas de preparação base de dados. Primeiro, foram selecionadas oito variáveis da relação de dezoito apresentadas no Quadro O pesquisador buscou selecionar variáveis relacionadas à dimensão do conhecimento do Atlas do Desenvolvimento no Brasil: IDHM_E-n ; IDHM_Rn; ESPEVIDA-n ; SOBRE60-n ; E_ANOSESTUDO-n ; FBSUPER-n ; RDPC-n ; e P_SUPER-n. Com isso foi possível produzir o Quadro Quadro Variáveis Selecionas para a Análise de Conglomerados VARIÁVEL SIGNIFICADO TIPO UNIDADE DE MEDIDA MUNICÍPIO Nome do Município Qualitativa N/a UF Unidade da Federação N/a Índice de Desenvolvimento Humano Municipal - Dimensão Educação. Índice sintético da dimensão Educação que é um dos 3 componentes do IDHM. É IDHM_E-n obtido através da média Quantitativo Índice geométrica do subíndice de frequência de crianças e jovens à escola, com peso de 2/3, e do subíndice de escolaridade da população adulta, com peso de 1/3. Índice de Desenvolvimento Humano Municipal - IDHM_R-n Dimensão Renda. Índice da dimensão Renda que é um dos 3 componentes do IDHM. É obtido a partir do indicador Renda per capita, através da fórmula: [ln (valor observado Índice do indicador) - ln (valor mínimo)] / [ln (valor máximo) - ln (valor mínimo)], onde os valores mínimo e máximo são R$ 8,00 e R$ 4.033,00 (a preços de agosto de 2010). ESPVIDA-n Esperança de vida ao nascer. Anos SOBRE60-n Probabilidade de sobrevivência até 60 anos Percentual E_ANOSESTUDO-n Expectativa de anos de estudo Anos T_FBSUPER-n Taxa de frequência bruta ao ensino superior. RDPC-n Renda per capita média P_SUPER-n Percentual dos ocupados com superior completo 18 anos ou mais Percentual Absoluto (valor) Percentual Fonte: Atlas Brasil (2017). Em segundo lugar, realizou-se procedimento de análise de variância para determinar as médias das variáveis por unidade da federação. O resultado nos permitiu produzir a Tabela com os dados das médias das variáveis por estado. Tabela Tabela de Dados: Média das Variáveis por UF 10

84 ESTADOn M- IDHM_En M- IDHM_Rn M- ESPVIDAn M- SOBRE60- n M- E_ANOSESTUDOn M- FBSUPERn M- RDPCn M- P_SUPERn AC 0,3968 0,3777 0,4267 0,6072 0, ,2205 0, ,14973 AL 0,3815 0,3022 0,3049 0,4594 0, ,1356 0, ,09997 AM 0,3721 0,2955 0,4216 0,6072 0, ,1003 0, ,13126 AP 0,5549 0,4458 0,5044 0,7091 0, ,2104 0, ,15008 BA 0,4448 0,3559 0,3951 0,5705 0, ,1308 0, ,09531 CE 0,5584 0,3244 0,4029 0,5842 0, ,1606 0, ,13862 DF 0,8657 0,9430 0,9033 0,7546 0, ,7375 0, ,65117 ES 0,6219 0,5715 0,6924 0,5039 0, ,2678 0, ,20754 GO 0,6296 0,5785 0,6914 0,5646 0, ,2919 0, ,19357 MA 0,4557 0,2682 0,3097 0,4662 0, ,1266 0, ,10999 MG 0,5661 0,5132 0,6840 0,5107 0, ,2234 0, ,19007 MS 0,5670 0,5862 0,6733 0,5333 0, ,3001 0, ,25191 MT 0,5987 0,5746 0,6547 0,5246 0, ,2712 0, ,21209 PA 0,3910 0,3510 0,4621 0,6527 0, ,1143 0, ,09121 PB 0,4376 0,3348 0,3777 0,5499 0, ,1786 0, ,12338 PE 0,4588 0,3551 0,3774 0,5490 0, ,1493 0, ,13000 PI 0,4040 0,2990 0,3500 0,5167 0, ,1956 0, ,14800 PR 0,6538 0,5946 0,6690 0,5579 0, ,3273 0, ,21817 RJ 0,6697 0,6203 0,6491 0,4606 0, ,2887 0, ,25447 RN 0,5008 0,3674 0,4093 0,5904 0, ,1892 0, ,14821 RO 0,5007 0,5258 0,5266 0,7282 0, ,2227 0, ,16210 RR 0,4728 0,3623 0,5685 0,7805 0, ,2712 0, ,16705 RS 0,6371 0,6560 0,7587 0,6459 0, ,3592 0, ,17912 SC 0,6950 0,6681 0,7880 0,6666 0, ,3364 0, ,21962 SE 0,4575 0,3608 0,3782 0,5505 0, ,1585 0, ,13624 SP 0,7594 0,6446 0,7387 0,6110 0, ,3083 0, ,27253 TO 0,5482 0,4287 0,5308 0,7270 0, ,1914 0, ,23006 Fonte: MiniTab (16.1.0) Em terceiro lugar, realizou-se a análise exploratória dos dados para eliminar a possibilidade de ocorrências de dados, conforme Tabela Pode-se observar que não houve a ocorrência de NI e que o número total de estado soma 27. Tabela Análise Exploratória dos Dados Descriptive Statistics: M-IDHM_E-n; M-IDHM_R-n; M-ESPVIDA-n; M- SOBRE60-n;... Total Variable Count N N* Mean SE Mean StDev Variance CoefVar M-IDHM_E-n ,5407 0,0239 0,1240 0, ,93 M-IDHM_R-n ,4706 0,0309 0,1606 0, ,14 M-ESPVIDA-n ,5425 0,0321 0,1667 0, ,73 M-SOBRE60-n ,5919 0,0174 0,0903 0, ,25 M-E_ANOSESTUDO-n ,5652 0,0184 0,0954 0, ,87 M-FBSUPER-n ,2395 0,0239 0,1239 0, ,74 M-RDPC-n ,1977 0,0298 0,1546 0, ,21 M-P_SUPER-n ,1875 0,0203 0,1056 0, ,32 Variable Minimum Q1 Median Q3 Maximum M-IDHM_E-n 0,3721 0,4448 0,5482 0,6296 0,8657 M-IDHM_R-n 0,2682 0,3510 0,4287 0,5862 0,9430 M-ESPVIDA-n 0,3049 0,3951 0,5266 0,6840 0,9033 M-SOBRE60-n 0,4594 0,5246 0,5705 0,6527 0,7805 M-E_ANOSESTUDO-n 0,3665 0,5274 0,5557 0,6284 0,7259 M-FBSUPER-n 0,1003 0,1585 0,2205 0,2919 0,7375 M-RDPC-n 0,0696 0,1039 0,1434 0,2570 0,8313 M-P_SUPER-n 0,0912 0,1313 0,1621 0,2182 0,6512 Fonte: MiniTab (16.1.0) Nos itens a seguir, apresentamos as estatísticas descritivas das médias por variáveis. 11

85 2.2.1 : M-IDHM_E-n (dimensão IDHM) Abaixo, na Figura , podemos analisar o Histograma, Curva de Densidade, Box- Plot, Intervalo de confiança da média e mediana, além das medidas numéricas, como média, desvio-padrão, variância, quantidade de observações, valores mínimos e máximos, e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável M-IDHM_E-n. Summary for M-IDHM_E-n Anderson-Darling Normality Test A-Squared 0,39 P-Value 0,364 Mean 0,54073 StDev 0,12401 Variance 0,01538 Skewness 0, Kurtosis 0, N 27 0,36 0,48 0,60 0,72 0,84 Minimum 0, st Quartile 0,44480 Median 0, rd Quartile 0,62960 Maximum 0, % Confidence Interval for Mean 0, , % Confidence Interval for Median 0, , % Confidence Intervals 95% Confidence Interval for StDev 0, ,16994 Mean Median 0,450 0,475 0,500 0,525 0,550 0,575 0,600 Figura Estatística Descritiva para M-IDHM_E-n Fonte: MiniTab (16.1.0) Algumas observações realizadas a partir dos resultados obtidos: Forma: O histograma nos permite analisar uma distribuição concentrada do M- IDHM_E-n na faixa de 0,445 a 0,630. O Box-Plot demonstra a concentração na faixa estratificada. A mediana está à direita do referido intervalo. Não há ocorrência de outliers. O teste de normalidade de Anderson-Darling indica que os dados seguem uma distribuição normal. Valores Atípicos: O estado com o maior índice apresenta 0,866 de M-IDHM_E-n. Centro e Dispersão: A mediana indica que 50% dos municípios possuem M- IDHM_E-n menor ou igual a 0,548 e os demais 50% possuem M-IDHM_E-n maior ou igual a 0,548. O M-IDHM_E-n médio dos estados é de 0,541, com desvio padrão de 0,124. Com 95% de confiança podemos afirmar que a média se encontra no intervalo dos índices entre 0,492 e 0,590, e a mediana no intervalo de 0,457 e 0, : M-IDHM_R-n (dimensão IDHM) Abaixo, na Figura , podemos analisar o Histograma, Curva de Densidade, Box- Plot, Intervalo de confiança da média e mediana, além das medidas numéricas, como média, desvio-padrão, variância, quantidade de observações, valores mínimos e máximos, e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável M-IDHM_R-n. 12

86 Summary for M-IDHM_R-n Anderson-Darling Normality Test A-Squared 0,96 P-Value 0,013 Mean 0,47056 StDev 0,16064 Variance 0,02581 Skewness 0,97034 Kurtosis 1,04725 N 27 0,3 0,4 0,5 0,6 0,7 0,8 0,9 Minimum 0, st Quartile 0,35100 Median 0, rd Quartile 0,58620 Maximum 0, % Confidence Interval for Mean 0, , % Confidence Interval for Median 0, , % Confidence Intervals 95% Confidence Interval for StDev 0, ,22015 Mean Median 0,35 0,40 0,45 0,50 0,55 0,60 Figura Estatística Descritiva para M-IDHM_R-n Fonte: MiniTab (16.1.0) Algumas observações realizadas a partir dos resultados obtidos: Forma: O histograma nos permite analisar uma distribuição concentrada do M- IDHM_R-n na faixa de 0,351 a 0,586. O Box-Plot demonstra a concentração na faixa estratificada, a mediana está à esquerda do referido intervalo. Os outliers estão à direita do intervalo mencionado. O teste de normalidade de Anderson-Darling indica que os dados seguem uma distribuição normal. Valores Atípicos: O estado com o maior índice apresenta 0,943 de M-IDHM_R-n. Centro e Dispersão: A mediana indica que há uma distribuição proporcional de estados, ou seja, 50% possuem M-IDHM_R-n menor ou igual a 0,429 e o restante maior ou igual a 0,429. O M-IDHM_R-n médio dos estados é de 0,471, com desvio padrão de 0,161. Com 95% de confiança podemos afirmar que a média se encontra no intervalo dos índices entre 0,407 e 0,534, e a mediana no intervalo de 0,126 e 0, : M-ESPVIDA-n (Dimensão Demográfica) Abaixo, na Figura , podemos analisar o Histograma, Curva de Densidade, Box- Plot, Intervalo de confiança da média e mediana, além das medidas numéricas, como média, desvio-padrão, variância, quantidade de observações, valores mínimos e máximos, e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável M-ESPVIDA-n. 13

87 Summary for M-ESPVIDA-n Anderson-Darling Normality Test A-Squared 0,73 P-Value 0,051 Mean 0,54254 StDev 0,16670 Variance 0,02779 Skewness 0,33167 Kurtosis -1,00867 N 27 0,36 0,48 0,60 0,72 0,84 Minimum 0, st Quartile 0,39510 Median 0, rd Quartile 0,68400 Maximum 0, % Confidence Interval for Mean 0, , % Confidence Interval for Median 0, , % Confidence Intervals 95% Confidence Interval for StDev 0, ,22845 Mean Median 0,40 0,45 0,50 0,55 0,60 0,65 0,70 Figura Estatística Descritiva para M-ESPVIDA-n Fonte: MiniTab (16.1.0) Algumas observações realizadas a partir dos resultados obtidos: Forma: O histograma nos permite analisar uma distribuição concentrada do M- ESPVIDA-n na faixa de 0,395 a 0,684. O Box-Plot demonstra a concentração na faixa estratificada, a mediana está à direita do referido intervalo. Não foram identificados outliers. O teste de normalidade de Anderson-Darling indica que os dados seguem uma distribuição normal. Valores Atípicos: O estado com o maior índice apresenta 0,903 de M-ESPVIDA-n. Centro e Dispersão: A mediana indica que 50% dos estados possuem M-ESPVIDAn menor ou igual a 0,527 e os demais 50% maior ou igual a 0,527. O M-ESPVIDAn médio dos estados é de 0,542, com desvio padrão de 0,167. Com 95% de confiança podemos afirmar que a média se encontra no intervalo dos índices entre 0,476 e 0,608, e a mediana no intervalo de 0,409 e 0, : M-SOBRE60-n (Dimensão Demográfica) Abaixo, na Figura , podemos analisar o Histograma, Curva de Densidade, Box- Plot, Intervalo de confiança da média e mediana, além das medidas numéricas, como média, desvio-padrão, variância, quantidade de observações, valores mínimos e máximos, e o teste de normalidade de Anderson-Darling ( A-Squared e P-Value), para a variável M-SOBRE60-n. 14

88 Summary for M-SOBRE60-n Anderson-Darling Normality Test A-Squared 0,47 P-Value 0,233 Mean 0,59194 StDev 0,09028 Variance 0,00815 Skewness 0, Kurtosis -0, N 27 0,5 0,6 0,7 0,8 Minimum 0, st Quartile 0,52460 Median 0, rd Quartile 0,65270 Maximum 0, % Confidence Interval for Mean 0, , % Confidence Interval for Median 0, , % Confidence Intervals 95% Confidence Interval for StDev 0, ,12373 Mean Median 0,54 0,56 0,58 0,60 0,62 Figura Estatística Descritiva para M-SOBRE60-n Fonte: MiniTab ( ) Algumas observações realizadas a partir dos resultados obtidos: Forma: O histograma nos permite analisar uma distribuição concentrada do M- SOBRE60-n na faixa de 0,525 a 0,652. O Box-Plot demonstra a concentração na faixa estratificada, a mediana está à direita do intervalo mencionado. Não foram identificados outliers na análise da variável. O teste de normalidade de Anderson-Darling indica que os dados seguem uma distribuição normal. Valores Atípicos: O estado com o maior índice apresenta 0,780 de M-SOBRE60-n. Centro e Dispersão: A mediana indica que 50% dos estados possuem M-SOBRE60- n menor ou igual a 0,570, e o restante maior igual ao referido índice. O M-SOBRE60- n médio dos estados é de 0,591, com desvio padrão de 0,090. Com 95% de confiança podemos afirmar que a média se encontra no intervalo dos índices entre 0,556 e 0,628, e a mediana no intervalo de 0,548 e 0, : M-E_ANOSESTUDO-n (Dimensão Educação) Abaixo, na Figura , podemos analisar o Histograma, Curva de Densidade, Box- Plot, Intervalo de confiança da média e mediana, além das medidas numéricas, como média, desvio-padrão, variância, quantidade de observações, valores mínimos e máximos, e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável M- E_ANOSESTUDO-n. 15

89 Summary for M-E_ANOSESTUDO-n Anderson-Darling Normality Test A-Squared 0,45 P-Value 0,248 Mean 0,56516 StDev 0,09536 Variance 0,00909 Skewness -0, Kurtosis -0, N 27 0,4 0,5 0,6 0,7 Minimum 0, st Quartile 0,52740 Median 0, rd Quartile 0,62839 Maximum 0, % Confidence Interval for Mean 0, , % Confidence Interval for Median 0, , % Confidence Intervals 95% Confidence Interval for StDev 0, ,13069 Mean Median 0,52 0,54 0,56 0,58 0,60 0,62 Figura Estatística Descritiva para M-E_ANOSESTUDO-n Fonte: MiniTab (16.1.0) Algumas observações realizadas a partir dos resultados obtidos: Forma: O histograma nos permite analisar uma distribuição concentrada do M- E_ANOSESTUDO-n na faixa de 0,527 anos a 0,628. O Box-Plot demonstra a concentração na faixa estratificada, a mediana está à direita do intervalo. Os outliers estão a esquerda. O teste de normalidade de Anderson-Darling indica que os dados seguem uma distribuição normal. Valores Atípicos: O estado com o maior indicador apresenta 0,726 para a variável M- E_ANOSESTUDO-n. Centro e Dispersão: A mediana indica que 50% dos municípios possuem indicador de M-E_ANOSESTUDO-n menor ou igual a 0,556, os 50% restantes possuem indicador maior ou igual a mediana encontrada. M-E_ANOSESTUDO-n média dos estados é de 0,366, com desvio padrão de 0,095. Com 95% de confiança podemos afirmar que a média se encontro no intervalo dos índices de 0,527 e 0,603, e a mediana no intervalo de 0,542 e 0, : M-FBSUPER-n (Dimensão Educação) Abaixo, na Figura , podemos analisar o Histograma, Curva de Densidade, Box- Plot, Intervalo de confiança da média e mediana, além das medidas numéricas, como média, desvio-padrão, variância, quantidade de observações, valores mínimos e máximos, e o teste de normalidade de Anderson-Darling ( A-Squared e P-Value), para a variável M-FBSUPER-n. 16

90 Summary for M-FBSUPER-n Anderson-Darling Normality Test A-Squared 1,30 P-Value < 0,005 Mean 0,23953 StDev 0,12394 Variance 0,01536 Skewness 2,54882 Kurtosis 9,58300 N 27 0,1 0,2 0,3 0,4 0,5 0,6 0,7 Minimum 0, st Quartile 0,15850 Median 0, rd Quartile 0,29190 Maximum 0, % Confidence Interval for Mean 0, , % Confidence Interval for Median 0, , % Confidence Intervals 95% Confidence Interval for StDev 0, ,16985 Mean Median 0,18 0,20 0,22 0,24 0,26 0,28 0,30 Figura Estatística Descritiva para M-FBSUPER-n Fonte: MiniTab (16.1.0) Algumas observações realizadas a partir dos resultados obtidos: Forma: O histograma nos permite analisar uma distribuição concentrada da M- FBSUPER-n na faixa de 0,158 a 0,292. O Box-Plot demonstra a concentração na faixa estratificada, a mediana está a direta do referido intervalo. Os outliers estão à esquerda e também a direita do intervalo supracitado. O teste de normalidade de Anderson- Darling indica que os dados não seguem uma distribuição normal. Valores Atípicos: O estado com a maior índice apresenta 0,737 para a variável M- FBSUPER-n. Centro e Dispersão: A mediana indica que metade dos estados possuem M- FBSUPER-n menor ou igual a 0,220, a outra metade maior ou igual a 0,220. A M- FBSUPER-n média dos estados é de 0,239, com desvio padrão de 0,124. Com 95% de confiança podemos afirmar que a média se encontra no intervalo da entre de 0,190 e 0,288, e a mediana no intervalo entre 0,178 e 0, : M-RDPC-n (Dimensão Renda) Abaixo, na Figura , podemos analisar o Histograma, Curva de Densidade, Box- Plot, Intervalo de confiança da média e mediana, além das medidas numéricas, como média, desvio-padrão, variância, quantidade de observações, valores mínimos e máximos, e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável M-RDPC-n. 17

91 Summary for M-RDPC-n Anderson-Darling Normality Test A-Squared 2,00 P-Value < 0,005 Mean 0,19769 StDev 0,15461 Variance 0,02390 Skewness 2,7938 Kurtosis 10,5132 N 27 0,2 0,4 0,6 0,8 Minimum 0, st Quartile 0,10389 Median 0, rd Quartile 0,25699 Maximum 0, % Confidence Interval for Mean 0, , % Confidence Interval for Median 0, , % Confidence Intervals 95% Confidence Interval for StDev 0, ,21188 Mean Median 0,100 0,125 0,150 0,175 0,200 0,225 0,250 Figura Estatística Descritiva para M-RDPC-n Fonte: MiniTab (16.1.0) Algumas observações realizadas a partir dos resultados obtidos: Forma: O histograma nos permite analisar uma distribuição concentrada da M-RDPCn na faixa de 0,104 a 0,256. O Box-Plot demonstra a concentração na faixa estratificada, a mediana está à direita do referido intervalo. Os outliers estão a direita do intervalo supracitado. O teste de normalidade de Anderson-Darling indica que os dados não seguem uma distribuição normal. Valores Atípicos: O estado com a maior expectativa apresenta 0,831 para a variável M-RDPC-n. Centro e Dispersão: A mediana indica 50% dos estados apresentam M-RDPC-n menor ou igual 0,143, e os demais 50% maior ou igual ao mesmo indicador. A M- RDPC-n média dos estados é de 0,197, com desvio padrão de 0,155. Com 95% de confiança podemos afirmar que a média se encontra no intervalo dos índices de 0,136 e 0,259, e a mediana no intervalo de 0,105 e 0, : M-P_SUPER-n (Dimensão educação) Abaixo, na Figura , podemos analisar o Histograma, Curva de Densidade, Box- Plot, Intervalo de confiança da média e mediana, além das medidas numéricas, como média, desvio-padrão, variância, quantidade de observações, valores mínimos e máximos, e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável M-P_SUPER-n. 18

92 Summary for M-P_SUPER-n Anderson-Darling Normality Test A-Squared 2,32 P-Value < 0,005 Mean 0,18746 StDev 0,10557 Variance 0,01115 Skewness 3,4282 Kurtosis 14,8159 N 27 0,1 0,2 0,3 0,4 0,5 0,6 Minimum 0, st Quartile 0,13126 Median 0, rd Quartile 0,21817 Maximum 0, % Confidence Interval for Mean 0, , % Confidence Interval for Median 0, , % Confidence Intervals 95% Confidence Interval for StDev 0, ,14468 Mean Median 0,14 0,16 0,18 0,20 0,22 0,24 Figura Estatística Descritiva para M-P_SUPER-n Fonte: MiniTab (16.1.0) Algumas observações realizadas a partir dos resultados obtidos: Forma: O histograma nos permite analisar uma distribuição concentrada do M- P_SUPER-n na faixa de 0,131 a 0,218. O Box-Plot demonstra a concentração dentro faixa estratificada, a mediana está à direita do referido intervalo. Não há ocorrência de outliers. O teste de normalidade de Anderson-Darling indica que os dados não seguem uma distribuição normal. Valores Atípicos: O estado com a maior taxa apresenta 0,651 para a variável M- P_SUPER-n. Centro e Dispersão: A mediana indica que metade dos estados possuem índice de M- P_SUPER-n menor ou igual a 0,162, e a outra metade apresenta taxa maior ou igual a 0,162. A M-P_SUPER-n média dos estados é de 0,187, com desvio padrão de 0,105. Com 95% de confiança podemos afirmar que a média se encontra no intervalo de 0,145 a 0,229 e a mediana no intervalo de 0,138 a 0,208. CAPÍTULO III. ANÁLISE DE CONGLOMERADOS Após os procedimentos preparatórios realizados nos itens anteriores, nosso próximo visa atender o objetivo principal deste trabalho. Assim, realizou-se a análise da observação de clusters com apoio do software de suporte estatístico MiniTab. A Tabela 4.1 apresenta os resultados do procedimento, com observação de um cluster, distancia euclidiana e ligação simples. Tabela 4.1 Observação de Cluster para os Estados Cluster Analysis of Observations: M-IDHM_E-n; M-IDHM_R-n; M-ESPVIDA-n;... Euclidean Distance, Single Linkage 19

93 Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,5786 0, ,0984 0, ,1797 0, ,3009 0, ,6907 0, ,4683 0, ,3810 0, ,0436 0, ,0207 0, ,7623 0, ,6419 0, ,3598 0, ,1311 0, ,8881 0, ,8087 0, ,4307 0, ,2757 0, ,2308 0, ,9467 0, ,4191 0, ,7802 0, ,1503 0, ,6072 0, ,9298 0, ,7836 0, ,7590 0, Final Partition Number of clusters: 1 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 27 3, , ,16500 Fonte: MiniTab (16.1.0) Para melhor observar os resultados a Figura 4.1 apresenta graficamente os resultados com a aplicação do dendograma. 20

94 Similarity Similarity DENDOGRAMA - MÉDIA DOS ESTADOS x VARIÁVEIS 44,76 63,17 81,59 100,00 SE PE PB BA MA AL AC PI AP PA AM CE RN TO MT ES RR RO Observations DF SP SC RS RJ MG PR MS GO Figura 4.1 Agrupamento em Relação as Médias dos Estados Fonte: Minitab (16.1.0) Podemos observar que a similaridade em sua maioria é acima de 80%, exceto para o Distrito Federal que abaixo de 45%. Também realizamos a titulo de exploração a análise de cluster das variáveis, conforme podemos observar o dendograma na Figura 4.2. DENDORAMA - VARIAVEIS_mn 68,23 78,82 89,41 100,00 M-IDHM_E-n M-IDHM_R-n M-ESPVIDA-n M-FBSUPER-n M-RDPC-n M-P_SUPER-n M-E_A NOSESTUDO-n M-SOBRE60-n Variables Figura 4.2 Análise de Cluster das Variáveis Fonte: MiniTab (16.1.0) 21

95 As variáveis apresentam certa similaridade, podemos inclusive destacar as variáveis M-FBSUPER-n e M-RDPC-n de 98%. Por outro lado, a variável M-SOBRE60-n ficou isolada abaixo de 70% de similaridade. Como é sabido há diversos métodos de mensuração de distância e de ligação, afim de aprofundamos nossa análise, realizamos quatro procedimentos com métodos diferentes de mensuração de distância e de ligação. Assim foi possível analisar as diferenças nos resultados para método escolhido. A Tabela 4.2 demonstra os diferentes resultados, considerando a observação de sete clusters para cada método escolhido, em relação aos estados. Tabela 4.2 Comparação de Métodos de Mensuração de Distância e Ligação ESTADO-n CLUSTER-SE CLUSTER-MM CLUSTER-CSP CLUSTER-CM AC AL AM AP BA CE DF ES GO MA MG MS MT PA PB PE PI PR RJ RN RO RR RS SC SE SP TO Fonte: Elaborado pelo autor (2017) Na coluna um da Tabela 4.2 estão descritos os estados, a coluna dois demonstra qual grupo pertence cada estado, considerando o método de mensuração euclidiano e de ligação simples. A coluna três demonstra qual grupo pertence cada estado em relação ao método de mensuração mediano e de ligação manhattan. A coluna quatro demonstra qual grupo pertence cada estado apartir do método de mensuração completo e de ligação Pearson quadrado. Finalmente a coluna cinco apresenta qual estado pertence a qual grupo, considerando o método de mensuração completo e de ligação manhattan. É possível observar que cada método gerou um resultado diferente para os mesmos estados e base de dados, interessante notar que no caso do Acre, todos os grupos foram os mesmos, ou seja, grupo um, assim como o estado de Minas Gerais no grupo cinco. O estado de São Paulo, apresentou os mesmos grupos para os métodos euclidiano e simples; e mediano e 22

96 Similarity Similarity Similarity Similarity manhattan, ou seja, grupo sete, já para os métodos completo e Pearson quadrado; e centroide e euclidiano quadrado o estado se manteve no grupo seis. Assim, observa-que os diferentes métodos produzem resultados diferentes, principalmente no que se refere ao grau de similaridade. A Figura 4.3 apresenta um comparativo dos dendogramas para cada um dos métodos de mensuração de distância e de ligação. Veja por exemplo, os estados Pernambuco e Sergipe, no método euclidiano e simples ele está no grupo verde com grau de similaridade de 98.58%, enquanto que no método mediano e manhattan os mesmos estados pertencem ao grupo vermelho com similaridade de 98,93%. No método completo e pearson quadrado, os estados pertencem ao grupo verde, que é diferente do citado acima, com grau de similaridade de 99,96%. Para o método euclidiano quadrado e centroide, os estados pertencem ao grupo verde com similaridade de 99,97%. DENDOGRAMA (SINGLE/EUCL) - MÉDIA DOS ESTADOS DENDOGRAMA (MEDIAN/MANHA) - MÉDIA DOS ESTADOS 44,76 34,81 63,17 56,54 81,59 100,00 AL AC MA BA PB PE SE PI RN CE AM PA AP TO RO RR ES MT Observations PR MS GO DF SP SC RS RJ MG DENDOGRAMA (COMPLETE/SQPEARSON) - MÉDIA DOS ESTADOS 78,27 100,00 AL PA AM AC RR RN CE SE PE PB BA PI MA AP TO GO MT ES MG RO Observations DF SP SC RS RJ PR MS DENDOGRAMA (CENTROID/SQEUCL) - MÉDIA DOS ESTADOS 0,00 0,00 33,33 33,33 66,67 100,00 AL PA AM AC AP RN CE PI SE PE PB BA MA Observations RO TO RR ES MT MG GO MS RJ PR SP RS SC DF 66,67 100,00 AL PA AM AC AP RN CE SE PE PB BA PI MA TO RO RR ES MT Observations GO MS PR RJ MG RS SC SP DF Figura 4.3 Comparação de Dendogramas em Relação ao Método de Mensuração e Ligação Fonte: MiniTab (16.1.0) Afim de prosseguirmos com nosso estudo, escolhemos o método de mensuração de distância completo e de ligação Manhattan. A Tabela 4.3 apresenta os resultados do procedimento de análise de observação de clusters com partição final especificada com sete clusters. Tabela 4.3 Análise de Observação de Clusters com Método de Mensuração Completo e Manhattan Cluster Analysis of Observations: M-IDHM_E-n; M-IDHM_R-n; M-ESPVIDA-n;... Manhattan Distance, Complete Linkage Amalgamation Steps Number 23

97 of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,9329 0, ,0765 0, ,8838 0, ,8462 0, ,9891 0, ,7991 0, ,7036 0, ,5091 0, ,1151 0, ,5978 0, ,4237 0, ,9700 0, ,9145 0, ,3274 0, ,6223 0, ,4871 0, ,1070 0, ,9868 0, ,3662 0, ,1416 0, ,6649 0, ,1287 0, ,9789 0, ,6936 1, ,5033 2, ,0000 4, Final Partition Number of clusters: 7 Maximum Within Average distance Number of cluster sum distance from from observations of squares centroid centroid Cluster1 3 0, , , Cluster2 9 0, , , Cluster3 3 0, , , Cluster4 1 0, , , Cluster5 7 0, , , Cluster6 1 0, , , Cluster7 3 0, , , Cluster Centroids Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 M-IDHM_E-n 0, , , , , ,47280 M-IDHM_R-n 0, , , , , ,36230 M-ESPVIDA-n 0, , , , , ,56850 M-SOBRE60-n 0, , , , , ,78050 M-E_ANOSESTUDO-n 0, , , , , ,39576 M-FBSUPER-n 0, , , , , ,27120 M-RDPC-n 0, , , , , ,11713 M-P_SUPER-n 0, , , , , ,16705 Grand Variable Cluster7 centroid M-IDHM_E-n 0, , M-IDHM_R-n 0, , M-ESPVIDA-n 0, , M-SOBRE60-n 0, ,

98 Similarity M-E_ANOSESTUDO-n 0, , M-FBSUPER-n 0, , M-RDPC-n 0, , M-P_SUPER-n 0, , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0, , , , , , , Cluster2 0, , , , , , , Cluster3 0, , , , , , , Cluster4 1, , , , , , , Cluster5 0, , , , , , , Cluster6 0, , , , , , , Cluster7 0, , , , , , , Fonte: Minitab (16.1.0) A Figura 4.4 apresenta o dendograma para os mesmos métodos de mensuração selecionado. DENDOGRAMA (COMPLETO/MANHATTAN) - MÉDIA DOS ESTADOS 0,00 33,33 66,67 100,00 AL PA AM AC MA AP RN CE SE PE PB BA PI TO MT ES RR RO Observations GO MS PR RJ MG RS SC SP DF Figura 4.4 Dendograma com Método de Mensuração Completo e Manhattan Fonte: MiniTab (16.1.0) Observa-se que há pelo menos três grupos distintos, com sete observações com grau de similaridade de 81,59%. Para aprofundamos nossa análise, na Figura 4.5, o mapa do Brasil, com os estados com a cor dos grupos que eles pertencem. Note que Roraima e o Distrito Federal estão isolados no mapa com as cores demonstrando o agrupamento dos demais estados. Embora o estado do Acre também apareça no grupo vermelho no dendograma, note que trata-se da mesma cor (vermelho) que o agrupamento dos estados do Rio Grande do Sul, Santa Catarina e São Paulo. O agrupamento verde, que se refere aos estados do Maranhão, Piauí, Ceará, Rio Grande do Norte, Paraíba, Pernambuco, Alagoas, Sergipe e Bahia, de alguma forma estão ligados pelas fronteiras geográficas, o que não ocorre com o agrupamento azul com os estados Rondônia, Amapá e Tocantins que nem se quer são próximos geograficamente. 25

99 O mesmo ocorre com o agrupamento vermelho, qual o estado do Acre distante geograficamente dos estados de São Paulo, que não faz fronteira com Santa Catarina e Rio Grande do Sul, mas há certa proximidade geográfica, já os estados de Santa Catarina e Rio Grande de Sul possuem fronteira entre os dois estados. Figura 4.5 A Nova Cor do Brasil: Análise de Conglomerados Fonte: Elaborado pelo Autor (Escolinha do Tio Lu, 2017) Após análise, consideramos a possiblidade da mudança dos resultados se não considerássemos o outlier, no caso Distrito Federal. Assim, para realizamos o procedimento, excluímos da análise o Distrito Federal. Observar-se na Tabela 4.4 a não ocorrência de NI ou erros na base de dados. Tabela 4.4 Análise Exploratória dos Dados S/DF Descriptive Statistics: M-IDHM_E-n; M-IDHM_R-n; M-ESPVIDA-n; M- SOBRE60-n;... Total Variable Count N N* Mean SE Mean StDev Variance CoefVar M-IDHM_E-n ,5282 0,0211 0,1077 0, ,39 M-IDHM_R-n ,4524 0,0260 0,1325 0, ,30 M-ESPVIDA-n ,5287 0,0301 0,1533 0, ,99 M-SOBRE60-n ,5857 0,0168 0,0859 0, ,67 M-E_ANOSESTUDO-n ,5618 0,0188 0,0957 0, ,02 M-FBSUPER-n ,2204 0,0148 0,0753 0, ,18 M-RDPC-n ,1733 0,0177 0,0905 0, ,21 M-P_SUPER-n ,1696 0,0101 0,0516 0, ,40 Fonte: MiniTab (16.1.0) Seguindo o procedimento foi realizado a análise de observação de clusters, excluindose então o Distrito Federal. Podemos observar o resultado na Tabela 4.5 e na Figura 4.6. Para tanto utilizou a mesma especificação da análise com o outlier, ou seja, o método de mensuração 26

100 de distância foi o euclidiano e de ligação foi o simples, com partição final especificada com sete clusters. Tabela 4.5 Análise de Observação de Clusters S/DF Cluster Analysis of Observations: M-IDHM_E-n; M-IDHM_R-n; M-ESPVIDA-n;... Manhattan Distance, Complete Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,9673 0, ,4311 0, ,0641 0, ,0875 0, ,4548 0, ,0930 0, ,9109 0, ,5406 0, ,7900 0, ,8046 0, ,5680 0, ,7038 0, ,5981 0, ,4797 0, ,1366 0, ,8790 0, ,1549 0, ,0212 0, ,1244 0, ,6965 0, ,7884 0, ,0524 0, ,2426 0, ,0796 1, ,0000 2, Final Partition Number of clusters: 7 Maximum Within Average distance Number of cluster sum distance from from observations of squares centroid centroid Cluster1 3 0, , , Cluster2 3 0, , , Cluster3 3 0, , , Cluster4 6 0, , , Cluster5 7 0, , , Cluster6 1 0, , , Cluster7 3 0, , , Cluster Centroids Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 M-IDHM_E-n 0, , , , , ,

101 Similarity M-IDHM_R-n 0, , , , , ,36230 M-ESPVIDA-n 0, , , , , ,56850 M-SOBRE60-n 0, , , , , ,78050 M-E_ANOSESTUDO-n 0, , , , , ,39576 M-FBSUPER-n 0, , , , , ,27120 M-RDPC-n 0, , , , , ,11713 M-P_SUPER-n 0, , , , , ,16705 Grand Variable Cluster7 centroid M-IDHM_E-n 0, , M-IDHM_R-n 0, , M-ESPVIDA-n 0, , M-SOBRE60-n 0, , M-E_ANOSESTUDO-n 0, , M-FBSUPER-n 0, , M-RDPC-n 0, , M-P_SUPER-n 0, , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster6 Cluster7 Cluster1 0, , , , , , , Cluster2 0, , , , , , , Cluster3 0, , , , , , , Cluster4 0, , , , , , , Cluster5 0, , , , , , , Cluster6 0, , , , , , , Cluster7 0, , , , , , , Fonte: MiniTab (16.1.0) DENDOGRAMA (COMPLETE/MANHATAN) - MÉDIA DOS ESTADOS (S/DF) 0,00 33,33 66,67 100,00 AL PA AM AC RN CE SE PE PB BA PI MA AP TO MT ES RR RO Observations Figura 4.6 Dendograma com Método de Mensuração Euclidiano e Simples (S/DF) Fonte: MiniTab (16.1.0) SP SC RS MG RJ PR MS GO Observa-se que houve certa mudança no resultado do procedimento de análise de observação de cluster com a exclusão do outlier. Ocorreu um novo agrupamento e o grau de similaridade se afastou do máximo, como por exemplo o grupo formado por Pernambuco e 28

102 Similarity Similarity Sergipe que antes possuíam 98,93% de grau de similaridade, e reduzindo para 97,33. Uma análise comparativa em relação a qual grupo cada estado pertence, produzida na Tabela 4.6, pode nos ajudar a melhorar nossa análise. Tabela 4.6 Comparação da Análise de Observação de Cluster com e sem DF ESTADO-n CLUSTER-CM CLUSTER_SDF-CM AC 1 1 AL 2 2 AM 1 1 AP 3 3 BA 2 4 CE 2 4 ES 4 5 GO 5 5 MA 5 2 MG 2 5 MS 5 5 MT 5 5 PA 5 1 PB 1 4 PE 2 4 PI 2 2 PR 2 5 RJ 5 5 RN 5 4 RO 2 3 RR 6 6 RS 7 7 SC 7 7 SE 2 4 SP 7 7 TO 3 3 Fonte: Elaborado pelo Autor (2017) Podemos observar na Tabela 4.6, nas linhas destacadas em vermelho a ocorrência da mudança do agrupamento do estado. Vejamos agora, na Figura 4.7, a comparação entre os dendogramas das duas análises. DENDOGRAMA (COMPLETO/MANHATTAN) - MÉDIA DOS ESTADOS DENDOGRAMA (COMPLETE/MANHATAN) - MÉDIA DOS ESTADOS (S/DF) 0,00 0,00 33,33 33,33 66,67 100,00 AL PA AM AC AP RN CE SE PE PB BA PI MA TO RO RR ES MT Observations GO MS PR RJ MG RS SC SP DF 66,67 100,00 AL PA AM AC RN CE SE PE PB BA PI MA Figura 4.7 Comparação de Dendogramas com DF e sem DF Fonte: MiniTab (16.1.0) AP TO SP SC RS MG RJ PR MS GO MT ES RR RO Observations É possível observar graficamente uma mudança significativa na composição os agrupamentos e o grau de similaridade. Se traçarmos uma linha de 80% do grau similaridade, 29

103 é possível verificar a possibilidade de novas e mais combinações de agrupamento no procedimento em que excluímos o Distrito Federal. Com isso, podemos observar na Figura 4.8, um novo mapa do Brasil. Figura 4.8 A Nova Cor do Brasil (S/DF): Análise de Conglomerados Fonte: Elaborado pelo Autor (Escolinha do Tio Lu, 2017) Afim de facilitar e melhorar nossa análise, foi produzido a Figura 4.9, qual compara os dois mapas do País, sob a perspectiva da análise de conglomerados. Figura 4.9 Comparação: A Nova cor do Brasil (com e sem DF) Fonte: MiniTab (16.1.0) Observa-se que no caso do estado do Acre, Amazonas e Para não houve. Os estados de Rondônia, Amapá e Tocantins, também permaneceram no mesmo agrupamento, na cor azul. 30

104 Os estados do Ceará, Rio Grande do Norte, Paraíba, Pernambuco, Sergipe e Bahia formaram um novo grupo na cor laranja, diminuindo o agrupamento verde. CAPÍTULO IV. ANÁLISE DESCRIMINANTE A variável dependente para a análise discriminante será o conglomerado e para tentar explicar qual conglomerado cada estado está, utilizamos as oito variáveis, com os valores médios para cada estado, de indicadores relacionados do desenvolvimento humano dos estados. Considerando o resultado da análise de observação de clusters, no qual em primeiro lugar verificou-se a necessidade da exclusão do Distrito Federal, também se verificou a necessidade de incluir outro outlier em um cluster mais próximo considerando a distância do seu centro, pois neste caso a quantidade de dados é significativa e não fazia sentido exclui-lo, assim como diminuição do número de cluster de sete para três. A Tabela 5.1 demonstra o resultado. Tabela 5.1 Ajuste de Clusters por Proximidade de Centros e Rotulação Estado Clusters Cluster Cluster Novos Rótulo S/Ajuste Ajustado Renomeado Clusters AC Região 1 AL Região 1 AM Região 1 AP Região 2 BA Região 1 CE Região 1 ES Região 3 GO Região 3 MA Região 1 MG Região 3 MS Região 3 MT Região 3 PA Região 1 PB Região 1 PE Região 1 PI Região 1 PR Região 3 RJ Região 3 RN Região 1 RO Região 2 RR Região 2 RS Região 3 SC Região 3 SE Região 1 SP Região 3 TO Região 2 Fonte: Elaborado pelo Autor (2017) Como podemos observar na Tabela 5.1, os cluster foram ajustados e rotulados para favorecer a análise. Primeiro foi realizado com a ajuda do software estatístico, baseado na distância dos centros entre os cluster, a inclusão do cluster 6 no cluster 3; a inclusão do cluster 1 no cluster 4; a inclusão do cluster 2 também no cluster 4; e finalmente a inclusão do cluster 7 no cluster 5. Segundo foi realizado, com ajuda do software estatístico o mesmo procedimento, mas desta vez com objetivo de renomear para favorecer a ordem, no qual o cluster 3 foi renomeado como cluster 1; o cluster 4 foi renomeado como cluster 2; e o cluster 5 foi renomeado como cluster 3. Terceiro, realizou-se o procedimento ANOVA que reorganizou os 31

105 conglomerados. Finalmente, com suporte do software estatístico rotulamos os cluster em Região 1, Região 2 e Região 3. Após a reorganização dos agrupamentos, conforme supracitado, realizou um novo procedimento ANOVA que pode ser observado na Tabela 5.2. Para este procedimento como método de mensuração de distância e de ligação optou-se por Manhattan e Completo respectivamente. Tabela 5.2 Análise de Observação de Cluster com Partição Final de 3 Cluster Cluster Analysis of Observations: M-IDHM_E-n; M-IDHM_R-n; M-ESPVIDA-n;... Manhattan Distance, Complete Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster ,9673 0, ,4311 0, ,0641 0, ,0875 0, ,4548 0, ,0930 0, ,9109 0, ,5406 0, ,7900 0, ,8046 0, ,5680 0, ,7038 0, ,5981 0, ,4797 0, ,1366 0, ,8790 0, ,1549 0, ,0212 0, ,1244 0, ,6965 0, ,7884 0, ,0524 0, ,2426 0, ,0796 1, ,0000 2, Final Partition Number of clusters: 3 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 12 0, , , Cluster2 4 0, , , Cluster3 10 0, , , Cluster Centroids Grand Variable Cluster1 Cluster2 Cluster3 centroid M-IDHM_E-n 0, , , ,

106 M-IDHM_R-n 0, , , , M-ESPVIDA-n 0, , , , M-SOBRE60-n 0, , , , M-E_ANOSESTUDO-n 0, , , , M-FBSUPER-n 0, , , , M-RDPC-n 0, , , , M-P_SUPER-n 0, , , , Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster1 0, , , Cluster2 0, , , Cluster3 0, , , Fonte: MiniTab (16.1.0) Seguindo então para a análise discriminante que pode ser observada na Tabela 5.3. Podemos observar nas linhas destacadas em vermelho que cada grupo possui um número determinado de estados, e que há 100% de acerto na análise. Assim, percebemos que há uma maior similaridade entre os agrupamentos permitindo a produção de categorias mais homogêneas. Tabela 5.3 Análise Discriminante dos Conglomerado Discriminant Analysis: C43 versus M-IDHM_E-n; M-IDHM_R-n;... Linear Method for Response: C43 Predictors: M-IDHM_E-n; M-IDHM_R-n; M-ESPVIDA-n; M-SOBRE60-n; M-E_ANOSESTUDO-n; M-FBSUPER-n; M-RDPC-n; M-P_SUPER-n Group Count Summary of classification True Group Put into Group Total N N correct Proportion 1,000 1,000 1,000 N = 26 N Correct = 26 Proportion Correct = 1,000 Squared Distance Between Groups ,000 20, , ,987 0, , , ,322 0,000 Linear Discriminant Function for Groups Constant -206,7-291,7-656,8 M-IDHM_E-n 134,7 147,6-10,5 33

107 Similarity M-IDHM_R-n 1003,2 1160,3 1198,7 M-ESPVIDA-n 35,9 160,8 2579,0 M-SOBRE60-n 217,6 181,9-1688,1 M-E_ANOSESTUDO-n 37,1 35,0 248,6 M-FBSUPER-n 87,4 124,8 410,6 M-RDPC-n -1640,0-1876,6-1958,2 M-P_SUPER-n 61,5 110,3-16,1 Fonte: MiniTab (16.1.0) Assim com o objetivo de melhorar nossa capacidade de análise produziu-se o dendograma, apresentada na Figura 5.1. DENDOGRAMA-AJUST (COMPLETO/MANHATTAN) - ESTADOS-SDF 0,00 33,33 66,67 100,00 AM AC PA MA AL PI PB BA SE PE RN CE AP TO Observations RO RR ES GO MT PR MS MG RJ RS SP SC Figura 5.1 Dendograma Agrupamento Ajustado Fonte: MiniTab (16.1.0) Podemos agora perceber três grupos distintos de estados, permitindo aprofundar nossa análise a partir de grupos com estados mais homogêneos facilitando assim a análise. Com isso foi possível produzir um novo mapa considerando o resultado, a Figura 5.2 demonstra o resultado. 34

108 Figura 5.2 A Cor da Educação no Brasil Fonte: Elaborado pelo Autor (2017) 4.1 Análise Comparativa entre as Regiões do Brasil versus Novos Conglomerados Para realizar a análise comparativa entre as regiões tradicionais do Brasil, ou seja, Norte, Nordeste, Centro-oeste, Sudeste e Sul, e os novos conglomerados criados com o procedimento de análise de observação de cluster e análise discriminante, realizou o procedimento de análise de variância que teste a hipótese de que as médias de duas ou mais populações são iguais. A Tabela demonstra o resultado. Tabela Análise de Variância One-way ANOVA: M-IDHM_E-n versus REGIÃO-M Source DF SS MS F P REGIÃO-M 4 0, , ,76 0,000 Error 21 0, ,00381 Total 25 0,29015 S = 0,06177 R-Sq = 72,39% R-Sq(adj) = 67,13% One-way ANOVA: M-IDHM_E-n versus CLUSTER_SDF_AJ4-CM Source DF SS MS F P CLUSTER_SDF_AJ4-CM 2 0, , ,49 0,000 Error 23 0, ,00296 Total 25 0,29015 S = 0,05442 R-Sq = 76,52% R-Sq(adj) = 74,48% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CENTRO-OESTE 3 0, ,03130 ( *------) NORDESTE 9 0, ,05150 (----*---) NORTE 7 0, ,07643 (----*----) SUDESTE 4 0, ,08188 (-----*------) SUL 3 0, ,02980 (------* ) ,50 0,60 0,70 0,80 Pooled StDev = 0,06177 One-way ANOVA: M-IDHM_R-n versus REGIÃO-M Source DF SS MS F P REGIÃO-M 4 0, , ,55 0,000 Error 21 0, ,00269 Total 25 0,43917 S = 0,05187 R-Sq = 87,13% R-Sq(adj) = 84,68% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev REGIÃO , ,05411 (----*---) REGIÃO 2 4 0, ,03920 ( * ) REGIÃO , ,05897 (----*---- ) ,420 0,490 0,560 0,630 Pooled StDev = 0,05442 One-way ANOVA: M-IDHM_R-n versus CLUSTER_SDF_AJ4-CM Source DF SS MS F P CLUSTER_SDF_AJ4-CM 2 0, , ,16 0,000 Error 23 0, ,00202 Total 25 0,43917 S = 0,04495 R-Sq = 89,42% R-Sq(adj) = 88,50% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CENTRO-OESTE 3 0, ,00590 (----*-----) NORDESTE 9 0, ,03401 (--*--) NORTE 7 0, ,07524 (--*---) SUDESTE 4 0, ,05806 (----*---) SUL 3 0, ,03941 (----*----) Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev REGIÃO , ,03448 (-*--) REGIÃO 2 4 0, ,06723 (----*----) REGIÃO , ,04695 (--*--)

109 +--- 0, ,36 0,48 0,60 0,70 Pooled StDev = 0, ,40 0,50 0,60 Pooled StDev = 0,05187 One-way ANOVA: M-ESPVIDA-n versus REGIÃO-M Source DF SS MS F P REGIÃO-M 4 0, , ,61 0,000 Error 21 0, ,00204 Total 25 0,58734 S = 0,04520 R-Sq = 92,69% R-Sq(adj) = 91,30% One-way ANOVA: M-ESPVIDA-n versus CLUSTER_SDF_AJ4-CM Source DF SS MS F P CLUSTER_SDF_AJ4-CM 2 0, , ,54 0,000 Error 23 0, ,00196 Total 25 0,58734 S = 0,04424 R-Sq = 92,34% R-Sq(adj) = 91,67% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CENTRO-OESTE 3 0, ,01835 (---*----) NORDESTE 9 0, ,03815 (--*-) NORTE 7 0, ,05601 (--*--) SUDESTE 4 0, ,03689 (---*---) SUL 3 0, ,06200 (----*- --) ,36 0,48 0,60 0,72 Pooled StDev = 0,04520 One-way ANOVA: M-SOBRE60-n versus REGIÃO-M Source DF SS MS F P REGIÃO-M 4 0, , ,82 0,000 Error 21 0, ,00306 Total 25 0,18445 S = 0,05532 R-Sq = 65,15% R-Sq(adj) = 58,52% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev REGIÃO , ,04622 (-*--) REGIÃO 2 4 0, ,02660 (---*----) REGIÃO , ,04642 (--*--) ,40 0,50 0,60 0,70 Pooled StDev = 0,04424 One-way ANOVA: M-SOBRE60-n versus CLUSTER_SDF_AJ4-CM Source DF SS MS F P CLUSTER_SDF_AJ4-CM 2 0, , ,92 0,000 Error 23 0, ,00336 Total 25 0,18445 S = 0,05799 R-Sq = 58,06% R-Sq(adj) = 54,42% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CENTRO-OESTE 3 0, ,02104 ( * ) NORDESTE 9 0, ,04762 (-----*----) NORTE 7 0, ,06638 (-----*--- --) SUDESTE 4 0, ,06363 ( * ) SUL 3 0, ,05772 ( * ) ,490 0,560 0,630 0,700 Pooled StDev = 0,05532 One-way ANOVA: M-E_ANOSESTUDO-n versus REGIÃO-M Source DF SS MS F P REGIÃO-M 4 0, , ,63 0,001 Error 21 0, ,00481 Total 25 0,22873 S = 0,06937 R-Sq = 55,82% R-Sq(adj) = 47,41% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev REGIÃO , ,05701 (----*----) REGIÃO 2 4 0, ,03080 ( * ) REGIÃO , ,06562 (-----*----) ,560 0,630 0,700 0,770 Pooled StDev = 0,05799 One-way ANOVA: M-E_ANOSESTUDO-n versus CLUSTER_SDF_AJ4-CM Source DF SS MS F P CLUSTER_SDF_AJ4-CM 2 0, , ,86 0,005 Error 23 0, ,00623 Total 25 0,22873 S = 0,07893 R-Sq = 37,35% R-Sq(adj) = 31,91% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CENTRO-OESTE 3 0, ,05409 ( * ) NORDESTE 9 0, ,04103 (----*----) NORTE 7 0, ,09989 (-----*----) SUDESTE 4 0, ,08433 (------*------) SUL 3 0, ,01634 ( * ) ,50 0,60 0,70 0,80 Pooled StDev = 0,06937 One-way ANOVA: M-FBSUPER-n versus REGIÃO-M Source DF SS MS F P REGIÃO-M 4 0, , ,41 0,000 Error 21 0, ,00157 Total 25 0,14187 S = 0,03956 R-Sq = 76,83% R-Sq(adj) = 72,42% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev REGIÃO , ,07690 ( * ) REGIÃO 2 4 0, ,09522 ( * ) REGIÃO , ,07531 ( * ) ,480 0,540 0,600 0,660 Pooled StDev = 0,07893 One-way ANOVA: M-FBSUPER-n versus CLUSTER_SDF_AJ4-CM Source DF SS MS F P CLUSTER_SDF_AJ4-CM 2 0, , ,89 0,000 Error 23 0, ,00135 Total 25 0,14187 S = 0,03680 R-Sq = 78,05% R-Sq(adj) = 76,14% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CENTRO-OESTE 3 0, ,01489 (------*------) NORDESTE 9 0, ,02530 (---*---) NORTE 7 0, ,06163 (---*----) SUDESTE 4 0, ,03641 (-----*-----) SUL 3 0, ,01643 (------*---- -) ,140 0,210 0,280 0,350 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev REGIÃO , ,03588 (---*---) REGIÃO 2 4 0, ,03405 ( *------) REGIÃO , ,03874 (---*----) ,150 0,200 0,250 0,300 Pooled StDev = 0,03680 Pooled StDev = 0,03956 One-way ANOVA: M-RDPC-n versus REGIÃO-M Source DF SS MS F P REGIÃO-M 4 0, , ,85 0,000 Error 21 0, ,00109 Total 25 0,20469 S = 0,03296 R-Sq = 88,85% R-Sq(adj) = 86,73% One-way ANOVA: M-RDPC-n versus CLUSTER_SDF_AJ4-CM Source DF SS MS F P CLUSTER_SDF_AJ4-CM 2 0, , ,47 0,000 Error 23 0, ,00107 Total 25 0,20469 S = 0,03266 R-Sq = 88,02% R-Sq(adj) = 86,98% Individual 95% CIs For Mean Based on Pooled StDev Individual 95% CIs For Mean Based on Pooled StDev 36

110 M-IDHM_R-n M-IDHM_R-n M-IDHM_E-n M-IDHM_E-n Level N Mean StDev CENTRO-OESTE 3 0, ,00464 (---*----) NORDESTE 9 0, ,01411 (--*-) NORTE 7 0, ,04018 (--*---) SUDESTE 4 0, ,05079 (---*---) SUL 3 0, ,04334 (----*---- ) ,080 0,160 0,240 0,320 Pooled StDev = 0,03296 One-way ANOVA: M-P_SUPER-n versus REGIÃO-M Source DF SS MS F P REGIÃO-M 4 0, , ,39 0,000 Error 21 0, , Total 25 0, S = 0,03161 R-Sq = 68,44% R-Sq(adj) = 62,43% Level N Mean StDev REGIÃO , ,01513 (---*--) REGIÃO 2 4 0, ,03642 (-----*----) REGIÃO , ,04476 (---*--) ,120 0,180 0,240 0,300 Pooled StDev = 0,03266 One-way ANOVA: M-P_SUPER-n versus CLUSTER_SDF_AJ4-CM Source DF SS MS F P CLUSTER_SDF_AJ4-CM 2 0, , ,84 0,000 Error 23 0, , Total 25 0, S = 0,02738 R-Sq = 74,06% R-Sq(adj) = 71,81% Level N Mean StDev CENTRO-OESTE 3 0, ,02981 NORDESTE 9 0, ,01981 NORTE 7 0, ,04186 SUDESTE 4 0, ,03873 SUL 3 0, ,02298 Individual 95% CIs For Mean Based on Pooled StDev Level CENTRO-OESTE ( *------) NORDESTE (---*---) NORTE (----*----) SUDESTE (-----*------) SUL (------* ) ,150 0,200 0,250 0,300 Level N Mean StDev REGIÃO , ,02118 REGIÃO 2 4 0, ,03587 REGIÃO , ,03065 Individual 95% CIs For Mean Based on Pooled StDev Level REGIÃO 1 (----*---) REGIÃO 2 ( * ) REGIÃO 3 (----*----) ,140 0,175 0,210 0,245 Pooled StDev = 0,02738 Pooled StDev = 0,03161 Fonte: Minitab (16.1.0) O resultado da análise de variância também nos possibilitou realizar uma análise comparativa dos boxplot que pode ser observado na Figura Boxplot of M-IDHM_E-n Boxplot of M-IDHM_E-n 0,8 0,8 0,7 0,7 0,6 0,6 0,5 0,5 0,4 0,4 CENTRO-OESTE NORDESTE NORTE REGIÃO-M SUDESTE SUL REGIÃO 1 REGIÃO 2 CLUSTER_SDF_AJ4-CM REGIÃO 3 Boxplot of M-IDHM_R-n Boxplot of M-IDHM_R-n 0,7 0,7 0,6 0,6 0,5 0,5 0,4 0,4 0,3 0,3 CENTRO-OESTE NORDESTE NORTE REGIÃO-M SUDESTE SUL REGIÃO 1 REGIÃO 2 CLUSTER_SDF_AJ4-CM REGIÃO 3 37

111 M-FBSUPER-n M-FBSUPER-n M-E_ANOSESTUDO-n M-E_ANOSESTUDO-n M-SOBRE60-n M-SOBRE60-n M-ESPVIDA-n M-ESPVIDA-n Boxplot of M-ESPVIDA-n Boxplot of M-ESPVIDA-n 0,8 0,8 0,7 0,7 0,6 0,6 0,5 0,5 0,4 0,4 0,3 CENTRO-OESTE NORDESTE NORTE REGIÃO-M SUDESTE SUL 0,3 REGIÃO 1 REGIÃO 2 CLUSTER_SDF_AJ4-CM REGIÃO 3 Boxplot of M-SOBRE60-n Boxplot of M-SOBRE60-n 0,80 0,80 0,75 0,75 0,70 0,70 0,65 0,65 0,60 0,60 0,55 0,55 0,50 0,50 0,45 CENTRO-OESTE NORDESTE NORTE REGIÃO-M SUDESTE SUL 0,45 REGIÃO 1 REGIÃO 2 CLUSTER_SDF_AJ4-CM REGIÃO 3 Boxplot of M-E_ANOSESTUDO-n Boxplot of M-E_ANOSESTUDO-n 0,75 0,75 0,70 0,70 0,65 0,65 0,60 0,60 0,55 0,55 0,50 0,50 0,45 0,45 0,40 0,40 0,35 CENTRO-OESTE NORDESTE NORTE REGIÃO-M SUDESTE SUL 0,35 REGIÃO 1 REGIÃO 2 CLUSTER_SDF_AJ4-CM REGIÃO 3 Boxplot of M-FBSUPER-n Boxplot of M-FBSUPER-n 0,35 0,35 0,30 0,30 0,25 0,25 0,20 0,20 0,15 0,15 0,10 0,10 CENTRO-OESTE NORDESTE NORTE REGIÃO-M SUDESTE SUL REGIÃO 1 REGIÃO 2 CLUSTER_SDF_AJ4-CM REGIÃO 3 38

112 Boxplot of M-RDPC-n Boxplot of M-RDPC-n 0,35 0,35 0,30 0,30 M-RDPC-n 0,25 0,20 M-RDPC-n 0,25 0,20 0,15 0,15 0,10 0,10 CENTRO-OESTE NORDESTE NORTE REGIÃO-M SUDESTE SUL REGIÃO 1 REGIÃO 2 CLUSTER_SDF_AJ4-CM REGIÃO 3 Boxplot of M-P_SUPER-n Boxplot of M-P_SUPER-n 0,28 0,28 0,26 0,26 0,24 0,24 M-P_SUPER-n 0,22 0,20 0,18 0,16 0,14 0,12 0,10 M-P_SUPER-n 0,22 0,20 0,18 0,16 0,14 0,12 0,10 CENTRO-OESTE NORDESTE NORTE REGIÃO-M SUDESTE SUL REGIÃO 1 REGIÃO 2 CLUSTER_SDF_AJ4-CM REGIÃO 3 Figura Análise Comparativa dos Bloxplot Fonte: Minita (16.1.0) CONSIDERACÕES FINAIS Afim de proporcionar uma visão mais qualitativa as novas categorias, julgou-se necessário ajustar os outliers em grupos com maior proximidade quanto a distância dos centros. Dessa forma foi possível gerar um novo agrupamento, ou seja, menos categorias com dados similares, permitindo uma análise mais homogênea do resultado. Assim, foram produzidas três novas categorias, o que antes eram sete. Podemos observar pela Figura 5.2, que houve uma mudança significativa nos agrupamentos em relação as variáveis selecionadas. A análise discriminante então resultou em 100% de acerto. REFERÊNCIA ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, ATLAS DO DESENVOLVIMENTO HUMANO NO BRASIL. Disponível em: < Acessado em: 17 mar IBGE, Instituto Brasileiro de Geografia e Estatística. Séries Históricas e Estatísticas. Disponível em: < Acessado em: 30 mar LAS CASAS A., DE HOYOS A. Pesquisa de Marketing 39

113 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada Utilizando 25 variáveis selecionadas do Atlas Brasil DISCIPLINA: MÉTODOS QUALITATIVOS E QUANTITATIVOS EM ADMINISTRAÇÃO PROF. ARNOLDO JOSÉ DE HOYOS GUEVARA Lauro Kuester Marin 1º SEMESTRE DE 2017 São Paulo SP 2017

114 SUMÁRIO 2 INTRODUÇÃO... 3 CAPITULO 1. ENTENDENDO OS DADOS Os Indivíduos As Variáveis A Tabela de Dados Fonte de Dados... 7 CAPITULO 2. ESTATÍSTICA DESCRITIVA ANÁLISE DAS VARIÁVEIS Variáveis Categóricas : Município Variáveis s : ESPVIDA : SOBRE : SOBRE : MORT : T_MULCHEFEFIF : T_RMAXIDOSO : IDHM : RDPC : I_FREQ_PROP : T_ANALF15M : E_ANOSESTUDO : P_SUPER : REND : GINI : PPOB : RENOCUP : P_FORMAL : T_ATIV : T_LUZ : T_AGUA : T_DENS CAPÍTULO 3. CORRELAÇÕES E DENDOGRAMAS CAPÍTULO 4. ANÁLISE DOS COMPONENTES PRINCIPAIS CAPÍTULO 5. COMPONENTES PRINCIPAIS E A CLASSIFICAÇÃO DOS ESTADOS (RANKING) NO DESENVOVIMENTO HUMANO Compentes principais Análise Stepwise dos Componentes principais CONSIDERAÇÕES FINAIS REFERÊNCIAS... 50

115 3 INTRODUÇÃO O presente trabalho tem por objetivo efetuar uma análise das correlações e dos componentes principais (análise multivariada) e estabelecer um ranking dos Estados brasileiros com melhores e piores índices de desenvolvimento humano com base nos dados do censo demográfico do Brasil de Os dados se referem aos munícipios brasileiros, obtidos do censo demográfico do Brasil de 2010 sob a ótica do desenvolvimento humano, através de publicação conhecida como Atlas Brasil 2013 Municípios, para entender os números e indicadores da população brasileira ao final da primeira década do século XXI, que foram objeto de classificação em sete dimensões: - Demografia, desenvolvimento humano, educação, habitação, renda, trabalho e vulnerabilidade. Para tal, iniciamos com análise da estatística descritiva. Em seguida passamos para a análise das correlações e dendogramas. Na terceira parte utilizamos a análise dos componentes principais e na quarta parte selecionaremos sete variáveis para novamente fazer a análise dos componentes principais e colocar os Estados em uma ordem de decrescente de melhores indicadores do maior para o menor, que poderemos chamar de rankeamento, para nestes parâmetros verificar quais estavam em melhores condições de desenvolvimento humano, no censo demográfico de Por fim, fazemos as considerações finais. Os dados são compilados pelo Banco Mundial. O software estatístico utilizado é o MINITAB. CAPITULO 1. ENTENDENDO OS DADOS Os dados são referentes ao ano de As variáveis são indicadores dos municípios do censo demográfico do Brasil de 2010, sob a ótica do desenvolvimento humano, através de publicação conhecida como Atlas Brasil 2013 Municípios. 1.1 Os Indivíduos Os indivíduos desta análise são as pessoas físicas componentes da população brasileira, através de dados coletados nos municípios brasileiros, pertencentes aos Estados da Federação. O critério de seleção da análise da população é sua classificação em sete dimensões - Demografia, desenvolvimento humano, educação, habitação, renda, trabalho e vulnerabilidade. A população do Brasil está localizada em um total de municípios brasileiros, que como dito analisaremos os dados através de sete dimensões, que por sua vez terão 176 variáveis quantitativas, porém neste estudo somente analisaremos três variáveis de cada dimensão, em um total de 21 variáveis, que somadas às 04 variáveis categóricas identificadoras dos municípios Estado, código 6, código 7 e nome, somarão ao final 25 variáveis. Os dados analisados de cada município são as variáveis que descrevemos a seguir. 1.2 As Variáveis São 25 as variáveis desta pesquisa, incluindo o nome dos municípios, o Estado a que pertencem, seu código 6 do IBGE sem o dígito identificador e seu código 7 do IBGE com o dígito. As mesmas são melhor explicadas na Tabela 1. Ressaltamos que todos os dados desta pesquisa são referentes ao ano de Tabela 1. As Variáveis Significado Tipo Unidade de Medida UF É o código do Estado a que pertence o município. Categórica N/A Codmun6 Codmun7 É o código do IBGE de classificação do município É o código do IBGE de classificação do município, com o dígito verificador. Categórica Município É o nome do município. N/A N/A N/A

116 ESPVIDA Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. Anos 4 SOBRE40 Probabilidade de uma criança recém-nascida viver até os 40 anos, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. Percentual SOBRE60 Probabilidade de uma criança recém-nascida viver até os 60 anos, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo. Percentual MORT1 Número de crianças que não deverão sobreviver ao primeiro ano de vida em cada 1000 crianças nascidas vivas. Indivíduos T_MULCHEFE FIF014 Razão entre o número de mulheres que são responsáveis pelo domicílio, não têm o ensino fundamental completo e têm pelo menos 1 filho de idade inferior a 15 anos morando no domicílio e o número total de mulheres chefes de família multiplicado por 100. São considerados apenas os domicílios particulares permanentes. Percentual T_RMAXIDOS O Razão entre as pessoas que vivem em domicílios vulneráveis à pobreza (com renda per capita inferior a 1/2 salário mínimo de agosto de 2010) e nos quais a principal fonte de renda provém de moradores com 65 anos ou mais de idade e população total residente em domicílios particulares permanentes multiplicado por 100. Percentual IDHM Índice de Desenvolvimento Humano Municipal. Média geométrica dos índices das dimensões Renda, Educação e Longevidade, com pesos iguais. Índice RDPC Razão entre o somatório da renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos. Valores em reais de 01/agosto de Em reais ( R$) I_FREQ_PROP Subíndice selecionado para compor o IDHMEducação, representando a frequência de crianças e jovens à escola em séries adequadas à sua idade. É obtido através da média aritmética simples de 4 indicadores: % de crianças de 5 a 6 anos na escola, % de crianças de 11 a 13 anos no 2º ciclo do fundamental, % de jovens de 15 a 17 anos com o fundamental completo e % de jovens de 18 a 20 anos com o médio completo. Índice

117 T_ANALF15M Razão entre a população de 15 anos ou mais de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por Percentual E_ANOSESTU DO Número médio de anos de estudo que uma geração de crianças que ingressa na escola deverá completar ao atingir 18 anos de idade, se os padrões atuais se mantiverem ao longo de sua vida escolar. Anos P_SUPER Razão entre o número de pessoas de 18 anos ou mais de idade ocupadas e que já concluíram a graduação do ensino superior e o número total de pessoas ocupadas nessa faixa etária multiplicado por 100. Percentual REN1 Razão entre o número de pessoas de 18 anos ou mais de idade ocupadas e com rendimento mensal de todos os trabalhos inferior a 1 salário mínimo de julho de 2010 e o número total de pessoas ocupadas nessa faixa etária multiplicado por 100. Percentual GINI Mede o grau de desigualdade existente na distribuição de indivíduos segundo a renda domiciliar per capita. Seu valor varia de 0, quando não há desigualdade (a renda domiciliar per capita de todos os indivíduos tem o mesmo valor), a 1, quando a desigualdade é máxima (apenas um indivíduo detém toda a renda).o universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. Índice PPOB Proporção dos indivíduos com renda domiciliar per capita igual ou inferior a R$ 255,00 mensais, em reais de agosto de 2010, equivalente a 1/2 salário mínimo nessa data. O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes. Percentual RENOCUP Média dos rendimentos de todos os trabalhos das pessoas ocupadas de 18 anos ou mais de idade. Valores em reais de agosto de Em reais ( R$) P_FORMAL Razão entre o número de pessoas de 18 anos ou mais formalmente ocupadas e o número total de pessoas ocupadas nessa faixa etária multiplicado por 100. Foram considerados como formalmente ocupados os empregados com carteira de trabalho assinada, os militares do exército, da marinha, da aeronáutica, da polícia militar ou do corpo de bombeiros, os empregados pelo regime jurídico dos funcionários públicos, assim como os empregadores e trabalhadores por conta própria que eram contribuintes de instituto de previdência oficial. Percentual

118 T_ATIV Razão entre as pessoas de 10 anos ou mais de idade que eram economicamente ativas, ou seja, que estavam ocupadas ou desocupadas na semana de referência do Censo e o total de pessoas nesta faixa etária multiplicado por 100. Considera-se desocupada a pessoa que, não estando ocupada na semana de referência, havia procurado trabalho no mês anterior a essa pesquisa. 6 Percentual T_LUZ Razão entre a população que vive em domicílios particulares permanentes com iluminação elétrica e a população total residente em domicílios particulares permanentes multiplicado por 100. Considera-se iluminação proveniente ou não de uma rede geral, com ou sem medidor. Percentual T_AGUA Razão entre a população que vive em domicílios particulares permanentes com água canalizada para um ou mais cômodos e a população total residente em domicílios particulares permanentes multiplicado por 100. A água pode ser proveniente de rede geral, de poço, de nascente ou de reservatório abastecido por água das chuvas ou carro-pipa. Percentual T_DENS Razão entre a população que vive em domicílios particulares permanentes com densidade superior a 2 e a população total residente em domicílios particulares permanentes multiplicado por 100. A densidade do domicílio é dada pela razão entre o total de moradores do domicílio e o número total de cômodos usados como dormitório. Percentual 1.3 A Tabela de Dados Os dados das variáveis apurados dos municípios brasileiros são os seguintes: Média Mediana Menor Dado Maior Dado Desvio Padrão ESPVIDA 71,089 73,470 65,3 78,64 2,681 SOBRE40 93,781 93,89 88,83 93,09 1,256 SOBRE60 82,755 82,92 71,98 90,81 2,754 MORT1 19,247 16,9 8,49 46,8 7,137 T_MULCHEFEFIF0 19,956 18, ,59 10, T_RMAXIDOSO 3,5146 2, ,17 2,4895 IDHM 0, ,665 0,418 0,862 0,072 RDPC 493,61 467,65 96, ,74 243,27 I_FREQ_PROP 0, ,67 0,268 0,962 0,09613 T_ANALF15M 16,159 13,120 0,95 44,4 9,84 E_ANOSESTUDO 9,4636 9,47 4,34 12,83 1,0983 P_SUPER 7,0356 6,4 0,32 37,53 3,6051 REND1 39,309 35,810 4,53 89,33 21,587 GINI 0, ,49 0,28 0,8 0,06607 PPOB 43,991 42,23 1,97 91,57 22,438 RENOCUP 780,11 761,72 136, ,26 341,68

119 P_FORMAL 43,506 42,85 2,97 89,11 19,275 T_ATIV 55,378 55,640 17,290 91,27 9,24 T_LUZ 97,190 99,39 27, ,024 T_AGUA 85,598 90,28 0, ,721 T_DENS 25,127 23,07 0,65 88,64 12, Fonte de Dados Todos os dados desta pesquisa foram obtidos em: CAPITULO 2. ESTATÍSTICA DESCRITIVA ANÁLISE DAS VARIÁVEIS Começamos com a análise das medidas e gráficos da estatística descritiva de cada variável. 2.1 Variáveis Categóricas Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo pie chart e barras : Município Nossa amostra totaliza dados de municípios do Brasil, coletados no censo de Por estes dados se referirem ao conjunto de todos os municípios, não se justifica, neste momento, a análise desta variável. 2.2 Variáveis s A análise deste tipo de variável permite a utilização de uma maior gama de ferramentas de análise como histogramas, curvas de densidade, gráfico de ramos, box-plot e dot-plot, além de informações numéricas como média, desvio-padrão, mediana, quartis, 5 números, intervalo de confiança e teste de normalidade de Anderson-Darling : ESPVIDA Segue abaixo quadro contendo Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável ESPVIDA.

120 8 Summary for ESPVIDA A nderson-darling Normality Test A -Squared 34,95 P-V alue < 0,005 Mean 73,089 StDev 2,681 V ariance 7,186 Skew ness -0, Kurtosis -0, N Minimum 65,300 1st Q uartile 71,150 Median 73,470 3rd Q uartile 75,160 Maximum 78,640 95% C onfidence Interv al for Mean 73,019 73,159 95% C onfidence Interv al for Median 73,380 73,550 95% Confidence Intervals 95% C onfidence Interv al for StDev 2,632 2,731 Mean Median 73, 0 73, 1 73, 2 73, 3 73, 4 73, 5 73, 6 Principais observações que podemos fazer são: Forma: O Histograma nos permite verificar que trata-se de uma distribuição visivelmente assimétrica, concentrada mais a direita, e temos duas curvas, mostrando duas realidades diferentes. Esta conclusão está comprovada pelo teste de normalidade de Anderson-Darling que indica que a distribuição pode ser considerada uma Normal. A distribuição tem dois picos, que mostra que a esperança de vida que acontece na maioria dos municípios é desigual, havendo assim aparentemente dois grupos de municípios com médias de esperança de vida próprias. O Box-Plot e a análise dos números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana longe do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha esperança de vida ao nascer entre 63,3 e 73,47 anos e a outra metade maior do que este valor e chegando até 78,64 anos. A Esperança de vida média dos municípios era de 73,089 anos, mas o desvio-padrão (medida de dispersão) apresenta o índice de 2,681 anos. A esperança de vida mínima, como dito, é de 63,3 anos, e a máxima de 78,64 anos, demonstrando uma grande amplitude entre os munícipios do País, chegando a mais de 15 anos. A mediana é de 73,47 anos, estando não muito longe da média ( 73,089 anos ), o que por si só parece demonstrar uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 73,019 e 73,159 anos. O histograma acima mostra tratar-se de uma distribuição assimétrica para a esquerda : SOBRE40 Segue abaixo quadro contendo Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e A-Squared e P- Value para a variável SOBRE40.

121 9 Summary for SOBRE40 A nderson-darling Normality Test A -Squared 13,75 P-V alue < 0,005 Mean 93,781 StDev 1,256 V ariance 1,577 Skew ness -0, Kurtosis 0, N ,8 90,0 91,2 92,4 93,6 94,8 96,0 97,2 Minimum 88,830 1st Q uartile 92,950 Median 93,890 3rd Q uartile 94,680 Maximum 97,090 95% C onfidence Interv al for Mean 93,748 93,814 95% C onfidence Interv al for Median 93,850 93,930 95% Confidence Intervals 95% C onfidence Interv al for StDev 1,233 1,280 Mean Median 93,75 93,80 93,85 93,90 93,95 Com base nas informações acima, fazemos os seguintes comentários: Forma: A análise dos dados e gráficos acima nos permite verificar que se trata de uma variável com características pouca coisa diferente da variável ESPVIDA. A distribuição é pouco assimétrica, com a mediana próxima do centro, indicando normalidade. Há apenas um pico pronunciado, que se refere aos municípios com probabilidade de 84,2% das crianças ao nascer estarem vivas até 40 anos. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta pouca assimetria da distribuição. A posição da linha da mediana perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 88,83% e 93,89% de probabilidade de suas crianças nascidas naquele ano estarem vivas até os 40 anos e a outra metade maior do que este valor e chegando até 97,090% de probabilidade, ou seja, quase 100% de todas as nascidas estarem vivas até completarem 40 anos. A probabilidade média dos municípios era de 93,781%, mas o desvio-padrão (medida de dispersão) apresenta o índice de 1,256%. A probabilidade mínima de sobrevida até os 40 anos, como dito, é de 88,83%, e a máxima de 97,09%, demonstrando não tão grande amplitude entre os munícipios do País, quanto foi no caso da esperança de vida total ao nascer. A mediana é de 93,89%, estando muito próxima da média ( 93,781% ), o que por si confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 93,748% e 93,814% : SOBRE60

122 Summary for SOBRE60 10 A nderson-darling Normality Test A -Squared 8,07 P-V alue < 0,005 Mean 82,755 StDev 2,754 V ariance 7,586 Skew ness -0, Kurtosis 0, N Minimum 71,980 1st Q uartile 81,040 Median 82,920 3rd Q uartile 84,595 Maximum 90,810 95% C onfidence Interv al for Mean 82,682 82,827 95% C onfidence Interv al for Median 82,830 83,020 95% Confidence Intervals 95% C onfidence Interv al for StDev 2,704 2,806 Mean Median 82,70 82,75 82,80 82,85 82,90 82,95 83,00 Segue abaixo o mesmo quadro resumo apresentado para as variáveis analisadas acima. Analisando as informações acima, concluímos: Forma: Conforme comentamos na variável SOBRE40, a análise dos dados e gráficos acima nos permite verificar que se trata de uma variável com características semelhantes nos dois casos. A distribuição é pouco assimétrica, quase que simétrica, com a mediana próxima do centro, indicando normalidade. Há apenas dois picos não muito pronunciados, que se referem aos municípios com probabilidade de 83% e 84% das crianças ao nascer estarem vivas até 60 anos. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta quase simetria da distribuição. A posição da linha da mediana perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson- Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 71,98% e 82,92% de probabilidade de suas crianças nascidas naquele ano estarem vivas até os 60 anos e a outra metade maior do que este valor e chegando até 90,81% de probabilidade, estarem vivas até completarem 60 anos. A probabilidade média dos municípios era de 82,755%, mas o desvio-padrão (medida de dispersão) apresenta o índice de 2,754%. A probabilidade mínima de sobrevida até os 60 anos, como dito, é de 71,98%, e a máxima de 90,81%, demonstrando neste caso uma amplitude maior entre os munícipios do País, em torno de 19%, quanto foi no caso da probabilidade de estar vivo até os 40 anos, que somente foi em torno de 8%. A mediana é de 82,92%, estando muito próxima da média ( 82,755% ), o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 82,682 e 82,827% : MORT1 Segue abaixo o resumo descritivo estatístico da variável MORT1:

123 Summary for MORT1 11 A nderson-darling Normality Test A -Squared 158,86 P-V alue < 0,005 Mean 19,247 StDev 7,137 V ariance 50,932 Skew ness 1,00629 Kurtosis 0,43243 N Minimum 8,490 1st Q uartile 13,800 Median 16,900 3rd Q uartile 23,800 Maximum 46,800 95% C onfidence Interv al for Mean 19,059 19,435 95% C onfidence Interv al for Median 16,700 17,173 95% Confidence Intervals 95% C onfidence Interv al for StDev 7,006 7,272 Mean Median 17,0 17,5 18,0 18,5 19,0 19,5 Com base neste quadro-resumo, concluímos: Forma: A análise dos dados e gráficos acima nos permite verificar que se trata de uma variável com características diferentes das variáveis ESPVIDA, SOBRE40 e SOBRE60. A distribuição é assimétrica, com a mediana mais longe do centro, porém indicando normalidade. Há apenas um pico, porém não pronunciado, que se refere aos municípios com 13 crianças a cada com probabilidade de não sobreviveram ao completar 1 ano de vida. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana não tão perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 8,49 e 16,9 crianças a cada nascidas com probabilidade de não estarem vivas ao completarem 1 ano de vida e a outra metade maior do que este valor e chegando até 46,8 crianças por mil nascidas em um município com probabilidade de não completarem o primeiro anos de vida, ou seja, quase 5% de todas as nascidas nesta faixa de municípios não teriam probabilidade de completarem o primeiro ano de vida, e um caso que deveria receber a total atenção das autoridades públicas, principalmente da área de saúde. O índice médio dos municípios era de 19,247 crianças a cada nascidas, mas o desvio-padrão (medida de dispersão) apresenta o índice de 7,137 crianças. O índice mínimo de não sobrevida até primeiro ano, como dito, era de 8,49 crianças e o máximo de 46,8 crianças, demonstrando grande amplitude entre os munícipios do País. A mediana é de 16,9 crianças, não estando muito próxima da média ( 19,247 ), o que por si confirma uma assimetria mais pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 19,069 e 19,435 crianças a cada nascidas vivas com probabilidade de não estarem vivas ao completarem o primeiro ano de vida. Podemos observar uma assimetria positiva de distribuição à direita.

124 : T_MULCHEFEFIF014 Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável T_MULCHEFEFIF014. Summary for T_MULCHEFEFIF014 A nderson-darling Normality Test A -Squared 68,62 P-V alue < 0,005 Mean 19,956 StDev 10,321 V ariance 106,532 Skew ness 0,99289 Kurtosis 1,37190 N Minimum 0,000 1st Q uartile 12,320 Median 18,090 3rd Q uartile 25,865 Maximum 77,590 95% C onfidence Interv al for Mean 19,684 20,227 95% C onfidence Interv al for Median 17,799 18,430 95% Confidence Intervals 95% C onfidence Interv al for StDev 10,133 10,517 Mean Median 18,0 18,5 19,0 19,5 20,0 20,5 Forma: Conforme verificamos na variável anterior - MORT1, a análise dos dados e gráficos acima nos permite verificar que se trata de uma variável com características semelhantes nos dois casos, ou seja, uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, com a mediana mais longe do centro, porém indicando normalidade. Há apenas um pico e triplo, porém um pouco pronunciado, que se refere aos municípios com índices na faixa de 12, 14 e 16 mulheres que são responsáveis pelo domicílio, não têm o ensino fundamental completo e têm pelo menos 1 filho de idade inferior a 15 anos morando no domicílio e o número total de mulheres chefes de família multiplicado por 100. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana não tão perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 0 ( Zero ) e 18,09 mulheres nesta condição e a outra metade maior do que este valor e chegando até 77,59 mulheres chefes de família nesta condição a cada 100 mulheres chefes de família no município. Ou seja, enquanto que existiam municípios que das mulheres chefes de família, nenhuma delas ( Zero ) não tinham o ensino fundamental completo e tinham pelo menos 1 filho de idade inferior a 15 anos morando no domicílio, contrariamente em outros, quase que 80% das chefes de família, estavam nesta condição de não ter o ensino fundamental completo e ter pelo menos 1 filho de idade inferior a 15 anos morando no domicílio a cada 100 mulheres chefes de família. A média dos municípios era de 19,956 mulheres nesta condição, mas o desvio-padrão (medida de dispersão) apresentou o índice de 10,321. Os municípios com menos mulheres nesta condição, como dito não possuíam nenhuma mulher, e os com valores máximos possuíam 77,59 mulheres nesta condição a cada 100 mulheres que eram chefes de família, demonstrando neste caso uma amplitude enorme entre os munícipios do País, em torno de

125 13 80%. A mediana é de 18,090 mulheres nesta condição, não estando muito próxima da média ( 19,956 ), porém não tão longe, o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 19,684 e 20,227 mulheres : T_RMAXIDOSO Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável T_RMAXIDOSO. Summary for T_RMAXIDOSO A nderson-darling Normality Test A -Squared 116,70 P-V alue < 0,005 Mean 3,5146 StDev 2,4895 V ariance 6,1978 Skew ness 0, Kurtosis -0, N ,0 2,5 5,0 7,5 10,0 12,5 15,0 17,5 Minimum 0,0000 1st Q uartile 1,4300 Median 2,8500 3rd Q uartile 5,3200 Maximum 18, % C onfidence Interv al for Mean 3,4492 3, % C onfidence Interv al for Median 2,7600 2, % Confidence Intervals 95% C onfidence Interv al for StDev 2,4441 2,5367 Mean Median 2,8 3,0 3,2 3,4 3,6 Forma: Mais uma vez verificamos na análise dos dados e gráficos acima, semelhanças com as últimas variáveis estudadas, ou seja, uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, com a mediana mais longe do centro, porém indicando normalidade. Há apenas praticamente um pico, pronunciado, que se refere aos municípios com índice na faixa de 1% de pessoas que vivem em domicílios vulneráveis à pobreza (com renda per capita inferior a 1/2 salário mínimo de agosto de 2010) e nos quais a principal fonte de renda provém de moradores com 65 anos ou mais de idade e comparado com a população total residente em domicílios particulares permanentes. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana não tão perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 0 ( Zero ) e 2,85% pessoas nesta condição e a outra metade maior do que este valor e chegando até 18,17% de pessoas que vivem em domicílios vulneráveis à pobreza (com renda per capita inferior a 1/2 salário mínimo de agosto de 2010) e nos quais idosos de 65 anos ou mais são a principal fonte de renda. Ou seja, enquanto que existiam municípios que não possuíam nenhuma pessoa residindo nesta condição, contrariamente em outros, 18,17% das pessoas estavam nesta condição. A média dos municípios era de 3,5146% nesta condição, mas o desvio-padrão (medida de dispersão) apresentou o índice de 2,4895%, mostrando um a dispersão alta da média. Os municípios com menos pessoas nesta condição, como dito não possuíam nenhuma, e os com valores máximos possuíam 18,17%

126 14 das pessoas nesta condição, demonstrando neste caso uma amplitude enorme entre os munícipios do País, em torno de 18%. A mediana é de 2,85% das pessoas nesta condição, não estando muito próxima da média ( 3,5146% ), porém não tão longe, o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 3,4492 e 3,58% das pessoas : IDHM Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável IDHM. Summary for IDHM A nderson-darling Normality Test A -Squared 40,51 P-V alue < 0,005 Mean 0,65916 StDev 0,07200 V ariance 0,00518 Skew ness -0, Kurtosis -0, N ,42 0,49 0,56 0,63 0,70 0,77 0,84 Minimum 0, st Q uartile 0,59900 Median 0, rd Q uartile 0,71800 Maximum 0, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,07336 Mean Median 0,658 0,660 0,662 0,664 0,666 0,668 0,670 Forma: Mais uma vez verificamos na análise dos dados e gráficos acima, semelhanças com a variável ESPVIDA, pois o histograma nos permite verificar que se trata de uma distribuição levemente assimétrica, concentrada mais a direita, e temos duas curvas, mostrando duas realidades diferentes. Esta conclusão está comprovada pelo teste de normalidade de Anderson-Darling que indica que a distribuição pode ser considerada uma Normal. A distribuição tem dois picos, que mostra que o índice de desenvolvimento humano que acontece na maioria dos municípios ( IDHM ) é desigual, havendo assim aparentemente dois grupos de municípios com índices diferenciados. O Box-Plot e a análise dos números, nos deixam ainda mais clara esta leve assimetria da distribuição. Mostrando que a posição da linha da mediana não está longe do centro do quadrado principal do Box-Plot, nos confirma esta afirmativa da leve assimetria. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha IDHM entre 0,418 e 0,665 e a outra metade maior do que este valor e chegando até o índice de 0,862. O IDHM médio dos municípios era de 0,65916, mas o desvio-padrão (medida de dispersão) apresenta o índice de 0,072. O IDHM mínimo, como dito, é de 0,418, e o máximo de 0,862, demonstrando uma grande amplitude entre os munícipios do País, chegando a mais do dobro de um índice para o outro. A mediana é de 0,655, estando não muito longe da média 0,6519, o que por si só parece demonstrar uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 0,65727 e 0,66105.

127 15 O histograma acima mostra tratar-se de uma distribuição assimétrica negativa para a esquerda : RDPC Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável RDPC. Summary for RDPC A nderson-darling Normality Test A -Squared 80,55 P-V alue < 0,005 Mean 493,61 StDev 243,27 V ariance 59179,97 Skew ness 0,95965 Kurtosis 1,65248 N Minimum 96,25 1st Q uartile 281,09 Median 467,65 3rd Q uartile 650,64 Maximum 2043,74 95% C onfidence Interv al for Mean 487,21 500,00 95% C onfidence Interv al for Median 456,26 478,34 95% Confidence Intervals 95% C onfidence Interv al for StDev 238,83 247,88 Mean Median Forma: Mais uma vez verificamos na análise dos dados e gráficos acima, semelhanças com variáveis já estudadas, ou seja, uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, porém com a mediana não tão longe do centro, indicando normalidade. Há apenas praticamente um pico pronunciado, que se refere aos municípios com valores na faixa de R$250,00 de renda média por pessoa e por residência. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana não tão perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios possuía renda média de pessoa por residência ( Renda de todos os indivíduos residentes em domicílios particulares permanentes e o número total desses indivíduos ) de R$96,25 a R$467,65 e a outra metade maior do que este valor e chegando até R$2.043,74 de rendimento médio de habitante residencial. A média dos municípios era de R$493,61, mas o desvio-padrão (medida de dispersão) apresentou o índice de R$243,27, mostrando um a dispersão alta da média. Os municípios com menos valores apresentaram a média de R$96,25 e os com valores máximos possuíam R$2.043,74 de renda média, demonstrando neste caso uma amplitude enorme entre os munícipios do País, em torno de R$1.950,00. A mediana é de R$467,65, estando de certa forma próxima da média ( R$493,61 ), o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores R$487,21 e R$500,00. O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita.

128 2.2.9 : I_FREQ_PROP Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável I_FREQ_PROP. 16 Summary for I_FREQ_PROP A nderson-darling Normality Test A -Squared 5,84 P-V alue < 0,005 Mean 0,66834 StDev 0,09613 V ariance 0,00924 Skew ness -0, Kurtosis -0, N ,3 0,4 0,5 0,6 0,7 0,8 0,9 Minimum 0, st Q uartile 0,60300 Median 0, rd Q uartile 0,74150 Maximum 0, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,09795 Mean Median 0,6650 0,6675 0,6700 0,6725 0,6750 Forma: Verificamos na análise dos dados e gráficos acima que o histograma mostra que se que se trata de uma distribuição levemente assimétrica, concentrada mais a direita, e mostrando quase simetria, tanto que média e mediana estão bem próximos. Esta conclusão está comprovada pelo teste de normalidade de Anderson-Darling que indica que a distribuição pode ser considerada uma Normal. A distribuição tem três leves picos, que mostra que o índice representando a frequência de crianças e jovens à escola em séries adequadas à sua idade, tem aparente distribuição uniforme. O Box-Plot e a análise dos números, nos deixam ainda mais clara esta leve assimetria da distribuição. Mostrando que a posição da linha da mediana não está longe do centro do quadrado principal do Box-Plot, nos confirma esta afirmativa da leve assimetria. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha o índice da frequência de crianças e jovens à escola em séries adequadas à sua idade entre 0,268 e 0,67 e a outra metade maior do que este valor e chegando até o índice de 0,962. O índice médio dos municípios era de 0,66834, mas o desvio-padrão (medida de dispersão) apresenta o índice de 0, O índice mínimo, como dito, foi de 0,268, e o máximo de 0,962, demonstrando uma grande amplitude entre os munícipios do País, chegando a mais do triplo de um índice para o outro. A mediana é de 0,67, estando muito perto da média 0,66834, o que por si só parece demonstrar uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 0,66582 e 0, O histograma acima mostra tratar-se de uma distribuição assimétrica negativa para a esquerda : T_ANALF15M Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável T_ANALF15M.

129 17 Summary for T_ANALF15M A nderson-darling Normality Test A -Squared 140,31 P-V alue < 0,005 Mean 16,159 StDev 9,840 V ariance 96,818 Skew ness 0, Kurtosis -0, N Minimum 0,950 1st Q uartile 8,080 Median 13,120 3rd Q uartile 24,320 Maximum 44,400 95% C onfidence Interv al for Mean 15,900 16,417 95% C onfidence Interv al for Median 12,859 13,481 95% Confidence Intervals 95% C onfidence Interv al for StDev 9,660 10,026 Mean Median Forma: Mais uma vez verificamos na análise dos dados e gráficos acima, semelhanças com variáveis já estudadas, ou seja, uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, porém com a mediana não tão longe do centro, indicando normalidade. Há apenas praticamente um pico pronunciado, que se refere aos municípios com taxas de 9% de pessoas analfabetas aos 15 anos de idade em comparação à população do município de mesma idade. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana não tão perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios possuía taxas de analfabetos aos 15 anos de menos de 1% ( 0,95% ) a 13,12% e a outra metade maior do que este valor e chegando até 44,4% de analfabetos nesta idade. A média dos municípios era uma taxa de 16,159%, mas o desvio-padrão (medida de dispersão) apresentou o índice de 9,84%, mostrando um a dispersão alta da média. Os municípios com menos valores apresentaram a média de 0,95% e os com valores máximos possuíam taxas de 44,4%, demonstrando neste caso uma amplitude enorme entre os munícipios do País no quesito, ou seja, em alguns municípios quase metade das pessoas de 15 anos de idade eram analfabetas. A mediana foi de 13,12%, estando de certa forma não tão próxima da média ( 16,159% ), o que mostra uma assimetria na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 15,9% e 16,417%. O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita : E_ANOSESTUDO Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável E_ANOSESTUDO.

130 18 Summary for E_ANOSESTUDO A nderson-darling Normality Test A -Squared 1,38 P-V alue < 0,005 Mean 9,4636 StDev 1,0983 V ariance 1,2062 Skew ness -0, Kurtosis 0, N ,8 6,0 7,2 8,4 9,6 10,8 12,0 Minimum 4,3400 1st Q uartile 8,7500 Median 9,4700 3rd Q uartile 10,2100 Maximum 12, % C onfidence Interv al for Mean 9,4348 9, % C onfidence Interv al for Median 9,4400 9, % Confidence Intervals 95% C onfidence Interv al for StDev 1,0782 1,1191 Mean Median 9,44 9,45 9,46 9,47 9,48 9,49 9,50 Forma: Verificamos na análise dos dados e gráficos acima que o histograma mostra que se que se trata de uma distribuição levemente assimétrica, concentrada um pouco mais a direita, e mostrando quase simetria, tanto que média e mediana estão muito próximas. Esta conclusão está comprovada pelo teste de normalidade de Anderson-Darling que indica que a distribuição pode ser considerada uma Normal. A distribuição tem somente um pico duplo, que mostra que duas faixas com 9,4 e 9,6 anos de estudo que crianças que ingressam na escola agora devem ter ao completar 18 anos. O Box-Plot e a análise dos números, nos deixam ainda mais clara esta leve assimetria da distribuição. Mostrando que a posição da linha da mediana não está longe do centro do quadrado principal do Box-Plot, nos confirma esta afirmativa da leve assimetria. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha a média de 4,34 anos de estudo de crianças ingressantes agora na escola deverão ter ao completar 18 anos de idade até 9,47 anos de estudo e a outra metade maior do que este valor e chegando até o índice de 12,83 anos de estudo. O índice médio dos municípios era de 9,4636 anos previstos ao completar 18 anos de vida, mas o desvio-padrão (medida de dispersão) apresenta o índice de 1,0983. O índice mínimo, como dito, foi de 4,34 anos, e o máximo de 12,83 anos, demonstrando uma grande amplitude entre os munícipios do País, chegando a quase o triplo de um índice para o outro. A mediana é de 9,47 anos, estando muito perto da média de 9,4636 anos, o que por si só parece demonstrar uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 9,438 anos e 9,4925 anos. O histograma acima mostra tratar-se de uma distribuição assimétrica negativa para a esquerda : P_SUPER Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável P_SUPER.

131 19 Summary for P_SUPER A nderson-darling Normality Test A -Squared 84,72 P-V alue < 0,005 Mean 7,0356 StDev 3,6051 V ariance 12,9967 Skew ness 1,53911 Kurtosis 5,31372 N Minimum 0,3200 1st Q uartile 4,5600 Median 6,4000 3rd Q uartile 8,8150 Maximum 37, % C onfidence Interv al for Mean 6,9409 7, % C onfidence Interv al for Median 6,3000 6, % Confidence Intervals 95% C onfidence Interv al for StDev 3,5393 3,6733 Mean Median 6,2 6,4 6,6 6,8 7,0 7,2 Forma: Verificamos na análise dos dados e gráficos acima, uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, com a mediana um pouco longe do centro, porém indicando normalidade. Há apenas um pico, não tão pronunciado, que se refere aos municípios com índice na faixa de 5% de pessoas que concluíram curso superior, com idade igual ou acima de 18 anos e que trabalham em relação ao total da população desta mesma faixa etária e que trabalham. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana não tão perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 0,32% e 6,4% de pessoas nesta condição e a outra metade maior do que este valor e chegando até 37,53% de pessoas que trabalham, tem idade de 18 anos ou mais e já concluíram um curso superior. A média dos municípios era de 7,0356% nesta condição, mas o desvio-padrão (medida de dispersão) apresentou o índice de 3,6051%, mostrando um a dispersão relativamente alta da média. Os municípios com menos pessoas nesta condição, como dito possuíam 0,36% de pessoas trabalhando, com 18 anos ou mais e que já haviam concluído um curso superior, e os com valores máximos possuíam 37,53% das pessoas nesta condição, demonstrando mais uma vez uma amplitude enorme entre os munícipios do País neste quesito de educação, ou seja, com amplitude em torno de 37%. A mediana é de 6,4% das pessoas nesta condição, estando próxima da média ( 7,0356% ), o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 6,9409 e 7,1303% das pessoas nesta condição. O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita : REND1 Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável REND1.

132 20 Summary for REN1 A nderson-darling Normality Test A -Squared 116,50 P-V alue < 0,005 Mean 39,309 StDev 21,587 V ariance 465,978 Skew ness 0,28991 Kurtosis -1,22784 N Minimum 4,530 1st Q uartile 19,595 Median 35,810 3rd Q uartile 58,555 Maximum 89,330 95% C onfidence Interv al for Mean 38,742 39,876 95% C onfidence Interv al for Median 34,497 37,025 95% Confidence Intervals 95% C onfidence Interv al for StDev 21,193 21,995 Mean Median Forma: Observando os dados e gráficos acima verificamos na análise semelhanças com variáveis estudadas, ou seja, mais uma vez uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, com a mediana mais longe do centro, porém indicando normalidade. Há um pico pronunciado e vários outros picos menores, que se referem aos habitantes dos municípios com idade de 18 anos ou mais e renda média inferior a um salário mínimo. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana mais distanciada do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson- Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 4,53% e 35,81% pessoas nesta condição e a outra metade maior do que este valor e chegando até 89,33% de pessoas que vivem com renda inferior a um salário mínimo entre aqueles de 18 anos ou mais que trabalham. Ou seja, enquanto que existiam municípios que possuíam menos de 5% dos trabalhadores ocupados recebendo menos de um salário mínimo, contrariamente em outros, mais de 89% das pessoas estavam nesta condição, de rendimentos inferiores a um salário mínimo. A média dos municípios era de 39,309% nesta condição, índice a priori muito alto para um país do terceiro mundo que almeja se desenvolver economicamente, mas o desvio-padrão (medida de dispersão) apresentou o índice de 21,587%, mostrando um a dispersão muito alta da média. Os municípios com menos pessoas nesta condição possuíam 4,53% e os com valores máximos possuíam 89,33% das pessoas nesta condição, demonstrando neste caso uma amplitude enorme entre os munícipios do País, em torno de 85%. A mediana é de 35,81% das pessoas nesta condição, não estando tão longe da média ( 39,309% ), porém o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 38,742 e 39,876% das pessoas. O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita : GINI

133 21 Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável GINI. Summary for GINI A nderson-darling Normality Test A -Squared 8,12 P-V alue < 0,005 Mean 0,49438 StDev 0,06607 V ariance 0,00437 Skew ness 0, Kurtosis 0, N ,32 0,40 0,48 0,56 0,64 0,72 0,80 Minimum 0, st Q uartile 0,45000 Median 0, rd Q uartile 0,54000 Maximum 0, % C onfidence Interv al for Mean 0, , % C onfidence Interv al for Median 0, , % Confidence Intervals 95% C onfidence Interv al for StDev 0, ,06733 Mean Median 0,490 0,492 0,494 0,496 0,498 0,500 Forma: Verificamos na análise dos dados e gráficos acima que o histograma mostra que se que se trata de uma distribuição levemente assimétrica, concentrada um pouco mais a esquerda, e mostrando quase simetria, tanto que média e mediana estão muito próximas. Esta conclusão está comprovada pelo teste de normalidade de Anderson-Darling que indica que a distribuição pode ser considerada uma Normal. A distribuição tem somente dois picos não acentudados, que mostra que duas faixas com 0,48 e 0,50 de índice. O Box-Plot e a análise dos números, nos deixam ainda mais clara esta leve assimetria da distribuição. Mostrando que a posição da linha da mediana não está longe do centro do quadrado principal do Box-Plot, nos confirma esta afirmativa da leve assimetria. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha índice médio de 0,28 a 0,49 e a outra metade maior do que este valor e chegando até o índice de 0,8. O índice médio dos municípios era de 0,49438, mas o desvio-padrão (medida de dispersão) apresenta o índice de 0, O índice mínimo, como dito, foi de 0,28, e o máximo de 0,8, demonstrando uma grande amplitude entre os munícipios do País, chegando a mais do triplo de um índice para o outro. A mediana é de 0,49, estando muito perto da média de 0,49438, o que por si só parece demonstrar uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 0,49264 e 0, O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita : PPOB Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável PPOB.

134 22 Summary for PPOB A nderson-darling Normality Test A -Squared 112,16 P-V alue < 0,005 Mean 43,991 StDev 22,438 V ariance 503,463 Skew ness 0,04381 Kurtosis -1,33657 N Minimum 1,970 1st Q uartile 23,960 Median 42,230 3rd Q uartile 65,310 Maximum 91,570 95% C onfidence Interv al for Mean 43,401 44,580 95% C onfidence Interv al for Median 40,999 43,652 95% Confidence Intervals 95% C onfidence Interv al for StDev 22,029 22,863 Mean Median Forma: Observando os dados e gráficos acima verificamos na análise semelhanças com variáveis estudadas, ou seja, mais uma vez uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, com a mediana não muito longe do centro, porém indicando normalidade. Há duas curvas principais com vários picos menores, que se referem aos renda residencial dos habitantes dos municípios com renda média inferior a meio salário mínimo. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana um pouco distanciada do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson- Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 1,97% e 42,23% pessoas nesta condição e a outra metade maior do que este valor e chegando até 91,57% de pessoas que vivem com renda inferior a meio salário mínimo entre aqueles residentes no município. Ou seja, enquanto que existiam municípios que possuíam menos de 2% dos residentes vivendo com menos de um salário mínimo, contrariamente em outros, mais de 91% das pessoas estavam nesta condição, de rendimentos inferiores a meio salário mínimo, considerados pobres. A média dos municípios era de 43,991% nesta condição, mas o desvio-padrão (medida de dispersão) apresentou o índice de 22,438%, mostrando um a dispersão muito alta da média. Os municípios com menos pessoas nesta condição possuíam 1,97% e os com valores máximos possuíam 91,57% das pessoas nesta condição, demonstrando neste caso uma amplitude enorme entre os munícipios do País, em torno de 90%. A mediana é de 42,23% das pessoas nesta condição, não estando tão longe da média ( 43,991% ), porém o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 43,401 e 44,58% das pessoas considerados como pobres nos domicílios dos municípios. O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita : RENOCUP

135 23 Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável RENOCUP. Summary for RENOCUP A nderson-darling Normality Test A -Squared 35,59 P-V alue < 0,005 Mean 780,11 StDev 341,68 V ariance ,92 Skew ness 0,72362 Kurtosis 1,27435 N Minimum 136,42 1st Q uartile 488,59 Median 761,72 3rd Q uartile 1008,08 Maximum 3177,26 95% C onfidence Interv al for Mean 771,13 789,09 95% C onfidence Interv al for Median 745,23 776,58 95% Confidence Intervals 95% C onfidence Interv al for StDev 335,45 348,15 Mean Median Forma: Verificamos na análise semelhanças com variáveis estudadas, ou seja, mais uma vez uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, com a mediana não tão longe do centro, porém indicando normalidade. Há dois picos pronunciado, que se referem a valores médios dos rendimentos das pessoas ocupadas nos municípios, com idade de 18 anos ou mais. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana um pouco distanciada do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha valores médios das pessoas ocupadas de 18 anos ou mais em valores de R$136,42 a R$761,72 e a outra metade maior do que este valor e chegando até R$3.177,26 de rendimento médio no município. Ou seja, enquanto que existiam municípios que possuíam menos de R$200,00 de rendimento médio dos trabalhadores ocupados, contrariamente em outros, o rendimento médio dos ocupados ultrapassava a R$3.000,00. A média dos municípios era de R$780,11 de rendimento médio, o desvio-padrão (medida de dispersão) apresentou o valor de R$341,68, mostrando um a dispersão alta da média. Os municípios com menos pessoas nesta condição possuíam valor de R$136,42 de rendimento médio e os com valores máximos possuíam R$3.177,26 de rendimento médio, demonstrando neste caso uma amplitude enorme entre os munícipios do País, superior a R$3.000,00. A mediana é de R$761,72, não estando tão longe da média ( R$780,11 ), porém o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores R$771,13 e R$789,09. O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita : P_FORMAL

136 24 Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável P_FORMAL. Summary for P_FORMAL A nderson-darling Normality Test A -Squared 65,23 P-V alue < 0,005 Mean 43,506 StDev 19,275 V ariance 371,525 Skew ness 0,11438 Kurtosis -1,15796 N Minimum 2,970 1st Q uartile 26,320 Median 42,850 3rd Q uartile 59,770 Maximum 89,110 95% C onfidence Interv al for Mean 42,999 44,012 95% C onfidence Interv al for Median 41,846 43,980 95% Confidence Intervals 95% C onfidence Interv al for StDev 18,923 19,640 Mean Median 42,0 42,5 43,0 43,5 44,0 Forma: Observando os dados e gráficos acima verificamos na análise semelhanças com variáveis estudadas, ou seja, mais uma vez uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, com a mediana não muito longe do centro, porém indicando normalidade. Há duas curvas principais com vários picos menores, que se referem aos trabalhadores com 18 anos ou mais de idade formalizados em relação ao total de trabalhadores do município de mesma faixa etária. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana um pouco distanciada do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 2,97% e 42,85% pessoas nesta condição e a outra metade maior do que este valor e chegando até 89,11% de pessoas com idade de 18 anos ou mais que estavam trabalhando formalizadas em relação ao total das pessoas ocupadas no município. A média dos municípios era de 43,506% nesta condição, mas o desvio-padrão (medida de dispersão) apresentou o índice de 19,275%, mostrando um a dispersão alta da média. Os municípios com menos pessoas nesta condição possuíam 2,97% e os com valores máximos possuíam 89,11% das pessoas nesta condição, demonstrando neste caso uma amplitude enorme entre os munícipios do País, em torno de 86%. A mediana é de 42,85% das pessoas nesta condição, não estando tão longe da média ( 43,506% ), porém o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 42,999 e 44,012%. O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita : T_ATIV

137 25 Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável T_ATIV. Summary for T_ATIV A nderson-darling Normality Test A -Squared 4,46 P-V alue < 0,005 Mean 55,378 StDev 9,240 V ariance 85,386 Skew ness 0, Kurtosis 0, N Minimum 17,290 1st Q uartile 49,240 Median 55,640 3rd Q uartile 61,230 Maximum 91,270 95% C onfidence Interv al for Mean 55,135 55,621 95% C onfidence Interv al for Median 55,369 56,011 95% Confidence Intervals 95% C onfidence Interv al for StDev 9,072 9,415 Mean Median 55,2 55,4 55,6 55,8 56,0 Forma: Verificamos na análise dos dados e gráficos acima que o histograma mostra que se que se trata de uma distribuição levemente assimétrica, concentrada um pouco mais a esquerda, e mostrando quase simetria, tanto que média e mediana estão muito próximas. Esta conclusão está comprovada pelo teste de normalidade de Anderson-Darling que indica que a distribuição pode ser considerada uma Normal. A distribuição tem somente um pico acentudado, que mostra uma faixa de 58% de pessoas economicamente ativas. O Box-Plot e a análise dos números, nos deixam ainda mais clara esta leve assimetria da distribuição. Mostrando que a posição da linha da mediana não está longe do centro do quadrado principal do Box-Plot, nos confirma esta afirmativa da leve assimetria. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha índice médio de 17,29% a 55,64% de pessoas economicamente ativas e a outra metade maior do que este valor e chegando até o índice de 91,27%. O índice médio dos municípios era de 55,378%, mas o desvio-padrão (medida de dispersão) apresenta o índice de 9,24%. O índice mínimo, como dito, foi de 17,29%, e o máximo de 91,27%, demonstrando uma grande amplitude entre os munícipios do País, chegando a mais do quadruplo de um índice para o outro. A mediana é de 55,64%, estando muito perto da média de 55,378%, o que por si só parece demonstrar uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 55,135% a 55,621%. O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita : T_LUZ Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável T_LUZ.

138 26 Summary for T_LUZ A nderson-darling Normality Test A -Squared 938,37 P-V alue < 0,005 Mean 97,190 StDev 6,024 V ariance 36,293 Skew ness -4,2167 Kurtosis 23,1543 N Minimum 27,410 1st Q uartile 97,645 Median 99,390 3rd Q uartile 99,870 Maximum 100,000 95% C onfidence Interv al for Mean 97,031 97,348 95% C onfidence Interv al for Median 99,350 99,430 95% Confidence Intervals 95% C onfidence Interv al for StDev 5,915 6,138 Mean Median 97,0 97,5 98,0 98,5 99,0 99,5 Forma: A análise dos dados e gráficos acima nos permite verificar que se trata de uma variável com características diferentes das até aqui estudadas, pois não havíamos visto até então uma distribuição dos dados assimétrica negativa à esquerda. Como dito, a distribuição é pouco assimétrica, com a mediana próxima do centro, indicando normalidade. Há apenas um pico pronunciado, que se refere aos municípios com taxa de 100% das residências servidas por energia elétrica. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta pouca assimetria da distribuição. A posição da linha da mediana perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 27,41% e 99,39% de percentual de residências com energia elétrica e a outra metade maior do que este valor e chegando até 100% de das residências, ou seja, quase 100% de todas as residências do País são servidas por energia elétrica. A taxa média dos municípios era de 97,19%, mas o desvio-padrão (medida de dispersão) apresenta o índice de 6,024%. A taxa mínima encontrada foi de 27,41% de residências servidas por energia elétrica no município, e a máxima de 100%, demonstrando grande amplitude entre os munícipios do País, chegando a em torno de 73%. A mediana é de 99,39%, estando muito próxima da média ( 97,19% ), o que por si confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 97,031% e 97,348%. O histograma acima mostra tratar-se de uma distribuição assimétrica negativa para a esquerda : T_AGUA Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável T_AGUA.

139 27 Summary for T_AGUA A nderson-darling Normality Test A -Squared 270,99 P-V alue < 0,005 Mean 85,598 StDev 14,721 V ariance 216,717 Skew ness -1,89166 Kurtosis 4,71167 N Minimum 0,150 1st Q uartile 79,635 Median 90,280 3rd Q uartile 96,260 Maximum 100,000 95% C onfidence Interv al for Mean 85,211 85,985 95% C onfidence Interv al for Median 89,870 90,701 95% Confidence Intervals 95% C onfidence Interv al for StDev 14,453 15,000 Mean Median Forma: Como a T_LUZ, a análise dos dados e gráficos acima nos permite verificar que se trata de uma variável com características diferentes das até aqui até então estudadas, pois como a anterior tem uma distribuição dos dados assimétrica negativa à esquerda. Como dito, a distribuição é pouco assimétrica, com a mediana próxima do centro, indicando normalidade. Há apenas um pico pronunciado, que se refere aos municípios com taxa de 98% das residências servidas por água encanada. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta pouca assimetria da distribuição. A posição da linha da mediana perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 0,15% e 90,28% de percentual de residências com água encanada e a outra metade maior do que este valor e chegando até 100% de das residências, ou seja, grande parte das residências do País são servidas por água encanada. A taxa média dos municípios era de 85,598, mas o desvio-padrão (medida de dispersão) apresenta o índice de 14,721%. A taxa mínima encontrada foi de 0,15% de residências servidas por água encanada no município, e a máxima de 100%, demonstrando grande amplitude entre os munícipios do País, chegando a em torno de 100%. A mediana é de 90,28%, estando próxima da média ( 85,598% ), o que por si confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 85,211% e 85,985%. O histograma acima mostra tratar-se de uma distribuição assimétrica negativa para a esquerda : T_DENS Abaixo encontramos o quadro contendo os gráficos e valores da estatística descritiva da variável T_DENS.

140 28 Summary for T_DENS A nderson-darling Normality Test A -Squared 60,82 P-V alue < 0,005 Mean 25,127 StDev 12,999 V ariance 168,961 Skew ness 1,04504 Kurtosis 1,63411 N Minimum 0,650 1st Q uartile 15,410 Median 23,070 3rd Q uartile 32,580 Maximum 88,640 95% C onfidence Interv al for Mean 24,785 25,468 95% C onfidence Interv al for Median 22,689 23,551 95% Confidence Intervals 95% C onfidence Interv al for StDev 12,761 13,245 Mean Median 23,0 23,5 24,0 24,5 25,0 25,5 Forma: Verificamos na análise dos dados e gráficos acima, uma distribuição assimétrica positiva à direita. A distribuição é assimétrica, com a mediana um pouco longe do centro, porém indicando normalidade. Há apenas um pico principal, não tão pronunciado, que se refere aos municípios com índice na faixa de 16% de pessoas que vivem em domicílios com densidade superior a 2 pessoas por cômodo de dormitório residencial em relação ao total da população. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana não tão perto do centro do quadrado principal do Box-Plot nos confirma esta afirmativa. O teste de normalidade de Anderson-Darling indica tratar-se de uma distribuição Normal. Centro e Dispersão: A mediana nos indica que em 2010 aproximadamente metade dos municípios tinha entre 0,65% e 23,07% de pessoas nesta condição e a outra metade maior do que este valor e chegando até 88,64% de pessoas residindo em residências com densidade superior a 2 pessoas por cômodo de dormitório residencial. A média dos municípios era de 25,127% nesta condição, mas o desvio-padrão (medida de dispersão) apresentou o índice de 12,999%, mostrando um a dispersão relativamente alta da média. Os municípios com menos pessoas nesta condição, como dito possuíam 0,65% de densidade de pessoas nesta condição, e os com valores máximos possuíam 88,64% das pessoas nesta condição, demonstrando mais uma vez uma amplitude enorme entre os munícipios do País neste quesito, ou seja, com amplitude em torno de 88%. A mediana é de 22,07% das pessoas nesta condição, estando próxima da média ( 25,127% ), o que mais uma vez confirma uma assimetria não tão pronunciada na distribuição. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 24,785% e 25,468% das pessoas nesta condição. O histograma acima mostra tratar-se de uma distribuição assimétrica positiva para a direita. 3. CORRELAÇÕES E DENDOGRAMAS Segue abaixo as matrizes de correlações e os dendogramas entre as 21 variáveis quantitativas. Correlations: ESPVIDA; SOBRE40; SOBRE60; MORT1; T_MULCHEFEFI; T_RMAXIDOSO;...

141 29 ESPVIDA SOBRE40 SOBRE60 SOBRE40 0,504 0,000 SOBRE60 0,635 0,956 0,000 0,000 MORT1-0,967-0,463-0,591 0,000 0,000 0,000 T_MULCHEFEFIF014-0,565-0,174-0,242 0,000 0,000 0,000 T_RMAXIDOSO -0,726-0,212-0,306 0,000 0,000 0,000 IDHM 0,852 0,352 0,453 0,000 0,000 0,000 RDPC 0,784 0,313 0,412 0,000 0,000 0,000 I_FREQ_PROP 0,641 0,192 0,245 0,000 0,000 0,000 T_ANALF15M -0,824-0,286-0,388 0,000 0,000 0,000 E_ANOSESTUDO 0,441 0,163 0,190 0,000 0,000 0,000 P_SUPER 0,543 0,244 0,316 0,000 0,000 0,000 REN1-0,771-0,252-0,360 0,000 0,000 0,000 GINI -0,380 0,009-0,014 0,000 0,502 0,280 PPOB -0,837-0,257-0,359 0,000 0,000 0,000 RENOCUP 0,741 0,312 0,418 0,000 0,000 0,000 T_ATIV 0,609 0,174 0,257 0,000 0,000 0,000 P_FORMAL 0,709 0,228 0,310 0,000 0,000 0,000 T_LUZ 0,341 0,016 0,065 0,000 0,222 0,000 T_AGUA 0,549 0,152 0,238 0,000 0,000 0,000 T_DENS -0,589-0,054-0,141 0,000 0,000 0,000 MORT1 T_MULCHEFEFIF014 T_MULCHEFEFIF014 0,576 0,000 T_RMAXIDOSO T_RMAXIDOSO 0,724 0,522 0,000 0,000 IDHM -0,829-0,646-0,799 0,000 0,000 0,000

142 RDPC -0,744-0,571-0,772 0,000 0,000 0, I_FREQ_PROP -0,636-0,634-0,630 0,000 0,000 0,000 T_ANALF15M 0,825 0,556 0,802 0,000 0,000 0,000 E_ANOSESTUDO -0,454-0,469-0,474 0,000 0,000 0,000 P_SUPER -0,499-0,414-0,460 0,000 0,000 0,000 REN1 0,744 0,502 0,760 0,000 0,000 0,000 GINI 0,384 0,416 0,473 0,000 0,000 0,000 PPOB 0,818 0,649 0,863 0,000 0,000 0,000 RENOCUP -0,704-0,488-0,730 0,000 0,000 0,000 T_ATIV -0,611-0,456-0,740 0,000 0,000 0,000 P_FORMAL -0,678-0,469-0,715 0,000 0,000 0,000 T_LUZ -0,332-0,311-0,375 0,000 0,000 0,000 T_AGUA -0,546-0,413-0,544 0,000 0,000 0,000 T_DENS 0,594 0,634 0,563 0,000 0,000 0,000 IDHM RDPC I_FREQ_PROP RDPC 0,908 0,000 I_FREQ_PROP 0,862 0,686 0,000 0,000 T_ANALF15M -0,884-0,816-0,677 0,000 0,000 0,000 E_ANOSESTUDO 0,653 0,512 0,785 0,000 0,000 0,000 P_SUPER 0,698 0,700 0,517 0,000 0,000 0,000 REN1-0,859-0,800-0,609 0,000 0,000 0,000 GINI -0,424-0,274-0,530 0,000 0,000 0,000 PPOB -0,936-0,909-0,774 0,000 0,000 0,000 RENOCUP 0,869 0,929 0,588 0,000 0,000 0,000 T_ATIV 0,668 0,702 0,554 0,000 0,000 0,000

143 31 P_FORMAL 0,824 0,767 0,620 0,000 0,000 0,000 T_LUZ 0,490 0,386 0,529 0,000 0,000 0,000 T_AGUA 0,659 0,564 0,528 0,000 0,000 0,000 T_DENS -0,645-0,592-0,689 0,000 0,000 0,000 T_ANALF15M E_ANOSESTUDO P_SUPER E_ANOSESTUDO -0,492 0,000 P_SUPER -0,548 0,392 0,000 0,000 REN1 0,831-0,410-0,620 0,000 0,000 0,000 GINI 0,394-0,396-0,047 0,000 0,000 0,000 PPOB 0,874-0,575-0,580 0,000 0,000 0,000 RENOCUP -0,794 0,424 0,742 0,000 0,000 0,000 T_ATIV -0,678 0,422 0,255 0,000 0,000 0,000 P_FORMAL -0,770 0,459 0,599 0,000 0,000 0,000 T_LUZ -0,353 0,446 0,237 0,000 0,000 0,000 T_AGUA -0,631 0,410 0,456 0,000 0,000 0,000 T_DENS 0,536-0,517-0,336 0,000 0,000 0,000 REN1 GINI PPOB GINI 0,436 0,000 PPOB 0,871 0,562 0,000 0,000 RENOCUP -0,872-0,162-0,838 0,000 0,000 0,000 T_ATIV -0,497-0,423-0,754 0,000 0,000 0,000 P_FORMAL -0,913-0,467-0,834 0,000 0,000 0,000 T_LUZ -0,393-0,444-0,464 0,000 0,000 0,000 T_AGUA -0,667-0,323-0,629 0,000 0,000 0,000 T_DENS 0,477 0,552 0,709 0,000 0,000 0,000

144 Similarity 32 RENOCUP T_ATIV P_FORMAL T_ATIV 0,546 0,000 P_FORMAL 0,801 0,487 0,000 0,000 T_LUZ 0,323 0,301 0,415 0,000 0,000 0,000 T_AGUA 0,599 0,388 0,616 0,000 0,000 0,000 T_DENS -0,429-0,565-0,470 0,000 0,000 0,000 T_LUZ T_AGUA 0,408 0,000 T_AGUA T_DENS -0,505-0,427 0,000 0,000 O p-value de todas as correlações são significativos ao nível de 5%, o que indica que podemos considerar os índices de correlação. Percebemos também que existem muitas correlações relativamente fortes, acima de 0,50. As maiores correlações entre as variáveis são entre ESPVIDA X MORT1 negativa de -0,967 e entre SOBRE40 X SOBRE60 positiva de 0,956. Vejamos abaixo o dendograma que nada mais é do que as mesmas correlações acima, porém em forma gráfica, nos indicando mais claramente quais as variáveis que poderiam ser unidas. O gráfico corrobora os comentários efetuados acima. Dendrogram Single Linkage; Correlation Coefficient Distance 76,44 84,30 92,15 100,00 ESPVIDA-N MORT1-NP TMAXDOSO-NP IDHM-N PPOB-NP RDPC-N RENOCUP-N TANALF15M-NP REN1-NP PFORMAL-N IFREQPROP-N EANOSEST-N Variables TATIV-N PSUPER-N TDENS-NP TAGUA-N TMULHCHF14-NP SOBRE40-N SOBRE60-N GINI-NP TLUZ-N.4. ANÁLISE DOS COMPONENTES PRINCIPAIS O objetivo deste tópico é, através da análise dos componentes principais, tentarmos reduzir o número de variáveis, ou seja, percebermos as relações entre as variáveis e a possibilidade de agruparmos as mesmas. Certamente a análise de correlações e dendogramas acima já nos dão uma

145 33 idéia de que a possibilidade de agrupamento é grande pelos elevados índices de correlação entre todas as variáveis: Segue abaixo o resultado das análises dos componentes principais juntamente com o gráfico de EigenValue. Principal Component Analysis: ESPVIDA-N; SOBRE40-N; SOBRE60-N; MORT1-NP; TMAXDO Eigenanalysis of the Correlation Matrix Eigenvalue 9,2991 1,7366 0,5586 0,4218 0,3140 0,2655 0,1568 0,0934 Proportion 0,715 0,134 0,043 0,032 0,024 0,020 0,012 0,007 Cumulative 0,715 0,849 0,892 0,924 0,948 0,969 0,981 0,988 Eigenvalue 0,0652 0,0335 0,0232 0,0182 0,0143 Proportion 0,005 0,003 0,002 0,001 0,001 Cumulative 0,993 0,996 0,998 0,999 1,000 Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 ESPVIDA-N 0,300-0,151 0,134-0,384 0,125-0,281-0,252-0,011 SOBRE40-N 0,140-0,664-0,030 0,228-0,011 0,235 0,107-0,114 SOBRE60-N 0,176-0,632-0,048 0,077-0,017 0,064-0,013 0,091 MORT1-NP 0,293-0,130 0,199-0,496 0,143-0,279-0,183 0,069 TMAXDOSO-NP 0,278 0,142 0,022-0,294-0,454 0,709-0,163 0,173 IDHM-N 0,318 0,064 0,174 0,213 0,013-0,074 0,081 0,101 RDPC-N 0,301 0,077-0,112 0,239-0,456-0,307-0,133-0,402 TANALF15M-NP 0,300 0,083 0,025-0,249-0,016-0,016 0,886-0,174 REN1-NP 0,297 0,125-0,363 0,009 0,349 0,084 0,032 0,491 PPOB-NP 0,313 0,137 0,066-0,012-0,096 0,079-0,170-0,345 RENOCUP-N 0,294 0,070-0,385 0,262-0,286-0,317 0,003 0,395 PFORMAL-N 0,282 0,150-0,344 0,149 0,552 0,246-0,160-0,437 IFREQPROP-N 0,250 0,147 0,702 0,455 0,177 0,077-0,008 0,185 Variable PC9 PC10 PC11 PC12 PC13 ESPVIDA-N 0,034 0,446-0,546 0,251 0,042 SOBRE40-N -0,072-0,437-0,424 0,006 0,176 SOBRE60-N -0,001 0,454 0,525 0,001-0,259 MORT1-NP 0,165-0,547 0,314-0,221-0,038 TMAXDOSO-NP 0,206 0,040-0,051-0,056-0,008 IDHM-N 0,047 0,204 0,177-0,231 0,817 RDPC-N -0,017 0,059-0,137-0,517-0,249 TANALF15M-NP 0,047 0,050-0,013 0,066-0,124 REN1-NP -0,479 0,008-0,148-0,345-0,151 PPOB-NP -0,661-0,124 0,248 0,444 0,066 RENOCUP-N 0,280-0,194 0,033 0,486-0,017 PFORMAL-N 0,408 0,013 0,068 0,061-0,028 IFREQPROP-N 0,089-0,046-0,079 0,066-0,353

146 34 0,2 0,1 Loading Plot of ESPVIDA-N;...; IFREQPROP-N IFREQPROP-N TMAXDOSO-NP PFORMAL-N REN1-NP PPOB-NP RENOCUP-N TANALF15M-NP RDPC-N IDHM-N Second Component 0,0-0,1-0,2-0,3-0,4-0,5 MORT1-NP ESPVIDA-N -0,6 SOBRE60-N SOBRE40-N -0,7 0,00 0,05 0,10 0,15 0,20 First Component 0,25 0,30 0,35 Scree Plot of ESPVIDA-N;...; IFREQPROP-N Eigenvalue Component Number Primeiramente selecionaremos as variáveis com correlações mais fortes das 21 relacionadas, ou seja, com correlações entre si de 0,80 ou mais. Por este critério de seleção, encontraremos 13 variáveis que relacionadas entre si, tem correlação igual ou superior a 0,80: - ESPVIDA-N, SOBRE40-N, SOBRE60-N, MORT1-NP, IDHM-M, TANALF15M-NP, PPOB-NP, RDPC-N, IFREQPROP-N, TMAXIDOSO-NP, REN1-NP, RENOCUP-N e PFORMAL-N. Pela análise dos detalhes e gráfico acima percebemos que se juntarmos as 13 variáveis em apenas 1 (PC1) teremos um proporção de 71,5%, com 2 (PC1 e PC2) chegamos a 85% e assim por diante. Isto é algo extremamente significativo, pois ao invés de trabalharmos com 13 variáveis poderíamos trabalhar com o índice PC1, que já explica 71,5% das variáveis ou com PC1 e PC2 que explicam 85% das variáveis.

147 C100 C Pela análise dos valores / participação de cada variável no índice PC1, poderíamos denominá-lo média, uma vez que as participações são bastante equitativas e possuem o mesmo sinal Scatterplot of C100 vs C101 REGIÃO CO N NE S SE ,0-2,5 0,0 C101 2,5 5,0 Scatterplot of C100 vs C ,0-2,5 0,0 C101 2,5 5,0 ESTA DO A C A L A M A P BA C E DF ES GO MA MG MS MT PA PB PE PI PR RJ RN RO RR RS SC SE SP Agora fazendo-se o stepwise regression para a PC1 teremos: Stepwise Regression: C100 versus ESPVIDA-N; SOBRE40-N;... Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15

148 36 Response is C100 on 13 predictors, with N = 5565 Step Constant -9,906-9,956-9,560-10,890-10,082-10,835 IDHM-N 18,238 13,051 9,870 8,729 6,573 6,507 T-Value 296,56 154,38 123,75 126,69 93,59 126,09 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 ESPVIDA-N 4,912 4,417 4,168 4,139 3,233 T-Value 72,01 85,39 97,74 118,16 111,90 P-Value 0,000 0,000 0,000 0,000 0,000 REN1-NP 2,746 2,337 2,262 2,475 T-Value 65,75 66,59 78,39 115,53 P-Value 0,000 0,000 0,000 0,000 TMAXDOSO-NP 2,897 2,499 2,896 T-Value 52,22 54,09 84,09 P-Value 0,000 0,000 0,000 RDPC-N 3,653 3,632 T-Value 51,80 70,10 P-Value 0,000 0,000 SOBRE40-N 1,461 T-Value 68,85 P-Value 0,000 S 0,744 0,535 0,401 0,329 0,270 0,198 R-Sq 94,05 96,92 98,27 98,84 99,22 99,58 R-Sq(adj) 94,05 96,92 98,27 98,84 99,22 99,58 Step Constant -10,72-10,67-10,92-11,03-11,12-10,81 IDHM-N 5,869 5,528 5,410 2,991 2,406 2,337 T-Value 127,71 147,73 177,85 60,90 56,87 109,26 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 ESPVIDA-N 2,920 3,009 1,465 1,598 1,798 1,764 T-Value 114,70 146,72 44,18 60,25 80,58 156,30 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 REN1-NP 2,3011 1,5000 1,5418 1,8938 1,5734 1,1665 T-Value 123,81 72,11 91,32 127,83 113,90 151,88 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 TMAXDOSO-NP 2,5489 2,5279 2,4204 2,3736 2,4526 2,0428 T-Value 84,42 104,24 122,46 150,58 186,56 276,63 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 RDPC-N 3,658 3,618 3,937 4,723 3,765 2,303 T-Value 83,12 102,32 134,48 174,05 128,04 122,58 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 SOBRE40-N 1,5625 1,5764 1,6204 1,7902 1,7577 1,8476 T-Value 86,08 108,11 136,73 180,76 213,68 438,07 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 TANALF15M-NP 1,1232 1,1870 1,0070 1,1957 1,2632 1,2452 T-Value 46,33 60,86 62,30 89,91 113,87 222,01 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 PFORMAL-N 1,1317 1,1842 1,1506 1,2348 1,1988 T-Value 55,31 71,25 86,84 111,26 213,43 P-Value 0,000 0,000 0,000 0,000 0,000 MORT1-NP 1,774 1,752 1,704 1,558

149 T-Value 53,81 66,69 78,27 140,81 P-Value 0,000 0,000 0,000 0, IFREQPROP-N 1,435 1,832 1,579 T-Value 56,60 81,69 137,26 P-Value 0,000 0,000 0,000 RENOCUP-N 1,674 2,692 T-Value 50,46 144,91 P-Value 0,000 0,000 PPOB-NP 1,1757 T-Value 127,21 P-Value 0,000 S 0,169 0,135 0,110 0,0874 0,0724 0,0366 R-Sq 99,69 99,80 99,87 99,92 99,94 99,99 R-Sq(adj) 99,69 99,80 99,87 99,92 99,94 99,99 Step 13 Constant -10,84 IDHM-N 1,96123 T-Value * P-Value * ESPVIDA-N 1,49322 T-Value * P-Value * REN1-NP 1,16530 T-Value * P-Value * TMAXDOSO-NP 2,03129 T-Value * P-Value * RDPC-N 2,41195 T-Value * P-Value * SOBRE40-N 0,92332 T-Value * P-Value * TANALF15M-NP 1,32331 T-Value * P-Value * PFORMAL-N 1,26151 T-Value * P-Value * MORT1-NP 1,57119 T-Value * P-Value * IFREQPROP-N 1,80776 T-Value * P-Value * RENOCUP-N 2,61384 T-Value * P-Value * PPOB-NP 1,24953 T-Value * P-Value * SOBRE60-N 1,20094 T-Value *

150 P-Value * 38 S 0, R-Sq 100,00 R-Sq(adj) 100,00 Stepwise Regression: C100 versus ESPVIDA-N; SOBRE40-N;... Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is C100 on 13 predictors, with N = 5565 Step Constant -9,906-9,956-9,560-10,890-10,082-10,835 IDHM-N 18,238 13,051 9,870 8,729 6,573 6,507 T-Value 296,56 154,38 123,75 126,69 93,59 126,09 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 ESPVIDA-N 4,912 4,417 4,168 4,139 3,233 T-Value 72,01 85,39 97,74 118,16 111,90 P-Value 0,000 0,000 0,000 0,000 0,000 REN1-NP 2,746 2,337 2,262 2,475 T-Value 65,75 66,59 78,39 115,53 P-Value 0,000 0,000 0,000 0,000 TMAXDOSO-NP 2,897 2,499 2,896 T-Value 52,22 54,09 84,09 P-Value 0,000 0,000 0,000 RDPC-N 3,653 3,632 T-Value 51,80 70,10 P-Value 0,000 0,000 SOBRE40-N 1,461 T-Value 68,85 P-Value 0,000 S 0,744 0,535 0,401 0,329 0,270 0,198 R-Sq 94,05 96,92 98,27 98,84 99,22 99,58 R-Sq(adj) 94,05 96,92 98,27 98,84 99,22 99,58 Step Constant -10,72-10,67-10,92-11,03-11,12-10,81 IDHM-N 5,869 5,528 5,410 2,991 2,406 2,337 T-Value 127,71 147,73 177,85 60,90 56,87 109,26 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 ESPVIDA-N 2,920 3,009 1,465 1,598 1,798 1,764 T-Value 114,70 146,72 44,18 60,25 80,58 156,30 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 REN1-NP 2,3011 1,5000 1,5418 1,8938 1,5734 1,1665 T-Value 123,81 72,11 91,32 127,83 113,90 151,88 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 TMAXDOSO-NP 2,5489 2,5279 2,4204 2,3736 2,4526 2,0428 T-Value 84,42 104,24 122,46 150,58 186,56 276,63 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 RDPC-N 3,658 3,618 3,937 4,723 3,765 2,303 T-Value 83,12 102,32 134,48 174,05 128,04 122,58 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 SOBRE40-N 1,5625 1,5764 1,6204 1,7902 1,7577 1,8476 T-Value 86,08 108,11 136,73 180,76 213,68 438,07 P-Value 0,000 0,000 0,000 0,000 0,000 0,000

151 39 TANALF15M-NP 1,1232 1,1870 1,0070 1,1957 1,2632 1,2452 T-Value 46,33 60,86 62,30 89,91 113,87 222,01 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 PFORMAL-N 1,1317 1,1842 1,1506 1,2348 1,1988 T-Value 55,31 71,25 86,84 111,26 213,43 P-Value 0,000 0,000 0,000 0,000 0,000 MORT1-NP 1,774 1,752 1,704 1,558 T-Value 53,81 66,69 78,27 140,81 P-Value 0,000 0,000 0,000 0,000 IFREQPROP-N 1,435 1,832 1,579 T-Value 56,60 81,69 137,26 P-Value 0,000 0,000 0,000 RENOCUP-N 1,674 2,692 T-Value 50,46 144,91 P-Value 0,000 0,000 PPOB-NP 1,1757 T-Value 127,21 P-Value 0,000 S 0,169 0,135 0,110 0,0874 0,0724 0,0366 R-Sq 99,69 99,80 99,87 99,92 99,94 99,99 R-Sq(adj) 99,69 99,80 99,87 99,92 99,94 99,99 Step 13 Constant -10,84 IDHM-N 1,96123 T-Value * P-Value * ESPVIDA-N 1,49322 T-Value * P-Value * REN1-NP 1,16530 T-Value * P-Value * TMAXDOSO-NP 2,03129 T-Value * P-Value * RDPC-N 2,41195 T-Value * P-Value * SOBRE40-N 0,92332 T-Value * P-Value * TANALF15M-NP 1,32331 T-Value * P-Value * PFORMAL-N 1,26151 T-Value * P-Value * MORT1-NP 1,57119 T-Value * P-Value * IFREQPROP-N 1,80776 T-Value * P-Value *

152 RENOCUP-N 2,61384 T-Value * P-Value * 40 PPOB-NP 1,24953 T-Value * P-Value * SOBRE60-N 1,20094 T-Value * P-Value * S 0, R-Sq 100,00 R-Sq(adj) 100,00 Fazendo-se o stepwise regression para a PC2 teremos: Stepwise Regression: C101 versus ESPVIDA-N; SOBRE40-N;... Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is C101 on 13 predictors, with N = 5565 Step Constant 4,544 3,910 3,918 3,845 3,540 3,508 SOBRE40-N -7,581-8,548-3,527-3,603-3,443-4,453 T-Value -134,65-293,47-48,38-62,64-73,70-127,20 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 PPOB-NP 2,285 2,684 1,832 0,819 1,346 T-Value 129,20 193,29 100,10 34,18 74,79 P-Value 0,000 0,000 0,000 0,000 0,000 SOBRE60-N -5,643-5,586-6,052-4,326 T-Value -71,93-90,23-118,88-103,33 P-Value 0,000 0,000 0,000 0,000 PFORMAL-N 1,143 0,937 0,940 T-Value 58,09 57,09 82,46 P-Value 0,000 0,000 0,000 IDHM-N 2,047 2,379 T-Value 53,90 88,96 P-Value 0,000 0,000 ESPVIDA-N -1,392 T-Value -77,14 P-Value 0,000 S 0,639 0,319 0,230 0,181 0,147 0,102 R-Sq 76,52 94,13 96,96 98,11 98,76 99,40 R-Sq(adj) 76,52 94,13 96,96 98,11 98,76 99,40 Step Constant 2,915 3,005 2,912 2,870 2,967 2,991 SOBRE40-N -4,3881-4,1927-4,3077-4,2484-4,2372-4,3388 T-Value -175,76-195,31-224,40-264,72-342,58-754,06 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 PPOB-NP 0,8230 0,7761 0,7812 0,7298 0,7228 0,7302 T-Value 56,10 62,49 71,16 79,23 101,81 222,77 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 SOBRE60-N -4,3910-4,6725-4,4758-4,5061-4,5441-4,3599 T-Value -147,09-180,54-191,17-230,75-301,71-616,59 P-Value 0,000 0,000 0,000 0,000 0,000 0,000

153 41 PFORMAL-N 0,9437 0,8429 0,8968 0,6801 0,6509 0,6791 T-Value 116,12 117,42 138,18 97,63 120,77 272,09 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 IDHM-N 2,4506 2,1511 1,1938 1,0572 1,1140 0,5766 T-Value 128,40 124,34 41,63 43,93 59,99 61,61 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 ESPVIDA-N -1,4076-1,3180-1,2420-1,2789-0,7166-0,6907 T-Value -109,40-119,60-125,07-153,86-64,30-134,15 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 TMAXDOSO-NP 1,0384 1,0073 1,0528 1,0421 1,0901 1,0057 T-Value 73,38 84,22 99,01 117,51 158,49 311,43 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 RENOCUP-N 0,7620 1,2067 1,0247 0,9425 1,0679 T-Value 47,42 66,55 65,85 78,12 189,40 P-Value 0,000 0,000 0,000 0,000 0,000 IFREQPROP-N 0,6347 0,7558 0,7466 0,9734 T-Value 39,46 55,44 71,05 190,76 P-Value 0,000 0,000 0,000 0,000 REN1-NP 0,3831 0,4006 0,3494 T-Value 49,38 66,94 125,40 P-Value 0,000 0,000 0,000 MORT1-NP -0,6250-0,7665 T-Value -61,64-160,22 P-Value 0,000 0,000 TANALF15M-NP 0,3594 T-Value 143,19 P-Value 0,000 S 0,0728 0,0614 0,0543 0,0453 0,0349 0,0161 R-Sq 99,70 99,78 99,83 99,88 99,93 99,99 R-Sq(adj) 99,69 99,78 99,83 99,88 99,93 99,99 Step 13 Constant 2,978 SOBRE40-N -4,36565 T-Value * P-Value * PPOB-NP 0,54790 T-Value * P-Value * SOBRE60-N -4,31896 T-Value * P-Value * PFORMAL-N 0,66955 T-Value * P-Value * IDHM-N 0,39548 T-Value * P-Value * ESPVIDA-N -0,75249 T-Value * P-Value * TMAXDOSO-NP 1,03306 T-Value * P-Value *

154 RENOCUP-N 0,62541 T-Value * P-Value * 42 IFREQPROP-N 1,06200 T-Value * P-Value * REN1-NP 0,49191 T-Value * P-Value * MORT1-NP -0,69895 T-Value * P-Value * TANALF15M-NP 0,36487 T-Value * P-Value * RDPC-N 0,61792 T-Value * P-Value * S 0, R-Sq 100,00 R-Sq(adj) 100,00 Agora vamos fazer ANOVA para PC1 utilizando as cinco regiões geográficas do País: One-way ANOVA: C100 versus REGIÃO Source DF SS MS F P REGIÃO , , ,49 0,000 Error ,56 3,65 Total ,02 S = 1,910 R-Sq = 60,80% R-Sq(adj) = 60,77% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 466 1,326 1,416 (*) N 449-1,414 2,117 (-*) NE ,158 1,785 (*) S ,503 1,658 (* SE ,624 2,241 (* ,0-1,5 0,0 1,5 Pooled StDev = 1,910

155 C Boxplot of C CO N NE REGIÃO S SE Por último vamos fazer ANOVA para PC2 utilizando as cinco regiões geográficas do País: One-way ANOVA: C101 versus REGIÃO Source DF SS MS F P REGIÃO ,38 597,59 456,91 0,000 Error ,95 1,31 Total ,33 S = 1,144 R-Sq = 24,74% R-Sq(adj) = 24,69% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev CO 466 0,775 0,807 (*-) N 449-1,593 1,128 (*-) NE ,447 1,425 (* S ,137 0,981 (*) SE ,595 0,985 (* ,40-0,70 0,00 0,70 Pooled StDev = 1,144

156 44 Boxplot of C101 5,0 2,5 C101 0,0-2,5-5,0 CO N NE REGIÃO S SE De acordo com todas as análises acima, percebemos claramente que o agrupamento de variáveis é bastante pertinente no caso das 13 variáveis selecionadas. Isto pôde ser observado inicialmente pelas matrizes de correlação e dendogramas e depois comprovados pela análise dos componentes principais. Assim, ao invés de trabalharmos com um grupo grande de variáveis (13) poderíamos utilizar apenas um ou dois índices (PC1 ou PC1 e PC2) que as represente satisfatoriamente. As proporções de participação de cada uma das variáveis em PC1 são muito parecidas. Já em relação a PC2, há algumas variações como, por exemplo, quatro delas ( ESPVIDA-N, SOBRE40-N, SOBRE60-N e MORT1-NP ) tem sinal negativo e as nove demais tem sinal positivo. 5. COMPONENTES PRINCIPAIS E A CLASSIFICAÇÃO DOS ESTADOS ( RANKING ) NO DESENVOVIMENTO HUMANO. Para fazermos um ranking dos Estados que apresentavam os melhores indicadores de desenvolvimento humano em sete variáveis no censo demográfico de 2.010, nesta etapa, pegaremos apenas, como dito, as sete variáveis normalizadas e positivadas e suas respectivas médias por Estado da Federação, sendo uma da dimensão demografia ESPVIDA, uma da dimensão educação T_ANALF15M, duas da dimensão vulnerabilidade MORT1 e T_RMAXIDOSO e finalmente três variáveis da dimensão renda REND1, GINI e PPOB, que apresentam os seguintes dados: EST. ESPVIDA T_ANALF15M MORT1 T_RMAXIDOSO REND1 GINI PPOB AC 0,4267 0,4701 0, , ,5063 0,3698 0,2946 AL 0,3049 0,2725 0, , ,3768 0,5107 0,2205 AM 0,4216 0,5776 0,6202 0,71 0,3548 0,3465 0,1981 AP 0,5044 0,7283 0, , ,5916 0,357 0,3386 BA 0,3951 0,4728 0, , ,3592 0,5276 0,2995 CE 0,4029 0,394 0, , ,2944 0,5235 0,2644 ES 0,6924 0,7265 0, , ,6536 0,5856 0,6245 GO 0,6914 0,4034 0, , ,7597 0,6142 0,6625 MA 0,3097 0,7122 0, , ,2893 0,4646 0,197

157 MG 0,684 0,7599 0, ,8248 0,66 0,6283 0,5677 MS 0,6733 0,7493 0, , ,7637 0,5446 0,6338 MT 0,6547 0,6339 0,779 0, ,7724 0,5616 0,631 PA 0,4621 0,3404 0, , ,4328 0,452 0,2739 PB 0,3777 0,397 0, , ,316 0,5768 0,2941 PE 0,3774 0,3186 0, ,6909 0,3958 0,5392 0,3027 PI 0,35 0,7832 0, , ,2612 0,5012 0,2466 PR 0,669 0,8429 0, , ,7206 0,6429 0,7062 RJ 0,6491 0,4093 0, , ,8449 0,5968 0,6942 RN 0,4093 0,7533 0, , ,4302 0,5752 0,3307 RO 0,5266 0,5976 0, , ,6006 0,5218 0,5333 RR 0,5685 0,8666 0, , ,4987 0,2885 0,2776 RS 0,7587 0,8697 0, , ,6737 0,6419 0,7701 SC 0,788 0,4329 0, , ,7782 0,6899 0,8178 SE 0,3782 0,846 0, , ,4196 0,5646 0,2991 SP 0,7387 0,6049 0, , ,8557 0,6746 0,7926 TO 0,5308 0,4701 0, , ,569 0,4975 0, Componentes principais Fazendo a análise de componentes principais destas sete variáveis, chegaremos ao seguinte: Principal Component Analysis: Mean ESPVIDA; Mean GINI; Mean TANALF1; Mean MORT1 Eigenanalysis of the Correlation Matrix Eigenvalue 5,1022 1,0430 0,6313 0,1363 0,0545 0,0221 0,0107 Proportion 0,729 0,149 0,090 0,019 0,008 0,003 0,002 Cumulative 0,729 0,878 0,968 0,988 0,995 0,998 1,000 Variable PC1 PC2 PC3 PC4 PC5 PC6 PC7 Mean ESPVIDA 0,432-0,059-0,134-0,365 0,189-0,649 0,449 Mean GINI 0,280 0,438 0,793-0,089 0,039 0,201 0,227 Mean TANALF15M 0,111-0,881 0,448 0,083 0,058 0,029-0,004 Mean MORT1 0,417-0,115-0,249-0,630-0,023 0,569-0,172 Mean PPOB 0,435 0,111 0,122 0,101-0,085-0,374-0,791 Mean REND1 0,420 0,038-0,228 0,547 0,631 0,256 0,082 Mean TRMAXIDOSO 0,427-0,038-0,157 0,381-0,744 0,091 0,291 Observando-se os resultados, vemos que somente dois componentes principais apresentam Eigenvalue acima de 1,0, que seriam o PC1 com eigenvalue de 5,1022 e PC2 com 1,0430; os demais estão todos com valores abaixo de 1. Visto isto, iremos fazer nova análise de componentes principais, porém agora limitando a somente dois componentes. Seguem os resultados desta análise abaixo: Principal Component Analysis: Mean ESPVIDA; Mean GINI; Mean TANALF1; Mean MORT1 Eigenanalysis of the Correlation Matrix Eigenvalue 5,1022 1,0430 0,6313 0,1363 0,0545 0,0221 0,0107 Proportion 0,729 0,149 0,090 0,019 0,008 0,003 0,002 Cumulative 0,729 0,878 0,968 0,988 0,995 0,998 1,000 Variable PC1 PC2

158 Mean ESPVIDA 0,432-0,059 Mean GINI 0,280 0,438 Mean TANALF15M 0,111-0,881 Mean MORT1 0,417-0,115 Mean PPOB 0,435 0,111 Mean REND1 0,420 0,038 Mean TRMAXIDOSO 0,427-0, Análise Stepwise dos Componentes principais Para que possamos prosseguir em nossos estudos e montar o ranking dos Estados, iremos fazer uma análise de Stepwise com o PC1 ( Componente Principal 1 ), que segue abaixo: Stepwise Regression: PC1 versus Mean ESPVIDA; Mean GINI;... Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is PC1 on 7 predictors, with N = 26 Step Constant -4,729-6,636-6,693-6,883-7,723-10,151 Mean PPOB 10,55 7,38 6,27 6,26 4,92 3,25 T-Value 26,18 16,91 13,48 17,85 7,29 6,01 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 Mean MORT1 4,94 4,24 3,78 4,34 4,30 T-Value 8,26 8,15 9,30 9,71 14,77 P-Value 0,000 0,000 0,000 0,000 0,000 Mean REND1 1,89 2,13 2,74 2,41 T-Value 3,65 5,41 6,07 8,04 P-Value 0,001 0,000 0,000 0,000 Mean TANALF15M 0,618 0,690 0,644 T-Value 4,21 4,99 7,13 P-Value 0,000 0,000 0,000 Mean GINI 1,30 2,33 T-Value 2,25 5,50 P-Value 0,036 0,000 Mean TRMAXIDOSO 3,65 T-Value 5,31 P-Value 0,000 S 0,424 0,218 0,176 0,132 0,121 0,0788 R-Sq 96,62 99,15 99,47 99,71 99,77 99,91 R-Sq(adj) 96,48 99,07 99,40 99,66 99,71 99,88 Step 7 Constant -10,64 Mean PPOB 2,06805 T-Value * P-Value * Mean MORT1 2,71425 T-Value * P-Value * Mean REND1 2,22513 T-Value * P-Value * Mean TANALF15M 0,58314 T-Value *

159 P-Value * 47 Mean GINI 2,73251 T-Value * P-Value * Mean TRMAXIDOSO 4,31589 T-Value * P-Value * Mean ESPVIDA 2,82018 T-Value * P-Value * S 0, R-Sq 100,00 R-Sq(adj) 100,00 E agora, prosseguindo em nossos estudos, faremos uma análise de Stepwise com o PC2 ( Componente Principal 2 ), que segue abaixo: Stepwise Regression: PC2 versus Mean ESPVIDA; Mean GINI;... Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is PC2 on 7 predictors, with N = 26 Step Constant 2,8681 0,5746 0,6917 0,9646 0,8846 0,8902 Mean TANALF15M -4,832-4,784-4,654-4,657-4,645-4,639 T-Value -10,10-52,86-145,55-274,53-316,39-411,74 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 Mean GINI 4,269 4,652 4,289 4,406 4,382 T-Value 25,44 73,52 73,30 71,84 93,10 P-Value 0,000 0,000 0,000 0,000 0,000 Mean MORT1-0,589-0,979-0,969-0,796 T-Value -13,44-17,32-20,41-14,03 P-Value 0,000 0,000 0,000 0,000 Mean PPOB 0,409 0,234 0,330 T-Value 7,56 3,26 5,52 P-Value 0,000 0,004 0,000 Mean REND1 0,151 0,166 T-Value 3,16 4,52 P-Value 0,005 0,000 Mean ESPVIDA -0,309 T-Value -3,94 P-Value 0,001 S 0,455 0,0860 0,0290 0,0154 0,0129 0,00979 R-Sq 80,97 99,35 99,93 99,98 99,99 99,99 R-Sq(adj) 80,17 99,29 99,92 99,98 99,98 99,99 Step 7 Constant 1,145 Mean TANALF15M -4,63271 T-Value * P-Value *

160 Mean GINI 4,26838 T-Value * P-Value * 48 Mean MORT1-0,74964 T-Value * P-Value * Mean PPOB 0,52833 T-Value * P-Value * Mean REND1 0,20351 T-Value * P-Value * Mean ESPVIDA -0,38488 T-Value * P-Value * Mean TRMAXIDOSO -0,38131 T-Value * P-Value * S 0, R-Sq 100,00 R-Sq(adj) 100,00 Agora sim, com base nos resultados das análises de componentes principais e na análise Stepwise dos dois componentes principais, e aplicando a equação apropriada, obtivemos os seguintes dados: ESTADOS DADOS IND. DES. HUMANO AC 0, AL 0, AM 0, AP 0, BA 0, CE 0, ES 0,55977 GO 0, MA 0,24515 MG 0, MS 0, MT 0, PA 0, PB 0, PE 0, PI 0, PR 0,6333 RJ 0, RN 0, RO 0, RR 0, RS 0,682328

161 SC 0, SE 0, SP 0, TO 0, Para transformar estes dados em um escala de 0 a 100 e obter a classificação em ordem decrescente do melhor Estado em desenvolvimento humano no censo de 2010 para o pior, usaremos a fórmula CY=100*(cX-MIN(cX))/(MAX(cX)-MIN(cX)). Diante disto, chegamos ao seguinte resultado: CLASSIFICAÇÃO ESTADOS IND. PROP. DES. HUMANO 1 RS SP 96,57 3 SC 96,22 4 PR 89,63 5 RJ 76,33 6 MS 75,33 7 ES 74,07 8 MT 72,30 9 GO 71,74 10 MG 66,53 11 RO 56,27 12 TO 30,10 13 RN 29,84 14 AP 29,69 15 SE 27,21 16 RR 23,91 17 BA 17,61 18 PI 17,26 19 AC 15,99 20 PB 15,09 21 PE 14,18 22 CE 10,49 23 PA 10,32 24 MA 7,50 25 AM 4,44 26 AL 0 CONSIDERAÇÕES FINAIS De acordo com todas as análises acima, podemos constatar que considerando-se as sete variáveis selecionadas do censo demográfico dos municípios do Brasil do ano de 2.010, que são da dimensão demografia ESPVIDA ( Número médio de anos que as pessoas deverão viver a partir do nascimento, se permanecerem constantes ao longo da vida o nível e o padrão de mortalidade por idade prevalecentes no ano do Censo ), da dimensão educação T_ANALF15M ( Razão entre a população de 15 anos ou mais de idade que não sabe ler nem escrever um bilhete simples e o total de pessoas nesta faixa etária multiplicado por 100 ), da dimensão vulnerabilidade MORT1 ( Número de crianças que não deverão sobreviver ao primeiro ano de vida em cada crianças nascidas vivas ) e T_RMAXIDOSO (Razão entre as pessoas que vivem em domicílios vulneráveis à pobreza (com renda per capita inferior a 1/2 salário mínimo de agosto de 2010) e nos quais a

162 50 principal fonte de renda provém de moradores com 65 anos ou mais de idade e população total residente em domicílios particulares permanentes multiplicado por 100 ) e finalmente da dimensão renda REND1 ( Razão entre o número de pessoas de 18 anos ou mais de idade ocupadas e com rendimento mensal de todos os trabalhos inferior a 1 salário mínimo de julho de 2010 e o número total de pessoas ocupadas nessa faixa etária multiplicado por 100 ), GINI ( Mede o grau de desigualdade existente na distribuição de indivíduos segundo a renda domiciliar per capita. Seu valor varia de 0, quando não há desigualdade ( a renda domiciliar per capita de todos os indivíduos tem o mesmo valor ), a 1, quando a desigualdade é máxima ( apenas um indivíduo detém toda a renda ).O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes ) e PPOB (Proporção dos indivíduos com renda domiciliar per capita igual ou inferior a R$ 255,00 mensais, em reais de agosto de 2010, equivalente a 1/2 salário mínimo nessa data. O universo de indivíduos é limitado àqueles que vivem em domicílios particulares permanentes ). Desta forma, considerando-se estas sete variáveis, o Estado que estava em melhor situação em indicadores de desenvolvimento humano no ano de é o Rio Grande do Sul, com índice 100, seguido do Estado de São Paulo com índice 96,57 e em terceiro o Estado de Santa Catarina, com índice de 96,22. Do outro lado da tabela temos como o pior Estado em índices de desenvolvimento humano, considerando-se estas sete variáveis, o Estado de Alagoas com índice 0, lembrando que estes índices foram usados apenas para um rankeamento proporcional dos Estados, pois na verdade a média normalizada e positivada de Alagoas para estas sete variáveis, obtida na fórmula que aplicamos foi 0,285 e do melhor Estado o Rio Grande do Sul foi de 0,682; prosseguindo vemos que o Amazonas é o penúltimo pior Estado com índice de 4,44 e em seguida como o antepenúltimo pior Estado o Maranhão com índice 7,5. Se considerarmos neste ranking as regiões geográficas do País, podemos ver que os três Estados ( RS, SC e PR ) da região SUL ficaram nos quatro primeiros melhores lugares, e os quatro Estados ( SP, MG, RJ e ES ) da região SUDESTE e os três ( GO, MS e MT ) da região CENTRO- OESTE ficaram entre os dez melhores, desta forma temos as três regiões S, SE e CO entre os dez melhores Estados do Brasil e nenhum Estado das regiões NE e N entre os dez primeiros. REFERÊNCIAS ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatística aplicada à administração e economia. 2. ed. São Paulo: Thomson Learning, ATLAS DO DESENVOLVIMENTO HUMANO NO BRASIL. Disponível em: < Acessado em: 17 mar IBGE, Instituto Brasileiro de Geografia e Estatística. Séries Históricas e Estatísticas. Disponível em: < Acessado em: 30 mar LAS CASAS A., DE HOYOS A. Pesquisa de Marketing. São Paulo, Ed. Atlas, 2010.

163 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL ATLAS BRASIL CLASSIFICAÇÃO: Da Visão Não Supervisionada a Supervisionada, Utilizando 21 variáveis selecionadas do Atlas Brasil. DISCIPLINA: MÉTODOS QUALITATIVOS E QUANTITATIVOS EM ADMINISTRAÇÃO PROF. ARNOLDO JOSÉ DE HOYOS GUEVARA Odair Gomes Salles 1º SEMESTRE DE 2017 São Paulo SP 2017

164 SUMÁRIO INTRODUÇÃO... 3 CAPÍTULO I. ENTENDENDO OS DADOS Os Indivíduos As Variáveis A Tabela de Dados... 5 CAPÍTULO II. ANÁLISE DAS VARIÁVEIS Variáveis qualitativa ou categórica : Município quantitativa Análise comparativa das variáveis... 8 CAPÍTULO III. ANÁLISE DISCRIMINANTE Análise discriminante método Euclidiano Completo agrupamento com 7 clusters Dendrograma de clusterização Euclidiano completo com 7 clusters Análise discriminante método Euclidiano Completo agrupamento com 3 clusters Dendrograma de clusterização Euclidiana completo com 3 clusters após agrupamento Análise discriminante método Manhattan Completo agrupamento com 7 clusters Dendrograma de clusterização Manhattan completo com 7 clusters após agrupamento Análise discriminante método Manhattan Completo agrupamento com 3 clusters Dendrograma de clusterização Manhattan completo com 3 clusters após agrupamento...18 CAPÍTULO IV.MAPA DO BRASIL Os diferentes Brasis Os 2 Brasis comparando-se com 7 clusters e agrupando-os em 3 conglomerados método euclidiano completo Os 2 Brasis comparando-se com 7 clusters e agrupando-os em 3 conglomerados - método manhattan completo Os Brasis agrupados com 3 conglomerados...20 CONSIDERAÇÕES FINAIS...20 REFERÊNCIA

165 INTRODUÇÃO O Atlas do Desenvolvimento Humano no Brasil democratiza a informação no âmbito municipal e metropolitano. Seu objetivo é instrumentalizar a sociedade. Fortalece as capacidades locais, o aprimoramento da gestão pública e o empoderamento dos cidadãos. É constituído pelo Atlas do Desenvolvimento Humano nos Municípios e o Atlas do Desenvolvimento Humano nas Regiões Metropolitanas. Local de consulta ao Índice de Desenvolvimento Humano Municipal (IDHM) de municípios brasileiros, 27 Unidades da Federação (UF), 20 Regiões Metropolitanas (RM) e suas respectivas Unidades de Desenvolvimento Humano (UDH). Além disso, fornece mais de 20 indicadores de demografia, educação, renda, trabalho, habitação e vulnerabilidade. Os dados dos Censos Demográficos, dos anos de 1991, 2000 e 2010 (ATLAS BRASIL, 2017). O Atlas consolida um diálogo informado e embasado sobre o desenvolvimento a partir de uma referência utilizada internacionalmente, o Índice do Desenvolvimento Humano (IDH). Desenvolvimento Humano é o processo de ampliação das liberdades das pessoas, com relação às suas capacidades e as suas oportunidades a seu dispor, para que elas possam escolher a vida que desejam ter. Tanto o conceito como sua medida o IDH, foram apresentados em 1990 no Programa das Nações Unidades para o Desenvolvimento (PNUD). Idealizado pelo o economista paquistanês MahbubulHaq e colaboração do economista Amartya Sen (ATLAS BRASIL, 2017). O Atlas permite transparência aos processos de desenvolvimento em importantes temas sociais. Possibilita o acompanhamento dos caminhos trilhados nos últimos 20 anos e análises para traçar o futuro. A audiência principal está organizada em cinco categorias: (1) gestores estaduais e municipais, uma forma de identificar regiões que necessitam de intervenções, políticas e ações especificas; (2) atores municipais, apoio ao diagnóstico aos principais desafios municipais; (3) pesquisadores, nosso caso, estudo das políticas públicas, identificação de programas bem-sucedidos e mapeamento de desafios e oportunidades; (4) sociedade civil e setor privado, orienta a alocação de recursos e definição de público-alvo para as ações de desenvolvimento; e (5) cidadãos, estimulo a participação social. O presente trabalho tem por objetivo efetuar uma análise de dendogramas e cluster (análise multivariada) de dados dimensionadores que compõem o IDH_M dos 5565 municípios do Brasil, 27 unidades da federação (UF) e 20 regiões metropolitanas. Por fim, fazemos as considerações finais sobre a análise de todas as variáveis estudadas. Os dados são compilados pelo Atlas de Desenvolvimento no Brasil no ano de 2010 publicados em O software estatístico utilizado é o MINITAB. Capítulo I. Entendendo Os Dados Os dados são referentes ao ano de As variáveis são indicadores agregados que compõem o IDH_M e seus componentes IDH_E, IDH_L e IDH_R. Neste sentido, Desenvolvimento Humano é definido como um conjunto de indicadores que tratam de Educação, Longevidade ligada à Saúde e Renda das populações nos municípios. As dimensões educação, longevidade e econômica são capturadas pelas variáveis que serão discutidas abaixo. 1.1 Os Indivíduos Os indivíduos desta análise são os 5565 municípios brasileiros que constam na base de dados do Atlas de Desenvolvimento Humano no Brasil quanto a seus indicadores de Educação, Longevidade e Renda. São no total 27 estados da federação. 3

166 1.2 As Variáveis Inicialmente foram selecionadas 21 variáveis entre categóricas e quantitativas dentre as 232 variáveis que compõem o IDHM e referem-se ao ano de 2010; conforme tabela 1 a seguir. Com base nesta seleção inicial, para cada uma das variáveis realizouse a normatização e/ou positivação quando fosse necessário. Tabela 1 As Variáveis N VARIÁVEL SIGNIFICADO ANALISAR UNIDADE DE MEDIDA 1 REGIÃO Nome da Região do Brasil NÃO NA 2 UF Unidade da Federação NÃO NA 3 MUNICÍPIO Nome do Município NÃO NA 4 IDHM IDH Município NÃO Índice 5 IDHM_R IDHM Renda NÃO Índice 6 IDHM_L IDHM Longevidade NÃO Índice 7 IDHM_ E IDHM Educação NÃO Índice 8 ESPVIDAn Esperança de vida ao nascer Valor Absoluto 9 MORT1np Mortalidade infantil Valor Absoluto 10 T_ANALF25Mnp Taxa de analfabetismo - 25 anos ou mais Percentual 11 T_FUND25Mnp % de 25 anos ou mais com fundamental completo Percentual 12 RDPCn Renda per capita Valor Absoluto 13 RINDn Renda per capita média dos extremamente pobres Índice 14 P_FORMALn Grau de formalização dos ocupados - 18 anos ou mais Índice 15 RENOCUPn Rendimento médio dos ocupados - 18 anos ou mais Valor Absoluto 16 T_BANAGUAn % da população em domicílios com banheiro e água encanada Percentual 17 T_DENSnp % da população em domicílios com densidade > 2 Percentual 18 T_NESTUDA_NTRAB_MMEIOnp % de 15 a 24 anos que não estudam, não trabalham e são vulneráveis à pobreza Percentual 19 T_FUNDIN_TODOS_MMEIOnp % de pessoas em domicílios vulneráveis à pobreza e em que ninguém tem Percentual fundamental completo 20 T_MULCHEFEFIF014np % de mães chefes de família sem fundamental completo e com filhos Percentual menores de 15 anos 21 PEA18Mn PEA 18 anos ou mais Valor Absoluto Fonte: Elaborado pelo autor (Minitab 2016). Na sequência foram selecionadas por correlação as 7 variáveis desta análise de cluster, além do nome da região e unidade da federação; as mesmas são melhor explicadas na Tabela 2. Uma vez feitas as correlações, elaborou-se a tabela específica com aquelas que serão analisadas em termos de clusterização. Para esta análise usaremos apenas as variáveis já normalizadas e positivadas: ESPVIDAn, MORT1np, T_ANALF25Mnp, T_FUNDIN_TODOS_MMEIOnp, RDPCn, RENOCUPn, T_NESTUDA_NTRAB_MMEIOnp Tabela 2 As Variáveis Selecionadas para análise de Cluster N VARIÁVEL SIGNIFICADO ANALISAR UNIDADE DE MEDIDA 1 REGIÃO Nome da Região do Brasil NÃO NA 2 UF Unidade da Federação NÃO NA 3 ESPVIDAn Esperança de vida ao nascer Valor Absoluto 4 MORT1np Mortalidade infantil Valor Absoluto 5 T_ANALF25Mnp Taxa de analfabetismo - 25 anos ou mais Percentual 4

167 6 T_FUNDIN_TODOS_MMEIOnp % de pessoas em domicílios vulneráveis à pobreza e em que ninguém tem fundamental completo Percentual 7 RDPCn Renda per capita Valor Absoluto 8 RENOCUPn Rendimento médio dos ocupados - 18 anos ou mais 9 T_NESTUDA_NTRAB_MMEIOnp % de 15 a 24 anos que não estudam, não trabalham e são vulneráveis à pobreza Fonte: Elaborado pelo autor (Minitab 2016). 1.3 A Tabela de Dados Uma vez selecionadas as variáveis objeto do trabalho, realizou-se a análise estatística descritiva; cujos resultados são apresentados na tabela 3 a seguir. Tabela 3. Estatística descritiva Descriptive Statistics: MeanESPVIDAn; MeanMORT1np; MeanT_ANALF2;... Variable N N* Mean SE Mean StDev Minimum Q1 MeanESPVIDAn ,5287 0,0301 0,1533 0,3049 0,3909 MeanMORT1np ,6741 0,0301 0,1535 0,3890 0,5401 MeanT_ANALF25Mnp ,6056 0,0375 0,1910 0,2756 0,4158 MeanT_FUNDIN_TODOS_MMEIO ,6701 0,0272 0,1389 0,4450 0,5511 MeanRDPCn ,1733 0,0177 0,0905 0,0696 0,1012 MeanRENOCUPn ,2011 0,0154 0,0787 0,0908 0,1247 MeanT_NESTUDA_NTRAB_MMEI ,6826 0,0246 0,1253 0,5336 0,5764 Variable Median Q3 Maximum MeanESPVIDAn 0,5155 0,6760 0,7880 MeanMORT1np 0,6966 0,8201 0,8975 MeanT_ANALF25Mnp 0,6190 0,7553 0,8753 MeanT_FUNDIN_TODOS_MMEIO 0,6585 0,7952 0,9048 MeanRDPCn 0,1306 0,2516 0,3444 MeanRENOCUPn 0,2027 0,2712 0,3199 MeanT_NESTUDA_NTRAB_MMEI 0,6225 0,7993 0,9102 Valor Absoluto Percentual Fonte: Elaborado pelo autor (Minitab 2016). Devemos observar que para efeito da análise por estado excluiu-se o Distrito Federal por representar um outlier uma vez que só tem 1 município. CAPÍTLO II. Análise Das Variáveis 2.1 Variáveis qualitativa ou categórica Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo pie chart e/ou barras : Município A amostra totaliza municípios, que pode ser verificada na distribuição no território nacional de acordo com a Unidade Federal no Gráfico 1 5

168 Município ; Norte ; 449; 8% Distribuição de Municípios por Macro-Região Município ; Sul ; 1188; 21% Município ; Sudeste ; 1668; 30% Município ; Nordeste ; 1794; 32% Norte Nordeste Centro-Oeste Sudeste Sul Município ; Centro- Oeste ; 466; 9% Gráfico 1 Distribuição de Municípios por Região Fonte: Elaborado pelo autor (Atlas Brasil, 2016) De acordo com o Gráfico 1, observa-se que as maiores concentrações de municípios brasileiros estão nas regiões Nordeste (32%) e na região Sudeste (30%). Juntas somam mais de 60% dos municípios pesquisados, totalizando 62%. O Gráfico 2, apresenta a distribuição dos municípios brasileiros pelas Unidades da Federação do Brasil; onde podemos observar que a maior concentração de municípios encontra-se no estado de Minas Gerais com 853 municípios, seguido por São Paulo com 645. O estado com menor número de municípios é o Estado de Roraima com 15 municípios. 6

169 Gráfico 2 Distribuição dos Municípios por Unidade da Federação Fonte: Elaborado pelo Autor (Atlas Brasil, 2016) Podemos observar no Gráfico 2, a Unidade Federativa mais populosa em números de municípios é Minas Gerais (15%), seguida por São Paulo (12%) e Rio Grande do Sul (9%). As menos populosas em número de municípios são Acre, Amazonas, Amapá, entre outras. A Figura 2 apresenta o IDHM dos municípios brasileiros em 1999, 2000 e Com base nesta representação topográfica, observa-se que os índices mais altos de IDHM, estão concentrados na região centro-sul do Brasil. Nota-se também que a região Norte e Nordeste apresentava em 1999 índices muitos abaixo, nos 2000 e 2010 observa-se a significativa evolução dos índices nas regiões. 7

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICPAL NO BRASIL Focando

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos

Leia mais

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM ÍNDICE DE DESENVOLVIMENTO HUMANO MUNICIPAL

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS Disciplina: Métodos Quantitativos Professor:

Leia mais

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programas de Pós Graduação em Economia e Administração da PUC-SP BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2 IDHEs ÍNDICE DE DESENVOLVIMENTO HUMANO ESTADUAL

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados

Leia mais

Quantidade de Acessos / Plano de Serviço / Unidade da Federação - Novembro/2007

Quantidade de Acessos / Plano de Serviço / Unidade da Federação - Novembro/2007 Quantidade de Acessos / Plano de Serviço / Unidade da Federação - Novembro/2007 REGIÃO NORTE 5.951.408 87,35 861.892 12,65 6.813.300 RONDÔNIA 760.521 88,11 102.631 11,89 863.152 ACRE 298.081 85,86 49.094

Leia mais

REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL

REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA Faculdade de Economia e Administração Programa de Estudos Pós Graduados em Administração REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL Disciplina:

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL focando

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL focando principalmente indicadores

Leia mais

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO Aluno: Claudemir

Leia mais

MÉTODOS QUANTITATIVOS TRABALHO FINAL ANALISE DA POPULAÇÃO, EDUCAÇÃO E SUAS RELAÇÕES COM AS CONDIÇÕES DE NATALIDADE NOS DISTRITOS DE SÃO PAULO.

MÉTODOS QUANTITATIVOS TRABALHO FINAL ANALISE DA POPULAÇÃO, EDUCAÇÃO E SUAS RELAÇÕES COM AS CONDIÇÕES DE NATALIDADE NOS DISTRITOS DE SÃO PAULO. PUC - SP MÉTODOS QUANTITATIVOS TRABALHO FINAL ANALISE DA POPULAÇÃO, EDUCAÇÃO E SUAS RELAÇÕES COM AS CONDIÇÕES DE NATALIDADE NOS DISTRITOS DE SÃO PAULO. CESAR DO NASCIMENTO MESTRADO EM ADMINISTRAÇÃO DE

Leia mais

Acre Previsão por Coeficiente no Estado

Acre Previsão por Coeficiente no Estado Acre 0,6 121.073,55 262.729,59 0,8 161.431,39 350.306,12 1,0 201.789,24 437.882,66 1,2 242.147,09 525.459,19 1,4 - - 1,6 322.862,79 700.612,25 1,8 363.220,64 788.188,78 2,0 - - 2,2 - - 2,4 - - 2,6 524.652,03

Leia mais

Geografia. Demografia do Brasil. Professor Thomás Teixeira.

Geografia. Demografia do Brasil. Professor Thomás Teixeira. Geografia Demografia do Brasil Professor Thomás Teixeira www.acasadoconcurseiro.com.br Geografia Aula XX DEMOGRAFIA BRASILEIRA DEMOGRAFIA BRASILEIRA População estimada [2018] 208.494.900 pessoas Homem

Leia mais

UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS

UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS Aluna: Erika Camila Buzo

Leia mais

ANÁLISE DE CONGLOMERADOS E OS INDICADORES DE GOVERANÇA MUNDIAL

ANÁLISE DE CONGLOMERADOS E OS INDICADORES DE GOVERANÇA MUNDIAL PUC - SP ANÁLISE DE CONGLOMERADOS E OS INDICADORES DE GOVERANÇA MUNDIAL José Renato Lamberti Stella Milanez MESTRADO EM ADMINISTRAÇÃO DE EMPRESAS MÉTODOS QUANTITATIVOS PROF. DR. ARNOLDO HOYOS SÃO PAULO

Leia mais

FNPETI FÓRUM NACIONAL DE PREVENÇÃO E ERRADICAÇÃO DO TRABALHO INFANTIL. Cenário do Trabalho Infantil Dados PNAD 2014

FNPETI FÓRUM NACIONAL DE PREVENÇÃO E ERRADICAÇÃO DO TRABALHO INFANTIL. Cenário do Trabalho Infantil Dados PNAD 2014 Cenário do Trabalho Infantil Dados PNAD 2014 Fonte: IBGE/Pnad. Elaboração própria. Nota: a PNAD até o ano de 2003 não abrangia a área rural da região Norte (exceto o Tocantins). Nos anos de 1994, 2000

Leia mais

COMPILAÇÃO DE INDICADORES SOCIAIS

COMPILAÇÃO DE INDICADORES SOCIAIS COMPILAÇÃO DE INDICADORES SOCIAIS PNAD Pesquisa Nacional por Amostra de Domicílio última atualização da pesquisa: 2011 1 2 CARACTERÍSTICAS DOS DOMICÍLIOS 3 ACESSO A SERVIÇOS PÚBLICOS EVOLUÇÃO DO PERCENTUAL

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO Disciplina: Métodos Quantitativos Professor:

Leia mais

Contabilizando para o Cidadão

Contabilizando para o Cidadão Gasto Médio por Deputado Estadual - Assembleias Legistativas Estaduais - Ano 2017 R$17,5 R$16,9 R$15,9 Gasto Médio Anual por Deputado Estadual (em Milhões de R$) Média Nacional - Gasto Anual por Deputado

Leia mais

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO. Pesquisas Relacionadas a Indicadores Municipais no Brasil. ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO. Pesquisas Relacionadas a Indicadores Municipais no Brasil. ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2 BA STA BOLETIM DE ANÁLISE ESTATÍSTICO Pesquisas Relacionadas a Indicadores Municipais no Brasil ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2 Pesquisa socio-economica ao nível municipal no Brasil focando

Leia mais

ATLAS BRASIL 2013 ALGUMAS VARIÁVEIS DA DIMENSÃO EDUCAÇÃO

ATLAS BRASIL 2013 ALGUMAS VARIÁVEIS DA DIMENSÃO EDUCAÇÃO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 ALGUMAS VARIÁVEIS DA DIMENSÃO EDUCAÇÃO Disciplina: Métodos Quantitativos

Leia mais

PUC - SP VARIÁVEIS SÓCIO-ECONÔMICAS E TAXA DE SUICÍDIOS NO BRASIL

PUC - SP VARIÁVEIS SÓCIO-ECONÔMICAS E TAXA DE SUICÍDIOS NO BRASIL PUC - SP VARIÁVEIS SÓCIO-ECONÔMICAS E TAXA DE SUICÍDIOS NO BRASIL MICHEL WIAZOWSKI ROCHA RUTHELLE MARIA DE CARVALHO SOUSA MESTRANDO EM ADMINISTRAÇÃO MÉTODOS QUANTITATIVOS PROF. DR. ARNOLDO HOYOS SÃO PAULO

Leia mais

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP MÉTODOS QUANTITATIVOS DE PESQUISA EMPÍRICA Prof. Dr. ARNOLDO HOYOS ENADE 9 Exame Nacional de Desempenho de Estudantes Instituições do Ensino Superior

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO ANÁLISE EXPLORATÓRIA DE PARÂMETROS DE ÍNDICE DE DESENVOLVIMENTO HUMANO NAS 100 CIDADES BRASILEIRAS COM MAIOR POPULAÇÃO Rafael Fortes Gatto PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade

Leia mais

9, R$ , , R$ ,

9, R$ , , R$ , Rondônia 2005 R$ 601.575,17 2005 10.154 2004 1.027.983 2004 108.139 2004 10,52 2006 R$ 609.834,21 2006 10.757 2005 1.025.249 2005 101.539 2005 9,90 2007 R$ 1.229.490,00 2007 9.100 2006 1.047.004 2006 111.068

Leia mais

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo

Leia mais

Alfabetização. Censo Demográfico 2010 Características da população e dos domicílios Resultados do universo

Alfabetização. Censo Demográfico 2010 Características da população e dos domicílios Resultados do universo Alfabetização A alfabetização é o primeiro passo para o acesso à informação escrita e a níveis de educação mais elevados. Assegurar que as crianças frequentem o ensino fundamental nas idades apropriadas

Leia mais

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE Disciplina: Métodos Quantitativos Professor:

Leia mais

Ranking de salário dos Tribunais de Justiça nos Estados e DF - Junho 2018 SS JUSTIÇA MG

Ranking de salário dos Tribunais de Justiça nos Estados e DF - Junho 2018 SS JUSTIÇA MG Ranking de salário dos Tribunais de Justiça nos Estados e DF - Junho 2018 SS JUSTIÇA MG SS Justiça MG Junho 2018 Tabela 1 Tribunais de Justiça Estaduais posicionados conforme Vencimento Básico Vencimentos

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Curitiba, PR 08/07/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 437,42 km² IDHM 2010 0,823 Faixa do IDHM Muito Alto (IDHM entre 0,8 e 1) (Censo 2010) 1751907

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Novo Santo Antônio, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 4386,24 km² IDHM 2010 0,653 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 2005 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Rosário Oeste, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 8061,98 km² IDHM 2010 0,650 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 17679 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Alto Araguaia, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 5557,93 km² IDHM 2010 0,704 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 15644 hab. Densidade

Leia mais

PESQUISA NOSSA SÃO PAULO QUALIDADE DE VIDA URBANA EM. SÃO PAULO Um estudo de correlações entre trabalho e renda e violência.

PESQUISA NOSSA SÃO PAULO QUALIDADE DE VIDA URBANA EM. SÃO PAULO Um estudo de correlações entre trabalho e renda e violência. PESQUISA NOSSA SÃO PAULO QUALIDADE DE VIDA URBANA EM SÃO PAULO Um estudo de correlações entre trabalho e renda e violência urbana DANIEL RODRIGUES PIRES BEZERRA PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Canarana, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 10877,15 km² IDHM 2010 0,693 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 18754 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Pedra Preta, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 4205,57 km² IDHM 2010 0,679 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 15755 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Alto Garças, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 3670,07 km² IDHM 2010 0,701 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 10350 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Novo São Joaquim, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 5039,25 km² IDHM 2010 0,649 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 6042 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Barra do Garças, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 9176,17 km² IDHM 2010 0,748 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 56560 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Bom Jesus do Araguaia, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 4299,96 km² IDHM 2010 0,661 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5314 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São Pedro da Cipa, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 344,84 km² IDHM 2010 0,660 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 4158 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Rondonópolis, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 4181,58 km² IDHM 2010 0,755 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 195476 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Campo Verde, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 4810,5 km² IDHM 2010 0,750 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 31589 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Jaciara, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1663,25 km² IDHM 2010 0,735 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 25647 hab. Densidade

Leia mais

Contabilizando para o Cidadão

Contabilizando para o Cidadão 14,6% 14,5% 14,0% 14,0% 13,2% 13,1% 12,1% Contabilizando para o Cidadão Nº de Famílias Beneficiadas pelo Bolsa Família em Relação ao Total de Famílias do Estado - Ano 2017 50,00% 48,6% Nº de Famílias Beneficiadas

Leia mais

PROJETO ORIBER. TEMA: Bem Estar e Qualidade de Vida ANÁLISE DISCRIMINANTE

PROJETO ORIBER. TEMA: Bem Estar e Qualidade de Vida ANÁLISE DISCRIMINANTE PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PROJETO ORIBER TEMA: Bem Estar e Qualidade de Vida ANÁLISE DISCRIMINANTE

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Confresa, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 5819,29 km² IDHM 2010 0,668 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 25124 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Vila Rica, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 7468,7 km² IDHM 2010 0,688 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 21382 hab. Densidade

Leia mais

DEFINIÇÃO DO NÚMERO DE ATERROS REGIONAIS BRASIL. Obras

DEFINIÇÃO DO NÚMERO DE ATERROS REGIONAIS BRASIL. Obras DEFINIÇÃO DO NÚMERO DE REGIONAIS BRASIL Aplicada a metodologia descrita nos itens. a. para todos os Estados dos Brasil e para o Distrito Federal, se obteve os números totais de aterros regionais para cada

Leia mais

Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua. Mercado de Trabalho Brasileiro 1º trimestre de de maio de 2018

Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua. Mercado de Trabalho Brasileiro 1º trimestre de de maio de 2018 Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua Mercado de Trabalho Brasileiro 1º trimestre de 2018 17 de maio de 2018 P R I N C I P A L O B J E T I V O Produzir informações contínuas

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São Félix do Araguaia, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 16915,81 km² IDHM 2010 0,668 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 10625

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração METODOS QUANTITATIVOS TRABALHO FINAL Análise de indicadores

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Poço das Trincheiras, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 303,4 km² IDHM 2010 0,526 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São José do Xingu, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 7493,63 km² IDHM 2010 0,657 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5240 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Alta Floresta, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 8983,98 km² IDHM 2010 0,714 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 49164 hab. Densidade

Leia mais

Empoderando vidas. Fortalecendo nações.

Empoderando vidas. Fortalecendo nações. Empoderando vidas. Fortalecendo nações. INTRODUÇÃO O Atlas do Desenvolvimento Humano no Brasil é baseado exclusivamente nos Censos Demográficos, realizados de 10 em 10 anos, pelo Instituto Brasileiro de

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Porto de Pedras, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 267,75 km² IDHM 2010 0,541 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010)

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Batalha, AL 13/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 322,26 km² IDHM 2010 0,594 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010) 17076

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Maceió, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 516,46 km² IDHM 2010 0,721 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 932748

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Campo Novo do Parecis, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 9480,98 km² IDHM 2010 0,734 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 27577

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Penedo, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 690,81 km² IDHM 2010 0,630 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 60378

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Paranatinga, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 24272,24 km² IDHM 2010 0,667 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 19290 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Cuiabá, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 3552,82 km² IDHM 2010 0,785 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 551098 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Roteiro, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 129,89 km² IDHM 2010 0,505 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010) 6656

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Rio Branco, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 530,1 km² IDHM 2010 0,707 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 5070 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Barra de São Miguel, AL 13/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 75 km² IDHM 2010 0,615 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010)

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Piranhas, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 408,47 km² IDHM 2010 0,589 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010) 23045

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Porto dos Gaúchos, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 7036,6 km² IDHM 2010 0,685 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 5449 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Várzea Grande, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 940,83 km² IDHM 2010 0,734 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 252596 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Maringá, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 11554,5 km² IDHM 2010 0,663 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 6590 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Gaúcha do Norte, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 16962,36 km² IDHM 2010 0,615 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 6293 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Santa Luzia do Norte, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 28,6 km² IDHM 2010 0,597 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Capela, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 207,26 km² IDHM 2010 0,573 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010) 17077

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Cáceres, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 24478,87 km² IDHM 2010 0,708 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 87942 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Sinop, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 3204,92 km² IDHM 2010 0,754 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 113099 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Castanheira, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 3966,38 km² IDHM 2010 0,665 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 8231 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Diamantino, MT 01/08/2013 - Pág 1 de 14 Caracterização do território Área 7657,48 km² IDHM 2010 0,718 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 20341 hab. Densidade

Leia mais

CLASSIFICAÇÃO DO BRASIL. Focando principalmente indicadores relacionados a habitação, educação, trabalho e muito particularmente SAÚDE

CLASSIFICAÇÃO DO BRASIL. Focando principalmente indicadores relacionados a habitação, educação, trabalho e muito particularmente SAÚDE PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados a habitação, educação, trabalho

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Monte Verde, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 6528,7 km² IDHM 2010 0,691 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 8093 hab. Densidade

Leia mais

PROJEÇÕES POPULACIONAIS PARA O ESTADO DO RIO GRANDE DO SUL:

PROJEÇÕES POPULACIONAIS PARA O ESTADO DO RIO GRANDE DO SUL: PROJEÇÕES POPULACIONAIS PARA O ESTADO DO RIO GRANDE DO SUL: 2015-2050 Centro de Informações Estatísticas Núcleo de Indicadores Sociais e Ambientais Porto Alegre, 08 de Novembro de 2012 - Evoluções Populacionais

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nobres, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 3874,39 km² IDHM 2010 0,699 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 15002 hab. Densidade demográfica

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Canaã do Norte, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 5996,71 km² IDHM 2010 0,686 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 12127 hab.

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Guarita, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1091,25 km² IDHM 2010 0,688 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 4932 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Nova Marilândia, MT 02/08/2013 - Pág 1 de 14 Caracterização do território Área 1946,65 km² IDHM 2010 0,704 Faixa do IDHM Alto (IDHM entre 0,700 e 0,799) (Censo 2010) 2951 hab. Densidade

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de São Brás, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 140,32 km² IDHM 2010 0,572 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010) 6718

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Arapiraca, AL 13/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 352,81 km² IDHM 2010 0,649 Faixa do IDHM Médio (IDHM entre 0,6 e 0,699) (Censo 2010) 214006

Leia mais

Caracterização do território

Caracterização do território Perfil do Município de Branquinha, AL 14/01/2014 - Pág 1 de 14 Report a map error Caracterização do território Área 192,17 km² IDHM 2010 0,513 Faixa do IDHM Baixo (IDHM entre 0,5 e 0,599) (Censo 2010)

Leia mais