ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE

Documentos relacionados
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

ATLAS BRASIL 2013 DIMENSÕES DEMOGRAFIA E HABITAÇÃO

ATLAS BRASIL 2013 ALGUMAS VARIÁVEIS DA DIMENSÃO EDUCAÇÃO

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

REGRESSÃO LOGÍSTICA E INDICADORES DE GOVERNANÇA GLOBAL

CLASSIFICAÇÃO DO BRASIL. Focando principalmente indicadores relacionados a habitação, educação, trabalho e muito particularmente SAÚDE

ENADE Exame Nacional de Desempenho de Estudantes. Instituições do Ensino Superior do Município de São Paulo

ATLAS BRASIL 2013 ANALISE DE ALGUMAS DIMENSÕES DO ATLAS E OUTRAS VARIÁVEIS

ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE E OUTRAS VARIÁVEIS

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - FACULDADE DE ECONOMIA E ADMINISTRAÇÃO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO CLASSIFICAÇÃO DO BRASIL. em base a Indicadores do ATLAS BRASIL BASTA 2014 v1

UM ESTUDO DAS RELAÇÕES ENTRE INDICADORES DE DESENVOVLIMENTO HUMANO-HDI E INDICADORES DE INOVAÇÃO-GII

ATLAS BRASIL 2013 DIMENSÃO DESENVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Programa de Estudos Pós-Graduados em Administração Mestrado em Administração

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

ATLAS BRASIL 2013 DIMENSÃO DESINVOLVIMENTO HUMANO E OUTRAS VARIÁVEIS

CLASSIFICAÇÃO DO BRASIL. Focando principalmente indicadores relacionados a. habitação, educação, trabalho e muito particularmente o

PONTÍFICA UNIVERSIDADE CATÓLICA DE SÃO PAULO PROGRAMA DE ESTUDOS PÓS-GRADUADOS EM ADMINISTRAÇÃO/ PUC-SP

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

ATLAS BRASIL 2013 DIMENSÃO GESTÃO FISCAL DOS MUNICÍPIOS

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

ATLAS BRASIL 2013 DIMENSÃO EDUCAÇÃO E OUTRAS VARIÁVEIS

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

ATLAS BRASIL 2013 DIMENSÃO LIBERDADE ECONÔMICA

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO

CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados a habitação, trabalho, saúde e muito particularmente EDUCAÇÃO.

UMA ANÁLISE COMPARATIVA DE DESESENVOLVIMENTO POR ESTADO NO BRASIL A PARTIR DE ALGUNS INDICADORES DO IBGE

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

UMA ANÁLISE DE ÍNDICES DE DESENVOLVIMENTO BÁSICO DA REGIÃO DE ARARAS

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO. Pesquisas Relacionadas a Indicadores Municipais no Brasil. ISDM/FGV, IFDM e IFGF/FIRJAN BASTA 2013 V2

ANEXO I BICICLETA ESCOLAR. Modelo de ofício para adesão à ata de registro de preços (GRUPO 1)

Racionamento de água. Abril/2017

CLASSIFICAÇÃO DE PAISES CONFORME INDICADORES DA LIBERDADE ECONÔMICA E DE DIREITO DE PROPRIEDADE OTÁVIA T. M. SALA

BA STA BOLETIM DE ANÁLISE ESTATÍSTICO CLASSIFICAÇÃO DO BRASIL. em base a Indicadores Municipais. ISDM/FGV, IFDM e IFGF/FIRJAN.

PROJETO ORIBER. TEMA: Bem Estar e Qualidade de Vida ANÁLISE DISCRIMINANTE

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO. Programa de Pós-Graduação em Economia e Administração FEA PUC-SP BASTA 2017 V1 IDHM

Tabela 2: PIB Brasil e unidades da federação a preços constantes - R$ de 2000(mil) - Deflacionado pelo Deflator Implícito do PIB nacional

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO ARVORES DE DECISÃO E INDICADORES DE GOVERANÇA MUNDIAL

Mortos e Acidentes por Unidade Federativa

CLASSIFICAÇÃO DO BRASIL Focando principalmente indicadores relacionados a habitação, educação, saúde e muito particularmente TRABALHO

PROCESSO SELETIVO UFAL SiSU GERAL (5.168 vagas ofertadas)

Incubadoras em Implantação. Distribuição regional NORTE AM 01 AP 02 PA 03 RO 01 TO 01 TOTAL 08

Pensando na Aposentadoria. Janeiro/2017

Caracterização do território

UM ESTUDO COMPARATIVO DO USO DO MINITAB, SPSS E XL-STAT EM REGRESSÕES UTILZIANDO DADOS SOBRE LIBERDADE ECONÔMICA DE 157 PAÍSES NO CENÁRIO MUNDIAL

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

ÍNDICE DE DESENVOLVIMENTO HUMANO Uma análise comparativa sócio-econômico entre os cinco continentes PAULA AUGUSTA RODRIGUES COELHO

Caracterização do território

Caracterização do território

Caracterização do território

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

MÉTODOS QUANTITATIVOS TRABALHO FINAL ANALISE DA POPULAÇÃO, EDUCAÇÃO E SUAS RELAÇÕES COM AS CONDIÇÕES DE NATALIDADE NOS DISTRITOS DE SÃO PAULO.

Caracterização do território

Relatório de Dados do Programa de Microcrédito 2º. Trimestre de 2012

BOLETIM DE ANÁLISES ESTATÍSTICO BASTA 2017 Vol. 2. IDHEs

BOLETIM DE ANÁLISE ESTATÍSTICO BASTA 2017 Vol. 1 IDHM

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

FONTE DE DADOS. Cadastro Nacional de Estabelecimentos de Saúde: Dados de todos os estabelecimentos de saúde do Brasil.

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Metas Educacionais As 5 Metas do Todos Pela Educação. Rio de Janeiro, 27 de abril de 2009

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

Caracterização do território

TABELA I - OPERAÇÕES REALIZADAS PELAS DISTRIBUIDORAS

Caracterização do território

Transcrição:

PONTÍFICIA UNIVERSIDADE CATÓLICA DE SÃO PAULO Faculdade de Economia, Administração, Contabilidade e Atuariais. ATLAS BRASIL 2013 DIMENSÃO DESVULNERABILIDADE Disciplina: Métodos Quantitativos Professor: Dr. Arnoldo Jose de Hoyos Sandra Rocio Parada Castiblanco 1º Semestre 2014

2 1. INTRODUÇÃO. O bem-estar de uma sociedade não pode ser calculado só medindo a riqueza ou os recursos de um país através do PIB, é assim como o Programa das Nações Unidas para o Desenvolvimento Humano criou em 1990 o Indicador IDH Índice de Desenvolvimento Humano. Este indicador resume em um só dado às três dimensões mais importantes para o desenvolvimento das pessoas em um país: a) Oportunidade de vida longa e saudável, b) Acesso ao conhecimento e c) Padrão de vida digno. Além da renda, são estudadas as condições de Saúde e Educação para medir o progresso da sociedade. No Brasil foi criado o indicador IDHM Índice de Desenvolvimento Humano Municipal o qual tem sete dimensões: Desenvolvimento Humano, Demografia, Educação, Trabalho, Renda, Habitação e Vulnerabilidade. O presente trabalho tem por objetivo efetuar análises discriminantes para tentar predizer ou explicar os indicadores relacionados ao desenvolvimento da desvulnerabilidade dos municípios do Brasil com dados do ano 2010 segundo a Pesquisa Atlas Brasil 2013. Iniciamos com o entendimento dos dados, incluindo a definição dos indivíduos e das variáveis, suas classificações em variáveis categóricas ou quantitativas, os significados e unidades de medida, além da apresentação da tabela de dados. Depois de fazer a Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade baixo o método linear e quadrático, o objetivo e comparar através da Regressão Logística Ordinal qual pode ser aquela analise que permita explicar o país por agrupamento o menor grau de erros. Por fim, fazemos as considerações finais. O software estatístico utilizado é o MINITAB16. 2. ENTENDENDO OS DADOS 2.1 Os indivíduos Os indivíduos desta análise são os 5564 (-DF) municípios das cinco regiões do país, (Centro Oeste, Nordeste, Norte, Sudeste e o Sul). Os dados foram tomados da fonte Atlas de Desenvolvimento Humano Brasil 2013, dimensão Vulnerabilidade, dados 2010. http://www.atlasbrasil.org.br/2013/ Esta dimensão apresenta a sua vez quatro áreas de estudo: i) Mulheres, ii) Crianças, iii) Educação, iv) Trabalho e Renda e Habitação. 2.2 As Variáveis Como foi citada anteriormente, a dimensão Vulnerabilidade, apresenta quatro tópicos de estudo Mulheres, Crianças, Educação e Trabalho e Renda e Habitação, as quais apresentam em sua totalidade 17 variáveis numéricas e 2 categóricas, para um total de 19 variáveis. Ver tabela número 1.

3 Tabela 1. As Variáveis Tema Variável NOME CURTO Tipo Municipio (5565) UFN T-M10A14CF VULNERABILIDADE variável Categorica NA % de mulheres de 10 a 14 anos que tiveram filhos variável Numérica Unidade de Medida NA Percentual Mulheres (3) T-M15A17CF T_MULHCHEFEFIF014 % de mulheres de 15 a 17 anos que tiveram filhos % de mães chefes de família sem fundamental completo e com filhos menores de 15 anos variável Numérica variável Numérica Percentual Percentual MORT1 Mortalidade infantil variável Numérica Taxa PINDCRI % de crianças extremamente pobres variável Numérica Percentual Crianças (5) T_CRIFUNDIN_TODOS T_FORA4A5 % de crianças em domicílios em que ninguém tem fundamental completo variável Numérica Percentual % de crianças de 4 a 5 anos fora da escola variável Numérica Percentual T_FORA6A14 % de crianças de 6 a 14 fora da escola variável Numérica Percentual T_FUNDIN_TODOS_MMEIO % de pessoas em domicílios vulneráveis à pobreza e em que ninguém tem fundamental completo. variável Numérica Percentual Educação, Trabalho e Renda (6) T_NESTUDA_NTRAB_MMEIO T_FUNDIN18MINF T_FUNDIN_TODOS % de pessoas de 15 a 24 anos que não estudam nem trabalham e são vulneráveis à pobreza. variável Numérica Percentual % de pessoas de 18 anos ou mais sem fundamental completo e em ocupação informal variável Numérica Percentual % de pessoas em domicílios em que ninguém tem fundamental completo variável Numérica Percentual T_RMAXIDOSO % de pessoas em domicílios vulneráveis à pobreza e dependentes de idosos variável Numérica Percentual T_OCUPDESLOC_1 % de pessoas vulneráveis à pobreza e que gastam mais de uma hora até o trabalho variável Numérica Percentual T_SLUZ % de pessoas em domicílios sem energia elétrica variável Numérica Percentual Habitação (3) PAREDE AGUA_ESGOTO % de pessoas em domicílios com paredes inadequadas variável Numérica Percentual % de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequados variável Numérica Percentual Fonte. http://www.atlasbrasil.org.br/2013/pt/consulta/

4 2.3. A Tabela de Dados Tabela 2. Descriptive Statistics: PINDCRI. AGUA_ESGOTO. T_FORA6A14. T_FUNDIN_TOD.. Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum MORT1_n 5565 0 0,28079 0,0025 0,18629 0 0,13861 0,21952 0,39963 1 PINDCRI_n 5565 0 0,22137 0,00284 0,21198 0 0,0417 0,13737 0,37616 1 AGUA_ESGOTO_n 5565 0 0,1078 0,00202 0,15041 0 0,00621 0,03819 0,15271 1 PAREDE_n 5565 0 0,06485 0,00152 0,11373 0 0,00496 0,01982 0,0704 1 T_CRIFUNDIN_TODOS_n 5565 0 0,43794 0,00237 0,17711 0 0,30412 0,42986 0,56934 1 T_FORA4A5_n 5565 0 0,24775 0,00238 0,17786 0 0,11343 0,20536 0,34069 1 T_FORA6A14_n 5565 0 0,05937 0,000741 0,05526 0 0,03152 0,04935 0,07122 1 T_FUNDIN_TODOS_n 5565 0 0,40321 0,00206 0,15394 0 0,29125 0,39787 0,51408 1 T_FUNDIN_TODOS_MMEIO_n 5565 0 0,27613 0,0023 0,17139 0 0,12722 0,24973 0,40713 1 T_FUNDIN18MINF_n 5565 0 0,5184 0,00257 0,19204 0 0,36199 0,52236 0,67934 1 T_M10A14CF_n 5565 0 0,04765 0,00111 0,08248 0 0 0 0,07995 1 T_M15A17CF_n 5565 0 0,18274 0,00156 0,1162 0 0,10271 0,16724 0,24704 1 T_MULCHEFEFIF014_n 5565 0 0,25719 0,00178 0,13303 0 0,15878 0,23315 0,33335 1 T_NESTUDA_NTRAB_MMEIO_n 5565 0 0,26743 0,00212 0,1584 0 0,13204 0,24742 0,39095 1 T_OCUPDESLOC1_n 5565 0 0,08471 0,00128 0,0953 0 0,02012 0,05488 0,11646 1 T_RMAXIDOSOn 5565 0 0,19343 0,00184 0,13701 0 0,0787 0,15685 0,29279 1 T_SLUZn 5565 0 0,03872 0,00111 0,08299 0 0,00179 0,0084 0,03244 1 Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab16. 3. ANÁLISE DAS VARIÁVEIS 3.1 Variáveis Categóricas. São variáveis de tipo qualitativo que podem ser classificadas como de Nominais ou Ordinais. Estes tipos de variáveis indicam que o foco de concentração deve ser a análise de gráficos do tipo pie chart e barras. 3.1.1 Variável: Estado Fazem parte desta pesquisa os 27 estados brasileiros e suas cidades. O gráfico abaixo exibe o número de municípios por estado. 900 800 700 600 Gráfica 1. Municípios por Estado. Cidades por Estado Count 500 400 300 200 100 0 PA RN CE PE MA PB PI GO SC PR BA RS SP MG MT UFN SE MS ES RJ AL TO AM RO AC AP RR DF Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab16.

5 A variação na quantidade de municípios por estado é alta. O Mato Grosso possui mais de 852 municípios, só seguido por São Paulo. 3.1.2 Variável: REGIÃO Segundo o pie chart por região, das cinco regiões a maior concentração de municípios para a dimensão vulnerabilidade são Sudeste (SE) com 30%, Nordeste (NE) com 32,2% e Sul (S) com 21,3%. Só estas três regiões concentram o 83,5% dos municípios do país. Gráfico 2. Distribuição Percentual dos municípios por regiões Gráfico por Regiões SE 30,0% CO 8,4% N 8,1% Category CO N NE S SE NE 32,2% S 21,3% Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab16.

6 A ilustração a seguir monstra a divisão do Brasil por região e por estado 3.1.2 Variável: Munícipio Unidades Federais Nacionais mais representativas são: Minas Gerais com o 15,3% dos municípios, São Paulo 11,6% e Rio Grande do Sul 8,9%. Embora o 18,3% seja aparentemente um valor representativo, na verdade quando se representa graficamente este percentual a segmentação é amplia, se divide em várias UFN representando valores muito pequenos. Gráfico 3. Munícipios por regiões 2000 1794 Municipios do Brasil por Região 1668 1500 1188 Count 1000 500 466 449 0 NE SE S Região CO N

7 Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab16. Gráfico 4. Distribuição dos Municípios pelas UFN Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab16. 3.2 Variáveis Quantitativas. Todas as variáveis quantitativas ou numéricas são indicadores, porque estão normalizadas, de fato também estão positivadas, o que quer dizer que o nome deveria mudar e expressar seu conceito de forma positiva. Para maior detalhe destas 17 variáveis ver a tabela numero 1 apresentada anteriormente. Indicador de mulheres de 10 a 14 anos que tiveram filhos Indicador de mulheres de 15 a 17 anos que tiveram filhos Indicador de mães chefes de família sem fundamental completo e com filhos menores de 15 anos Indicador Mortalidade infantil menos de um ano. Indicador de crianças extremamente pobres Indicador de crianças em domicílios em que ninguém tem fundamental completo Indicador de crianças de 4 a 5 anos fora da escola Indicador de crianças de 6 a 14 fora da escola Indicador de pessoas em domicílios vulneráveis à pobreza e em que ninguém tem fundamental completo. Indicador de pessoas de 15 a 24 anos que não estudam nem trabalham e são vulneráveis à pobreza. Indicador de pessoas de 18 anos ou mais sem fundamental completo e em ocupação informal Indicador de pessoas em domicílios em que ninguém tem fundamental completo Indicador de pessoas em domicílios vulneráveis à pobreza e dependentes de idosos

8 Indicador de pessoas vulneráveis à pobreza e que gastam mais de uma hora até o trabalho Indicador de pessoas em domicílios sem energia elétrica Indicador de pessoas em domicílios com paredes inadequadas Indicador de pessoas em domicílios com abastecimento de água e esgotamento sanitário inadequado A análise deste tipo de variável permite a utilização de uma maior gama de ferramentas de análise como histogramas, curvas de densidade, gráfico de ramos, box-plot e dot-plot, além de informações numéricas como média, desvio-padrão, mediana, quartis, intervalo de confiança e teste de normalidade de Anderson-Darling. A continuação os gráficos das três variáveis mais representativas da Dimensão Vulnerabilidade do Indicador IDHM do Brasil. (MORTI, PINDRI, NESTUDA) Fonte: http://atlasbrasil.org.br/2013/pt/consulta/

9 Fonte: http://atlasbrasil.org.br/2013/pt/consulta/ Fonte: http://atlasbrasil.org.br/2013/pt/consulta/ 3.2.1 A Tabela de Dados Para as análises os dados foram normalizados e transformados em dados positivos, gerando desta forma uma nova dimensão chamada Invulnerabilidade. Results for: DESVULNERABILIDADE.MTW Tabela 3. Estatística Descritiva Desvulnerabilidade: MORT1_np. PINDCRI_np. AGUA_ESGOTO_. PAREDE_np....

10 Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum MORT1_np 5565 0 0,71921 0,0025 0,18629 0,18629 0 0,60037 0,78048 0,86139 1 PINDCRI_np 5565 0 0,77863 0,00284 0,21198 0,21198 0 0,62384 0,86263 0,9583 1 AGUA_ESGOTO_np 5565 0 0,8922 0,00202 0,15041 0,01504 0 0,84729 0,96181 0,99379 1 PAREDE_np 5565 0 0,93515 0,00152 0,11373 0,11373 0 0,9296 0,98018 0,99504 1 T_CRIFUNDIN_TODOS_np 5565 0 0,56206 0,00237 0,17711 0,17711 0 0,43066 0,57014 0,69588 1 T_FORA4A5_np 5565 0 0,75225 0,00238 0,17786 0,17786 0 0,65931 0,79464 0,88657 1 T_FORA6A14_np 5565 0 0,94063 0,000741 0,05526 0,05526 0 0,92878 0,95065 0,96848 1 T_FUNDIN_TODOS_np 5565 0 0,59679 0,00206 0,15394 0,01539 0 0,48592 0,60213 0,70875 1 T_FUNDIN_TODOS_MMEIO_np 5565 0 0,72387 0,0023 0,17139 0,17139 0 0,59287 0,75027 0,87278 1 T_FUNDIN18MINF_np 5565 0 0,4816 0,00257 0,19204 0,19204 0 0,32066 0,47764 0,63801 1 T_M10A14CF_np 5565 0 0,95235 0,00111 0,08248 0,08248 0 0,92005 1 1 1 T_M15A17CF_np 5565 0 0,81726 0,00156 0,1162 0,11620 0 0,75296 0,83276 0,89729 1 T_MULCHEFEFIF014_np 5565 0 0,74281 0,00178 0,13303 0,13303 0 0,66665 0,76685 0,84122 1 T_NESTUDA_NTRAB_MMEIO_np 5565 0 0,73257 0,00212 0,1584 0,15840 0 0,60905 0,75258 0,86796 1 T_OCUPDESLOC1_np 5565 0 0,91529 0,00128 0,0953 0,09530 0 0,88354 0,94512 0,97988 1 T_RMAXIDOSOnp 5565 0 0,80657 0,00184 0,13701 0,13701 0 0,70721 0,84315 0,9213 1 T_SLUZnp 5565 0 0,96128 0,00111 0,08299 0,08299 0 0,96756 0,9916 0,99821 1 Fonte. Atlas de Desenvolvimento humano Brasil. Cálculos próprios Minitab16. 3.2.2. ANÁLISE DISCRIMINANTE LINEAR POR REGIÃO A análise multivariada é utilizada para analisar dados quando tem-se feito multiplex medições onde se pode escolher: Analisar a covariância para entendê-la ou para reduzir a dimensão dos dados. Assignar observações aos grupos Explorar relações dentro das variáveis categóricas Interpretar os resultados é subjetivo já que a ferramenta Minitab não compara testes de significância para processos multivariados. A análise discriminante classifica observações em dois ou mais grupos. Neste caso o objetivo é discriminar os valores de dimensão Desvulnerabilidade dos municípios do Brasil, começando com a variável categórica Região.

11 Tabela 4. Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Linear. Discriminant Analysis: Região versus MORT1_np. PINDCRI_np. T_NESTUDA_NT Linear Method for Response: Região Predictors: MORT1_np. PINDCRI_np. T_NESTUDA_NTRAB_MMEIO_np Group CO N NE S SE Count 465 449 1794 1188 1668 Summary of classification True Group Put into Group CO N NE S SE CO 96 76 89 109 247 N 47 218 544 12 198 NE 4 119 1144 0 11 S 108 12 2 885 575 SE 210 24 15 182 637 Total N 465 449 1794 1188 1668 N correct 96 218 1144 885 637 Proportion 0,206 0,486 0,638 0,745 0,382 N = 5564 N Correct = 2980 Proportion Correct = 0,536 Squared Distance Between Groups CO N NE S SE CO 0,0000 4,6286 10,2475 1,0214 0,0141 N 4,6286 0,0000 1,8985 8,4913 5,1062 NE 10,2475 1,8985 0,0000 15,9265 10,8586 S 1,0214 8,4913 15,9265 0,0000 0,9697 SE 0,0141 5,1062 10,8586 0,9697 0,0000 Linear Discriminant Function for Groups CO N NE S SE Constant -45,502-28,526-21,196-54,292-46,316 MORT1_np 50,002 43,595 30,350 55,438 50,056 PINDCRI_np 10,207 1,200 1,664 6,245 11,098 T_NESTUDA_NTRAB_MMEIO_np 51,956 44,344 44,580 61,263 51,916 A tabela anterior permite estabelecer um cruzamento de dados entre as regiões. A região que acertou mais foi Nordeste com 63,8% e a que errou mais foi CO com 20,6%. Já que o Nordeste possui 1794 municípios dos quais 1144 são corretos, mas o Centro-Este com 465 municípios só acertou 96 deles apresentando uma margem de erro alta. Segundo esta analise a avaliação o agrupamento por região não é uma boa escolha porque a proporção correta é só 53,6%.

12 Tabela 5. Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Quadratico. Discriminant Analysis: Região versus MORT1_np. PINDCRI_np. T_NESTUDA_NT Quadratic Method for Response: Região Predictors: MORT1_np. PINDCRI_np. T_NESTUDA_NTRAB_MMEIO_np Group CO N NE S SE Count 465 449 1794 1188 1668 Summary of classification True Group Put into Group CO N NE S SE CO 131 48 30 123 272 N 46 228 598 25 157 NE 1 94 1080 0 13 S 135 12 2 899 572 SE 152 67 84 141 654 Total N 465 449 1794 1188 1668 N correct 131 228 1080 899 654 Proportion 0,282 0,508 0,602 0,757 0,392 N = 5564 N Correct = 2992 Proportion Correct = 0,538 Comparada com a proporção correta do método linear que foi de 53,6%, a Análise Discriminante do método quadrático não representou uma porcentagem melhor, já que foi só de 53,8% 3.2.2. ANÁLISE DISCRIMINANTE LINEAR POR 4 BRASIS A segunda parte da tabela 4 representa o distancia entre os grupos, encontrando que as regiões Centro-Oeste e Sudeste podem conformar um agrupamento chamado COSE, assim ficariam 4 regiões i) COSE ii) N iii) NE iv) S

13 Tabela 6. Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Linear. Quatro Brasis. Discriminant Analysis: Regiões Codifica versus MORT1_np. PINDCRI_np.... Linear Method for Response: Regiões Codificadas Predictors: MORT1_np. PINDCRI_np. T_NESTUDA_NTRAB_MMEIO_np Group COSE N NE S Count 2133 449 1794 1188 Summary of classification True Group Put into Group COSE N NE S COSE 1168 93 96 281 N 253 224 551 12 NE 16 119 1144 0 S 696 13 3 895 Total N 2133 449 1794 1188 N correct 1168 224 1144 895 Proportion 0,548 0,499 0,638 0,753 N = 5564 N Correct = 3431 Proportion Correct = 0,617 Squared Distance Between Groups COSE N NE S COSE 0,0000 4,9967 10,7186 0,9787 N 4,9967 0,0000 1,8986 8,4883 NE 10,7186 1,8986 0,0000 15,9222 S 0,9787 8,4883 15,9222 0,0000 Ainda assim o COSE não é a região com menor grau de erros, as melhores são Sul com 75,3% e Nordeste com 63,8% em quanto COSE tem 54,8% e Norte 49,9% Segundo esta analise a avaliação o agrupamento por região (4 Brasis) é melhor porque a proporção correta passou de 53,6% no método anterior a 61,7%

14 3.2.3. ANÁLISE DISCRIMINANTE QUADRÁTICA POR 4 BRASIS Tabela 7. Análise Discriminante por Região para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Quadratico. Quatro Brasis. Discriminant Analysis: Regiões Codifica versus MORT1_np. PINDCRI_np.... Quadratic Method for Response: Regiões Codificadas Predictors: MORT1_np. PINDCRI_np. T_NESTUDA_NTRAB_MMEIO_np Group COSE N NE S Count 2133 449 1794 1188 Summary of classification True Group Put into Group COSE N NE S COSE 1133 103 101 219 N 245 237 611 40 NE 14 94 1080 0 S 741 15 2 929 Total N 2133 449 1794 1188 N correct 1133 237 1080 929 Proportion 0,531 0,528 0,602 0,782 N = 5564 N Correct = 3379 Proportion Correct = 0,607 Segundo a tabela 4, a melhor analise para avaliação o agrupamento por região (4 Brasis) é para Análise Discriminante linear que apresenta uma proporção correta de 61,7% em quanto a quadrática é de 60,7%. 3.2.4. ANÁLISE DISCRIMINANTE LINEAR PARA DADOS AGRUPADOS Para procurar uma Análise Discriminante com uma porcentagem de proporção mais correta, foi realizado o dendrograma do Cluster Analysis of Observations (9 clusters) sem considerar DF, para as três variáveis com maior F da dimensão Desvulnerabilidade. Com base na similaridade poderemos definimos agrupamento de dados e após utilizamos a análise discriminante para verificar a proporção correta dos agrupamentos.

15 Grafico 5. Dendrograma Média por Estado para as três variáveis com maior F. Dendrograma Média por Estado para Morti_np x Pindcri_np x Nestuda_np 75,18 Similarity 83,45 91,73 100,00 9 clusters (-DF) AM RJ AL RR AP AC PE CE SE MS ES RO RN MT PA TO Observations MG SP RS PR BA SC PI PB MA GO Depois de tentar com diferentes números de clusters este é o dendrograma que permite fazer uma melhor análise discriminante e aumentar assim a porcentagem de proporção correta de agrupamento de municípios, sem considerar DF. Comando: STAT > MULTIVARIATE > DISCRIMINANT ANALISYS. Tabela 8. Análise Discriminante por Agrupamento para as três variáveis com maior F da Dimensão Desvulnerabilidade. Metodo Linear Discriminant Analysis: Agrupamento versus Mean_Morti_n. Mean_Pindcri.... Linear Method for Response: Agrupamento do Estado Predictors: Mean_Morti_np. Mean_Pindcri_np. Mean_Nestuda_np Group G1 G2 G3 G4 Count 3 9 10 4 Summary of classification True Group Put into Group G1 G2 G3 G4 G1 2 1 0 0 G2 0 4 1 1 G3 1 2 8 0 G4 0 2 1 3 Total N 3 9 10 4 N correct 2 4 8 3 Proportion 0,667 0,444 0,800 0,750 N = 26 N Correct = 17 Proportion Correct = 0,654

16 Existem duas possibilidades análise discriminante que são a linear e a quadrática. Dependendo da variável deve-se dar mais peso e mais atenção a um método que outro. Até o momento a melhor avaliação de Análise Discriminante para agrupamento de regiões era a Linear que apresentava uma proporção correta de 61,7%, mas com esta nova análise baseada na similaridade pode-se definir que a Análise Discriminante por agrupamento e método linear é melhor com um 65,4% de proporção Correta. Para seguir com a comparação a continuação se apresenta a regressão logística. 4. COMPARAÇÃO DE MÉDIA, ANÁLISE DE VARIÂNCIA E INTERVALO DE CONFIANÇA. Segue abaixo os resultados da One-Way ANOVA para cada uma das três variáveis MORTI_np X PINDRI_np X NESTUDA_np para verificar a ordem das regiões One-way ANOVA: MORT1_np versus Região Source DF SS MS F P Região 4 130,1073 32,5268 2871,93 0,000 Error 5559 62,9600 0,0113 Total 5563 193,0673 S = 0,1064 R-Sq = 67,39% R-Sq(adj) = 67,37% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---------+---------+---------+---------+ CO 465 0,8110 0,0706 (*) N 449 0,6584 0,1230 (*) NE 1794 0,5119 0,1529 *) S 1188 0,8823 0,0558 *) SE 1668 0,8167 0,0705 (* ---------+---------+---------+---------+ 0,60 0,70 0,80 0,90 Pooled StDev = 0,1064 Depois de fazer a analise das três ANOVAS se determina que a classificação das regiões é: NE (1) N (2) CO (3) S (4).

17 5. REGRESSÃO LOGÍSTICA Ordinal Logistic Regression: Regiões Codi versus MORT1_np. PINDCRI_np.... Link Function: Logit Response Information Variable Value Count Regiões Codificadas COSE 2133 N 449 NE 1794 S 1188 Total 5564 Logistic Regression Table 95% Odds CI Predictor Coef SE Coef Z P Ratio Lower Const(1) -0,562769 0,119990-4,69 0,000 Const(2) -0,202780 0,119829-1,69 0,091 Const(3) 1,30097 0,120997 10,75 0,000 MORT1_np 0,343728 0,219357 1,57 0,117 1,41 0,92 PINDCRI_np 3,30346 0,234606 14,08 0,000 27,21 17,18 T_NESTUDA_NTRAB_MMEIO_np -3,70566 0,294851-12,57 0,000 0,02 0,01 Predictor Upper Const(1) Const(2) Const(3) MORT1_np 2,17 PINDCRI_np 43,09 T_NESTUDA_NTRAB_MMEIO_np 0,04 Log-Likelihood = -6873,010 Test that all slopes are zero: G = 334,281, DF = 3, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 16740,7 16683 0,375 Deviance 13746,0 16683 1,000 Measures of Association: (Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant 6823904 63,3 Somers' D 0,27 Discordant 3909684 36,2 Goodman-Kruskal Gamma 0,27 Ties 54925 0,5 Kendall's Tau-a 0,19 Total 10788513 100,0

18 A análise de Regressão Logística Ordinal por região apresenta um valor de P-Value de zero o que significa que a análise é confiável, o modelo apresentou nível de concordância de 63,3% de acerto. Results for: COMPONENTES PRINCIPALES Y OTROS DATOS NORMAL. E POSITIVA.MTW Ordinal Logistic Regression: Grupos versus Mean_Morti_n. Mean_Pindcri.... Link Function: Logit Response Information Variable Value Count Grupos 1 3 2 7 3 2 4 6 5 4 6 1 7 1 8 1 9 1 Total 26 Logistic Regression Table Predictor Coef SE Coef Z P Odds Ratio 95% CI Lower Const(1) 3,44363 2,62501 1,31 0,190 Const(2) 5,21812 2,68518 1,94 0,052 Const(3) 5,52231 2,70556 2,04 0,041 Const(4) 6,54315 2,79025 2,35 0,019 Const(5) 7,61814 2,88862 2,64 0,008 Const(6) 8,05001 2,92826 2,75 0,006 Const(7) 8,63258 2,98682 2,89 0,004 Const(8) 9,46946 3,10230 3,05 0,002 Mean_Morti_np 7,58182 4,87237 1,56 0,120 1962,19 0,14 Mean_Pindcri_np 4,06256 7,07981 0,57 0,566 58,12 0,00 Mean_Nestuda_np -20,1636 11,3062-1,78 0,075 0,00 0,00 Predictor Upper Const(1) Const(2) Const(3) Const(4) Const(5) Const(6) Const(7) Const(8) Mean_Morti_np 27549501,96 Mean_Pindcri_np 61757820,89 Mean_Nestuda_np 7,36 Log-Likelihood = -46,728 (Test that all slopes are zero: G = 6,766, DF = 3, P-Value = 0,080) Goodness-of-Fit Tests Method Chi-Square DF P Pearson 164,141 197 0,958 Deviance 93,456 197 1,000 Measures of Association:(Between the Response Variable and Predicted Probabilities) Pairs Number Percent Summary Measures Concordant 179 64,2 Somers' D 0,28 Discordant 100 35,8 Goodman-Kruskal Gamma 0,28 Ties 0 0,0 Kendall's Tau-a 0,24 Total 279 100,0

19 A análise de Regressão Logística Ordinal por região apresenta um valor de P-Value de zero o que significa que a análise é confiável, o modelo apresentou nível de concordância de 63,3% de acerto. A análise de Regressão Logística Ordinal para os dados agrupados por região apresenta um P- Value de 0,080 com um nível de concordância de 64,2%. Através da Regressão Logística Ordinal se classificam novas observações em uma ou duas categorias, esta regressão pode ser superior do que o a análise discriminante e este foi o caso do anterior exercício. 6. TRABAJO ARVOLES DE CLASSIFICAÇÃO Advertencia No se muestran las tablas de resúmenes de ganancias ya que no se han definido los beneficios. No se muestran las tablas de ganancias de las categorías objetivo ya que no se han definido las categorías objetivo. Resumen del modelo Especificações Método de crecimiento CHAID Variable dependiente Variables independientes Validación Região MORT1_np, PINDCRI_np, NESTUDA_np Ninguna Máxima profundidad de árbol 3 Mínimo de casos en un nodo filial 100 Mínimo de casos en un nodo parental 50 Resultados Variables independientes incluidas MORT1_np, NESTUDA_np, PINDCRI_np Número de nodos 53 Número de nodos terminales 37 Profundidad 3

20 Gráfica 6. Arvore de Classificação. Riesgo Estimación Típ. Error,352,006 Métodos de crecimiento: CHAID Variable dependiente: Região

21 Clasificación Observado Pronosticado CO N NE S SE Porcentaje correcto CO 19 0 26 51 369 4,1% N 6 0 231 18 194,0% NE 2 0 1573 4 215 87,7% S 12 0 13 603 560 50,8% SE 14 0 62 184 1408 84,4% Porcentaje global 1,0%,0% 34,2% 15,5% 49,4% 64,8% Métodos de crecimiento: CHAID Variable dependiente: Região A porcentagem de acerto deste modelo é de 64,8%. El árbol no consigue distinguir CO de SE (pronostico todo en esta última), ni N y NE. A árvore considera que as variáveis mais importantes são: em primeiro lugar Supervivência Infantil de até um ano. (Morti_np). Sem considerar o valor F, este tipo de análise determina que as regiões com maior concentração para Morti_np são NE com 32,2% e 1794 municípios seguida de SE com 30% com 1668 munícipios. O nodo um tem 558 municípios, apresentando que as duas regiões mais misturadas são NE e S com 31,4% e 28% respectivamente tomando a variarei NESTUDA_np como aquela que entre as 6 variáveis melhor pode ajudar a separar os dados.

Gráfica 7. Ampliação Arvore de Classificação. (parte esquerda) 22

Gráfica 7. Ampliação Arvore de Classificação. (parte direita) 23

24 CONSIDERAÇÕES FINAIS Sem considerar o F, o sistema determina por níveis de classificação as variáveis mais representativas para classificar os municípios em grupos, estabelecendo para isto o numero de casos por intervalos fazendo uma régua logica. Entre mais separa melhor. Em um primeiro nível, a variável que melhor separa a Dimensão Desvulnerabilidade é Supervivência Infantil (morti_np). Este modelo de arvores de classificação oferece uma porcentagem de 64,8% de acerto.