MODELOS LINEARES GENERALIZADOS: UMA FERRAMENTA PARA A CARACTERIZAÇÃO DA FECUNDIDADE E INFECUNDIDADE EM PORTUGAL

Tamanho: px
Começar a partir da página:

Download "MODELOS LINEARES GENERALIZADOS: UMA FERRAMENTA PARA A CARACTERIZAÇÃO DA FECUNDIDADE E INFECUNDIDADE EM PORTUGAL"

Transcrição

1 MODELOS LINEARES GENERALIZADOS: UMA FERRAMENTA PARA A CARACTERIZAÇÃO DA FECUNDIDADE E INFECUNDIDADE EM PORTUGAL Rui Dias 1, Maria Filomena Mendes 2, Paulo Infante 3 1 RuiDias666@gmail.com, Universidade de Évora, Portugal 2 mmendes@uevora.pt, CIDEHUS, Universidade de Évora, Portugal 3 pinfante@uevora.pt, CIMA, Universidade de Évora, Portugal 1

2 1. Introdução A fecundidade baixa ou muito baixa é um dos grandes problemas do século XXI em alguns países europeus, algo que tem contribuído para esses valores de fecundidade é a incidência crescente de mulheres e homens que, voluntaria ou involuntariamente, não fazem a transição para a maternidade e paternidade ou a fazem muito tardiamente (González & Jurado- Guerrero, 2006). Durante a última década, Portugal registou um declínio entre 2000 e 2012 de 1,55 para 1,28 filhos por mulher, classificando- se como um dos Países com mais baixa fecundidade em toda a União Europeia. Segundo o European Demographic Datasheet (2012) do Vienna Institute of Demography, as mulheres, mesmo nos países de baixo Índice Sintético de Fecundidade (ISF), têm o primeiro filho mais cedo (Hungria 27,7 anos, Letónia 26, Roménia 25,2 e Moldávia 24,1). Um factor decisivo para a redução do número de nascimentos é o adiamento da maternidade e paternidade (Oliveira, 2008, Mendes, 2012, Mendes e Tomé, 2010, Sobotka, 2004). Os países europeus que mais precocemente diminuíram a sua fecundidade aumentaram recentemente os valores do ISF em resultado da recuperação dos nascimentos adiados (Goldstein et al, 2009, Sobokta et al, 2012). Os casais portugueses, pelo contrário, foram adiando o nascimento do segundo filho e mesmo do primeiro (Oliveira, 2012, Cunha, 2012, Maciel et al, 2012). Até à data não foram ainda encontrados os factores determinantes deste duplo adiamento em Portugal. Ao longo dos anos, adiar o nascimento do primeiro e do segundo filho tem sido um comportamento reprodutivo bastante comum e será uma das principais causas para a não realização de preferências e intenções reprodutivas (Maciel et al, 2012, Rosina et al, 2009, Bilari et al, 2009). Embora a aspiração à parentalidade seja ainda amplamente valorizada (Cunha, 2007), a fecundidade em Portugal regista traços bastante distintos: elevada proporção de famílias com um filho e incidência marginal de famílias sem filhos. Mais concretamente verifica- se um aumento nos últimos anos de mais descendências de filho único e cada vez menos descendências de terceira ordem. Existe também uma baixa incidência do padrão tardio de constituição da vida familiar, com as mulheres a terem uma idade média aos 29 anos, aproximadamente, e um adiamento principalmente nos indivíduos mais escolarizados (Cunha, 2012). Portugal apresenta também um dos valores mais baixos de infecundidade (childlessness) da Europa com 5% na coorte de mulheres de 1963 (Frejka, 2008). Uma das dúvidas mais frequentes é a caracterização dos indivíduos com mais de 35 anos sem filhos, este projecto pretende assim dar um contributo importante nessa análise dos indivíduos com mais de 35 anos que não têm nem pretendem vir a ter filhos, incluindo- se portanto na 2

3 infecundidade (childlessness). É também importante conseguir caracterizar os indivíduos que chegando aos 30 anos sem filhos ainda têm intenções de entrar na parentalidade, incluindo- se portanto naquela faixa de cidadãos que adiam o primeiro filho. Tendo como principal objectivo a descoberta de factores que possam influenciar indivíduos com determinadas características, a utilização de modelos de regressão parece uma via bastante interessante e que pode trazer resultados promissores. O modelo linear normal foi criado no início do século XIX por Legendre e Gauss e dominou a modelação estatística até meados do século XX. Foi então que vários modelos não lineares e não normais foram desenvolvidos para fazer face a situações em que o modelo linear normal não era o mais adequado. Exemplos disso são os modelos complementar log- log para ensaios de diluição (Fisher, 1922), os modelos probit (Bliss, 1935), e logit (Berkson, 1944; Dyke and Patterson, 1952; Rasch, 1960) para proporções, os modelos log- lineares para dados de contagens (Birch,1963), os modelos de regressão para análise de sobrevivência (Feigland Zelen, 1965; Zippin and Armitage, 1966; Glasser, 1967). Todos os modelos anteriormente descritos apresentam uma estrutura de regressão linear e têm, em comum, o facto da variável resposta seguir uma distribuição dentro de uma família de distribuições com propriedades muito específicas: a família exponencial. Os Modelos Lineares Generalizados (MLG) introduzidos por Nelder e Wedderburn (1972) correspondem a uma síntese destes e de outros modelos, vindo assim unificar, tanto do ponto de vista teórico como conceptual, a teoria da modelação estatística até então desenvolvida. Para este estudo, e tendo em conta a utilização de variáveis quer discretas quer contínuas, optou- se pelo modelo linear generalizado definido pelo modelo binomial com função de ligação canónica logit, sendo conhecido por modelo de regressão logística. O modelo de regressão logística é o mais popular entre os modelos lineares generalizados para analisar dados binários, muito possivelmente, devido à sua simplicidade de implementação computacional. 2. Dados e Metodologias A base de dados utilizada neste estudo foi a do Special Eurobarometer Social Climate de A escolha da função de ligação é essencial num MLG, neste caso optou- se por uma função de ligação logit pelo facto da variável resposta ser binária e também pela sua 3

4 simplicidade. A função de ligação relaciona a combinação linear das variáveis explicativas com o valor esperado da variável resposta. A função de ligação logit tem a seguinte expressão: π x = e!!!!!! 1 + e!!!!!! logit = ln π x 1 π x = β! + β! x Para a interpretação dos coeficientes estimados pelo modelo calcula- se as Razões de Possibilidades (inglês: Odds Ratio, OR), a razão que define a possibilidade de ocorrência de um evento num grupo com a possibilidade de ocorrência noutro grupo. Essa possibilidade é a probabilidade de ocorrência desse evento dividida pela probabilidade de não ocorrência desse mesmo evento. A determinação dos OR torna- se então fundamental para a análise e interpretação dos resultados obtidos na modelação. O seu cálculo conjuntamente com o cálculo de intervalos de confiança são efectuados através das seguintes expressões matemáticas, quando estamos perante um modelo sem interacções: OR = exp (β! ) IC!!! = β! ± Z!!! σ!! Na modelação estatística há que ter em atenção algumas particularidades: quanto maior o número de variáveis incluídas no modelo, maiores as estimativas dos desvios padrão dos coeficientes e mais dependente o modelo fica dos dados observados; o comportamento individual das variáveis pode ser muito distinto do comportamento das mesmas quando em conjunto com outras; o sobreajustamento (valores demasiado elevados nas estimativas) pode ser problemático nos casos onde o número de variáveis no modelo é grande em relação ao número de indivíduos ou quando a probabilidade de ocorrer o evento (variável resposta=1) está perto do 0 ou 1. De um ponto de vista metodológico, é possível organizar a modelação estatística em várias fases/etapas: 1) Definir qual a variável resposta e quais as variáveis explicativas a utilizar na modelação; 4

5 2) Análise Univariada de cada variável Ter atenção especial para as tabelas de contingência, entre a variável e a variável resposta, com alguma célula igual a zero: nesses casos terá de se juntar categorias ou eliminar por completo a categoria, caso seja uma variável dicotómica, não incluí- la no modelo; se a variável é ordinal, modelar como se fosse contínua. 3) Selecção de variáveis para a modelação multivariada As variáveis com um valor de p (Wald) inferior a 0,25 no ponto anterior, assim como as variáveis importantes no contexto do estudo são incluídas no modelo multivariado; Para as variáveis com esse grau de associação, estimar os Odds Ratio, assim como os seus intervalos de confiança; 4) Verificação da importância de cada variável no modelo As variáveis que não contribuem significativamente (valor de p inferior a 0,10) para o modelo devem ser retiradas e um novo modelo ajustado. O novo modelo deve ser comparado ao anterior através do teste de razão de verosimilhanças ou pelo valor de p de Wald; Este processo de exclusão contínua até que todas as variáveis importantes estejam incluídas no modelo e as excluídas sejam contextualmente ou estatisticamente não significativas. 5) Verificação da importância de cada variável que ficou de fora do modelo multivariado inicial Cada variável que não foi seleccionada para o modelo multivariado inicial deve ser adicionada uma a uma no modelo actual; Este passo é útil na identificação de variáveis que, por si só, não são significativas, mas que dão um contributo importante ao modelo na presença de outras. 6) Observação cuidadosa das variáveis no modelo Para além da atenção já evidenciada no ponto 2, no que toca à existência de categorias com algum valor de zero, há que verificar a homogeneidade na distribuição de eventos nas categorias das variáveis discretas (a existência de poucos eventos em algumas categorias pode enviesar e muito os resultados obtidos); 5

6 Verificação do pressuposto da linearidade das variáveis contínuas com o logit (utilização do método dos polinómios fraccionários ou do método dos quartis são apenas dois exemplos que podem ser efectuados para as variáveis contínuas). 7) Procura de interacções Limpar a base de dados de missing values (NA), para ser possível a comparação entre modelos através do teste de razão de verosimilhanças; Introduzir todos os pares de variáveis, um de cada vez no modelo de efeitos principais, que têm alguma base científica para interagir; Testar a significância de cada interacção no modelo através do teste de razão de verosimilhança entre o modelo com a interacção e o modelo sem a interacção (valor de p inferior a 0,05). 8) Validação, Adequabilidade e Bondade de Ajustamento Para a validação do modelo é necessário o cálculo do R! de Cox & Snell, da Distância de Sommers, D!,! e dos valores de Slope. Nenhum destes valores deve apresentar- se muito superior a 0,10; Para a bondade de ajustamento, pode- se efectuar ou o teste de Hosmer- Lemeshow (Hosmer & Lemeshow, 2000) ou o teste de Cessie- van Houwelingen (Hosmer et al., 1997), para estes testes é necessário que o valor de p fique acima do valor de significância pretendido (0,05); Para categorizar a discriminação do modelo foi construída a curva ROC, que fornece dados sobre a sensibilidade, especificidade e AUC (area under curve). Sensibilidade é a percentagem de ocorrências correctamente preditas. Especificidade é a percentagem de não ocorrências correctamente preditas. Nestes dois casos é necessário ter mais de 70%. O AUC fornece a habilidade do modelo em discriminar entre indivíduos com o evento e sem evento. AUC entre 70 e 80% é aceitável, acima disso é excelente ou excepcional. 9) Análise de Resíduos Para finalizar a modelação é necessário avaliar a influência de cada observação no modelo. Neste caso em particular, analisa- se os resíduos via padrão de covariáveis, comparando- se a estimativa dos 6

7 coeficientes obtidos a partir da eliminação dos padrões de covariáveis consideradas influentes. Caso as estimativas dos coeficientes sejam muito diferentes é necessário decidir sobre a manutenção ou não do padrão considerado influentes na base de dados. 3. Resultados 1º Modelo 3.1. Análise Descritiva A primeira análise que deve ser efectuada, antes de se proceder à modelação estatística, é uma análise descritiva de todas as variáveis que se pretende incorporar no modelo; nomeadamente, tabelas de contingência entre as possíveis variáveis explicativas e a variável resposta. A variável resposta, ou seja que se quer explicada, que se pretende utilizar neste primeiro modelo foi caracterizada da seguinte forma: indivíduos com mais de 35 anos que não têm filhos, nem têm intenção de ter residentes em Portugal (resp35). O quadro 1 regista os valores verificados para a variável resposta, podendo- se observar a existência de 65 casos de indivíduos com mais de 35 anos que não têm filhos nem pretendem vir a ter. Variável 0 1 resp Quadro 1 Análise Descritiva da Variável Resposta. As variáveis explicativas foram divididas em três grupos distintos: 1) variáveis respeitantes a questões de percepção relativa à vida do indivíduo; 2) variáveis respeitantes a questões de expectativa sobre os próximos 12 meses; 3) variáveis caracterizadoras do indivíduo. Os quadros seguintes caracterizam as respectivas variáveis explicativas em função da variável resposta. Com esta análise pretende- se verificar a existência de uma distribuição homogénea por parte das respectivas variáveis nas suas categorias em função da variável resposta. 7

8 1) Variáveis respeitantes a questões de percepção da vida do indivíduo. Globalmente, como se sente, com a vida que tem? (qb1rgps) qb1rgps/resp Satisfeito Não Satisfeito Quadro 2 Tabela de Contingência: Variável qb1rgps vs Variável Resposta. Como avalia a área em que vive actualmente? (qb2_1rgps) qb2_1rgps/resp Boa Má Quadro 3 Tabela de Contingência: Variável qb2_1rgps vs Variável Resposta. Como avalia o sistema de saúde do seu país actualmente? (qb2_2rgps) qb2_2rgps/resp Bom Mau Quadro 4 Tabela de Contingência: Variável qb2_2rgps vs Variável Resposta. 8

9 Como avalia o sistema de pensões do seu país actualmente? (qb2_3rgps) qb2_3rgps/resp Bom 95 8 Mau Quadro 5 Tabela de Contingência: Variável qb2_3rgps vs Variável Resposta. Como avalia os subsídios a desempregados do seu país actualmente? (qb2_4rgps) qb2_4rgps/resp Bom Mau Quadro 6 Tabela de Contingência: Variável qb2_4rgps vs Variável Resposta. Como avalia o custo de vida do seu país actualmente? (qb2_5rgps) qb2_5rgps/resp Bom 48 1 Mau Quadro 7 Tabela de Contingência: Variável qb2_5rgps vs Variável Resposta. 9

10 Como avalia o combate à desigualdade e pobreza no seu país actualmente? (qb2_7rgps) qb2_7rgps/resp Bom Mau Quadro 8 Tabela de Contingência: Variável qb2_7rgps vs Variável Resposta. Como avalia o acesso à habitação no seu país actualmente? (qb2_9rgps) qb2_9rgps/resp Bom 62 2 Mau Quadro 9 Tabela de Contingência: Variável qb2_9rgps vs Variável Resposta. Como avalia a situação económica do seu país actualmente? (qb2_11rgps) qb2_11rgps/resp Boa 26 1 Má Quadro 10 Tabela de Contingência: Variável qb2_11rgps vs Variável Resposta. 10

11 Como avalia a sua situação de emprego actualmente? (qb2_12rgps) qb2_12rgps/resp Boa Má Quadro 11 Tabela de Contingência: Variável qb2_12rgps vs Variável Resposta. Como avalia a situação financeira do seu agregado familiar actualmente? (qb2_13rgps) qb2_13rgps/resp Boa Má Quadro 12 Tabela de Contingência: Variável qb2_13rgps vs Variável Resposta. Como avalia a situação de emprego no seu país actualmente? (qb2_14rgps) qb2_14rgps/resp Boa 40 2 Má Quadro 13 Tabela de Contingência: Variável qb2_14rgps vs Variável Resposta. 2) Variáveis respeitantes a questões relativas às expectativas sobre os próximos 12 meses. Estas variáveis inicialmente estavam factorizadas em três categorias (melhor, na mesma e pior), tendo em vista uma mais fácil interpretação e uma adequação ao pretendido no estudo, juntaram- se as categorias na mesma e pior, resultando em novas variáveis dicotómicas. 11

12 Expectativas em relação à sua vida no geral. (qb3_1cat) qb3_1cat/resp Melhor Pior + Na mesma Quadro 14 Tabela de Contingência: Variável qb3_1cat vs Variável Resposta. Expectativas em relação à sua área de residência. (qb3_2cat) qb3_2cat/resp Melhor Pior + Na mesma Quadro 15 Tabela de Contingência: Variável qb3_2cat vs Variável Resposta. Expectativas em relação ao sistema de saúde no seu país. (qb3_3cat) qb3_3cat/resp Melhor 75 1 Pior + Na mesma Quadro 16 Tabela de Contingência: Variável qb3_3cat vs Variável Resposta. 12

13 Expectativas em relação ao sistema de pensões no seu país. (qb3_4cat) qb3_4cat/resp Melhor 36 1 Pior + Na mesma Quadro 17 Tabela de Contingência: Variável qb3_4cat vs Variável Resposta. Expectativas em relação a subsídios de desemprego no seu país. (qb3_5cat) qb3_5cat/resp Melhor 30 0 Pior + Na mesma Quadro 18 Tabela de Contingência: Variável qb3_5cat vs Variável Resposta. Expectativas em relação ao custo de vida no seu país. (qb3_6cat) qb3_6cat/resp Melhor 34 0 Pior + Na mesma Quadro 19 Tabela de Contingência: Variável qb3_6cat vs Variável Resposta. 13

14 Expectativas em relação ao combate à desigualdade e pobreza no seu país. (qb3_8cat) qb3_8cat/resp Melhor 48 1 Pior + Na mesma Quadro 20 Tabela de Contingência: Variável qb3_8cat vs Variável Resposta. Expectativas em relação ao acesso à habitação no seu país. (qb3_10cat) qb3_10cat/resp Melhor 31 1 Pior + Na mesma Quadro 21 Tabela de Contingência: Variável qb3_10cat vs Variável Resposta. Expectativas em relação à situação económica no seu país. (qb3_12cat) qb3_12cat/resp Melhor 49 1 Pior + Na mesma Quadro 22 Tabela de Contingência: Variável qb3_12cat vs Variável Resposta. 14

15 Expectativas em relação à sua situação de emprego. (qb3_13cat) qb3_13cat/resp Melhor 65 3 Pior + Na mesma Quadro 23 Tabela de Contingência: Variável qb3_13cat vs Variável Resposta. Expectativas em relação à situação financeira do seu agregado familiar. (qb3_14cat) qb3_14cat/resp Melhor 54 2 Pior + Na mesma Quadro 24 Tabela de Contingência: Variável qb3_14cat vs Variável Resposta. Expectativas em relação à situação de emprego no seu país. (qb3_15cat) qb3_15cat/resp Melhor 50 2 Pior + Na mesma Quadro 25 Tabela de Contingência: Variável qb3_15cat vs Variável Resposta. Nota: Há duas variáveis que registam o problema de não apresentarem valores 1 na variável resposta numa das suas categorias. São os casos das variáveis que representam as expectativas dos indivíduos sobre os subsídios de desemprego e sobre o custo de vida nos próximos 12 meses. Como não é possível uma nova recategorização, decidiu- se não colocar essas variáveis em futuras análises, ou modelos. 15

16 3) Variáveis caracterizadoras do indivíduo. Neste grupo de variáveis, cada caso é um caso, portanto, o tratamento efectuado a cada uma das variáveis está condicionado pelos resultados obtidos em análises posteriores. No entanto, apresentam- se os primeiros dados relativos a cada uma delas. Estado Civil (d7cat5) Nesta variável foi adoptada a opção de agregar os indivíduos casados com os divorciados e viúvos, tendo como principal razão o factor de viverem, ou de alguma vez terem vivido, numa relação conjugal estável. As categorias com parceiros e solteiros demonstraram numa análise posterior serem relevantes para a modelação e daí a sua manutenção como categorias separadas. d7cat5/resp Casados + Divorciados + Viúvos Com Parceiros 39 8 Solteiros Quadro 26 Tabela de Contingência: Variável Estado Civil vs Variável Resposta. Género (d10) d10/resp Homem Mulher Quadro 27 Tabela de Contingência: Variável Género vs Variável Resposta. Condição perante o trabalho (d15cat) A variável condição perante o trabalho estava factorizada em três categorias, trabalhador independente, por conta doutrem ou desempregado. Optou- se por utilizar uma variável dicotómica, com as categorias: empregado e desempregado. 16

17 d15cat/resp Empregado Desempregado Quadro 28 Tabela de Contingência: Variável Condição Perante Trabalho vs Variável Resposta. Região onde vive (d25cat) A variável que caracteriza a região onde o indivíduo vive estava inicialmente factorizada em três categorias, área rural ou vila, cidade de tamanho médio ou grande cidade. Após uma análise mais extensa, optou- se por categorizar a variável em dois factores: pequena ou média cidade e cidade grande. d25cat/resp Pequena+Média Cidade Grande Cidade Quadro 29 Tabela de Contingência: Variável Região Onde Vive vs Variável Resposta. Dificuldades em pagar as contas ao final do mês no último ano (d60cat) Esta variável permite- nos verificar as dificuldades que o indivíduo relata em pagar as suas contas ao final do mês no último ano. Inicialmente estava factorizada em três categorias, muitas vezes, algumas vezes e raras vezes ou nunca. Para uma melhor interpretação optou- se por dicotomizar a variável: muitas vezes e algumas, raras ou nunca. d60cat/resp Muitas Vezes Algumas, Raras ou Nunca Quadro 30 Tabela de Contingência: Variável d60cat vs Variável Resposta. 17

18 Último grau académico concluído (edu) Variável categorizada inicialmente em três categorias (básico, secundário e universitário ou mais), foi recategorizada para dicotómica. Assim tem- se as categorias: nível inferior a universitário; nível universitário ou superior. edu/resp Inferior a Universitário Universitário ou Superior Quadro 31 Tabela de Contingência: Variável Grau Académico vs Variável Resposta. Como se vê na sociedade numa escala de 1 a 10. (d61) Sendo esta uma variável ordinal, deve ser analisada de duas formas. Primeiro, tentando perceber quais as características da variável e depois como interage com a variável reposta. Mínimo 1º Quartil Mediana Média 3º Quartil ,699 5 Max 9 Quadro 32 Análise Descritiva da Variável d61. resp35/d Quadro 33 Tabela de Contingência: Variável d61 vs Variável Resposta. 18

19 Nota: Variável Idade Nesta modelação estatística não será possível introduzir a variável idade no modelo, na medida em que a variável resposta é construída a partir das idades dos indivíduos e isso compromete a independência da variável resposta em relação à idade. No entanto, uma análise breve caracterizadora da amostra em relação à idade é sempre necessária e interessante. Mínimo 1º Quartil Mediana Média 3º Quartil Max 92 Quadro 34 Análise Descritiva da Variável Idade Análise Univariada A primeira etapa a realizar na análise univariada é a construção de modelo nulo, chegando aos valores apresentados no quadro seguinte. Posteriormente, constroem- se modelos univariados para cada variável estudada e regista- se os valores da estimativa, erro padrão, estatística de teste e p- value de Wald. Com esses dados é possível tomar uma decisão quanto à utilização ou não de cada variável na fase seguinte da modelação. No quadro seguinte registaram- se os respectivos coeficientes de cada modelo univariado construído para o primeiro grupo de variáveis, assim como do modelo nulo. 19

20 Variáveis de Percepção da Vida do Indivíduo Modelo Categoria Estimativa Erro Padrão Est. Teste p- value AIC Nulo (Intercept) - 2,7162 0, ,21 <2e- 16*** 489,32 Visão Global da sua Vida Satisfeito vs Não Satisfeito - 0,0110 0,2614-0,04 0, ,06 Percepção da área que vive Boa vs Má 0,1294 0,3564 0,363 0, ,11 Percepção do SNS Bom vs Mau - 0,1259 0,2563-0,491 0, ,66 Percepção do Sistema de Pensões Percepção dos Subsídios a Desempregados Bom vs Mau - 0,2629 0,3931-0,669 0,504 Bom vs Mau 0,4568 0,4411 1,035 0, ,38 437,49 Percepção do Custo de Vida Bom vs Mau 1,193 1,019 1,171 0, ,9 Percepção do Combate à Desigualdade e Pobreza Percepção do Acesso à Habitação Percepção da Situação Económica Percepção da sua Situação do Emprego Percepção da Situação Financeira do Agregado Percepção da Situação do Emprego Bom vs Mau 0,2407 0,3700 0,650 0,515 Bom vs Mau 0,7699 0,7303 1,054 0,292 Boa vs Má 0,5616 1,0268 0,547 0,5844 Boa vs Má 0,0034 0,2739 0,012 0,99 Boa vs Má - 0,1837 0,2590-0,709 0,478 Boa vs Má 0,2941 0,7361 0,399 0,69 Quadro 35 Modelos Univariados para Variáveis de Percepção. 476,69 480,37 489,93 427,43 479,7 490,63 Como se pode verificar pelos p- value dos modelos univariados construídos, apenas um apresenta valor abaixo dos 25% de significância, limiar pelo qual são incluídas num modelo 20

21 multivariado. A variável em questão é a que representa a percepção que os indivíduos têm em relação ao custo de vida no país. O valor de p apresentado foi de 0,242, muito próximo dos 0,25 que foi o colocado como patamar de decisão. No próximo quadro são colocados os modelos e respectivos coeficientes para o segundo grupo de variáveis. Variáveis de Expectativa do Indivíduo para o próximo ano Modelo Categoria Estimativa Erro Padrão Est. Teste p- value AIC Expectativa para a sua vida no geral Melhor vs Pior ou na Mesma - 0,0140 0,4141-0,034 0, ,54 Expectativa para a área que vive Melhor vs Pior ou na Mesma 0,4001 0,2758 1,451 0, ,87 Expectativa no SNS Melhor vs Pior ou na Mesma 1,685 1,015 1,661 0, ,04 Expectativa no Sistema de Pensões Melhor vs Pior ou na Mesma 0,9501 1,0220 0,930 0, ,77 Expectativa no Combate à Desigualdade e Pobreza Melhor vs Pior ou na Mesma 1,239 1,019 1,216 0, ,50 Expectativa no Acesso à Habitação Melhor vs Pior ou na Mesma 0,7521 1,024 0,734 0, ,61 Expectativa na Situação Económica Melhor vs Pior ou na Mesma 1,220 1,019 1,198 0, ,31 Expectativa na sua Situação do Emprego Melhor vs Pior ou na Mesma 0,3945 0,6058 0,651 0, ,50 Expectativa na Situação Financeira do Agregado Melhor vs Pior ou na Mesma 0,6166 0,7318 0,843 0, ,21 Expectativa na Situação do Emprego Melhor vs Pior ou na Mesma 0,5363 0,7329 0,732 0, ,31 Quadro 36 Modelos Univariados para Variáveis de Expectativa. Deste conjunto de variáveis, que representam as expectativas que os indivíduos põem em diversos aspectos da vida pessoal e do seu país no próximo ano existem quatro que apresentam valores de p inferiores a 0,25: expectativas para a área em que vive, expectativas 21

22 relativamente ao serviço de saúde, expectativas no combate à desigualdade e à pobreza e expectativas na situação económica do país. De seguida são apresentados os coeficientes para o terceiro grupo de variáveis. Variáveis Caracterizadoras do Indivíduo Modelo Categoria Estimativa Erro Padrão Est. Teste p- value AIC Grau Académico Concluído Inferior a Universitário vs Universiário ou Superior 0,2979 0,4463 0,668 0, ,9 Estado Civil Casad+Div+Viu vs Com Parc. 2,0319 0,4467 4,55 5,40e- 06 *** Casad+Div+Viu vs Solteiros 2,2651 0,2896 7,82 5,23e- 15 *** 421,2 Género Homem vs Mulher 0,2075 0,2585 0,803 0, ,67 Condição Perante o Trabalho Empregado vs Desempregado - 0,2226 0,2571-0,866 0, ,57 Região onde Vive Peq+Med Cidade vs Grande Cidade 0,8661 0,2787 3,108 0, ,32 Dificuldades em Pagar as Contas Muitas Vezes vs Alg+Raras+Nunca 0,0949 0,2716 0,349 0, ,40 Como se vê na sociedade Contínua 1 a 10-0,1158 0,0914 1,267 0,205 Quadro 37 Modelos Univariados para Variáveis Caracterizadoras dos Indivíduos. 475,37 Das sete variáveis caracterizadoras do indivíduo analisadas apenas três apresentam valores de p inferiores a 0,25. O estado civil, a região onde vive e a forma como o indivíduo se vê na sociedade serão as variáveis que seguirão para a fase de análise multivariada seguinte. Agregando os diversos resultados da análise univariada, chega- se às seguintes variáveis significativas a 25%: 1) Como avalia o custo de vida no seu país; 2) Quais as expectativas que tem para a área que vive para os próximos 12 meses; 3) Quais as expectativas que tem para o serviço nacional de saúde para os próximos 12 meses; 4) Quais as expectativas que tem para o combate às desigualdades e pobreza no seu país para os próximos 12 meses; 22

23 5) Quais as expectativas que tem para a situação económica do seu país para os próximos 12 meses; 6) Estado Civil; 7) Região onde vive; 8) Como o indivíduo se vê na sociedade (de 1 a 10); O quadro seguinte apresenta os valores de Odds Ratio e Intervalos de Confiança para as variáveis significativas nos modelos univariados. Modelo Categoria OR IC 95% p- value Percepção do Custo de Vida Bom vs Mau 3,2961 Expectativa para a área que vive Expectativa no SNS Expectativa no Combate à Desigualdade e Pobreza Expectativa na Situação Económica Estado Civil Região onde Vive Melhor vs Pior ou 1,4920 na Mesma Melhor vs Pior ou 5,3950 na Mesma Melhor vs Pior ou 3,4524 na Mesma Melhor vs Pior ou 3,3868 na Mesma Cas+Div+Viu vs 7,6288 Parceiros Cas+Div+Viu vs 9,6321 Solteiros Peq+Med Cidade 2,3776 vs Grande Cidade Como se vê na sociedade Contínua 1 a 10 0,8906 ]0,4477 ; 24,2663[ ]0,8689 ; 2,5619[ ]0,7386 ; 39,4089[ ]0,4687 ; 25,4315[ ]0,4600 ; 24,9366[ ]3,1785 ; 18,3103[ ]5,4601 ; 16,9917[ ]1,3770 ; 4,1055[ ]0,7445 ; 1,0653[ 0,2416 0,147 0, ,2239 0,2311 5,40e- 06 *** 5,23e- 15 *** 0,0019** 0,205 Quadro 38 Odds Ratio e Intervalos de Confiança para Variáveis Significativas a 25% na Modelação Univariada. Observando os valores de Odds Ratio e os respectivos intervalos de confiança calculados constata- se que nas primeiras cinco variáveis, as que representam percepções ou expectativas, o intervalo de confiança é muito grande e que por isso cria dificuldades na interpretação dos dados. Esse facto também se deve ao menor grau de significância, mesmo dentro do limite de 25% que muitas as variáveis apresentam. Ainda assim, para esse grau de significância, pode- se afirmar que: 23

24 A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenção de ter um filho que classificou o custo de vida como mau é 3 vezes superior à de um indivíduo no mesmo contexto que avaliou o custo de vida como bom. A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenções de ter um filho com uma expectativa negativa da área que vive para os próximos 12 meses é 1,5 vezes superior à de um indivíduo no mesmo contexto com uma expectativa positiva para a área que vive nos próximos 12 meses. A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenções de ter um filho com uma expectativa negativa no serviço nacional de saúde para os próximos 12 meses é 5,4 vezes superior à de um indivíduo no mesmo contexto com uma expectativa positiva no serviço nacional de saúde nos próximos 12 meses. A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenções de ter um filho com uma expectativa negativa do combate à desigualdade e pobreza para os próximos 12 meses é 3,4 vezes superior à de um indivíduo no mesmo contexto com uma expectativa positiva do combate à desigualdade e pobreza nos próximos 12 meses. A possibilidade de um indivíduo com mais de 35 anos não ter nem ter intenções de ter um filho com uma expectativa negativa na situação económica do país para os próximos 12 meses é 3,4 vezes superior à de um indivíduo no mesmo contexto com uma expectativa positiva na situação económica do país nos próximos 12 meses. A possibilidade de um indivíduo casado, divorciado ou viúvo, com mais de 35 anos não ter nem ter intenções de ter um filho é 7,6 vezes superior à de um indivíduo no mesmo contexto vivendo com parceiro. A possibilidade de um indivíduo casado, divorciado ou viúvo, com mais de 35 anos não ter nem ter intenções de ter um filho é 9,6 vezes superior à de um indivíduo no mesmo contexto sendo ele solteiro. A possibilidade de um indivíduo residente numa grande cidade com mais de 35 anos não ter nem ter intenções de ter um filho é 2,4 vezes superior à de um indivíduo no mesmo contexto residente numa zona rural ou cidade de dimensões médias. A possibilidade de um indivíduo com mais de 35 anos não ter filhos nem intenções de ter, diminui cerca de 10% por cada aumento de 1 unidade na visão que esse mesmo indivíduo tem de si na sociedade. 24

25 3.3. Análise Multivariada Nesta fase de modelação, o primeiro passo é utilizar as variáveis significativas a 25% da análise univariada para construir um modelo multivariado. As variáveis que não contribuem a um nível de significância de 10% devem ser retiradas e um novo modelo ajustado. Este processo deve ser realizado até ter um modelo ajustado com todas as variáveis com um nível de significância abaixo dos 10%. Este processo foi efectuado para as oito variáveis significativas a 25% da análise univariada e alcançou- se o seguinte modelo multivariado: Variáveis Categoria Estimativa Erro Padrão Est. Teste p- value (Intercept) - 4,5525 1,1398-3,99 6,50e- 05 *** Expectativa no SNS Melhor vs Pior ou na Mesma 1,8608 1,0280 1,81 0,0703. Estado Civil Cas+Div+Viu vs Com Parceiros Cas+Div+Viu vs Solteiros 1,8794 0,4831 3,89 2,2552 0,3043 7,41 0,0001 *** 1,25e- 13 *** Região Onde Vive Peq+Med Cidade vs Grande Cidade 0,5647 0,3184 1,77 0,0761. Como se vê na Sociedade 1 a 10 Contínua - 0,2051 0,1017-2,02 AIC: 384,91 0,0437 * Quadro 39 Modelo Multivariado Final sem Procura de Interacções. Para avaliar o grau de resposta das covariáveis calcula- se o valor de R! : R! = 1!"#$%&'"!"#$%&'(!"!"#$%&'(!"#$%&'"!"#.!"#$!!!"#.!"#$ = 1!"#,!"!"#!!",!"!"# = 1 0,8409 = 0,1591 Pode- se concluir que as covariáveis existentes no modelo explicam cerca de 16% da variável resposta. 25

26 O passo seguinte a dar é a verificação da importância de cada variável que ficou de fora do modelo actual. Este passo é útil na identificação de variáveis que, por si só, não são significativas, mas dão um contributo importante na presença de outras variáveis. Neste caso, observou- se a não alteração do modelo inicial. Nenhuma das variáveis que ficaram de foram do modelo acrescentou algum contributo ao modelo. Todas elas apresentaram níveis de significância superiores a 10% quando incluídas no modelo actual. Pressupostos do Modelo É necessário uma observação cuidada às diversas variáveis no modelo. No caso das variáveis discretas uma análise a cada uma das categorias e no caso das variáveis contínuas verificar o pressuposto da linearidade. No que respeita à análise das variáveis discretas, foram desde logo retiradas as variáveis que apresentavam zero eventos em alguma das suas categorias, isto porque o modelo não ajustava correctamente e, portanto, seria pouco produtiva essa tentativa logo desde início. No entanto, verifica- se que das quatro variáveis que se encontram como significativas no modelo actual ajustado, uma delas apresenta categorias pouco homogeneamente distribuídas. A variável que reflecte a expectativa do individuo em relação ao sistema de saúde do seu país nos próximos 12 meses apresenta apenas um evento numa das suas categorias, o que pressupõe um ajustamento bastante mais débil do modelo e que evidenciará pouca confiança nos resultados obtidos. Assim sendo, a opção tomada foi a de não utilizar essa variável no modelo e continuar com um modelo de apenas três variáveis. Quanto a variáveis contínuas, o modelo identificou uma como sendo significativa. A que diz respeito a como o indivíduo se vê na sociedade. Para verificar o pressuposto da linearidade recorreu- se ao método dos quartis e registou- se o seguinte gráfico: Figura 1 Gráfico para verificação do Pressuposto da Linearidade da Variável d61 (método dos quartis). 26

27 Como se pode verificar através do gráfico, a linearidade da variável não pode ser contestada. Os pontos apresentam um declive decrescente bastante linear. Modelo Final sem Interacções Ajustando o modelo sem a variável discreta que não passou no pressuposto da homogeneidade de categorias, pode- se apresentar um modelo final ajustado sem a introdução de interacções entre variáveis. O quadro seguinte resume a informação desse modelo final ajustado. Variáveis Categoria Estimativa Erro Padrão Est. Teste p- value (Intercept) - 2,8339 0,4813-5,89 3,90e- 09 *** Estado Civil Cas+Div+Viu vs Com Parceiros Cas+Div+Viu vs Solteiros 1,7901 0,4735 3,78 2,2472 0,2959 7,60 0,0002 *** 3,07e- 14 *** Região Onde Vive Peq+Med Cidade vs Grande Cidade 0,5948 0,3081 1,93 0,0536. Como se vê na Sociedade 1 a 10 Contínua - 0,1932 0,0981-1,97 AIC: 408,54 0,0488 * Quadro 40 Modelo Multivarido Final. Fazendo o mesmo cálculo do R! para avaliar o grau de resposta das variáveis ajustadas no modelo: R! = 1!"#$%&'"!"#$%&'(!"!"#$%&'(!"#$%&'"!"#.!"#$!"!"#.!"#$ = 1!"#,!"!!"!"!,!"!!" = 1 0,8516 = 0,1484 Pode- se portanto afirmar que as três variáveis ajustadas no modelo explicam a variável resposta em aproximadamente 15%. O que nos permite afirmar que a perda de informação com a retirada da variável que não passou no pressuposto anterior não foi muito acentuada. Quando comparados os dois modelos através do Critério de Informação de Akaike (AIC), e tendo como factor decisor a minimização do mesmo, pode- se confirmar que, de facto, o valor 27

28 de AIC aumenta com a retirada da variável e que significaria um modelo com pior representatividade do que o anterior. No entanto, isso não significa um melhor ajuste ou uma maior confiança nos resultados, não verificados os pressupostos. Encontrado um modelo ajustado final, ainda sem interacções procuradas, é possível calcular Odds Ratio e respectivos intervalos de confiança a 95% para cada uma das variáveis. O quadro seguinte resume essa informação: Variáveis Categoria OR IC 95% p- value Estado Civil Cas+Div+Viu vs Com Parceiros Cas+Div+Viu vs Solteiros 5,9899 9,4610 ]2,3696 ; 15,1519[ ]5,2977 ; 16,8959[ 0,0002 *** 3,07e- 14 *** Região Onde Vive Peq+Med Cidade vs Grande Cidade 1,8127 ]0,9909 ; 3,3159[ 0,0536. Como se vê na Sociedade 1 a 10 Contínua 0,8243 ]0,6802 ; 0,9990[ 0,0488 * Quadro 41 Odds Ratio e Intervalos de Confiança do Modelo Multivariado Final. De um modo geral a interpretação realizada na análise univariada destas variáveis não se altera. Ou seja, a possibilidade de indivíduos com mais de 35 anos que têm parceiros conjugais, não terem filhos nem desejarem ter é superior à de indivíduos com mais de 35 anos casados, divorciados ou viúvos em quase 6 vezes. Quanto a indivíduos com mais de 35 anos solteiros, têm uma possibilidade de não ter filhos nem intenção de ter mais de 9 vezes superior a homens nas mesmas condições mas sendo casados, divorciados ou viúvos. A possibilidade de indivíduos com mais de 35 anos a viverem numa grande cidade não terem filhos nem desejarem ter é superior em quase o dobro quando comparados com indivíduos residentes em pequenas cidades ou de média dimensão. Por fim, a possibilidade de um indivíduo com mais de 35 anos não ter filhos nem intenções de ter, diminui cerca de 20% por cada aumento de 1 unidade na visão que esse mesmo indivíduo tem de si na sociedade. 28

29 Procura de Interacções Uma das fases necessárias à conclusão duma modelação estatística é a necessidade de procurar interacções entre as variáveis ajustadas no modelo multivariado. Resume- se à necessidade de tentar averiguar se existe relação no modelo entre duas das variáveis dadas como relevantes ou significativas. No caso do modelo anterior ajustado não existe qualquer interacção significativa entre as variáveis. Para um modelo com três variáveis ajustadas existe a possibilidade de três possíveis interacções duas variáveis a duas e uma interacção entre as três variáveis disponíveis. Nos quatro casos possíveis não foi evidenciada nenhuma significância abaixo dos 5%, limiar pelo qual se acha relevante a entrada da interacção no modelo. Assim sendo, o modelo anterior é considerado o modelo final encontrado na modelação de estes dados. Validação, Calibração e Bondade de Ajustamento do Modelo Para efectuar a validação dum modelo de regressão logística como o utilizado neste projecto é necessário calcular os coeficientes D!", R! e Slope. Os valores optimistas médios destes coeficientes não podem exceder os 0,10. No quadro seguinte são fornecidos os valores dos coeficientes anteriores para o modelo actual. Valores optimistas médios D xy R 2 Slope 0,0128 0,0181 0,0341 Quadro 42 Coeficientes para validação do modelo. Como se pode verificar pelos valores calculados, a validação do modelo foi conseguida. Isto porque, como foi referido, os valores de cada um dos coeficientes fica muito abaixo dos 10% colocados como limite. Para verificar o grau de bondade do ajustamento do modelo ajusta- se o teste de bondade de ajustamento de Cessie- van Houwelingen. Este valor não se poderá situar abaixo do limiar de significância de 0,05. Teste de Cessie- van Houwelingen Valor- p 0,3621 Quadro 43 Coeficiente Cessie- van Houweligen. 29

30 Para averiguar a calibração do modelo final encontrado pode- se representar o seguinte gráfico com os valores observados no modelo com a curva das estimativas para o enviesamento. Uma melhor calibração significa as curvas mais próximas. Figura 2 Gráfico de observação da calibração do modelo. Observando o gráfico é possível concluir que a calibração é positiva, não existindo uma grande disparidade de valores nas curvas apresentadas. Por fim, pode- se analisar o ajustamento do modelo através da sensibilidade. Essa análise é feita a partir da Curva ROC representada no gráfico seguinte. Figura 3 Gráfico da Curva ROC e critério AUC. 30

31 Sensibilidade e especificidade situam- se acima ou muito perto dos 70%, valor que seria pretendido, e a área abaixo da curva (AUC) acima dos 70%, valor considerado aceitável. Tudo indicadores de um modelo bem ajustado e validado Conclusões De um modo geral pode- se concluir que a análise descritiva nos garante uma modelação bem- sucedida. Isto porque as variáveis apresentam distribuições homogéneas nas diversas categorias e aquelas que poderiam suscitar algumas dúvidas foram retiradas por esse mesmo motivo. Se observarmos com mais atenção cada uma das variáveis caracterizadoras, chega- se às seguintes conclusões: Existe um número de homens casados, divorciados ou viúvos muito superior ao de solteiros ou com parceiros na base de dados e a percentagem de indivíduos que têm mais de 35 anos com parceiros que não têm filhos nem querem ter é muito superior nos solteiros do que nos casados, divorciados ou viúvos; Existem mais mulheres que homens e mais desempregados que empregados, embora a diferença nos dois grupos não seja grande; Observa- se uma diferença acentuada no número de indivíduos que vivem nas pequenas e médias cidades quando comparado com quem vive nas grandes cidades, com vantagem para as primeiras; No que se refere às dificuldades de pagar as despesas ao final do mês, existem muito mais indivíduos que responderam Muitas vezes do que os restantes; Por fim, o número de indivíduos com um nível de escolaridade inferior ao Ensino Superior é muito maior do que o de indivíduos com nível idêntico ou superior ao Ensino Superior. A modelação Univariada apresentou oito (8) variáveis significativas a 25%: uma (1) de percepção, quatro (4) de expectativas e três (3) caracterizadoras do indivíduo. Destaque para o estado civil e região onde vive o indivíduo que apresentaram valores de significância abaixo dos 5% e que se apresentam, à partida, como as principais candidatas a manterem- se num modelo final multivariado. Quanto à interpretação de valores de Odds Ratio, pode- se constatar que na variável de percepção, assim como nas quatro (4) variáveis de expectativas, os resultados apresentados serão os esperados. Ou seja, quanto pior a percepção da realidade, ou pior a expectativa, maior a possibilidade de não ter filhos nem ter intenção de ter, em 31

32 indivíduos com mais de 35 anos. No que se refere às variáveis caracterizadoras, indivíduos com mais de 35 anos, com parceiros ou solteiros têm uma maior possibilidade de não ter filhos nem ter intenção de vir a ter quando comparados com indivíduos casados, divorciados ou viúvos. Assim como indivíduos residentes em grandes cidades com mais de 35 anos, têm uma maior possibilidade de não terem filhos nem quererem vir a ter, do que residentes em pequenas e médias cidades. Já o nível que o indivíduo se coloca na sociedade aponta para uma maior possibilidade de não ter nem querer vir a ter filhos em indivíduos com um nível inferior. Na modelação multivariada, destaque para a escassez de resultados promissores. Ou seja, o número de variáveis estatisticamente significativas é pequeno, embora o modelo se apresente como estatisticamente válido e bem ajustado. Apresentando poucas variáveis estatisticamente significativas, a capacidade de resposta tende a ser menor e também a quantidade de informação retirada do modelo é menor. Contudo é possível concluir que, no modelo final, existem três (3) variáveis que apresentam valores de significância estatística: estado civil, região onde vive e como se vê na sociedade. A tendência de interpretação segue o caminho apresentado na análise univariada, assim como os valores de Odds Ratio se situam próximos dos obtidos na análise univariada. Na fase de procura de interacções foi concluído que não existem interacções estatisticamente significativas entre estas variáveis, por isso o modelo final não apresenta nenhuma interacção. Por fim, segundo a análise relativa à validação do modelo e bondade do seu ajustamento, conclui- se que tudo aponta para um modelo válido e bem ajustado. Não sendo de destacar nenhum valor ou estatística que possa alertar para qualquer problema. 4. Resultados 2º Modelo 4.1. Análise Descritiva Na segunda abordagem deste estudo pretende- se mais uma vez realizar uma análise através da modelação estatística. Se no primeiro modelo o objectivo era comparar indivíduos com 35 anos ou mais sem ter filhos nem intenções de vir a ter com os restantes indivíduos da amostra para Portugal, neste segundo modelo a comparação é feita da seguinte forma: indivíduos com 30 anos ou mais sem ter filhos mas com intenção de ter (variável resposta, resp30) comparados apenas com todos os indivíduos da amostra que têm filhos. Podendo assim explicar o facto de se ter 30 anos e ainda não se ter entrado na parentalidade, mas tendo intenção de entrar, quando reunido numa amostra com indivíduos que já têm filhos. 32

33 Para além da diferença na variável resposta, há que destacar o aumento da dimensão da amostra, na medida em que nesta análise ir- se- á ter em conta não só Portugal mas também Grécia, Espanha e Itália. Isto porque nos dará uma comparação interessante entre países mas também porque aumenta o número de eventos na nossa amostra, necessário para se obter um modelo válido e bem ajustado. Primeira análise descritiva a efectuar é a da variável resposta. Variável 0 1 resp Quadro 44 Análise Descritiva da Variável Resposta. Verifica- se assim um aumento no número da amostra de cerca de 800 casos para mais de A incidência de eventos aumenta de cerca de 3% para mais de 9%, num total de 252 eventos para os quatro países. De acordo com a forma utilizada para caracterizar as possíveis variáveis explicativas do modelo, dividiu- se as mesmas em três grupos: variáveis com questões de percepção da vida do indivíduo; variáveis com questões de expectativas sobre os próximos 12 meses; e variáveis caracterizadoras do indivíduo. Segue- se uma análise descritiva de cada variável em relação à nova variável resposta. 1) Variáveis com questões de percepção da vida do indivíduo. Globalmente, como se sente, com a vida que tem? (qb1rgps) qb1rgps/resp Satisfeito Não Satisfeito Quadro 45 Tabela de Contingência: Variável qb1rgps vs Variável Resposta. 33

34 Como avalia a área em que vive actualmente? (qb2_1rgps) qb2_1rgps/resp Boa Má Quadro 46 Tabela de Contingência: Variável qb2_1rgps vs Variável Resposta. Como avalia o sistema de saúde do seu país actualmente? (qb2_2rgps) qb2_2rgps/resp Bom Mau Quadro 47 Tabela de Contingência: Variável qb2_2rgps vs Variável Resposta. Como avalia o sistema de pensões do seu país actualmente? (qb2_3rgps) qb2_3rgps/resp Bom Mau Quadro 48 Tabela de Contingência: Variável qb2_3rgps vs Variável Resposta. 34

35 Como avalia os subsídios a desempregados do seu país actualmente? (qb2_4rgps) qb2_4rgps/resp Bom Mau Quadro 49 Tabela de Contingência: Variável qb2_4rgps vs Variável Resposta. Como avalia o custo de vida do seu país actualmente? (qb2_5rgps) qb2_5rgps/resp Bom Mau Quadro 50 Tabela de Contingência: Variável qb2_5rgps vs Variável Resposta. Como avalia o combate à desigualdade e pobreza no seu país actualmente? (qb2_7rgps) qb2_7rgps/resp Bom Mau Quadro 51 Tabela de Contingência: Variável qb2_7rgps vs Variável Resposta. 35

36 Como avalia o acesso à habitação no seu país actualmente? (qb2_9rgps) qb2_9rgps/resp Bom Mau Quadro 52 Tabela de Contingência: Variável qb2_9rgps vs Variável Resposta. Como avalia a situação económica do seu país actualmente? (qb2_11rgps) qb2_11rgps/resp Boa Má Quadro 53 Tabela de Contingência: Variável qb2_11rgps vs Variável Resposta. Como avalia a sua situação de emprego actualmente? (qb2_12rgps) qb2_12rgps/resp Boa Má Quadro 54 Tabela de Contingência: Variável qb2_12rgps vs Variável Resposta. 36

37 Como avalia a situação financeira do seu agregado familiar actualmente? (qb2_13rgps) qb2_13rgps/resp Boa Má Quadro 55 Tabela de Contingência: Variável qb2_13rgps vs Variável Resposta. Como avalia a situação de emprego no seu país actualmente? (qb2_14rgps) qb2_14rgps/resp Boa Má Quadro 56 Tabela de Contingência: Variável qb2_14rgps vs Variável Resposta. 2) Variáveis com questões de expectativas sobre os próximos 12 meses. Estas variáveis inicialmente estavam factorizadas em três categorias (melhor, na mesma e pior), tendo em vista uma mais fácil interpretação e uma adequação ao pretendido no estudo, juntaram- se as categorias na mesma e pior, resultando em novas variáveis dicotómicas. Expectativas em relação à sua vida no geral. (qb3_1cat) qb3_1cat/resp Melhor Pior + Na mesma Quadro 57 Tabela de Contingência: Variável qb3_1cat vs Variável Resposta. 37

4 Modelos Lineares Generalizados

4 Modelos Lineares Generalizados 4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da

Leia mais

Depois dos 35 anos, quais as intenções de fecundidade dos Sul Europeus?

Depois dos 35 anos, quais as intenções de fecundidade dos Sul Europeus? Depois dos 35 anos, quais as intenções de fecundidade dos Sul Europeus? Rita Freitas (CIDEHUS-UÉ, rfreitas@uevora.pt) Maria Filomena Mendes (Universidade de Évora, CIDEHUS-UÉ, mmedes@uevora.pt) Andreia

Leia mais

Fecundidade da população portuguesa: uma análise estatística dos determinantes da transição para a parentalidade.

Fecundidade da população portuguesa: uma análise estatística dos determinantes da transição para a parentalidade. + Fecundidade da população portuguesa: uma análise estatística dos determinantes da transição para a parentalidade. Lídia P. Tomé, CIDEHUS - UE Maria Filomena Mendes, CIDEHUS - UE Paulo Infante, CIMA -

Leia mais

Regressão para Dados Binários - Estudo de Dengue

Regressão para Dados Binários - Estudo de Dengue Universidade Federal do Paraná Departamento de Estatística Regressão para Dados Binários - Estudo de Dengue CE225 - Modelos Lineares Generalizados Francielle Przibiciem de Mattos GRR20124686 Guilherme

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Questionário GERAÇÃO SAUDÁVEL: ANÁLISE ESTATÍSTICA

Questionário GERAÇÃO SAUDÁVEL: ANÁLISE ESTATÍSTICA Questionário GERAÇÃO SAUDÁVEL: ANÁLISE ESTATÍSTICA ANÁLISE DE DADOS Os dados foram analisados na versão R 2.13.1. Foi realizada uma análise descritiva exaustiva de todas as variáveis em estudo, usando

Leia mais

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME:

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME: DEPARTAMENTO DE MATEMÁTICA DA UNIVERSIDADE DE COIMBRA Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME: Observação: A resolução completa das perguntas inclui a justificação

Leia mais

INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO

INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO CE225 - Modelos Lineares Generalizados Eduardo

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR ) UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152), Cinthia Zamin Cavassola(GRR20149075) e Luiza Hoffelder da Costa(GRR20149107) AJUSTE DE MODELO DE REGRESSÃO LOGÍSTICA REFERENTE À PRESENÇA DE

Leia mais

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência REGRESSÃO LOGÍSTICA É uma técnica recomendada para situações em que a variável dependente é de natureza dicotômica ou binária. Quanto às independentes, tanto podem ser categóricas ou não. A regressão logística

Leia mais

IV Congresso Português de Demografia Universidade de Évora, 12 e 13 de Setembro de 2012 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

IV Congresso Português de Demografia Universidade de Évora, 12 e 13 de Setembro de 2012 XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX Breve caracterização dos indivíduos sem filhos em Portugal Nome 1º autor: MACIEL, Andreia Doutoranda em Sociologia, Universidade de Évora/CIDEHUS, abfmaciel@fa.uevora.pt

Leia mais

O nível de instrução das mães portuguesas e a evolução da idade média ao nascimento do primeiro filho

O nível de instrução das mães portuguesas e a evolução da idade média ao nascimento do primeiro filho O nível de instrução das mães portuguesas e a evolução da idade média ao nascimento do primeiro filho 31 Março 2012 Maria Filomena Mendes Departamento de Sociologia CIDHEUS Universidade de Évora Lídia

Leia mais

1. A população de Portugal não tem um número elevado de filhos porque não pode ou porque não quer?

1. A população de Portugal não tem um número elevado de filhos porque não pode ou porque não quer? O Inquérito à Fecundidade, realizado em 2013, resultou de uma parceria entre o Instituto Nacional de Estatística (INE) e a Fundação Francisco Manuel dos Santos (FFMS). O momento para apresentação da totalidade

Leia mais

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Lic. Eng. Biomédica e Bioengenharia-2009/2010 Modelos de regressão É usual estarmos interessados em estabelecer uma relação entre uma variável

Leia mais

Disciplina de Modelos Lineares Professora Ariane Ferreira

Disciplina de Modelos Lineares Professora Ariane Ferreira Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável

Leia mais

2.1. Resultados do tratamento de informação

2.1. Resultados do tratamento de informação C. Seguros de Acidentes de Trabalho em Portugal Mortalidade e Remaridação 1. Enquadramento A estimação de parâmetros adequados para o provisionamento das pensões decorrentes de Acidentes de Trabalho tem

Leia mais

IMPACTOS DA EDUCAÇÃO NA POBREZA E NA PRIVAÇÃO MATERIAL DAS FAMÍLIAS EM PORTUGAL, 2010

IMPACTOS DA EDUCAÇÃO NA POBREZA E NA PRIVAÇÃO MATERIAL DAS FAMÍLIAS EM PORTUGAL, 2010 DISSERTAÇÃO MESTRADO EM ECONOMIA E POLÍTICAS PÚBLICAS IMPACTOS DA EDUCAÇÃO NA POBREZA E NA PRIVAÇÃO MATERIAL DAS FAMÍLIAS EM PORTUGAL, 2010 Por: SUSANA PAULA P. F. NEVES INSTITUTO NACIONAL DE ESTATÍSTICA

Leia mais

Análise de Regressão EST036

Análise de Regressão EST036 Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Regressão sem intercepto; Formas alternativas do modelo de regressão Regressão sem

Leia mais

DIMENSÃO PONDERADA DAS LISTAS DE UTENTES DOS MÉDICOS DE FAMÍLIA

DIMENSÃO PONDERADA DAS LISTAS DE UTENTES DOS MÉDICOS DE FAMÍLIA DIMENSÃO PONDERADA DAS LISTAS DE UTENTES DOS MÉDICOS DE FAMÍLIA AGOSTO DE 2017 RESUMO No dia 1 de janeiro de 2013 verificou-se um aumento da dimensão das listas de utentes dos Médicos de Família de 1500

Leia mais

Barómetro Regional da Qualidade Avaliação da Satisfação dos Utentes dos Serviços da Administração Pública Regional e Local

Barómetro Regional da Qualidade Avaliação da Satisfação dos Utentes dos Serviços da Administração Pública Regional e Local Avaliação da Satisfação dos Utentes dos Serviços da Administração Pública Regional e Local Entidade Promotora Enquadramento Concepção e Realização Avaliação da Satisfação dos Utentes dos Serviços da Administração

Leia mais

APONTAMENTOS DE SPSS

APONTAMENTOS DE SPSS Instituto de Ciências Biomédicas de Abel Salazar APONTAMENTOS DE SPSS Rui Magalhães 2010-1 - - 2 - Menu DATA Opção SPLIT FILE Permite dividir, de uma forma virtual, o ficheiro em diferentes ficheiros com

Leia mais

Trabalho de Modelos Lineares Generalizados

Trabalho de Modelos Lineares Generalizados Universidade Federal do Paraná Trabalho de Modelos Lineares Generalizados Ananda Bordignon 1, Brendha Lima 2, Giovanna Lazzarin 3 12 de Novembro de 2018 1 GRR20149157 2 GRR20149163 3 GRR20149088 1 SUMÁRIO

Leia mais

Homocedasticidade? Exemplo: consumo vs peso de automóveis

Homocedasticidade? Exemplo: consumo vs peso de automóveis REGRESSÃO Análise de resíduos Homocedasticidade? Exemplo: consumo vs peso de automóveis 60 50 Consumo (mpg) 40 30 0 10 0 1500 000 500 3000 3500 4000 4500 Peso 0 Diagrama de resíduos 15 10 Resíduos 5 0-5

Leia mais

Trabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017

Trabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017 Trabalho de GLM 2 Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER 17 de outubro de 2017 1 - Resumo Para o trabalho, foi extraída do site kaggle.com uma base com uma amostra

Leia mais

Barómetro Regional da Qualidade Avaliação da Satisfação dos Utentes dos Serviços de Educação

Barómetro Regional da Qualidade Avaliação da Satisfação dos Utentes dos Serviços de Educação Avaliação da Satisfação dos Utentes dos Serviços de Educação Entidade Promotora Concepção e Realização Enquadramento Avaliação da Satisfação dos Utentes dos Serviços de Educação Índice RESUMO EXECUTIVO...

Leia mais

MORTALIDADE DE IDOSOS POR DOENÇAS CARDIOLÓGICAS NA CIDADE DE JOÃO PESSOA-PB

MORTALIDADE DE IDOSOS POR DOENÇAS CARDIOLÓGICAS NA CIDADE DE JOÃO PESSOA-PB MORTALIDADE DE IDOSOS POR DOENÇAS CARDIOLÓGICAS NA CIDADE DE JOÃO PESSOA-PB Msc. Elídio Vanzella- Ensine Faculdades; Estácio. INTRODUÇÃO No ano de 1990 o governo brasileiro, pelo menos no campo das intenções,

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR 20149072 RODOLFO PIROLO GATZKE - GRR 20149150 THAYS COSTA S. SOUZA - GRR 20159231 MODELAGEM PARA O SUCESSO DE CAMPANHA DE MARKETING CURITIBA

Leia mais

AVALIAÇÃO DA QUALIDADE EM CARDIOLOGIA DE INTERVENÇÃO: A IMPORTÂNCIA DO AJUSTAMENTO PELO RISCO NA ANÁLISE DE RESULTADOS

AVALIAÇÃO DA QUALIDADE EM CARDIOLOGIA DE INTERVENÇÃO: A IMPORTÂNCIA DO AJUSTAMENTO PELO RISCO NA ANÁLISE DE RESULTADOS AVALIAÇÃO DA QUALIDADE EM CARDIOLOGIA DE INTERVENÇÃO: A IMPORTÂNCIA DO AJUSTAMENTO PELO RISCO NA ANÁLISE DE RESULTADOS Paulo Sousa, António Sousa Uva; Fausto Pinto, em nome dos Investigadores do Registo

Leia mais

Portugal é caracterizado por uma alta prevalência de excesso de peso e obesidade nas mulheres, sendo que o aumento de peso acontece mais abruptamente

Portugal é caracterizado por uma alta prevalência de excesso de peso e obesidade nas mulheres, sendo que o aumento de peso acontece mais abruptamente RESUMO Portugal é caracterizado por uma alta prevalência de excesso de peso e obesidade nas mulheres, sendo que o aumento de peso acontece mais abruptamente no início da vida adulta. Comportamentos e características

Leia mais

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2 COMO USAR ESTE LIVRO ÍNDICE PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 Variáveis, Populações e Amostras 1.1. VARIÁVEIS ESTATÍSTICAS E ESCALAS DE MEDIDA 27 1.2. POPULAÇÃO VS. AMOSTRA

Leia mais

Coeficiente de determinação R 2 no modelo de regressão linear normal

Coeficiente de determinação R 2 no modelo de regressão linear normal Coeficiente de determinação R 2 no modelo de regressão linear normal Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br

Leia mais

b χ 2 (a 1)(b 1), sob H 0,

b χ 2 (a 1)(b 1), sob H 0, ISTITUTO SUPERIOR DE AGROOMIA ESTATÍSTICA E DELIEAMETO 3 de ovembro, 014 PRIMEIRO TESTE 014-15 Uma resolução possível I Tem-se uma tabela de contingências de dimensão 4. 1. O problema colocado corresponde

Leia mais

Barómetro Regional da Qualidade Avaliação da Satisfação dos Residentes com o Comércio e Restauração

Barómetro Regional da Qualidade Avaliação da Satisfação dos Residentes com o Comércio e Restauração Avaliação da Satisfação dos Residentes com o Comércio e Restauração Entidade Promotora Concepção e Realização Enquadramento Avaliação da Satisfação dos Residentes com o Comércio e Restauração Índice

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010

Leia mais

18% DOS RESIDENTES EM RISCO DE POBREZA.

18% DOS RESIDENTES EM RISCO DE POBREZA. Rendimento e Condições de Vida 2006 15 de Janeiro de 2008 18% DOS RESIDENTES EM RISCO DE POBREZA. O Instituto Nacional de Estatística apresenta os principais indicadores sobre o risco de pobreza e a desigualdade

Leia mais

i j i i Y X X X i j i i i

i j i i Y X X X i j i i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Filho, não é um bicho: chama-se Estatística!

Filho, não é um bicho: chama-se Estatística! Paulo Jorge Silveira Ferreira Filho, não é um bicho: chama-se Estatística! Estatística aplicada uma abordagem prática FICHA TÉCNICA EDIÇÃO: Paulo Ferreira TÍTULO: Filho, não é um bicho: chama-se Estatística!

Leia mais

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão. Glossário Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão. Análise de co-variância: Procedimento estatístico utilizado para análise de dados que

Leia mais

Rendimento e Condições de Vida 2008 (Dados Provisórios)

Rendimento e Condições de Vida 2008 (Dados Provisórios) Rendimento e Condições de Vida 2008 (Dados Provisórios) 15 de Julho de 2009 O risco de pobreza manteve-se em 18% e a Desigualdade continuou a descer Segundo os resultados provisórios do Inquérito às Condições

Leia mais

Esse material foi extraído de Barbetta (2007 cap 13)

Esse material foi extraído de Barbetta (2007 cap 13) Esse material foi extraído de Barbetta (2007 cap 13) - Predizer valores de uma variável dependente (Y) em função de uma variável independente (X). - Conhecer o quanto variações de X podem afetar Y. Exemplos

Leia mais

Notas sobre a população a quebra do número de casamentos

Notas sobre a população a quebra do número de casamentos Maria João Valente Rosa* Análise Social, vol. XXXIV (156), 2000, 791-796 Notas sobre a população a quebra do número de casamentos Viver a dois (com um parceiro conjugal) é uma situação maioritária nas

Leia mais

AULA 17 - Variáveis binárias

AULA 17 - Variáveis binárias AULA 17 - Variáveis binárias Susan Schommer Econometria I - IE/UFRJ Variáveis binárias A variável binária (ou dummy) é um simples exemplo de variável aleatória, o qual é chamada de função indicadora de

Leia mais

Associação entre duas variáveis

Associação entre duas variáveis Associação entre duas variáveis Questões de interesse: Será que duas variáveis são independentes ou pelo contrário dependentes? E se forem dependentes, qual o tipo e grau de dependência? Existem diversas

Leia mais

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo 1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma

Leia mais

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou

Leia mais

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência NOME:

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência NOME: DEPARTAMENTO DE MATEMÁTICA DA UNIVERSIDADE DE COIMBRA Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência 24-05-2011 NOME: Observação: A resolução completa das perguntas inclui

Leia mais

COMPARAÇÃO DE SISTEMAS USANDO DADOS DE AMOSTRAS. Capítulo 13 do livro: The Art of Computer Systems Performance Analysis

COMPARAÇÃO DE SISTEMAS USANDO DADOS DE AMOSTRAS. Capítulo 13 do livro: The Art of Computer Systems Performance Analysis COMPARAÇÃO DE SISTEMAS USANDO DADOS DE AMOSTRAS Capítulo 13 do livro: The Art of Computer Systems Performance Analysis Uma Amostra é apenas um Exemplo As palavras inglesas sample (amostra) e example (exemplo)

Leia mais

Analise de sobreviventes em acidentes de carros

Analise de sobreviventes em acidentes de carros Analise de sobreviventes em acidentes de carros Modelos Lineares Generalizados Lais Hoffmam GRR20159455 Simone Matsubara GRR20124663 Willian Meira GRR20159077 Yasmin Fernandes ISO20180365 Curitiba 2018

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

Leia mais

Número de Consultas ao Médico

Número de Consultas ao Médico UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA João Matheus S. K. T. Hneda Lineu Alberto Cavazani de Freitas Número de Consultas ao Médico Análise

Leia mais

Epidemiologia de Doenças Transmissíveis Aulas Práticas

Epidemiologia de Doenças Transmissíveis Aulas Práticas Epidemiologia de Doenças Transmissíveis Aulas Práticas Módulo 18 Regressão Logística 1. A tabela seguinte classifica 100 homens hospitalizados quanto à idade ( 55 anos=0; >55 anos=1) e quanto a evidência

Leia mais

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2. Veremos

Leia mais

DEPOIS DOS 35 ANOS, QUAIS AS INTENÇÕES DE FECUNDIDADE DOS SUL-EUROPEUS?

DEPOIS DOS 35 ANOS, QUAIS AS INTENÇÕES DE FECUNDIDADE DOS SUL-EUROPEUS? DEPOIS DOS 35 ANOS, QUAIS AS INTENÇÕES DE FECUNDIDADE DOS SUL-EUROPEUS? Rita Freitas Cidehus, Universidade de Évora, Évora, Portugal Maria Filomena Mendes Cidehus, Universidade de Évora, Évora, Portugal

Leia mais

5 CARACTERÍSTICAS DINÂMICAS DA ATENUAÇÃO POR CHUVAS

5 CARACTERÍSTICAS DINÂMICAS DA ATENUAÇÃO POR CHUVAS 5 CARACTERÍSTICAS DINÂMICAS DA ATENUAÇÃO POR CHUVAS Na literatura técnica tem sido dada pouca atenção ao modelamento das características dinâmicas da atenuação por chuvas em enlaces terrestres. O conhecimento

Leia mais

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto Introdução 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2.

Leia mais

Métodos de Previsão Problem Set 2

Métodos de Previsão Problem Set 2 Métodos de Previsão Problem Set 2 Exercício 1: Indique a Expressão do coeficiente de determinação corrigido ou ajustado R 2 e explique a importância do seu cálculo, comparando-o com o R 2. O R 2 representa

Leia mais

Modelos Lineares Generalizados - Componentes do Modelo

Modelos Lineares Generalizados - Componentes do Modelo Modelos Lineares Generalizados - Componentes do Modelo Erica Castilho Rodrigues 01 de Abril de 2014 3 Vejamos agora quais as componentes de um Modelo Linear Generalizado. Temos um conjunto de variáveis

Leia mais

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012 1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à

Leia mais

RESOLUÇÃO Nº 01/2016

RESOLUÇÃO Nº 01/2016 Legislações Complementares: Resolução Nº 02/2016 Colegiado DEst Resolução Nº 03/2016 Colegiado DEst Resolução Nº 01/2017 Colegiado DEst RESOLUÇÃO Nº 01/2016 O Departamento de Estatística, tendo em vista

Leia mais

= Assim, toma-se ˆp= x m =

= Assim, toma-se ˆp= x m = INSTITUTO SUPERIOR DE AGRONOMIA ESTATÍSTICA E DELINEAMENTO de Outubro, 06 PRIMEIRO TESTE 06-7 Uma resolução possível I Seja X a variável aleatória que conta o número de parcelas onde cada genótipo da casta

Leia mais

Resultados. Grupo SK/aids

Resultados. Grupo SK/aids 40 Resultados Em virtude da quantidade e da complexidade dos dados obtidos, optou-se pela apresentação individual dos resultados na forma de Quadros que se encontram em Anexo; e para facilitar a visualização

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Seção 18 Performance e validação Marcel de Souza Borges Quintana marcel.quintana@ini.fiocruz.br 2018 Estrutura 1. Avaliação do desempenho do modelo (Cap 15) Medidas

Leia mais

Seleção de Variáveis e Construindo o Modelo

Seleção de Variáveis e Construindo o Modelo Seleção de Variáveis e Construindo o Modelo Seleção de modelos candidatos A idéia é selecionar um conjunto menor de variáveis explanatórias de acordo com algum(s) critério(s), e assim selecionar o modelo

Leia mais

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA 1 UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA Professor: Ernesto Friedrich de Lima Amaral Disciplina: Avaliação

Leia mais

Mais Informações sobre Itens do Relatório

Mais Informações sobre Itens do Relatório Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Probabilidades e Estatística MEEC, LEIC-A, LEGM

Probabilidades e Estatística MEEC, LEIC-A, LEGM Departamento de Matemática Probabilidades e Estatística MEEC, LEIC-A, LEGM Exame a Época / o Teste (Grupos III e IV) o semestre 009/00 Duração: 80 / 90 minutos /06/00 9:00 horas Grupo I Exercício 5 valores

Leia mais

Disciplina: Gestão da Mobilidade Urbana. Prof. Responsável: Rosário Macário. Aulas Teóricas

Disciplina: Gestão da Mobilidade Urbana. Prof. Responsável: Rosário Macário. Aulas Teóricas MESTRADO INTEGRADO DE ENGENHARIA CIVIL MESTRADO EM URBANISMO E ORDENAMENTO DO TERRITÓRIO MESTRADO EM PLANEAMENTO E OPERAÇÃO DE TRANSPORTES LICENCIATURA EM ENGENHARIA DO TERRITÓRIO Disciplina: Gestão da

Leia mais

Cálculo do Valor Acrescentado No Programa Aves Mª Conceição Silva Portela e Sandra Guerreiro

Cálculo do Valor Acrescentado No Programa Aves Mª Conceição Silva Portela e Sandra Guerreiro Cálculo do Valor Acrescentado No Programa Aves Mª Conceição Silva Portela e Sandra Guerreiro 1. Valor Acrescentado Calcular o valor acrescentado de uma escola significa tentar perceber que valor a escola

Leia mais

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou

Leia mais

Consultoria para realizar pesquisa para estimar a prevalência de nascimentos pré-termo no Brasil e explorar possíveis causas

Consultoria para realizar pesquisa para estimar a prevalência de nascimentos pré-termo no Brasil e explorar possíveis causas ANEXO 2 UNICEF Brasil Consultoria para realizar pesquisa para estimar a prevalência de nascimentos pré-termo no Brasil e explorar possíveis causas Documento técnico com análise dos fatores associados à

Leia mais

Regressão linear simples

Regressão linear simples Regressão linear simples Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução Foi visto na aula anterior que o coeficiente de correlação de Pearson é utilizado para mensurar o grau de associação

Leia mais

Modelos Lineares Generalizados - Regressão Logística

Modelos Lineares Generalizados - Regressão Logística Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 26 de Maio de 2014 AIC 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos de modelo. Mede

Leia mais

Introdução. Introdução. Instituto Superior de Economia e Gestão. As questões centrais da nossa investigação são:

Introdução. Introdução. Instituto Superior de Economia e Gestão. As questões centrais da nossa investigação são: Introdução Docente Tutor: Prof.ª Dra. Elsa Fontainha Docente Coordenador: Prof.ª Dra. Joana Leite Trabalho realizado por: Bárbara Carvalho, n.º37681 Cristina Stresna, n.º 37874 Luís Pena, n.º 37838 Tânia

Leia mais

Regressão de Poisson e parentes próximos

Regressão de Poisson e parentes próximos Janeiro 2012 Família Exponencial Seja Y uma variável aleatória. A distribuição de probabilidade de Y pertence à família exponencial se a sua função densidade de probabilidade é da forma ( ) yθ b(θ) f (y

Leia mais

Modelos de Escolha Discreta. a)pretende-se conhecer os coeficientes da função de utilidade, assim como a sua significância estatística.

Modelos de Escolha Discreta. a)pretende-se conhecer os coeficientes da função de utilidade, assim como a sua significância estatística. Nº Observações espaço Lx centro espaço periferia nº clientes (15 min) centro Lx nº clientes (15 min) periferia estacionamento centro Lx estacionamento periferia tc rodo centro Lx tc rodo periferia Código

Leia mais

INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Estatística II - Licenciatura em Gestão Época de Recurso - Parte prática (14 valores) 24/01/2011.

INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Estatística II - Licenciatura em Gestão Época de Recurso - Parte prática (14 valores) 24/01/2011. INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Estatística II - Licenciatura em Gestão Época de Recurso - Parte prática (14 valores) 24/01/2011 Nome: Nº Espaço reservado para a classificação (não escrever aqui)

Leia mais

_ Desviopadrão

_ Desviopadrão 53 5. Resultados Os resultados serão apresentados separadamente para cada um dos quatro casos em estudo, correspondentes à combinação entre dois tipos de cobertura e dois sexos. 5.1. Cobertura por Morte

Leia mais

ESTATÍSTICA. Tabelas e Gráficos. Elisabeti Kira - IME USP. Beti Kira (IME-USP) Estatística 18.abril.

ESTATÍSTICA. Tabelas e Gráficos. Elisabeti Kira - IME USP. Beti Kira (IME-USP) Estatística 18.abril. ESTATÍSTICA Tabelas e Gráficos Elisabeti Kira - IME USP betikira@ime.usp.br Beti Kira (IME-USP) Estatística 18.abril.2017 1 / 26 Visão geral Coletar dados censo, técnicas de amostragem, amostra aleatória,

Leia mais

ÍNDICE GERAL AGRADECIMENTOS RESUMO ABSTRACT SIMBOLOGIA 1. - INTRODUÇÃO 2. - DEFINIÇÃO DO PROBLEMA

ÍNDICE GERAL AGRADECIMENTOS RESUMO ABSTRACT SIMBOLOGIA 1. - INTRODUÇÃO 2. - DEFINIÇÃO DO PROBLEMA ÍNDICE GERAL AGRADECIMENTOS RESUMO ABSTRACT SIMBOLOGIA 1. - INTRODUÇÃO 2. - DEFINIÇÃO DO PROBLEMA 3. - SISTEMATIZAÇÃO DE CONCEITOS E REVISÃO DA LITERATURA 3.1 - INTERPOLAÇÃO ESPACIAL DE INFORMAÇÃO ASSOCIADA

Leia mais

i j i i Y X X X i j 1 i 2 i i

i j i i Y X X X i j 1 i 2 i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Nota sobre as estatísticas apresentadas no Relatório

Nota sobre as estatísticas apresentadas no Relatório ANEXO ESTATISTICO NOTA SOBRE AS ESTATISTICAS APRESENTADAS NO RELATORIO Nota sobre as estatísticas apresentadas no Relatório Estrutura do Anexo Estatístico A estrutura do Anexo Estatístico no presente relatório,

Leia mais

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ) Cinthia Zamin Cavassola (GRR ) Luiza Hoffelder da Costa (GRR )

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ) Cinthia Zamin Cavassola (GRR ) Luiza Hoffelder da Costa (GRR ) UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152) Cinthia Zamin Cavassola (GRR20149075) Luiza Hoffelder da Costa (GRR20149107) INFLUÊNCIA DE CARACTERÍSTICAS RELACIONADAS À ESCOLA, DEMOGRÁFICAS

Leia mais

Análise de Dados Categóricos

Análise de Dados Categóricos 1/43 Análise de Dados Categóricos Modelo de Regressão de Poisson Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Departamento de Estatística Universidade Federal de Minas Gerais 2/43 Revisão:

Leia mais

Análise de regressão linear simples. Diagrama de dispersão

Análise de regressão linear simples. Diagrama de dispersão Introdução Análise de regressão linear simples Departamento de Matemática Escola Superior de Tecnologia de Viseu A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente

Leia mais

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total. INSTRUÇÕES Para a realização desta prova, você recebeu este Caderno de Questões. 1. Caderno de Questões Verifique se este Caderno de Questões contém a prova de Conhecimentos Específicos referente ao cargo

Leia mais

DIA INTERNACIONAL DA MULHER 30 ANOS ( ) QUARTA CONFERÊNCIA MUNDIAL SOBRE AS MULHERES 10 ANOS (1995, PEQUIM)

DIA INTERNACIONAL DA MULHER 30 ANOS ( ) QUARTA CONFERÊNCIA MUNDIAL SOBRE AS MULHERES 10 ANOS (1995, PEQUIM) Dia Internacional da Mulher (8 de Março) 1995-2005 04 de Março de 2005 DIA INTERNACIONAL DA MULHER 30 ANOS (1975 2005) QUARTA CONFERÊNCIA MUNDIAL SOBRE AS MULHERES 10 ANOS (1995, PEQUIM) No momento em

Leia mais

PROJECTO DE INVESTIGAÇÃO DESTINADO À ELABORAÇÃO DE UMA DISSERTAÇÃO ORIGINAL NO ÂMBITO DO CURSO DE MESTRADO EM EPIDEMIOLOGIA (1ª EDIÇÃO)

PROJECTO DE INVESTIGAÇÃO DESTINADO À ELABORAÇÃO DE UMA DISSERTAÇÃO ORIGINAL NO ÂMBITO DO CURSO DE MESTRADO EM EPIDEMIOLOGIA (1ª EDIÇÃO) PROJECTO DE INVESTIGAÇÃO DESTINADO À ELABORAÇÃO DE UMA DISSERTAÇÃO ORIGINAL NO ÂMBITO DO CURSO DE MESTRADO EM EPIDEMIOLOGIA (1ª EDIÇÃO) Prevalência e Factores de Sucesso do Aleitamento Materno no Hospital

Leia mais

aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES

aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES 18 aula META Fazer com que o aluno seja capaz de realizar os procedimentos existentes para a avaliação da qualidade dos ajustes aos modelos. OBJETIVOS Ao final

Leia mais

OBSERVAÇÕES DA UGT SOBRE A ACTUALIZAÇÃO DA RETRIBUIÇÃO MÍNIMA MENSAL GARANTIDA

OBSERVAÇÕES DA UGT SOBRE A ACTUALIZAÇÃO DA RETRIBUIÇÃO MÍNIMA MENSAL GARANTIDA OBSERVAÇÕES DA UGT SOBRE A ACTUALIZAÇÃO DA RETRIBUIÇÃO MÍNIMA MENSAL GARANTIDA I. ELEMENTOS PARA A ACTUALIZAÇÃO DA RETRIBUIÇÃO MÍNIMA MENSAL GARANTIDA Documento distribuído pelo Governo em CPCS Regista-se

Leia mais

NÚMERO DE CRIANÇAS DIMINUI EM PORTUGAL

NÚMERO DE CRIANÇAS DIMINUI EM PORTUGAL PROJECÇÕES DE POPULAÇÃO RESIDENTE EM PORTUGAL - (29 de Maio de 2003) NÚMERO DE CRIANÇAS DIMINUI EM PORTUGAL Os resultados das projecções de população residente apontam para o decréscimo da população jovem

Leia mais

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra) Testes de Tendência Central (média, mediana, proporção) Classificação Variável 1 Variável 2 Núm ero Gru pos Dependência Teste Z Paramétrico Quantitativa - 1 - Premissas Variância pop. * conhecida Teste

Leia mais

Medidas de efeito e associação em epidemiologia

Medidas de efeito e associação em epidemiologia Medidas de efeito e associação em epidemiologia Objetivo central da pesquisa epidemiológica: identificação de relações causais entre exposições (fatores de risco ou proteção) e desfechos (doenças ou medidas

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS Em uma grande escola, 10% dos alunos são comprovadamente fracos. Um teste educacional conseguiu identificar corretamente 80% entre aqueles que são fracos e 85% entre aqueles que

Leia mais

Seminários em Bioestatística

Seminários em Bioestatística Seminários em Bioestatística Seleção de variáveis na presença de valores omissos Uma aplicação na modelação do Índice de Massa Corporal nos imigrantes africanos e brasileiros residentes em Lisboa e Setúbal

Leia mais

Imunofenotipagem Leucocitária

Imunofenotipagem Leucocitária Interpretação de Relatórios UK NEQAS Imunofenotipagem Leucocitária 1. Estrutura dos Relatórios relativos à Imunofenotipagem Leucocitária Os relatórios dos programas de Imunofenotipagem Leucocitária apresentam

Leia mais

Taxa de variação homóloga do IPC aumentou para 1,4%

Taxa de variação homóloga do IPC aumentou para 1,4% 11 de outubro de 2018 Índice de Preços no Consumidor Setembro 2018 Taxa de variação homóloga do IPC aumentou para 1,4% A variação homóloga do Índice de Preços no Consumidor (IPC) foi 1,4% em setembro de

Leia mais

Desemprego e Inatividade no Estado do Pará: Evidências da Técnica de Regressão Logística Multinomial

Desemprego e Inatividade no Estado do Pará: Evidências da Técnica de Regressão Logística Multinomial Desemprego e Inatividade no Estado do Pará: Evidências da Técnica de Regressão Logística Multinomial 1 Introducão Mônica Josélly Gonçalves Soares 1 Marinalva Cardoso Maciel 2 Natália Cyntia Cordeiro 3

Leia mais

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti. Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Regressão David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Regressão Linear ( e Múltipla ) Não-Linear ( Exponencial / Logística

Leia mais