INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO

Documentos relacionados
ESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES

Regressão para Dados Binários - Estudo de Dengue

EFICIÊNCIA DE UM TRATAMENTO APLICADO A PACIENTES COM LEUCEMIA

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )

Regressão Logística: Um Estudo sobre o Uso de Tabaco entre Alunos da Universidade Federal do Paraná Curitiba

Analise de sobreviventes em acidentes de carros

Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão generalizado com resposta Binomial

Trabalho de Modelos Lineares Generalizados

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR

Óbitos por Acidentes de Transporte em Santa Catarina no ano de 2016

RELAÇÃO ENTRE EXPECTATIVA DE VIDA E CARACTERÍSTICAS DOS ESTADOS NORTE-AMERICANOS ENTRE OS ANOS DE 1969 E 1970

Trabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017

Aula 2 Uma breve revisão sobre modelos lineares

Disciplina de Modelos Lineares Professora Ariane Ferreira

UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski

4 Modelos Lineares Generalizados

Modelos Lineares Generalizados

EXPLORANDO OS MODELOS LINEARES GENERALIZADOS APLICAÇÃO A DADOS DE UM PEQUENO SUPERMERCADO

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS

Modelos Lineares Generalizados - Regressão Logística

Número de Consultas ao Médico

Exemplos Regressão Dados Binários

Modelos de Regressão para Dados de Contagem

Exemplo Preferência de Automóveis

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

Exemplos Modelos de Quase-Verossimilhança

3.33pt. AIC Introdução

Modelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos

Regressão para Dados de Contagem - Segurança e privatização ferroviária na Grã-Bretanha

A Importância da Estatística na Pesquisa Científica e na Tomada de Decisão

UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ) Cinthia Zamin Cavassola (GRR ) Luiza Hoffelder da Costa (GRR )

MAE Modelos Lineares Generalizados 2 o semestre 2017

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Análise dados de diagnóstico de câncer de mama

CONHECIMENTOS ESPECÍFICOS

1 z 1 1 z 2. Z =. 1 z n

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA

Quantis residuais. Luziane Franciscon Acadêmica de Estatística Universidade Federal do Paraná

Análise de dados de Contagem

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Análise do acidente do Titanic

CONHECIMENTOS ESPECÍFICOS

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR

Correlação e Regressão

Modelo de Regressão Múltipla

Aplicação de modelos lineares generalizados na captura de atum da espécie Thunnus albacares.

Esse material foi extraído de Barbetta (2007 cap 13)

Utilização de modelos marginais na análise de dados longitudinais irregulares em relação ao tempo

i j i i Y X X X i j i i i

CONHECIMENTOS ESPECÍFICOS

Lista 1 - Gabarito. Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados. 29 de Abril. f(y i, θ i ) = θ i exp( yiθ i ).

Análise de Dados Categóricos

Análise de dados de contagem para jogadores de futebol americano

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

Análise de Regressão EST036

MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS

Análise Multivariada Aplicada à Contabilidade

Modelo de regressão estável aplicado a econometria

RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE

Exemplos Equações de Estimação Generalizadas

Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais

Exemplo Vida Útil de Ferramentas

Especialização em Engenharia de Processos e de Sistemas de Produção

i j i i Y X X X i j 1 i 2 i i

Ralph S. Silva

SELEÇÃO DE VARIÁVEIS

UNIVERSIDADE FEDERAL DO PARANÁ. Adi M. A. Junior Leonardo H. B. Krüger Kristiany J. Martini Konstanz T. Winter

SELEÇÃO DE VARIÁVEIS

Aplicação dos modelos lineares generalizados na análise do

MAE Planejamento e Pesquisa II

Modelo de regressão Beta

ANÁLISE DE REGRESSÃO

CE071 - Análise de Regressão Linear

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

RESOLUÇÃO Nº 01/2016

Modelos de Regressão Linear Simples - parte III

Exemplo Ausências Escolares

Disciplina de Modelos Lineares

INFERÊNCIA EM MODELOS LINEARES GENERALIZADOS ANÁLISE DE DEVIANCE

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

CORRELAÇÃO E REGRESSÃO

Técnicas computacionais em probabilidade e estatística II

4 Metodologia. Wt = W 0 exp{(l/k)(1-e-kt)} (8)

Precificação de apartamentos para o bairro Água Verde em Curitiba

Exame da OAB. Gilberto A. Paula. Departamento de Estatística IME-USP, Brasil

Coeficiente de determinação R 2 no modelo de regressão linear normal

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Introdução à Regressão Logística Quantílica

Modelos Lineares Generalizados - Componentes do Modelo

MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4

Modelos lineares generalizados: um estudo sobre leilões de veículos

Filho, não é um bicho: chama-se Estatística!

_ Desviopadrão

Exemplos Regressão Dados de Contagem

Transcrição:

Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO CE225 - Modelos Lineares Generalizados Eduardo Elias Ribeiro Junior Curitiba, 19 de novembro de 14

Contents 1 Introdução 2 2 Materiais e Métodos 2 3 Modelagem Estatística 2 3.1 Análise Descritiva e Explorátória.................................... 2 3.2 Seleção de Variáveis........................................... 4 3.3 Especificação da Função de Ligação................................... 5 3.4 Modelo Proposto............................................. 5 3.5 Análise de Diagnóstico.......................................... 6 4 Resultados 7 5 Conclusões 8 1

1 Introdução Para investigar a incidência de dengue numa determinada cidade da costa mexicana foram coletadas características de 196 indivíduos, escolhidos aleatoriamente em dois setores da cidade. As características coletadas foram idade, idade do entrevistado, nível, nível sócio-econômico (nivel=1, nível alto; nivel=2, nível médio; nivel=3, nível baixo), setor, setor da cidade onde mora o entrevistado (setor=1, setor 1; setor=2, setor 2) e caso, se o entrevistado contraiu (caso=1) ou não (caso=) a doença recentemente. O principal objetivo do estudo é tentar prever ou explicar a probabilidade de um indivíduo contrair a doença (variável caso=1) dadas as variáveis explicativas idade, nível e setor, porém relação de influência destas variáveis explicativas na variável resposta caso também serão estudadas. 2 Materiais e Métodos Relações onde uma variável, ou um conjunto de variáveis, são utilizadas para explicar outra podem ser analisados, em estatística, com o auxílio da teoria de modelos de regressão. Neste caso, dada a natureza binária da variável resposta caso ( ou 1), serão utilizados os conceitos de modelos lineares generalizados, propostos em 1972 por Nelder e Wedderburn. Em regressão para dados binários a distribuição Binomial é a principal alternativa como componente aleatório do modelo, o componente sistemário é dado pela combinação linear das variáveis explicativas e para função de ligação trabalharemos com as funções: logit, probit, complemento log-log e cauchit. A definição do modelo teórico com a características citadas é descrito abaixo: Y i Binomial(1, π i ) g(π i ) = β + β 1 x 1i + β 2 x 2i + + β p x pi Sendo Y a variável resposta, x 1i, x 2i,..., x ni as i-ésimas realizações das respectivas variáveis explicativas X 1, X 2,..., X n e g(π i ) a função de ligação, que assume as expressões conforme tabela 1. Perceba que particularizamos a distribuição para o atual problema fixando o primeiro parâmetro da distribuição Binomial em 1 (resultando em uma Bernoulli). Este foi fixado em um, pois devido a variável idade ter sido coletada em anos não houve indivíduos com o mesmo conjunto de covariáveis. Table 1: Funções de Ligação Ligação Logit ( ) Probit Complemento log-log Cauchit g(π) ln P 1 (Z 1 π) ln[ ln(1 π)] P 1 (C 2 π) π 1 π 1 Z N(, 1) 2 C Cauchy(, 1) Com as funções de ligação listadas acima temos opções para testar diferentes modelos e compará-los, o que será discutido posteriormente. 3 Modelagem Estatística Nesta seção serão abordados os tópicos para modelagem de dados binários. Exploração dos dados, seleção de variáveis, especificação da função de ligação, definição do modelo e análise de diagnóstico serão temas apresentados e discutidos a seguir. 3.1 Análise Descritiva e Explorátória Para observar o comportamento e particularidades das variáveis em estudo, nesta seção, serão discutidos alguns gráficos descritivos das variáveis coletadas no estudo. Como primeira visualização são exibidos, na figura 1, gráficos univariados de: caso, idade, nível e setor. 2

Caso Idade Nível Setor Frequência 1 1 1 8 6 139 57 Densidade..5.1.15..25 49 46 37 29 12 11 8 3 1 Frequência 8 77 6 49 7 Frequência 1 117 1 8 6 79 Não Contraiu Contraiu 6 8 Nível 1 Nível 2 Nível 3 Setor 1 Setor 2 Contração da doença (a) Idade (b) Tipo de Nível (c) Tipo de Setor (d) Figure 1: Variáveis Coletadas no Estudo Na figura 1 (a) temos o gráfico de frequência para contração de dengue, note que tivemos um desbalanceamento acentuado, com a frequença dos indivíduos que não contraíram a doença quase duas vezes e meia maior do que os que contraíram. Para a figura 1 (b) temos o histograma das idades dos indivíduos estudados com forte assimetria a direita, estando aproximadamente 75% das observações abaixo de 35 anos de idade. Para os dois últimos gráficos, figura 1 (c) e figura 1 (d), temos exibidas as frequências observadas das categorias de cada variável. Em (c) as categorias, nível 1, 2 e 3, são referente ao nível sócio-econômico do indivíduo e em (d) as categorias, setor 1 e 2, referenciam o setor onde o entrevistado reside. Nesses gráficos o desbalanceamento entre as frequências nas categorias não é tão intenso quanto o observado na figura 1 (a), mas também é presente. Retomando o objetivo inicial, onde se deseja verificar a influência das variáveis explicativas idade, nível e setor na contração de dengue, é apresentado na figura 2 um conjunto de gráficos uni e bivariados estratificados pela contração ou não da doença. 3

Variável Caso Contraiu (1) Não Contraiu () Idade..75.15.225.3 6 8 6 8 1 3 5 6 7 8 9 1. 1.2 1.4 1.6 1.8 2. 1. 1.5 2. 2.5 3. 1 95 Setor 1. 1.2 1.4 1.6 1.8 2. 8 6 22 44 35 1. 1.2 1.4 1.6 1.8 2. 6 8 Setor 1 Setor 2 1. 1.5 2. 2.5 3. Nível 1. 1.5 2. 2.5 3. 1. 1.5 2. 2.5 3. Frequência 5 3 1 53 24 35 14 51 19 6 8 1. 1.2 1.4 1.6 1.8 2. Nível 1 Nível 2 Nível 3 Figure 2: Covariáveis Estratificadas por Contração ou Não de Dengue Perceba na figura 2 que os gráficos são dispostos em uma matriz de 3 linhas e 3 colunas resultando em 9 gráficos.os gráficos abaixo da diagonal principal são gráficos bivariados idênticos aos gráficos acima dela, invertendo somente seus eixos. Primeiramente, observando os gráficos univariados da diagonal principal estratificados por caso, notamos que o histograma das idades dos indivíduos assume formas distintas dentre os estratos, indicando que esta variável pode ser significativa para explicar a contração de dengue nestes indivíduos. Para o gráfico de frequências do setor onde reside o indivíduo é observado que a disposição das frequências dos indivíduos que contraíram e não contraíram a doença é distinta dentro dos setores 1 e 2, também indicando que esta variável pode auxiliar na explicação da contração da doença. Já para o nível socio-econômico dos indivíduos a diposição das frequências nos estratos caso = 1 e caso = não parece se distinguir tão evidentemente. Para os gráficos bivariados nenhum padrão sistemático pode ser observado claramente, ou seja, os pontos indicando indivíduos que contraíram ou não a doença parecem se dispor aleatoriamente dentre as combinações das variáveis. 3.2 Seleção de Variáveis Após o conhecimento adquirido na seção de descrição e exploração dos dados partiremos para seleção de variáveis que será realizado pelo algoritmo stepwise considerando como critério de seleção o AIC (Critério de Informação de Akaike) 1. O algoritmo step com critério AIC parte de um modelo especificado e realiza sucessivas atualizações na inclusão ou exclusão de variáveis pertencentes aov modelo até que se atinja o menor AIC possível. Nesse estudo executamos o algoritmo em modelos com as quatro funções de ligação descritas na tabela 1 e em suas três direções: forward (passo a frente, iniciando com um modelo nulo e inserindo variáveis, uma a uma, até que se encontre o menor AIC tendo como limete um modelo completo especificado), backward (passo a trás, retira variáveis do modelo iniciando com um modelo completo especificado até que se resulte o menor AIC) e both ou stepwise (passo a passo, iniciando com um modelo completo, retira e insere variáveis sucessivamente até resultar em um modelo com o menor AIC). Consideramos como modelo completo o modelo aditivo com todos os efeitos principais, todas as interações duplas e mais a interação tripla somando ao todo 12 parâmetros. O algoritmo 1 Teoria disponível em http://www.yaroslavvb.com/papers/bozdogan-akaike.pdf 4

em suas diferentes direções e com diferentes funções de ligação resultaram no mesmo conjunto de variáveis, são elas: idade do indivíduo e o setor onde reside. O resultado do algoritmo é coerente com os gráficos apresentados na figura 2, pois as variáveis que mais se diferem dentre as categorias de contração da doença são a idade e setor. Portanto, no decorrer do estudo seguiremos nossas análise com o modelo definido abaixo. Caso i Binomial(1, π i ) g( π i ) = β + β 1 idade i + β 2 setor i Sendo a idade: a idade do individuo em anos e setor: uma variável indicadora assumindo 1 quando o setor onde o indivíduo reside é igua a 2 e caso contrário. 3.3 Especificação da Função de Ligação Com o componente aleatório e sistemático do modelo já definidos conforme discussões anteriores, faremos a escolha da função de ligação nesta subseção. Dentre as funções de ligação definidas na tabela 1, faremos um comparativo conforme medidas descritas na tabela 2 e gráficos apresentados na figura 3. Table 2: Comparação dos Modelos com Diferentes Links Ligação gl s AIC Deviance Area ROC Pseudo R 2 Logit 3 217.6393 211.6393.7254.145 Probit 3 217.3 211.3.7253.157 Comp. log-log 3 218.115 212.115.7266.125 Cauchit 3 218.7541 212.7541.7274.998 Ligação Logit Ligação Probit Ligação Complemento Log Log Ligação Cauchit 2 1 1 2 2 1 1 2 2 1 1 2 2 1 1 2 3 2 1 1 2 3 3 2 1 1 2 3 3 2 1 1 2 3 3 2 1 1 2 3 Figure 3: Qanti-Quantil com Envelope Simulado - Comparação de Links Perceba que os modelos especificados com diferentes funções de ligação apresentaram um comportamento muito parecido. Com base nos gráficos apresentados na figura 3, não há problemas quanto a especificação do modelo nas quatro diferentes funções de ligação propostas, todos os gráficos apresentaram resíduos dentro dos intervalos simulados. Já com base nas medidas de comparação exibidas na tabela 2, nota-se um tímido melhor desempenho das ligações logit e probit em relação a complemento log-log e cauchit. A logit apresentou um desempenho um pouco abaixo da ligação probit, porém, em função da magnitude das medidas comparativas e pela vantagem interpretativa da especificação logit, dada em função de razão de chances, esta foi definida no modelo proposto. 3.4 Modelo Proposto Com os elementos: distribuição Binomial, preditor linear com efeitos principais aditivos de idade e setor e função de ligação logito vamos escrever o modelo resultante das análises até aqui: Caso i Binomial(1, π i ) (1) π i g( π i ) = ln( ) = 1 π β + β 1 idade i + β 2 setor i (2) i A tabela 3 complementa complementa e equação (2) com os valores estimados dos parâmetros e seus respectivos erros padrão: 5

Table 3: Resumo das Estimativas para o Modelo Ajustado Efeito Parâmetro Estimativa E. Erro Padrão Estatística Z Pr(> z ) Constante β -2.1597.3439-6.28. Idade β 1.268.86 3.1.19 Setor β 2 1.1817.337 3.51.5 Note nesta tabela 3 que marginalmente (considerando a distribuição Z - Normal(,1)) todos os efeitos são bastante significativos. A interpretação das estimativas dos parâmetros será discutida posteriormente, pois esta se dará em função da razão de chances conforme já mencionado na seção 3.3. Table 4: Análise de Diferenças de Deviances Diferença de Diferença Modelos gl s Deviances Deviances de gl s Valor p Nulo 195 236.33 Idade 194 224.32 12.13 1.5283 Setor Idade 193 211.64 12.6771 1.372 Na tabela 4 é apresentada a análise de deviances sequenciais, onde são testados os efeitos das variáveis idade e setor. Primeiramente temos a hipótese de não significância do efeito da variável idade expressa por H : β 1 = onde, pelo teste de razão de verossimilhanças (TRV), obteve-se p valor.53 evidenciando a significância estatística deste efeito. Da mesma forma, para a não significância do efeito da variável setor na presença da variável idade, H : β 2 =, obteve-se p valor.4. Deste modo, há também evidências de efeito significativo da variável setor na preseça da variável idade. Com isso validamos a seleção de variáveis realizada na seção 3.2. 3.5 Análise de Diagnóstico Com o principal objetivo de subsidiar a avaliação da qualidade do modelo, a análise de diagnóstico verificará a adequação da distribuição proposta, da função de ligação, do preditor linear, enfim do modelo de regressão ajustado aos dados. Com relação a especificação das covariáveis no modelo podemos observar na figura 4 que não há grandes evidências de má especificação das covariáveis no modelo, mesmo sendo observada a assimetria dos resíduos. Note que a interpretação dos gráficos de diagnóstico é mais flexível nestes casos, pois a limitação da variável resposta (suporte ou 1) interfere na interpretação gráfica. Pearson residuals 1 1 2 Pearson residuals 1 1 2 Pearson residuals 1 1 2 6 8 1 2 2. 1.5 1..5..5 1. idade setor Linear Predictor Figure 4: vs. Covariáveis e Preditor Linear Para a figura 5 são apresentados outros 3 gráficos que auxiliam na identificação de possíveis fuga de suposições do modelo. No caso apresentado, não temos evidências gráficas para suspeitar de nenhuma suposição não atendida. No gráfico (a) a magnitude dos resíduos não ultrapassa 2 e temos, apenas, uma leve frequência maior de resíduos abaixo de zero. No segundo gráfico (b) representando o resíduo vs. valores ajustados, temos uma disposição aparentemente centrada em zero, novamente lembramos que a natureza da variável resposta dificulta a interpretação. No terceiro e último gráfico deste figura, (c), temos o gráfico quantil-quantil com envelope 6

simulado, onde resíduos dispostos dentro das bandas de confiança representam adequação dos dados ao modelo proposto. Resíduo Componente do Desvio 2 1 1 2 3 Resíduo Componente do Desvio 1 1 2 2 1 1 2 5 1 15.1.2.3.4.5.6.7 3 2 1 1 2 3 Índice (a) Valor Ajustado (b) (c) Figure 5: vs. Covariáveis e Preditor Linear Atendidos os pressupostos de adequação do modelo proposto com distribuição, especificação das covariáveis no preditor linear e função de ligação bem ajustadas, verificaremos possíveis obervações influentes a partit da figura 6. Alavancagem..2.4.6 195 Dist. de Cook..1.2.3.4.5 157 195 5 1 15 5 1 15 Index (a) Index (b) Figure 6: Medidas de Influência Nos gráficos da figura 6 são apresentadas duas medidas de influência: valores de alavancagem h em (a) e distâncias de cook em (b). Ambos indicam que valores com grandes magnitudes, em relação aos demais, podem se apresentar como observações influentes. Nos dois gráficos destamos 2 observações (#157 e #195) que apresentaram valores muito diferentes dos demais. A observação #157 refere-se a um indivíduo com 79 anos, residente do setor 2 da cidade e que não contraiu a doença recentemente, perceba que para este perfil, segundo o modelo, teríamos uma maior probabilidade de contração da doença (estimada em aproximadamente.76). Da mesma forma para o perfil #195: 85 anos, residente do setor 1 da cidade e não apresentando contração da doença recentemente, o modelo estima uma probabilidade de aproximadamente.53 de contrair a doença. Foram ajustados modelos sem as variáveis identificadas, porém as estimativas e componentes do modelo não apresentaram diferenças significativas. As observações continuaram presentes na análise. Com isso, pelas análises de diagnóstico realizadas anteriormente podemos utilizar o modelo proposto para inferência e interpretações. 4 Resultados Com o modelo especificado e avaliado podemos realizar predições e interpretações. gráficos provenientes do modelo descrito nas expressões (1) e (2) da seção 3.4. A figura 7 exibe os 7

Setor 1 Setor 2 Pr(caso = 1).1.2.3.4.5.6.7.8 Logito 2. 1.5 1..5..5 1. Chances..5 1. 1.5 2. 2.5 3. 3.5 6 8 idade (a) 6 8 idade (b) 6 8 idade (c) Figure 7: Prediçaõ do Modelo Ajustado Note que na figura 7 são exibidos três gráficos de predição sob o mesmo modelo. Em modelos lineares generalizados temos mais que um gráfico de predição, especialmente neste caso temos dois deles, (a) e (c), que são de extrema importância para interpretações e inferências. Apresentando as diferenças e equivalências dos gráficos temos em (a) o gráfico que representa a predição na escala do parâmetro de interesse, a probabilidade de um indíviduo contrair a doença, com características de idade e setor descritas. Já para a figura 7 (b) é considerada a escala do logito (ln( ˆπ 1 ˆπ )) e temos retas paralelas apresentadas, concordante com a especificação do preditor linear do modelo. Finalmente para o gráfico (c) temos a escala das chances apresentada no eixo y, ou seja, exponencial do logito que também é de fundamental interesse no estudo, observe que a chance de contração da doença é diretamente proporcional a idade do indivíduo e indivíduos residentes no setor 2 da cidade tem uma maior chance estimada. O modelo de regressão binomial com função de ligação logito tem como atrativo, a facilidade da obtençção das razões de chances devido a construção da função de ligação. Neste estudo uma estimativa para a razão de chances entre o setor 1 e setor 2, ajustada para idade do indivíduo, é dada por exp {1.1817} 3.26, ou seja, estima-se que a chance de contração da doença em indivíduos residentes do setor 2 é aproximadamente 3.26 vezes a chance dos indivíduos residente do setor 1 (observe também o gráfico (c)). De modo análogo, a razão de chances entre indivíduos com 1 ano de diferença, ajustada pelo setor de residência do indivíduo, é estimada por exp {.2681} 1.31, ou seja, estima-se que a chance de contração da doença em indivíduos com x + 1 anos de idade é 1.31 vezes a chance dos indivíduos com x anos. 5 Conclusões Com base neste estudo foi possível constatar que o setor da cidade tem forte influência na propagação da dengue, ainda foi evidenciado que a idade do indivíduo também tem certa influência. Para o nível socioecônomico, variável também coletada no estudo, não foi possível verificar associação com a doença. Ainda para as variáveis significativas verificou-se que interações não foram significaticas, ou seja, o efeito de idade estratificado pelos diferentes setores não foi significativo. O setor 2 da cidade teve uma chance de contração de aproximadamente 3 vezes maior que o setor 1 da cidade. Para a idade do indivíduo também tivemos uma chance maior para indivíduos mais idosos, porém com menor intensidade. 8