Resenha Modelos Lineares Generalizados

Resenha Modelos Lineares Generalizados Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2014 G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 1 / 75

Introdução Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 2 / 75

Introdução Introdução Objetivos O objetivo desta palestra inaugural é fazer uma resenha dos Modelos Lineares Generalizados (MLGs) criados há 42 anos por Nelder e Wedderburn (1972). Após uma breve introdução dos MLGs apresentaremos em ordem cronológica algumas das principais classes de modelos de regressão que foram motivadas pelos MLGs. Algumas dessas classes serão estudadas na disciplina Modelos Lineares Generalizados. Exemplos ilustrativos são também apresentados ao longo do texto. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 3 / 75

Introdução Introdução Antes dos MLGs Os MLGs foram criados com o objetivo de reunir numa mesma família vários modelos estatísticos que eram tratados separadamente. Em geral, nas análises de regressão, procurava-se algum tipo de transformação que levasse à normalidade, tais como a transformação de Box-Cox (1964) dada abaixo z = { y λ 1 λ se λ 0 logy se λ = 0, em que y > 0 e λ é uma constante desconhecida. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 4 / 75

Exemplos MLGs Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 5 / 75

Exemplos MLGs Exemplos MLGs Modelo Logístico Linear em que (0 < µ i < 1). (i) y i ind Be(µ i ) (i = 1,...,n), (ii) µ i = exp(η i) 1+exp(η i ), η i = x i β, G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 6 / 75

Exemplos MLGs Exemplos MLGs Modelo Logístico Linear em que (0 < µ i < 1). (i) y i ind Be(µ i ) (i = 1,...,n), (ii) µ i = exp(η i) 1+exp(η i ), η i = x i β, Modelo Recíproco Gama (i) y i ind G(µ i,φ) (i = 1,...,n), (ii) µ i = η 1 i, η i = x i β, em que (µ i > 0) e (y i > 0). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 6 / 75

Exemplos MLGs Exemplos MLGs Modelo Log-Linear de Poisson (i) y i ind P(µ i ) (i = 1,...,n), (ii) µ i = exp(η i ), η i = x i β, em que (y i = 0, 1, 2,...), (µ i > 0) e (Var(y i ) = µ i ). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 7 / 75

Exemplos MLGs Exemplos MLGs Modelo Log-Linear de Poisson (i) y i ind P(µ i ) (i = 1,...,n), (ii) µ i = exp(η i ), η i = x i β, em que (y i = 0, 1, 2,...), (µ i > 0) e (Var(y i ) = µ i ). Modelo Log-Linear Binomial Negativo (i) y i ind BN(µ i,φ) (i = 1,...,n), (ii) µ i = exp(η i ), η i = x i β, em que (y i = 0, 1, 2,...), (µ i > 0) e (Var(y i ) = µ i + µ2 i φ ). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 7 / 75

Um Exemplo Simples Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 8 / 75

Um Exemplo Simples Um Exemplo Simples Exposição de Bactérias Vamos considerar um exemplo em que modelos de regressão normal linear são comparados com um modelo log-linear de Poisson para ajustar dados de contagem. resposta: número de bactérias sobreviventes em amostras de um produto elimentício exposto a uma temperatura de 300 o F. variável explicativa: tempo de exposição do produto (em minutos). (Montgomery, Peck e Vining, 2001) (Paula, 2013a). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 9 / 75

Um Exemplo Simples Um Exemplo Simples Descrição dos Dados Bactérias 175 108 95 82 71 50 Exposição 1 2 3 4 5 6 Bactérias 49 31 28 17 16 11 Exposição 7 8 9 10 11 12 G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 10 / 75

Um Exemplo Simples Um Exemplo Simples Descrição dos Dados Bactérias 175 108 95 82 71 50 Exposição 1 2 3 4 5 6 Bactérias 49 31 28 17 16 11 Exposição 7 8 9 10 11 12 Gráfico de Dispersão Numero de Bacterias 50 100 150 2 4 6 8 10 12 Tempo de Exposicao G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 10 / 75

Um Exemplo Simples Um Exemplo Simples Ajuste Modelos Normais Com base na aproximação da Poisson pela normal vamos propor inicialmente os seguintes modelos: yi = α+βtempo i +ǫ i e yi = α+βtempo i +γtempo 2 i +ǫ i, em que ǫ i ind N(0,σ 2 ). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 11 / 75

Um Exemplo Simples Resíduos Modelos Normais Residuo Studentizado -2 0 2 4 6 Residuo Studentizado -2 0 2 4-1 0 1 Percentil da N(0,1) (Linear) -1 0 1 Percentil da N(0,1) (Quadratico) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 12 / 75

Um Exemplo Simples Um Exemplo Simples Modelo Log-linear de Poisson Vamos supor agora o seguinte modelo log-linear de Poisson: logµ i = α+βtempo i, em que y i ind P(µ i ). As estimativas desse modelo são apresentadas na tabela abaixo. Parâmetro Estimativa E/E.Padrão α 5,30 88,34 β -0,23-23,00 Desvio 8,42 (10 g.l.) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 13 / 75

Um Exemplo Simples Resíduos Modelo Log-Linear de Poisson Componente do Desvio -2-1 0 1 2 3-1 0 1 Percentil da N(0,1) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 14 / 75

Um Exemplo Simples Um Exemplo Simples Interpretação Modelo de Poisson O modelo ajustado fica então dado por ˆµ(x) = e 5,30 0,23x, em que x denota o tempo de exposição. Logo, se diminuirmos de uma unidade o tempo de exposição a variação no valor esperado fica dada por ˆµ(x 1) ˆµ(x) = e 0,23 = 1, 259. Ou seja, o número esperado de sobreviventes aumenta aproximadamente 25,9%. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 15 / 75

Um Exemplo Simples Curva Ajustada Modelo Log-Linear de Poisson Numero de Bacterias 50 100 150 2 4 6 8 10 12 Tempo de Exposicao G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 16 / 75

Contribuições dos MLGs Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 17 / 75

Contribuições dos MLGs Constribuições dos MLGs Algumas Contribuições Ligação entre a média e o preditor linear: µ i = g 1 (η i ). Para cada distribuição da família exponencial novos modelos podem ser gerados variando-se a função de ligação g( ). Função desvio: D(y; ˆµ) = 2{L(y, y) L(ˆµ, y)} = n i=1 d 2 (y i,ˆµ i ). É uma distância entre as (log) verossimilhanças do modelo saturado e do modelo postulado. Para alguns modelos a distribuição do desvio é uma qui-quadrado facilitando avaliar a qualidade do ajuste. Resíduo componente do desvio: t Di = ± d 2 (y i,ˆµ i ). Esse resíduo é muito utilizado para detectar pontos aberrantes e para avaliar a adequação da distribuição assumida para a resposta. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 18 / 75

Contribuições dos MLGs Contribuições dos MLGs Algumas Contribuições Função de variância: V(µ). Caracteriza a distribuição da família exponencial. Ou seja, para cada V(µ) existe apenas uma distribuição na família exponencial e vice-versa. Além disso, quando φ tem-se que φ(y µ) d N(0, V(µ)) (Jørgensen, 1987). Processo iterativo na forma de mínimos quadrados reponderados. A estimativa de máxima verossimilhança ˆβ pode ser obtida através do seguinte processo iterativo: β (m+1) = (X W (m) X) 1 X W (m) z (m), para m = 0, 1,..., X é a matriz modelo, W é a matriz de pesos e z a variável dependende modificada. Esse processo iterativo é inicializado nos próprios valores observados e em geral converge em um número finito de passos. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 19 / 75

Contribuições dos MLGs Modelos de Quase-Verosimilhança Definição Os modelos de quase-verossimilhança podem ser definidos da seguinte maneira: (i) y i ind QV(µ i,σ 2 ) (i = 1,...,n), E(y i ) = µ i e Var(y i ) = σ 2 V(µ i ), (ii) µ i = g 1 (η i ), η i = x i β, em que g( ) função de ligação e σ 2 > 0 é o parâmetro de dispersão. O parâmetro β do preditor linear pode ser estimado através de um processo iterativo de mínimos quadrados reponderados similar aos MLGs. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 20 / 75

Contribuições dos MLGs Aplicação Descrição Seja y ij a proporção da área afetada da folha da cevada da variedade j no local i (i = 1,...,9 e j = 1,...,10) (McCullagh e Nelder, 1989, Tabela 9.2). Como 0 y ij 1 propomos o seguinte modelo de QV: (i) y ij ind QV(µ ij,σ 2 ) (0 < µ ij < 1), E(y ij ) = µ ij e Var(y ij ) = σ 2 V(µ ij ), (ii) µ ij = exp(η ij) 1+exp(η ij ), η ij = α+β i +γ j. Vamos comparar os ajustes com V(µ ij ) = µ ij (1 µ ij ) e V(µ ij ) = µ 2 ij (1 µ ij) 2. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 21 / 75

Contribuições dos MLGs Diagnóstico V(µ ij ) = µ ij (1 µ ij ) Distância de Cook 0.0 0.5 1.0 1.5 38 65 Resíduo de Pearson 3 2 1 0 1 2 3 0 20 40 60 80 Índice 8 6 4 2 0 2 Preditor Linear G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 22 / 75

Contribuições dos MLGs Diagnóstico V(µ ij ) = µ 2 ij (1 µ ij) 2 24 Distância de Cook 0.0 0.2 0.4 0.6 0.8 1.0 65 52 76 Resíduo de Pearson 3 2 1 0 1 2 3 0 20 40 60 80 Índice 8 6 4 2 0 2 Preditor Linear G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 23 / 75

Equações de Estimação Generalizadas Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 24 / 75

Equações de Estimação Generalizadas Equações de Estimação Generalizadas Definição Liang e Zeger (1986) propuseram as Equações de Estimação Generalizadas (EEGs) que são uma extensão dos modelos de QV para dados correlacionados. Supondo que y i = (y i1,...,y ini ) correspondem às n i respostas do i-ésimo indivíduo (ou grupo) as EEGs saem do seguinte modelo de QV: R i (ρ): matriz trabalho. (i) y ij QV(µ ij,σ 2 ) (i = 1,...,n), (j = 1,...,n i ), E(y ij ) = µ ij e Var(y ij ) = σ 2 V(µ ij ), (ii) µ ij = g 1 (η ij ), η ij = x ij β, (iii) corr(y i ) = R i (ρ), em que ρ = (ρ 1,...,ρ q ). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 25 / 75

Equações de Estimação Generalizadas Aplicação Descrição Considere os dados abaixo descritos em Myers, Montgomery e Vining (2002), em que pacientes com problemas respiratórios receberam dois tratamentos. Visita 1 Visita 2 Visita 3 Visita 4 Droga Ativa 22/27 13/27 5/27 1/27 Placebo 20/29 18/29 21/29 15/29 Os pacientes foram aleatorizados da seguinte maneira: 27 receberam uma droga ativa e 29 receberam placebo. Cada paciente foi observado em quatro ocasiões em que mediu-se a condição respiratória (boa ou ruim). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 26 / 75

Equações de Estimação Generalizadas Aplicação Modelo Proposto Variáveis observadas para cada paciente: Trat (=0 droga ativa, =1 placebo), Idade (em anos), Gênero (=0 feminino, =1 masculino) e Base (=0 ausência, =1 presença). Seja y ij a condição respiratória (=1 ruim, =0 boa) do i-ésimo paciente na j-ésima ocasião, i = 1,...,56 e j = 1, 2, 3, 4. Propomos o seguinte modelo de QV: (i) y ij Be(µ i ) (0 < µ i < 1), (ii) µ i = exp(η i) 1+exp(η i ), em que η i = α+β 1 Idade i +β 2 Trat i +β 3 Genero i +β 4 Base i, (iii) corr(y ij, y ij ) = ρ j j para j j (AR(1)), estrutura de correlação autoregressiva de 1 a ordem. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 27 / 75

Equações de Estimação Generalizadas Aplicação Resultados Estimativas dos ajustes através de modelos logísticos supondo independência e estrutura de correlação AR(1). Correlação AR(1) Independência Efeito Estimativa z-robusto Estimativa z-robusto Intercepto -0,377-0,386-0,404-0,474 Idade 0,043 3,380 0,048 3,443 Placebo 1,001 3,066 1,070 3,425 Gênero -2,003-2,988-2,178-3,162 Base 0,492 0,586 0,498 0,977 ρ 0,275 0,00 G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 28 / 75

Equações de Estimação Generalizadas Resíduos Modelo Logístico Resíduo de Pearson 6 4 2 0 2 3 2 1 0 1 2 3 Percentil da N(0,1) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 29 / 75

Equações de Estimação Generalizadas Distância de Cook Modelo Logístico Distância de Cook 0.0 0.1 0.2 0.3 0.4 0.5 (18,4) (28,4) (53,4) 0 10 20 30 40 50 Unidade Experimental G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 30 / 75

Modelos Aditivos Generalizados Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 31 / 75

Modelos Aditivos Generalizados Modelos Aditivos Generalizados Definição Hastie e Tibshirane (1990) propuseram substituir o preditor linear dos MLGs por um preditor aditivo formado por funções não paramétricas f 1 (x 1 ),...,f p (x p ) dos valores x 1,...,x p de variáveis explicativas (por exemplo splines cúbicos). Essa nova classe de modelos de regressão é definida por: (i) y i ind FE(µ i,φ), (i = 1,...,n), (ii) µ i = g 1 (η i ), em que η i = α+f 1 (x 1i )+ +f p (x pi ). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 32 / 75

Modelos Aditivos Generalizados B-Splines Definição As funções f(x) em geral assumem a forma f(x) = r l=1 b l(x)γ l, em que b 1 (x),...,b r (x) é a base que depende dos valores de x e γ 1,...,γ r são parâmetros a serem estimados. O logaritmo da função de verossimilhança penalizada assume a forma L p (θ) = L(θ) 1 2 p λ j f j S j f j, j=1 em que θ = (α, f 1,...,f p), f j = (f j (xj1 0),...,f j(xjr 0 j )), S j é uma matriz r j r j que depende dos valores distintos xj1 0 <... < x jr 0 j e λ j são os parâmetros de suavização. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 33 / 75

Modelos Aditivos Generalizados Aplicação Descrição Considere os dados apresentados em Neter et al. (1996) sobre o perfil dos clientes de uma determinada loja oriundos de 110 áreas de uma cidade. O objetivo do estudo é relacionar o número de clientes em cada área (Nclientes) com as seguintes variáveis explicativas em cada área: número de domicílios (em mil) (Domic), renda média anual (em mil USD) (Renda), idade média dos domicílios (em anos) (Idade), distância ao concorrente mais próximo (em milhas) (Dist1) e distância à loja (em milhas) (Dist2). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 34 / 75

Modelos Aditivos Generalizados Diagramas de Dispersão Clientes 0 5 10 20 30 Clientes 0 5 10 20 30 20000 60000 100000 Renda 0 10 20 30 40 50 60 Idade Clientes 0 5 10 20 30 Clientes 0 5 10 20 30 1 2 3 4 5 6 Dist1 2 4 6 8 10 Dist2 G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 35 / 75

Modelos Aditivos Generalizados Aplicação Modelo Log-linear de Poisson Supor o seguinte MLG: (i) Nclientes i ind P(µ i ), (i = 1,...,110), (ii) logµ i = α+β 1 Domic i +β 2 Renda i +β 3 Idade i +β 4 Dist1 i +β 5 Dist2 i. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 36 / 75

Modelos Aditivos Generalizados Aplicação Modelo Log-linear de Poisson Supor o seguinte MLG: Estimativas (i) Nclientes i ind P(µ i ), (i = 1,...,110), (ii) logµ i = α+β 1 Domic i +β 2 Renda i +β 3 Idade i +β 4 Dist1 i +β 5 Dist2 i. Efeito Parâmetro Estimativa E/E.Padrão Constante α 2,942 14,21 Domicílio β 1 0,606 4,27 Renda β 2-0,012-5,54 Idade β 3-0,004-2,09 Dist1 β 4 0,168 6,54 Dist2 β 5-0,129-7,95 G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 36 / 75

Modelos Aditivos Generalizados Resíduos Modelo Log-linear de Poisson Componente do Desvio -2 0 2-2 -1 0 1 2 Percentil da N(0,1) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 37 / 75

Modelos Aditivos Generalizados Aplicação Modelo Aditivo de Poisson Supor o seguinte modelo aditivo: (i) Nclientes i ind P(µ i ), (i = 1,...,110), (ii) logµ i = α+f 1 (Domic i )+f 2 (Renda i )+f 3 (Idade i ) +f 4 (Dist1 i )+f 5 (Dist2 i ), em que f 1 (x),...,f 5 (x) são splines cúbicos. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 38 / 75

Modelos Aditivos Generalizados Ajustes Modelo Aditivo de Poisson s(renda,1) 1.0 0.5 0.0 0.5 1.0 s(idade,1) 1.0 0.5 0.0 0.5 1.0 20000 40000 60000 80000 120000 renda 0 10 20 30 40 50 60 idade s(dist1,3.12) 1.0 0.5 0.0 0.5 1.0 s(dist2,1) 1.0 0.5 0.0 0.5 1.0 1 2 3 4 5 6 dist1 2 4 6 8 10 dist2 G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 39 / 75

Modelos Aditivos Generalizados Comparação de Ajustes Predito ajuste GAM 5 10 15 20 25 30 5 10 15 20 25 30 35 Predito ajuste GLM G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 40 / 75

Modelos Não Lineares Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 41 / 75

Modelos Não Lineares Modelos Não Lineares Definição Cordeiro e Paula (1989) propuseram os Modelos Não Lineares de Família Exponencial, em que o preditor linear dos MLGs é substituído por um preditor não linear. Wei (1998) agregou novos resultados a esta classe que é definida por: (i) y i ind FE(µ i,φ), (i = 1,...,n), (ii) µ i = g 1 (η i ), em que η i = f(x i ;β) com f(x i ;β) sendo uma função não linear em β. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 42 / 75

Modelos Não Lineares Exemplo Mistura de Drogas Modelo proposto por Finney (1978) para avaliar a mistura de duas drogas A e B: (i) y i ind FE(µ i,φ), (i = 1,...,n), (ii) g(µ i ) = α+δlog{x 1i +ρx 2i + k ρx 1i x 2i }, em que Y é a resposta, x 1 e x 2 representam as log-doses das drogas A e B, respectivamente, δ é a inclinação comum na relação log-dose e resposta, ρ é a potência da droga B em relação à doga A e k representa a interação entre as duas drogas (k = 0 ausência de interação, k > 0 sinergismo e k < 0 antagonismo). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 43 / 75

Modelos Não Lineares Aplicação Descrição Diagrama de dispersão entre o peso das lentes dos olhos (em mg) e a idade (em dias) de um tipo de coelho europeu largamente encontrado na população selvagem da Austrália (Ratkowsky, 1983). Peso das lentes dos olhos do coelho(em mg) 50 100 150 200 250 0 200 400 600 800 Idade do coelho(em dias) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 44 / 75

Modelos Não Lineares Aplicação Modelo Proposto Wei (1998) e Possamai (2009) propuseram o seguinte modelo não linear para explicar o peso médio das lentes dos olhos dos coelhos em função da idade: ind (i) y i NI(µ i,φ), (i = 1,...,76), { } (ii) µ i = αexp β x i +γ ou logµ i = µ β x i +γ, em que Y i e x i denotam, respectivamente, o peso das lentes dos olhos e a idade do i-ésimo coelho, α é a assíntota ou o valor máximo esperado para o peso das lentes dos coelhos, β está relacionado com o aumento do peso das lentes dado a idade e γ é um tipo de correção para a idade do coelho. Note que Var(y i ) = φ 1 µ 3 i. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 45 / 75

Modelos Não Lineares Aplicação Estimativas Modelo Não Linear Efeito Estimativa E/E.Padrão µ 5,63 224,96 β 128,53 21,09 γ 36,78 16,65 Daí podemos estimar a assíntota (tamanho máximo esperado para o peso das lentes) como sendo ˆα = 278, 66(0, 067). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 46 / 75

Modelos Não Lineares Curva Ajustada Peso das lentes dos olhos do coelho(em mg) 50 100 150 200 250 0 200 400 600 800 Idade do coelho(em dias) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 47 / 75

Modelos Lineares Generalizados Duplos Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 48 / 75

Modelos Lineares Generalizados Duplos MLGs Duplos Definição Smyth (1989) introduziu os modelos lineares generalizados duplos com modelagem conjunta da média e do parâmetro de precisão (φ) ou dispersão (φ 1 ), os quais são definidos por: (i) y i ind FE(µ i,φ i ), (i = 1,...,n), (ii) µ i = g 1 (η i ), η i = x i β, (iii) φ i = h 1 (λ i ), λ i = z i γ, em que x i = (x i1,...,x ip ) e z i = (z i1,...,z iq ) contêm valores de variáveis explicativas e β = (β 1,...,β p ) e γ = (γ 1,...,γ q ) são parâmetros a serem estimados. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 49 / 75

Modelos Lineares Generalizados Duplos Aplicação Descrição Vamos considerar um estudo desenvolvido na Faculdade de Saúde Pública da USP em que 4 formas diferentes de um novo tipo de snack com baixo teor de gordura saturada e de ácidos graxos (denotados por B, C, D e E) foram comparados ao longo de 20 semanas com um tipo padrão (denotado por A). Neste novo produto optou-se por substituir, totalmente ou parcialmente, o agente responsável pela fixação do aroma do produto, a gordura vegetal hidrogenada por óleo de canola. Uma das variáveis de interesse é o comportamento da textura dos produtos através da força necessária para o cisalhamento (Paula, Moura e Yamaguchi, 2004; Paula, 2013b). G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 50 / 75

Modelos Lineares Generalizados Duplos Força de Cisalhamento pela Semana Cisalhamento 40 60 80 100 120 2 4 6 8 10 12 14 16 18 20 Semanas G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 51 / 75

Modelos Lineares Generalizados Duplos Força de Cisalhamento segundo o Grupo Cisalhamento 40 60 80 100 120 A B C D E Grupo G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 52 / 75

Modelos Lineares Generalizados Duplos Tendências Cisalhamento Medio 45 50 55 60 65 70 CV Cisalhamento 20 25 30 5 10 15 20 Semanas 5 10 15 20 Semanas G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 53 / 75

Modelos Lineares Generalizados Duplos Aplicação Modelo Proposto Com base nas tendências para a média da força de cisalhamento e para o coeficiente de variação da força de cisalhamento, vamos propor o seguinte modelo: (i) y ij ind G(µ ij,φ ij ), (ii) µ ij = β 0 +β i +β 6 semana j +β 7 semana 2 j, (iii) log(φ ij ) = γ 0 +γ i +γ 6 semana j +γ 7 semana 2 j, em que Y ijk denota a força de cisalhamento referente à k-ésima réplica do i-ésimo grupo na j-ésima semana, β 1 = 0 e γ 1 = 0. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 54 / 75

Modelos Lineares Generalizados Duplos Aplicação Estimativas Modelo Gama Duplo Média Precisão Efeito Estimativa E/E.Padrão Estimativa E/E.Padrão Constante 36,990 11,53 1,560 7,27 Grupo B -10,783-6,40 0,468 2,95 Grupo C -3,487-1,98 0,050 0,31 Grupo D -14,829-9,18 0,815 5,05 Grupo E -15,198-9,54 0,817 5,06 Semana 5,198 9,88 0,155 3,91 Semana 2-0,189-8,88-0,005-2,99 G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 55 / 75

Modelos Lineares Generalizados Duplos Resíduos para Média Modelo Gama Duplo Componente do Desvio 4 2 0 2 3 2 1 0 1 2 3 Percentil da N(0,1) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 56 / 75

Modelos Lineares Generalizados Duplos Resíduos para Precisão Modelo Gama Duplo Componente do Desvio 6 4 2 0 2 4 3 2 1 0 1 2 3 Percentil da N(0,1) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 57 / 75

Modelos Lineares Generalizados Mistos Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 58 / 75

Modelos Lineares Generalizados Mistos MLGs Mistos Definição Breslow e Clayton (1993) propuseram os Modelos Lineares Generalizados Mistos (MLGs Mistos) em que o preditor linear é formado por um componente fixo (paramétrico) e um componente aleatório (efeitos aleatórios). Supondo que y i = (y i1,...,y ini ) T correspondem às n i respostas do i-ésimo indivíduo os MLGs Mistos são definidas por: (i) y ij b i ind FE(µ ij,φ), (i = 1,...,n), (j = 1,...,n i ), (ii) µ ij = g 1 (η ij ), η ij = x ij β + z ij b i, (iii) b i iid N q (0, D). em que x i = (x i1,...,x ip ) e z i = (z i1,...,z iq ) contêm valores de variáveis explicativas, β = (β 1,...,β p ) e b i = (b i1,...,b iq ) são os efeitos aleatórios. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 59 / 75

Modelos Lineares Generalizados Mistos Modelo Marginal Descrição Sejam f ij (y ij b i,β,φ) e f(b i D) as f.d.p. s de y ij b i e b i, respectivamente. Então, a f.d.p. marginal de y = (y 1,...,y n ) T, em que y i = (y i1,...,y imi ) T, fica dada por (McCullogh e Searle, 2001) f(y β,φ, D) = Π n i=1 {Π m i IR q j=1 f ij(y ij b i,β,φ)}f(b i D)db i. O logaritmo da função de verossimilhança marginal fica dado por L(β,φ, D) = n i=1 log {Π m i IR q j=1 f ij(y ij b i,β,φ)}f(b i D)db i. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 60 / 75

Modelos Lineares Generalizados Mistos Aplicação Descrição Hadgu e Koch(1999) discutem os resultados de um ensaio clínico com 109 adultos voluntários com pré-existência de placa dentária. Nesse estudo os indivíduos foram distribuídos de forma aleatória para receberem um líquido tipo A (34 indivíduos), um líquido tipo B (36 indivíduos) e placebo (39 indivíduos). As placas dentárias de cada indivíduo foram avaliadas e classificadas segundo um escore no início do tratamento, após 3 meses e após 6 meses. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 61 / 75

Modelos Lineares Generalizados Mistos Perfis Placas Dentárias Escore 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 Placebo RINSE A RINSE B Início Após 3 meses Após 6 meses Período G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 62 / 75

Modelos Lineares Generalizados Mistos Distribuição Inicial Placas Dentárias Densidade 0.0 0.2 0.4 0.6 0.8 1.0 1.2 2.0 2.5 3.0 3.5 Placa G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 63 / 75

Modelos Lineares Generalizados Mistos Aplicação Modelo Gama de Intercepto aleatório Seja y ijk o escore do k-ésimo indivíduo do i-ésimo grupo (placebo, líquido A, líquido B) e j-ésimo período (início do tratamento, após 3 meses, após 6 meses), i, j = 1, 2, 3, k = 1,...,n ij com n 1j = 39, n 2j = 34 e n 3j = 36. Vamos propor o seguinte modelo de intercepto aleatório: ind (i) y ijk b k G(µ ijk,φ), (ii) logµ ijk = η ijk, η ijk = α+b k +β i +γ j +δ ij, (iii) b k iid N(0,σ 2 e), em que b k denota efeito aleatório de indivíduo, β i, γ j e δ ij denotam, respectivamente, os efeitos de líquido, tempo e interação, com β 1 = 0, γ 1 = 0, δ 1j = 0 e δ i1 = 0. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 64 / 75

Modelos Lineares Generalizados Mistos Aplicação Estimativas Modelo Gama de Intercepto Aleatório Efeito Parâmetro Estimativa E/E.Padrão Constante α 0,938 13,95 Líquido A β 2 0,020 0,21 Líquido B β 3-0,026-0,27 Tempo(3M) γ 2-0,409-5,41 Tempo(6M) γ 3-0,424-5,46 A*Tempo(3M) δ 22-0,376-3,39 A*Tempo(6M) δ 23-0,319-2,93 B*Tempo(3M) δ 32-0,419-3,72 B*Tempo(6M) δ 33-0,498-4,51 Efeito aleatório σe 2 0,064 G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 65 / 75

Aplicativos Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 66 / 75

Aplicativos Aplicativos Detalhes O primeiro aplicativo desenvolvido para o ajuste de MLGs GLIM está desativado. Aplicativos com MLGs e extensões: S-Plus (http://www.insightful.com) R (http://www.r-project.org) SAS (http://www.sas.com) STATA (http://www.stata.com) MATLAB (http://www.mathworks.com) SUDAAN (http://www.rti.org/sudaan) G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 67 / 75

Considerações Finais Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 68 / 75

Considerações Finais Considerações Finais Conclusões Os MLGs trouxeram uma nova notação para a área de Modelos de Regressão e nesses 42 anos receberam várias extensões com modificações na parte aleatória, na estrutura de correlação e no componente sistemático com a inclusão, por exemplo, de componentes não paramétricos, componentes não lineares e componentes aleatórios. Todavia, os MLGs na sua forma original continuam sendo aplicados num grande número de problemas práticos com excelentes resultados. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 69 / 75

Referências Sumário 1 Introdução 2 Exemplos MLGs 3 Um Exemplo Simples 4 Contribuições dos MLGs 5 Equações de Estimação Generalizadas 6 Modelos Aditivos Generalizados 7 Modelos Não Lineares 8 Modelos Lineares Generalizados Duplos 9 Modelos Lineares Generalizados Mistos 10 Aplicativos 11 Considerações Finais 12 Referências G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 70 / 75

Referências Referências Referências Box, G. E. P. e Cox, D. R. (1964). An analysis of transformations (with discussion). Journal of the Royal Statistical Society B 26, 211-252. Breslow, N. E. e Clayton, D. G. (1993). Approximate inference in generalized linear mixed models. Journal of the American Statistical Association 88, 9-25. Cordeiro, G. M. e Paula, G. A. (1989). Improved likelihood ratio statistics for exponential family nonlinear models. Biometrika 76, 93-100. Finney, D. J. (1978). Statistical Methods in Biological Assay, 3rd. Edition. Cambridge University Press, Cambridge. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 71 / 75

Referências Referências Referências Hadgu, A. e Koch, G. (1999). Application of generalized estimating equations to a dental randomized clinical trial. Journal of Biopharmaceutical Statistics 9, 161-178. Hastie, T. e Tibshirani, R. (1990). Generalized Additive Models. Chapman and Hall, London. Jørgensen, B. (1987). Exponential dispersion models (with discussion). Journal of the Royal Statistical Society B 49, 127-162. Liang, K. Y. e Zeger, S. L. (1986). Longitudinal data analysis using generalized linear models. Biometrika 73, 13-22. McCullagh, P. e Nelder, J. A. (1989). Generalized Linear Models, 2nd. Edition. Chapman and Hall, London. McCulloch, C. E. e Searle, S. R. (2001). Linear and Generalized Linear Mixed Models. Wiley, New York. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 72 / 75

Referências Referências Referências Montgomery, D. C.; Peck, E. A. e Vining, G. G. (2001). Introduction to Linear Regression Analysis, Third Edition. John Wiley, New York. Myers, R.H.; Montgomery, D. C. e Vining, G. G. (2002). Generalized Linear Models: With Applications in Engineering and the Sciences. John Wiley, New York. Nelder, J. A. e Wedderburn, R. W. M. (1972). Generalized linear models. Journal of the Royal Statistical Society A 135, 370-384. Neter, J.; Kutner, M. H.; Nachtsheim, C. J. e Wasserman, W.(1996). Applied Linear Regression Models, 3rd Edition. Irwin, Illinois. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 73 / 75

Referências Referências Referências Paula, G. A., de Moura, A. S. e Yamaguchi, A. M. (2004). Estabilidade Sensorial de Snacks Aromatizados com Óleo de Canola e Gordura Vegetal Hidrogenada, São Paulo, IME-USP RAECEA-04P05. Paula, G. A. (2013a). Modelos de Regressão: com apoio computacional. IME-USP. (http://www.ime.usp.br/ giapaula/cursospos.htm) Paula, G. A. (2013b). On diagnostics in double generalized linear models. Computational Statistics and Data Analysis 68, 44-51. Possamai, A. A. (2009). Modelos Não Lineares de Família Exponencial Revisitados. Dissertação de Mestrado, IME-USP. Ratkowsky, D. A. (1983). Nonlinear Regression Modelling. Marcel Dekker, New York. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 74 / 75

Referências Referências Referências Smyth, G. K. (1989). Generalized linear models with varying dispersion. Journal of the Royal Statistical Society B 51, 47-60. Wedderburn, R. W. M. (1974). Quasi-likelihood functions, generalized linear models and the Gauss-Newton method. Biometrika 61, 439-447. Wei, B. C. (1998). Exponential Family Nonlinear Models. Lecture Notes in Statistics Vol. 130. Springer, New York. G. A. Paula (IME-USP) Resenha MLGs 2 o Semestre 2014 75 / 75