Analisando com desfecho binário

Tamanho: px
Começar a partir da página:

Download "Analisando com desfecho binário"

Transcrição

1 Analisando com desfecho binário Leo Bastos Fundação Oswaldo Cruz Leo Bastos (PROCC/Fiocruz) Dados binários 1 / 69

2 Outline 1 Análise para dados com desfecho binário. Mundo 2x2 Regressão para dados binários 2 Medidas de associação ajustadas Estimando o risco relativo* ajustado Estimando RR diretamente da regressão logística 3 GLM para amostras complexas 4 Modelos multinível Leo Bastos (PROCC/Fiocruz) Dados binários 2 / 69

3 Baixo peso ao nascer A tabela de contingência Baixo peso ao nascer x mãe fumou durante gravidez em um estudo sectional: Calculando o OR: Peso ao nascer < 2500g 2500g Fumou Não fumou OR fumou = 86/29 44/30 = Leo Bastos (PROCC/Fiocruz) Dados binários 4 / 69

4 Exemplo coorte: Medidas tabela 2x2 epi.2by2(with(table(low, smoke), data = birth), method = "cross.sectional") ## Outcome + Outcome - Total Prevalence * ## Exposed ## Exposed ## Total ## Odds ## Exposed ## Exposed ## Total ## ## Point estimates and 95 % CIs: ## ## Prevalence ratio 1.35 (1.01, 1.79) ## Odds ratio 2.01 (1.03, 3.96) ## Attrib prevalence * (1.87, 32.13) ## Attrib prevalence in population * (-2.84, 26.22) ## Attrib fraction in exposed (%) (0.98, 44.25) ## Attrib fraction in population (%) (-0.21, 34.88) ## ## * Cases per 100 population units Leo Bastos (PROCC/Fiocruz) Dados binários 5 / 69

5 Algumas medidas de associação por estudo Estudo de coorte Incidence risk ratio (Razão de riscos) Incidence rate ratio (Razão de taxas) Odds ratio (OR) Estudo caso controle Odds ratio (OR) Estudo seccional Odds ratio (OR) Prevalence ratio (PR, razão de prevalências) Leo Bastos (PROCC/Fiocruz) Dados binários 6 / 69

6 Exemplo coorte Leo Bastos (PROCC/Fiocruz) Dados binários 7 / 69

7 Exemplo coorte: Medidas tabela 2x2 ## Outcome + Outcome - Total Inc risk * ## Exposed ## Exposed ## Total ## Odds ## Exposed ## Exposed ## Total ## ## Point estimates and 95 % CIs: ## ## Inc risk ratio 3.00 (1.14, 7.91) ## Odds ratio (1.39, ) ## Attrib risk * (26.05, 93.95) ## Attrib risk in population * (-5.60, 65.60) ## Attrib fraction in exposed (%) (12.15, 87.35) ## Attrib fraction in population (%) (-6.82, 76.60) ## ## * Cases per 100 population units Leo Bastos (PROCC/Fiocruz) Dados binários 8 / 69

8 Exemplo coorte: Kaplan Meier Exposto Não exposto Leo Bastos (PROCC/Fiocruz) Dados binários 9 / 69

9 Exemplo coorte: teste log rank survdiff(surv(x, D=="+") ~ E) ## Call: ## survdiff(formula = Surv(x, D == "+") ~ E) ## ## N Observed Expected (O-E)^2/E (O-E)^2/V ## E= ## E= ## ## Chisq= 3.5 on 1 degrees of freedom, p= Leo Bastos (PROCC/Fiocruz) Dados binários 10 / 69

10 Modelos para medidas de associação ajustadas Quando precisamos controlar por outras variáveis explicativas OR Regressão logística Razão de taxas Análise de sobrevivência (e.g. Modelo de Cox) Razão de riscos (ou prevalencias) Modelo log-binomial, regressão de Poisson (com variância robusta), regressão logística*,... Leo Bastos (PROCC/Fiocruz) Dados binários 11 / 69

11 GLM Seja Y 1, Y 2,..., Y n variáveis aleatórias independentes Cada Y i FE(θ i ), com valor esperado E[Y i ] = µ i = c (θ i )/b (θ i ). As variáveis explicativas x i1,..., x ip influenciam a variável resposta através de um preditor linear η i = x T i β = β 0 + β 1 x 1i + + β p x pi A média, µ i (que é função de θ i ), e o preditor linear, η i, estão relacionados por uma função de ligação g( ) tal que: g(µ i ) = η i = x T i β Leo Bastos (PROCC/Fiocruz) Dados binários 12 / 69

12 Dados binários Seja Y 1, Y 2,..., Y n variáveis aleatórias independentes O desfecho é binário, i.e. Y i = {0, 1} Assume-se que onde θ i = P(Y i = 1) (0, 1). Sabemos que E[Y i ] = µ i = θ i. Y i Bern(θ i ) O componente sistemático está relacionado com o componente aleatório através da função de ligação, i.e. onde g( ) : (0, 1) R. g(µ i ) = x T i β = β 0 + β 1 x 1i + + β p x pi Leo Bastos (PROCC/Fiocruz) Dados binários 13 / 69

13 Funções de ligação Algumas possíveis funções de ligação: Logit ( ) µi log = x T i β = η i µ i = eη i 1 µ i 1 + e η i Complemento log-log: cloglog log ( log(1 µ i )) = x T i β µ i = 1 e eη i Probit Φ 1 (µ i ) = x T i β µ i = Φ(η i ) onde Φ( ) é a função acumulada da Normal padrão. Cauchit F 1 C (µ i) = x T i β µ i = F C (η i ) onde F C ( ) é a função acumulada da Cauchy padrão. (Cauchy t 1 ) Leo Bastos (PROCC/Fiocruz) Dados binários 14 / 69

14 Função logistica Função de ligação mais popular. Uma função dos efeitos pode ser interpretada como razão de chances. OR = p 1 1 p 1 p 2 1 p 2 Suponha o seguinte componente sistemático: η i = β 0 + β 1 x i. Para dois valores distintos de x, {x 1, x 2 }, podemos calcular a OR OR = P(Y i =1 X i =x 1 ) 1 P(Y i =1 X i =x 1 ) P(Y i =1 X i =x 2 ) 1 P(Y i =1 X i =x 2 ) = µ (xi =x 1 ) 1 µ (xi =x 1 ) µ (xi =x 2 ) 1 µ (xi =x 2 ) Leo Bastos (PROCC/Fiocruz) Dados binários 15 / 69

15 Função logistica Note que a função de ligação, para qualquer valor de x, tem a forma: ( ) µ(xi =x) log = β 0 + β 1 x i µ (x i =x) = exp{β 0 + β 1 x} 1 µ (xi =x) 1 µ (xi =x) Logo a razão de chances de interesse é OR = µ (xi =x 1 ) 1 µ (xi =x 1 ) µ (xi =x 2 ) 1 µ (xi =x 2 ) Se x 1 = 1 e x 2 = 0 então = exp{β 0 + β 1 x 1 } exp{β 0 + β 1 x 2 } = exp{β 1(x 1 x 2 )} OR = exp{β 1 } Leo Bastos (PROCC/Fiocruz) Dados binários 16 / 69

16 Voltando ao exemplo do peso ao nascer A tabela de contingência Baixo peso ao nascer x mãe fumou durante gravidez Calculando o OR: Peso ao nascer < 2500g 2500g Fumou Não fumou OR fumou = 86/44 29/30 = Leo Bastos (PROCC/Fiocruz) Dados binários 17 / 69

17 Saída R: glm() (saida <- glm(low ~ smoke, family=binomial(), data=birth)) ## ## Call: glm(formula = low ~ smoke, family = binomial(), data = birth) ## ## Coefficients: ## (Intercept) smokesim ## ## ## Degrees of Freedom: 188 Total (i.e. Null); 187 Residual ## Null Deviance: ## Residual Deviance: AIC: exp(c(saida$coef[2], confint(saida, 2) )) ## smokesim 2.5 % 97.5 % ## Leo Bastos (PROCC/Fiocruz) Dados binários 18 / 69

18 Função logistica Se for de interesse, e o delineamento do estudo permitir, podemos estimar a probabilidade do desfecho ocorrer sob condições específicas das variáveis explicativas. Ou seja, Para o modelo logistico: P(Y i = 1 X i = x) = µ (xi =x) = g 1 (x T i β) P(Y i = 1 X i = x) = ext i β 1 + e xt i β Logo, previsões para essas probabilidades são dados por P(Y i = 1 X i = x) = ext i ˆβ 1 + e xt i ˆβ Leo Bastos (PROCC/Fiocruz) Dados binários 19 / 69

19 Função logistica Suponha que dois cenários serão compardos, onde a única diferença entre eles é a variável x k, que assume valor a em um cenário e b no outro. O resto das variáveis são exatamente iguais, ou seja, para um particular valor x da variável x k, temos que log ( µ(xk =x) 1 µ (xk =x) ) = x T k β k+xβ k µ (x k =x) 1 µ (xk =x) Logo a razão de chances de interesse é OR = µ (xk =a) 1 µ (xk =a) µ (xk =b) 1 µ (xk =b) Se a = 1 e b = 0 então = exp{x T k β k+xβ k } = exp{xt k β k + aβ k } exp{x T k β k + bβ k } = exp{β k(a b)} OR = exp{β 1 } Leo Bastos (PROCC/Fiocruz) Dados binários 20 / 69

20 Exemplos Se x k for uma variável dicotômica (binária), então exp{ ˆβ k } é uma estimativa da razão de chances entre os dois grupos. Interpretação: A chance de um paciente (do grupo x k = 1) ter um resultado positivo do desfecho é exp{ ˆβ k } vezes a chance de um paciente (do grupo x k = 0), mantidas as outras variáveis constantes. Leo Bastos (PROCC/Fiocruz) Dados binários 21 / 69

21 Exemplos Se x k for uma variável numérica (contínua), então exp{ ˆβ k } é uma estimativa da razão de chances do acréscimo em uma unidade dessa variável. Interpretação: O acréscimo de uma unidade da variável x k implica em uma chance exp{ ˆβ k } vezes do paciente ter um desfecho positivo. Leo Bastos (PROCC/Fiocruz) Dados binários 22 / 69

22 Outras funções de probabilidade Link cloglog: Função de distribuição de valor extremo. Link probit: Função de distribuição de Normal padrão. Link cauchit: Função de distribuição de Cauchy padrão. Modelos úteis quando temos modelo dose-resposta. Dobson (2001), seção 7.3. Leo Bastos (PROCC/Fiocruz) Dados binários 23 / 69

23 Exemplo: Fatores de risco associados ao baixo peso Dados de 189 nascimentos foram coletados no Baystate Medical Center, Springfield, Massachusetts em low: Peso ao nascer abaixo de 2.5kg (1=sim, 0=não) age: Idade da mãe em anos. lwt: Peso da mãe em Kg na ultima menstruação. race: Raça da mãe ( white, black, other ) smoke: Fumou durante a gravidez (1=sim, 0=não) ht: Histórico de hipertensão (1=sim, 0=não) ui: Presença de uterine irritability (1=sim, 0=não) ftv: Número de visitas ao médico durante o primeiro trimestre. ptl: Número de partos prematuros. bwt: Peso ao nascer em gramas. Leo Bastos (PROCC/Fiocruz) Dados binários 24 / 69

24 Descritivas Baixo peso por idade da mae Nao Sim Leo Bastos (PROCC/Fiocruz) Dados binários 25 / 69

25 Descritivas Baixo peso por raça Nao Sim Freq Leo Bastos (PROCC/Fiocruz) Dados binários 26 / 69

26 Descritivas Baixo peso por ht Nao Sim Freq nao sim Histórico de hipertensão Leo Bastos (PROCC/Fiocruz) Dados binários 27 / 69

27 Descritivas Baixo peso por ftv Freq Nao Sim 0 1 Visitas ao medico 1o trimestre Leo Bastos (PROCC/Fiocruz) Dados binários 28 / 69

28 Testes estatísticos Variáveis Teste p-value Baixo peso x Idade t Baixo peso x Peso da mãe t Baixo peso x Raça da mãe χ Baixo peso x Fumou na gravidez χ Baixo peso x Histórico de hipertensão Exato de Fisher Baixo peso x uterine irritability χ Baixo peso x Visitas ao médico 1o trim. χ Baixo peso x Partos prematuros χ Leo Bastos (PROCC/Fiocruz) Dados binários 29 / 69

29 Saída R: glm() ## ## Call: ## glm(formula = low ~ age + lwt + race + smoke + ht + ui + ptl, ## family = binomial, data = birth) ## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## ## ## Coefficients: ## Estimate Std. Error z value Pr(> z ) ## (Intercept) ## age ## lwt * ## raceother ## racewhite * ## smokesim * ## htsim ** ## uisim ## ptl ** ## --- ## Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## (Dispersion parameter for binomial family taken to be 1) Leo Bastos (PROCC/Fiocruz) Dados binários 30 / 69

30 Saída R: glm() apos rodar o stepwise ## ## Call: ## glm(formula = low ~ lwt + race + smoke + ht + ui + ptl, family = binomial, ## data = birth) ## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## ## ## Coefficients: ## Estimate Std. Error z value Pr(> z ) ## (Intercept) ## lwt * ## raceother ## racewhite * ## smokesim * ## htsim ** ## uisim ## ptl * ## --- ## Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## (Dispersion parameter for binomial family taken to be 1) ## Leo Bastos (PROCC/Fiocruz) Dados binários 31 / 69

31 Testando a variável ui usando a deviance ## Analysis of Deviance Table ## ## Model 1: low ~ lwt + race + smoke + ht + ptl ## Model 2: low ~ lwt + race + smoke + ht + ui + ptl ## Resid. Df Resid. Dev Df Deviance Pr(>Chi) ## ## Leo Bastos (PROCC/Fiocruz) Dados binários 32 / 69

32 Saída R: glm() apos rodar o stewise ## ## Call: ## glm(formula = low ~ lwt + race + smoke + ht + ptl, family = binomial, ## data = birth) ## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## ## ## Coefficients: ## Estimate Std. Error z value Pr(> z ) ## (Intercept) ## lwt * ## raceother ## racewhite * ## smokesim * ## htsim * ## ptl ** ## --- ## Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## (Dispersion parameter for binomial family taken to be 1) ## ## Null deviance: on 188 degrees of freedom Leo Bastos (PROCC/Fiocruz) Dados binários 33 / 69

33 Entendendo a variável raça A Variável raça é um fator com 3 níveis (black, other, white) Na modelagem, as variáveis precisam ser transformadas em números. E um fator é transformado em número usando contrastes ortogonais. other white black 0 0 other 1 0 white 0 1 O número de contrastes de uma variável, do tipo fator, é igual ao número de níveis menos 1. Sempre haverá um valor base, cujo o efeito estará embutido no intercepto. (no exemplo da raça, a base é black) O efeito de um constraste é sempre relativo ao efeito da base. Leo Bastos (PROCC/Fiocruz) Dados binários 34 / 69

34 Testando a variável raça usando a deviance ## Analysis of Deviance Table ## ## Model 1: low ~ lwt + smoke + ht + ptl ## Model 2: low ~ lwt + race + smoke + ht + ui + ptl ## Resid. Df Resid. Dev Df Deviance Pr(>Chi) ## ## * ## --- ## Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' Leo Bastos (PROCC/Fiocruz) Dados binários 35 / 69

35 Baseado no teste de Wald Vamos supor que o modelo final é aquele que melhor representa o conhecimento a respeito do baixo peso, sob os pontos de vista teórico e estatístico. A equação do modelo final é logit(π i ) = lwd i 0.39race : other i 1.26race : white i smoke : sim i ht : sim i ptl i Como podemos interpretar os resultados? Leo Bastos (PROCC/Fiocruz) Dados binários 36 / 69

36 Estimativas Estimate Std. Error z value Pr(> z ) (Intercept) lwt raceother racewhite smokesim htsim ptl Leo Bastos (PROCC/Fiocruz) Dados binários 37 / 69

37 Análise visual Regression Estimates ptl htsim smokesim racewhite raceother lwt Leo Bastos (PROCC/Fiocruz) Dados binários 38 / 69

38 Baixo peso: Interpretação Mães com peso da mãe na última menstruação uma unidade menor tem a chance de ter filho com baixo peso é vezes maior. A chance de uma mãe negra ter um filho com baixo peso é vezes a chance de uma mãe branca. A chance de uma mãe que fumou na gravidez ter um filho com baixo peso é 2.41 vezes a chance de uma mãe que não fumou durante a gravidez. A chance de uma mãe com histórico de hipertensão ter um filho com baixo peso é 5.81 vezes a chance de uma mãe que não tem histórico de hipertensão. A chance de uma mãe que já teve pelo menos um parto prematuro ter um filho com baixo peso é 3.43 vezes a chance de uma mãe que não teve filho prematuro. Leo Bastos (PROCC/Fiocruz) Dados binários 39 / 69

39 Medidas de associação ajustadas Quando precisamos controlar por outras variáveis explicativas OR Regressão logística Razão de taxas Análise de sobrevivência (e.g. Modelo de Cox) Razão de riscos (ou prevalencias) Modelo log-binomial, regressão de Poisson (com variância robusta), regressão logística*,... Leo Bastos (PROCC/Fiocruz) Dados binários 41 / 69

40 Odds ratio via regressão logística Ao estimarmos um coeficiente β em um modelo de regressão logística junto com as outras variáveis, dizemos que estamos controlando por essas outras variáveis. A OR estimada é chamada de OR ajustada. A OR pode ser calculada nos três desenhos: coorte, seccional e caso-controle. Um propriedade: quanto menor a prevalência do desfecho, melhor a aproximação do uso da OR como Risco relativo (ou razão de prevalência). Leo Bastos (PROCC/Fiocruz) Dados binários 42 / 69

41 Razão de riscos (ou prevalências) A Razão de risco ou risco relativo, RR, pode ser calculada diretamente em estudos de coorte, e em estudos seccionais (razão de prevalências). SPG, suponha que queremos encontrar a RR para a variável X 1, RR 1, controlando pelas demais (X 2, z..., X p ). O RR 1 ajustada é dada por: RR 1 = P(Y = 1 X 1 = 1, X 2 = x 2,..., X k = x k ) P(Y = 1 X 1 = 0, X 2 = x 2,..., X k = x k ) Em um modelo log-binomial, essa razão se reduz a RR 1 = eβ 0+β 1 +β 2 x β k x k e β 0+β 2 x β k x k = e β 1 Como a função de ligação, log, não é uma função g( ) : (0, 1) R, então pode-se observar instabilidade numérica na estimação. Leo Bastos (PROCC/Fiocruz) Dados binários 43 / 69

42 Alternativas para o cálculo do risco relativo O método mais popular é a regressão de Poisson com variância robusta, Barros e Hirakata (2003, BMC) e Zou (2004, AJE). A ideia, ajustar um modelo de Poisson aos dados binários, e usar um método robusto de correção de variância para estimar a incerteza dos efeitos. Usa uma equivalência matematica entre a função de verossimilhança da distribuição de Poisson com um modelo de risco proporcionais de Cox com modificação de Breslow. A variância dos estimadortes é corrigida usando um método de estimação da matriz de variâncias heterocedástico-consistente, o R tem 9(!) estimadores. O default chamado HC3, é o melhor segundo um estudo de simulação (Long & Ervin, 2000, The American Statistician) para modelos lineares. Leo Bastos (PROCC/Fiocruz) Dados binários 44 / 69

43 Regressão para dados binários Seja Y 1, Y 2,..., Y n variáveis aleatórias binárias independentes Assume-se que Y i Poisson(λ i ) onde λ i é uma taxa. Usando a função de ligação log, temos que log(λ i ) = β 0 + β 1 x 1i + + β p x pi Agora não há problema de instabilidade numérica, e a Razão de taxas para a variável X 1 pode ser estimada RR 1 = λ X 1 =1 λ X1 =0 = e β 1 Leo Bastos (PROCC/Fiocruz) Dados binários 45 / 69

44 Regressão para dados binários No R, usa-se a função glm de forma usual, em seguida corrigi-se a variância usando os pacotes lmtest e sandwich As estimativas corrigidas são obtidas com a função: coeftest( modelopoisson, vcov.=vcovhc(modelopoisson, type= HC3 ) ) onde modelopoisson é a saída do ajuste modelo de Poisson aos dados binários Uma estimativa para o risco relativo (asism como a razão de prevalência) pode ser calculada diretamente da regressão logística. Leo Bastos (PROCC/Fiocruz) Dados binários 46 / 69

45 Estimando RR diretamente da regressão logística A ideia foi proposta por Wilcosky and Chambless (1985), é funciona da seguinte maneira: O RR é essencialmente a razão das seguintes probabilidades: Na regressão logística vimos que RR 1 = P(Y = 1 X 1 = 1, X 1 = x 1 ) P(Y = 1 X 1 = 0, X 1 = x 1 ) eβ0+β1x+β2x βpx p P(Y = 1 X 1 = x, X 1 = x 1 ) = 1 + e β0+β1x+β2x βpx p Dessa forma a razão que temos interesse é: RR 1 = e β 1 + e β0+β2x βpx p e β0+β1+β2x βpx p Dessa forma, o risco relativo depende de uma variadade de coisas. Leo Bastos (PROCC/Fiocruz) Dados binários 47 / 69

46 Estimando RR diretamente da regressão logística Os efeitos de regressão β são estimados diretamente do modelo Wilcosky and Chambless (1985) proporam algumas formas para lidar com as outras covariáveis: 1 RR marginal: A ideia é calcular o risco relativo médio da amostra n RR (m) i=1 1 = P(Y = 1 X 1 = 1, X 2 = x 2i,..., X p = x pi ) n i=1 P(Y = 1 X 1 = 0, X 2 = x 2i,..., X p = x pi ) 2 RR condicional: A ideia é calcular o risco relativo para um indivíduo médio da amostra 3 Lembrando que RR (c) 1 = P(Y = 1 X 1 = 1, X 2 = x 2,..., X p = x p ) P(Y = 1 X 1 = 0, X 2 = x 2,..., X p = x p ) eβ0+β1x+β2x βpx p P(Y = 1 X 1 = x, X 2 = x2,..., X p = xp ) = 1 + e β0+β1x+β2x βpx p Leo Bastos (PROCC/Fiocruz) Dados binários 48 / 69

47 Estimando RR diretamente da regressão logística Teoria assintótica para RR (m) e RR (c) foi desenvolvida por Flanders and Rhodes (1987) Um pacote para estimar RR (m) e RR (c), e seus respectivos erro padrão e IC, está em desenvolvimento. Exemplo tirado de Barros & Hirakata (2003) Com o objetivo de avaliar a ocorrencia de baixo peso em crianças de 4-5 anos em Pelotas/RS (desfecho) por hospitalização prévia (exposição), controlado por peso ao nascer (normal ou baixo peso). Peso atual Z X Baixo peso Normal Normal Sim Não Baixo peso Sim Não Leo Bastos (PROCC/Fiocruz) Dados binários 49 / 69

48 Resultados Tabela : Prevalence ratios (PR) and respective 95% confidence interval estimates in the analysis of the data using underweight as the outcome (Y), previous hospitalization (X) as the risk factor and birth weight as control factor (Z). PR 95% CI Crude PR (1.710, 4.927) Crude POR (1.673, 5.597) Robust Poisson (1.454, 4.226) Log-binomial (1.447, 4.226) Logistic regression POR (1.481, 4.671) PR (c) X (1.471, 4.357) PR (m) X (1.451, 4.171) See more in Bastos, de Oliveira and Velasque (2015, CSP) Leo Bastos (PROCC/Fiocruz) Dados binários 50 / 69

49 GLM para amostras complexas A primeira suposição de um GLM, seja Y 1, Y 2,..., Y n desfechos independentes. Isso é equivalente a supor que a amostra observada é uma amostra aleatória simples (com reposição) ou de uma população infinita. Em muitos estudos a seleção da amostra é proveniente de um plano amostral complexo, e portanto a suposição essa suposição de AAS pode ser muito forte. Em um plano amostral probabiĺıstico, devemos ser capazes de calcular a probabilidade de cada elemento da população pertencer a amostra. Essa probabilidade é definida pelo desenho da amostra e é posteriormente usada na modelagem. Leo Bastos (PROCC/Fiocruz) Dados binários 52 / 69

50 GLM para amostras complexas A probabilidade de inclusão de cada indivíduo, π i, vai definir o peso amostral de cada indivíduo. Usualmente o peso, ω i, é o inverso da probabilidade de inclusão, mas existem correções para o peso (ex. calibração) Tipos de amostragem: 1 Aleatória simples; 2 Estratificada; 3 Por conglomerados em 1,2,3,... estágios; 4 Combinações das amostras acima. Leo Bastos (PROCC/Fiocruz) Dados binários 53 / 69

51 GLM para amostras complexas A não inclusão do desenho amostral pode causar viés nas estimativas de um modelo. Isso acontece, pois algumas observações podem ter pesos diferentes podendo distorcer a associação entre variáveis. Existem algumas maneiras distintas de incluir o desenho amostral na análise, aqui vamos olhar para o método da pseudo-verossimilhança. No método da pseudo-verossimilhança os pesos são incluídos multiplicando a função escore. Dessa forma, estimativas corrigidas para os efeitos, e principlamente, para as variâncias podem ser calculadas ao incluir os pesos e mostrar qual o plano amostral utilizado. Leo Bastos (PROCC/Fiocruz) Dados binários 54 / 69

52 GLM para amostras complexas O pacote survey do R faz isso. Referências: Analysis of Survey Data. Edited by R. L. Chambers and C. J. Skinner, John Wiley & Sons, Ltd Complex survey: A guide to analysis using R, Thomas Lumley, John Wiley & Sons, Ltd Leo Bastos (PROCC/Fiocruz) Dados binários 55 / 69

53 Exemplo API (Academic Performance Index) foi calculado para todas as escolas da California baseado no resultado padronizado de testes dos estudantes (min=200, max=1000). 200 escolas foram selecionadas segundo uma amostra estratificada por tipo de escola (Elementary/Middle/High school). População: N = População dos estratos: N E = 4421, N M = 1018, N H = 755. Variáveis de interesse: 1 Desfecho API 800; 2 ell % de English-Language learners ; 3 meals % de estudantes elegíveis a refeições subsidiadas. Leo Bastos (PROCC/Fiocruz) Dados binários 56 / 69

54 Comandos no R require(survey) data(api) des<-svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc) m1 = glm(i(api00 >= 800) ~ ell + meals, family=binomial(), data=apistrat) m2 = svyglm(i(api00 >= 800) ~ ell + meals, family=binomial(), design=des) ## Warning: non-integer #successes in a binomial glm! Leo Bastos (PROCC/Fiocruz) Dados binários 57 / 69

55 Saída GLM Modelo logístico usual ## Waiting for profiling to be done... ## Coef 2.5 % 97.5 % ## (Intercept) ## ell ## meals Modelo logístico usando o desenho amostral ## Coef 2.5 % 97.5 % ## (Intercept) ## ell ## meals Leo Bastos (PROCC/Fiocruz) Dados binários 58 / 69

56 Saída GLM Odds ratios: Aumentando em 1 unidade percentual ## Coef 2.5 % 97.5 % ## ell ## meals OR: Aumentando em 10 unidades percentuais ## Coef 2.5 % 97.5 % ## ell ## meals Leo Bastos (PROCC/Fiocruz) Dados binários 59 / 69

57 Modelos multinível Tipos de modelos multinível: Modelo usual: Y ij = α + βx ij onde Y ij é a nota final do aluno i da escola j, e X ij é sua nota de entrada. Modelo com intercepto variando: Modelo com coeficiente variando: Y ij = α j + βx ij Y ij = α + β j X ij Modelo com intercepto e coeficiente variando: Y ij = α j + β j X ij Leo Bastos (PROCC/Fiocruz) Dados binários 61 / 69

58 Modelos multinível - Exemplo Belenky et al. (2003). Sleep restriction study Journal of Sleep Research, 12, voluntários foram submetidos a 7 dias de privação de sono (apenas 3 horas de sono por noite), seguidos de 3 dias com 8 horas de sono. Em cada dia, um teste de vigilância psicomotora (PVT) era realizado e o tempo de reação (em ms) registrado. The PVT measures simple reaction time to a visual stimulus, presented approximately 10 times/minute (interstimulus interval varied from 2 to 10 s in 2-s increments) for 10 min and implemented in a thumb-operated, hand-held device. Leo Bastos (PROCC/Fiocruz) Dados binários 62 / 69

59 Visualizando dados Data from Belenky et al. (2003) Average reaction time (ms) Days of sleep deprivation Leo Bastos (PROCC/Fiocruz) Dados binários 63 / 69

60 Ajustando os modelos # Fixed fm0 <- lm(reaction ~ Days, sleepstudy) # Multilevel - varying intercept fm1 <- lmer(reaction ~ 0 + Days + (1 Subject), sleepstudy) # Multilevel - varying coefficient fm2 <- lmer(reaction ~ 1 + (0+Days Subject), sleepstudy) # Multilevel - varying both fm3 <- lmer(reaction ~ (Days Subject), sleepstudy) Leo Bastos (PROCC/Fiocruz) Dados binários 64 / 69

61 Modelos ajustados Fixed intercept and coefficent Average reaction time (ms) Days of sleep deprivation Leo Bastos (PROCC/Fiocruz) Dados binários 65 / 69

62 Modelos ajustados Varying intercept Average reaction time (ms) Days of sleep deprivation Leo Bastos (PROCC/Fiocruz) Dados binários 66 / 69

63 Modelos ajustados Varying coefficient Average reaction time (ms) Days of sleep deprivation Leo Bastos (PROCC/Fiocruz) Dados binários 67 / 69

64 Modelos ajustados Varying both Average reaction time (ms) Days of sleep deprivation Leo Bastos (PROCC/Fiocruz) Dados binários 68 / 69

65 Concluindo Os dados e objetivos em análises epidemiológicas geralmente não são simples. Existe modelagem adequada para a maioria dos problemas, modelos lineares e modelos lineares generalizados são apenas a base ponta do iceberg. Duvidas, elogios, críticas, sugestões, ameaças: lsbastos@fiocruz.br Leo Bastos (PROCC/Fiocruz) Dados binários 69 / 69

1 AULA 5 - REGRESSÃO LOGÍSTICA BINOMIAL

1 AULA 5 - REGRESSÃO LOGÍSTICA BINOMIAL 1 AULA 5 - REGRESSÃO LOGÍSTICA BINOMIAL 1.1 Tabela de contingência A base de dados que vamos utilizar são os dados do estudo caso-controle em que os casos foram mulheres com infertilidade e os controles,

Leia mais

Lista 1 - Gabarito. Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados. 29 de Abril. f(y i, θ i ) = θ i exp( yiθ i ).

Lista 1 - Gabarito. Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados. 29 de Abril. f(y i, θ i ) = θ i exp( yiθ i ). Lista 1 - Gabarito Prof. Erica Castilho Rodrigues Disciplina: Modelos Lineares Generalizados 29 de Abril 1. (Concurso Petrobrás - 2011) Em um modelo de regressão logística, o que indica se o modelo se

Leia mais

Modelos para dados de contagem

Modelos para dados de contagem O modelo de Poisson Sumário 1 Introdução 2 Regressão de Poisson Taxa de Incidência Inclusão de covariáveis Interpretação dos parâmetros 3 Exemplos 4 Superdispersão Dados de Contagem Podemos estar interessados

Leia mais

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência Erica Castilho Rodrigues 12 de Agosto Introdução 3 Vimos como usar Poisson para testar independência em uma Tabela 2x2.

Leia mais

Cap 7 Modelo de Cox. Outline. 2 Cap 2 O tempo. 3 Cap 3 Funções de Sobrevida. 5 Modelo de Cox. Carvalho MS (2009) Sobrevida 1 / 22

Cap 7 Modelo de Cox. Outline. 2 Cap 2 O tempo. 3 Cap 3 Funções de Sobrevida. 5 Modelo de Cox. Carvalho MS (2009) Sobrevida 1 / 22 Outline Cap 7 Modelo de Cox 1 Cap 1 Introdução 2 Cap 2 O tempo 3 Cap 3 Funções de Sobrevida 4 Cap 4 Não-Paramétrica 5 Modelo de Cox Carvalho MS (2009) Sobrevida 1 / 22 Riscos Proporcionais Cap 7 Modelo

Leia mais

Análise de Sobrevivência

Análise de Sobrevivência Análise de Sobrevivência Modelagem paramétrica Valeska Andreozzi 1 valeska.andreozzi@fc.ul.pt & Marilia Sá Carvalho 2 cavalho@fiocruz.br 1 Centro de Estatística e Aplicações da Universidade de Lisboa,

Leia mais

Modelos Lineares Generalizados - Regressão Logística

Modelos Lineares Generalizados - Regressão Logística Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 26 de Maio de 2014 AIC 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos de modelo. Mede

Leia mais

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 21 de Junho de 2013 3 Uma outra medida usada para verificar o ajuste do modelo. Essa estatística é dada por X

Leia mais

Exemplos Modelos Binomiais de Dose-Resposta

Exemplos Modelos Binomiais de Dose-Resposta Exemplos Modelos Binomiais de Dose-Resposta p. 1/14 Exemplos Modelos Binomiais de Dose-Resposta Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre

Leia mais

Modelo de Variáveis discretas. Regressão com uma variável dependente Binária. Variáveis dependentes Binárias. Modelo de Probabilidade Linear

Modelo de Variáveis discretas. Regressão com uma variável dependente Binária. Variáveis dependentes Binárias. Modelo de Probabilidade Linear Regressão com uma variável dependente Binária Capítulo 9 Stock e Watson. Econometria. Modelo de Variáveis discretas P(y = 1 x) = G(β 0 + xβ) y* = β 0 + xβ + u, y = max(0,y*) 1 2 Variáveis dependentes Binárias

Leia mais

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47 CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................

Leia mais

TÉCNICAS DE AMOSTRAGEM

TÉCNICAS DE AMOSTRAGEM TÉCNICAS DE AMOSTRAGEM Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Definições e Notação Estimação Amostra Aleatória

Leia mais

Modelos de Análise de Sobrevivência

Modelos de Análise de Sobrevivência 1 Modelos de Análise de Sobrevivência Ernesto F. L. Amaral Magna M. Inácio 02 de dezembro de 2010 Tópicos Especiais em Teoria e Análise Política: Problema de Desenho e Análise Empírica (DCP 859B4) TAXA

Leia mais

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja: Pessoal, trago a vocês a resolução da prova de Estatística do concurso para Auditor Fiscal aplicada pela FCC. Foram 10 questões de estatística! Não identifiquei possibilidade para recursos. Considero a

Leia mais

A Importância do Desenho Amostral. Donald Pianto Departamento de Estatística UnB

A Importância do Desenho Amostral. Donald Pianto Departamento de Estatística UnB A Importância do Desenho Amostral Donald Pianto Departamento de Estatística UnB Objetivo dessa aula Explicar os tipos básicos de amostragem e a razão pelo uso de cada um Contemplar o uso simultaneo de

Leia mais

Modelo de Regressão de Cox

Modelo de Regressão de Cox MAE 514 - à Análise de Sobrevivência e Aplicações O modelo de Cox com taxas de falhas proporcionais MAE 514 - à Análise de Sobrevivência e Aplicações IME-USP MAE 514 - à Análise de Sobrevivência e Aplicações

Leia mais

Modelos de regressão para dados correlacionados. Cibele Russo

Modelos de regressão para dados correlacionados. Cibele Russo Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo

Leia mais

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos

Aula 2. ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos Aula 2 ESTATÍSTICA E TEORIA DAS PROBABILIDADES Conceitos Básicos 1. DEFINIÇÕES FENÔMENO Toda modificação que se processa nos corpos pela ação de agentes físicos ou químicos. 2. Tudo o que pode ser percebido

Leia mais

4 Modelos Lineares Generalizados

4 Modelos Lineares Generalizados 4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da

Leia mais

Técnicas econométricas para avaliação de impacto O uso de algoritmos de emparelhamento baseados em escore de propensão propensity score matching

Técnicas econométricas para avaliação de impacto O uso de algoritmos de emparelhamento baseados em escore de propensão propensity score matching Técnicas econométricas para avaliação de impacto O uso de algoritmos de emparelhamento baseados em escore de propensão propensity score matching Bruno César Araújo Instituto de Pesquisa Econômica Aplicada

Leia mais

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,

Leia mais

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Experimentos Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Experimentos Agora,

Leia mais

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso MEDIDAS DE POSIÇÃO E DE DISPERSÃO Profª Andréa H Dâmaso Bioestatística e Delineamento Experimental - 2012 Tópicos da aula Medidas de tendência central e dispersão Variáveis contínuas: distribuição normal

Leia mais

Teste F-parcial 1 / 16

Teste F-parcial 1 / 16 Teste F-parcial Ingredientes A hipótese nula, H 0, define o modelo restrito. A hipótese alternativa, H a : H 0 é falsa, define o modelo irrestrito. SQR r : soma de quadrado dos resíduos associada à estimação

Leia mais

Modelo de regressão estável aplicado a econometria

Modelo de regressão estável aplicado a econometria Modelo de regressão estável aplicado a econometria financeira Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br 1 Objetivos

Leia mais

Exemplos Modelos de Quase-Verossimilhança

Exemplos Modelos de Quase-Verossimilhança Exemplos Modelos de Quase-Verossimilhança p. 1/40 Exemplos Modelos de Quase-Verossimilhança Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de

Leia mais

Regressão Logística. Propriedades

Regressão Logística. Propriedades Regressão Logística Propriedades Geralmente a grande questão a ser respondida nos estudos epidemiológicos é saber qual a relação entre uma ou mais variáveis que refletem a exposição e a doença (efeito).

Leia mais

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. 1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3

Leia mais

TÉCNICAS DE AMOSTRAGEM

TÉCNICAS DE AMOSTRAGEM TÉCNICAS DE AMOSTRAGEM Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Teorema Central do Limite (TCL) Se y 1, y 2,...,

Leia mais

ANÁLISE DE SOBREVIVÊNCIA. Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP

ANÁLISE DE SOBREVIVÊNCIA. Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP ANÁLISE DE SOBREVIVÊNCIA Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP Objetivo Estudar o tempo desde um instante inicial até a ocorrência de um evento (alha). Estudar o tempo de sobrevida de

Leia mais

Conceito de Estatística

Conceito de Estatística Conceito de Estatística Estatística Técnicas destinadas ao estudo quantitativo de fenômenos coletivos, observáveis. Unidade Estatística um fenômeno individual é uma unidade no conjunto que irá constituir

Leia mais

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016. de Matemática Financeira e Estatística do ISS Teresina, aplicada em 8/08/016. 11 - (ISS Teresina 016 / FCC) Joana aplicou todo seu capital, durante 6 meses, em bancos ( e Y). No Banco, ela aplicou 37,5%

Leia mais

Econometria Aplicada com uso do R

Econometria Aplicada com uso do R Econometria Aplicada com uso do R Alexandre Rodrigues Loures Universidade Federal da Paraíba Centro de Ciências Sociais Aplicadas Programa de Pós-Graduação em Economia 10 de maio de 2015 LOURES, A. R.

Leia mais

AULAS 14 E 15 Modelo de regressão simples

AULAS 14 E 15 Modelo de regressão simples 1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 18 e 23 de outubro de 2012 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem

Leia mais

Distribuições derivadas da distribuição Normal. Distribuição Normal., x real.

Distribuições derivadas da distribuição Normal. Distribuição Normal., x real. Distribuições derivadas da distribuição Normal Distribuição Normal Uma variável aleatória X tem distribuição normal com parâmetros µ e σ, quando sua densidade de probabilidade é f ( x) π σ e ( x µ ) σ,

Leia mais

Dimensionamento de ensaios de não inferioridade para o caso de grupos paralelos e resposta binária: algumas comparações

Dimensionamento de ensaios de não inferioridade para o caso de grupos paralelos e resposta binária: algumas comparações Dimensionamento de ensaios de não inferioridade para o caso de grupos paralelos e resposta binária: algumas comparações Introdução Arminda Lucia Siqueira Dimensionamento de amostras, importante elemento

Leia mais

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva http://páginapessoal.utfpr.edu.br/ngsilva Estimação de Parâmetros Intervalo de Confiança Introdução A inferência estatística é o processo

Leia mais

6. Amostragem e estimação pontual

6. Amostragem e estimação pontual 6. Amostragem e estimação pontual Definição 6.1: População é um conjunto cujos elementos possuem qualquer característica em comum. Definição 6.2: Amostra é um subconjunto da população. Exemplo 6.1: Um

Leia mais

Testes de raiz unitária

Testes de raiz unitária Testes de raiz unitária Avaliando estacionariedade em séries temporais financeiras Wilson Freitas Quant Developer Recursos index.rmd 2/20 Testes de Raiz Unitária Definição do teste de raiz unitária Existem

Leia mais

Estatística II Aula 2. Prof.: Patricia Maria Bortolon, D. Sc.

Estatística II Aula 2. Prof.: Patricia Maria Bortolon, D. Sc. Estatística II Aula Prof.: Patricia Maria Bortolon, D. Sc. Distribuições Amostrais ... vocês lembram que: Antes de tudo... Estatística Parâmetro Amostra População E usamos estatíticas das amostras para

Leia mais

AULA 02 Distribuição de Probabilidade Normal

AULA 02 Distribuição de Probabilidade Normal 1 AULA 02 Distribuição de Probabilidade Normal Ernesto F. L. Amaral 20 de agosto de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario

Leia mais

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5 MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão

Leia mais

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação Capítulo 3 O Modelo de Regressão Linear Simples: Especificação e Estimação Introdução Teoria Econômica Microeconomia: Estudamos modelos de oferta e demanda (quantidades demandadas e oferecidas dependem

Leia mais

Intervalos Estatísticos para uma única Amostra - parte I

Intervalos Estatísticos para uma única Amostra - parte I Intervalos Estatísticos para uma única Amostra - parte I Intervalo de confiança para média 14 de Janeiro Objetivos Ao final deste capítulo você deve ser capaz de: Construir intervalos de confiança para

Leia mais

P. P. G. em Agricultura de Precisão DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)

P. P. G. em Agricultura de Precisão DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Amostragem: Em pesquisas científicas, quando se deseja conhecer características de uma população, é comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa amostra, obter

Leia mais

Estatística I Aula 8. Prof.: Patricia Maria Bortolon, D. Sc.

Estatística I Aula 8. Prof.: Patricia Maria Bortolon, D. Sc. Estatística I Aula 8 Prof.: Patricia Maria Bortolon, D. Sc. MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS CONTÍNUAS Lembram o que vimos sobre V.A. contínua na Aula 6? Definição: uma variável

Leia mais

Precificação de apartamentos para o bairro Água Verde em Curitiba

Precificação de apartamentos para o bairro Água Verde em Curitiba Precificação de apartamentos para o bairro Água Verde em Curitiba Chuck Norris Arnold Schwarzenegger 18 de julho de 2013 O preço de imóveis depende principalmente do seu tamanho e localização. A infraestrutura

Leia mais

Estatística para Cursos de Engenharia e Informática

Estatística para Cursos de Engenharia e Informática Estatística para Cursos de Engenharia e Informática BARBETTA, Pedro Alberto REIS, Marcelo Menezes BORNIA, Antonio Cezar MUDANÇAS E CORREÇOES DA ª EDIÇÃO p. 03, após expressão 4.9: P( A B) = P( B A) p.

Leia mais

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA UFPE - Universidade Federal de Pernambuco Departamento de Estatística Disciplina: ET-406 Estatística Econômica Professor: Waldemar A. de Santa Cruz Oliveira Júnior INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Podemos

Leia mais

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas 1 AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas Ernesto F. L. Amaral 07 e 09 de dezembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Wooldridge, Jeffrey M. Introdução à

Leia mais

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral. DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíveis resultados de um experimento. Evento é qualquer subconjunto do espaço amostral. Evento combinado: Possui duas

Leia mais

GAM. Ilka Afonso Reis

GAM. Ilka Afonso Reis GAM Ilka Afonso Reis Modelo Estatístico O objetivo de um modelo estatístico é fornecer a base matemática para responder às seguintes questões: As variáveis preditoras/explicativas explicam adequadamente

Leia mais

Análise de Dados e Simulação

Análise de Dados e Simulação Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco Simulação de Variáveis Aleatórias Contínuas. O método da Transformada Inversa Teorema Seja U U (0,1). Para qualquer

Leia mais

Assume que a taxa de risco (hazard rate) é função das variáveis independentes (covariáveis)

Assume que a taxa de risco (hazard rate) é função das variáveis independentes (covariáveis) MODELO DE RISCO PROPORCIONAL DE COX Uma escolha popular para relacionar a função hazard e um determinado número de covariáveis consiste no modelo de Cox. A função de risco h (t) (hazard function) também

Leia mais

AMOSTRAGEM. É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas.

AMOSTRAGEM. É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas. AMOSTRAGEM É a parte da Teoria Estatística que define os procedimentos para os planejamentos amostrais e as técnicas de estimação utilizadas. Nos planejamentos amostrais, a coleta dos dados deve ser realizada

Leia mais

ESTUDOS DE COORTE. Baixo Peso Peso Normal Total Mãe usuária de cocaína

ESTUDOS DE COORTE. Baixo Peso Peso Normal Total Mãe usuária de cocaína UNIVERSIDADE FEDERAL DO RIO DE JANEIRO CENTRO DE CIÊNCIAS DA SAÚDE FACULDADE DE MEDICINA DEPARTAMENTO DE MEDICINA PREVENTIVA DISCIPLINA DE EPIDEMIOLOGIA ESTUDOS DE COORTE 1) Com o objetivo de investigar

Leia mais

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA) 1. Sabe-se que o nível de significância é a probabilidade de cometermos um determinado tipo de erro quando da realização de um teste de hipóteses. Então: a) A escolha ideal seria um nível de significância

Leia mais

Introdução à Inferência Estatística

Introdução à Inferência Estatística Introdução à Inferência Estatística Capítulo 10, Estatística Básica (Bussab&Morettin, 7a Edição) 2a AULA 02/03/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 2a aula (02/03/2015) MAE229 1 / 16

Leia mais

O que é população? O que é amostra? Curso de Bacharelado em Educação Física e Saúde

O que é população? O que é amostra? Curso de Bacharelado em Educação Física e Saúde Curso de Bacharelado em Educação Física e Saúde Disciplina de Epidemiologia da Atividade Física Prof. Alex Antonio Florindo Prof. Douglas Andrade População e amostra O que é população e amostra; Tipos

Leia mais

TÉCNICAS DE AMOSTRAGEM

TÉCNICAS DE AMOSTRAGEM TÉCNICAS DE AMOSTRAGEM Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Amostragem estratificada Divisão da população em

Leia mais

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística Introdução ao Planejamento e Análise Estatística de Capítulo 3 Introdução à Probabilidade e à Inferência Estatística INTERVALOS DE CONFIANÇA: Diferentes pesquisadores, selecionando amostras de uma mesma

Leia mais

Noções de Simulação. Ciências Contábeis - FEA - Noturno. 2 o Semestre MAE0219 (IME-USP) Noções de Simulação 2 o Semestre / 23

Noções de Simulação. Ciências Contábeis - FEA - Noturno. 2 o Semestre MAE0219 (IME-USP) Noções de Simulação 2 o Semestre / 23 Noções de Simulação Ciências Contábeis - FEA - Noturno 2 o Semestre 2013 MAE0219 (IME-USP) Noções de Simulação 2 o Semestre 2013 1 / 23 Objetivos da Aula Sumário 1 Objetivos da Aula 2 Motivação 3 Geração

Leia mais

ICMS/PE 2014 Resolução da Prova de Estatística Professor Fábio Amorim. ICMS PE 2014: Resolução da prova de Estatística Prof.

ICMS/PE 2014 Resolução da Prova de Estatística Professor Fábio Amorim. ICMS PE 2014: Resolução da prova de Estatística Prof. ICMS/PE 2014 Resolução da Prova de Estatística Professor Fábio Amorim 1 de 6 Pessoal, segue a resolução das questões de Estatística da prova realizada pela SEFAZ-PE, para o cargo de Auditor Fiscal do Tesouro

Leia mais

MEEMF-2010 Aula 01. Noções de inferência estatística: Diferença entre máxima verossimilhança e abordagem bayesiana

MEEMF-2010 Aula 01. Noções de inferência estatística: Diferença entre máxima verossimilhança e abordagem bayesiana MEEMF-2010 Aula 01 Noções de inferência estatística: Diferença entre máxima verossimilhança e abordagem bayesiana O que é inferência estatística? Inferência estatística é o importante ramo da Estatística

Leia mais

FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES

FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES 1 Os modelos lineares generalizados, propostos originalmente em Nelder e Wedderburn (1972), configuram etensões dos modelos lineares clássicos e permitem analisar a

Leia mais

Exemplo Regressão Binomial Dados Emparelhados

Exemplo Regressão Binomial Dados Emparelhados Exemplo Regressão Binomial Dados Emparelhados Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2013 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre

Leia mais

VALIDADE EM ESTUDOS EPIDEMIOLÓGICOS

VALIDADE EM ESTUDOS EPIDEMIOLÓGICOS UNIVERSIDADE FEDERAL DO RIO DE JANEIRO CENTRO DE CIÊNCIAS DA SAÚDE FACULDADE DE MEDICINA -DEPARTAMENTO DE MEDICINA PREVENTIVA NÚCLEO DE ESTUDOS EM SAÚDE COLETIVA DISCIPLINA DE EPIDEMIOLOGIA 1º semestre

Leia mais

Centro Internacional de Pobreza (PNUD/IPEA) Fabio Veras Soares. Estimação do Impacto de Múltiplos Tratamentos e do. Escore de Propensão Generalizado

Centro Internacional de Pobreza (PNUD/IPEA) Fabio Veras Soares. Estimação do Impacto de Múltiplos Tratamentos e do. Escore de Propensão Generalizado Estimação do Impacto de Múltiplos Tratamentos e do Efeito Dosagem: Escore de Propensão Generalizado Fabio Veras Soares Centro Internacional de Pobreza (PNUD/IPEA) Vimos nas aulas anteriores que o escore

Leia mais

Estatística Descritiva

Estatística Descritiva C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística

Leia mais

Variáveis Aleatórias Contínuas e Distribuição de Probabilidad

Variáveis Aleatórias Contínuas e Distribuição de Probabilidad Variáveis Aleatórias Contínuas e Distribuição de Probabilidades - parte III 23 de Abril de 2012 Introdução Objetivos Ao final deste capítulo você deve ser capaz de: Calcular probabilidades aproximadas

Leia mais

1 Introdução aos Métodos Estatísticos para Geografia 1

1 Introdução aos Métodos Estatísticos para Geografia 1 1 Introdução aos Métodos Estatísticos para Geografia 1 1.1 Introdução 1 1.2 O método científico 2 1.3 Abordagens exploratória e confirmatória na geografia 4 1.4 Probabilidade e estatística 4 1.4.1 Probabilidade

Leia mais

Pesquisa Operacional II. Professor: Roberto César

Pesquisa Operacional II. Professor: Roberto César Pesquisa Operacional II Professor: Roberto César POPULAÇÃO E AMOSTRA População: refere-se ao grupo total. Amostra: é toda fração obtida de uma população (independente de seu tamanho). Quando usar Amostragem?

Leia mais

Aspectos metodológicos de pesquisas domiciliares por amostra

Aspectos metodológicos de pesquisas domiciliares por amostra DPE DIRETORIA DE PESQUISAS COREN COORDENAÇÃO DE TRABALHO E RENDIMENTO Aspectos metodológicos de pesquisas domiciliares por amostra 06/05/11 Censo x pesquisas por amostra Censo: investiga todos os elementos

Leia mais

Patrício Costa. Escola de Ciências da Saúde Universidade do Minho

Patrício Costa. Escola de Ciências da Saúde Universidade do Minho Patrício Costa Escola de Ciências da Saúde Universidade do Minho Teoria Hipóteses Operacionalização de conceitos Selecção de inquiridos ou sujeitos Plano de investigação: observacional / Inquérito Condução

Leia mais

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva Inferência Estatística: Prof.: Spencer Barbosa da Silva Amostragem Estatística Descritiva Cálculo de Probabilidade Inferência Estatística Estimação Teste de Hipótese Pontual Por Intervalo Conceitos básicos

Leia mais

M l u t l i t c i oli l n i e n arid i a d de

M l u t l i t c i oli l n i e n arid i a d de Multicolinearidade 1 Multicolinearidade Quando existem relação linear exata entre as variáveis independentes será impossível calcular os estimadores de MQO. O procedimento MQO utilizado para estimação

Leia mais

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO:

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO: INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 Estudos de Mercado EXAME: DATA 24 / 02 / 20010 NOME DO ALUNO: Nº INFORMÁTICO: TURMA: PÁG. 1_ PROFESSOR: ÉPOCA: Grupo I (10

Leia mais

CAPÍTULO 3 POPULAÇÃO E AMOSTRA

CAPÍTULO 3 POPULAÇÃO E AMOSTRA DEPARTAMENTO DE GEOCIÊNCIAS GCN 7901 ANÁLISE ESTATÍSTICA EM GEOCIÊNCIAS PROFESSOR: Dr. ALBERTO FRANKE CONTATO: alberto.franke@ufsc.br F: 3721 8595 CAPÍTULO 3 POPULAÇÃO E AMOSTRA As pesquisas de opinião

Leia mais

Modelos Lineares Distribuições de Probabilidades Distribuição Normal Teorema Central do Limite. Professora Ariane Ferreira

Modelos Lineares Distribuições de Probabilidades Distribuição Normal Teorema Central do Limite. Professora Ariane Ferreira Distribuições de Probabilidades Distribuição Normal Teorema Central do Limite Professora Ariane Ferreira Modelos Probabilísticos de v.a. continuas Distribuição de Probabilidades 2 IPRJ UERJ Ariane Ferreira

Leia mais

Inferência Estatística: Conceitos Básicos II

Inferência Estatística: Conceitos Básicos II Inferência Estatística: Conceitos Básicos II Distribuição Amostral e Teorema do Limite Central Análise Exploratória de dados no SPSS Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação

Leia mais

AULA 07 Inferência a Partir de Duas Amostras

AULA 07 Inferência a Partir de Duas Amostras 1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia Métodos Estatísticos Avançados em Epidemiologia Análise de Sobrevivência - Conceitos Básicos Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/

Leia mais

Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine)

Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine) Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine) Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 6-1 Objetivos: Neste capítulo, você aprenderá:

Leia mais

5 MEDIDAS DE RISCO 5.1 INTRODUÇÃO

5 MEDIDAS DE RISCO 5.1 INTRODUÇÃO 5 MEDIDAS DE RISCO 5.1 INTRODUÇÃO Neste capítulo, são apresentadas as medidas de risco usadas no setor elétrico e em finanças, analisando as propriedades da definição de medida de risco coerente [30].

Leia mais

Licenciatura em Ciências Biológicas Universidade Federal de Goiás. Bioestatística. Prof. Thiago Rangel - Dep. Ecologia ICB

Licenciatura em Ciências Biológicas Universidade Federal de Goiás. Bioestatística. Prof. Thiago Rangel - Dep. Ecologia ICB Licenciatura em Ciências Biológicas Universidade Federal de Goiás Bioestatística Prof. Thiago Rangel - Dep. Ecologia ICB rangel.ufg@gmail.com Página do curso: http://www.ecologia.ufrgs.br/~adrimelo/bioestat

Leia mais

AULAS 25 E 26 Heteroscedasticidade

AULAS 25 E 26 Heteroscedasticidade 1 AULAS 25 E 26 Heteroscedasticidade Ernesto F. L. Amaral 10 e 15 de junho de 2010 Métodos Quantitativos de Avaliação de Políticas Públicas (DCP 030D) Fonte: Wooldridge, Jeffrey M. Introdução à econometria:

Leia mais

IND 1115 Inferência Estatística Aula 6

IND 1115 Inferência Estatística Aula 6 Conteúdo IND 5 Inferência Estatística Aula 6 Setembro de 004 A distribuição Lognormal A distribuição Beta e sua relação com a Uniforme(0,) Mônica Barros mbarros.com mbarros.com A distribuição Lognormal

Leia mais

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013 Análise da Regressão múltipla: Inferência Revisão da graduação Aula 4 6 de maio de 2013 Hipóteses do modelo linear clássico (MLC) Sabemos que, dadas as hipóteses de Gauss- Markov, MQO é BLUE. Para realizarmos

Leia mais

Distribuição Amostral e Estimação Pontual de Parâmetros

Distribuição Amostral e Estimação Pontual de Parâmetros Roteiro Distribuição Amostral e Estimação Pontual de Parâmetros 1. Introdução 2. Teorema Central do Limite 3. Conceitos de Estimação Pontual 4. Métodos de Estimação Pontual 5. Referências População e Amostra

Leia mais

Avaliação e Desempenho Aula 18

Avaliação e Desempenho Aula 18 Avaliação e Desempenho Aula 18 Aula passada Fila com buffer finito Fila com buffer infinito Medidas de interesse: vazão, número médio de clientes na fila, taxa de perda. Aula de hoje Parâmetros de uma

Leia mais

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc. ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc. Cap. 10 Multicolinearidade: o que acontece se os regressores são correlacionados? Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. Rio de Janeiro.

Leia mais

PARTE TEÓRICA Perguntas de escolha múltipla

PARTE TEÓRICA Perguntas de escolha múltipla PROBABILIDADES E ESTATÍSTICA MIEEC/FEUP PARTE TEÓRICA Perguntas de escolha múltipla 1 Dada a experiência aleatória ε define-se espaço amostral associado a ε como sendo: A O espaço físico onde se realiza

Leia mais

Intervalos de Confiança

Intervalos de Confiança Intervalos de Confiança Carla Henriques e Nuno Bastos Departamento de Matemática Escola Superior de Tecnologia de Viseu Carla Henriques e Nuno Bastos (DepMAT) Intervalos de Confiança 2010/2011 1 / 33 Introdução

Leia mais

Fernando de Pol Mayer

Fernando de Pol Mayer Fernando de Pol Mayer Laboratório de Estatística e Geoinformação (LEG) Departamento de Estatística (DEST) Universidade Federal do Paraná (UFPR) Este conteúdo está disponível por meio da Licença Creative

Leia mais

Princípios de Bioestatística

Princípios de Bioestatística Princípios de Bioestatística Cálculo do Tamanho de Amostra Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Depto. Estatística - ICEx - UFMG 1 / 32 2 / 32 Cálculo do Tamanho de Amostra Parte fundamental

Leia mais

ANOVA - parte I Conceitos Básicos

ANOVA - parte I Conceitos Básicos ANOVA - parte I Conceitos Básicos Erica Castilho Rodrigues 9 de Agosto de 2011 Referências: Noções de Probabilidade e Estatística - Pedroso e Lima (Capítulo 11). Textos avulsos. Introdução 3 Introdução

Leia mais

Vetor de Variáveis Aleatórias

Vetor de Variáveis Aleatórias Vetor de Variáveis Aleatórias Luis Henrique Assumpção Lolis 25 de junho de 2013 Luis Henrique Assumpção Lolis Vetor de Variáveis Aleatórias 1 Conteúdo 1 Vetor de Variáveis Aleatórias 2 Função de Várias

Leia mais

UNIVERSIDADE FEDERAL DO RIO GRANDE Instituto de Matemática, Estatística e Física Programa de Pós-Graduação em Modelagem Computacional

UNIVERSIDADE FEDERAL DO RIO GRANDE Instituto de Matemática, Estatística e Física Programa de Pós-Graduação em Modelagem Computacional UNIVERSIDADE FEDERAL DO RIO GRANDE Instituto de Matemática, Estatística e Física Programa de Pós-Graduação em Modelagem Computacional MINICURSO DE CORRELAÇÃO, REGRESSÃO LINEAR SIMPLES E ANOVA Ministrantes:

Leia mais

RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA

RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA Caro aluno, Disponibilizo abaixo a resolução resumida das questões de Estatística da prova de Auditor da SEFAZ/PI 2015. Vale dizer que utilizei a numeração da prova

Leia mais

APONTAMENTOS DE SPSS

APONTAMENTOS DE SPSS Instituto de Ciências Biomédicas de Abel Salazar APONTAMENTOS DE SPSS Rui Magalhães 2010-1 - - 2 - Menu DATA Opção SPLIT FILE Permite dividir, de uma forma virtual, o ficheiro em diferentes ficheiros com

Leia mais