SELEÇÃO DE VARIÁVEIS
|
|
- Pedro Henrique Belmonte Estrela
- 5 Há anos
- Visualizações:
Transcrição
1 SELEÇÃO DE VARIÁVEIS objetivo incluir tantas covariáveis quantas forem necessárias para auxiliar na predição do modelo? (1) buscar o menor subconjunto de covariáveis capaz de explicar adequadamente a variação de Y? (2) (1) incluir um grande número de covariáveis gera sérios problemas como interpretação complexa dos resultados (2) princípio de parcimônia
2 As vezes é possível fazer uma TRIAGEM INICIAL, eliminando algumas variáveis antes da análise de regressão, se: não são fundamentais para o estudo são afetadas por grandes erros de medida são redundantes com outra variável * mesmo depois da triagem inicial, poderá ainda ser relevante testar a significância do efeito isolado de cada covariável, uma a uma se o efeito não for significativo (p-valor > 0,30) no MRLS, a variável pode ser desconsiderada para o MRLM
3 Por que fazer SELEÇÃO DE VARIÁVEIS? para reduzir ainda mais o número de covariáveis no modelo, excluindo aquelas com pequena contribuição para o MRLM Como medir contribuição? há vários tipos de medidas de contribuição, denominadas: Critérios para seleção de variáveis
4 Critérios para seleção de variáveis PARTE I Comparar MRLM s com p covariáveis (p = 1, 2,, k) número de covariáveis disponíveis objetivo escolher o modelo mais adequado entre todos os modelos com p covariáveis Portanto, de acordo com o critério de seleção haverá: o modelo mais adequado com 1 covariável o modelo mais adequado com 2 covariáveis o modelo mais adequado com (k - 1) covariáveis só há um único modelo com k covariáveis
5 1) Coeficiente de determinação múltiplo para um modelo com p covariáveis 2 R m( p) = SQReg( p) SQT SQReg ( p ) : soma de quadrados da regressão para modelo com p covariáveis entre os modelos com p covariáveis, preferir modelo com maior 2 R m( p) Alternativamente, SQRes do modelo com p covariáveis 2 R m( p) SQRes( p) = 1 SQT
6 2) Coeficiente de determinação ajustado para um modelo com p covariáveis 2 SQRes( p)/(n p 1) R a( p) =1 SQT/(n 1) entre os modelos com p covariáveis, preferir modelo com maior 2 R a ( p) 3) Quadrado médio dos resíduos para um modelo com p covariáveis SQRes( p) QMRes( p)= (n p 1) entre os modelos com p covariáveis, preferir modelo com menor QMRes ( p )
7 4) Estatística C p de Mallows C p = SQRes( p) QMRes n + 2( p+1) QMRes do modelo com todas as covariáveis disponíveis resultado teórico: modelo com p covariáveis é bom se E(C p ) p+1 então, entre os modelos com p covariáveis, preferir modelo com C p mais próximo de ( p + 1)
8 ideia do resultado teórico: C p está baseado no Erro Quadrático Médio (EQM) dos preditos EQM de ^θ, estimador de θ: EQM(^θ)=b 2 ( ^θ) Var ( ^θ), com b( ^θ)=e (θ ^θ) vício EQM de ^y i : EQM( ^y i )=[E ( y i ^y )] 2 i Var ( ^y i ) ; i=1,2,,n EQM total padronizado de ^y i : τ p = 1 n σ 2 i=1 *um estimador de τ p é C p {[ E ( y i ^y i )] 2 Var ( ^y i )}
9 o modelo com p covariáveis é bom se: E( QMRes( p) ) QMRes 1 E ( SQRes( p)/(n p 1) QMRes ) 1 E ( SQRes( p) QMRes ) n p 1=n ( p+1) somando 2( p + 1) n em ambos os lados da igualdade E ( SQRes( p) QMRes n+2( p+1) ) p+1 C p
10 PROBLEMA adotando um dos critérios das PARTE I, teremos, no final, k modelos adequados Como escolher um dos k modelos adequados? usar o princípio de parcimônia (escolher o modelo, a partir do qual, o valor do critério varia muito pouco quando inclui mais uma covariável) usar o conhecimento específico da área *talvez facilite gráfico: (p = 1, 2,, k) p valor do critério para o modelo mais adequado entre aqueles com p covariáveis Por exemplo: regra prática para a Estatística C p de Mallows calcular C p para todas os possíveis MRLM s construir gráfico de ( p + 1) contra C p, traçando a reta C p = p + 1 preferir o modelo com menor C p mais próximo da reta
11 ILUSTRAÇÃO - Gráfico de Cp por (p + 1)
12 Critérios para seleção de variáveis - PARTE II Comparar todos os possíveis MRLM s * os critérios da PARTE II tem a vantagem de, no final, eleger um só modelo adequado 1) Critério de Akaike AIC= 2 ln(l )+2 p l é o valor máximo da função de verossimilhança; e, neste caso, p é o número de coeficientes no modelo de regressão preferir modelo com menor AIC
13 *AIC pode ser usado também para comparar diferentes tipos de modelos!!! por exemplo: comparar um MRLM com um modelo de regressão não linear; ou com um modelo linear generalizado Pode ser mostrado que no MRLM: AIC=n ln ( SQRes n ) + 2 p
14 2) p-valor da ANOVA com modelos encaixados e q = 1 regra prática: estabelecer um ponto de corte para o p-valor, a fim de incluir mais covariáveis ao modelo nulo preferir o modelo que não permite incluir mais nenhuma covariável ou estabelecer um ponto de corte para o p-valor, a fim de excluir covariáveis do modelo com todas as covariáveis preferir o modelo que não permite excluir mais nenhuma covariável ou estabelecer dois pontos de corte para o p-valor, a fim de incluir e excluir covariáveis, alternadamente a partir do modelo nulo ou do modelo com todas as covariáveis, preferir o modelo que não permite incluir nem excluir mais nenhuma covariável
15 3) Estatística PRESS (para avaliar qualidade preditiva do modelo) n PRESS = i=1 e (i) = y i y ^ (i) ; i=1,,n 2 e (i) estimativa da resposta média do indivíduo i, sob o modelo ajustado com os outros (n - 1) indivíduos preferir modelo com menor PRESS * pode ser mostrado que no MRLM n PRESS = i=1 ( e i 1 h ii)2
16 ## cálculo dos critérios para seleção de variáveis para modelos com p=1 covariável ## para exemplificar apresentar os comandos, somente para a covariável X 1 #considere arquivo de dados dados com as variáveis y, x1, x2,... attach(dados) ajust1 <- lm(y~x1) saida1 <- summary(ajust1) #Coeficiente de determinação múltipla saida1$'r.squared' #Coeficiente de determinação ajustado saida1$'adj.r.squared' #Quadrado médio dos resíduos saida1$sigma^2 #Cp de Mallows p <- length(ajust1$coef) n <- length(y) ajust <- lm(y ~., dados) saida <- summary(ajust) QMRes<-saida$sigma^2 SQRes_p <-(n-p-1)*saida1$sigma^2 SQRes_p/QMRes - n + 2*(p+1) #AIC AIC(ajust1) #p-valor da ANOVA com modelos encaixados e q = 1 ajust0 <- lm(y~1) aov <- anova(ajust0, ajust1) aov$pr[2] #PRESS require(daag) press(ajust1) #para instalar o pacote use: install.packages()
17 ## a função regsubsets pode listar os L melhores modelos, segundo critério da SQRes, ## para modelos com p covariáveis (p = 1, 2,..., k) ## Para exemplificar, vamos encontrar os dois melhores modelos (L = 2), ## para cada p (p = 1, 2,..., k) ## veja que L é o argumento nbest desta função require(leaps) #para instalar o pacote use: install.packages() summary(regsubsets(y ~., nbest = 2, data = dados)) #a função regsubsets também pode retornar, para cada modelo, os valores de #SQRes, Estatística Cp de Mallows, R2_multiplo e R2_ajustado sub <- summary(regsubsets(y ~., data = dados)) n_coef <- as.numeric(rownames(sub$which))+1 Cp <- sub$cp R2_a <- sub$adjr2 SQRes <- sub$rss #gráficos de SQRes, Estatística Cp e R2_ajustado (por (p+1) ou p) plot(n_coef, Cp, xlab="p + 1", ylab = "Estatística Cp") abline(0,1) plot(n_coef-1, SQRes, xlab="p", ylab = "Soma de Quadrados dos Resíduos") plot(n_coef-1, R2_a, xlab="p", ylab = "Coeficiente de Determinação Ajustado")
18 Exemplo 8
19
20 #Exemplo 8 rm(list=ls()) dados <- read.table('exemplo8.csv', h=t) require(leaps) #para instalar o pacote use: install.packages() summary(regsubsets(y ~., nbest=10, data = dados)) sub <- summary(regsubsets(y ~., nbest = 15, data = dados)) n_coef <- as.numeric(rownames(sub$which))+1 Cp <- sub$cp R2_a <- sub$adjr2 SQRes <- sub$rss #gráficos de SQRes, Estatística Cp e R2_ajustado (por (p+1) ou p) plot(n_coef, Cp, xlab="p + 1", ylab = "Estatística Cp") abline(0,1) plot(n_coef-1, SQRes, xlab="p", ylab = "Soma de Quadrados dos Resíduos") plot(n_coef-1, R2_a, xlab="p", ylab = "Coeficiente de Determinação Ajustado")
21 PROBLEMA o uso dos critérios da PARTE I e PARTE II requerer ajuste de todos os possíveis MRLM s Procedimento com todos os possíveis modelos, pode ser inviável quando k é muito grande, pois são ajustados um total de 2 k modelos Por exemplo: se k = 10 são 2 10 = 1024 modelos Como usar de forma sistemática um critério? Existe mais de uma forma sistemática de uso de um critério Procedimento para seleção de variáveis a cada passo de um procedimento, há a adição ou a retirada de uma covariável
22 Procedimentos básicos para seleção de covariáveis 1) Seleção passo a frente (forward) começa pelo modelo nulo e adicionam-se covariáveis uma a uma ao modelo, até que a inclusão de uma nova covariável não seja necessária 2) Seleção passo a atrás (backward) começa pelo modelo que contém todas as covariáveis, eliminando covariáveis (uma a uma), que não sejam significativas para o modelo 3) Seleção passo a passo (stepwise) * é uma combinação dos procedimentos backward e forward inicia-se como no procedimento forward, e após cada etapa de inclusão de uma covariável, tem-se uma etapa para tentar excluir outra covariável
23 1) Seleção passo a frente (forward) Passo 1: Primeira covariável a entrar no modelo é X j se: o modelo somente com X j apresenta o melhor valor para o critério, entre os modelos com uma covariável Passo 2: Segunda covariável a entrar no modelo é X j se: o modelo com X j e X j apresenta o melhor valor para o critério, entre os modelos com duas covariáveis Demais passos: covariáveis entram, uma a uma, conforme melhor valor do critério, entre os modelos que incluem também as demais covariáveis selecionadas no passo anterior processo termina quando a inclusão de mais uma covariável não seja necessária Note que a covariável selecionada em um determinado passo, permanece até o final do procedimento, não havendo possibilidade de exclusão
24 2) Seleção passo a atrás (backward) Passo 1: Primeira covariável a sair do modelo é X j se: o modelo sem X j tem o melhor valor para o critério, entre os modelos com (k 1) covariáveis Passo 2: Segunda covariável a sair do modelo é X j se: o modelo sem X j tem o melhor valor para o critério, entre os modelos com (k 2) covariáveis Demais passos: covariáveis saem, uma a uma, de acordo o melhor valor do critério, entre os modelos com todas as covariáveis do passo anterior, exceto uma processo termina quando a exclusão de mais uma covariável não seja necessária Note que a covariável removida em um determinado passo, não pode ser incluída novamente no modelo
25 3) Seleção passo a passo (stepwise) Passo 1: igual ao Passo 1 do procedimento forward, para a entrada da Primeira covariável (X j ) no modelo Passo 2: igual ao Passo 2 do procedimento forward, para a entrada da Segunda covariável (X j ) no modelo Passo 3: X j sai do modelo após a entrada de X j sem X j melhorar o valor do critério, somente se o modelo Passo 4: igual aos Demais Passos do procedimento forward, para a entrada da Terceira covariável (X j ) no modelo
26 Passo 5: X j (ou X j ) sai do modelo após a entrada de X j, somente se o modelo sem X j (ou o modelo sem X j ) melhorar o valor do critério Demais passos: alternar procedimentos forward e backward : forward para incluir mais uma covariável backward para excluir uma ou mais covariáveis após a inclusão de uma nova covariável processo termina quando a inclusão ou a exclusão de mais uma covariável não seja necessária
27 Importante ter em mente que: a) diferentes combinações de critérios/procedimentos nem sempre levam a mesma seleção de variáveis, pois diferentes modelos podem ter ajustes equivalentes b) nenhuma combinação de critérios/procedimentos pode garantir que o melhor modelo foi obtido
28 Exemplo 9
29 Todos o modelos possíveis sem incluir efeitos de interação
30
31 ## Exemplo 9 # dados y <- c(78.5,74.3,104.3,87.6,95.9,109.2,102.7,72.5,93.1,115.9,83.8,113.3,109.4) x1 <- c(7,1,11,11,7,11,3,1,2,21,1,11,10) x2 <- c(26,29,56,31,52,55,71,31,54,47,40,66,68) x3 <- c(6,15,8,8,6,9,17,22,18,4,23,9,8) x4 <- c(60,52,20,47,33,22,6,44,22,26,34,12,12) # criando um banco de dados dados <- data.frame(cbind(y,x1,x2,x3,x4)) # removendo os vetores rm(y,x1,x2,x3,x4) ## Procedimento passo a passo com AIC modelo_todas <- lm(y~., data=dados) step(lm(y~., data=dados), direction = "both") #ver outras opções da função step no help do R ## função alternativa require(mass) stepaic(lm(y~., data=dados))
32 > step(lm(y~., data=dados), direction = "both") Start: AIC=26.94 y ~ x1 + x2 + x3 + x4 Df Sum of Sq RSS AIC - x x x <none> x Step: AIC=24.97 y ~ x1 + x2 + x4 Df Sum of Sq RSS AIC <none> x x x x Call: lm(formula = y ~ x1 + x2 + x4, data = dados) Coefficients: (Intercept) x1 x2 x
33 > stepaic(lm(y~., data=dados)) Start: AIC=26.94 y ~ x1 + x2 + x3 + x4 Df Sum of Sq RSS AIC - x x x <none> x Step: AIC=24.97 y ~ x1 + x2 + x4 Df Sum of Sq RSS AIC <none> x x x Call: lm(formula = y ~ x1 + x2 + x4, data = dados) Coefficients: (Intercept) x1 x2 x
SELEÇÃO DE VARIÁVEIS
SELEÇÃO DE VARIÁVEIS objetivo incluir tantas covariáveis quantas forem necessárias para auxiliar na predição do modelo? (1) buscar o menor subconjunto de covariáveis capaz de explicar adequadamente a variação
Leia maisANOVA com modelos encaixados
ANOVA com modelos encaixados Motivação 1 Testar a significância de β j ( j = 0, 1,, p na presença das demais regressoras, usando o teste t, é trabalho, pois precisa de: ^β e ^Var (^β j = ^σ 2 j c ( j+1(
Leia maisDisciplina de Modelos Lineares
Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique
Leia maisb) Teste a hipótese de efeito significante do tamanho da população sobre a venda do produto, na presença de renda per capita
Exemplo 1 (continuação a Estime por intervalo de 95% de confiança, o aumento do número médio de lotes vendidos devido a 1000 pessoas a mais na população, mantendo a renda per capita fixa b Teste a hipótese
Leia maisRegression and Clinical prediction models
Regression and Clinical prediction models Session 7 Introducing statistical modeling Part 3 (Multivariable linear regression) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Continuar
Leia maisSeleção de Variáveis e Construindo o Modelo
Seleção de Variáveis e Construindo o Modelo Seleção de modelos candidatos A idéia é selecionar um conjunto menor de variáveis explanatórias de acordo com algum(s) critério(s), e assim selecionar o modelo
Leia maisModelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste
Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste Erica Castilho Rodrigues 2 de Setembro de 2014 Erro Puro 3 Existem dois motivos pelos quais os pontos observados podem não cair na reta
Leia maisMRLM COM COVARIÁVEIS CATEGÓRICAS. criar uma variável dummy para representar uma categoria da variável. variável dummy: assume só dois valores: 0 ou 1
MRLM COM COVARIÁVEIS CATEGÓRICAS Como quantificar o efeito das categorias de uma variável sobre a resposta Y? (exemplo: efeito de sexo masculino/feminino sobre salário) criar uma variável dummy para representar
Leia maisME613 - Análise de Regressão
ME613 - Análise de Regressão Parte 11 Critérios para Seleção de Modelos Samara F. Kiihl - IMECC - UNICAMP file:///users/imac/documents/github/me613-unicamp/me613-unicamp.github.io/aulas/slides/parte11/parte11.html#1
Leia maisAnálise de Regressão Linear no Pacote R
Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Análise de Regressão Linear no Pacote R Gabriela Domingues do Amaral Vanessa Loureiro Silva Edna Afonso Reis
Leia maisModelo Linear Generalizado Distribuição Normal
Valeska Andreozzi 1 Modelo Linear Generalizado Distribuição Normal O objetivo deste exercício é familiarizar o aluno com os modelos lineares generalizados (MLG). PROBLEMA 1: Pressão arterial A pressão
Leia maisANÁLISE DE REGRESSÃO
ANÁLISE DE REGRESSÃO Lucas Santana da Cunha http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 09 de janeiro de 2017 Introdução A análise de regressão consiste na obtenção de uma equação
Leia maisREGRESSÃO LINEAR SIMPLES PARTE III
REGRESSÃO LINEAR SIMPLES PARTE III Instalando e usando a opção Regressão do Excel. Francisco Cavalcante(f_c_a@uol.com.br) Administrador de Empresas graduado pela EAESP/FGV. É Sócio-Diretor da Cavalcante
Leia maisAnálise de Resíduos. investiga características que comprometem a validade do MRLS:
Análise de Resíduos investiga características que comprometem a validade do MRLS: (1) relação entre X e Y não é linear (2) erros não tem variância constante (3) erros correlacionados (4) erros não são
Leia maisAnálise de Regressão EST036
Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Regressão sem intercepto; Formas alternativas do modelo de regressão Regressão sem
Leia maisTeste da razão de verossimilhanças generalizada
SME0812 Modelos Lineares Teste da razão de verossimilhanças generalizada Prof. Cibele Russo 7 de maio de 2015 1 / 21 Suponha que em um modelo linear geral Y n 1 = X n (p+1) (p+1) 1 + n 1; com N(0; 2 I);
Leia maisRegressão linear múltipla. Regressão linear múltipla
Regressão linear múltipla 35 R 2 = 61% Maria Virginia P Dutra Eloane G Ramos Vania Matos Fonseca Pós Graduação em Saúde da Mulher e da Criança IFF FIOCRUZ Baseado nas aulas de M. Pagano e Gravreau e Geraldo
Leia maisAnálise de Resíduos. investigar características que comprometem a validade do MRLS:
Análise de Resíduos investigar características que comprometem a validade do MRLS: (1) relação entre X e Y não é linear (2) erros não tem variância constante (3) erros correlacionados (4) erros não são
Leia mais9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla
9 Correlação e Regressão 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 1 9-1 Aspectos Gerais Dados Emparelhados há uma relação? se há, qual
Leia maisECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.
ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc. Cap. 8 Análise de Regressão Múltipla: o Problema da Inferência Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. Rio de Janeiro. Elsevier- Campus,
Leia mais4 Modelos Lineares Generalizados
4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da
Leia maisINFLUÊNCIA DE PONTOS ATÍPICOS. investigar a causa das discrepâncias
INFLUÊNCIA DE PONTOS ATÍPICOS como identificá-los? investigar a causa das discrepâncias avaliar seus efeitos (influências) no ajuste do modelo No MRLS podemos identificar pontos atípicos influentes com:
Leia maisREGRESSÃO LINEAR Parte I. Flávia F. Feitosa
REGRESSÃO LINEAR Parte I Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Julho de 2015 Onde Estamos Para onde vamos Inferência Esta5s6ca se resumindo a uma equação
Leia maisRalph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:
Leia maisModelos Lineares Generalizados - Verificação do Ajuste do Modelo
1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma
Leia maisCORRELAÇÃO E REGRESSÃO
CORRELAÇÃO E REGRESSÃO Permite avaliar se existe relação entre o comportamento de duas ou mais variáveis e em que medida se dá tal interação. Gráfico de Dispersão A relação entre duas variáveis pode ser
Leia maisAULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2
AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2 Susan Schommer Econometria I - IE/UFRJ Testes de hipóteses sobre combinação linear dos parâmetros Na aula passada testamos hipóteses sobre
Leia maisAula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Leia maisModelos de Regressão Linear Simples - parte III
1 Modelos de Regressão Linear Simples - parte III Erica Castilho Rodrigues 20 de Setembro de 2016 2 3 4 A variável X é um bom preditor da resposta Y? Quanto da variação da variável resposta é explicada
Leia maisi j i i Y X X X i j i i i
Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão
Leia maisRegressão Linear Simples
Regressão Linear Simples Capítulo 16, Estatística Básica (Bussab&Morettin, 8a Edição) 10a AULA 18/05/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 10a aula (18/05/2015) MAE229 1 / 38 Introdução
Leia maisINFERÊNCIA EM MODELOS LINEARES GENERALIZADOS ANÁLISE DE DEVIANCE
INFERÊNCIA EM MODELOS LINEARES GENERALIZADOS ANÁLISE DE DEVIANCE A análise de deviance é uma generalização, para modelos lineares generalizados, da análise de variância. No caso de modelos lineares, utiliza-se
Leia maisi j i i Y X X X i j 1 i 2 i i
Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão
Leia maisAnálise de Dados Longitudinais Aula
1/35 Análise de Dados Longitudinais Aula 08.08.2018 José Luiz Padilha da Silva - UFPR www.docs.ufpr.br/ jlpadilha 2/35 Sumário 1 Revisão para dados transversais 2 Como analisar dados longitudinais 3 Perspectiva
Leia maisAnálise da Regressão. Prof. Dr. Alberto Franke (48)
Análise da Regressão Prof. Dr. Alberto Franke (48) 91471041 O que é Análise da Regressão? Análise da regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas
Leia maisUNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.
UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo
Leia maisRevisão de Modelos de regressão. Prof. Thais C O Fonseca - DME, UFRJ
Revisão de Modelos de regressão Prof. Thais C O Fonseca - DME, UFRJ Conteúdo Regressão linear simples Regressão linear múltipla Método de Mínimos Quadrados Introdução a Inferência Bayesiana em Regressão
Leia maisEsse material foi extraído de Barbetta (2007 cap 13)
Esse material foi extraído de Barbetta (2007 cap 13) - Predizer valores de uma variável dependente (Y) em função de uma variável independente (X). - Conhecer o quanto variações de X podem afetar Y. Exemplos
Leia maisModelo de Regressão Múltipla
Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão
Leia maisAnálise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Leia maisRegressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei
Regressão PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão Introdução Analisar a relação entre duas variáveis (x,y) através da equação (equação de regressão) e do gráfico
Leia maisRegressão linear múltipla
Regressão linear múltipla Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução A regressão múltipla é uma generalização da regressão simples, visto que, há mais de uma variável explicativa
Leia maisIntrodução ao modelo de Regressão Linear
Introdução ao modelo de Regressão Linear Prof. Gilberto Rodrigues Liska 8 de Novembro de 2017 Material de Apoio e-mail: gilbertoliska@unipampa.edu.br Local: Sala dos professores (junto ao administrativo)
Leia maisCapacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.
UFFS Universidade Federal da Fronteira Sul Campus Cerro Largo PROJETO DE EXTENSÃO Software R: capacitação em análise estatística de dados utilizando um software livre Fonte: https://www.r-project.org/
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )
UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152), Cinthia Zamin Cavassola(GRR20149075) e Luiza Hoffelder da Costa(GRR20149107) AJUSTE DE MODELO DE REGRESSÃO LOGÍSTICA REFERENTE À PRESENÇA DE
Leia maisTeste F-parcial 1 / 16
Teste F-parcial A hipótese nula, H 0, define o modelo restrito. Ingredientes SQR r : soma de quadrado dos resíduos sob H 0. R 2 r: coeficiente de determinação sob H 0. g: número de restrições a serem testadas
Leia maisINCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO
Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO CE225 - Modelos Lineares Generalizados Eduardo
Leia maisTESTES DE HIPÓTESES E INTERVALOS DE CONFIANÇA EM MODELOS LINEARES GENERALIZADOS
TESTES DE HIPÓTESES E INTERVALOS DE CONFIANÇA EM MODELOS LINEARES GENERALIZADOS Antes de apresentar alguns dos testes de hipóteses e intervalos de confiança mais usuais em MLG, segue a definição de modelos
Leia maisAjuste por mínimos quadrados no Scilab
Ajuste por mínimos quadrados no Scilab O ajuste por mínimos quadrados é uma regressão linear nos parâmetros (eles podem ser arranjados na equação de regressão na forma de um único vetor) que tem sua eficiância
Leia maisRegression and Clinical prediction models
Regression and Clinical prediction models Session 6 Introducing statistical modeling Part 2 (Correlation and Linear regression) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Continuar
Leia maisO parâmetro β1 indica a mudança ocorrida na esperança de Y a cada unidade de mudança em X 1 quando X2 é mantida fixa.
Outras informações para ajudar na interpretação das análises de Regressão 1. Interpretação dos parâmetros na ausência de interações Considere o modelo E(Y x) = β0 + β1 x1 + β2 x2. O parâmetro β0 é o intercepto
Leia maisCorrelação e Regressão
Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe
Leia maisEstudar a relação entre duas variáveis quantitativas.
Estudar a relação entre duas variáveis quantitativas. Exemplos: Idade e altura das crianças Tempo de prática de esportes e ritmo cardíaco Tempo de estudo e nota na prova Taxa de desemprego e taxa de criminalidade
Leia maisAULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2
AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2 Susan Schommer Econometria I - IE/UFRJ Testes de hipóteses sobre combinação linear dos parâmetros Na aula passada testamos hipóteses sobre
Leia maisModelos Lineares Generalizados - Introdução
Modelos Lineares Generalizados - Erica Castilho Rodrigues 18 de Março de 2014 3 Por que queremos modelar os dados? A forma do modelo revela padrões de interação e associação nos dados. Através de procedimentos
Leia maisMulticolinariedade e Autocorrelação
Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não
Leia maisDisciplina de Modelos Lineares Professora Ariane Ferreira
Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável
Leia maisTeste F-parcial 1 / 16
Teste F-parcial Ingredientes A hipótese nula, H 0, define o modelo restrito. A hipótese alternativa, H a : H 0 é falsa, define o modelo irrestrito. SQR r : soma de quadrado dos resíduos associada à estimação
Leia maisECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.
ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc. Cap. 9 Modelos de Regressão com Variáveis Binárias Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. Rio de Janeiro. Elsevier- Campus, 2006 Variáveis
Leia maisEstatística Aplicada II. } Regressão Linear
Estatística Aplicada II } Regressão Linear 1 Aula de hoje } Tópicos } Regressão Linear } Referência } Barrow, M. Estatística para economia, contabilidade e administração. São Paulo: Ática, 007, Cap. 7
Leia maisCoeficiente de determinação R 2 no modelo de regressão linear normal
Coeficiente de determinação R 2 no modelo de regressão linear normal Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br
Leia maisAULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012
1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à
Leia maisModelos de regressão para dados correlacionados. Cibele Russo
Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo
Leia maisProva # SUB 15 junho de 2015
MAE 229 -Introdução à Probabilidade e Estatística II Prof. Fábio Machado e Prof. Lígia Henriques-Rodrigues Prova # SUB 15 junho de 2015 Questão 1 2 3 4 Total Valor Nome: Nro. USP: Observações: Não destaque
Leia maisInstituto Federal Goiano
e simples e Instituto Federal Goiano e Conteúdo simples 1 2 3 4 5 simples 6 e simples Associação entre duas variáveis resposta Exemplos: altura de planta e altura da espiga, teor de fósforo no solo e na
Leia maisME613 - Análise de Regressão
ME613 - Análise de Regressão Parte 12 Gráficos de Regressão Parcial Samara F. Kiihl - IMECC - UNICAMP file:///users/imac/documents/github/me613-unicamp/me613-unicamp.github.io/aulas/slides/parte12/parte12.html#1
Leia maisREGRESSÃO LINEAR. Introdução a Estatítica Aplicada a Climatologia Programa de Pós Graduação em Geografia Física Universidade de São Paulo
REGRESSÃO LINEAR Introdução a Estatítica Aplicada a Climatologia Programa de Pós Graduação em Geografia Física Universidade de São Paulo REGRESSÃO LINEAR REGRESSÃO LINEAR A correlação linear mostra quanto
Leia maisCONHECIMENTOS ESPECÍFICOS
CESPE/UnB FUB/03 fa 5 4 3 CONHECIMENTOS ESPECÍFICOS 60 As distribuições B e C possuem os mesmos valores para os quartis Q e Q, e o quartil superior em B corresponde ao quartil central (Q ) da distribuição
Leia maisRegressão Linear - Parte I
UFPE - Universidade Federal de Pernambuco Curso: Economia Disciplina: ET-406 Estatística Econômica Professor: Waldemar Araújo de S. Cruz Oliveira Júnior Regressão Linear - Parte I 1 Introdução Podemos
Leia maisAnálise de regressão linear múltipla com estudo relacionado a horas de máquinas paradas na linha de produção de uma indústria de calçados
Universidade Estadual da Paraíba Centro de Ciências e Tecnologia Departamento de Estatística Humberto Moreira de Almeida Análise de regressão linear múltipla com estudo relacionado a horas de máquinas
Leia maisAula Prática 1. Uso do R com exemplos Adaptação: Flávia Landim/UFRJ
Aula Prática 1 Uso do R com exemplos Adaptação: Flávia Landim/UFRJ Objetivos Analisar duas variáveis quantitativas: traçando diagramas de dispersão, para avaliar possíveis relações entre as duas variáveis;
Leia maisPlanejamento de Experimentos
Planejamento de Experimentos 1 6.4 Os Modelos fatoriais 2 k : o caso geral. O modelo estatístico para um plano 2 k inclui k ( k 2 ( k ) ) efeitos principais efeitos de interação de ordem 2 efeitos de interação
Leia maisAULA 19 E 20 Análise de Regressão Múltipla: Problemas Adicionais
1 AULA 19 E 20 Análise de Regressão Múltipla: Problemas Adicionais Ernesto F. L. Amaral 19 e 24 de maio de 2011 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria:
Leia mais5.3 Experimentos fatoriais a dois fatores. Ambos os fatores são supostos fixos e os efeitos de tratamento são definidos como desvios da média tal que
5. Experimentos Fatoriais 5.3 Experimentos fatoriais a dois fatores. Modelo de Efeitos Y ijk = µ+τ i +β j +(τβ) ij +ɛ ijk, i = 1, 2,..., a j = 1, 2,..., b k = 1, 2,..., n Ambos os fatores são supostos
Leia maisQuiz Econometria I versão 1
Obs: muitos itens foram retirados da ANPEC. Quiz Econometria I versão 1 V ou F? QUESTÃO 1 É dada a seguinte função de produção para determinada indústria: ln(y i )=β 0 + β 1 ln( L i )+β 2 ln( K i )+u i,
Leia maisQMRE = n (p+1) R 2. 1 R 2 (p,n (p+1)), sob H 0.
INSTITUTO SUPERIOR DE AGRONOMIA ESTATÍSTICA E DELINEAMENTO 4 de Janeiro, 205 SEGUNDO TESTE 204-5 Uma resolução possível I. O valor R 2 =0.528 significa que esta regressão linear múltipla explica quase
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA
UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA BRUNO GERONYMO - GRR20159232 HERMANN MOGIZ DELGADO - GRR20159211 MARIA HELENA OLIVEIRA - GRR20159213 VINICIUS CESAR PEDROSO
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski
UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010
Leia maisREGRESSÃO LINEAR SIMPLES PARTE II
REGRESSÃO LINEAR SIMPLES PARTE II Erro Padrão de Estimativa. Correlação. Francisco Cavalcante(f_c_a@uol.com.br) Administrador de Empresas graduado pela EAESP/FGV. É Sócio-Diretor da Cavalcante Associados,
Leia maisMonitoria Sessão 6. Verônica Santana FEA-USP 10/05/2017
Monitoria Sessão 6 Verônica Santana FEA-USP 10/05/2017 1 Testes de Especificação Retomando o modelo anterior ADA i = β 0 + β 1 ROA i + β 2 MT B i + β 3 SIZE i + β 4 LEV i + β 5 CF O i + β 6 LOSS i + u
Leia maisREGRESSÃO E CORRELAÇÃO
REGRESSÃO E CORRELAÇÃO A interpretação moderna da regressão A análise de regressão diz respeito ao estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis explanatórias,
Leia maisBibliografia Recomendada
Bibliografia Recomendada Barros Neto, B.; Scarminio, I. S.; Bruns, R. E. Como Fazer Experimentos. Montgomery, D. C. Design and Analysis of Experiments. Box, G. E. P.; Hunter, J. S.; Hunter, W. G. Statistics
Leia maisRegressão Linear Simples
Regressão Linear Simples Mario Andrade Lira Junior Direitos autorais reservados segundo licença Creative Commons 3.0: com Atribuição; Não Comercial; Compartilha Igual Termos importantes Tipos de variáveis
Leia maisModelos Lineares Generalizados - Introdução
Modelos Lineares Generalizados - Erica Castilho Rodrigues 18 de Março de 2014 3 Por que queremos modelar os dados? A forma do modelo revela padrões de interação e associação nos dados. Através de procedimentos
Leia maisPredição do preço médio anual do frango por intermédio de regressão linear
Predição do preço médio anual do frango por intermédio de regressão linear João Flávio A. Silva 1 Tatiane Gomes Araújo 2 Janser Moura Pereira 3 1 Introdução Visando atender de maneira simultânea e harmônica
Leia mais2 ou mais fatores são de interesse.
5. Experimentos Fatoriais 5.1 Definições e Princípios Básicos 2 ou mais fatores são de interesse. Experimentos Fatoriais: em cada replicação do experimento todas as combinações dos níveis de tratamento
Leia maisMarina Andretta. 10 de outubro de Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis.
Solução básica viável inicial Marina Andretta ICMC-USP 10 de outubro de 2016 Baseado no livro Introduction to Linear Optimization, de D. Bertsimas e J. N. Tsitsiklis. Marina Andretta (ICMC-USP) sme0211
Leia maisAULA 07 Análise de Regressão Múltipla: Problemas Adicionais
1 AULA 07 Análise de Regressão Múltipla: Problemas Adicionais Ernesto F. L. Amaral 24 de julho de 2012 Análise de Regressão Linear (MQ 2012) www.ernestoamaral.com/mq12reg.html Fonte: Wooldridge, Jeffrey
Leia maisBIE5782. Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES
BIE5782 Unidade 7: INTRODUÇÃO AOS MODELOS LINEARES ROTEIRO 1.Motivação 2. Método dos mínimos quadrados 3. Ajuste no R: função lm 4. Resultado no R: objeto lm 5. Premissas, interpretação e diagnóstico 6.
Leia maisProva # 2 8 junho de 2015
MAE 229 -Introdução à Probabilidade e Estatística II Prof. Fábio Machado e Prof. Lígia Henriques-Rodrigues Prova # 2 8 junho de 2015 Questão 1 2 3 4 Total Valor Nome: Nro. USP: Observações: Não destaque
Leia maisAULAS 14 E 15 Modelo de regressão simples
1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 18 e 23 de outubro de 2012 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem
Leia maisAULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013
1 AULA 07 Regressão Ernesto F. L. Amaral 05 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas
Leia maisMOQ-14 Projeto e Análise de Experimentos
Instituto Tecnológico de Aeronáutica Divisão de Engenharia Mecânica-Aeronáutica MOQ-14 Projeto e Análise de Experimentos Profa. Denise Beatriz Ferrari www.mec.ita.br/ denise denise@ita.br Regressão Linear
Leia maisPrograma R para seleção de preditores em modelos de superfície de resposta
Programa R para seleção de preditores em modelos de superfície de resposta Ricardo de Almeida Pazianotto 1 Aline de Holanda Nunes Maia 1 1 Introdução Superfícies de resposta são modelos empíricos amplamente
Leia maisDelineamento e Análise Experimental Aula 4
Aula 4 Castro Soares de Oliveira ANOVA Significativa Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos evidência de que existem diferenças entre as médias populacionais.
Leia maisModelos log-lineares em tabelas tridimensionais
Modelos log-lineares em tabelas tridimensionais A Tabela 1 apresenta o número de respondentes em um estudo transversal classificados de acordo com a ideologia política, o partido político e o sexo. Os
Leia maisCORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011
CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Modelos Probabilísticos para a Computação Professora: Andréa Rocha UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011 CORRELAÇÃO Introdução Quando consideramos
Leia maisModelos de Regressão Múltipla - Parte VII
1 Modelos de Regressão Múltipla - Parte VII Erica Castilho Rodrigues 26 de Janeiro de 2016 2 3 Vimos como ajustar um modelo não linear fazendo transformações das variáveis, como, por exemplo Y = exp{β
Leia mais