Contabilometria Aula 9 Regressão Linear Inferências e Grau de Ajustamento
Interpretação do Intercepto e da Inclinação b 0 é o valor estimado da média de Y quando o valor de X é zero b 1 é a mudança estimada na média dos valores de Y para uma unidade de mudança em X
Regressão Linear - Exemplo Um corretor quer estudar a relação entre o preço de venda de uma casa e o seu tamanho (medido em pés quadrados) Uma amostra aleatória de 10 casas é selecionada Variável Dependente (Y) = Preço da casa em $1000s Variável Independente (X) = pés quadrados
Regressão Linear - Exemplo Dados Preço da casa em $1000s (Y) Pés quadrados (X) 245 1400 312 1600 279 1700 308 1875 199 1100 219 1550 405 2350 324 2450 319 1425 255 1700
Regressão Linear - Exemplo Diagrama de Dispersão Preço das casas ($1000s) Modelo do preço das casas: diagrama de dispersão 450 400 350 300 250 200 150 100 50 0 0 500 1000 1500 2000 2500 3000 Pés Quadrados
Preço das casas ($1000s) Regressão Linear Exemplo Representação Gráfica Modelo do preço das casas: Diagrama de dispersão e linha da regressão Intercepto = 98.248 450 400 350 300 250 200 150 100 50 0 0 500 1000 1500 2000 2500 3000 Pés Quadrados Inclinação = 0.110 Preço = 98,248 + 0,110*Área em pés quadrados
Regressão Linear Exemplo Interpretação de b 0 Preço = 98,248 + 0,110*Área em pés quadrados b 0 é o valor estimado da média de Y quando o valor de X é zero (se X = 0 está no intervalo dos valores observados de X) Como a área de uma casa não pode ser 0, o intercepto calculado não tem nenhuma aplicação prática.
Regressão Linear Exemplo Interpretação de b 1 Preço = 98,248 + 0,110*Área em pés quadrados b 1 mede a mudança no valor médio de Y resultante da variação em uma unidade no valor de X. Aqui, b 1 =.110 mostra que o valor médio de uma casa aumenta em.110($1000) = $110, em média, para cada unidade de área (pés quadrados) adicional no tamanho
Considerações relevantes sobre a reta de regressão A previsão de y é sempre um valor médio. Não é possível prever o preço exato de uma casa dada a sua área. Ou no exemplo anterior, a quantidade exata vendida para um determinado preço. As previsões devem ser feitas dentro do intervalo de valores utilizados da variável independente.
Regressão Linear Exemplo Fazendo Previsões Prever o preço de uma casa com 2.000 pés quadrados: Preço 98.25 0.110 (pés quadrados) 98.25 0.110(2000) 317.85 O preço previsto para uma casa com 2000 pés quadrados é 317,85($1.000s) = $317.850
Preço das Casas ($1000s) Regressão Linear Exemplo Fazendo Previsões Ao usar um modelo de regressão para fazer previsões, faça-o somente dentro do intervalo relevante Intervalo relevante para previsões 450 400 350 300 250 200 150 100 50 0 0 500 1000 1500 2000 2500 3000 Pés Quadrados Não tente extrapolar para além do intevalo observado de X.
Testes de hipóteses e intervalos de confiança Os pares (x,y) estão dispersos em torno da reta de regressão; Isto ocorre porque provavelmente há outras variáveis influenciando o valor de y. A reta traçada não consegue prever todos os fatores que afetam a variação de y. Como há incertezas na nossa previsão, precisamos avaliar quão úteis são nossas estimativas para explicar o comportamento da variável y. Para isso calcularemos os erros-padrão e faremos inferências usando intervalos de confiança e testes de hipóteses.
Erro-padrão das estimativas Comparando Erros-Padrão S e mede a variabilidade de Y em torno da linha de previsão Y Y s YX pequeno X s YX grande X Quanto maior a dispersão, maior a imprecisão da estimativa
Erro-padrão das estimativas O erro-padrão é uma medida para avaliar o grau de precisão da estimativa proporcionada pela reta de regressão. É um desvio-padrão, tem a mesma unidade da variável dependente S e y y n 2 ˆ 2 y valor observado da variável dependende yˆ valor estimado da variável dependente n número de observações
Erro padrão do coeficiente linear (Sa) Mede a distância entre o coeficiente a e o coeficiente na população A; Quanto menor, melhor a precisão. S x S e S a média S e 1 n x S 2 xx erro padrão da estimativa n número de observações xx x 2 n x 2 da variável independente( x)
Erro padrão do coeficiente angular (Sb) Mede a distância entre o coeficiente b e o coeficiente na população B; Quanto menor, melhor a precisão. S b S S e xx S erro padrão da estimativa n número de observações S e xx x 2 n x 2
Inferências sobre o coeficiente angular Sempre precisamos verificar se o modelo linear obtido é realmente significativo Como ter segurança de que o coeficiente b não é igual a 0??? Y A B=0 Devemos testar as seguintes hipóteses: H 0 : B = 0 H 1 : B 0 X
Intervalo de confiança ou teste de hipóteses Intervalo de confiança: b t. S B b t. S b b Teste de hipóteses: α/2 α/2 Rejeita H 0 -t n-k,α/2 Não rejeita H 0 0 Onde: b = estimativa do coeficiente angular b t = valor crítico S b = erro padrão do coeficiente angular b n k = graus de liberdade = (no. de observações no. de variáveis) t t n-k,α/2 b S b B Rejeita H 0 Estatística de teste:
Covariância A covariância mede a força do relacionamento entre duas variáveis em termos absolutos. Expressão: cov(x,y) n i1 (X i X)(Y n 1 i Y) Mede a força da associação entre as duas variáveis. Não implica causação.
Covariância Covariância entre duas variáveis aleatórias: cov(x,y) > 0 cov(x,y) < 0 cov(x,y) = 0 X e Y tendem a se mover na mesma direção X e Y tendem a se mover em direções opostas X e Y são independentes
Coeficiente de correlação O coeficiente de correlação mede a força relativa da associação linear entre duas variáveis. Expressão: r n i1 n i1 (X i (X i X) 2 X)(Y n i i1 Y) (Y i Y) 2 cov(x,y) S S X Y
Coeficiente de Correlação Adimensional Varia entre 1 e 1 Quanto mais perto de 1, mais forte a relação linear negativa Quanto mais perto de 1, mais forte a relação linear positiva Quanto mais próximo de 0, mais fraca qualquer tipo de relação linear
Coeficiente de correlação Y Y Y X X r = -1 r = -.6 r = 0 X Y Y r = +1 X r = +.3 X