Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Documentos relacionados
9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento

Análise da Regressão. Prof. Dr. Alberto Franke (48)

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

Correlação e Regressão Linear

Introdução ao modelo de Regressão Linear

Modelos de Regressão Linear Simples - Análise de Resíduos

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

CORRELAÇÃO E REGRESSÃO

Estatística aplicada ao Melhoramento animal

REGRESSÃO LINEAR SIMPLES E MÚLTIPLA

Módulo 2 AVALIAÇÃO DA DEMANDA EM TRANSPORTES

Instituto Federal Goiano

Exercícios Selecionados de Econometria para Concursos Públicos

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

AULAS 14 E 15 Modelo de regressão simples

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

1 semestre de 2014 Gabarito Lista de exercícios 3 - Estatística Descritiva III C A S A

Material exclusivo para o livro ESTATÍSTICA (São Paulo, Pleiade, 2008). Proibida a reprodução, sob pena da lei.

Regressão Linear. Prof. Dr. Leandro Balby Marinho. Análise de Dados II. Introdução Regressão Linear Regressão Múltipla

a) 19% b) 20% c) Aproximadamente 13% d) 14% e) Qualquer número menor que 20%

9 Regressão linear simples

= < 5. O segundo menor valor esperado estimado corresponde à célula (3,3), com Ê33 = 29 30

VERSÃO RESPOSTAS PROVA DE MÉTODOS QUANTITATIVOS

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

Homocedasticidade? Exemplo: consumo vs peso de automóveis

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Métodos Quantitativos

Ajuste de Curvas. Universidade Tecnológica Federal do Paraná Campus Francisco Beltrão. Disciplina: Cálculo Numérico Professor: Jonas Joacir Radtke

Seja (X,Y) uma v.a. bidimensional contínua ou discreta. Define-se valor esperado condicionado de X para um dado Y igual a y da seguinte forma:

Análise de Regressão Múltipla: Mínimos Quadrados Ordinários

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Revisão de Modelos de regressão. Prof. Thais C O Fonseca - DME, UFRJ

EXAME NACIONAL DE SELEÇÃO 2012 PROVA DE ESTATÍSTICA

ESTATÍSTICA INFERENCIAL. Prof. Dr. Guanis de Barros Vilela Junior

UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARANÁ DEPARTAMENTO DE ENGENHARIA AMBIENTAL LISTA DE EXERCÍCIOS 5

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

CORRELAÇÃO. Flávia F. Feitosa

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

CONHECIMENTOS ESPECÍFICOS

AULAS 28 E 29 Análise de Regressão Múltipla com Informações Qualitativas

Estatística Aplicada ao Serviço Social

7 Teste de Hipóteses

Econometria Semestre

Mais Informações sobre Itens do Relatório

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

AULA 07 Inferência a Partir de Duas Amostras

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Análise Prospectiva do Consumo de um Produto

Análise de Regressão. Luiz Carlos Terra

Estimação e Testes de Hipóteses

Regressão múltipla: problemas adicionais. Unidades de medida. Unidades de medida. Unidades de medida salário em dólares (*1000) Unidades de medida

CONHECIMENTOS ESPECÍFICOS

UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA NOTAS DE AULA MAT236 MÉTODOS ESTATÍSTICOS 3ª UNIDADE

Capítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia

Correlação e Regressão Linear

Prova de Estatística

Professora Ana Hermínia Andrade. Período

Bioestatística e Computação I

Palavras-chave: Correlação entre variáveis. Definição de regressões para determinação de lucro.

LISTA DE EXERCÍCIOS 2 INE 7001 PROF. MARCELO MENEZES REIS ANÁLISE BIDIMENSIONAL GABARITO

AULAS 25 E 26 Heteroscedasticidade

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

Pesquisa Quantitativa Regressão e Correlação Roteiro Geral Roteiro do Módulo Regressão e correlação

Procedimento Complementar para Validação de Métodos Analíticos e Bioanalíticos usando Análise de Regressão Linear

AULAS 13, 14 E 15 Correlação, Análise Fatorial e Regressão

CONHECIMENTOS ESPECÍFICOS

CORRELAÇÃO LINEAR, TIPOS DE CORRELAÇÃO. REGRESSÃO LINEAR PELO ESTUDO DA CORRELAÇÃO E UTILIZANDO OS MÍNIMOS QUADRADOS

Renda x Vulnerabilidade Ambiental

Estatística 1. Resumo Teórico

Análise espacial da incidência de Dengue no município de São Paulo

INSTITUTO POLITÉCNICO DE SETÚBAL ESCOLA SUPERIOR DE SAÚDE ESTATÍSTICA. Cursos: Licenciatura em Enfermagem

25 a 30 de novembro de 2013

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

AULAS 20 E 21 Modelo de regressão simples

Resultados possíveis do nosso estudo

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

AULA 11 Heteroscedasticidade

5. Resultados e Discussão

Elementos de Estatística

REGRESSÃO E CORRELAÇÃO

4 Modelos de Regressão Dinâmica

Testes de Hipótese para uma única Amostra - parte II

PESQUISA EM MERCADO DE CAPITAIS. Prof. Patricia Maria Bortolon, D. Sc.

EXAME DE ESTATÍSTICA / ESTATÍSTICA I

Testes de Hipótese para uma única Amostra - parte I

Estatística e Probabilidade. Aula 11 Cap 06

Econometria em Finanças e Atuária

Teste de hipóteses para proporção populacional p

A Metodologia de Box & Jenkins

Ajuste por mínimos quadrados no Scilab

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste

Inferência Estatística Básica. Teste de Hipóteses para uma média populacional Cálculo do Valor p

Transcrição:

Regressão PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Regressão Introdução Analisar a relação entre duas variáveis (x,y) através da equação (equação de regressão) e do gráfico (gráfico de regressão) que representa tal relação. Equação de regressão Relação entre: x: variável independente (preditora, explanatória) í: variável dependente (resposta) Hipóteses: Estudos de relações lineares Cada valor de x: y é uma variável aleatória com distribuição normal todas as distribuições de y têm a mesma variância a média da distribuição dos valores de y se localiza sobre a reta de regressão

Equação de Regressão y = mx + b yˆ = b + b x o 1 inclinação intercepto de y bo = y b1x b 1 = n ( xy) ( y)( y) ( n x ) ( x) b o b 1 estatísticas amostrais β o β 1 estatísticas populacionais y = β +β o 1 x

Exemplo x y x y xy x² y² 4 4 8 4 16 3 3 3 3 9 9 9 3 4 3 4 1 9 16 6 8 6 8 48 36 64 Σ 14 19 77 58 105 ( ) ( )( ) ( n x ) ( x) n xy x y 4(77) (14)(19) b1 = = = 1,1666666 4(58) (14) bo = y b1x bo = 4, 75 1,166667.3,5 = 0, 667 ŷ = 0,667 + 1,167x Estimativa de y=β o + β 1 x

Exemplo x y 4 3 3 3 4 6 8 ŷ = 0, 667 + 1,167x y 9 8 7 6 5 4 3 1 0 0 1 3 4 5 6 7 x

EXEMPLO DE CÁLCULO USANDO STATDISK

Utilizando a equação de regressão Prevendo y com base em x Se existe correlação linear: usar a equação de regressão Cuidados com a predição! Manter o valor da previsão de acordo com valores reais (no alcance da amostra). Usar a equação para a população da amostra. Verificar se a previsão é viável (datas, intervalos de valores, etc.) Se não existe correlação linear entre x e y: y (previsto) = y No 1 exemplo, podemos, portanto, prever qual seria y para x = 5. y = 0,667+1,1667(5) = 6,5

Exemplo y = 3,865 +,168x Avaliar a quantidade de hemoglobina para um paciente que apresente 5,5 unidades de medidas de glóbulos vermelhos y = 3,865 +,168(5,5) y = 15,789 A média dos dados amostrais de hemoglobina é de 13,906

Resumindo, para prever uma variável, temos: Calcular o valor de r Testar a hipótese: ρ = 0 sim Há correlação linear significante? (ρ = 0 é rejeitada?) não Predição pela média amostral da variável a ser prevista Predição pela Equação de Regressão

Outras ferramentas para análise Mudança marginal (b 1 ) : variação de uma variável em relação a variação, em uma unidade, da outra variável emparelhada. No exemplo em que b 1 =,168, temos que a taxa de hemoglobina vai aumentar de,168 para cada aumento de uma unidade de glóbulos vermelhos. Outliers e pontos influentes: Pontos que afetam fortemente o gráfico da reta de regressão 1.80 1.60 1.40 1.0 1.00 0.80 0.60 0.40 0.0 0.00 0.00 1.00.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00

Outras ferramentas para análise Resíduo: Diferença entre o valor amostral observado (y) e o valor previsto pela equação de regressão (í). Resíduo = y í Propriedade dos mínimos quadrados: Soma dos quadrados dos rezíduos deve ser mínima y 9 8 7 6 5 4 3 1 0 0 1 3 4 5 6 7 x x y y^ resíduo 4 3.0 1.0 3 3 4. -1. 3 4 4. -0. 6 8 7.7 0.3 Σ(res ) =,5

Outras ferramentas para análise Desvio total: Distância entre o ponto (x,y) e a reta horizontal que passa pela média amostral. Desvio explicado: Distância entre o valor predito e a reta horizontal que passa pela média amostral. Desvio não-explicado: Resíduo. Distância entre o ponto (x,y) e a reta de regressão. Desvio total = Desvio explicado + Desvio não-explicado (y y) = (yˆ y) + (y y) ˆ Variação total = Variação explicada + Variação não-explicada (y y) = (yˆ y) + (y y) ˆ

Exemplo No nosso primeiro exemplo, tínhamos: Admitiremos uma correlação linear significativa Equação da reta de regressão: í = 1.1667x + 0.6667 A média dos valores de y é 4,75 Um dos pares de dados amostrais é (3, 4) Substituindo x = 3 na equação, temos o ponto 4,1666... que é um dos pontos sobre a reta de regressão. Desvio total: (y y) = 4 4,75 = 0,750 Desvio explicado: (yˆ y) = 4,1667 4,75 = 0,583 Desvio não-explicado: (y y) ˆ = 4 4,1667 = 0,1667

y 9 8 7 6 5 4 3 1 0 Desvio explicado Desvio não-explicado 0 1 3 4 5 6 7 x

Exemplo No nosso primeiro exemplo, tínhamos: Admitiremos uma correlação linear significativa Equação da reta de regressão: í = 1.1667x + 0.6667 A média dos valores de y é 4,75 Um dos pares de dados amostrais é (3, 4) Substituindo x = 3 na equação, temos o ponto 4,1666... que é um dos pontos sobre a reta de regressão. Variação total: (y y) = 14,8 Variação explicada: (y y) 1,3 Variação não-explicada: (y y),5 ˆ = ˆ =

Continuando nossa análise... Coeficiente de determinação (r ): Quantidade de variação em y, explicada pela reta de regressão. (ŷ (y y) r = y) = Variação explicada Variação total r indica a % da variação total em y que pode ser explicada pela relação linear (x,y). No caso do exemplo: r = 1,3/14,8 = 0,831. 83,1% da variação total em y que pode ser explicada pela relação linear (x,y).

Continuando nossa análise... Erro padrão da estimativa (s e ): Medida de como os pontos amostrais se afastam da reta de regressão. s e maiores: pontos mais afastados da reta de regressão e vice-versa s e (y ŷ) y b o y b 1 xy = = n n No nosso exemplo: 105 0, 667(19) 1,1667(77) se = = 1,1180 = 1,1 4

E mais... Intervalo de predição n(x x) o yˆ E < y < yˆ + E com E = tα se 1+ + n n x x 1 ( ) ( ) n graus de liberdade No exemplo: Vimos que quando x = 5 a melhor predição para y é 6,50. No entanto, diz-se que ao se usar valores mais precisos de y, bo e b1, obtemos 6,47. Usando um NS de 95% determine o quão preciso é o valor 6,47. Se α = 0,05 t α/ = 4,303 1 4(6,5 3,5) E = 4,303(1,1) 1+ + = 4,303.1,1.1,5 = 7, 904 4 458 14 ( ) ( )

Continuando... yˆ E< y< yˆ + E 6, 47 7, 904 < y < 6, 47 + 7, 904 0,76 < y < 13,70 Para x = 5, estamos 95% certos de que o valor de y está entre 0,76 e 13,70. Vejam bem que, como o tamanho amostral é muito pequeno, o intervalo de predição é grande! Portanto, o valor de y pode variar muito em relação ao valor predito 6,47

Regressão múltipla Relação linear entre uma variável dependente y e duas ou mais variáveis independentes (x 1, x,..., x k ) ŷ = bo + b1x1+ bx +... + bkxk b 1, b,..., b k estimativas amostrais de β 1, β,..., β k β 1, β,..., β k coeficientes das variáveis independentes x 1, x,..., x k β o valor de y quando todas as variáveis são nulas (parâmetro populacional) b o estatística amostral e estimativa de β o Extremamente complicado. Exige o uso de pacotes estatísticos!

Regressão múltipla Coeficiente de determinação múltipla (R ): Avalia o ajuste da equação de regressão múltipla aos dados amostrais. Coeficiente de determinação múltipla ajustado: R modificado para levar em conta o número de variáveis e o tamanho amostral. R ajustado = 1 (n 1) (1 R [n (k + 1)] ) k = número de variáveis independentes (x 1, x,..., x k ) n = tamanho da amostra Valor P: Medida da significância da Eq. Reg. Múltipla

Exemplo: Regressão Múltipla Dados Colesterol Idade Altura Peso 5 58 180 76 17 168 65 740 3 18 81 49 31 174 79 30 8 17 69 316 46 176 75 590 41 169 61 466 56 171 91 11 0 173 79 578 54 167 63 78 17 160 70 65 73 173 84 50 5 186 86 65 5 17 68 73 9 173 94 7 17 180 107 97 41 156 80 75 5 194 99 138 3 168 75 139 0 177 6 Um estudo mostra os seguintes dados coletados no posto de saúde de um bairro da cidade. É possível predizer o nível de colesterol a partir da idade, altura e peso?

Exemplo: Regressão Múltipla y = 010,8 + 6,45*idade 11,67*altura + 1,5*peso Será que o uso de outras variáveis poderíamos melhorar a predição? Por exemplo, o uso de batimentos cardíacos (pulsação) ou o IMC.