Estatística Aplicada II. } Correlação e Regressão

Documentos relacionados
Métodos Empíricos de Pesquisa I. } Análise Bidimensional

Estatística Aplicada I. } Análise Bidimensional

Estatística Aplicada II. } Regressão Linear

Modelos de Regressão Linear Simples - parte II

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento

Módulo 2 AVALIAÇÃO DA DEMANDA EM TRANSPORTES

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Definição Há correlação entre duas variáveis quando os valores de uma variável estão relacionados, de alguma maneira, com os valores da outra variável

Modelos de Regressão Linear Simples - parte III

Virgílio A. F. Almeida DCC-UFMG 2005

Correlação e Regressão Linear

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

3 3. Variáveis Aleatórias

Prof. Lorí Viali, Dr.

Esse material foi extraído de Barbetta (2007 cap 13)

Métodos Quantitativos

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

Cap. 13 Correlação e Regressão

AULAS 14 E 15 Modelo de regressão simples

Modelo de Regressão Múltipla

Seja (X,Y) uma v.a. bidimensional contínua ou discreta. Define-se valor esperado condicionado de X para um dado Y igual a y da seguinte forma:

Medidas de Dispersão para uma Amostra. Conteúdo: AMPLITUDE VARIÂNCIA DESVIO PADRÃO COEFICIENTE DE VARIAÇÃO

Estatística Aplicada ao Serviço Social

Física Geral - Laboratório. Aula 8: Estimativas e erros em medidas indiretas: Ajuste de funções

Análise de Regressão Linear Simples e

Estatística Descritiva (III) Associação entre Variáveis

Estatística Aplicada II. } Estimação e Intervalos de Confiança

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Estatística CORRELAÇÃO E REGRESSÃO LINEAR. Prof. Walter Sousa

Aula 2 Uma breve revisão sobre modelos lineares

Métodos Quantitativos Aplicados

Estatística aplicada ao Melhoramento animal

RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO

Análise de regressão linear simples. Diagrama de dispersão

Noções sobre Regressão

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada

Exemplo 1. Conjunto de dados de uma amostra de 12 meninas da escola: y i x i

CORRELAÇÃO E REGRESSÃO

Introdução ao modelo de Regressão Linear

Correlação e Regressão

Correlação e Regressão

CORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011

AULAS 14 E 15 Modelo de regressão simples

Análise Multivariada Aplicada à Contabilidade

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

Química Analítica V 2S Prof. Rafael Sousa. Notas de aula:

RESPOSTAS - PROVA ESTATÍSTICA AGENTE PF 2018

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Medidas de localização (ou de tendência central) Média: definida como o centro de massa (ou ponto de equilíbrio) do conjunto.

Anexo 1 - Revisões de Teoria das Probabilidades e Processos Estocásticos

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

Regressões: Simples e MúltiplaM. Prof. Dr. Luiz Paulo Fávero 1

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

PARTE 1 ANÁLISE DE REGRESSÃO COM DADOS DE CORTE TRANSVERSAL CAPÍTULO 2 O MODELO DE REGRESSÃO SIMPLES

RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA

Delineamento e Análise Experimental Aula 4

Física Geral - Laboratório. Aula 3: Estimativas e erros em medidas diretas (I)

Exercícios Selecionados de Econometria para Concursos Públicos

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

1 semestre de 2014 Gabarito Lista de exercícios 3 - Estatística Descritiva III C A S A

DATA MINING & MACHINE LEARNING (I) Thiago Marzagão

Modelos de Regressão Múltipla - Parte I

Física Geral - Laboratório (2013/1) Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Química Analítica V 1S Prof. Rafael Sousa. Notas de aula:

Análise de Regressão EST036

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Estatística Descritiva (III) Associação entre Variáveis

ESTATÍSTICA E BIOESTATÍSTICA

INSTITUTO POLITÉCNICO DE SETÚBAL ESCOLA SUPERIOR DE SAÚDE ESTATÍSTICA. Cursos: Licenciatura em Enfermagem

14/3/2012. S = Σ (x i x ) 2 QUÍMICA ANALÍTICA V 1S Prof. Rafael Sousa. Para casa. Dispersão de uma medida em relação à média

EXAME DE ESTATÍSTICA / ESTATÍSTICA I

Ralph S. Silva

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Aula de hoje. administração. São Paulo: Ática, 2007, Cap. 3. ! Tópicos. ! Referências. ! Distribuição de probabilidades! Variáveis aleatórias

EXAME DE ESTATÍSTICA / ESTATÍSTICA I

VERIFICAÇÃO DOS RECURSOS NECESSÁRIOS. Capítulo 1 VARIÁVEIS E AMOSTRAS 1

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

ANÁLISE DE REGRESSÃO

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Os exercícios abaixo podem ser resolvidos sob a forma de algoritmos ou programas Pascal

Estatística Aplicada II. } Revisão: Probabilidade } Propriedades da Média Amostral

Transcrição:

Estatística Aplicada II } Correlação e Regressão 1

Aula de hoje } Tópicos } Correlação e Regressão } Referência } Barrow, M. Estatística para economia, contabilidade e administração. São Paulo: Ática, 2007, Cap. 7 2

Aula de hoje Objetivos: } Analisar os movimentos simultâneos de variáveis: } Entender o grau de relação linear entre elas através do cálculo do coeficiente de correlação } Entender a causalidade entre elas através da análise de regressão 3

Correlação

Exemplo: Renda familiar e gastos com alimentação (em % da renda) } Como esperado, à medida em que aumenta a renda familiar, diminui o percentual da renda destinado à alimentação Família Renda Total Gasto em Alimentação A 12 7,2 B 16 7,4 C 18 7,0 D 20 6,5 E 28 6,6 F 30 6,7 G 40 6,0 H 48 5,6 I 50 6,0 Renda Total 70 60 50 40 30 20 L 60 5,0 10 4,5 5,5 6,5 7,5 Gasto com Alimentação

Exemplo livro (Bussab-Morettin), p.81 } Consideremos as duas variáveis abaixo Número de anos de serviço (X) por número de clientes de agentes de uma cia de seguros Agente Anos de Número de serviço (X) clientes A 2 48 B 3 50 C 4 56 D 5 52 E 4 43 F 6 60 G 7 62 H 8 58 I 8 64 J 10 72 Dados hipotéticos

Exemplo livro (Bussab-Morettin), p.81 } Gráfico de Dispersão 80 70 Número de Clientes 60 50 40 30 20 10 0 0 2 4 6 8 10 12 Anos de Serviço Dados hipotéticos

Covariância } Dados n pares de valores (x 1, y 1 )..., (x n, y n ), chamaremos de covariância entre as variáveis X e Y, na população: cov( X, Y) n i = = 1 ( x x)( y y) } Para calcular a covariância na amostra, devemos dividir por n-1 e não por n } É a média dos produtos dos valores centrados das variáveis } Tendo esta definição, podemos escrever o coeficiente de correlação como: corr ( X, Y) = i n cov( X, Y) dp( X ). dp( Y) i 8

Características da covariância } Das expressões da covariância, população e amostra: } As duas variáveis devem ter o mesmo número de dados. } Os pares de dados ocorrem ao mesmo tempo, são pares casados. Embora possa parecer redundante, é importante observar que não se pode mudar a ordem de uma única variável; a mudança de ordem deverá ser realizada nas duas amostras sem descasar os pares de dados. 9

Características da covariância } A covariância é: } No caso de população, a soma dos produtos dos desvios de duas variáveis dividida pela quantidade de dados das variáveis. } No caso de amostra, a soma dos produtos dos desvios de duas variáveis dividida pela quantidade de dados das variáveis menos um. } Os numeradores das expressões da covariância para população e para amostra são iguais, o resultado da soma dos produtos dos desvios. 10

A covariância pode ser nula, negativa ou positiva. A covariância é a medida do afastamento simultâneo das respectivas médias. Se as ambas variáveis aleatórias tendem a estar simultaneamente acima, ou abaixo, de suas respectivas médias, então a covariância tenderá a ser positiva e nos outros casos poderá ser negativa, como mostram os gráficos abaixo. Vendas 700 600 500 400 300 200 100 0 27 380 0 10 20 30 40 50 60 Propaganda Ação B 14% 13% 12% 11% 10% 9% 8% 10,3% 10,8% Ação A 8% 9% 10% 11% 12% 13% A maioria dos pares de valores tem os dois valores acima de sua média correspondente, provocando covariância positiva. A maioria dos pares de valores tem um valor acima de sua média e outro abaixo da média correspondente, provocando covariância negativa. 11

3 Coeficiente de correlação = 0,81 4 Coeficiente de correlação = -0,81 2 3 1 2 Y 0 Y 1 0-1 -1-2 -2-3 -3-2 -1 0 1 2 3 X -3-3 -2-1 0 1 2 3 X O gráfico de dispersão da esquerda mostra uma relação direta ou positiva entre as variáveis X e Y, tendência destacada pela declividade positiva da elipse tracejada. Enquanto o gráfico de dispersão da direita mostra uma relação inversa ou negativa, tendência também destacada pela declividade negativa da elipse tracejada. 12

Características da covariância } A covariância de uma variável e ela mesma é a própria variância da variável, seja no caso de população ou amostra. Como Y = X, σ XX = N i=1 (X i µ X ) (X i µ X ) N } A permutação das variáveis não altera o resultado da covariância, se os pares de valores não forem alterados = N i=1 (X i µ X ) 2 N = σ X 2 σxy = σ YX 13

Características da covariância } } Da mesma forma que a variância, a covariância é afetada pelos valores extremos da variável, ela não é uma medida resistente. A unidade de medida é o resultado do produto das unidades dos valores das variáveis. 14

Coeficiente de correlação } Para facilitar o entendimento da relação entre duas variáveis e evitar a influência da unidade de medida, foi definido o coeficiente de correlação r XY. } Os valores de r XY estão limitados entre os valores -1 e +1, e sem nenhuma unidade de medida 15

Coeficiente de correlação } O coeficiente de correlação busca auferir a direção da relação entre as variáveis, dentro de um intervalo determinado entre -1 e 1 } O objetivo do intervalo é discriminar a direção e a intensidade da relação: } valores próximos de zero indicam ausência de relação entre as variáveis } valores próximos de 1 indicam forte relação positiva } valores próximos de -1 indicam forte relação negativa

Coeficiente de correlação } O coeficiente de correlação é a medida do grau de associação linear entre duas variáveis } Fórmula do coeficiente de correlação: corr(x,y ) = 1 n " $ # x i x dp(x) %" ' $ &# y i y dp(y ) % ' &

Cálculo do coeficiente de correlação Agente Anos de serviço (X) Número de clientes x x y zx.zy A 2 48-3,7-8,5-1,54-1,05 1,608 B 3 50-2,7-6,5-1,12-0,80 0,897 C 4 56-1,7-0,5-0,71-0,06 0,043 D 5 52-0,7-4,5-0,29-0,55 0,161 E 4 43-1,7-13,5-0,71-1,66 1,173 F 6 60 0,3 3,5 0,12 0,43 0,054 G 7 62 1,3 5,5 0,54 0,68 0,366 H 8 58 2,3 1,5 0,95 0,18 0,176 I 8 64 2,3 7,5 0,95 0,92 0,882 J 10 72 4,3 15,5 1,78 1,91 3,407 Total 57 565 0 0 8,768 y x x dp ( X ) = z x y y = dp ( Y ) z y Para calcular o coeficiente de correlação, devemos dividir o somatório dos valores da última coluna (8,77) pelo número de observações (n=10) Então: Corr(X,Y) = 8,77/10=0,877

Coeficiente de correlação } O coeficiente de correlação pode ser escrito da seguinte forma: corr(x,y ) = 1 n corr(x,y ) = " x i x %" y $ ' i y % $ ' # dp(x) &# dp(y )& x i y i nxy ( x 2 i nx 2 ) y 2 i ny 2 ( ) } Lembremos da variância, que usamos para observar a dispersão de uma só variável 19 var( X ) n i = = 1 ( x x) i n 2 Sendo que -1 corr(x,y) 1

Voltando ao coeficiente de correlação } Da fórmula do coeficiente de correlação pode-se obter também a covariância das mesmas variáveis quando conhecidos os desvios padrões correspondentes: σ XY = rxy σx σy 20

Características de r } Se a variável Y é a mesma variável X, então o coeficiente de correlação é igual a 1: r XX = σ σxx σ X X = σ σ 2 X 2 X = 1 } A permutação das variáveis não altera o resultado do coeficiente de correlação, se os mesmos pares de valores forem mantidos. r XY = r YX 21

r = +1 22

r = -1 23

r = 0 24

25

26

Os resultados são significantes? Ø H 0 : r = 0 H 1 : r 0 Ø A estatística do teste é: t = r n 2 1 r 2 Ø A qual tem distribuição t com n-2 graus de liberdade 27

Teste de Hipótese } As etapas do teste são: 1. Escrever as hipóteses alternativas e nulas 2. Escolher o nível de significância do teste α 3. Calcular a estatística t, conhecida como a estatística do teste 4. Calcular o valor crítico do teste t *, 5. Decidir: Comparar a estatística do teste t com o valor crítico do teste t *, 28

Regressão Linear Simples Ø Modelo linear para explicar a variável Y, denominada variável dependente, explicada ou endógena como função da variável X, denominada variável independente, explicativa ou exógena 29

Regressão Linear Simples 60 Birth rate 50 40 Y ˆ = a + bx 32.6 30 20 10 0-1.0 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 Growth rate 30

Regressão Linear Simples 40 Birth rate 35 30 error, e 25 3 3.5 4 Growth rate 31

Regressão Linear Simples Ø A relação entre valor observado de Y e valor previsto de Y pelo modelo é dada por: Y = Yˆ + e Y = a + bx + e 32

Regressão Linear Simples Ø Os valores de a e b são dados pela minimização da soma do quadrado dos erros. Tem-se: e e b n n XY X 2 X Y ( X ) 2 a Y bx 33

Regressão Linear Simples 35 TSS component Y i Yˆi Y RSS component 30 2 3 Growth rate X 2.8 34

Regressão Linear Simples Ø Mensuração da qualidade do ajuste: R 2 RSS TSS Em que: 2 2 2 TSS Y Y Y ny 2 ESS Y Yˆ 35