Associação entre duas variáveis quantitativas

Documentos relacionados
Prof. Lorí Viali, Dr.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Prof. Lorí Viali, Dr.

Análise de Regressão

Prof. Lorí Viali, Dr.

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Métodos Avançados em Epidemiologia

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Prof. Lorí Viali, Dr.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

1. CORRELAÇÃO E REGRESSÃO LINEAR

Estatística II Antonio Roque Aula 18. Regressão Linear

Análise Exploratória de Dados

REGRESSÃO NÃO LINEAR 27/06/2017

CORRELAÇÃO E REGRESSÃO

Análise de Regressão Linear Múltipla IV

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Regressão Linear Simples by Estevam Martins

Contabilometria. Aula 8 Regressão Linear Simples

O problema da superdispersão na análise de dados de contagens

Estatística Aplicada II CORRELAÇÃO. AULA 21 07/11/16 Prof a Lilian M. Lima Cunha

Capítulo 1. Exercício 5. Capítulo 2 Exercício

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

O problema da superdispersão na análise de dados de contagens

Escola Superior de Tecnologia de Viseu. Fundamentos de Estatística 2006/2007 Ficha nº 7

Cap. 11 Correlação e Regressão

Gabarito da Lista de Exercícios de Econometria I

Gráficos de Controle para Processos Autocorrelacionados

INSTITUTO POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

PRESSUPOSTOS DO MODELO DE REGRESSÃO

4 Critérios para Avaliação dos Cenários

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

Análise Exploratória de Dados

Métodos Experimentais em Ciências Mecânicas

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Análise de Regressão Linear Múltipla VII

2 Incerteza de medição

Covariância na Propagação de Erros

MODELOS DE REGRESSÃO PARAMÉTRICOS

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Regressão Linear Simples. Frases. Roteiro

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

3. Estatística descritiva bidimensional

Tabela 1. Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de menores de 5 anos para 20 países, 1992.

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

Análise de influência

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

Objetivos da aula. Essa aula objetiva fornecer algumas ferramentas descritivas úteis para

AULA EXTRA Análise de Regressão Logística

Tipo tratamento idade Tipo tratamento sexo

Tópicos Extras 2ª parte. Análise de Correlação e Regressão

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

REGRESSÃO E CORRELAÇÃO

Probabilidade e Estatística. Correlação e Regressão Linear

Aplicando o método de mínimos quadrados ordinários, você encontrou o seguinte resultado: 1,2

7 - Distribuição de Freqüências

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Testes não-paramétricos

CAPÍTULO 9 REGRESSÃO LINEAR PPGEP REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES UFRGS. Regressão Linear Simples

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Regressão Linear Múltipla. Frases. Roteiro

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

3 A técnica de computação intensiva Bootstrap

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

Dados ajustáveis a uma linha recta

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Capítulo 2. Modelos de Regressão

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

(B) Considere X = antes e Y = depois e realize um teste t para dados pareados e um teste da ANOVA de um DBC com 5 blocos. Compare os resultados.

Ajuste de Curvas Regressão. Computação 2º Semestre 2016/2017

Correlação. Frases. Roteiro. 1. Coeficiente de Correlação 2. Interpretação de r 3. Análise de Correlação 4. Aplicação Computacional 5.

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Análise de Variância. Comparação de duas ou mais médias

DELINEAMENTOS EXPERIMENTAIS

Elementos de Estatística e Probabilidades II

Modelo de Regressão Simples

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores.

Serão abordados nesse capítulo os modelos causais, utilizados como ferramentas para o desenvolvimento e análise desse trabalho.

Transcrição:

Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa e que passaram pelo processo de seleção que utlzou os tas testes. Para cada um dos funconáros fo regstrada a nota méda nos testes de cratvdade, racocíno mecânco, racocíno abstrato e habldade matemátca (notas de 0 a 26). Anda, após 6 meses da contratação, fo calculado um escore que ndca o seu desempenho profssonal (0 a 20). Pergunta: exste alguma relação entre o escore de desempenho dos funconáros e a nota méda nos testes?

Assocação entre duas varáves quanttatvas o Dagrama de dspersão: recurso gráfco que nos permte vsualzar o comportamento conjunto das duas varáves. o Coefcente de correlação lnear: mede a ntensdade da assocação lnear exstente entre as varáves. 2

Coefcente de Correlação Lnear Defnção: Medda de assocação lnear entre duas varáves quanttatvas (vara entre e +). Valores próxmos a +: ndcam forte relação lnear postva; Valores próxmos a -: ndcam forte relação lnear negatva; Valores próxmos a zero: ndcam ausênca de relação lnear. 3

Um breve parênteses... 4

Dferença entre correlação e causaldade A correlação não mplca necessaramente uma relação de causaldade. Ou seja, um dos eventos não necessaramente causa a ocorrênca do outro. Todava, a correlação pode ser uma psta... Não é porque (A) acontece juntamente com (B) que podemos afrmar que (A) causa (B). Por outro lado, se (A) e (B) apresentam relação de causaldade, então eles apresentarão correlação. 5

Dferença entre correlação e causaldade Assm, determnar se exste de fato uma relação de causaldade requer nvestgação adconal pos podem acontecer as seguntes stuações: (A) causa realmente (B); (B) pode ser a causa de (A); Um tercero fator (C) pode ser causa tanto de (A) quanto de (B); A correlação pode ser apenas uma concdênca, ou seja, os dos eventos não têm qualquer relação para além do fato de ocorrerem ao mesmo tempo. 6

Dferença entre correlação e causaldade Bolsa Famíla é paraquedas eletoral de Dlma no Norte/Nordeste (Estadão, /0/200) Quanto maor o peso do Bolsa Famíla no muncípo, maor a votação de Dlma Rousseff (PT). A petsta tem uma espéce de paraquedas eletoral que lhe garante um patamar mínmo de votos, especalmente nas regões onde o programa é mas mportante para a economa local. Em cerca de metade dos muncípos brasleros, o Bolsa Famíla atende pelo menos um terço das famílas (...) http://blogs.estadao.com.br/vox-publca/200/0//bolsa-famla-e-paraquedas-eletoral-de-dlma-no-nortenordeste/ 7

Dferença entre correlação e causaldade 8

Dferença entre correlação e causaldade 9

Dferença entre correlação e causaldade 0

Dferença entre correlação e causaldade Então, para você, o governo usou o Bolsa-Famíla como moeda de troca eletoral? Uma vez que o Bolsa-Famíla exste, ele gerou votos adconas para a presdente? Os gráfcos anterores são sufcentes para responder a estas perguntas?

Voltando ao Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa e que passaram pelo processo de seleção que utlzou os tas testes. Para cada um dos funconáros fo regstrada a nota méda nos testes de cratvdade, racocíno mecânco, racocíno abstrato e habldade matemátca (notas de 0 a 26). Anda, após 6 meses da contratação, fo calculado um escore que ndca o seu desempenho profssonal (0 a 20). Pergunta: exste alguma relação entre o escore de desempenho dos funconáros e a nota méda nos testes?

Voltando ao Exemplo r XY 0,76 Desempenho vs Nota Méda 3

Voltando ao Exemplo Perguntas: a) Qual modelo estatístco você propora para estudar a relação entre o escore de desempenho dos funconáros e a nota méda nos testes? b) Qual método de estmação você utlzara para encontrar os estmadores dos parâmetros do modelo proposto? Esses estmadores apresentam boas propredades? c) A varável nota méda nos testes é relevante para explcar o escore médo de desempenho dos funconáros? d) Qual a estmatva para o escore de desempenho de funconáros que obtveram nota méda gual a 3 nos testes?

Análse de Regressão Lnear Smples I Aula 0 Gujarat e Porter Capítulos 2 e 3 Wooldrdge Seções 2.2 e 2.3

Análse de Regressão Regressão Técnca Estatístca utlzada para nvestgar e modelar a relação entre varáves. Objetvo Na stuação em que mutas varáves estão envolvdas, estudar o efeto que algumas varáves exercem nas outras. Este estudo consstra na construção e análse de uma relação matemátca entre as varáves (no geral, uma varável em função das outras). 6

Análse de Regressão Na termnologa de regressão, a varável que está sendo estudada é chamada de varável dependente ou resposta, comumente denotada por Y. Já as varáves (ou a varável) que estão sendo usadas para explcar a varável dependente são chamadas de varáves ndependentes, explcatvas ou regressores, comumente denotadas por X, X 2,..., X k. A análse de regressão consste em estudar como alterações nas varáves explcatvas nfluencam a varável resposta. 7

Análse de Regressão O tpo mas smples de análse de regressão, envolvendo uma varável explcatva (ou ndependente) e uma varável resposta (ou dependente), é chamado de regressão lnear smples. A análse de regressão envolvendo duas ou mas varáves explcatvas é chamada de análse de regressão lnear múltpla. 8

Regressão Lnear Smples Defnção A função E(Y X) é chamada regressão de Y em X. Aqu, será abordado um mportante modelo de regressão, o modelo de regressão lnear, no qual E(Y X) é uma função lnear nos parâmetros. Vale observar que a relação matemátca exstente entre Y (varável resposta) e X (varável explcatva) pode ser qualquer.

Voltando ao Exemplo Qual forma funconal você propora para estudar a relação entre o escore de desempenho dos funconáros e a nota méda nos testes? Y X x β0 β x E

Observações Duas amostras obtdas do mesmo teste de aptdão (X) não teram obrgatoramente que apresentar o mesmo resultado no que dz respeto ao desempenho (Y), mas valores em torno de um valor 0 + x (reta). Não esperamos uma relação perfeta entre as varáves nota méda nos testes e escore de desempenho dos funconáros, uma vez que outros fatores não controlados como, por exemplo, tempo de experênca na função também podem nfluencar na explcação da varável escore de desempenho. 2

Regressão Lnear Smples y Y X x β0 β x E y Modelo x ε β0 β x ε E Y X Característca comum Característca específca

Regressão Lnear Smples Observação É comum supor que os, =, 2,..., n, sejam varáves aleatóras dentcamente dstrbuídas, qualquer que seja o valor do regressor, que em mutos casos é consderado aleatóro. 23

Regressão Lnear Smples E(Y x) como uma função lnear de x, onde para todo x a dstrbução de Y é centrada sobre E(Y x) f Y x (y) y.. E(Y x) = 0 + x x x 2

Regressão Lnear Smples Observação 2 Vale salentar que o termo regressão lnear sgnfca regressão lnear nos parâmetros, ou seja, modelos da forma ou da forma y = 0 + x 2 + ln(y ) = 0 + ln(x ) + também serão consderados regressões lneares. 25

O parâmetro Regressão Lnear Smples E(Y X=x) = 0 + x, que representa a méda da v.a. Y, condconal a X = x, será estmado por Abuso de notação E(Y X x) yˆ βˆ 0 βˆ x b 0 b x em que βˆ 0 b e βˆ 0 b são estmatvas para β0 e β. 26

Regressão Lnear Smples Anda, a quantdade Abuso de notação ˆ y - ŷ y - ( ˆ 0 ˆ x ),, 2,..., n. será chamada de resíduo. Assm, o valor ˆ por prever y ( =, 2,..., n) a partr de pode ser encarado como o erro cometdo ŷ. 27

Regressão Lnear Smples y 4. 4 ˆ { ˆ ˆ ŷ 0 x y 3 y 2 ˆ 2 {.. } ˆ 3 Abuso de notação y. } ˆ x x 2 x 3 x 4 x 28

Voltando ao Exemplo Qual método de estmação você utlzara para, com base numa dada amostra, encontrar as estmatvas dos parâmetros do modelo de regressão lnear smples anterormente proposto? Y x β0 β x E 29

Estmação Qual método de estmação utlzar? Um procedmento bastante utlzado em Econometra para obter estmadores é aquele que se basea no prncípo dos mínmos quadrados ordnáros (MQO), ntroduzdo por Gauss em 794. 30

Idea! Mínmos Quadrados Ordnáros Quanto menor for o erro quadrátco total ( 2 ), melhor será a estmatva. Isso nos sugere procurar a estmatva que torne mínma essa soma de quadrados. Matematcamente, o problema passa a ser o de encontrar os valores de 0 e que mnmzem a função S n 2 0, y 0 x n 2 3

Mínmos Quadrados Ordnáros O mínmo da função é obtdo dervando-a em relação a 0 e, e gualando o resultado a zero, o que resulta ( 0; ) 0 S e ( ; ) 0 0 S 0 32

Dervando... n n x y S 2 0 2 0, n y x S 0 0 0 2, n x x y S 0 0 2, Mínmos Quadrados Ordnáros Voltando à função de nteresse: 33

Igualando a zero a dervada em relação ao parâmetro 0, 0, 0 S vem que: Mínmos Quadrados Ordnáros 0 n 2y yˆ ˆ ˆ x 0 0 Nota: va condção de prmera ordem, notamos que a soma dos resíduos, no modelo de regressão lnear com ntercepto, é sempre gual a zero.

Igualando a zero a dervada em relação ao parâmetro, vem que: Mínmos Quadrados Ordnáros S 0 0, n 2 ˆ ˆ ˆ y x x 0 0 Nota: va condção de prmera ordem, notamos que a covarânca entre os resíduos e o regressor é sempre gual a zero.

Assm, Mínmos Quadrados Ordnáros 36 n n n n n x n y x y 0 0 ˆ ˆ ˆ ˆ Abrndo o somatóro da gualdade y x 0 ˆ ˆ 0 ˆ ˆ 2 0 n x y vem que:

Substtundo na gualdade anteror, não é dfícl obter: Mínmos Quadrados Ordnáros 37 Anda, abrndo o somatóro da gualdade vem que: 0 ˆ ˆ 2 0 n x x y n n n x x y x 2 0 0 ˆ ˆ y x 0 ˆ ˆ

Mínmos Quadrados Ordnáros ˆ n x n y x 2 x y (x x)(y y) SXY SY r 2 2 2 XY x (x x) SX SX Dessa forma, a equação estmada por mínmos quadrados fca dado por Abuso de notação ˆ ˆ ˆ x 0 y,

Desempenho Voltando ao Exemplo Quas as estmatvas dos parâmetros do modelo de regressão lnear smples de nteresse? 40 20 00 80 60 40 20 00 0.00 5.00 0.00 5.00 20.00 25.00 30.00 Nota méda Abuso de notação yˆ 68,5, 8x Como tas estmatvas devem ser nterpretadas?

Regressão Lnear Smples y Parâmetros 0 é o ntercepto; coefcente angular da reta de regressão E(Y X x) x Na prátca, nem sempre 0 (ntercepto) apresenta nterpretação. x ε β0 β x ε E Y X Observação β 40

Voltando ao Exemplo Abuso de notação yˆ 68,5, 8x 68,5: valor médo do desempenho dos funconáros que traram méda gual a zero nos testes de admssão.,8: varação méda no desempenho dos funconáros, quando aumenta-se a nota méda obtda nos testes de admssão em undade. 4

Mínmos Quadrados Ordnáros Exercíco Encontre a matrz hessana e verfque sob quas condções a mesma é defnda como postva. Anda, dscuta se os estmadores encontrados geram o mínmo da função de nteresse. 42

Voltando ao Exemplo Abuso de notação yˆ 68,5, 8x O modelo de regressão proposto está bem ajustado? Como medr a qualdade de ajuste do modelo?

Objetvo Construr uma medda que ndque, mesmo que de modo mperfeto, a qualdade do ajuste do modelo de regressão. Coefcente de determnação (ou de explcação) R 2 44

Somas de Quadrados y ŷ y ˆ ˆ 0 x y - y : erro ao se prever y pela méda geral y - ŷ: erro ao se prever y pelo valor estmado para E(Y X) ŷ - y : ganho ao se prever y pelo valor estmado para E(Y X) em comparação ao se prever y pela méda geral

Somas de Quadrados y ŷ y ˆ ˆ 0 x n SST y n SSR y 2 - y 2 - ŷ n SSE ŷ 2 - y SST: soma de quadrados total SSR: soma de quadrados devdo aos resíduos SSE: soma de quadrados devdo à explcação (modelo de regressão)

Coefcente de Determnação (R 2 ) Resultado: SST = SSE + SSR Parcela da varabldade de y que é explcada pelos regressores do modelo Parcela da varabldade de y que não é explcada pelos regressores do modelo R 2 SSE SST SSR SST Proporção da varabldade total de y que é explcada pelos regressores do modelo adotado.

Desempenho Voltando ao Exemplo 40 20 00 80 60 40 R 2 SSE SST 0,5808 20 00 0,00 5,00 0,00 5,00 20,00 25,00 30,00 Nota méda SST n 2 y - y 4.593, SSR n 2 y - ŷ 925,3 SSE n 2 ŷ - y 2.667,7 SST-SSE

Desempenho Voltando ao Exemplo 40 20 00 80 60 40 R 2 SSE SST 0,5808 20 00 0,00 5,00 0,00 5,00 20,00 25,00 30,00 Nota méda Interpretação: 58% das varações no desempenho dos funconáros após 3 meses de trabalho são explcadas pela nota méda obtda nos testes de admssão.

Desempenho Voltando ao Exemplo 40 20 00 80 60 40 R 2 SSE SST 0,5808 20 00 0,00 5,00 0,00 5,00 20,00 25,00 30,00 Nota méda Conclusão: Parece que a nota méda obtda é relevante para a explcação do desempenho dos funconáros, uma vez que tal regressor explca mas da metade das varações da varável resposta.

Coefcente de Determnação (R 2 ) Exercíco Prove que, no caso do modelo de regressão lnear smples com ntercepto, o coefcente de correlação lnear de Pearson elevado ao quadrado é gual ao coefcente de explcação (ou determnação) R 2. Ou seja, R SSE S 2 2 XY ˆ 2 SST SxxSYY S S XY YY