Correlação e Regressão



Documentos relacionados
Estatística e Probabilidade

AULAS 13, 14 E 15 Correlação e Regressão

Esta aula foi compilada por alunos. Caso encontre erros, favor procurar no ou.

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

Análise de componentes principais (PCA)

Regressão Linear em SPSS

Objetivos: Construção de tabelas e gráficos, escalas especiais para construção de gráficos e ajuste de curvas à dados experimentais.

Distribuição de Freqüência

Correlação e Regressão Linear

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

AULAS 02 E 03 Modelo de Regressão Simples

Método dos mínimos quadrados - ajuste linear

INE Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

Introdução. Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou mais variáveis;

Faculdade Sagrada Família

Contabilometria. Aula 10 Grau de Ajustamento e Verificação das Premissas MQO

A função do primeiro grau

Correlação e Regressão

Análise de Regressão Linear Simples e Múltipla

Análise de regressão linear simples. Departamento de Matemática Escola Superior de Tecnologia de Viseu

AULAS 04 E 05 Estatísticas Descritivas

CRM e Prospecção de Dados

Métodos Matemáticos para Gestão da Informação

Departamento de Matemática - UEL Ulysses Sodré. Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 4 a LISTA DE EXERCÍCIOS GBQ12 Professor: Ednaldo Carvalho Guimarães AMOSTRAGEM

LISTA DE EXERCÍCIOS 2 INE 7001 PROF. MARCELO MENEZES REIS ANÁLISE BIDIMENSIONAL


canal 1 canal 2 t t 2 T

TUTORIAL SOBRE ANÁLISE DE REGRESSÃO

CAPÍTULO 5 APRESENTAÇÃO E ANÁLISE DOS RESULTADOS

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

Correlação e Regressão

AULAS 14, 15 E 16 Análise de Regressão Múltipla: Problemas Adicionais

Ajuste de Curvas. Ajuste de Curvas

Elementos de Estatística (EST001-B)

Tratamento de Dados Utilizando o SciDAVis Tutorial Parte 1 Como construir um gráfico e fazer um ajuste linear

Estatística descritiva. Também designada Análise exploratória de dados ou Análise preliminar de dados

REGRESSÃO LINEAR SIMPLES

UTILIZAÇÃO DE RECURSOS ESTATÍSTICOS AVANÇADOS DO EXCEL PREVISÃO

Análise Exploratória de Dados

Ferramentas da Qualidade. Professor: Leandro Zvirtes UDESC/CCT

Contabilometria. Aula 11 Regressão Linear Múltipla e Variáveis Dummy

QUEDA LIVRE. Permitindo, então, a expressão (1), relacionar o tempo de queda (t), com o espaço percorrido (s) e a aceleração gravítica (g).

Uma lei que associa mais de um valor y a um valor x é uma relação, mas não uma função. O contrário é verdadeiro (isto é, toda função é uma relação).

Tópico 8. Aula Prática: Movimento retilíneo uniforme e uniformemente variado (Trilho de ar)

Análise de Variância com dois ou mais factores - planeamento factorial

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

Tópico 11. Aula Teórica/Prática: O Método dos Mínimos Quadrados e Linearização de Funções

Estatística Aplicada Lista de Exercícios 7

AULAS 24 E 25 Análise de Regressão Múltipla: Inferência

Matemática para as Artes

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Probabilidade. Distribuição Normal

MOQ-23 ESTATÍSTICA. Professor: Rodrigo A. Scarpel

CI202 - Métodos Numéricos

7.4 As nuvens de perfis

4 Análise de Dados. 4.1 Perfil dos Respondentes

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

PRIMAVERA RISK ANALYSIS

Escolha de Portfólio. Professor do IE-UNICAMP

Correlação Canônica. Outubro / Versão preliminar. Fabio Vessoni. fabio@mv2.com.br (011) MV2 Sistemas de Informação

AVALIAÇÃO DO MODELO DE ONDAS

DIRETORIA DE PESQUISAS - DPE COORDENAÇÃO DE CONTAS NACIONAIS CONAC. Sistema de Contas Nacionais - Brasil Referência Nota Metodológica nº 18

Módulo 4 PREVISÃO DE DEMANDA

O modelo ANOVA a dois factores, hierarquizados

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type.

Universidade Federal Rural de Pernambuco

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

Medidas e Incertezas

INF Introdução a Interação Humano-Computador (IHC)

CURSO ON-LINE PROFESSOR GUILHERME NEVES

Probabilidades e Estatística

Estudar a relação entre duas variáveis quantitativas.

Pindyck & Rubinfeld, Capítulo 11, Determinação de Preços :: REVISÃO 1. Suponha que uma empresa possa praticar uma perfeita discriminação de preços de

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

COM A TÉCNICA DE REGRESSÃO LINEAR SIMPLES

EXCEL Público Alvo: Arquitetos Engenheiros Civis Técnicos em Edificações Projetistas Estudantes das áreas de Arquitetura, Decoração e Engenharia

Faturamento de Restaurantes

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas

FUNÇÕES. 1. Equação. 2. Gráfico. 3. Tabela.

Parte 1 Risco e Retorno

CAP. I ERROS EM CÁLCULO NUMÉRICO

Estatística Aplicada. Gestão de TI. Evanivaldo Castro Silva Júnior

O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão.

Pesquisa experimental

ESCOLA DR. ALFREDO JOSÉ BALBI UNITAU APOSTILA PROF. CARLINHOS NOME: N O :

Exemplo Regressão Linear Múltipla

Tomada de Decisão e Distribuições de Probabilidade. Lupércio França Bessegato

Valeska Andreozzi 2010

APLICAÇÕES DA DERIVADA

Estatística. Correlação e Regressão

Universidade da Beira Interior - Departamento de Matemática ESTATÍSTICA APLICADA À PSICOLOGIA I

Experimento 1. Estudo Prático da Lei de Ohm

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

Métodos Quantitativos. PROF. DR. Renato Vicente

Olá pessoal! Sem mais delongas, vamos às questões.

25 a 30 de novembro de 2013

GERAÇÃO DE VIAGENS. 1.Introdução

Transcrição:

Correlação e Regressão Análise de dados. Tópico Prof. Dr. Ricardo Primi & Prof. Dr. Fabian Javier Marin Rueda Adaptado de Gregory J. Meyer, University of Toledo, USA; Apresentação na Universidade e São Francisco, São Paulo, Brasil Julho,

Correlação e Regressão Mensura a relação entre variáveis Correlação = co- relação = co- variância = r Geralmente examina variáveis bidimensionais Mas diferenças de média entre grupos também podem ser expressas por meio da co- relação e.g., VI = DiagnósWco: Transtorno PsicóWco (codificado como ) vs. outros transtornos (codificados como ) VD = X- % como um índice de Acurácia Perceptual t- test comparando M PsychoWc vs. M Other de X- % pode ser expressa como a r do DiagnósWco com X- % i.e., r DiagnosWco - X- % r e t terão o mesmo valor de p ou de significância esta`swca

Correlação e Regressão Em geral as medidas estão associadas por relações lineares Mas existem técnicas para correlações e regressões não lineares Correlação Causalidade r s assumem valores entre -. e +. O sinal mostra a direção das relações Os valores absolutos mostram a magnitude da relação. = ausência de relação -. or +. = relação perfeita Visualizando as magnitudes das correlações "ForcedDegreeofCorrelaWon.sps"

var.......... var... var.. var. var......................

Correlation plot T_O T_O T_O T_O T_O T_O T_O T_O T_O T_O T_N T_N T_9N T_9N T_9N T_9N T_N T_N T_E T_E T_E T_E T_E T_E T_E T_E T_C T_C T_C T_C T_C T_C T_C T_C T_C T_A T_A T_A T_A T_A T_A T_A T_A T_A T_A T_A T_A T_A T_A T_A T_A T_A T_A T_C T_C T_C T_C T_C T_C T_C T_C T_C T_E T_E T_E T_E T_E T_E T_E T_E T_N T_9N T_N T_9N T_N T_9N T_N T_9N T_O T_O T_O T_O T_O T_O T_O T_O T_O T_O........

var.. var. var

Correlation plot T_Em T_Em T_Em T_Em T_Em T_9Em T_Em T_Em T_Sc T_Sc T_Sc T_Sc T_Sc T_Sc T_Sc T_9Sc T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_Ac T_9Sc T_Sc T_Sc T_Sc T_Sc T_Sc T_Sc T_Sc T_Em T_Em T_9Em T_Em T_Em T_Em T_Em T_Em........

Correlation plot SE Grit SlfSoc SlfEmo SlfAcd Locus ProSoc PeerProb HypAc EmoSym CndProb Open Neuro Extra Consc Agree Open Neuro Extra Consc Agree Agree Consc Extra Neuro Open Agree Consc Extra Neuro Open CndProb EmoSym HypAc PeerProb ProSoc Locus SlfAcd SlfEmo SlfSoc Grit SE........

9 RMG RG GF_GC EPN_EG

Correlação e Regressão DisWnção esta`swca Correlação variáveis randômicas, X e Y Nenhuma delas está sob controle do experimentador Regressão: variável fixa (X), variável randômica (Y) se presume X que está sobre controle do experimentador e somente os valores que interessam são estudados Essa diswnção é precisa tecnicamente mas não necessária no uwlização práwca das correlações e regressões

Fórmula r = N i = ( x i x ) ( y i y ) s x s y N ( ) r = N i = z xi z yi N

Produto- momento! A média do produto de dois momentos indicando co- relação Produto : mulwplicação de duas variáveis (X, Y) Momento: função aplicada a média de desvios z = ( X X) σ Momentos centrais: : o = Média, º = Variancia, º = Assimetria, o = Kurtose Os escores z são momentos Desvios da média em unidades de desvio padrão Co- relação: ocorrência simultânea together z para X pareado copm z para Y Então a correlação Produto- Momento de Pearson (r) é a magnitude média em que pares de escores (X, Y) se correlacionam por desviarem simultaneamente de suas respecwvas médias zxz r = N Y

Coeficiente de Correlação de Pearson - Produto Momento n Nota A Nota B : : : 9 9 9 9

Correlação e Regressão DisWnção PráWca Correlação: Magnitude de associação entre X e Y Ambas podem ser desenhadas no eixo horizontal (abscissa) porque ambas poderiam ser designadas como X Regressão: Usa a associação para desenvolver uma equação que prevê Y a parwr de X a parwr da melhor forma possível. "Regride Y em X" Desenha X no eixo horizontal; Y no eixo verwcal (ordenada)

r Produto Momento: Exemplo ID X Y M.. σ.. Sum Y Insira X andy no SPSS e calcule o r r XY =. X

Reta de regressão Equação preditora: Ŷ= b + b X X = valor do preditor Y = valor do critério Ŷ= valor predito Y b = inclinação da linha b = constante X

Equação da reta

Reta de regressão Melhor previsão de Y em relação aos valores de X Equação de previsão: Ŷ= b + b X Na qual: X = valor do preditor (variável preditora ou VI) Ŷ= valor previsto de Y (variável resposta ou VD ou critério) i.e., valor de Y na linha, dado X b = inclinação (slope) da linha, Mudança em Ŷ para uma mudança de - unidade de mudança em X b = r XY (S Y /S X ) b = constante (intercept) Ŷ quando X =. b = M Y b M X

Reta de regressão Gere a equação de regressão do exemplo no SPSS A equação de previsão minimiza os erros, definidos como Em que : SS Residual = (Y Ŷ) Y = valores observados (i.e., os valores do gráfico de dispersão) Ŷ= valores preditos na reta de regressão Portanto, SS Residual indica a extensão em que a linha não consegue prever os dados observados SS Resid na regressão é análogo ao SS WG na ANOVA i.e., variabilidade nas células que não pode ser explicada pelo modelo.

Reta de regressão: Exemplo SS Resid = (Y Ŷ) Sum of squared distances of each person's Y score from the line of predicwon Y X

Reta de regressão : Exemplo Equação de previsão: Ŷ= b + b X b = r XY (S Y /S X ) =.(./.) =. (Porque S Y = S X, r = b ; isso é raro acontecer) b = M Y b M X =.() =. =. Ŷ=. + (.)(X) ID X Y Ŷ M.. S.. Calcule Ŷ para cada X e.g., for X = Ŷ =. + (.)() =.

Reta de regressão : Exemplo Equação de previsão: Ŷ= b + b X b = r XY (S Y /S X ) =.(./.) =. (Porque S Y = S X, r = b ; isso é raro acontecer) b = M Y b M X =.() =. =. Ŷ=. + (.)(X) ID X Y Ŷ..... M.. S.. Calcule Ŷ para cada X e.g., for X = Ŷ =. + (.)() =.

Reta de regressão exemplo Y Ŷ= b + b X =. + (.)(X) X b =.; mudança no escore bruto de Ŷ para a unidade de mudança em X b =.; constante; valor de Ŷquando X =

Como na ANOVA, a análise de regressão parwciona a variância da variável dependente em componentes mutuamente exclusivos e exauswvos:. Aquilo que é explicado pelo modelo i.e., pela VI ou VIs. Aquilo que não pode ser explicado pelo modelo i.e., variância residual SS Total = SS Modelo + SS Residual Como definido, SS Residual = (Y Ŷ) Soma das distâncias ao quadrado de cada escore Y das pessoas em relação a reta de regressão (linha de predição)

Soma de Quadrados da Regressão SS Residual = (Y Ŷ) Soma das distâncias ao quadrado de cada escore Y das pessoas em relação a reta de previsão Y X

Soma de Quadrados da Regressão SS Total = (Y M Y ) Soma das distâncias ao quadrado de cada escore Y das pessoas em relação à média geral de Y i.e., numerador da variância de Y; total de variância na VD Y X

Soma de Quadrados da Regressão SS Modelo = (Ŷ M Y ) Soma das distâncias ao quadrado de cada escore predito Y (i.e., a linha) da média de Y Indica a variação na VD que pode ser explicada pelo modelo Os pontos observados de dados não são considerados; somente a comparação do modelo de Y tem relação à média de Y Y X

Soma de Quadrados da Regressão X Y X Y X Y SS Total = (Y MY) SS Model = (Ŷ MY) SS Residual = (Y Ŷ)

Saídas do SPSS (Output) Dados do Modelo: as Tabelas Tabelas da ANOVA SS Modelo é chamado SS Regression Variação (i.e., SS) é dividida pelo gl (df) correspondente para calcular- se a a variância (i.e., MS) MS = SS / df F é calculado por MS Modelo /MS Residual i.e., A variância explicada pelo modelo é maior do que a variância não explicada? Avaliar a significância usando df Numerador e df Denominador

Saídas do SPSS (Output) Dados do Modelo: as Tabelas ModeloTabelaSumária(Summary table) R =proporçãodavariânciatotal explicadapelomodelode regressão R = SS Model / SS Total No exemplo: R =. /. =. R = R = r YŶ No exemplo:r =. =. R = r YŶ =.

Saídas do SPSS (Output) Dados do Modelo: Tabela sumária (cont.) as Tabelas R ajustado = EsWmaWva do parâmetro populacional, ρ (rho) Em que p = # de preditores No exemplo a: Adj. R = - [(-.)(- )/(- - )] = - [(.*)/] =. Erro padrão da EsWmaWva (SEE) Indica o grau de incerteza na previsão SEE = MS Residual No exemplo: SEE =. =.9

Coeficientes de regressão: b, B, &β Indicam a mudança em Ŷ para cada a- unidade de mudança em X b = coeficiente de regressão não padronizado Mudança expressa em unidades do escore bruto Mudança no escore bruto Ŷpara uma unidade de mudança no escore bruto de X B = SPSS notação para b β (Beta) = coeficiente de regressão padronizado. Mudança expressa em unidades de desvio padrão (SD) Número de mudanças em SD em Ŷ para uma mudança de SD em X

Coeficientes de regressão: b, B, &β b pode ser muito maior que β (& vice versa) Isso dependerá da unidade de medida b = β quando: S X = S Y e.g., quando X e Y são escores z Interpretação b é empregado quando as unidades tenham um senwdo inerente e.g., renda, altura, peso β é empregado quando as métricas são arbitrárias e.g., maioria das escalas psicológicas Note: b para (constante) é o termo constante (intercept, b )

Pressupostos Correlação: como uma esta`swca descriwva não há assunções prévias Regressão: requer assunções Ambas relacionadas às distribuições condicionais

Distribuições Marginais e Condicionais Distribuições marginais: Distribuição de Y desconsiderando X i.e., Variância de Y transpassando todos os níveis de X: S Y Distribuição condicional: DistribuWção de Y condicionada em X i.e, Variância de Y em um dado valor de X: S Y X Considere as diferenças usando a sintaxe do SPSS "Marginal andcondiwonaldistribuwons.sps"

Distribuição marginal de Y_ 9......... -. -. -. -. -. Std. Dev =.99 Mean =. N =. -. -. -. Marginal Distribution of Y_

Distribuiçãocondicional de Y_

Duas assunções na regressão Normalidade: Y é normalmente distribuído para cada valor de X Procure por assimetria <. e curtose <. HomocedasWcidade: S de Y é constante quando calculado separadamente para cada valor específico de X; i.e., cada distribuição condicional Análogo à assunção de variâncias iguais dentro dos grupos no t- test ou ANOVA JusWfica o uso de um único MS Residual para: Calcular a significância esta`swca Determinar o erro padrão da eswmawva (SEE) SEE é simplesmente o SD das distribuições condicionais SEE = S Y X ( Y Yˆ ) SYX = = SY ( R ) N use N because estimated a and b from data