Probabilidade e Estatística. Correlação e Regressão Linear



Documentos relacionados
Probabilidade e Estatística. Correlação e Regressão Linear

Introdução à Análise de Dados nas medidas de grandezas físicas

Professor Mauricio Lutz CORRELAÇÃO

CORRELAÇÃO E REGRESSÃO

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

NOTA II TABELAS E GRÁFICOS

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

Covariância e Correlação Linear

Regressão e Correlação Linear

Análise de Regressão

PARTE Apresente as equações que descrevem o comportamento do preço de venda dos imóveis.

Introdução e Organização de Dados Estatísticos

Y X Baixo Alto Total Baixo 1 (0,025) 7 (0,175) 8 (0,20) Alto 19 (0,475) 13 (0,325) 32 (0,80) Total 20 (0,50) 20 (0,50) 40 (1,00)

Associação entre duas variáveis quantitativas

Estatística stica Descritiva

Apostila de Estatística Curso de Matemática. Volume II Probabilidades, Distribuição Binomial, Distribuição Normal. Prof. Dr. Celso Eduardo Tuna

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Regressão Múltipla. Parte I: Modelo Geral e Estimação

2ª Atividade Formativa UC ECS

1. CORRELAÇÃO E REGRESSÃO LINEAR

3ª AULA: ESTATÍSTICA DESCRITIVA Medidas Numéricas

Prof. Lorí Viali, Dr.

Medidas de Dispersão e Assimetria Desvio Médio Variância Desvio Padrão Medidas de Assimetria Coeficiente de Assimetria Exemplos.

Trabalho e Energia. Definimos o trabalho W realizado pela força sobre uma partícula como o produto escalar da força pelo deslocamento.

INTRODUÇÃO SISTEMAS. O que é sistema? O que é um sistema de controle? O aspecto importante de um sistema é a relação entre as entradas e a saída

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

PROVA DE MATEMÁTICA DO VESTIBULAR 2013 DA UNICAMP-FASE 1. RESOLUÇÃO: PROFA. MARIA ANTÔNIA C. GOUVEIA

TEORIA DE ERROS * ERRO é a diferença entre um valor obtido ao se medir uma grandeza e o valor real ou correto da mesma.

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3

Contabilometria. Aula 8 Regressão Linear Simples

Estatística II Antonio Roque Aula 18. Regressão Linear

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Consideraremos agora, uma de cada vez, as equivalentes angulares das grandezas de posição, deslocamento, velocidade e aceleração.

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 1 Revisões de Estatística

Introdução. Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou mais variáveis;

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

METROLOGIA E ENSAIOS

são os coeficientes desconhecidos e o termo ε (erro)

Fast Multiresolution Image Querying

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4

Análise Exploratória de Dados

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Uso dos gráficos de controle da regressão no processo de poluição em uma interseção sinalizada

ESPELHOS E LENTES ESPELHOS PLANOS

O problema da superdispersão na análise de dados de contagens

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

As tabelas resumem as informações obtidas da amostra ou da população. Essas tabelas podem ser construídas sem ou com perda de informações.

CAPÍTULO VI Introdução ao Método de Elementos Finitos (MEF)

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

MODELOS DE REGRESSÃO PARAMÉTRICOS

Distribuição de Massa Molar

1 Princípios da entropia e da energia

7 - Distribuição de Freqüências

LQA - LEFQ - EQ -Química Analítica Complemantos Teóricos 04-05

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

Experiência V (aulas 08 e 09) Curvas características

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES


MEDIDAS DE TENDÊNCIA CENTRAL

CENTRO UNIVERSITÁRIO DO LESTE DE MINAS GERAIS - UnilesteMG

Física. Física Módulo 1 Vetores, escalares e movimento em 2-D

Prof. Antônio Carlos Fontes dos Santos. Aula 1: Divisores de tensão e Resistência interna de uma fonte de tensão

5.1 Seleção dos melhores regressores univariados (modelo de Índice de Difusão univariado)

2. VARIÁVEIS ALEATÓRIAS

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Transcrição:

Probabldade e Estatístca Correlação e Regressão Lnear

Correlação Este uma correlação entre duas varáves quando uma delas está, de alguma forma, relaconada com a outra. Gráfco ou Dagrama de Dspersão é o método gráfco feto sobre dos eos, e, que representa a correção entre as varáves.

Dagramas de Dspersão Um dagrama de dspersão mostra a relação entre duas varáves quanttatvas, meddas sobre os mesmos ndvíduos. Os valores de uma varável aparecem no eo horzontal, e os da outra, no eo vertcal. Cada ndvíduo aparece como o ponto do gráfco defndo pelos valores de ambas as varáves para aquele ndvíduo

Varáves Varável: característcas ou tens de nteresse de cada elemento de uma população ou amostra Também chamada parâmetro, posconamento, condção... Duas varáves estão relaconadas se a mudança de uma provoca a mudança na outra. Eemplo: velocdade consumo combustível O eo geralmente é um parâmetro.

Eemplos Fabrcação Número de peças produzdas e número de peças defetuosas Construção Número de falhas em uma obra e a satsfação méda dos produtvos Das de atraso de entrega número de das chuvosos Fnancero Méda de tempo de atraso de pagamento e número de erros de fatura Vendas % de móves venddos na data de entrega da obra satsfação méda dos clentes nos últmos 10 empreendmentos.

Eemplo - Peso altura Peso (kg) Altura (m) 80 1,80 85 1,83 50 1,65 70 1,90 55 1,60 77 1,80 85 1,78 93 1,86 65 1,70 60 1,65 Pesos 1,9 1,8 1,7 1,6 1,5 Peso Altura 40 50 60 70 80 90 100 Altura

Eemplo Peso Altura Estratfcando Peso (kg) Altura homens (m) Altura Mulheres (m) 80 1,80 --- 85 1,83 50 --- 70 --- 55 --- 77 1,80 85 --- 93 1,86 65 1,70 60 --- --- 1,65 1,90 1,60 --- 1,78 --- --- 1,65 P e s o s 110 90 70 50 30 10 Peso Altura (por seo) Homens Mulheres 1,5 1,6 1,7 1,8 1,9 Alturas

Dcas Eo Varável que é alterada por uma modfcação no processo (varável ndependente) Geralmente uma possível causa de um problema Eo Varável que pode mudar de acordo com a mudança da varável em (varável dependente) Geralmente um ndcador de qualdade ou efeto gerado por uma causa.

Analsando Dagramas de Dspersão Os aspectos abao são relevantes na análse dos Dagramas: DIREÇÃO FORMA (lnear, não-lnear, aglomerados) PONTOS DISCREPANTES

Interpretando Padrões de Dspersão Quanto maor a correlação, mas próma de uma reta a 45 o ou 135 o será a dstrbução.

Interpretando Grau de Relaconamento

Problemas da Análse Gráfca A análse gráfca da relação entre varáves é mportante, mas os olhos nem sempre são um bom juz da ntensdade de uma relação lnear. Os dagramas a segur lustram precsamente os mesmos dados, mas o gráfco nferor é menor em um campo mas amplo.

Problemas da Análse Gráfca Nossos olhos podem ser enganados por uma mudança de escalas, ou pela quantdade de espaço em branco em torno do aglomerado dos pontos. Deve-se, então, utlzar uma medda numérca para suplementar o gráfco. Coefcente de Correlação Lnear (r)

Coefcente de Correlação Lnear r mede o grau de relaconamento lnear entre valores emparelhados e em uma amostra. Mede a ntensdade e a dreção da relação lnear entre duas varáves quanttatvas Chamado também de Coefcente de Correlação de Pearson (Karl Pearson, 1857-1936).

Coefcente de Correção Lnear ou Coefcente de Pearson n S 1 ) ( n S 1 ) ( n S 1 ) )( ( S S S r. -1 r 1 ) ( ) ( n S ) ( ) ( n S ) )( (. n S

Coefcente de Correção Lnear ou Coefcente de Pearson ( ) ( )( ) ( ) ( ) 1 1 r n n n r

Interpretando o Coefcente de Correlação Lnear r sempre será um valor entre -1 r 1 Quanto mas prómo de 1: maor correlação negatva Quanto mas prómo de 1: maor correlação postva Quanto mas prómo de 0: menor a correlação lnear

Interpretação do Valor de r valor de r -1 0 +1 correlação negatva forte correlação negatva fraca ausênca de correlação correlação postva fraca correlação postva forte

Propredades do Coefcente de Correlação de Pearson -1 r +1 O valor de r não vara se todos os valores de qualquer uma das varáves são convertdos para uma escala dferente. O valor de r não é afetado pela escolha de ou. Permutando e, r permanece nalterado. r só mede a ntensdade ou grau de relaconamentos lneares. Não serve para medr ntensdade de relaconamentos nãolneares.

E.: Alturas e Pesos de Ursos Sberanos Comprmento (pol.) Peso (lb.). 53,0 80 4.40.809,00 6.400 67,5 344 3.0 4.556,5 118.336 7,0 416 9.95 5.184,00 173.056 7,0 348 5.056 5.184,00 11.104 73,5 6 19.57 5.40,5 68.644 68,5 360 4.660 4.69,5 19.600 73,0 33 4.36 5.39,00 110.4 37,0 34 1.58 1.369,00 1.156 Totas 517.176 151.879 34.55,75 78.50

E.: Alturas e Pesos de Ursos Sberanos r r n n ( ) ( )( ) ( ) n ( ) 8(151.879) (516,5)(.176) 8(34.55,75) (516,5) 91.18 0,897 9433,75 1.093.184 8(78.50) (.176)

Reta de Regressão Lnear Dferentes retas podem ser traçadas, a olho nu, e um dagrama de dspersão Cada pessoa terá uma tendênca dferente Nenhuma reta passará eatamente por todos os pontos (se a correlação não for máma) Precsamos encontrar uma reta que esteja tão próma dos pontos quanto possível Os erros de predção para a reta são erros em (dreção vertcal)

Reta de Regressão Lnear Se um dagrama de dspersão sugere uma relação lnear, é de nteresse representar este padrão através de uma reta Usa-se o método dos mínmos quadrados para ajustar uma reta de regressão ao conjunto de pontos do dagrama A reta de regressão descreve como uma varável resposta (dependente) vara em relação a uma varável eplanatóra (ndependente)

Varáves Varável resposta () (dependente) Mede um resultado em um estudo Varável eplanatóra () (ndependente) Procura eplcar os resultados observados Varável ndependente () Temperatura do forno ( o C) Quantdade de adtvo (%) Renda (R$) Memóra RAM (GB) Varável dependente () Resstênca mecânca da cerâmca (MPa) Octanagem da gasolna Consumo (R$) Tempo de resposta do sstema (s)

Defnção Dada uma coleção de dados amostras emparelhados, a segunte equação de regressão descreve a relação entre as duas varáves ˆ a + b O gráfco da equação é chamado reta de regressão (ou reta de melhor ajuste, ou reta de mínmos quadrados)

Defnção b a + ˆ b: coefcente angular a: ponto onde a reta ntercepta eo ( ) ( )( ) ( ) ( ) ( )( ) ( )( ) ( ) ( ) n b a n a n n b

Eemplo Consdere um epermento em que se analsa a octanagem da gasolna (Y) em função da adção de um adtvo (X). Para sto, foram realzados ensaos com os percentuas de 1,, 3, 4, 5 e 6% de adtvo. Os resultados seguem.

Eemplo X Y 1 80,5 81,6 3 8,1 4 83,7 5 83,9 6 85,0 Índce de Octanagem 85,5 85,0 84,5 84,0 83,5 83,0 8,5 8,0 81,5 81,0 80,5 80,0 0 1 3 4 5 6 7 Quantdade de Adtvo (%)

Eemplo Calculando a equação de regressão... 1 80,5 1 80,5 81,6 4 163, 3 8,1 9 46,3 4 83,7 16 334,8 5 83,9 5 419,5 6 85,0 36 510,0 Soma 1 496,8 91 1.754,3 b 6(1754,3) (1)(496,8) 6(91) (1) 496,8 (0,886)(1) a 79,7 6 ˆ 79,7 + 0,886 93 105 0,886

Eemplo ˆ 79,7 + 0, 886 Índce de Octanagem 85,5 85,0 84,5 84,0 83,5 83,0 8,5 8,0 81,5 81,0 80,5 80,0 0 1 3 4 5 6 7 Quantdade de Adtvo (%)