ESTATÍSTICA I Prof. Alberto W. Ramos

Documentos relacionados
Cap. 4 - Estimação por Intervalo

1 Distribuições Amostrais

Distribuições Amostrais

Amostras Aleatórias e Distribuições Amostrais. Probabilidade e Estatística: afinal, qual é a diferença?

CONCEITOS BÁSICOS E PRINCÍPIOS DE ESTATÍSTICA

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

A finalidade de uma equação de regressão seria estimar valores de uma variável, com base em valores conhecidos da outra.

ESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO

Capítulo 5- Introdução à Inferência estatística.

DESIGUALDADES, LEIS LIMITE E TEOREMA DO LIMITE CENTRAL. todas as repetições). Então, para todo o número positivo ξ, teremos:

Objetivo. Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

População x Amostra. statística descritiva X inferência estatística. Revisão de Estatística e Probabilidade

Virgílio A. F. Almeida DCC-UFMG 1/2005

Instruções gerais sobre a Prova:

MAE Introdução à Probabilidade e Estatística II Resolução Lista 1

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

ESTIMAÇÃO DE PARÂMETROS

DISTRIBUIÇÕES DE PROBABILIDADE

MEDIDAS DESCRITIVAS DE POSIÇÃO, TENDÊNCIA CENTRAL E VARIABILIDADE

Probabilidade II Aula 12

ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL p

CAPÍTULO 6 - ESTIMAÇÃO E TESTES DE HIPÓTESES

Variáveis Aleatórias e Distribuições de Probabilidade

Objetivos. Testes não-paramétricos

Lista 9 - Introdução à Probabilidade e Estatística

ENGENHARIA DA QUALIDADE A ENG AULA 6 CARTAS DE CONTROLE PARA ATRIBUTOS

INFERÊNCIA. Fazer inferência (ou inferir) = tirar conclusões

Objetivos. Os testes de hipóteses ser: Paramétricos e Não Paramétricos. Testes não-paramétricos. Testes paramétricos

DETERMINANDO A SIGNIFICÂNCIA ESTATÍSTICA PARA AS DIFERENÇAS ENTRE MÉDIAS

Revisando... Distribuição Amostral da Média

Stela Adami Vayego DEST/UFPR

10 - Medidas de Variabilidade ou de Dispersão

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPTO. DE ESTATÍSTICA LISTA 4 PROBABILIDADE A (CE068) Prof. Benito Olivares Aguilera

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Introdução. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ...

Fundamentos de Análise Matemática Profª Ana Paula. Números reais

Uma amostra aleatória simples de n elementos é selecionada a partir da população. Calcula-se o valor da média a partir da amostra

Análise de Regressão Linear Múltipla I

PROVA 1 27/10/ Os dados apresentados na seqüência mostram os resultados de colesterol

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Estimativa de Parâmetros

ESTATÍSTICA E PROBABILIDADES

Mestrado Integrado em Engenharia Civil. Disciplina: TRANSPORTES. Sessão Prática 4: Amostragem

Inferência Estatística

b) Fabrico de peças cilíndricas Capítulo 5 - Distribuições conjuntas de probabilidades e complementos X - comprimento da peça Y - diâmetro da peça

Estimação por Intervalo (Intervalos de Confiança):

CAPÍTULO 6 ESTIMATIVA DE PARÂMETROS PPGEP. Introdução. Introdução. Estimativa de Parâmetros UFRGS

Testes de Comparação Múltipla

Exercícios de Intervalos de Confiança para media, variância e proporção

Probabilidade II Aula 9

AMOSTRAGEM ALEATÓRIA DISTRIBUIÇÕES POR AMOSTRAGEM

) E X. ) = 0 2 ( 1 p ) p = p. ) E 2 ( X ) = p p 2 = p ( 1 p ) ( ) = i 1 n. ( ) 2 n E( X) = ( ) = 1 p ( ) = p V ( X ) = E ( X 2 E X

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

CORRELAÇÃO Aqui me tens de regresso

) E 2 ( X) = p p 2 = p( 1 p) ) = 0 2 ( 1 p) p = p ( ) = ( ) = ( ) = p. F - cara (sucesso) C - coroa (insucesso)

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Estimação pontual e intervalar

TP010 ENGENHARIA DA QUALIDADE 1. VARIÁVEIS, DESCRIÇÃO E DISTRIBUIÇÕES DE PROBABILIDADE.

2.2. Séries de potências

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

MEDIDAS RESUMO EM TABELAS DE FREQUÊNCIA

AEP FISCAL ESTATÍSTICA

Processos Estocásticos

Teoria Elementar da Probabilidade

Intervalos Estatísticos para uma única Amostra - parte II

MODELOS PROBABILÍSTICOS DISCRETOS (BINOMIAL e POISSON)

Métodos de Amostragem

Universidade São Judas Tadeu Faculdade de Tecnologia e Ciências Exatas Laboratório de Física e Química

Licenciatura em Economia REVISÃO DE ALGUNS CONCEITOS EM ESTATÍSTICA. Luís Filipe Martins.

3.4.2 Cálculo da moda para dados tabulados. 3.4 Moda Cálculo da moda para uma lista Cálculo da moda para distribuição de freqüências

Sucessão ou Sequência. Sucessão ou seqüência é todo conjunto que consideramos os elementos dispostos em certa ordem. janeiro,fevereiro,...

Disciplina: MATEMÁTICA Turma: 3º Ano Professor (a) : CÉSAR LOPES DE ASSIS INTRODUÇÃO A ESTATÍSTICA. Organização de dados

6. Testes de Hipóteses Conceitos Gerais

Hipótese Estatística. Tipos de Hipóteses

CPV O cursinho que mais aprova na fgv

Faculdade de Economia Universidade Nova de Lisboa ESTATÍSTICA. Exame Final 2ª Época 26 de Junho de Grupo I (3 valores)

5. ANÁLISE DE SISTEMAS DA CONFIABILIADE DE SISTEMAS SÉRIE-PARALELO

MEDIDAS DE TENDÊNCIA CENTRAL E MEDIDAS DE DISPERSÃO Í N D I C E

Probabilidades. José Viegas

Séquências e Séries Infinitas de Termos Constantes

Estatística Aplicada Medidas Resumo Apostila 4 Prof. Fábio Hipólito Aluno(a):

Cap. VI Histogramas e Curvas de Distribuição

Distribuição de Bernoulli

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPTO. DE ESTATÍSTICA LISTA 1-ESTATÍSTICA II (CE003)

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Técnicas de Reamostragem

Departamento de Informática. Modelagem Analítica. Modelagem Analítica do Desempenho de Sistemas de Computação. Disciplina: Algumas Distribuições

Ajuste de Curvas pelo Método dos Quadrados Mínimos

Análise de Algoritmos. Análise de Algoritmos. Análise de Algoritmos. Análise de Algoritmos. Análise de Algoritmos. Análise de Algoritmos

Introdução ao Qui-Quadrado

10 INFERÊNCIA ESTATÍSTICA Testes de Hipóteses Introdução Lógica dos Testes de Hipóteses

TESTE DE HIPÓTESES. Se a Hipótese Nula (H 0 ) é: COMETE O ACEITA DECISÃO CORRETA O PESQUISADOR ERRO TIPO II COMETE O REJEITA DECISÃO CORRETA

Métodos de Classificação dos Objetos Segmentados(IAR) Vizinho Próximo Lógica Fuzzy

Recredenciamento Portaria MEC 347, de D.O.U

Probabilidades e Estatística LEIC-A, LEIC-T, LEGM, MA, MEMec

Capítulo VII: Soluções Numéricas de Equações Diferenciais Ordinárias

Secção 1. Introdução às equações diferenciais

Probabilidades num jogo aos dados

DERIVADAS DE FUNÇÕES11

Estatística para Cursos de Engenharia e Informática

3ª Lista de Exercícios de Programação I

PROBABILIDADE E ESTATÍSTICA APLICADAS À HIDROLOGIA

Transcrição:

ESCOLA POLITÉCNICA DA UNIVERSIDADE DE SÃO PAULO DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO ESTATÍSTICA I Prof. Alberto W. Ramos SÃO PAULO, 016

ESTATÍSTICA ESTATÍSTICA É a ciêcia que trata da coleta, orgaização, descrição, aálise e iterpretação de dados experimetais. Dados ESTATÍSTICA Iformações Para que precisamos de iformações? ALBERTO W. RAMOS 016

ESTATÍSTICA 3 TERMOS BÁSICOS Termo Sigificado População (ou uiverso) É a coleção de todas as uidades sobre as quais desejamos iformações Amostra É parte da coleção total de uidades Ceso É a pesquisa que evolve 100% da população Variável Aquela característica a qual estamos iteressados. Iferêcia Estatística POPULAÇÃO (OU UNIVERSO) AMOSTRA Probabilidade ALBERTO W. RAMOS 016

ESTATÍSTICA 4 Cálculo de Probabilidades ALBERTO W. RAMOS 016

ESTATÍSTICA 5 PROBABILIDADE DETERMINÍSTICOS FENÔMENOS PROBABILÍSTICOS Defiições: a) Espaço Amostral (S): cojuto de todos os resultados possíveis de um feômeo probabilístico. Ex.: laçameto de dado S {1,,3,4,5,6} b) Eveto (A,B,C,...): qualquer subcojuto de S. Ex.: P poto par {,4,6} I poto ímpar {1,3,5} T poto maior que três {4,5,6} Obs.: S eveto certo Ø eveto impossível ALBERTO W. RAMOS 016

ESTATÍSTICA 6 OPERAÇÕES COM EVENTOS a) Eveto itersecção: A B Ex.: P T {4,6} (ambos ocorrem) A B S A B B b) Eveto uião: A B Ex.: P I {1,,3,4,5,6} S (pelo meos um ocorre) A B S A B B c) Eveto complemetar: A Ex.: P {1,3,5} I (P ão ocorre) A A S c) Evetos mutuamete exclusivos: A B Ø Ex.: P I Ø (P e I ão ocorrem ao mesmo tempo) A B S ALBERTO W. RAMOS 016

ESTATÍSTICA 7 DEFINIÇÃO DE PROBABILIDADE É um úmero real, associado a um eveto, que mede sua chace de ocorrêcia: ode: P (A) m é o úmero de resultados favoráveis a A é o úmero de resultados possíveis, desde que igualmete prováveis m Observações: a) 0 P(E) 1 b) P(A B) P(A) + P(B) - P(A B) c) P(A ) 1 - P(A) ALBERTO W. RAMOS 016

ESTATÍSTICA 8 EXEMPLO Seja o laçameto de dois dados: um preto e outro baco. Qual a probabilidade de se obter poto o dado preto meor que o braco? (1,1) (,1) (3,1) (4,1) (5,1) (6,1) (1,) (,) (3,) (4,) (5,) (6,) S (1,3) (,3) (3,3) (4,3) (5,3) (6,3) (1,4) (,4) (3,4) (4,4) (5,4) (6,4) (1,5) (,5) (3,5) (4,5) (5,5) (6,5) (1,6) (,6) (3,6) (4,6) (5,6) (6,6) PRETO BRANCO P (A) 15 36 ALBERTO W. RAMOS 016

ESTATÍSTICA 9 PROBABILIDADE CONDICIONADA Notação: P(A/B) probabilidade do eveto A, sabedo-se que o eveto B ocorreu Ex.: A chuva B previsão de chuva P(A/B) probabilidade de chuva dado que houve previsão de chuva Defiição: P(A/B) P(A B), P(B) 0 P(B) ou P(B/A) P(A B), P(A) 0 P(A) logo: P(A B) P(A). P(B/A) P(B). P(A/B) ALBERTO W. RAMOS 016

ESTATÍSTICA 10 EXEMPLO Seja o laçameto de dois dados, com A: dar poto 1, ou 3 o primeiro dado e B: dar soma 6. Calcular P(A/B) e P(B/A). A B B (1,1) (,1) (3,1) (4,1) (5,1) (6,1) (1,) (,) (3,) (4,) (5,) (6,) S (1,3) (,3) (3,3) (4,3) (5,3) (6,3) (1,4) (,4) (3,4) (4,4) (5,4) (6,4) (1,5) (,5) (3,5) (4,5) (5,5) (6,5) (1,6) (,6) (3,6) (4,6) (5,6) (6,6) 18 P (A) 36 1 15 P (B) 36 A 5 1 1 P (A B) 36 1 3 P(A/B) P(A B) P(B) 1 3 5 1 1 15 4 5 P(B/A) P(A B) P(A) 1 3 1 3 ALBERTO W. RAMOS 016

ESTATÍSTICA 11 EVENTOS INDEPENDENTES Se P(A/B) P(A/B ) P(A) o eveto A é estatisticamete idepedete de B P(B/A) P(B/A ) P(B) Neste Caso: P(A B) P(A). P(B) ALBERTO W. RAMOS 016

ESTATÍSTICA 1 TEOREMA DA PROBABILIDADE TOTAL Sejam A 1, A,..., A evetos mutuamete exclusivos e exaustivos (partição) e seja B um eveto qualquer de S. A 1 A A 3 S B A 4... A B U A i 1 i B P(B) P(Ai B) i 1 (TPT) i 1 P (B) P(A ).P(B/ i Ai) ALBERTO W. RAMOS 016

ESTATÍSTICA 13 TEOREMA DE BAYES Nas mesmas codições do Teorema da Probabilidade Total. P(A j /B) P(A j P(B) B) P(A j /B) P(A ).P(B/ A ) i 1 j P(A ). P(B/ A ) i j i (TB) ALBERTO W. RAMOS 016

ESTATÍSTICA 14 Variáveis Aleatórias ALBERTO W. RAMOS 016

ESTATÍSTICA 15 VARIÁVEIS ALEATÓRIAS Uma variável aleatória (VA) é a represetação dos evetos de uma partição de S através de úmeros reais. Exemplos: a) úmero de caras obtidas o laçameto de três moedas. b) soma de potos obtida o laçameto de dois dados. 0 1 A 1 A p VA A 3 Probabilidade em S Fução VA Fução Probabilidade ALBERTO W. RAMOS 016

ESTATÍSTICA 16 TIPOS DE VARIÁVEIS ALEATÓRIAS (VA) VA Discreta S fiito Cotíua S ifiito VA Discretas: A distribuição de probabilidade é represetada pela fução probabilidade, tal que: a) P(Xx i ) 0, x i b) P (X x ) i i 1 b c) P (X x > a i x ) P(a < i X b) ALBERTO W. RAMOS 016

ESTATÍSTICA 17 EXEMPLO Seja X o úmero de caras (K) obtidas o laçameto de três moedas. S CCC KCC CKC CCK KKC KCK CKK KKK x i 0 1 3 P(Xx i ) 1/8 3/8 3/8 1/8 P(Xx i ) 3/8 /8 1/8 0 1 3 x i ALBERTO W. RAMOS 016

ESTATÍSTICA 18 VA Cotíuas: S é ifiito e a probabilidade de cada resultado idividual é zero (mas ão teoricamete impossível). A distribuição de probabilidade é represetada pela fução desidade de probabilidade f X (x). a) f X (x) 0 + b) f X (x)dx 1 b a) f X(x)dx P(a < x b), b > a a f X (x) P(a<x b) a b x ALBERTO W. RAMOS 016

ESTATÍSTICA 19 EXEMPLO Seja uma fução desidade de probabilidade defiida como: f X (x) K 0 1 x a) determiar o valor de K. b) equacioar esta fdp. ALBERTO W. RAMOS 016

ESTATÍSTICA 0 FUNÇÃO DE REPARTIÇÃO OU DE DISTRIBUIÇÃO ACUMULADA É defiida por: (x) F X P(X x) - < x < + Para VAB discretas tem-se: F X (a) x a i P(X x i ) Para VAB cotíuas tem-se: F X (a) a f X (x) dx Propriedades: a) F X ( ) 0 b) F X ( + ) 1 c) P(a < X b) F (b) F (a) X Y ALBERTO W. RAMOS 016

ESTATÍSTICA 1 EXEMPLO Obter as fuções de distribuição acumulada dos dois exercícios ateriores. ALBERTO W. RAMOS 016

ESTATÍSTICA PARÂMETROS DE POSIÇÃO Idicam ode se localiza o cetro da distribuição. 1) Média ou Valor Esperado: µ(x) VA Discreta: µ X) x.p(x x ) ( i i VA Cotíua: µ X) x.f (x) dx ( X Propriedades: a) µ(k) K, K costate b) µ(k.x) K. µ(x) c) µ(x+y) µ(x) + µ(y) d) µ(x-y) µ(x) - µ(y) e) µ(x±k) µ(x) ± K f) Se X e Y são idepedetes µ(x.y) µ(x). µ(y) ) Mediaa: MD É o poto tal que: P(X<MD) P(X>MD) ½. 3) Moda: M O É o poto de máxima probabilidade ou desidade de probabilidade. ALBERTO W. RAMOS 016

ESTATÍSTICA 3 PARÂMETROS DE DISPERSÃO Idicam a variabilidade da distribuição de probabilidade. 1) Variâcia: σ (X), V(X) σ VA Discreta: ( X) µ [(X µ ) ] µ (X ) [ µ (X)] σ ( X) (x i µ ).P(X xi) xi.p(x xi) x i.p(x x i) i i i VA Cotíua: σ ( X) + (x µ ).fx(x)dx x.fx(x)dx + + x.f X (x)dx Propriedades: a) σ (K) 0, K costate b) σ (K.X) K. σ (X) c) Se X e Y são idepedetes: σ (X+Y) σ (X) + σ (Y) σ (X-Y) σ (X) + σ (Y) d) σ (X±K) σ (X) ALBERTO W. RAMOS 016

ESTATÍSTICA 4 ) Desvio-Padrão: σ(x) σ (X) σ (X) 3) Coeficiete de Variação: CV σ(x) CV µ (X) ALBERTO W. RAMOS 016

ESTATÍSTICA 5 EXEMPLOS Seja X o úmero de caras (K) obtidas o laçameto de três moedas. x i 0 1 3 P(Xx i ) 1/8 3/8 3/8 1/8 P(Xx i ) 3/8 /8 1/8 0 1 3 x i 1 3 3 1 1 µ ( X) x.p(x xi) 0 x + 1x + x + 3 x 8 8 8 8 8 i 1,5 1 3 3 1 4 x.p(x xi) 0 x + 1 x + x + 3 x 8 8 8 8 8 i i 3 σ (X) xi.p(x xi) x i.p(x i i xi) 3 ( 1,5 ) 0, 75 ALBERTO W. RAMOS 016

ESTATÍSTICA 6 EXEMPLO Seja uma fução desidade de probabilidade defiida como: f X (x) K 0 1 x Determiar a média µ(x) e a variâcia σ (X). ALBERTO W. RAMOS 016

ESTATÍSTICA 7 Pricipais Distribuições de Probabilidade ALBERTO W. RAMOS 016

ESTATÍSTICA 8 DISTRIBUIÇÕES DISCRETAS Distribuição de Beroulli Seja uma prova que só possa ter dois resultados: 1-p p fracasso X 0 sucesso X 1 com X úmero de sucessos (0 ou 1) x i 0 1 P(X x i ) 1-p p P(Xx i ) 1-p p 0 1 x i µ ( X) 0 (1 p) + 1 p p µ (X ) 0 (1 p) + 1 p p σ (X) µ (X ) [ µ (X)] p p p(1 p) ALBERTO W. RAMOS 016

ESTATÍSTICA 9 EXEMPLO Um dado é laçado cico vezes. Qual é a probabilidade de sair poto seis duas vezes? Evetos: S (sucesso) sair poto seis F (fracasso) ão sair poto seis Existem 10 maeiras (possibilidades) disto ocorrer: SSFFF SFSFF SFFSF SFFFS FSFFS FFSFS FFFSS FSSFF FSFSF FFSSF Cotudo existe uma maeira mais fácil, sem ter ecessidade de listar todas as possibilidades: x C,x! x!( x)! úmero de tetativas (5 laçametos) x úmero de sucessos ( potos seis ) ALBERTO W. RAMOS 016

ESTATÍSTICA 30 Distribuição Biomial P(X x) C x x,x.p.(1 p) ode: úmero de tetativas x úmero de sucessos p probabilidade de sucesso A média e a variâcia desta distribuição são: µ ( X). p σ (X).p.(1 p) Um lote de 1000 peças foi recebido a empresa e sabe-se que este tem 00 ites defeituosos. Se for retirada (com reposição) uma amostra de 10 peças, qual a chace desta coter 1 defeituosa? ALBERTO W. RAMOS 016

ESTATÍSTICA 31 Distribuição de Poisso P(X x) e λt.( λt) x! x ode: e úmero de Euler (,7) λ freqüêcia média de sucessos t itervalo de observação Nesta distribuição a média e a variâcia são: µ ( X) λt σ (X) λt Em um restaurate, o horário do almoço, em média chegam 10 clietes por miuto. Qual é a probabilidade de em dez miutos chegarem exatamete 1 clietes? ALBERTO W. RAMOS 016

ESTATÍSTICA 3 APROXIMAÇÕES DE DISTRIBUIÇÕES Se p 0,10 pode-se empregar a Distribuição de Poisso o lugar da Biomial, fazedo-se.p λ.t. Ex.: 0 e p 0,0 P BINOMIAL (X1) 0,73 e P POISSON (X1) 0,68 ALBERTO W. RAMOS 016

ESTATÍSTICA 33 DISTRIBUIÇÕES CONTÍNUAS Distribuição Expoecial Seja T o itervalo decorrido etre dois sucessos cosecutivos de um feômeo de Poisso, com parâmetro λ: P(X 0) e λt P(X0) é a probabilidade de ehum sucesso o itervalo de observação t. Sigifica também a probabilidade do primeiro sucesso levar mais do que t para ocorrer. P(X 0) P(T > t) e λt P(T t) F (t) 1 e T λt d dt λt ft(t) FT (t) λe, t 0 f(t) 1,0 0,8 0,6 0,4 λ1 0, 0,0 0 4 6 8 10 t 1 1 µ ( T) e σ (T) λ λ ALBERTO W. RAMOS 016

ESTATÍSTICA 34 Distribuição Normal (ou de Gauss) Seja X uma variável aleatória cotíua com a seguite distribuição: 1 1 x µ f X(x) exp, - < x < + π σ σ f(x) 0,18 0,16 0,14 0,1 µ( x)50 σ( x ),5 0,10 0,08 0,06 0,04 0,0 0,00 4 44 46 48 50 5 54 56 58 X Esta distribuição tem média e variâcia: µ ( X) µ σ ( X) σ Obs.: a) exp z e z b) É comum escrever-se: X N(µ;σ ) ALBERTO W. RAMOS 016

ESTATÍSTICA 35 DISTRIBUIÇÃO NORMAL REDUZIDA (OU PADRONIZADA) Seja X uma variável aleatória tal que X N(µ;σ ) e seja Z defiida como: Etão: Z N(0;1), com: z x µ σ f(z) 0,4 0,3 µ( z )0 σ( z )1 0, 0,1 0,0-3 - -1 0 1 3 z µ ( Z) 0 σ (Z) 1 Obs.: a) ( µ x x ) P(0 z z ) P 0 0 x µ x µ b) P (X x) P Z Φ σ σ ALBERTO W. RAMOS 016

ESTATÍSTICA 36 TABELA DA DISTRIBUIÇÃO NORMAL valores de P(0 < Z < z 0 ) z 0 0 1 3 4 5 6 7 8 9 0,0 0,0000 0,0040 0,0080 0,010 0,0160 0,0199 0,039 0,079 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0, 0,0793 0,083 0,0871 0,0910 0,0948 0,0987 0,106 0,1064 0,1103 0,1141 0,3 0,1179 0,117 0,155 0,193 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,168 0,1664 0,1700 0,1736 0,177 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,019 0,054 0,088 0,13 0,157 0,190 0,4 0,6 0,57 0,91 0,34 0,357 0,389 0,4 0,454 0,486 0,517 0,549 0,7 0,580 0,611 0,64 0,673 0,703 0,734 0,764 0,794 0,83 0,85 0,8 0,881 0,910 0,939 0,967 0,995 0,303 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,31 0,338 0,364 0,389 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,361 1,1 0,3643 0,3665 0,3685 0,3708 0,379 0,3749 0,3770 0,3790 0,3810 0,3830 1, 0,3849 0,3869 0,3888 0,3907 0,395 0,3944 0,396 0,3980 0,3997 0,4015 1,3 0,403 0,4049 0,4066 0,408 0,4099 0,4115 0,4131 0,4147 0,416 0,4177 1,4 0,419 0,407 0,4 0,436 0,451 0,465 0,479 0,49 0,4306 0,4319 1,5 0,433 0,4345 0,4357 0,4370 0,438 0,4394 0,4406 0,4418 0,449 0,4441 1,6 0,445 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,455 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,458 0,4591 0,4599 0,4608 0,4616 0,465 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,476 0,473 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767,0 0,477 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,481 0,4817,1 0,481 0,486 0,4830 0,4834 0,4838 0,484 0,4846 0,4850 0,4854 0,4857, 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916,4 0,4918 0,490 0,49 0,495 0,497 0,499 0,4931 0,493 0,4934 0,4936,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,495,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,496 0,4963 0,4964,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,497 0,4973 0,4974,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981,9 0,4981 0,498 0,498 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,499 0,499 0,499 0,499 0,4993 0,4993 3, 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 FONTE: COSTA NETO, P.L.O. Estatística. São Paulo, Edgard Blucher, 1978. ALBERTO W. RAMOS 016

ESTATÍSTICA 37 TEOREMA DO LIMITE CENTRAL Uma variável aleatória resultate da soma de variáveis aleatórias idepedetes, o limite, quado, tem distribuição Normal. TEOREMA DAS COMBINAÇÕES LINEARES Uma variável aleatória obtida pela combiação liear de variáveis aleatórias Normais idepedetes tem também distribuição Normal. ALBERTO W. RAMOS 016

ESTATÍSTICA 38 APROXIMAÇÕES PELA NORMAL Biomial pela Normal Se p 5 e.(1-p) 5 vale a aproximação da distribuição Biomial pela Normal. Poisso pela Normal Se λt 5 vale a aproximação da distribuição de Poisso pela Normal. Correção da Cotiuidade Como se aproxima uma distribuição discreta (Biomial ou Poisso) por uma cotíua (Normal), é ecessária esta correção: 1 discreta: P(Xx i ) Normal: (x 1 X x ) P i i + 1 discreta: P(x 1 X x ) Normal: (x 1 X x ) P 1 + ALBERTO W. RAMOS 016

ESTATÍSTICA 39 Estatística Descritiva ALBERTO W. RAMOS 016

ESTATÍSTICA 40 TIPOS DE VARIÁVEIS Nomiais Qualitativas Ordiais Variáveis Quatitativas Discretas Cotíuas Exemplo ( Variáveis em uma ficha cadastral PF ) Variável Tipo 1 Número de depedetes Idade 3 Local de ascimeto 4 Nível educacioal 5 Qualitativa, omial 6 Qualitativa, ordial 7 Quatitativa, discreta 8 Quatitativa, cotíua ALBERTO W. RAMOS 016

ESTATÍSTICA 41 AMOSTRAGEM Tão importate quato determiar quatos ites devem ser examiados a amostragem (tamaho da amostra), é determiar como coletar estes ites. 1. Amostragem simples (aleatória ou casual): todos ites da população têm igual chace de pertecer à amostra (sorteio). SORTEIO POPULAÇÃO AMOSTRA. Amostragem sistemática: os ites ecotram-se ordeados e a retirada de elemetos da amostra é feita periodicamete... 8 7 6 5 4 3 1. 7 4 1 POPULAÇÃO AMOSTRA ALBERTO W. RAMOS 016

ESTATÍSTICA 4 3. Amostragem estratificada: a população ecotra-se dividida em vários estratos e as amostras são coletadas aleatoriamete de cada estrato.. AMOSTRA POPULAÇÃO 4. Amostragem por agrupametos: a população ecotra-se fisicamete dividida em pequeos grupos, que são sorteados para formar a amostra.. AMOSTRA POPULAÇÃO ALBERTO W. RAMOS 016

ESTATÍSTICA 43 Distribuições de Frequêcias ALBERTO W. RAMOS 016

ESTATÍSTICA 44 DISTRIBUIÇÕES DE FREQUÊNCIAS Quado há uma grade quatidade de dados dispoíveis ( 30) é mais adequado trabalhar-se com estes agrupados do que com os valores idividualmete Distribuições de frequêcias permitem observar : Quatas vezes ocorre um certo resultado Simetria ou assimetria dos dados Ode se cocetram mais os valores Qual é a variabilidade (dispersão) dos dados Existêcia de valores discrepates (dados suspeitos) Estratificação (diferetes subgrupos de dados) ALBERTO W. RAMOS 016

ESTATÍSTICA 45 EXEMPLO Trita empresas foram selecioadas aleatoriamete e classificadas de acordo com seu tamaho: Tamaho Categoria 1 a 100 fucioários P 101 a 500 fucioários M mais de 500 fucioários G Os resultados foram os seguites: M P M M M P G G M G M G M M M M M P G M G P G G G G M M P G Distribuição de frequêcias: Porte f p P 5 0,16 f : frequêcia absoluta M 14 0,47 G 11 0,37 p : frequêcia relativa Total 30 1,00 14 1 10 Frequêcia 8 6 4 0 P M Tamaho G ALBERTO W. RAMOS 016

ESTATÍSTICA 46 EXEMPLO Número de pedidos de cocessão de empréstimo recebidos por uma agêcia as últimas 0 semaas. ( 1) ( ) 3 ( 3) 5 ( 4) 4 ( 5) 7 ( 6) 4 ( 7) ( 8) 5 ( 9) 1 (10) 3 (11) 3 (1) 5 (13) 3 (14) 4 (15) 0 (16) 3 (17) 4 (18) 1 (19) (0) 3 Mi 0 Máx 7 ( 8 valores distitos ) Distribuição de frequêcias : pedidos 0 1 3 4 5 6 7 frequêcia 1 3 6 4 3 0 1 6 5 Frequêcia 4 3 1 0 0 1 3 Pedidos 4 5 6 7 ALBERTO W. RAMOS 016

ESTATÍSTICA 47 EXEMPLO Porcetagem do faturameto recolhido sob a forma de tributos federais por 50 empresas Souza Cruz 36,9 Petróleo Ipiraga 3,1 Autolatia 8,4 Johso & Johso 10,1 Geeral Motors 5,7 Avo 17,8 Brahma 65,4 Atarctica Rio 8,9 Philip Morris 46,7 Alca 7,8 Shell 3,4 Bosch 18,9 Gessy Lever 15,8 Klabi 11,0 IBM 0,6 Glasurit 11,1 Fiat Automóveis 14, Kaiser SP 56,1 Nestlé 9,0 Krupp 7,0 Goodyear 15,1 Carrefour,4 Esso 1,8 Usimias 5, Mercedes-Bez 1,9 3M 6,0 Firestoe 3,7 Hoechst 8,0 Pirelli 17,6 Poliolefias,9 Texaco 3,8 Cebrasp 30,0 Atlatic 4,5 Aro 13,9 Skol 37,5 MBR 8,0 Cosul 14,3 Estrela 3,4 Sata Maria 0,3 Solvay 13,3 CBA 7,7 Kodak 10, Atarctica Paulista 46,5 Metal Leve 14, Brastemp 1,1 Champio 9,1 Suzao 1,7 Rhodia 4,8 Philips 4,8 Atarctica Nordeste 9,4 ALBERTO W. RAMOS 016

ESTATÍSTICA 48 Como existem 50 (50) diferetes valores, vamos agrupar os dados em classes, seguido o seguite procedimeto: a) Obter uma amostra de 50 a 100 dados (50 < < 100) b) Determiar o maior e o meor valor (x max e x mi ) c) Calcular a amplitude total dos dados R T x max - x mi d) Determiar o úmero de classes k e) Calcular a amplitude das classes h R/k f) Determiar os limites das classes g) Costruir uma tabela de freqüêcias h) Traçar o diagrama Resolução: x mi 1,8 e x max 65,4 R T 65,4 1,8 63,6 k 50 7 h 63,6/7 10 Limites das classes: Limite iferior da 1ª classe 0 Limite iferior da a classe 0 + 10 10 Limite iferior da 3 a classe 10+ 10 0... ALBERTO W. RAMOS 016

ESTATÍSTICA 49 TABELA DE FREQUÊNCIAS Classes c f p F p A 0 x<10 4,95 17 0,34 17 0,34 10 x<0 14,95 16 0,3 33 0,66 0 x<30 4,95 9 0,18 4 0,84 30 x<40 34,9 4 0,08 46 0,9 40 x<50 44,95 0,04 48 0,96 50 x<60 54,95 1 0,0 49 0,98 60 x<70 64,95 1 0,0 50 1,00 Total 50 1,00 Notação: c : poto médio (cetro) da classe f : Frequêcia absoluta p : Proporção (frequêcia relativa) F : Frequêcia absoluta acumulada p A : Frequêcia relativa acumulada ALBERTO W. RAMOS 016

ESTATÍSTICA 50 HISTOGRAMA 18 16 14 1 Frequecia 10 8 6 4 0 0 10 0 30 40 50 60 70 ALBERTO W. RAMOS 016

ESTATÍSTICA 51 ANÁLISE DE HISTOGRAMAS BIMODAL TRUNCADO RETÂNGULOS ISOLADOS ASSIMÉTRICO ALBERTO W. RAMOS 016

ESTATÍSTICA 5 POLÍGONO DE FREQUÊNCIAS ACUMULADAS 1 0,9 0,8 0,7 % Acumulada 0,6 0,5 0,4 0,3 0, 0,1 0 0 10 0 30 40 50 60 70 ALBERTO W. RAMOS 016

ESTATÍSTICA 53 Medidas Descritivas ALBERTO W. RAMOS 016

ESTATÍSTICA 54 MEDIDAS DESCRITIVAS Quado queremos caracterizar uma amostra, podemos caracterizá-la mediate o cálculo de certas quatidades chamadas de medidas descritivas 1. Medidas de Posição Mediaa ( md ou Q ) e Quartis ( Q1 e Q3 ) Média ( x ) Moda ( m o ). Medidas de Dispersão Amplitude ( R ) Variâcia ( s ) Desvio-padrão ( s ) ALBERTO W. RAMOS 016

ESTATÍSTICA 55 MEDIANA A mediaa é a quatidade que divide o cojuto de dados ordeados da amostra em duas metades com igual úmero de elemetos. Quartil, por sua vez, divide em quatro metades com iguais quatidades de elemetos. Exemplo Participação de mercado das 1 maiores seguradoras em % do valor total dos prêmios emitidos. (Fote: FENASEG i Exame, Fev / 93 ) 1,9,0,1,5 3,0 3,1 3,3 3,7 6,1 7,7 17,1 18,7 Mediaa md 3, Primeiro Quartil Q1,3 Terceiro Quartil Q3 6,9 ALBERTO W. RAMOS 016

ESTATÍSTICA 56 EXEMPLO Participação de mercado das 11 pricipais modalidades de seguros em % do valor total dos prêmios emitidos (outras modalidades correspodem à 6,9%) RAMO % Automóvel 33,6 Saúde 14,0 Icêdio 1,9 Terceiro Quartil Vida 1, Riscos Diversos 5,5 Habitação 5,3 Mediaa Trasporte 3,1 Acidetes Pessoais,9 Obrigatório Veículos 1,7 Primeiro Quartil Riscos de Egeharia 1,0 Resposabilidade Civil * 0,9 Fote ( Feaseg, i Exame, Fev / 93 ) ALBERTO W. RAMOS 016

ESTATÍSTICA 57 MÉDIA ARITMÉTICA x Σx Exemplos A) 3 5 37 47 x ( A ) 33 B) 5 10 57 60 x ( B ) 33 C) 8 10 14 100 x ( C ) 33 C B A 0 1 0 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 1 0 0 Quais as difereças etre os cojutos de dados? ALBERTO W. RAMOS 016

ESTATÍSTICA 58 Não se deve tomar decisões baseadas apeas a média A média em sempre é o valor "mais comum" ou "mais típico" ou "poto de simetria". x x x x x x 1 4 16 A média é iflueciada por dados suspeitos (outliers) Salários de uma empresa ( US$ ) 800 800 1000 1400 96000 x 0000 ALBERTO W. RAMOS 016

ESTATÍSTICA 59 VARIÂNCIA E DESVIO-PADRÃO Variâcia: s Σ(x x) 1 Desvio-Padrão: s s Exemplo A) 3 5 37 47 s 15,33 s 11, B) 5 10 57 60 s 87,67 s 9,5 C) 8 10 14 100 C B A 0 0 40 60 80 100 ALBERTO W. RAMOS 016

ESTATÍSTICA 60 DADOS AGRUPADOS Só devem ser utilizados quado ão se dispuser dos dados origiais, uma vez que são valores aproximados. Em geral, a aproximação é boa. Classes c f p F p A 0 x<10 4,95 17 0,34 17 0,34 10 x<0 14,95 16 0,3 33 0,66 0 x<30 4,95 9 0,18 4 0,84 30 x<40 34,9 4 0,08 46 0,9 40 x<50 44,95 0,04 48 0,96 50 x<60 54,95 1 0,0 49 0,98 60 x<70 64,95 1 0,0 50 1,00 Total 50 1,00 x Σf.c x s (c x) 1 f s Σf.c ( Σf.c) 1 s ALBERTO W. RAMOS 016

ESTATÍSTICA 61 MEDIANA E QUARTIS Pode-se calculá-los utilizado o polígoo de frequêcias acumuladas e observado o valor o eixo das abscissas. 1 0,9 0,8 0,7 % Acumulada 0,6 0,5 0,4 0,3 0, 0,1 0 0 10 0 30 40 50 60 70 ALBERTO W. RAMOS 016

ESTATÍSTICA 6 Distribuições Amostrais ALBERTO W. RAMOS 016

ESTATÍSTICA 63 DISTRIBUIÇÃO DA MÉDIA (x) Como: etão: xi x 1 (x 1 + x + x 3 +... + x 1 µ ( x) 1 µ [ µ (x ) + µ (x ) +... + (x )] ) 1. µ [ µ + µ +... + µ ] µ por outro lado: σ 1 x) [ σ (x ) + σ (x ) +... + σ (x )] ( 1 1 [ σ + σ +... + σ ]. σ σ σ (x) σ Obs.: se a amostragem é sem reposição e a população é fiita, etão: σ N σ (X) N 1 ALBERTO W. RAMOS 016

ESTATÍSTICA 64 A distribuição de x é ormal, devido ao Teorema Limite Cetral, desde que seja suficietemete grade. f(x) 0,0 0,15 _ distribuição de x 0,10 distribuição de x 0,05 0,00 10 15 0 5 30 35 40 x f(x) 0,4 0,3 0, _ distribuição de x 0,1 distribuição de x 0,0 0 4 6 8 10 1 14 X ALBERTO W. RAMOS 016

ESTATÍSTICA 65 DISTRIBUIÇÃO χ (QUI-QUADRADO) χ ν ν xi µ ν i 1 σ i 1 z i µ ( χν ) µ ( zi ) ν. µ (zi ) ν σ ( χν ). ν Propriedades: a) Quado ν, ν χ Normal (Teorema do Limite Cetral) b) Se as variáveis são idepedetes χ ν + χ ν χ ν 1 1+ ν f( χ) 0,5 0,4 0,3 ν 0, ν3 0,1 ν6 0,0 0 5 10 15 0 χ ALBERTO W. RAMOS 016

ESTATÍSTICA 66 TABELA DA DISTRIBUIÇÃO χ α ν 0,99 0,95 0,90 0,10 0,05 0,01 1 0,000 0,0039 0,0158,706 3,841 6,635 0,001 0,103 0,11 4,605 5,991 9,10 3 0,115 0,35 0,584 6,51 7,815 11,345 4 0,97 0,711 1,064 7,779 9,488 13,77 5 0,554 1,145 1,610 9,36 11,070 15,086 6 0,87 1,635,04 10,645 1,59 16,81 7 1,39,167,833 1,017 14,067 18,475 8 1,646,733 3,490 13,36 15,507 0,090 9,088 3,35 4,168 14,684 16,919 1,666 10,558 3,940 4,865 15,987 18,307 3,09 11 3,053 4,575 5,578 17,75 19,675 4,75 1 3,571 5,6 6,304 18,549 1,06 6,17 13 4,107 5,89 7,04 19,81,36 7,688 14 4,660 6,571 7,790 1,064 3,685 9,141 15 5,9 7,61 8,547,307 4,996 30,578 16 5,81 7,96 9,31 3,54 6,96 3,000 17 6,408 8,67 10,085 4,769 7,587 33,409 18 7,015 9,390 10,865 5,989 8,869 34,805 19 7,633 10,117 11,651 7,04 30,144 36,191 0 8,60 10,851 1,443 8,41 31,410 37,566 1 8,897 11,591 13,40 9,615 3,671 38,93 9,54 1,338 14,041 30,813 33,94 40,89 3 10,196 13,091 14,848 3,007 35,17 41,638 4 10,856 13,848 15,659 33,196 36,415 4,980 5 11,54 14,611 16,473 34,38 37,65 44,314 6 1,198 15,379 17,9 35,563 38,885 45,64 7 1,879 16,151 18,114 36,741 40,113 46,963 8 13,565 16,98 18,939 37,916 41,337 48,78 9 14,56 17,708 19,768 39,087 4,557 49,588 30 14,953 18,493 0,599 40,56 43,773 50,89 40,164 6,509 9,051 51,805 55,758 63,691 50 9,707 34,764 37,689 63,167 67,505 76,154 60 37,485 43,188 46,459 74,397 79,08 88,379 FONTE: COSTA NETO, P.L.O. Estatística. São Paulo, Edgard Blucher, 1978. ALBERTO W. RAMOS 016

ESTATÍSTICA 67 DISTRIBUIÇÃO DA VARIÂNCIA (s ) Relembrado: s (x x) i 1 Se X ~ N(µ;σ) s ~ χ 1. Note que µ foi substituído por x. χ 1 i 1 x i x σ (x x) i σ (x i x) 1 1 σ ( 1) s σ Logo: s σ χ 1 1 σ σ ( ) ( 1) σ 1 1 µ s ) µ ( χ 1 (s ) 4 σ ( 1) σ ( χ σ 1 ) 4 σ ( 1) ( 1) 4. σ 1 ALBERTO W. RAMOS 016

ESTATÍSTICA 68 DISTRIBUIÇÃO DA FREQUÊNCIA (f) Se a população é ifiita ou amostragem com reposição p (probabilidade de sucesso) é costate. Distribuição de f: Biomial. µ ( f).p σ (f).p.(1 p) DISTRIBUIÇÃO DA PROPORÇÃO (p ) p f Distribuição de p : Biomial. f µ (f).p µ ( p ) µ p f σ (f).p.(1 p) σ ( p ) σ p.(1 p) ALBERTO W. RAMOS 016

ESTATÍSTICA 69 DISTRIBUIÇÃO t-student Se X tem distribuição ormal com média µ e desvio-padrão σ x também terá distribuição com média µ, mas com desviopadrão σ / Pode-se defiir: z x µ σ Se o lugar de σ for usado s, etão: t 1 x µ s 0,0 0,15 distribuição de z 0,10 de t distribuição -1 0,05 0,00-8 -6-4 - 0 4 6 8 z, t ALBERTO W. RAMOS 016

ESTATÍSTICA 70 TABELA DA DISTRIBUIÇÃO t-student α ν 0,100 0,050 0,05 0,010 1 3,078 6,314 1,706 31,81 1,886,90 4,303 6,965 3 1,638,353 3,18 4,541 4 1,533,13,776 3,747 5 1,476,015,571 3,365 6 1,440 1,943,447 3,143 7 1,415 1,895,365,998 8 1,397 1,860,306,896 9 1,383 1,833,6,81 10 1,37 1,81,8,764 11 1,363 1,796,01,718 1 1,356 1,78,179,681 13 1,350 1,771,160,650 14 1,345 1,761,145,64 15 1,341 1,753,131,60 16 1,337 1,746,10,583 17 1,333 1,740,110,567 18 1,330 1,734,101,55 19 1,38 1,79,093,539 0 1,35 1,75,086,58 1 1,33 1,71,080,518 1,31 1,717,074,508 3 1,319 1,714,069,500 4 1,318 1,711,064,49 5 1,316 1,708,060,485 30 1,310 1,697,04,457 50 1,99 1,676,009,403 80 1,9 1,664 1,990,374 10 1,89 1,657 1,980,351 1,8 1,645 1,960,36 FONTE: COSTA NETO, P.L.O. Estatística. São Paulo, Edgard Blucher, 1978. ALBERTO W. RAMOS 016

ESTATÍSTICA 71 Estimação de Parâmetros ALBERTO W. RAMOS 016

ESTATÍSTICA 7 Quado um parâmetro de uma população é descohecido, vamos estimá-lo a partir das estatísticas forecidas pelas amostras. AMOSTRA ESTATÍSTICA POPULAÇÃO PARÂMETRO ALBERTO W. RAMOS 016

ESTATÍSTICA 73 ESTIMADOR E ESTIMATIVA Estimador: Quatidade calculada em fução dos elemetos da amostra, que será usada a estimação do parâmetro. Estimativa: Um certo valor de um estimador. EXEMPLO 113-14 - 115-107 - 10-115 110 estimador (de µ) estimativa x 114,9 x~ 115 m 0 115 ALBERTO W. RAMOS 016

ESTATÍSTICA 74 ESTIMAÇÃO POR PONTO A estimação por poto cosiste em forecer um úico valor, que é a melhor estimativa para o parâmetro da população. a) Estimação com base em uma amostra Parâmetro Estimado µ σ σ p Melhor Estimador xi x (x µ ) i s (x x) i s 1 s s 1 s s c4 f p Observações µ cohecido µ descohecido 30 < 30 ALBERTO W. RAMOS 016

ESTATÍSTICA 75 b) Estimação com base em várias (k) amostras Amostra Valores x s 1 x 11 x 1 x 13... x 1 x 1 s 1 x 1 x x 3... x x s 3 x 31 x 3 x 33... x 3 x 3 s 3............ k x k1 x k x k3... x k x k s k x.x 1 1 +.x + 1 + 3.x3 +... + k.x + +... + 3 k k Se 1 3... k x x k i s p ( 1 1)s 1 + ( 1)s +... + ( + +... + k 1 k k 1)s k Se 1 3... k s p si k p p 1.p 1 +.p +... + k.p k + +... + 1 k Se 1 3... k p p p i k ALBERTO W. RAMOS 016

ESTATÍSTICA 76 ESTIMAÇÃO POR INTERVALO Todas as estimativas por poto cotêm um erro, pois são diferetes do valor do parâmetro, embora próximas. Para avaliar a magitude do erro de estimação, costrói-se um Itervalo de Cofiaça (IC) em toro da estimativa, com probabilidade cohecida. Notação: f(z) 0,4 0,3 σ 1 z 0, 0,1 p 0,0 0 z p z µ média da população x média da amostra σ desvio-padrão da população s desvio-padrão da amostra tamaho da amostra e 0 semi-amplitude do IC IC.e 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 77 a) IC para µ com σ cohecido: 0,0 0,15 0,10 0,05 α/ 1 α α/ 0,00 µ-e 0 µ µ+e 0 x _ P 0 0 ( µ e x µ + e ) 1 α e 0 x x + e µ µ 0 µ x + e 0 x e 0 µ x e µ x + 0 e 0 (x e µ x + e ) 1 α P 0 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 78 ( µ + e0 ) µ σ z α / e0 z / α σ IC para µ: x ± z α / σ b) IC para µ com σ descohecido: Se σ é descohecido, substitui-se por s a fórmula aterior e, este caso, passa-se a ter um t-studet com -1 graus de liberdade. x ± t 1; α / s ALBERTO W. RAMOS 016

ESTATÍSTICA 79 c) IC para σ : α/ 1 α α/ 0 χ 1 ( 1) s σ P( χ χ χ ) 1 α α α 1;1 / 1 1; / χ 1;1 α / ( 1)s σ χ 1; α / ( 1)s χ 1; α / σ ( 1)s χ 1;1 α / ( 1)s ( 1)s P σ χ 1; α / χ 1;1 α / 1 α ALBERTO W. RAMOS 016

ESTATÍSTICA 80 d) IC para σ ( 1)s χ σ ( 1)s χ P 1; α / 1;1 α / 1 α e) IC para p p tem Distribuição Biomial µ ( p ) p p(1 p) σ (p ) Se.p 5 e.(1-p) 5 vale aproximação pela Normal. α e0 z / p(1 p) Como ão cohecemos p, usamos p : α p ± z / p.(1 p ) ALBERTO W. RAMOS 016

ESTATÍSTICA 81 TAMANHO DE AMOSTRAS (PARA ESTIMAÇÃO) a) Média:. Se σ cohecido: e0 z α / σ z e α / 0 σ. Se σ descohecido: t 1; α / e 0 s tamaho da amostra-piloto b) Proporção Populacioal (probabilidade): z e α / 0 p (1 p ) Se ão há estimativa para p, adotar p 1/. ALBERTO W. RAMOS 016

ESTATÍSTICA 8 Testes de Hipóteses ALBERTO W. RAMOS 016

ESTATÍSTICA 83 Com base os resaultados da amostra, quer se testar uma certa hipótese (cosiderada como válida, até prova em cotrário), a respeito de um parâmetro da população. Notação: H 0 hipótese ula, a ser testada H 1 hipótese alterativa Exemplo: H 0 o réu é iocete H 1 o réu é culpado Vai se obter uma amostra e: aceito H 0 (fraco) rejeito H 0 e afirmo H 1 (forte) ALBERTO W. RAMOS 016

ESTATÍSTICA 84 TIPOS DE ERROS Dois tipos de erros podem ser cometidos em testes de hipóteses: a) Erro tipo I: rejeitar H 0 quado H 0 é verdadeira. Ex.: juiz codear um réu iocete. b) Erro tipo II: aceitar H 0 quado H 0 é falsa. Ex.: juiz absolve um réu culpado. Cada tipo de erro tem uma certa probabilidade de ser cometido (α e β, respectivamete). REALIDADE DECISÃO aceitar H 0 rejeitar H 0 H 0 verdadeira decisão correta 1 - α erro tipo I α H 0 falsa erro tipo II β decisão correta 1 - β ALBERTO W. RAMOS 016

ESTATÍSTICA 85 EXEMPLO Um certo fabricate de peus afirma que estes têm duração média de 45.000 Km e desvio-padrão de 3.000 Km. Uma empresa adquiriu um lote deste produto, retirou e testou uma amostra de 16 peus que foreceu x 44.175 Km. Qual a decisão: aceitar ou rejeitar o lote? DICA: quado motar as hipóteses, colocar sempre em H 1 aquilo que se deseja afirmar ou provar. ALBERTO W. RAMOS 016

ESTATÍSTICA 86 Hipóteses: H 0 : µ 45.000 H 1 : µ < 45.000 σ Se H 0 é verdadeira x ~ N( µ ; ) µ 45.000 σ 3.000 16 750 0,0005 0,0004 _ σ x 750 0,0003 0,000 1 α 0,95 0,0001 α 0,05 0,0000 _ x1 µ 45000 _ X x1 45.000 z 1,645 1,645 x1 750 1 43.766 Como x 44.175, aida cai a região de probabilidade 1 - α 95% aceito H 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 87 TESTES PARA A MÉDIA A) σ cohecido: 1º Caso: H 0 : µ µ 0 H 1 : µ < µ 0 1 α α _ x1 µ 0 _ x x1 0 µ zα σ Se x x rejeito H 0 CALC < 1 ou se xcalc µ CALC < zα σ rejeito H 0 z 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 88 º Caso: H 0 : µ µ 0 H 1 : µ > µ 0 1 α α µ 0 x x x 0 µ + zα σ Se x x rejeito H 0 CALC > ou se z CALC > z α rejeito H 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 89 3º Caso: H 0 : µ µ 0 H 1 : µ µ 0 α/ 1 α α/ _ x µ 0 x x 1 x1 µ 0 zα / σ x µ 0 + zα / σ Se x CALC < x1 ou x CALC > x rejeito H 0 ou se zcalc < zα / ou zcalc > zα / rejeito H 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 90 B) σ descohecido: 1º Caso: H 0 : µ µ 0 H 1 : µ < µ 0 s x 1 µ 0 t 1; α ou x µ s CALC 0 tcalc Se x CALC < x1 ou t CALC < t 1; α rejeito H 0 º Caso: H 0 : µ µ 0 H 1 : µ > µ 0 x µ 0 + t 1; α s Se xcalc > x ou t CALC > t 1; α rejeito H 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 91 3º Caso: H 0 : µ µ 0 H 1 : µ µ 0 x µ 0 t 1; α / 1 x µ 0 + t 1; α / s s Se x CALC < x1 ou x CALC > x rejeito H 0 Ou se t CALC < t 1; α / ou t CALC > t 1; α / rejeito H 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 9 TESTES PARA VARIÂNCIA 1º Caso: H 0 : H 1 : σ σ σ > σ 0 0 Se H 0 for verdadeira ( σ σ 0 ), resulta: ( 1)s σ 0 χ 1 1 α α 0 s s Se Se Se s s rejeito H 0 CALC ( σ > 1)s CALC 0 > χ 1; α rejeito H 0 χ > χ rejeito H CALC 1; α 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 93 º Caso: H 0 : H 1 : σ σ σ < σ 0 0 Se χ < χ rejeito H CALC 1;1 α 0 3º Caso: H 0 : H 1 : σ σ σ σ 0 0 Se ou Se χ < χ CALC 1;1 α / rejeito H 0 χcalc > χ 1; α / rejeito H 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 94 TESTES PARA PROPORÇÃO Sabemos que p tem distribuição biomial. Porém, se.p 0 5 e.(1-p 0 ) 5 a distribuição de p poderá ser aproximada por uma distribuição ormal* 1º Caso: H 0 : p p 0 H 1 : p < p 0 p0(1 p0) p1 p0 zα Se p' p1 ou zcalc p' p0 < z p0(1 p0) rejeito H 0 < α º Caso: H 0 : p p 0 H 1 : p > p 0 p0(1 p0) p p0 + zα Se p' p ou zcalc p' p0 > z p0(1 p0 ) rejeito H 0 > α Nota: se esta aproximação ão for válida, deve-se empregar o teste exato de Fischer, cuja teoria foge ao escopo deste curso. ALBERTO W. RAMOS 016

ESTATÍSTICA 95 3º Caso: H 0 : p p 0 H 1 : p p 0 p1 p0 zα / p0(1 p0) p p0 + zα / p0(1 p0) Se p' p ou se p' > rejeito H 0 < 1 p ou aida, se z CALC < z α / ou se zcalc > z α / rejeito H 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 96 TAMANHO DE AMOSTRA PARA TESTES DE HIPÓTESES Sejam as hipóteses: e vamos assumir que: H 0 : µ µ 0 H 1 : µ > µ 0 σ é cohecido e; α e β estâo fixados (determiados). Se H 0 é verdadeira, ou seja, se µ µ 0 1 α α µ 0 x x µ + zα x 0 σ ALBERTO W. RAMOS 016

ESTATÍSTICA 97 Mas, se em realidade µ µ >µ 0, etão 1 α 1 β E, cosequetemete β α _ 0 ' µ x µ _ x x µ zβ σ igualado-se ambas expressões, resulta em zα + z µ µ 0 β σ ou, se σ é descohecido t 1; α + t µ µ 1; β 0 s ALBERTO W. RAMOS 016

ESTATÍSTICA 98 Se, alterativamete, as hipóteses testadas fossem: Etão: H 0 : µ µ 0 H 1 : µ µ 0 z α / + z µ µ 0 β σ ou, se s fôr descohecido t 1; α / + t µ µ 0 1; β s Aalogamete, para o caso de testes uilaterais da proporção, cosiderada válida a aproximação da distribuição da biomial pela ormal: z α p 0 (1 p 0 ) + z p' p 0 β p'(1 p' ) Como ficaría a expressão acima para teste bilateral da proporção? ALBERTO W. RAMOS 016

ESTATÍSTICA 99 Comparações Múltiplas ALBERTO W. RAMOS 016

ESTATÍSTICA 100 COMPARAÇÃO DE VÁRIAS VARIÂNCIAS Sejam várias amostras, de mesmo tamaho (), retiradas de k populações Normais. Se quisermos testar as hipóteses: H 0 : σ 1 σ... σk H 1 : pelo meos um σ i diferete dos demais obtemos: max s g (i 1,,..., k) i CALC s i e também: g CRIT fução de, k e α Se g g rejeito H 0 e afirmo H 1 CALC > CRIT ALBERTO W. RAMOS 016

ESTATÍSTICA 101 TABELA g (α 5%) 3 4 5 6 7 8 9 10 k 0,9985 0,9750 0,939 0,9057 0,877 0,8534 0,833 0,8159 0,8010 3 0,9669 0,8709 0,7977 0,7457 0,7071 0,6771 0,6530 0,6333 0,6167 4 0,9065 0,7679 0,6841 0,687 0,5895 0,5598 0,5365 0,5157 0,5017 5 0,841 0,6838 0,5931 0,5441 0,5065 0,4783 0,4564 0,4387 0,441 6 0,7808 0,6161 0,531 0,4803 0,4447 0,4184 0,3980 0,3817 0,368 7 0,771 0,561 0,4800 0,4307 0,3974 0,376 0,3535 0,3384 0,359 8 0,6798 0,5157 0,4377 0,3910 0,3595 0,336 0,3185 0,3043 0,96 9 0,6385 0,4775 0,407 0,3584 0,386 0,3067 0,901 0,768 0,659 10 0,600 0,4450 0,3733 0,3311 0,309 0,83 0,666 0,541 0,439 Observações: k quatidade de amostras tamaho da amostra ALBERTO W. RAMOS 016

ESTATÍSTICA 10 EXEMPLO Cico amostras com quatro elemetos cada foreceram s i : 3,7 -,5-5,1-6,0-3,. Ao ível de sigificâcia de 5%, existe evidêcia que alguma σ seja diferete das demais? i 4 e k 5 max s i 6,0 s i 0, 5 Com isso, temos: 6,0 g CALC 0,5 0,97 g g5;4;5% CRIT 0,5931 aceito que as variâcias são iguais, ou seja: σ 1 σ σ3 σ4 σ5 ALBERTO W. RAMOS 016

ESTATÍSTICA 103 COMPARAÇÃO DE VÁRIAS MÉDIAS Vamos imagiar que temos três grupos de pessoas e que se quer verificar se o seu QI (quociete de iteligêcia) médio é igual. Para tato, sorteiou-se oito idivíduos de cada grupo e a estes foi aplicado um certo teste. Os resultados obtidos serão apotados uma tabela da seguite forma: Grupo Notas x s 1 x 11 x 1 x 13... x 18 x1 s 1 x 1 x x 3... x 8 x s 3 x 31 x 3 x 33... x 38 x3 s 3 Notação empregada: - tamaho da amostra (8, o caso) k - quatidade de médias comparadas (3, o caso) x - média da amostra do grupo i i x - média geral (média das médias) s - variâcia da amostra do grupo i i d e s - variâcia detro da amostra (ou residual) s - variâcia etre amostras s t - variâcia total ALBERTO W. RAMOS 016

ESTATÍSTICA 104 Como ão se cohece a variâcia da população, chamada de σ, pode-se estimá-la mediate três métodos diferetes: Método 1: através dos s obtidos em cada grupo s s d k s i (x ij x k.( 1) i ) Método : através das médias dos grupos s e (xi x). k 1 Método 3: através de todos os dados idividuais (xij x) s t.k 1 Como toda esta otação é muito complicada, vamos mostrar os coceitos mediate aplicação ao exemplo do QI. ALBERTO W. RAMOS 016

ESTATÍSTICA 105 Imagie que os resultados obtidos teham sido os seguites: Grupo Notas x s 1 4 5 5 4 8 4 3 7 5,0,9 4 3 7 5 4 5 4,0,9 3 3 6 6 4 5 4 6 6 5,0 1,4 Método 1: através dos s obtidos em cada grupo,9,9 1,4 s + + d 3,4 Método : através das médias dos grupos 5,0 + 4,0 + 5,0 x 3 4,7 s [(5,0 4,7) + (5,0 4,7) ] e 8. + (4,0 4,7) (3 1),7 Método 3: através de todos os dados idividuais s [(4 4,7) + (5 4,7) +... + (6 4,7) ] t + (5 4,7) 8.3 1,4 Pode-se perceber que: as médias x são próximas; os valores de s d, s e e s t também são próximos. ALBERTO W. RAMOS 016

ESTATÍSTICA 106 Imagie, agora, que os resultados obtidos fossem: Grupo Notas x s 1 4 5 5 4 8 4 3 7 5,0,9 0 1 5 3 0 3,0,9 3 7 10 10 8 9 8 10 10 9,0 1,4 Método 1: através dos s obtidos em cada grupo,9,9 1,4 s + + d 3,4 Método : através das médias dos grupos 5,0 +,0 + 9,0 x 5,3 3 s [(5,0 5,3) + (9,0 5,3) ] e 8. + (,0 5,3) (3 1) 98,7 Método 3: através de todos os dados idividuais s [(4 5,3) + (5 5,3) +... + (6 5,3) ] t + (5 5,3) 8.3 1 10,8 Pode-se perceber, este ovo cojuto de resultados, que: as médias x ão mais são próximas; o valor de s ão se alterou; d os valores de s e e s t aumetaram muito. ALBERTO W. RAMOS 016

ESTATÍSTICA 107 Os gráficos abaixo ajudam a iterpretação dos resultados. No primeiro cojuto de dados as médias estavam próximas: 1 10 8 6 4 0-1 3 Max Mi Média Já o outro cojuto, as médias apresetavam-se mais afastadas umas em relação às outras: 1 10 8 6 4 0-1 3 Max Mi Média ALBERTO W. RAMOS 016

ESTATÍSTICA 108 COMENTÁRIOS 1. Se as médias das populações são iguais, os valores de x i serão próximos e tato faz estimar-se σ através de s d, s e ou s, pois todos eles forecerão valores próximos. t. Mas, quado as médias das populações são difere-tes, os valores de x i divergirão etre si. Embora s d cotiue sedo um bom estimador de σ, s e são afetados pela difereça etre as médias. e s t ão mais o serão, pois 3. Assim, pode-se comparar as médias das diversas populações (k) através da comparação de variâcias: s e e s d, respectivamete. Este teste é chamado de teste F, ode: se F calc s s tem (k-1) graus de liberdade, s d tem [k.(-1)] graus de liberdade. Portato, F calc terá (k-1) o seu umerador; [k.(- 1)] graus de liberdade o seu deomiador. 4. e 5. Quato maior o valor de F calc maior é a probabilidade de que as médias sejam diferetes etre si. Para chegar a uma coclusão, F calc é comparado cotra um F crit, obtido a partir de uma tabela. 6. Se F calc < F crit, etão admite-se que as médias são iguais. 7.A aálise de variâcia assume a hipótese de que as populações possuem a mesma variâcia (σ ). Se isto ão ocorrer, os resultados ão serão válidos. d ALBERTO W. RAMOS 016

ESTATÍSTICA 109 DISTRIBUIÇÃO F-SNEDECOR Sejam duas amostras idepedetes, retiradas de populações Normais, com mesma variâcia (σ ), que foreceram estimativas s 1 e s, respectivamete. Ao quociete de s por s, chamamos de: 1 F 1 1; 1 s s 1 f(f) 0,7 0,6 0,5 0,4 0,3 0, 0,1 0,0 0 1 3 4 5 6 7 F ALBERTO W. RAMOS 016

ESTATÍSTICA 110 TABELA F-SNEDECOR (α 5%) ν 1 ν 1 3 4 5 6 7 8 9 10 1 161,4 199,5 15,7 4,6 30, 34,0 36,8 38,9 40,5 41,9 18,51 19,00 19,16 19,5 19,30 19,33 19,35 19,37 19,38 19,40 3 10,13 9,55 9,8 9,1 9,01 8,94 8,89 8,85 8,81 8,79 4 7,71 6,94 6,59 6,39 6,6 6,16 6,09 6,04 6,00 5,96 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,8 4,77 4,74 6 5,99 5,14 4,76 4,53 4,39 4,8 4,1 4,15 4,10 4,06 7 5,59 4,74 4,35 4,1 3,97 3,87 3,79 3,73 3,68 3,64 8 5,3 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 9 5,1 4,6 3,86 3,63 3,48 3,37 3,9 3,3 3,18 3,14 10 4,96 4,10 3,71 3,48 3,33 3, 3,14 3,07 3,0,98 11 4,84 3,98 3,59 3,36 3,0 3,09 3,01,95,90,85 1 4,75 3,89 3,49 3,6 3,11 3,00,91,85,80,75 13 4,67 3,81 3,41 3,18 3,03,9,83,77,71,67 14 4,60 3,74 3,34 3,11,96,85,76,70,65,60 15 4,54 3,68 3,9 3,06,90,79,71,64,59,54 16 4,49 3,63 3,4 3,01,85,74,66,59,54,49 17 4,45 3,59 3,0,96,81,70,61,55,49,45 18 4,41 3,55 3,16,93,77,66,58,51,46,41 19 4,38 3,5 3,13,90,74,63,54,48,4,38 0 4,35 3,49 3,10,87,71,60,51,45,39,35 1 4,3 3,47 3,07,84,68,57,49,4,37,3 FONTE: COSTA NETO, P.L.O. Estatística. São Paulo, Edgard Blucher, 1978. ALBERTO W. RAMOS 016

ESTATÍSTICA 111 EXEMPLO O segudo cojuto de resultados do teste de QI, foreceu: s e 98,7 e s d,4 logo 98,7 F calc,4 41,1 F calc tem (3-1) GL o umerador e [3 x (8-1)] 1 GL o deomiador. F crit (para um α5%) será F, 1, 5% 3,47 > pelo meos uma turma é diferete das demais. ALBERTO W. RAMOS 016

ESTATÍSTICA 11 TABELA DA ANÁLISE DE VARIÂNCIA É comum apresetar-se os resultados da aálise de variâcia a forma de uma tabela, similar à de baixo: Fote SQ GL QM F CALC Etre. (x x (k-1) s s / s Detro Total i ) x x ij xi) ( k.(-1) ij x) ( k.-1 e s d s t e d ode: SQ - é a soma de quadrados GL - são os graus de liberdade das estimativas QM - é o quadrado médio SQ/GL No caso de osso exemplo do teste de QI, com o segudo cojuto de dados, tem-se: Fote SQ GL QM F CALC Etre 197,3 98,7 41,4 Detro 50,0 1,4 Total 47,3 3 10,8 ALBERTO W. RAMOS 016

ESTATÍSTICA 113 AMOSTRAS DE TAMANHOS DIFERENTES Há situações ode, evetualmete, pode-se estar trabalhado com amostras de tamaho diferete. Neste caso, a tabela da Aálise de Variâcia é modificada da seguite forma: Fote SQ GL QM F CALC SQE Etre SQESQT-SQD (k-1) s E s E/ s R k 1 SQR Residual SQR (i 1) s i i k sr i k Total Obs: este caso (x SQT x 1 ij ) i s T s R ( 1 1)s 1 + ( 1)s +... + (k + +... + k 1 k 1)s k ALBERTO W. RAMOS 016

ESTATÍSTICA 114 ALGUNS CUIDADOS A aálise de variâcia tem algumas hipóteses básicas que são assumidas para sua validade: o modelo válido é do tipo xij µ + α + ε, ode µ é a média geral, α i é o efeito do ível i do fator e ε ij é o erro; as populações são homocedásticas, ou seja, possuem a mesma variâcia em comum σ ; as populações podem ser adequadamete represetadas por uma distribuição de probabilidade ormal; coseqüetemete, ε ij ~N(0; σ ). 1. A codição de homocedasticidade é fudametal para que os resultados sejam válidos e pode ser verificada mediate uma aálise de resíduos ou, etão, pelo teste de Cochra ou de Bartlett.. A codição de ormalidade dos dados ão é essecial, pois a aálise de variâcia forece bos resultados mesmo quado a população ão é ormal. Ela pode ser verificada através do papel de probabilidade ormal. i ij ALBERTO W. RAMOS 016

ESTATÍSTICA 115 Correlação e Regressão ALBERTO W. RAMOS 016

ESTATÍSTICA 116 CORRELAÇÃO Quado duas (ou mais) variáveis apresetam tedêcia de variação cojuta, diz-se que estas se correlacioam EXEMPLO Criaça Peso Altura 1 3 4 5 6 7 8 9 10 30 3 4 8 6 34 5 3 35 31 145 150 15 140 17 145 13 11 155 145 Existe correlação etre peso e altura? ALBERTO W. RAMOS 016

ESTATÍSTICA 117 O diagrama de dispersão é uma maeira rápida e eficiete de verificar a existêcia de correlação 165 PESO x ALTURA 155 145 135 15 115 105 4 6 8 30 3 34 36 Qual é a coclusão? ALBERTO W. RAMOS 016

ESTATÍSTICA 118 TIPOS DE CORRELAÇÃO 14 CORRELAÇÃO LINEAR POSITIVA (QUANDO X AUMENTA > Y TAMBÉM AUMENTA) 1 10 8 Y 6 4 0 0 4 6 8 10 1 14 X 14 CORRELAÇÃO LINEAR NEGATIVA (QUANDO X AUMENTA > Y DIMINUI) 1 10 8 Y 6 4 0 0 4 6 8 10 1 14 X 7 CORRELAÇÃO NÃO LINEAR 6 5 4 Y 3 1 0 0 4 6 8 10 1 14 X ALBERTO W. RAMOS 016

ESTATÍSTICA 119 COEFICIENTE DE CORRELAÇÃO LINEAR Para medir o grau de correlação etre duas variáveis, podese utilizar o coeficiete de correlação liear: Σ(xi x)(yi y) r Σ(x x) Σ(y y) i i S S XX XY.S YY ode: S XY x.y i i ( xi. yi ) S S XX YY x y i i ( xi ) ( yi ) A sua iterpretação é a seguite: o valor de r varia de -1 a +1 (iclusive) r > 0 idica correlação liear positiva r < 0 idica correlação liear egativa r -1 idica correlação liear egativa perfeita r +1 idica correlação liear positiva perfeita ALBERTO W. RAMOS 016

ESTATÍSTICA 10 CUIDADOS NA CORRELAÇÃO a) Estratificação de Dados y y x x b) Amplitude do Estudo de Correlação y CONDIÇÃO NORMAL x c) Picos e Vales y y x x ALBERTO W. RAMOS 016

ESTATÍSTICA 11 TESTE DA CORRELAÇÃO Para determiar se a correlação é estatisticamete sigificativa ou ão, faz-se um teste de hipóteses quato ao coeficiete de correlação populacioal (ρ). Assim: H 0 : ρ 0 H 1 : ρ 0 (ão há correlação) (há correlação) Estas hipóteses serão testadas mediate o cálculo de um t de Studet, defiido como: t calc t r 1 r que será comparado cotra t crit t -;α/. Se t calc > t crit H 0 será rejeitada e pode-se afirmar que a correlação existe. ALBERTO W. RAMOS 016

ESTATÍSTICA 1 REGRESSÃO O objetivo fudametal da regressão é descobrir a equação que relacioa duas (ou mais) variáveis, ou seja: y f(x 1, x,..., x k ) + ε ode: x 1, x,..., x k são chamadas de fatores; f(x 1, x,..., x k ) idica uma fução de várias variáveis; ε é chamado de erro. EXEMPLOS Resposta Pressão Redimeto Viscosidade Variáveis Volume e Temperatura Temperatura, Tempo e Quatidade de Catalisador Temperatura, Pressão, Velocidade e Vazão ALBERTO W. RAMOS 016

ESTATÍSTICA 13 REGRESSÃO LINEAR SIMPLES Admite que uma equação do primeiro grau represeta satisfatoriamete o modelo: y β 0 + β 1.x como as costates β 0 e β 1 são descohecidas, etão a equação da reta será estimada através de: ode: b 0 - é o itercepto da reta ŷ b0 + b1.x b 1 - é a coeficiete agular da reta y ^ y b 0 + b 1 x tg θ b 1 b 0 x ALBERTO W. RAMOS 016

ESTATÍSTICA 14 EXEMPLO Foi feito um levatameto de diversos modelos de automóveis quato a potêcia do motor (Hp) e o cosumo médio (km/l). Carro Potêcia Cosumo 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 130 81 93 113 90 63 55 10 9 81 103 90 74 73 10 78 100 100 10,1 10,5 11,3 10,5 11,6 1,4 15,0 11,3 1,4 1,0 10,9 11,6 1,4 13,1 10,9 1,0 10,5 10,5 ALBERTO W. RAMOS 016

ESTATÍSTICA 15 DETERMINAÇÃO DA EQUAÇÃO DA RETA A equação da reta é determiada a partir dos dados da tabela aterior, através do método dos míimos quadrados, utilizado-se as seguites fórmulas: b 1 S S XY XX ode: S XY x y i i ( x i. yi) e S XX xi ( xi) O outro termos é obtido através de: b 0 y - b 1.x ALBERTO W. RAMOS 016

ESTATÍSTICA 16 Para facilitar os cálculos, usa-se uma tabela auxiliar: Carro Potêcia Cosumo x i y i (x i ) (y i ) 1 130 10,1 16900 10,01 1313,0 81 10,5 6561 110,5 850,5 3 93 11,3 8649 106,09 957,9 4 113 10,5 1769 110,5 1186,5 5 90 11,6 8100 134,56 1044,0 6 63 1,4 3969 153,76 781, 7 55 15,0 305 5,00 85,0 8 10 11,3 10404 17,69 115,6 9 9 1,4 8464 153,76 1140,8 10 81 1,0 6561 144,00 97,0 11 103 10,9 10609 118,81 11,7 1 90 11,6 8100 134,56 1044,0 13 74 1,4 5476 153,76 917,6 14 73 13,1 15 10 10,9 16 78 1,0 17 100 10,5 18 100 10,5 TOTAL 160 08,0 151404 49,4 18411,9 x i y i S XY S XX b 1 b 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 17 Assim sedo, resulta que a reta (de regressão) é: ŷ 16,504-0,055.x Abaixo é mostrado um gráfico (diagrama de dispersão) com os potos e a reta marcados. 15.5 QUILOMETRAGEM 14.5 13.5 1.5 11.5 ^ y 16,504-0,055.x 10.5 9.5 40 50 60 70 80 90 100 110 10 130 140 POTÊNCIA Qual a melhor estimativa do cosumo médio do carro quado seu motor tem 90 Hp de potêcia? ALBERTO W. RAMOS 016

ESTATÍSTICA 18 COMENTÁRIOS: o método dos míimos quadrados busca traçar a melhor reta através dos potos, ou seja, aquela que tora míima a distâcia destes à reta; sempre é possível obter a equação de uma reta que passa por um cojuto de potos, mas isto ão sigifica que o modelo seja ecessariamete adequado; para se verificar a adequação do modelo, emprega-se a aálise de variâcia (ANOVA). é recomedável também fazer uma aálise de resíduos para completar a aálise de adequação do modelo. ALBERTO W. RAMOS 016

ESTATÍSTICA 19 ANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO Para verificar se a regressão liear é estatisticamete sigificativa, deve-se testar o seguite cojuto de hipóteses: H 0 : β 1 0 H 1 : β 1 0 (ão há regressão) (há regressão) Este teste pode ser feito mediate a aplicação do método da aálise de variâcia. Pode-se idetificar dois tipos de variâcia diferetes: a total e a residual. A variâcia total é estimada através de: s T i 1 (y i y) 1 SYY 1 A variâcia residual (ou em toro da reta de regressão) é estimada através de: s R i 1 (y i ŷ) S YY b 1 S XX ALBERTO W. RAMOS 016

ESTATÍSTICA 130 À difereça etre estas duas variâcias chama-se de variâcia devido ao modelo de regressão, que é estimada através de: s M b 1 S 1 XX Se a regressão for sigificativa, etão a variâcia residual (ou devida ao erro) deve ser pequea quado comparada com a variâcia devida a regressão. Cosequetemete, o quociete das duas variâcias (regressão/erro) pode ser testado mediate um F-Sedecor. Em termos de tabela, este teste fica: Fote GL SQ QM Fcalc b Regressão 1 b 1 S XX b 1 S 1 S XX s Erro - S YY b 1 S XX s R S YY b 1.S XX R XX Total -1 S YY F calc será comparado cotra F crit F 1; -; α e se F calc > F crit rejeita-se H 0 ALBERTO W. RAMOS 016

ESTATÍSTICA 131 ANÁLISE DE RESÍDUOS O resíduo (ou erro) é defiido como sedo a difereça etre o valor observado (y) e o valor previsto pela equação obtida (ychapéu). Assim, o exemplo: Amostra x y ŷ e y - ŷ 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 130 81 93 113 90 63 55 10 9 81 103 90 74 73 10 78 100 100 10,1 10,5 11,3 10,5 11,6 1,4 15,0 11,3 1,4 1,0 10,9 11,6 1,4 13,1 10,9 1,0 10,5 10,5 9,4 1,0 11,4 10,3 11,6 13,0 13,5 10,9 11,4 1,0 10,8 11,6 1,4 1,5 10,9 1, 11,0 11,0 0,7-1,5-1,1 0, 0-0,6 1,5 0,4 1,0 0 0,1 0 0 0,6 0-0, -0,5-0,5 ALBERTO W. RAMOS 016

ESTATÍSTICA 13 Se o modelo (liear) ajustado aos dados for adequado, etão os resíduos devem se apresetar distribuídos aleatoriamete em toro do valor zero, quado marcados um gráfico cartesiao como o abaixo. 1.5 1 0.5 RESÍDUO 0-0.5-1 -1.5-9.5 10.5 11.5 1.5 13.5 14.5 15.5 x Padrões estrahos observados a forma em que os resíduos se distribuem este gráfico podem idicar problemas. ALBERTO W. RAMOS 016

ESTATÍSTICA 133 Papel de Probabilidade Normal ALBERTO W. RAMOS 016

ESTATÍSTICA 134 PAPEL DE PROBABILIDADE NORMAL (PPN) O PPN tem por objetivo verificar graficamete se dados experimetais aderem à distribuição ormal. 1 o Caso: muitos dados (> 30) EXEMPLO Duração Quatidade % acumulada 50 x < 55 5 5,0 55 x < 60 60 x < 65 65 x < 70 70 x < 75 75 x < 80 3 36 7 8 1 8,0 64,0 91,0 99,0 100,0 ALBERTO W. RAMOS 016