Documentos relacionados
É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Estudo das relações entre peso e altura de estudantes de estatística através da análise de regressão simples.

Cap. 5. Testes de Hipóteses

Econometria: 4 - Regressão Múltipla em Notação Matricial

IND 1115 Inferência Estatística Aula 9

Matemática. Resolução das atividades complementares. M18 Noções de Estatística

Análise de Regressão

Capítulo 1: Erros em cálculo numérico

Macroeconometria Aula 3 Revisão de estatística e teste de hipótese

Distribuições Amostrais. Estatística. 8 - Distribuições Amostrais UNESP FEG DPD

INTRODUÇÃO ÀS PROBABILIDADES E ESTATÍSTICA

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

CAPÍTULO 9 - Regressão linear e correlação

Perguntas Freqüentes - Bandeiras

MA12 - Unidade 4 Somatórios e Binômio de Newton Semana de 11/04 a 17/04

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

Estatística Notas de Aulas ESTATÍSTICA. Notas de Aulas. Professor Inácio Andruski Guimarães, DSc. Professor Inácio Andruski Guimarães, DSc.

MAE116 Noções de Estatística

A REGRESSÃO LINEAR EM EVENTOS HIDROLÓGICOS EXTREMOS: enchentes

CAPÍTULO 2 - Estatística Descritiva

Requisitos metrológicos de instrumentos de pesagem de funcionamento não automático

Econometria: 3 - Regressão Múltipla

Inferência Estatística e Aplicações I. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP

SUMÁRIO GOVERNO DO ESTADO DO CEARÁ. Cid Ferreira Gomes Governador. 1. Introdução Domingos Gomes de Aguiar Filho Vice Governador

MATERIAL DE ESTATÍSTICA II PROF. MÁRIO ROBERTO

APOSTILA DE ESTATÍSTICA APLICADA A ADMINISTRAÇÃO, ECONOMIA, MATEMÁTICA INDUSTRIAL E ENGENHARIA

Olá, amigos concursandos de todo o Brasil!

UERJ CTC IME Departamento de Informática e Ciência da Computação 2 Cálculo Numérico Professora Mariluci Ferreira Portes

Professor Mauricio Lutz REGRESSÃO LINEAR SIMPLES. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: ö ; ø.

Teoria da Amostragem

x n = n ESTATÍSTICA STICA DESCRITIVA Conjunto de dados: Organização; Amostra ou Resumo; Apresentação. População

Probabilidades e Estatística LEGM, LEIC-A, LEIC-T, MA, MEMec

CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE PPGEP Medidas de Tendência Central Média Aritmética para Dados Agrupados

PUCRS FAMAT DEPTº DE ESTATÍSTICA ESTATÍSTICA DESCRITIVA SÉRGIO KATO

Projeto de rede na cadeia de suprimentos

Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Controle Estatístico de Qualidade. Capítulo 6 (montgomery)

Capítulo 6 - Centro de Gravidade de Superfícies Planas

Média. Mediana. Ponto Médio. Moda. Itabira MEDIDAS DE CENTRO. Prof. Msc. Emerson José de Paiva 1 BAC011 - ESTATÍSTICA. BAC Estatística

s: damasceno.info www. damasceno.info damasceno.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou. experimental.

Estatística - exestatmeddisper.doc 25/02/09

Monitoramento ou Inventário Florestal Contínuo

Faculdade de Tecnologia de Catanduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL

1 SISTEMA FRANCÊS DE AMORTIZAÇÃO

Matemática Financeira

Notas de aula da disciplina Probabilidade e Estatística

Estimação pontual, estimação intervalar e tamanho de amostras

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Revisão de Estatística X = X n

Algoritmos de Interseções de Curvas de Bézier com Uma Aplicação à Localização de Raízes de Equações

Prof. Dr. Marco Antonio Leonel Caetano Projeção de Cenários Aplicados ao Orçamento Empresarial Com revisão das Ferramentas de Estatística

Relatório Final da disciplina de Probabilidades e Estatística. Economia Gestão Informática e Gestão

Conceitos básicos de metrologia. Prof. Dr. Evandro Leonardo Silva Teixeira Faculdade UnB Gama

( ) ( IV ) n ( ) Escolha a alternativa correta: A. III, II, I, IV. B. II, III, I, IV. C. IV, III, I, II. D. IV, II, I, III. E. Nenhuma das anteriores.

Parte 3 - Regressão linear simples

Cálculo de média a posteriori através de métodos de integração numérica e simulação monte carlo: estudo comparativo

NOTAS DE AULA DA DISCIPLINA CE076. ], T 2 = conhecido como T 2 de Hotelling

HIDROLOGIA E RECURSOS HÍDRICOS. Análise estatística aplicada à hidrologia

APOSTILA DA DISCIPLINA INFERÊNCIA ESTATÍSTICA I

Estatística. 2 - Estatística Descritiva

REGESD Prolic Matemática e Realidade- Profª Suzi Samá Pinto e Profº Alessandro da Silva Saadi

CEDEPLAR - UFMG Nivelamento em Estatística 2013 Prof a Sueli Moro. Variáveis aleatórias

Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto

Interpolação. Exemplo de Interpolação Linear. Exemplo de Interpolação Polinomial de grau superior a 1.

FINANCIAMENTOS UTILIZANDO O EXCEL

MEDIDAS DE POSIÇÃO: X = soma dos valores observados. Onde: i 72 X = 12

CVT: Coeficiente de Variação de Thorndike CVQ: Coeficiente Quartílico de Variação MEDIDAS DE ASSIMETRIA

Transcrição:

Apostla Básca de Estatístca Slvo Alves de Souza

ÍNDICE Itrodução... 3 Software R... 4 Software SPSS... 5 Dstrbução ormal de probabldade... 6 Testes de Hpótese paramêtrco... Testes Não-Paramétrco...5 Dstrbução Amostral...3 Regressão Múltpla...5 Epermetos Multomas...65 Tabela de Cotgêca...7 Itrodução a Séres Temporas...78 Bblografa...87 Aeo...88

Itrodução Esta apostla é uma tetatva de compor parte do coteúdo da dscpla Estatístca do CEFET MG. Esta dscpla é mstrada o curso de Admstração. Seu coteúdo é de acordo com o plao de eso do curso ctados acma. Na verdade é um materal complemetar para os aluos. Ele ão os seta da ecessdade de cosultar outras bblografas. A dscpla de Estatístca é abordada com o auílo de város softwares para tratameto de dados, etre eles o R e o SPSS. Os eemplos e eercícos foram motados com o objetvo de cotetualzar o coteúdo detro dos város cursos. Não buscamos prorzar ehum desses cursos para que o aluo possa perceber a utlzação da Estatístca em cada área do cohecmeto. 3

Software R O software R é um software lvre utlzado para aálse de dados, cálculo e costruão de gráfcos. Sua costrução fo feta utlzado város colaboradores. Para sua utlzação é ecessáro cohecmeto de sua lguagem própra, ou seja, seus comados. Algumas tarefas podem faclmete serem realzadas apeas utlzado seus comados e outras são ecessáras a costrução de algortmos. O R tem um help que os ajuda a eecução das tarefas. No decorrer do curso remos utlzá-lo para aálse de város dados e para a costrução de algus gráfcos específcos. Os comados ecessáros bem como a utlzação do software serão apresetados o decorrer das aulas. A utlzação deste software é uma tetatva de demostrar como utlzar a tecologa computacoal a aálse de dados. No aeo ecotra-se algus comados útes. 4

Software SPSS O software SPSS é um software ão-lvre utlzado para aálse Estatístca em geral. Por ão ser um software lvre mutas pessoas preferem a utlzação do software R. No etato ele é muto utlzado o meo empresaral. Ao cotráro do R o SPSS é bem smples de utlzar. Neste caso ão é ecessáro cohecmeto dos comados. O SPSS tem um help que os ajuda a eecução das tarefas. No decorrer do curso remos utlzá-lo para aálse de város dados e para a costrução de algus gráfcos específcos. A utlzação deste software também é uma tetatva de demostrar como utlzar a tecologa computacoal a aálse de dados. 5

Dstrbução ormal de probabldade Uma varável aleatóra X tem dstrbução ormal se seu hstograma tem a forma de um so. 00 00 0 Std. Dev 994,59 Mea 56,6 N 488,00 500,0 0,0 500,0 000,0 6000,0 5500,0 5000,0 4500,0 4000,0 3500,0 3000,0 500,0 000,0 Vedas de auto peças Defção Dados os parâmetros µ e σ > 0 reas, a fução desdade de probabldade da ormal é dada por: Ode E(X ) µ e f Var(X ) σ. µ ( ) σ ( ). e σ. π Podemos perceber que o cálculo de probabldade usado a dstrbução ormal é muto dfícl devdo ao tpo de fução. Uma forma de cotorarmos este problema é utlzar a dstrbução ormal padrozada. A dstrbução ormal padrozada tem este ome pos sua méda é 0 e a varâca é um. Com sso os cálculos fcam muto mas prátcos pos podemos utlzar as tabelas de probabldade ormal padrozada. Uma coseqüêca mportate do fato de uma dstrbução Normal ser completamete caracterzada por sua méda e desvo-padrão é que a área sob a curva etre um poto qualquer e a méda é fução somete do úmero de desvospadrões que o poto está dstate da méda. 6

Como estem uma fdade de dstrbuções ormas (uma para cada méda e desvo-padrão), trasformamos a udade estudada seja ela qual for (peso, espessura, tempo, etc.) a udade Z, que dca o úmero de desvos-padrão a cotar da méda. Para padrozar um cojuto de dados que tem dstrbução ormal é só aplcar a fórmula µ z X σ Utlzação da tabela da ormal padrozada A tabela os dá a área sobre o gráfco, ou seja, a probabldade. Mas a frete veremos que o desvo-padrão é alterado quado vamos padrozar a méda de um cojuto de dados. Este resultado é ecotrado em um teorema deomado Teorema Cetral do Lmte. Propredades da dstrbução ormal ) a curva é smétrca em toro da méda; ) lm f ( ) 0 3) a área total sob a curva é gual a ; área área0,5 área0,5 7

Eemplo : A resstêca à tração do papel usado em sacolas de super-mercado é uma característca de qualdade mportate. Sabe-se que essa resstêca segue um modelo Normal com méda 40 ps e desvo padrão ps. Se a especfcação estabelece que a resstêca deve ser maor que 35 ps, qual a probabldade que uma sacola produzda com este materal satsfaça a especfcação? P P { X 35} P{ X 35} 35 40 { X 35} P z P{ z,5} Pela tabela da ormal padrozada temos probabldade de 0,006. Logo a resposta é -0,006 99,38%. Comparação etre méda e varâca f() A B C 8

a) da dstrbução A para B muda a tedêca cetral, mas a varabldade é costate; b) da dstrbução A para C muda a varabldade, mas a tedêca cetral é costate; c) da dstrbução B para C muda a tedêca cetral e a varabldade. Eercícos ) Utlzado a tabela da dstrbução ormal padrozada calcule: a) P ( z < 0,4 ) b) P ( z < 0, 75) c) P( z < 0,30 ) d) P ( z > 0,56 ) e) P ( 0,5 < z < 0, 7) f) P ( 0,5 < z < 0,0 ) g) o valor de z tal que P ( z < Z < z) 0, 90. ) Supoha que a absorção de água(%) em certo tpo de pso cerâmco teha dstrbução ormal com méda,5 e desvo-padrão 0,6. Selecoado, aleatoramete, uma udade desse pso, qual é a probabldade de ele acusar absorção de água etre % e 3,5%? 9

3) Uma fábrca de chocolates comercalza barras que pesam em méda 00g. Os pesos são ormalmete dstrbuídos. Sabe-se que o desvo padrão é gual a 40g. Calcule a probabldade de uma barra de chocolate, escolhda aleatoramete, pesar a) etre 00 e 50g; b) mas de 30g; c) meos que 50g. 4) Supoha que uma varável aleatóra X teha dstrbução ormal com méda 5 e desvo-padrão 4. Calcule: ( X 8) P < 0

Testes de Hpótese paramêtrco Teste de Hpótese Em Estatístca, uma hpótese é uma afrmação sobre uma propredade de uma população. Podemos estar teressados em saber formações sobre a méda, a proporção ou a varâca. Compoetes de um teste de hpótese ) Hpótese ula - H 0 : é uma afrmação sobre o valor de um parâmetro populacoal. Deve coter o sal de gualdade e deve escrever-se como,,. ) Hpótese alteratva - H : é a afrmação que deve ser verdadera se a hpótese ula for falsa. Não deve coter o sal de gualdade. Eemplos: a) Testar a afrmação de que a méda populacoal é 75. Solução: Neste caso temos H : µ 75 e H : µ 75. 0 b) Testar a afrmação de que a méda é o mámo,50. Solução: Neste caso temos H 0 : µ, 50 e H : µ >, 50. 3) Erro tpo I: Cosste em rejetar a hpótese ula quado ela é verdadera. H 0 verdadera H 0 falsa Rejeta H Erro tpo I Acerto 0 Não rejeta H Acerto Erro tpo II 0 4) Nível de sgfcâca - α : A probabldade do erro tpo I ocorrer.

5) Erro tpo II: Cosste em ão rejetar a hpótese ula quado ela é falsa. 6) A probabldade de ocorrer o erro tpo II é. 7) Estatístca de teste: É uma estatístca amostral baseado os dados amostras. 8) Regão crítca: É o cojuto de todos os valores da estatístca de teste que levam à rejeção da hpótese ula. 9) Valor Crítco: É o valor, ou valores, que separa(m) a regão crítca dos valores da estatístca de teste que ão levam à rejeção da hpótese ula. Coclusões o teste de hpótese Em um teste de hpótese cocluímos por: rejetar a hpótese ula ou ão rejetar a hpótese ula. Tpos de teste Blateral (sal de H : ): a regão crítca está stuada as duas regões. Neste caso cada área tem valor α.

Ulateral esquerdo (sal de H : <): a regão crítca está stuada a parte P Erro tpo I. esquerda. Neste caso ( ) α Ulateral dreto (sal de H : >): a regão crítca está stuada a parte dreta. ( Erro tpo I ) α P. 3

Teste de uma afrmação sobre uma méda: grades amostras Cosdere uma amostra razoavelmete grade ( 30 ) para valer o teorema cetral do lmte, ou que os dados proveham de uma dstrbução apromadamete ormal. Para testarmos alguma formação com respeto à méda populacoal utlzamos a estatístca de teste dada por: Estatístca de teste µ z σ Os valores crítcos são ecotrados a Tabela A Obs.: Caso σ seja descohecdo podemos substtuí-lo por s. Notação : méda amostral; µ : méda populacoal. σ : desvo-padrão populacoal; : tamaho da amostra; Eemplo: O tempo médo etre falhas de um rádo da Telektroc Compahy para avões de pequeo porte é 40 horas. Após terem sdo modfcados 35 aparelhos de rádo, em uma tetatva de melhorar sua cofabldade, os testes acusaram um tempo médo de 385 horas para esta amostra, com desvo-padrão de 4 horas. Ao ível de sgfcâca de 0,05, teste a afrmação de que o tempo médo, após as modfcações, é meor que 40 horas. Solução: a) As hpóteses são: H 0 : µ 40 H : µ < 40 4

b) O teste é ulateral esquerdo, pos o sal de H é <. c) O ível de sgfcâca é α 0, 05; d) Os valores crítcos são z α, 645; Logo temos: e) Os dados amostras são: 385 e s 4 ; f) Como 35 ( 30 ), a estatístca de teste é dada por: z µ σ 385 40 8,63 4 35 g) Coclusão: Como a estatístca de teste está a detro da regão crítca, etão Eercícos rejetamos H 0. ) O gerete de uma empresa de trasporte suspeta da afrmação de um vededor de peus de que o seu produto tem uma vda méda de, ao meos, 8 000 mlhas. Para verfcar a afrmação, a frma stala 40 desses peus em seus camhões, obtedo uma vda méda de 7 563 mlhas, com desvopadrão de 348 mlhas. Qual a coclusão do gerete, se a probabldade de um erro tpo I deve ser 0.0? ) A vda méda de uma amostra de 00 lâmpadas de certa marca é 65 horas. Por smlardade com outros processos de fabrcação, supomos o desvopadrão gual a 0 horas. Utlzado um ível de sgfcâca de %, teste a afrmação de que a duração méda de todas as lâmpadas dessa marca é gual a 600 horas. 5

Teste de uma afrmação sobre uma méda: pequeas amostras Cosdere uma amostra pequea ( < 30 ). Supoha que: a) os dados proveham de uma dstrbução ormal b) o desvo-padrão populacoal σ é descohecdo. Para testarmos alguma formação com respeto à méda populacoal utlzamos a estatístca de teste dada por: Estatístca de teste t µ s Os valores crítcos são ecotrados a Tabela A 3 O úmero de Graus de lberdade Obs.: Caso a varâca populacoal σ seja cohecda etão devemos utlzar a dstrbução ormal, depedetemete do tamaho da amostra. µ z σ Eemplo: Os sete valores relacoados a segur são cargas aas (em lbras) da prmera amostra de sete latas de alumío de oz. A carga aal de uma lata é o peso mámo que seus lados podem suportar, e deve ser superor a 65 lbras, porque esta é a pressão máma aplcada quado se fa a tampa o lugar. Ao ível de sgfcâca de 0,0, teste a afrmação do egehero supervsor de que esta amostra provém de uma população com méda superor a 65 lbras. 70 73 58 04 54 8 8 Solução: 6

a) As hpóteses são: H 0 : µ 65 H: µ > 65 b) O teste é ulateral dreto, pos o sal de H é >; c) O ível de sgfcâca é α 0, 0; d) O valor do grau de lberdade é de 7-6. Logo o valor crítco é t 3, 43 ; Logo temos: α e) Os dados amostras são: 5, 7 e s 7, 6 ; Como 7 ( < 30 ), a estatístca de teste é dada por: t µ s 5,7 65 8,407 7,6 7 f) Coclusão: Como a estatístca de teste está a detro da regão crítca, etão Eercícos rejetamos H 0. ) Admtdo que a pressão saguíea arteral em homes sga o modelo Normal, 7 pacetes foram sorteados e tveram sua pressão medda obtedo os segutes resultados: 8-84 - 78-85 - 69-80 - 75 7

Utlzado um ível de sgfcâca de 0,0, teste a afrmação de a méda da pressão saguíea é de 8. ) O spetor de qualdade da JF Costruções medu 5 barras de aço e obteve as segutes meddas em metros: 4,5 5,38 4,84 5,33 4,74 4,99 5,5 5,5 5,8 5,45 4,68 4,74 5,53 5,40 4,7 4,97 5,4 4,94 4,75 5,50 4,8 5,5 4,86 4,93 4,95 Pode-se afrmar, com com ível de sgfcâca de 5%, que tas barras foram sacadas de um lote cujo comprmeto médo é de 5,00 metros? Teste de uma afrmação sobre varâca ou desvo-padrão Ao testar uma hpótese sobre o desvo-padrão σ ou a varâca σ de uma população, admtmos que os valores da população sejam dstrbuídos ormalmete. Notação tamaho da amostra s varâca amostral σ varâca populacoal Para testar uma formação sobre desvo-padrão σ ou a varâca estatístca de teste é dada por: σ a Estatístca de teste χ ( ) s σ Os valores crítcos são ecotrados a Tabela A 4 O úmero de Graus de lberdade 8

Eemplo: O tempo para trasmtr 0 MB em determada rede de computadores vara segudo um modelo ormal, com méda 7,4 segudos e varâca,3 segudos. Depos de algumas mudaças a rede, acredta-se uma redução o tempo de trasmssão de dados, Além de uma possível mudaça a varabldade. Foram realzados 0 esaos depedetes com um arquvo de 0 MB e foram coletados os tempos de trasmssão, em segudos: 6,8 7, 5,9 7,5 6,3 6,9 7, 7,3 6,6 6,3 Resolva: a) Este evdêca sufcete de que as mudaças a rede de computadores alteraram a varabldade o tempo de trasmssão de dados? Ao ível de 0,05. b) Este evdêca sufcete de que as mudaças a rede de computadores alteraram o tempo médo de trasmssão de dados? Ao ível de 0,05 Solução da letra a: H 0 : σ a) As hpóteses são: H : σ,3,3 b) O teste é blateral dreto, pos o sal de H é ; c) O ível de sgfcâca é α 0, 05; 9

d) O valor do grau de lberdade é de 0-9. Logo os valores crítcos são χ,700 e χ 9, 03; Logo temos: e) Os dados amostras dcam: s 0, 6; f) a estatístca de teste é dada por: χ (0 ) 0,6,807,3 g) Coclusão: Como a estatístca de teste está a detro da regão crítca, etão rejetamos H 0. Eercícos ) A cofap alega que a varâca da vda méda de seus amortecedores é de ove meses. A Chevrolet esaa 8 peças e ecotra varâca de um ao para a vda méda das referdas peças. A 5% de sgfcâca, sso lhe permte refutar a alegação da Cofap? ) Um laboratóro fez oto determações da quatdade de mpurezas em porções de certo composto. Os valores eram (em mg):,4,6,0,0,,3,5,7 0

Teste a hpótese de que o desvo-padrão é, ao ível se sgfcâca de 0,05. 3) Uma máqua de echmeto automátco é usada para echer garrafas com detergete líqudo. Uma amostra aleatóra de 0 garrafas resulta em uma varâca amostral de volume de echmeto de 0,053 (oça fluda). Se a varâca do volume de echmeto eceder 0,0 (oça fluda), estrá uma proporção acetável de garrafas cujo echmeto ão fo completo e cujo echmeto fo em demasa. Há evdêca os dados da amostra que sugra que o fabrcate teha um problema com garrafas cheas com falta e ecesso de detergete? Use ível de sgfcâca de 5%. Observação: Quado vamos trabalhar com graus de lberdade cujos valores crítcos ão são tabelados podemos aproma-los utlzado a fórmula a segur ode χ k é o úmero de graus de lberdade ( z + ) k z é o valor crítco, ecotrado a tabela ormal padrozada. Eemplo: ) Supoha que queramos fazer o teste com α 0, 05 e 0 teremos: a) k 9 b) z, 645 H 0 : σ H : σ, <, c) χ ( z + k ) (,645 + 9 ) 94, 59

TESTE DE HIPÓTESE PARA PROPORÇÃO O teste para proporção é aplcado em stuações as quas queremos verfcar se a proporção de algum atrbuto a população pode ser gual a certo valor p 0. SUPOSIÇÕES: ) São verfcadas as codções para um epermeto bomal. Isto é, temos um úmero fo de provas depedetes com probabldade costate, e cada prova comporta dos resultados, que desgamos sucesso e falha. ) As codções p 5 e q 5 são ambas verfcadas, de modo que a dstrbução bomal das proporções amostras pode ser apromada por uma dstrbução ormal com µ p e σ pq. Esta suposção é ecessára devdo ao fato de termos uma boa apromação da estatístca de teste, que este caso é ormal. NOTAÇÃO: : úmero de provas; p : proporção populacoal (usada a hpótese ula); p ˆ : proporção amostral; q p A estatístca de teste é dada por: ESTATÍSTICA DE TESTE: p p z ˆ pq Os valores crítcos são obtdos a tabela A (dstrbução ormal padrozada).

Eemplos: ) Uma empresa retra perodcamete amostras aleatóras de 500 peças de sua Solução: lha de produção para aálse da qualdade. As peças da amostra são classfcadas como defetuosas ou ão, sedo que a polítca da empresa ege que o processo produtvo seja revsto se houver evdêca de mas de,5% de peças defetuosas. Na últma amostra, foram ecotradas ove peças defetuosas. Usado ível de sgfcâca de %, o processo precsa ser revsto? H 0 : h) As hpóteses são: H : p 0,05 p > 0,05 ) O teste é ulateral dreto, pos o sal de H é >. j) O ível de sgfcâca é α 0, 0; k) O valor crítco é z, 33; Logo temos: α 9 l) Os dados amostras são: p ˆ 0, 08 500 m) Crtéros para a apromação ormal: p 500 0,05 7,5 e q 500 ( 0,05) 500 0,985 49,5 ) Estatístca de teste é dada por: 3

z pˆ p pq 0,08 0,05 0,05 0,985 500 0,003 0,55 0,005436 o) Coclusão: Como a estatístca de teste está fora da regão crítca, etão ão rejetamos H 0. ) Em um estudo da efcáca do ar-bag em automóves, costatou-se que, em 8 colsões de carros de tamaho médo equpados com ar-bag, 46 colsões resultaram em hosptalzação do motorsta. Ao ível de sgfcâca de 0,0, teste a afrmação de que a taa de hosptalzação os casos de ar-bag é feror à taa de 7,8% para colsões de carros de tamaho médo equpados com ctos automátcos de seguraça. 3) O cotrole estatístco de certo processo de fabrcação de determada lâmpada estabeleceu que pelo meos 94% delas têm que estar sem defeto. Para verfcar a valdade desta afrmação, fo coletada uma amostra de 50 lâmpadas das quas 38 estavam sem defeto. Com % de sgfcâca, há evdêca de que o processo está de acordo com o esperado? 4

Testes Não-Paramétrco Os testes ão-paramétrcos são utlzados quado ão temos formação sobre a dstrbução da população. Vatages- Meos suposções são ecessáras. Em mutos casos, apeas dados omas (categórcos) ou ordas (raks) são ecessáros, ao vés de umércos (tervalares). Desvatages- Freqüetemete prefermos ter um modelo bem defdo com parâmetros mportates tas como méda e varâca cluídas para melhor terpretação. São város os tpos de testes ão-paramétrcos: Teste dos sas; Teste de postos com sas de Wlcoo para duas amostras depedetes; Teste da soma de postos de Wlcoo para duas amostras depedetes; Teste de kruskal-walls; Correlação por postos; Teste de repetções para aleatoredade; Teste do qu-quadrado; Teste do qu-quadrado para depedêca ou assocação; Teste de Ma-Whtey; Teste da medaa; Não se refere à dstrbução da estatístca de teste, mas ao fato de que os métodos podem ser aplcados a amostras de populações de qualquer dstrbução. Esta deve ser especfcada apeas em termos geras (ser cotua, smétrca, 5

dêtca) sem precsar pertecer a alguma famíla (como ormal, uforme, epoecal, etc). QUANDO PRECISAMOS DOS MÉTODOS NÃO PARAMÉTRICOS? Mesmo se o teste paramétrco ão depede crucalmete da suposção de que a amostra vem de uma dstrbução partcular, se há alguma dúvda quato a sso o teste ão paramétrco, depede de suposções mas fracas, é preferível. Métodos ão paramétrcos são usualmete os úcos dspoíves para dados que smplesmete especfcam ordem ou cotagem em váras categoras. Teste de Correlação por postos Referêca: TRIOLA, Maro F. Itrodução à estatístca. O teste de correlação por postos pode ser utlzado para verfcar se este alguma assocação etre duas varáves. A taa de efcêca do teste é de 9%. Notação: r s : coefcete de correlação por postos para dados amostras emparelhados; ρ s : coefcete de correlação por postos para todos os dados populacoas emparelhados; : úmero de pares de dados; d : dfereça etre postos para as duas observações detro de um par. O ídce s é utlzado em homeagem a Charles Spearma (863-945). Ao testar se há ou ão correlação, testamos as segutes hpóteses: H 0 : ρs 0 H : ρs 0 6

Estatístca de teste dada por: A estatístca de teste, para o caso em que ão há empate etre os postos, é 6 d r s ( ) ode cada valor de d é uma dfereça etre os postos para um par de dados amostras. Caso haja empate etre os postos etão a estatístca de teste é dada por: ( ode posto de X e y posto de Y. Valores crítcos: r s y ( ) )(. y y) ( y) Se 30, cosulte tabela A 9. Se > 30, use a fórmula ± z r s ode o valor de z correspode ao ível de sgfcâca 7

Eemplos ) A tabela a segur apreseta 9 dados do volume desgastado do aço e da vscosdade do óleo. Volume desgastado Y (0-4 mm 3 ) Vscosdade X 40,6 8 9,4 93 5,5 55 0 7 0 35,5 3 43 75 40,5 94 33 Há correlação etre as duas varáves? Use α 0, 05. Solução: Passo : As hpóteses são H 0 : ρs 0 H : ρs 0 Passo : Nível de sgfcâca é α 0, 05 Passo 3: Utlzaremos estatístca ão-paramétrca pos ão temos formação sobre a população orgal. Passo 4: Estatístca de teste: Volume desgastado Y (0-4 mm 3 ) Vscosdade X Posto Y Posto X d d 40,6 9 8 64 8 9,4 7 5 5 93 5,5 8 3 5 5 55 0 5 4 7 6 5 0 35,5 3 7 4 6 3 43 4 9 5 5 75 40,5 8 7 49 94 33 6 4 6 Assm temos d 8

6 d r s ( ) 6() 9(8 ) 33 70,85 0,85 Passo 5: valores crítcos: Pela tabela A-9, os valores crítcos são ± 0, 683. Como r s 0, 85 está detro da regão crítca etão rejetamos H 0. Logo este correlação. 300 50 00 50 00 50 0 0 0 0 30 40 50 9

) Os valores a segur são referetes às vedas de tubos de aço carboo de certa dústra o período especfcado. Este correlação etre as varáves? X Ao Y Veda 80 58 8 85 8 3 83 8 84 57 85 8 86 74 87 47 88 90 89 05 90 55 9 3 9 6 93 97 94 84 95 4 96 38 30

Dstrbução Amostral Retrado dos lvros: Estatístca aplcada á Admstração, Steveso e Itrodução á Estatístca, Trola. Uma dstrbução amostral é uma dstrbução de probabldade que os mostra como é a varação da estatístca amostral ocasoada por varações a amostragem aleatóra. Uma estatístca amostral é qualquer fução baseada os dados amostras de uma amostra aleatóra. Uma estmatva é um valor específco, ou um tervalo de valores, umérco de uma estatístca amostral. Um estmador é uma estatístca amostral utlzada para obter uma apromação de um parâmetro populacoal. Eemplo: ) Estmador da méda populacoal µ :. ) Estmador da varâca populacoal σ : s. Propredade do estmador: Um estmador θˆ é dto ão tedecoso para o parâmetro populacoal θ, se E ( ˆ θ ) θ Se o estmador θˆ for tedecoso, etão a tedecosdade é dada por E ( ˆ θ ) θ E X P( X ). ode ( ) 3

Para verfcar se um estmador é ou ão tedecoso deveremos calcular a esperaça. Para o cálculo desta esperaça algumas propredades são fudametas: E) Se c X, etão ( X ) c E ; Prova: X é uma varável aleatóra dscreta. Etão E ( X ) c P( X c) c. c.. E) Se Y ax + b é uma varável aleatóra, etão E ( Y ) ae X ) + b (. Quado estamos teressados em avalar qual o melhor estmador etre város, utlzamos o erro quadrátco médo EQM. A segur temos a defção do EQM O erro quadrátco médo de um estmador θˆ do parâmetro θ é dado por Ou EQM ( ˆ θ ) E( ˆ θ θ ) ( ˆ θ ) Var( ˆ θ ) ( tedecosdade) EQM + Algumas propredades da varâca: V) Se X c, etão Var ( X ) 0 ; V) Var ( X + b) Var( X ) V3) Var ( ax + b) a Var( X ) V4) Var ( ax + by ) a Var( X ) + b Var( Y ) Eemplo:(Motgomery) Seja X, X, K, X 7 uma amostra aleatóra de uma população com méda µ e varâca σ. Cosdere os segutes estmadores: 3

33 7 7 X X X + + + K θ 4 6 X X X + θ Resolva: a) Verfque se os estmadores são ão-tedecosos. b) Qual é o melhor estmador? Solução: a) A esperaça do prmero estmador é µ µ µ µ θ + + + + + + + + + 7 7 ) ( ) ( ) ( 7 ) ( 7 7 K K K X E X E X E X X X E E A esperaça do segudo estmador é ( ) µ µ µ µ θ + + + ) ( ) ( ) ( 4 6 4 6 X E X E X E X X X E E Verfcamos que os dos estmadores ão são tedecosos. b) Varâca do estmador 7 7 7 49 7 ) ( ) ( ) ( 7 ) ( σ σ σ σ θ + + + + + + + + + K K K X Var X Var X Var X X X Var Var Varâca do estmador

Var ( θ ) X X 6 + X 4 Var Var( X X 6 + X 4 ) 4 4Var ( X) + Var( X 6 ) + Var( X 4 ) 4 4σ + σ + σ 4 6 σ 4 O melhor estmador é aquele que tem meor EQM. Como a tedecosdade é ula para ambos estmadores, etão e EQM EQM Como ( ˆ θ ) EQM ( θˆ ) ( ˆ θ) Var( ˆ θ) + ( tedecosdade) ˆ θ ) σ 7 ( ˆ θ ) Var( ˆ θ ) + ( tedecosdade) ˆ θ ) 6 σ 4 EQM <, etão o melhor estmador é o prmero. a segur. Para etedermos como é o comportameto da amostra cosdere o eemplo Eemplo: cosdere uma população formada pelos elemetos 4 3 Percebemos que a méda populacoal é de,5. Vamos etão aalsar a dstrbução amostral. Para sso supoha todas as amostras de tamaho sem reposção. Temos C 4, 6 amostras represetadas o quadro a segur 34

Amostras Méda e 4,5 e,5 e 3 4 e 3 4 e 3 3,5 e 3,5 Percebemos que em amostras das 6 (33,33%) ecotramos o verdadero valor da méda populacoal. As outras 4 amostras ão ecotramos a verdadera méda, o etato servem como uma apromação. Poderíamos, por eemplo, tomar amostras de tamaho 3 sem reposção. Neste caso teremos C 4,3 4 amostras represetadas o quadro a segur populacoal. Amostras, 4 e, 4 e 3, e 3 4, e 3 Méda Neste caso percebemos que ehuma amostra tem méda gual à méda 7 3 8 3 6 3 9 3 Tpos de estmatva Uma estmatva potual é um valor úco usado para apromar um parâmetro populacoal. Uma estmatva tervalar, ou tervalo de cofaça, é uma ampltude de valores que tem probabldade de coter o verdadero valor do parâmetro populacoal. 35

O grau de cofaça é a probabldade coter o verdadero valor do parâmetro populacoal. α de o tervalo de cofaça Um valor crítco é o úmero a frotera que separa os valores das estatístcas amostras prováves de ocorrerem, dos valores que têm pouca chace de ocorrer. Quado utlzamos dados amostras para estmar um parâmetro populacoal podemos cometer erros. A margem de erro, deotada por E, é a dfereça máma provável (com probabldade α ) etre o valor amostral e o verdadero valor populacoal. A margem de erro E é chamada também de erro mámo da estmatva. Para etedermos o erro, tomemos o eemplo ateror com amostras de tamaho : Amostras Méda Erro e 4,5 0 e,5 e 3 0,5 4 e 3 0,5 4 e 3 3,5,5 e 3,5 0 Neste caso o erro mámo fo de,5. 36

37 O quadro a segur os mostra como calcular os erros, o tervalo de cofaça e o tamaho da amostra para uma população fta. Parâmetro Cálculo do erro Itervalo de cofaça Tamaho de amostra Méda (Grades amostras) z E σ α E E + < < µ E z σ α Méda (Pequeas amostras) s t E α E E + < < µ E s t α Proporção pq z E ˆ ˆ α E p p E p + < < ˆ ˆ ˆ ˆ E pq z α ou 0,5 E z α Varâca ( ) ( ) L R s s χ σ χ < < Tabelado

Quado trabalhamos com populações ftas e a amostragem costtu mas de 5% da população devemos aplcar o fator de correção. Assm teremos: Parâmetro Cálculo do erro Itervalo de cofaça Méda σ N E < µ < + E E zα (Grades N amostras) Méda s N E < µ < + E E tα (Pequeas N amostras) Proporção pq ˆ ˆ N p ˆ E < p < pˆ + E E zα N Tamaho de amostra z σ N α z σ + E ( N ) α t s N α t s + E ( N ) α z σ N α z σ + E ( N ) α Eercícos: (Trola) ) Para as temperatura do corpo humao temos 06, 98,0º F e s 0,6º F. Para um ível de sgfcâca de 5% determe: a) a margem de erro E ; b) O tervalo de cofaça para µ. ) Um ecoomsta deseja estmar a reda méda para o prmero ao de trabalho de um bacharel por uma faculdade, que teve a felz déa de fazer um curso de estatístca. Quatos valores de reda devem ser tomados, se o ecoomsta deseja ter 95% de cofaça em que a méda amostral esteja a $500 da verdadera méda populacoal? Supoha que sabamos, por um estudo prévo, que, para tas redas, σ $ 650. 38

3) Deseja-se estmar o preço médo de veda de um lvro-teto para uma faculdade. Quatos eemplares devemos selecoar, para termos 95% de cofaça de que a méda amostral esteja a meos de $ da verdadera méda populacoal? (Supoha que os preços varam etre $0 a $90. Use σ ampltude / 4 ) 4) Os pesqusadores de opão são atormetados por uma dversdade de fatores de cofusão, como secretáras eletrôcas. Em uma pesqusa juto a 068 amercaos, 673 formaram ter secretára eletrôca (com base em dados da Iteratoal Mass Retal Assocato, relatado em USA Today). Com esses resultados amostras, determe: a) A estmatva potual da proporção populacoal de todos os amercaos que têm secretára eletrôca; b) A estmatva tervalar de 95% da proporção populacoal de todos os amercaos que têm secretára eletrôca. 5) Selecoados aleatoramete e pesqusados 500 uverstáros, verfcou-se que 35 deles têm computadores pessoas (com base em dados da Amerca Passage Meda Corporato). a) Determe a estmatva potual da verdadera proporção de todos os uverstáros que têm computador pessoal; b) Determe um tervalo de 99% de cofaça para a verdadera proporção de todos os uverstáros que têm computador pessoal. 6) Um estudo de saúde evolve 000 mortes selecoadas aleatóramete, detre as quas 33 causadas por doeças cardíacas (com base em dados do Ceter for Dsease Cotrol). a) Com os dados mostras, costrua um tervalo de cofaça de 99% para a proporção de todas as mortes causadas por doeças cardíacas; b) Utlzado os dados amostras como estudo ploto, determe o tamaho de amostra ecessáro para estmar a proporção de todas as mortes causadas por doeças cardíacas. Admta um ível de cofaça de 98%, em que o erro da estmatva ão supere 0.0. 39

7) No caso de estmatva da proporção quado temos uma população relatvamete pequea, de tamaho N, e a amostragem é sem reposção, modfcamos o erro para pq ˆ ˆ N E zα N Mostre que o o tamaho da amostra pode ser ecotrada por Npq ˆ ˆ zα pq ˆ ˆ zα + ( N ) E 8) Uma amostra cosste de 75 aparelhos de televsão adqurdos há város aos. Os tempos de substtução desses aparelhos têm méda de 8. aos e desvo-padrão de. aos ( com base em dados de Gettg Thgs Fed, Cosumer Reports). Costrua um tervalo de cofaça de 90% para o desvo-padrão dos tempos de substtução de todos os aparelhos de TV daquela época. 9) Um artgo de joral clu um gráfco mostrado que certos dados amostras são dstrbuídos ormalmete. a) Iadvertdamete, omtu-se o grau de cofaça quado fo dado o tervalo de cofaça de 7.58 < σ 35. 944. Determe o grau de cofaça sedo 0 ; 45.; s 3. 8. b) Dá-se o segute tervalo de cofaça: 9. < σ < 45. 8. Determe o segute valor do desvo-padrão, que fo omtdo. Use 95% de cofaça. < 0) (Motgomery) Supoha que ˆ θ e ˆ θ sejam dos estmadores do parâmetro θ. Sabemos que ( ˆ θ E θ ) θ, E ( θ ), Var ( θˆ ) 0 e Var ( θˆ ) 4 melhor estmador? ) (Motgomery) a) Mostre que s ( X X ) b) Qual é a tedecosdade? ˆ é um estmador tedecoso para. Qual o σ. 40

c) O que acotece com a tedêca a medda que o tamaho da amostra aumeta? Teorema Cetral do Lmte Se X, X, L, X for uma amostra aleatóra de tamaho, retrada de uma população (fta ou fta), com méda µ e varâca amostral, etão a forma lmte da dstrbução de σ, e se X for a méda X µ Z σ quado tede ao fto, é a dstrbução ormal padrão. Ou: Teorema Cetral do Lmte Se etrarmos todas as amostras aleatóras possíves, de tamaho, de uma população com méda µ e varâca assm, σ, a méda das médas se deota por µ ; µ µ Por sua vez, o desvo-padrão das médas amostras se deota por σ ; etão, σ σ 4

OBS.: (Trola) ) O teorema cetral do lmte se aplca quado estamos em face de uma dstrbução de médas amostras. Utlzamos o teorema quado o tamaho da amostra é maor do que 30 ou quado a população orgal tem dstrbução ormal. ) No caso de amostragem sem reposção, quado o tamaho da amostra é superor a 5% do tamaho N da população fta (sto é, > 0, 05N ), ajustamos o desvo-padrão da méda amostral população fta: σ multplcado o pelo fator de correção para N N 3) (Steveso) A fgura a segur os mostra o efeto do tamaho da amostra sobre a dstrbução amostral. A dstrbução bomal fo utlzada como parâmetro de referêca. A probabldade de sucesso fo matda costate e varou-se o tamaho da amostra. Percebemos que à medda que o tamaho da amostra cresce a dstrbução amostral das proporções tede a uma dstrbução ormal. Percebe-se também que a varabldade decresce. Observamos que a méda da dstrbução amostral é sempre gual a proporção. 4

43

4) (Steveso) A próma fgura os dá uma déa do comportameto da dstrbução amostral cosderado a dstrbução da população. 44

Eemplo: Voltado ao eemplo da população formada pelos elemetos 4 3 e cosderado todas as amostras possíves de tamaho Amostras Méda e 4,5 e,5 e 3 4 e 3 4 e 3 3,5 e 3,5 podemos observar que: a) Se calcularmos a méda das médas (méda etre os elemetos),5,5 3 3,5,5 ecotramos µ, 5 que correspode à méda populacoal µ. Assm temos, de acordo com o teorema, que µ µ. b) Calculado a varâca das médas, dados do tem (a), ecotramos σ. 5 Cosderado os dados populacoas (,4,,3) ecotramos σ. 3 Como o tamaho da amostra é e o tamaho da população é N 4, verfcamos que > 0. 05N. Assm devemos aplcar o fator de correção, ecotrado σ σ N. De fato: N 45

σ σ 5 3 5 3 5 3 3 5 3 3 3 5 9 5 3 σ N N 3 3 4 4 3 46

Eercícos: ) (Trola) Na egehara humaa e o projeto de produtos, freqüetemete é mportate cosderar os pesos das pessoas, de modo que ão haja sobrecarga em avões ou elevadores, as caderas ão quebrem, e ão ocorram outros acotecmetos pergosos ou embaraçosos. Dado que a população de homes tem pesos dstrbuídos ormalmete com méda de 73 lb e desvo-padrão de 30 lb (com base em dados do Natoal Health Survey dos EUA), determe a probabldade de que: a) Um homem escolhdo aleatoramete pese mas de 80 lb; b) Em 36 homes escolhdos aleatoramete, o peso médo seja superor a 80 lb. c) Refaça a letra (b) supodo a população de homes gual a N 500. ) Uma compaha eletrôca fabrca resstores que têm uma resstêca méda de 00 ohms e um desvo-padrão de 0 0hms. A dstrbução de resstêcas é ormal. Ecotre a probabldade de uma amostra aleatóra de 5 resstores ter uma resstêca méda meor que 95 ohms. 3) Uma população cosste os valores, 3, 6, 8,, 8. a) Determe µ e σ ; b) Relacoe todas as amostras de tamaho que podem ser obtdas sem reposção; c) Determe a população de todos os valores de achado a méda de cada amostra da parte (b); d) Ache a méda µ e o desvo-padrão σ ; e) Verfque que µ µ e σ σ N N 47

4) O calor lberado, em caloras por grama, de uma mstura de cmeto tem dstrbução apromadamete ormal. A méda deve ser 00 e o desvo-padrão é. Desejamos testar H0 : µ 00 H : µ 00 com uma amostra de tamaho 9 espécmes. Supoha que a regão de acetação é defda como 98,5 X 0, 5. Ecotre a probabldade do erro tpo ocorrer. 5) (Steveso) Um fabrcate de bateras alega que seu artgo de prmera categora tem uma vda méda de 50 meses. Sabe-se que o desvo-padrão correspodete é de 4 meses. Coleta-se uma amostra de tamaho 36. Que porcetagem destas amostras acusará vda méda o tervalo de mês em toro de 50 meses, admtdo ser 50 meses a verdadera vda méda das bateras? 48

Estmador de Máma Verossmlhaça Um dos melhores métodos de obter um estmador de um parâmetro é o método da máma verossmlhaça. Essa técca fo desevolvda os aos de 90 pelo famoso estatístco brtâco Sr R. A. Fsher. Como o ome mplca, o estmador será o valor do parâmetro que mamza a fução verossmlhaça. Supoha que X seja uma varável aleatóra com dstrbução de probabldade ( ),θ f, em que θ é um úco parâmetro descohecdo. Sejam,, K, os valores observados a amostra aleatóra de tamaho. Etão, a fução verossmlhaça da amostra é L ( θ ) f (, θ ) f (, θ ) L f (, θ ) O estmador de máma verossmlhaça é aquele que mamza a fução de verossmlhaça. Passos para se ecotrar o estmador de máma verossmlhaça: ) Ecotrar a fução de verossmlhaça L (θ ) ; ) Calcular l ( θ ) l L( θ ) ; d 3) Calcular ) dθ l(θ ; d 4) Igualar ( θ ) 0 dθ l e resolver em relação ao parâmetro escolhdo. Obs.: A fução de verossmlhaça da amostra L ( θ ) é apeas a probabldade ( X, ) P, K X 49

Eemplo: Seja X ormalmete dstrbuída, com méda µ descohecda e varâca σ cohecda. Qual o estmador de máma verossmlhaça para a méda µ cosderado uma amostra de tamaho? Sugestão: Utlze f ( µ ) ( µ ) σ, e σ π Eercícos de estmadores ) Seja X epoecalmete dstrbuída com parâmetro λ. A fução de máma verossmlhaça de uma amostra aleatóra de tamaho,,, K, é? Cosdere a fução epoecal como λe λ ) Refaça o eercíco da dstrbução ormal cosderado µ cohecdo e ecotre o estmador para a varâca σ. 3) Seja X uma varável aleatóra, com a segute dstrbução de probabldade ( θ + ) θ, 0 f (, θ ) 0, caso cotraro A fução de máma verossmlhaça para o estmador θ, cosderado uma amostra aleatóra de tamaho,,, K, é? Eercícos de revsão ) Uma amostra aleatóra de 00 possudores de cartão de crédto mostra que o débto médo aual esses cartões, para cotas dvduas, é de $59, com desvo-padrão de $997. Costrua o tervalo de 94% de cofaça para o débto médo aual em cartões de crédto para a população de todas as cotas. 50

) 430 < µ < 470 é um tervalo de 95% de cofaça para as vdas (em mutos) de plhas Kodak AA. Supoha que este resultado se basee em uma amostra de tamaho 00. a) Costrua o tervalo de 99% de cofaça; b) Qual é o valor da méda amostral? c) Qual é o valor do desvo-padrão amostral? d) Se se obtém com os mesmos dados o tervalo de cofaça 43 < µ < 468, qual é o grau de cofaça? 3) Costrua um tervalo de 98% de cofaça para a reda méda de todos os empregados de tempo tegral que têm grau de bacharel. Uma amostra de 5 desses empregados revelou que a dstrbução das redas é apromadamete ormal, com méda $39.7 e desvo-padrão de $8.933. 4) Uma pesqusa de mercado para a Ford Motor Compay revela que uma amostra de 0 resdêcas selecoadas aleatoramete clu 054 que possuem um veículo. Com base esses resultados, costrua um tervalo de 98% de cofaça para a porcetagem de todas as resdêcas que possuem um veículo. 5) Os valores relacoados são tempos de espera (em mutos) de cletes o Jefferso Bak, ode os cletes etram em uma fla úca que é atedda por três guchês. Costrua um tervalo de 95% de cofaça para o desvopadrão populacoal. 6,5 6,6 6,7 6,8 7, 7,3 7,4 7,7 7,7 7,7 5

Regressão Múltpla Este materal fo retrado do lvro: Estatístca Aplcada e Probabldade para Egeheros. Douglas C. Motgomery & George C. Ruger.. Defção: Uma equação de regressão lear múltpla epressa um relacoameto etre uma varável depedete ou de resposta, regressoras (,,, ) K k. y, e as varáves depedetes ou O modelo de regressão lear múltplo com k varáves é defdo por: y + + + L+ + ε 0 k k Ode,, K, e > k y k 0 + jj + ε j Notação: : tamaho da amostra; k : úmero de varáves depedetes; y : valor predto da varável depedete;,,, K k : varáves depedetes; 0,,, K, k : coefcetes de regressão; ε : erro. O parâmetro de varação utára em forem matdos costates. j represeta a varação esperada a resposta y por udade quado todos os outros regressores restates ( j) j Eemplo: 5

53 a) 053 0,,7447,6379 ˆ y + + ;. Estmação de Mímos Quadrados dos Parâmetros O método dos mímos quadrados pode ser usado para estmar os coefcetes de regressão o modelo de regressão múltpla. O objetvo é mmzar a fução k j j j y L 0 ε Queremos mmzar a fução L com relação a k,,,, 0 K. As estmatvas de mímos quadrados têm de satsfazer 0 ˆ ˆ 0 0 ˆ,, ˆ, ˆ, ˆ 0 0 k j y j L k K () e k j y L j k j j j k,,, 0, ˆ ˆ 0 0 ˆ,, ˆ, ˆ, ˆ 0 K K () Smplfcado as equações () e (), obtemos as equações ormas de mímos quadrados:

ˆ + ˆ + ˆ + + ˆ 0 k k y K ˆ + ˆ + ˆ + + ˆ 0 K k k y M M M M M ˆ k + ˆ k + ˆ k + + ˆ 0 K k k k y Note que há p k + equações ormas, uma para cada um dos coefcetes descohecdos da regressão. A solução para as equações ormas serão os estmadores de mímos quadrados. Eemplo : Os dados referem-se a resstêca à tração de um fo colado, em um processo de fabrcação de semcodutores, do comprmeto do fo e da altura da garra. Número da observação Resstêca à tração Comprmeto do fo Altura da garra y 9,95 50 4,45 8 0 3 3,75 0 4 35 0 550 5 5,0 8 95 6 6,86 4 00 7 4,38 375 8 9,60 5 9 4,35 9 00 0 7,50 8 300 7,08 4 4 37 400 3 4,95 500 54

55 4,66 360 5,65 4 05 6 7,89 4 400 7 69 0 600 8 0,30 585 9 34,93 0 540 0 46,59 5 50 44,88 5 90 54, 6 50 3 56,63 7 590 4,3 6 00 5,5 5 400 Ajustaremos o modelo y ε + + + 0 De acordo com a tabela temos: 74.86,7 8.008,47; 77.77; 3.53.848.396; 8.94; 06 75,8; 5; 5 5 5 5 5 5 5 5 y y y Para o modelo a ser ajustado as equações ormas são: + + + + + + y y y ˆ ˆ 0 ˆ ˆ ˆ 0 ˆ ˆ ˆ 0 ˆ

56 Substtudo as somas temos: 74.86,7 ˆ 3.53.848 ˆ 77.77 0 ˆ 8.94 8.008,47 ˆ 77.77 ˆ.396 0 ˆ 06 75,8 ˆ 8.94 ˆ 06 0 ˆ 5 + + + + + + A solução ecotrada é: 053 0,,744,6379 ˆ y + + 3. Abordagem matrcal para a regressão lear múltpla O modelo de regressão é um sstema de equações, que pode ser epresso a otação matrcal X + ε y ode k k k k X y y y y ε ε ε ε M M K M M M M K K M 0 ; ; ; As equações ormas do modelo são: y X X X ' ' ˆ ' X represeta a trasposta da matrz X. A estmatva de mímos quadrados é: ( ) y X X X ' ' ˆ

4. Estmatva da varâca A estmatva da varâca é obtda através do estmador ão-tedecoso ode ε ˆ σ p SQ E p SQE ( ˆ y y ) ε ε ' ε No deomador temos ou do resíduo. p que é deomado graus de lberdade do erro 5. Testes de hpóteses para a regressão lear múltpla 5.. Teste para a sgfcâca da regressão O teste para a sgfcâca da regressão é um teste para determar se este uma relação lear etre as varáves de resposta e as regressoras. As hpóteses são: H0 : K k 0 H : j 0 para o mímo A estatístca de teste é dada por: um j SQR MQ F k R 0 SQE MQE ( p) ode 57

58 y y X y y y SQ E ' ˆ' ' y y X SQ E ' ˆ' Podemos também usar o R e o R ajustado como uma estatístca global para avalar o ajuste do modelo. Assm temos: ( ) ( ) SQ p SQ R T E ajustado 5.. Testes para os coefcetes dvduas de regressão e subcojutos de coefcetes As hpóteses para testar se um coefcete dvdual de regressão, como j, é gual a um dado valor 0 j é: 0 0 0 : : j j j j H H A estatístca de teste é dada por: jj j j C T 0 0 ˆ σ

6. Itervalos de cofaça para a regressão lear múltpla Um tervalo de cofaça de 00( α )% para o coefcete de regressão, j 0,,, K k o modelo de regressão lear múltpla é dado por: j, ˆ j t p C ˆ α, ˆ σ jj j j + tα, p ˆ σ C jj 7. Prevsão de ovas observações por: Um tervalo de prevsão de 00 ( α )% para uma futura observação é dado ' ' ( + ( X ' X ) ) Y yˆ + t ˆ σ ( X X ) ( ) yˆ 0 tα, p ˆ σ 0 0 0 0 α, p + 0 ' 0 8. Uso computacoal Podemos utlzar város softwares para fazer a regressão múltpla: R, SPSS, Ecel, Mtab, etc. A segur apresetamos os resultados do eemplo, cal, usado o Ecel: RESUMO DOS RESULTADOS Estatístca de regressão R múltplo 0,99053843 R-Quadrado 0,9837483 R-quadrado ajustado 0,9794709 Erro padrão,88046833 Observações 5 Aálse: R-quadrado ajustado dá o grau de relacoameto lear múltplo, 0,9794709. Ele leva em cosderação o tamaho da amostra e o úmero de varáves. 59

Observações apreseta o tamaho da amostra, 5. 60

ANOVA gl SQ MQ F F de sgfcação Regressão 5990,77 995,386 57,67503,07546E-9 Resíduo 5,73488 5,3558 Total 4 605,944704 Aálse: A estmatva da varâca é dada por ε SQ ˆ σ E p p Na tabela acma esta estmatva é dada por MQ do resíduo, 5,3558. Ele correspode a soma dos quadrados, SQ, do resíduo dvddo pelo grau de lberdade, gl, do resíduo. No F de sgfcação temos o teste de hpótese para verfcar se o modelo lear múltplo é bem ajustado. Neste caso basta que seu valor seja meor que o ível de sgfcâca. Coefcetes Erro padrão Stat t valor-p 95% ferores 95% superores Iterseção,6379434,06006638,3559 0,04409945 0,06534863 4,463446 Varável X,74469643 0,09353844 9,3499 3,9069E-9,5503306,93865 Varável X 0,0578 0,0079849 4,476746 0,0008866 0,0067446 0,0833377 Aálse: Na tabela acma temos város resultados e testes. Etre eles temos os valores dos coefcetes da terseção,,6379434, da varável X,,74469643, e da varável X, 0,0578. Também testamos se cada coefcete é sgfcatvo, ou seja, se ele será ou ão acrescetado ao modelo. Neste caso é só observar a colua do valor-p. Caso este valor seja meor que o ível de sgfcâca etão o coefcete é sgfcatvo, sto é, é utlzado o modelo. Valor-P para Iterseção: 0,04409945 Valor-P para varável X: 3,9069E-9 Valor-P para varável X: 0,0008866 Temos também o tervalo de cofaça para cada coefcete. Neste caso é só observar seus lmtes ferores, a colua 95% ferores, e lmtes 6

superores, a colua 95% superores. Estes valor de 95% é defdo a hora de costrução do modelo, podedo varar. Itervalo de cofaça para a terseção: [ 0,06534863, 4,463446] Itervalo de cofaça para a varável X: [,5503306,,93865] Itervalo de cofaça para a varável X: [0,0067446, 0,0833377] RESULTADOS DE RESÍDUOS Observação Y prevsto Resíduos 8,37879,57787 5,59600783 -,46007833 3 33,95409488 -,04094876 4 36,5967843 -,5967849 5 7,936594 -,89365939 6 5,746438,356776 7,4505999,997400 8 8,40377693,963087 9 8,499936-3,86499936 0 7,9769-0,4769996 8,40383 -,33898 37,468806-0,4688064 3 4,4589385 0,4906754 4,6348-0,60348 5 5,8090734 5,84098659 6 8,599456-0,3699456 7 64,665873 4,3348869 8,33683074 -,036830738 9 36,475060 -,5450605 0 46,55978893 0,03007 47,0609038 -,8090385 5,568953,55870467 3 56,30778409 0,3593 4 9,989043,47809568 5 0,99664 0,53735795 Aálse: Na tabela acma temos os resíduos do modelo, ε y yˆ. 6

Eemplo: ) A eerga elétrca cosumda mesalmete por uma dústra químca está relacoada à temperatura méda ambete ( ), ao úmero de das o mês ( ), à pureza méda do produto ( ) e às toeladas do produto produzdo ( 4 ). Os dados hstórcos do ao passado estão dspoíves e são apresetados a tabela a segur: 3 y 3 4 40 5 4 9 00 36 3 90 95 70 45 4 88 0 74 60 5 87 88 30 65 5 9 94 36 7 6 94 99 300 80 5 87 97 96 84 5 86 96 67 75 4 88 0 76 60 5 9 05 88 50 5 90 00 6 38 3 89 98 Faça: a) Ecotre a reta de regressão; b) Calcule a estmatva da varâca; c) Teste a sgfcâca da regressão; d) Teste os coefcetes; e) Ecotre um tervalo de cofaça de 95% para o coefcete 0 e da regressão; 63

) Um estudo fo realzado sobre o desgaste de um macal, y, e sua relação com a vscosdade do óleo e carga. Os dados são o segute: y 93,6 85 30 5,5 86 7 058 9 43 0 3 33 357 5 40 5 Faça: a) Ecotre a reta de regressão; b) Calcule a estmatva da varâca; c) Teste a sgfcâca da regressão; d) Teste os coefcetes; e) Ecotre um tervalo de cofaça de 95% para o coefcete 0 e da regressão; 64

Epermetos Multomas Observação: O coteúdo a segur fo preparado utlzado o lvro Itrodução à Estatístca. Autor: M. F. Trola. Neste tópco usaremos a dstrbução qu-quadrado, χ, como estatístca de teste. Propredades:. Ao cotráro das dstrbuções ormal e t de Studet, a dstrbução ququadrado ão é smétrca;. Os valores da dstrbução qu-quadrado podem ser 0, zero, ou postvos, mas uca egatvos; 3. Há uma dstrbução qu-quadrado dferete para cada úmero de graus de Defção: lberdade, GL. Um epermeto multomal é um epermeto que verfca as segutes codções:. O úmero de provas é fo;. As provas são depedetes; 3. Todos os resultados de cada prova devem ser classfcados em eatamete uma detre váras categoras; 4. As probabldades para as dferetes categoras permaecem costates (as mesmas) em cada prova. 65

A segur apresetaremos um teste de aderêca. Ele é utlzado para testar a afrmação de que, em um epermeto multomal, as freqüêcas observadas as dferetes categoras se ajustam a determada dstrbução. Eemplos: ) Os cofetos M&M apresetam a segute dstrbução de cores: 30% marros, 0% amarelo, 0% vermelho, 0% laraja, 0% verde e 0% azul. ) É comum a creça de que ocorre um maor úmero de acdetes fatas com automóves em determados das da semaa, como seta-fera ou sábado. 3) O gerete de determado supermercado deve decdr a quatdade de cada sabor de sorvete que deve estocar a fm de ateder à demada dos cosumdores, sem que haja perda de sabores meos procurados. Defção: Utlza-se um teste de aderêca para testar a hpótese de que uma dstrbução de freqüêcas observadas se ajusta (ou adere) a determada dstrbução teórca. Notação: O : represeta a freqüêca observada de um resultado; E : represeta a freqüêca esperada de um resultado; k : represeta o úmero de categoras, ou resultados, dferetes; : represeta o úmero total de provas. Em stuação típca podemos ecotrar a freqüêca esperada, E, multplcado a probabldade p de uma categora pelo úmero de provas dferetes: E p Suposções: 66

Segue as suposções váldas ao testarmos a proporção populacoal alegada para cada uma das k categoras ( em um epermeto multomal) ) Os dados costtuem uma amostra aleatóra; ) Os dados amostras cosstem em categoras de freqüêcas para as k categoras dferetes; 3) Para cada uma das k categoras, a freqüêca esperada é, o mímo, 5. (Não há qualquer egêca de que cada freqüêca observada seja o mímo gual a 5.) Estatístca de teste de Aderêca Valores Crítcos: χ ( O ) E E. Na tabela A 4 ecotram-se os valores crítcos, tomado-se k graus de lberdade;. Os testes de hpótese de aderêca são sempre ulateras à dreta. 67

Eemplo: ) Os cofetos M&M apresetam a segute dstrbução de cores: 30% marros, 0% amarelo, 0% vermelho, 0% laraja, 0% verde e 0% azul. A segur apresetamos os dados amostras. Tabela: Frequêca dos cofetos M&M Marro Amarelo Vermelho Laraja Verde Azul Frequêca 33 6 8 7 5 Observada Teste a afrmação de que a dstrbução de cores é a afrmada acma. Use ível de sgfcâca 5%. Solução: Marro Amarelo Vermelho Laraja Verde Azul Frequêca Observada 33 6 8 7 5 Frequêca esperada 30 0 0 0 0 0 Temos que: Para os cofetos marro: E p 00 0,30 30 Aalogamete costruímos as freqüêcas esperadas. O teste a ser feto é: H 0 : pmarro 0,30 p amarelo 0,0 pvermelho 0,0 plaraja 0,0 pverde 0,0 pazul 0,0 H : pelo meos uma das proporções acma é dferete do valor alegado Cálculo da estatístca de teste: 68

Frequêca Frequêca O E ( O E) observada esperada ( O E) Marro 33 30 3 9 0,3000 Amarelo 6 0 6 36,8000 Vermelho 0 0,0500 Laraja 8 0-4 0,4000 Verde 7 0-3 9 0,9000 Azul 5 0-5 5,5000 E Assm χ ( O ) E E 5,9500 O valor crítco é,07. Como a estatístca de teste < valor crítco, 5,9500<,07, etão ão rejetamos H 0. Eercícos: ) Fez-se um estudo de 47 acdetes dustras que egram tratameto médco. Desses acdetes, 3 ocorreram a seguda-fera, 4 a terça-fera, 8 a quarta-fera, 5 a quta-fera e 3 a seta-fera. Teste a afrmação de que os acdetes ocorrem com a mesma proporção os cco das da semaa. ) O gerete do Supermercado Gleaso deve decdr a quatdade de cada sabor de sorvete que deve estocar a fm de ateder à demada dos cosumdores, sem que haja perda de sabores meos procurados. O forecedor de sorvete afrma que, etre os sabores mas populares, os cletes têm as segutes preferêcas: 6% preferem baulha, 8% preferem chocolate, % preferem apoltao e 8% preferem baulha com calda. Uma amostra de 00 cletes acusou os resultados a segur. Teste se o forecedor detfcou corretamete as preferêcas dos cosumdores. Use ível de sgfcâca de 5%. Sabor Baulha Chocolate Napoltao Baulha em calda Cletes 0 40 8 69

3) Com ível de sgfcâca de 0,05 e os dados de acdetes dustras do eercíco, teste a afrmação de um técco de seguraça de que os acdetes se dstrbuem pelos das útes como se segue: 30% a segudafera, 5% a terça, 5% a quarta, 0% a quta e 0% a seta. 70

Tabela de Cotgêca Observação: O coteúdo a segur fo preparado utlzado o lvro Itrodução à Estatístca. Autor: M. F. Trola. Defção: Uma tabela de cotgêca (ou tabela de freqüêca de dupla etrada) é uma tabela em que as freqüêcas correspodem a duas varáves. (Uma varável categorza as lhas, a outra categorza as coluas) As tabelas de cotgêcas são de grade mportâca pos são utlzadas para aalsar resultados de pesqusas. Usaremos um teste, chamado teste de depedêca, usado para determar se uma varável lha de uma tabela de cotgêca é depedete de sua varável colua. Defção: Utlza-se um teste de depedêca para testar a hpótese ula de que a varável lha e a varável colua em uma tabela de cotgêca ão estão relacoadas, sto é, são depedetes. Obs.: No coteto deste materal a palavra cotgêca se refere a depedêca, mas trata-se apeas de uma depedêca estatístca, e ão pode ser usada para estabelecer uma lgação dreta de causa e efeto etre as duas varáves. Hpóteses em um teste de depedêca H0 : as H : as var áves são depedetes var áves são depedetes 7

Suposções: 4) Os dados costtuem uma amostra aleatóra; 5) Para cada célula a tabela de cotgêca, a freqüêca esperada é, o mímo, 5. (Não há qualquer egêca de que cada freqüêca observada seja o mímo gual a 5.) Estatístca de teste Valores Crítcos: χ ( O ) E E ode: 3. Na tabela A 4 ecotram-se os valores crítcos, tomado-se graus de lberdade ( r )( ) gl c r: úmero de lhas c: úmero de coluas. 4. Os testes de hpótese de depedêca com tabelas de cotgêca evolvem apeas regões crítcas ulateras à dreta. Freqüêca esperada para uma tabela de cotgêca E ( total lhas)( total coluas) total geral 7

Eemplo: ) (Lvro Estatístca Aplcada à Gestão Empresaral Adrao L. Bru) Os dados a segur referem-se ao cruzameto etre as varáves: possu habltação e seo, de 53 fucoáros de um escrtóro de cotabldade. Tabela: Seo versus Habltação Habltado Sm Não Total Femo 9 Masculo 5 7 3 Total 34 9 53 Teste se as varáves são depedetes. Use ível de sgfcâca 5%. Solução: O teste a ser feto é: H0 : as H : as varáves são depedetes varáves são depedetes Cálculo das freqüêcas esperadas. Habltado Sm Não 34 9 Femo 3, 47 7,53 53 53 3 34 3 9 Masculo 0, 53,47 53 53 73

Cálculo da estatístca de teste: Habltado Sm Não Femo Masculo ( 9 3,47) ( 7,53) 3,47,483 7,53 ( 5 0,53) ( 7,47 ) 0,53 0,973,47,654,74 Assm χ ( O ) E E,483 +,654 + 0,973 +,74 6,85 Graus de lberdade: gl ( r )( c ) ( )( ) Valor crítco: χ 3, 84 Como a estatístca de teste > valor crítco, 6,85 > 3,84, etão ão rejetamos H 0. Logo as varáves são depedetes. Eercícos: ) A tabela a segur apreseta os resultados de 580 dados amostras etre a causa de morte e codção da pessoa. Fermeto acdetal Causa da Morte Doeça Homcído Ou Sucído Em zoa de combate 5 56 9 Fora da zoa de combate 75 94 3 ) (Trola) Fez-se uma pesqusa para determar se há restrções, quato ao seo, a cofaça que o povo deposta a políca. Os resultados amostras costam da tabela a segur. Com ível de 0,05 de sgfcâca, teste a afrmação de que ão há tal restrção. Cofaça a políca Muta Alguma Muto pouca ou 74

ehuma Homes 5 56 9 Mulheres 75 94 3 Fote: Mstéro da Justça dos EUA e da Gallup Orgazato 3) (Trola) A tabela a segur relacoa resultados de uma pesqusa obtdos de uma amostra aleatóra de vítmas de dferetes crmes. Com ível de 0,05 de sgfcâca, teste a afrmação de que o tpo de crme é depedete do fato de o crmoso ser um estraho. Tpo de crme Homcído Roubo Assalto Crmoso era um estraho 379 77 Crmoso era cohecdo ou parete 39 06 64 75

Resíduos Padrozados Defção Os resíduos (dfereças etre freqüêca observada e esperada) uma forma padrozada, ou seja, epressos em udades de desvos-padrão é dado por ode: O: freqüêca observada; E: freqüêca esperada; TC: total de coluas; TL: total de lhas; TG: total geral. O E Z res TC E TG TL TG Os resíduos padrozados represetam valores de relação buívoca com probabldades de ocorrêca, valores maores que,96 ou meores que -,96 têm pequeas chaces de ocorrêca, e podem assm strur potos de corte para um ível de sgfcâca de ecesso ou falta de ocorrêcas, respectvamete. Eemplo: Voltado ao eemplo, temos: Tabela: Seo versus Habltação Habltado Sm Não Total Femo 9 Masculo 5 7 3 Total 34 9 53 A freqüêca esperada é dada por: Sm Habltado Não Femo 3, 47 7, 53 76

Masculo 0, 53, 47 Os resíduos é dado por: Femo O E Z res TC E TG Sm 9 3,47,6 34 3,47 53 53 TL TG Habltado Não 7,53 9 7,53 53 53,6 Masculo 5 0,53 34 3 0,53 53 53,6 7,47 9 3,47 53 53,6 Aálses: ) Verfcamos calmete que o módulo da dfereça etre as freqüêcas observadas e esperadas são guas para todas as células. Neste caso ão podemos dzer qual das células mas fluecou para o resultado da estatístca de teste; ) Aalsado os resíduos vemos também que eles são, em módulos, guas. Cosderado um ível de sgfcâca de 5%, ode o valor crítco sera ±,96, percebemos que ambos os resíduos são superores a este valor. Isto dca que todos os resultados são gualmete pouco prováves. Sedo assm elas são sgfcates. Neste caso ão há ehuma freqüêca que causasse maor mpacto, todas tveram o mesmo mpacto. 3) Não podemos dzer o que valor 5, a tabela de cotgêca, dcasse que o úmero de homes habltados sera de maor mpacto. 77

Itrodução a Séres Temporas Defção Uma sére temporal cosste em um cojuto de observações de varáves quattatvas coletadas ao logo do tempo. Eemplos: ) Vedas mesas de uma fábrca de sorvete; ) Preço semaal de gasola; 3) Evolução do preço dáro de uma ação ao logo do tempo; 4) Temperatura dára em uma cdade. As séres temporas podem eglobar dados dáros, semaas, mesas, etc. Neste caso a ordem dos dados é fudametal. Os modelos de aálse de séres temporas geralmete preocupam-se em estmar o comportameto futuro de uma sére, com base em seus dados passados. Geercamete, os modelos de prevsão empregados em séres temporas podem ser apresetados da segute forma: ( Y, Y, Y,K) Y ˆ t+ f t t t Compoetes de séres temporas a) Tedêca: descreve um movmeto suave, a logo prazo, dos dados, para cma ou para bao. b) Varações cíclcas: correspodem a um certo grau de regulardade a logo prazo ( ao, dez aos, 50 aos) o comportameto das séres temporas. Eemplo: aumeto das vedas de badera do Brasl em fução da copa do mudo de futebol. c) Varações sazoas: represetam regulardades de varações a sére em períodos curtos de tempo (semaas, das, quzeas, meses, etc), geralmete detro de um ao. Eemplo: vedas de ovos de páscoa os meses de março e abrl. 78

d) Varações rregulares ou aleatóras: correspodem a ruídos a sére temporal em decorrêca de fatores varados. Como são aleatóros ão são prevstos o modelo. Eemplos: Uma sére é dta estacoára se ela for covergete. Ela flutua em toro de um poto. Uma sére é dta ão-estacoára se ela for dvergete. Neste caso ela tem raz utára. Uma opção para torar a sére estacoára é aplcar o operador dfereça. 79

Eemplo: ) Dados fctícos Quadrmestre Perodo Y 998 6,7 998 4,4 998 3 5,8 998 4 6, 999, 999 0, 999 3 0,8 999 4,5 000 6 000 3,9 000 3 4,9 000 4 4,7 00,9 00 0,9 00 3,4 00 4,9 00 8,3 00 5,4 00 3 6,4 00 4 6,8 003,6 003 9,7 003 3 0,6 003 4, 004 9,3 004 6, 004 3 7,6 004 4 8,3 005 3,8 005,5 005 3, 005 4,6 80

) Para lustrar dados evolvedo sazoaldade cosdere a veda de sorvete: Ao Quadrmestre Quadrmestre Quadrmestre Total 3 998 70 50 80 600 999 74 45 86 605 000 68 6 68 598 00 8 60 60 60 00 54 40 0 604 Total 848 57 904 3009 ) Para lustrar dados evolvedo sazoaldade com médas móves cosdere a demada de calçados 8

Quadrmestre Demada 000: 000: 000:3 3 00: 9 00: 8 00:3 9 00: 6 00: 4 00:3 5 Modelos: ) Médas móves smples Os modelos de médas móves smples sugerem que a estmatva do valor futuro Y ˆ t + pode ser feta com base em uma méda artmétca smples de k valores passados. Assm, Y Y Y Y Yˆ t + t + t + K+ t k + t + k ) Médas móves poderados No modelo de médas móves poderadas deve-se atrbur um peso para cada ao aalsado. Assm, Ode w : pesos Yˆ t + wy t + wyt + w3yt + K+ wkyt k + 8

Geralmete, dados mas recetes recebem maor poderação. 3) Alsameto epoecal A prevsão feta para o período posteror Y ˆ t + deve ser gual à prevsão feta para o período ateror t Ŷ, acrescdo de um ajuste [ α ( Y ˆ ) ] t Y t, fução do erro da prevsão efetuada para o período ateror. O valor de α deve estar compreeddo etre 0 e. Algebrcamete temos: Yˆ t Yˆ + t + α Epaddo a epressão ateror ecotramos: ( Y Yˆ ) t ( α ) Yt + α( α ) Yt + + α( ) Yt Yˆ t + αyt + α K α Para poder aplcar o modelo, assume-se que, o prmero ao, o valor estmado é o própro valor realzado. 4) Tedêca com modelo de regressão Neste modelo utlza-se a regressão lear smples ode ode ( y ) ( )( y ) b ( ) ( ) y b a y a + b t Aálse da qualdade da prevsão ) Desvo médo absoluto: represeta a soma dos desvos absolutos, represetados pelo módulo da dfereça ou dfereça absoluta etre a demada real e a prevsta. Y Yˆ DMA ) Erro quadrátco médo: represeta a soma dos desvos ao quadrado, represetados pela dfereça etre a demada real e a prevsta. Eemplo: EQM ( Y Yˆ ) 83

) Cosdere o hstórco de vedas a segur Mês Vedas Ja 9 Fev 83 Mar 66 Abr 74 Ma 75 Ju 84 Jul 84 Ago 8 Set 75 Out 63 Nov 9 Dez 84 Calcule, utlzado a méda móvel dos últmos 3 meses. a) a prevsão para o mês de jaero segute b) Desvo médo absoluto c) Erro quadrátco médo Solução: a) Cosderado a méda dos 3 aterores meses temos Logo ˆ Y + + out Yov Y Y dez jaero 3 ˆ 63+ 9+ 84 Y jaero 3 Yˆ jaero 79,33 b) Completado a tabela com as prevsões temos: Mês Vedas Y Prevsão Ŷ Y Yˆ ( ) Y Yˆ Ja 9 Fev 83 Mar 66 Abr 74 80,33 6,33 40,0689 Ma 75 74,33 0,67 0,4489 Ju 84 7,67,33 5,089 Jul 84 77,67 6,33 40,0689 Ago 8 8 0 0 Set 75 83 8 64 Out 63 80 7 89 Nov 9 73 8 34 Dez 84 76,33 7,67 58,889 84

DMA Y ˆ Y 76,33 8,48 9 EQM c) O erro quadrátco médo será ( ˆ Y Y ) 968,4445 07, 605 9 ) Refaça o eemplo ateror utlzado a méda móvel poderada com pesos 0.3, 0.4 e 0.5 para o tercero, segudo e prmero mês ateror, respectvamete. 3) A prevsão atga da demada do composto RK era de 00 udades. A últma demada real fo de 85 udades. Qual é a prevsão epoecalmete velada para o prómo período? Alfa tem valor 0,. 4) Cosdere os dados amostras: Semaa Demada 50 59 3 60 4 67 5 73 6 75 7 85 8 88 Utlzado o alsameto epoecal faça as prevsões para cada semaa e para a semaa 9, sedo: a) Alfa de 0, b) Alfa de 0,3 c) Calcule o desvo médo de cada tem ateror, (a) e (b) d) Com base o desvo médo, qual a melhor prevsão? 85

5) O cosumo de um compoete das Fábrcas Troc os últmos 0 meses fo gual a: 750, 680, 740, 70, 690, 640, 670, 70, 700 e 660. Calcular, com base em aálse de regressão, a prevsão de cosumo para o º mês. 86

Bblografa. TOLEDO, Geraldo Lucao. OVALLE, Ivo Izdoro. Estatístca Básca. ª edção. São Paulo: Atlas, 985.. MONTGOMERY, Douglas C., RUNGER, George C.. Estatístca aplcada e probabldade para egeheros. Ro de Jaero: LTC, 009. 3. MILONE, Guseppe. Estatístca: geral e aplcada. São Paulo: Thomso Learg, 006. 4. BRUNI, Adrao Leal. Estatístca aplcada à gestão empresaral. ª edção. São Paulo: Atlas, 008. 5. TRIOLA, Máro F., Itrodução à Estatístca. Ro de Jaero. Edtora LTC. 7.ª edção, 008. 87

Aeo Comados Software R # Gerar amostras aleatóras # crar vetor de amostras sort()# ordea os valores de. sample(,5,t)# gera 5 amostras do vetor com reposção sample(,5)# gera 5 amostras do vetor sem reposção # # Mudar dretóro # Arquvo Mudar dretoro Nome da pasta # # Letura e Prelmares dos Dados # Letura dos dados gasola <- sca(fle"gasola.tt") frago <- sca(fle"frago.tt") alcatra <- sca(fle"alcatra.tt") dados<-data.frame(frago,alcatra) # baco de dados jutos frago + alcatra attach(dados)# apreseta os omes das varáves ames(dados)# apreseta os omes das varáves dm(dados) # dmesão dos dados dados[:5]# apreseta os 5 prmeros resultados 88

# # Estatístcas Descrtvas # summary(gasola) summary(frago) mea(gasola) meda(gasola) quatle(gasola) # retora os quarts var(gasola)# varâca cov(frago,alcatra) #Covarâca cor(frago,alcatra)#correlação # # Tabela # table(frago)# apreseta tabela dstrbução frequeca smples. # # Grafcos # boplot(gasola,ylab"preços da Gasola") boplot(frago,alcatra,ylab"preços",lab"frago X alcatra") hst(frago) plot(alcatra) versa pars(cbd(frago,alcatra)) # faz o gráfco de dspersão versus e vce t<-ts(frago) # trasforma um cojuto de dados frago em uma sére temporal plot(t)# faz o gráfco da sére temporal par(mfrowc(,))#dvde a tela em. hst(gasola) 89

able(vmea(gasola))# faz uma lha a méda de. able(vmeda(gasola))# faz uma lha a medaa de. able(vquatle(gasola))# faz uma lha os quats de. # Regressão lear # plot(, y) # gráfco de dspersão. fm <- lm(y ~ ) # regressão etre cojutos pareados y e. fm # apreseta os coefcetes da regressão. aova(fm)# apreseta tabela aova do modelo. able(lm(y~)) # traça a reta de regressão. 90