CAPÍTULO 1 PROBABILIDADE
|
|
|
- Maria do Mar Garrau Alvarenga
- 10 Há anos
- Visualizações:
Transcrição
1
2
3 CAPÍTULO PROBABILIDADE. Coceto O coceto de probabldade está sempre presete em osso da a da: qual é a probabldade de que o meu tme seja campeão? Qual é a probabldade de que eu passe aquela dscpla? Qual é a probabldade de que eu gahe a lotera? Probabldade é uma espéce de medda assocada a um eveto. No caso específco da prmera perguta do parágrafo ateror o eveto em questão é meu tme será campeão. Se este eveto é mpossível de ocorrer, dzemos que a sua probabldade é zero. Se, etretato, ele ocorrerá com certeza, a sua probabldade é gual a um (ou cem por ceto). Chamado este eveto smplesmete de A, etão dzemos que: Se A é mpossível de ocorrer, etão P(A) =. Se A ocorre com certeza, etão P(A) =. Ode a expressão P(A) é lda como probabldade de A ocorrer, ou smplesmete probabldade de A. como: A probabldade de um eveto A qualquer pode ser defda, de uma maera smplfcada P(A) = úmero de vezes em que A ocorre úmero de vezes em que todos os evetos ocorrem Esta defção desse ser vsta com ressalvas: ão se trata do úmero de vezes que de fato ocorreram em um expermeto, mas sua proporção teórca. Assm, se jogássemos uma moeda comum três vezes e as três ela desse cara, sto ão sgfca que a probabldade de dar cara é gual a, o que os levara a coclur que com certeza esta moeda dará cara sempre, o que é um absurdo. O cojuto de todos os evetos possíves deste expermeto (cojuto este que chamamos de espaço amostral) é composto de dos possíves resultados: cara ou coroa. Cosderado que estes dos evetos têm a mesma chace de ocorrer (o que vale dzer que a moeda ão está vcada), teremos: P( cara ) = úmero de vezes em que ocorre"cara" úmero de vezes em que todos os evetos ocorrem = =,5 Todos os evetos, este caso, são dos: cara ou coroa. Destes dos, um deles é o eveto em questão ( cara ). Portato a probabldade de dar cara é gual a,5 (ou 5%). E, de maera dêtca, temos para o eveto coroa : P( coroa ) = úmero de vezes em que ocorre"coroa" úmero de vezes em que todos os evetos ocorrem = =,5 No apêdce.b deste capítulo é dada uma defção formal de probabldade.
4 Repare que a soma das duas probabldades é gual a. E tha que ser mesmo. A soma das probabldades (este caso específco) represeta a probabldade do eveto dar cara ou coroa, ou geeralzado ocorrer qualquer eveto possível, que é algo que ocorrerá com certeza. Se mudarmos o jogo, de cara ou coroa para dados, se jogarmos o dado uma úca vez, temos ses possbldades, que correspodem aos úmeros teros de a 6. A probabldade de car um úmero qualquer (dgamos, o 3) será dada por: P( car 3 ) = úmero de vezes em que ocorre"3" = úmero de vezes em que todos os evetos ocorrem 6 Uma outra maera de ecotrarmos estas probabldades sera se fzéssemos um expermeto (por exemplo, jogar a moeda) um úmero muto grade de vezes (a verdade, deveram ser ftas vezes) e ecotrássemos a proporção etre caras e coroas. Este expermeto fo feto e os resultados são mostrados a tabela abaxo: o de jogadas o de caras o de coroas proporção de caras proporção de coroas 6 4,6, ,47, ,59, ,4957, ,4994,56 O expermeto evdeca que, à medda que o úmero de jogadas aumeta, a proporção de caras e de coroas se aproxma do valor,5. Chamado de o úmero de vezes que o expermeto é feto, uma maera de defr probabldade é: P(A) = lm úmero de vezes em que A ocorre Que é chamada de defção de probabldade pela freqüêca relatva ou ada, defção freqüetsta de probabldade. Exemplo.. Qual a probabldade de, jogado um úco cartão, acertar a sea (ses dezeas em um total de 6)? O acerto exato das ses dezeas é uma úca possbldade etre todas as combações possíves (combações mesmo 3, já que a ordem em que os úmeros são sorteados ão é relevate): P( gahar a sea ) = = C 6,6 = 6! 54! 6!, Na verdade a moeda ão fo realmete jogada 5 vezes, mas os resultados foram obtdos através de uma smulação por computador. 3 Para uma revsão de aálse combatóra veja o apêdce.a.
5 Portato, a probabldade de acertar a sea com apeas um cartão é de uma para cada ou aproxmadamete,%. Exemplo.. Sedo o cojuto X defdo por X = {x ú < x < }, qual a probabldade de, ao sortearmos um úmero qualquer deste cojuto este úmero perteça ao tervalo [,5;,5]? E qual a probabldade deste úmero ser exatamete gual a? O cojuto X é um cojuto cotíuo, já que cotém todos os úmeros reas que sejam maores do que e meores do que. Tem, por exemplo, o úmero ; o úmero,5; o úmero,4; mas também tem o,45; o,475; o,46. Dados dos elemetos deste cojuto, sempre é possível ecotrar um úmero que esteja etre estes dos. Não há saltos ou buracos, daí a déa de cotudade. Ao cotráro do dado em que os valores possíves são,, 3, 4, 5 e 6 (ão exste,5 ou,), que é um cojuto dscreto 4. Neste caso, a probabldade de sortearmos qualquer úmero etre,5 e,5 (clusve), que é um tervalo de comprmeto gual a (=,5,5), de um tervalo possível que tem comprmeto gual a (= ) será dada por: P(,5 x,5) = 3 E a probabldade de ser exatamete? Ou seja, de sortear um úco úmero etre um total de úmeros presete o cojuto X de... ftos! A probabldade será dada, etão por: P(x = ) = lm = Portato, embora seja possível de ocorrer, a probabldade de ser gual a (ou gual a qualquer úmero) é gual a zero, se estvermos falado de um cojuto cotíuo. A probabldade só será dferete de zero se estvermos falado de um tervalo cotdo este cojuto. Como coseqüêca dsso, ão fará dfereça se o tervalo para o qual ecotramos calmete a probabldade (etre,5 e,5) fosse fechado ou aberto (sto é, cluísse ou ão os extremos), pos a probabldade de ser exatamete,5 ou,5 é zero. Portato, como X é um cojuto cotíuo: P(,5 x,5) = P(,5 < x <,5) =. Probabldade subjetva Nos casos exemplfcados acma, assumdo que os dados e as moedas utlzadas ão sejam vcados, as probabldades calculadas são exatas. Nem sempre sto é possível. Image o eveto meu tme será campeão. Não é possível repetr este expermeto (o campeoato) um úmero muto grade de vezes. Na verdade, este campeoato, com estes tmes, com os mesmos jogadores as mesmas codções só é jogado uma úca vez. Etretato, é possível atrbur um valor que represete as chaces do tme gahar o campeoato mas, evdetemete, este 4 Não há ecessdade de que um cojuto dscreto seja composto apeas por úmeros teros, etretato. Uma prova com questões de múltpla escolha, cada uma delas valedo meo poto terá otas varado este tervalo, sto é, poderá haver ota 7, ou 7,5, mas uca 7, ou 7,3. É um cojuto dscreto, portato.
6 valor será dferete para cada pessoa que opar a respeto: um torcedor faátco tederá atrbur um valor maor do que um aalsta fro e mparcal (se é que sto exste). Qualquer que seja este valor, etretato, deve segur as mesmas regras que a probabldade objetva, sto é, tem que estar etre e, sedo correspodedo à mpossbldade e à certeza de que o tme será campeão. E assm vale para uma sére de stuações: a probabldade de que o govero mude a polítca ecoômca (é certamete maor em períodos de crse); a probabldade de chover ou ão (é maor ou meor quado a prevsão do tempo afrma que va chover?); a probabldade de ser assaltado quado se passa por determada rua, etc. Exemplo.. Qual a probabldade de se acertar os treze potos a lotera esportva? Aí é mas complcado porque depede da avalação subjetva que se faz dos tmes em cada um dos jogos. É de se magar que um teste da lotera esportva em que predomem jogos equlbrados será mas dfícl de acertar e tederá a ter meos acertadores do que um teste que teha mas barbadas. Por exemplo, Flamego x Olara (um jogo teorcamete fácl): P(Flamego) = 7% P(empate) = % P(Olara) = % Já Corthas x São Paulo (jogo equlbrado): P(Corthas) = 3% P(empate) = 4% P(São Paulo) = 3% Todos estes úmeros, evdetemete, sujetos à dscussão. Esta avalação tera que ser feta jogo a jogo para se computar a probabldade de gahar a lotera esportva..3 Probabldade do e e do ou No íco do capítulo chamamos de espaço amostral o cojuto de todos os evetos possíves. O uso do termo cojuto, ão fo por acaso. De fato, há uma assocação muto grade etre a teora dos cojutos (e a sua lguagem) e a de probabldade. Chamado de S o espaço amostral (que equvale a todos os evetos, portato P(S)=) e sedo A um eveto deste espaço amostral (sto é, A é um subcojuto de S), uma represetação gráfca da probabldade de A é mostrada a fgura abaxo: 4
7 5 Em que a regão em que o cojuto A está represetado represeta a sua probabldade em relação ao espaço amostral S. Esta represetação gráfca de probabldade é cohecda como Dagrama de Ve. Um caso partcular mportate é um eveto que ão está em S (mpossível de ocorrer), como o dado car o úmero 7 ou a moeda ão dar em cara, em coroa, represetado pelo cojuto vazo ( ), em que, evdetemete 5 P( ) =. Pelo dagrama de Ve podemos verfcar uma relação mportate: a probabldade de ão- A, ou seja, o complemetar de A, represetado 6 por A. O cojuto A é represetado por todos os potos que pertecem a S, mas ão pertecem a A, o que o Dagrama de Ve abaxo é represetado pela regão sombreada: A probabldade de A será dada etão por: P(A ) = P(S) P(A) Mas como P(S) =, etão: P( A ) = P(A) Ou: 5 A recíproca ão é verdadera. Pelo exemplo.., vmos que P(A) pode ser gual a zero mesmo que A ão seja um cojuto vazo. No exemplo P(x=) = ão porque x ão pudesse ser gual a, mas por fazer parte de um cojuto cotíuo. 6 Há quem prefra a otação A C.
8 6 P(A) + P( A ) =. Isto é, a soma da probabldade de um eveto com a do seu complemetar é sempre gual a Supohamos agora dos evetos quasquer de S, A e B. A represetação o Dagrama de Ve será: Dados dos evetos poderemos ter a probabldade de ocorrer A e B, sto é, ocorrer A e também B. Por exemplo, jogar dos dados e dar 6 o prmero e o segudo; ser aprovado em Estatístca e em Cálculo. Em lguagem de cojutos, a ocorrêca de um eveto e também outro é represetada pela tersecção dos dos cojutos (A B). No Dagrama de Ve é represetada pela área sombreada abaxo: P(A e B) = P(A B) Há ada a probabldade de ocorrêca de A ou B. Isto equvale a ocorrer A, ou B, ou ambos 7. Em lguagem de cojutos equvale a uão de A e B (A B), represetada abaxo: 7 Não cofudr com o chamado ou exclusvo, em que ocorre A, ocorre B, mas ão ambos.
9 7 P(A ou B) = P(A B) Podemos verfcar que, se somarmos as probabldades de A e B, a regão comum a ambos (a tersecção) será somada duas vezes. Para retrarmos este efeto, basta subtrarmos a tersecção (uma vez). Portato: P(A ou B) = P(A B) = P(A) + P(B) P(A B) Um caso partcular desta regra é aquele em que A e B jamas ocorrem jutos, são evetos dtos mutuamete exclusvos (ocorrer um mplca em ão ocorrer outro).os cojutos ão terão potos em comum, portato (a tersecção é o cojuto vazo) e A e B etão são dtos dsjutos, como mostrado abaxo: Neste caso, ão há dúvda: P(A ou B) = P(A B) = P(A) + P(B) Portato, a chamada regra do ou pode ser resumda assm: Se A e B são evetos quasquer: P(A B) = P(A) + P(B) P(A B) Se A e B são evetos mutuamete exclusvos (dsjutos): P(A B) = P(A) + P(B)
10 8 Exemplo.3. Qual a probabldade de, ao jogar um dado, obter-se um úmero maor que 4? Número maor do que 4 o dado temos o 5 e o 6, portato: P(maor que 4) = P(5 ou 6) Que são evetos dsjutos, já que, se der 5, é mpossível dar 6 e vce-versa. P(5 ou 6) = P(5) + P(6) = = 3 Exemplo.3. (desespero dos pas de gêmeos) Duas craças gêmeas têm o segute comportameto: uma delas (a mas choroa) chora 65% do da; a outra chora 45% do da e ambas choram, ao mesmo tempo, 3% do da. Qual a probabldade (qual o percetual do da) de que pelo meos uma chore? E qual a probabldade de que ehuma chore? A probabldade de que pelo meos uma chore é a probabldade de que a prmera chore ou a seguda chore. Chamado de C o eveto a prmera craça chora e C a seguda craça chora, temos: P (C ou C) = P(C) + P(C) P(C e C) =,65 +,45,3 =,8 Portato, pelo meos uma craça estará chorado 8% do tempo. Nehuma das craças chora é o eveto complemetar: P(ehuma chora) = P(C ou C) =,8 =, Assm sedo, os pas destas craças terão paz em apeas % do tempo..4 Probabldade Codcoal Qual a probabldade de que o Baco Cetral aumete a taxa de juros? Qual a probabldade de que ele aumete a taxa sabedo-se que ocorreu uma crse que pode ter mpacto sobre a flação? Qual a probabldade do seu tme gahar o próxmo jogo? E se já é sabdo que o adversáro jogará desfalcado de seu prcpal jogador? Qual a probabldade de, jogado dos dados em seqüêca, obter-se um total superor a 7? E se, a prmera jogada, já se trou um 6? Você acorda de mahã e o céu está azul e sem uves. Você pega o guarda-chuva ou ão? É claro que, de posse dessa formação, a probabldade estmada para o eveto chover dmu. E assm vale para os três exemplos aterores. O acotecmeto de um eveto afeta a probabldade de ocorrêca do outro. Um casal que tem três flhos homes va para o quarto flho. Qual a probabldade de ser (afal!) uma mea? Ifelzmete para o casal, ão é dferete daquela que sera caso fosse o prmero. Não façamos cofusão: é claro que, para um casal que va ter quatro flhos, a
11 probabldade de serem quatro meas é pequea. Mas se ele já teve três meas, sto ão afeta a probabldade do próxmo flho ser meo ou mea (afal, os pobres espermatozódes ão têm a meor déa do hstórco famlar). A perguta que se faz, seja em um caso ou em outro é: qual a probabldade de um eveto sabedo-se que um outro eveto já ocorreu (ou va ocorrer)? Qual probabldade de A dado que B já é um fato da vda. 9 No Dagrama de Ve acma, B já ocorreu! A probabldade de A ocorrer etão só pode ser aquele pedaço em que A e B têm em comum (a tersecção). Mas a probabldade deve ser calculada ão mas em relação a S, mas em relação a B, já que os potos fora de B sabdamete ão podem acotecer (já que B ocorreu). Portato, a probabldade de A tedo em vsta que B ocorreu (ou ocorrerá), represetada por P(A B) (lê-se probabldade de A dado B), será dada por: P(A B) = P(AeB) P(B) (.4.) A regra do e, já apresetada a seção ateror, gaha uma ova forma: P(A e B) = P(A B) P(B) P(A e B) = P(B A) PA) ou Se o eveto B ão tver qualquer efeto sobre a probabldade do eveto A, etão teremos: P(A B) = P(A) P(B A) = P(B) e E A e B são dtos evetos depedetes (a probabldade codcoal é gual à ão codcoal). Serão evetos depedetes em caso cotráro, sto é: P(A B) P(A) e P(B A) P(B) Etão, se A e B forem evetos depedetes, vale: P(A e B) = P(A) P(B)
12 Não cofuda: o fato de dos evetos serem depedetes ão quer dzer que eles sejam mutuamete exclusvos. Pelo cotráro: se dos evetos (ão vazos) são mutuamete exclusvos (dsjutos) eles são, ecessaramete, depedetes, já que a ocorrêca de um mplca a ão ocorrêca de outro. Resumdo: para dos evetos depedetes temos: P(A e B) = P(A) P(B) P(A ou B) = P(A) + P(B) - P(A) P(B) Para dos evetos dsjutos (mutuamete exclusvos): P(A e B) = P(A ou B) = P(A) + P(B) Para dos evetos quasquer: P(A e B) = P(A) P(B A) = P(B) P(A B) P(A ou B) = P(A) + P(B) P(A e B) Exemplo.4. Qual a probabldade de que, jogado dos dados em seqüêca, obtehamos exatamete 7? E se a prmera jogada já obtvemos um 6? Para obtermos um total de 7 temos os segutes resultados possíves: e 6, e 5, 3 e 4, 4 e 3, 5 e, 6 e. O resultado de cada dado é depedete do resultado do outro, de modo que: P( e 6) = P( e 5) = P(3 e 4) = P(4 e 3) = P(5 e ) = P(6 e ) = = A probabldade de que ocorra qualquer um desses resultados, tedo em vsta que eles são mutuamete exclusvos é: P[( e 6) ou ( e 5) ou (3 e 4) ou (4 e 3) ou (5 e ) ou (6 e )] = = Se já deu 6 o prmero dado o úco resultado possível para somar 7 é que dê o segudo dado. A probabldade é 6, portato. De fato, usado a defção 3.4.: P(soma=7 o dado=6) = P(soma = 7 eo dado = 6) P(o dado = eo dado = 6) = P(o dado = 6) P(o dado = 6) = 36 = 6 6 Note que: P(soma=7 o dado=6) = P(soma=7)
13 Portato os evetos a soma dar exatamete 7 e o resultado 8 do o dado são depedetes. Exemplo.4. No exemplo.3. os evetos são depedetes? Caso ão sejam, qual é a probabldade de que a prmera craça chore dado que a seguda chora? E qual a probabldade de que a seguda craça chore dado que a prmera chora? Os evetos C e C ão são depedetes (são depedetes) dado que: P(C) P(C) =,65,45 =, 95 é dferete de: P(C e C) =,3 Para calcularmos as probabldades codcoas, temos: P(C e C) = P(C) P(C C),3 =,65 P(C C),3 P(C C) =,465,65 P(C e C) = P(C) P(C C),3 =,45 P(C C),45 P(C C) =,693,65 Portato, se a prmera craça chorar, há uma probabldade de 46,5% de que a seguda craça chore e, se a seguda craça chorar, a probabldade que a prmera chore é de 69,3%. Como as probabldades codcoas eram de 45% e 65%, respectvamete, percebe-se que o fato de uma craça chorar aumeta a chace da outra chorar também. Exemplo.4.3 Através do Dagrama de Ve abaxo (ode os valores marcados correspodem às probabldades das áreas delmtadas), verfque que, apesar de que P(A B C) = P(A) P(B) P(C), A e B e C ão são evetos depedetes. Do dagrama, temos: 8 Verfque que a coclusão é válda para qualquer resultado o o dado.
14 P(A) =, +,5 +, +,5 =,4 P(B) =,5 +,5 +, +, =,5 P(C) =,5 +,5 +, +, =,5 P(A B) =, +,5 =,5 P(A C) =, +,5 =,5 P(B C) =, +, =, P(A B C) =, De fato, P(A B C) = P(A) P(B) P(C), mas: P(A B) P(A) P(B) P(B C) P(B) P(C) P(A C) P(A) P(C) Portato, A, B e C são depedetes. Exemplo.4.4 Fo feta uma pesqusa com pessoas sobre as preferêcas a respeto de programas a televsão. Os resultados obtdos foram os segutes: homes mulheres total futebol 4 6 ovela total Etre o grupo de etrevstados, qual a probabldade de preferr ovela? E futebol? 4 P(ovela) = =,4 = 4% 6 P(futebol) = =,6 = 6% Qual a probabldade de ser mulher e preferr futebol? P(mulher e futebol) = =, = % Qual a probabldade de, em sedo homem, preferr futebol? Podemos resolver dretamete já que, pela tabela, dos 45 homes, 4 preferem futebol: 4 P(futebol homem) = =, ,8% 45 Ou pela defção de probabldade codcoal: P(futebol homem) = P(homem e futebol) P(homem) = 4 45 =, ,8% Qual a probabldade de que, se preferr ovela, for mulher? De ovo é possível resolver dretamete pela tabela, tedo em vsta que, dos 4 que preferem ovela, 35 são mulheres: 35 P(mulher ovela) = =,875 = 87,5% 4 Ou pela defção de probabldade codcoal:
15 P(mulher ovela) = P(mulher e ovela) P(ovela) = 35 4 =,875 = 87,5% Note que a preferêca por um tpo de programa ou outro e o sexo ão são evetos depedetes, já que: P(mulher ovela) P(mulher) P(futebol homem) P(futebol).5 Regra de Bayes Exeplo.5. Supoha que, uma eleção para goverador em um estado orte amercao, temos um caddato democrata e um republcao. Etre os eletores bracos, 3% votam o democrata, esta proporção sobe para 6% etre os eletores egros e é de 5% etre os eletores de outras etas. Sabedo-se que há 7% de eletores bracos, % de egros e % de outras etas, se um voto democrata é retrado ao acaso, qual a probabldade de que ele teha sdo dado por um eletor egro? Utlzaremos as segutes abrevações: B- braco D- democrata N- egro R- republcao O- outras etas Pelo eucado sabemos que: P(B) =,7 P(N) =, P(O) =, P(D N) =,6 P(D B) =,3 P(D O) =,5 E pede-se qual probabldade do voto ser de um eletor egro dado que o voto é para o caddato democrata, sto é: P(N D) =? P(N D) = P(N e D) P(D) A probabldade de ser egro e democrata é dada por: P(N e D) = P(N) P(D N) =,,6 =, E a probabldade de ser democrata será dada pela soma dos votos bracos e democratas, egros e democratas e outras e democratas: P(D) = P(D e B) + P(D e N) + P(D e O) =,7,3 +,,6 +,,5 =,38 Assm sedo: P(N D) =,,358 = 3,58%,38 3
16 Portato, 3,58% dos votos democratas são de eletores egros. 4 O exemplo ateror partu de probabldades codcoas para calcular uma probabldade com a codção vertda. A geeralzação do resultado obtdo é cohecda como Regra de Bayes, que é eucada abaxo: Se temos as probabldades codcoas de um eveto B dados todos os evetos do tpo A, ( =,,..., ) e queremos ecotrar a probabldade codcoal de um certo eveto A j dado B, esta será dada por 9 : P(A j B) = P(B A ) P(A ) = j P(B A ) P(A ) j 9 Evdetemete esta expressão ão precsa ser memorzada se for repetdo o racocío do exemplo.5..
17 Exercícos 5. Em uma caxa há 7 lâmpadas, sedo 4 boas e 3 quemadas. Retrado três lâmpadas ao acaso, sem reposção, qual é a probabldade de que: a) todas sejam boas. b) todas estejam quemadas. c) exatamete sejam boas. d) pelo meos sejam boas.. Calcule a probabldade de que, o laçameto de um dado, o úmero que der seja: a) ímpar b) prmo c) o mímo 4. d) o máxmo Ao laçar dos dados em seqüêca, quer-se atgr um total de potos. a) Qual a probabldade que sto ocorra? b) Qual a probabldade que sto ocorra supodo que o prmero dado deu 4? c) Qual a probabldade que sto ocorra supodo que o prmero dado deu 6? d) O eveto total de potos é depedete do resultado do prmero dado? Justfque. 4. Um apostador aposta o laçameto de um dado em um úco úmero. Qual a probabldade de: a) em três jogadas, gahar as três b) em quatro jogadas, gahar exatamete as duas prmeras. c) em quatro jogadas, gahar exatamete duas (quasquer). d) em quatro jogadas, gahar pelo meos duas. e) em quatro jogadas, gahar duas segudas. 5. Na prmera lotera de úmeros laçada o país, o apostador devera acertar cco dezeas em um total de possíves, apostado para sso em 5, 6, 7, 8, 9 ou dezeas. a) Qual a probabldade de acertar as 5 dezeas em cada uma das stuações? b) Se a aposta em 5 dezeas custasse $,, qual devera ser o preço dos demas tpos de apostas levado-se em cosderação a probabldade de acerto? 6. Cosderado que, em jogos de futebol, a probabldade de cada resultado (vtóra de um tme, de outro ou empate) é gual, qual a probabldade de fazer os treze potos a lotera os segutes casos: a) sem duplos ou trplos. b) com um úco duplo. c) com um úco trplo. d) com dos duplos e três trplos. 7. Represete o dagrama de Ve: a) A B b) A B c) A B d) A B 8. Verfque que a probabldade do ou exclusvo é dada por: P (A ou exclusvo B) = P[( A B) (A B)] (Sugestão: utlze o dagrama de Ve)
18 6 9. Foram selecoados protuáros de motorstas e o resultado fo o segute: homes mulheres total com multa sem multa Total 9 a) Qual a probabldade de que um motorsta deste grupo teha sdo multado? b) Qual a probabldade de que um motorsta (homem) deste grupo teha sdo multado? c) Qual a probabldade de que uma motorsta deste grupo teha sdo multada? d) Qual a probabldade de que, sedo o motorsta homem, ele teha sdo multado? e) Qual a probabldade de que, sedo mulher, a motorsta teha sdo multada? f) Qual a probabldade de, em sedo multado, o motorsta seja homem? g) A probabldade de ser multado é depedete do sexo? Justfque.. Pergutou-se para 3 estudates o que faram após a faculdade: procuraram emprego ou cursaram pós-graduação (ou ambos). As respostas foram: homes mulheres Emprego 9 pós-grad. 9 8 Total 6 4 Calcule a probabldade de um estudate, escolhdo ao acaso: a) ser homem e procurar emprego. b) ser mulher e cotuar estudado. c) ser homem e ão cotuar estudado. d) ser mulher ou ão procurar emprego. e) em sedo homem, querer cotuar apeas estudado. f) se quer apeas trabalhar, ser mulher.. Um cubo de madera é ptado e a segur é dvddo em 5 cubhos de mesmo tamaho. Qual a probabldade de que, se pegarmos um destes cubhos aos acaso, ele: a) teha apeas uma face ptada. b) teha duas faces ptadas. c) teha pelo meos duas faces ptadas. d) teha três faces ptadas.. Dado um cojuto X = {x ù < x < 8}, ode ù represeta o cojuto dos úmeros aturas. Se escolhermos ao acaso um úmero deste tervalo, calcule as probabldades peddas: a) P(x = ) b) P(x > ) c) P(x < 5) d) P(x = 8) 3. Dado um cojuto X = {x ú < x < 8}, ode ú represeta o cojuto dos úmeros reas. Se escolhermos ao acaso um úmero deste tervalo, calcule as probabldades peddas: a) P(x = ) b) P(x > ) c) P(x < 5) d) P( x 8)
19 4. Em um colégo de eso médo há aluos o o ao, o o ao e 8 o 3 o ao. Se dos aluos são escolhdos ao acaso e o prmero está mas adatado do que o segudo, qual a probabldade de que ele esteja o 3 o ao? 5. Verfque se são verdaderas ou falsas as afrmações abaxo e justfque. a) Sedo S o espaço amostral, etão P(S) =. b) Se P(A) = etão A = S. c) Se P(A) = etão A =. d) Se A e B são mutuamete exclusvos, etão P(A B) = e) Se P(A B) =, etão A e B são dsjutos. f) Se A e B são depedetes, etão P(A B) = P(A) + P(B). g) Se P(A B) =, etão A e B são depedetes. h) Se P(A B) =, etão A = B = S. ) Se P(A B) =, etão A = S ou B = S. j) Se A, B e C são depedetes, etão P(A B C) = P(A).P(B).P(C). k) Se P(A B C) = P(A).P(B).P(C), etão A, B e C são depedetes. l) Se P( A ) = etão A =. m) Se A e B são depedetes, etão A e B são depedetes. 6. Há 6% de probabldade que haja desvalorzação cambal. Se a desvalorzação ocorrer, há 7% de chaces do govero laçar um pacote emergecal de meddas. Se ão ocorrer, as chaces deste pacote ser laçado caem para 4%. Se o pacote fo laçado, qual a probabldade que teha ocorrdo desvalorzação cambal? 7. Num jogo de domó uma peça com dos valores guas é trada. Qual a probabldade de que a peça segute se ecaxe? 8. Num jogo de pôquer cada jogador tem cco cartas. Cosderado que seja utlzado o baralho completo, qual a probabldade do jogador obter: a) um par. b) uma trca. c) dos pares. d) um par e uma trca (full house). e) uma quadra. f) todas as cartas do mesmo ape, mas ão em seqüêca (flush). g) uma seqüêca (por exemplo: 7, 8, 9, e J), mas ão do mesmo ape. h) uma seqüêca (exceto a maor) com o mesmo ape (straght flush). ) a maor seqüêca (, J, Q, K e A) com o mesmo ape (royal straght flush). 9. Num dado vcado a probabldade de car um certo úmero é proporcoal a este úmero. a) Qual a probabldade de cada úmero? b) Qual a probabldade de, em uma jogada, o úmero ser o mímo 4? c) Qual a probabldade de, em duas jogadas, a soma ser o máxmo 9?. Cosdere que a probabldade de um recém ascdo ser meo é gual a de ser mea. Neste caso, qual a probabldade de um casal com quatro flhos: a) ter exatamete meas. b) ter, o máxmo, meos. c) ter pelo meos mea. d) o mas velho ser um meo. 7
20 . Em um mlhão de ascmetos foram regstrados meas e 49.8 meos. Cosderado esta proporção (aproxmadamete) uma estmatva mas realsta para a probabldade de ascmeto de meas e meos, refaça os cálculos do exercíco ateror.. Etre as mulheres solteras de uma cdade, 7% são moreas e 3% loras. Etre as moreas, 6% têm olhos castahos, 3% têm olhos verdes e % têm olhos azus. Já etre as loras, 4% têm olhos castahos, 3% verdes e 3% azus. Para um homem que va um ecotro às escuras, qual a probabldade de que a pessoa que va ecotrar: a) teha olhos azus. b) seja lora de olhos verdes. c) seja morea de olhos castahos. d) caso teha olhos castahos, seja lora. e) caso teha olhos verdes, seja morea. 3. Dado um espaço amostral defdo um plao cartesao: S = {(x,y) ú - x 3; y 4} e dado o cojuto A: A = {(x,y) ú x < ; 3 < y < 4} Calcule P(A). (Sugestão: ecotre grafcamete S e A). 4. Dados os cojutos A, B e C ão vazos cujas probabldades são dadas por P(A), P(B) e P(C). Determe P(A B C). (Sugestão: use um dagrama semelhate ao do exemplo.4.3) 5. Segudo as pesqusas eletoras, o caddato A tem 3% das preferêcas dos eletores. Admtdo que este valor esteja correto, se tomarmos 5 eletores ao acaso, qual a probabldade de: a) exatamete 3 deles votarem o caddato A. b) o máxmo deles votarem o caddato A. c) pelo meos um deles votar o caddato A. 6. Em uma ura há 6 bolas que podem ser bracas ou pretas. Se 3 bolas retradas ao acaso, com reposção, são bracas, qual a probabldade de ão haver bolas pretas? 7. A probabldade que um jogador de basquete acerte um arremesso é p. Determe o valor de p para que a probabldade de fazer pelo meos uma cesta a cada dos arremessos seja de 8%. 8. Mostre que, se é válda a expressão: P(A B) = P(A B ), etão A e B são depedetes. 8
21 APÊNDICE.A Revsão de Aálse Combatóra 9.A. Fatoral : Defe-se como o fatoral de um úmero (!), sedo este úmero um tero maor do que! = (-)... Assm sedo:! = = 3! = 3 = 6 4! = 4 3 = 4 5! = = 6! = = 7 E assm sucessvamete. Note que: 3! = 3! 4! = 4 3! 5! = 5 4! 6! = 6 5! Ou, geeralzado:! = (-)!, > Se estedermos esta propredade para =:! =!!! = = Etão, coveetemete defmos:! = Se cotuarmos para =:! =!!! = = Portato, temos:! = (-)..., >! =! =.A. Permutações Quatos aagramas são possíves a partr da palavra amor? AMOR MAOR OAMR RAMO
22 AMRO MARO OARM RAOM ARMO MORA OMRA RMOA AROM MOAR OMAR RMAO AOMR MRAO ORAM ROAM AORM MROA ORMA ROMA Portato, são possíves 4 aagramas. Os aagramas são as permutações ( trocas de lugar ) das letras da palavra. Temos etão, o caso P 4 (lê-se permutações de 4 elemetos) aagramas. Se a palavra fosse castelo, o exercíco acma sera muto mas trabalhoso. Como fazer, etão? Na palavra amor temos 4 espaços ode podemos colocar as 4 letras. No o espaço podemos colocar qualquer uma das 4 letras. Para cada letra colocada o o espaço, sobram 3 letras para preecher o o espaço; uma vez preechdo este espaço, sobram apeas para o 3 o ; falmete, sobrará uma últma letra o 4 o espaço. Assm P 4 = 4 3 = 4! = 4 Geeralzado: P =! Portato, o total de aagramas da palavra castelo é:.a.3 Arrajos P 7 = 7! = 54 Utlza-se um arrajo quado se quer formar grupos a partr de um cojuto maor em que a ordem é mportate. Por exemplo, de um grupo de 5 pessoas, deseja-se motar uma chapa para uma eleção composta por um presdete, um vce e um tesourero. Há 3 vagas. Para a vaga de presdete, temos 5 opções; escolhdo o presdete, temos 4 opções para vce, sobrado 3 opções para tesourero. Etão o úmero total de chapas será dado por A 5,3 (lê-se arrajos de 5 elemetos, 3 a 3) calculado assm: A 5,3 = = 6 Seram 6 chapas possíves, portato. Faltara, para completar o 5!, multplcar por e por. Multplcado e dvddo, temos: A 5,3 = = 5!! Geeralzado, temos A,k =! ( - k)!.a.4 Combações
23 Quado falamos em combações, como em arrajos, estamos queredo formar grupos a partr de um cojuto de elemetos, a dfereça é que a ordem ão mporta. Supohamos que, o exemplo ateror, a chapa ão teha cargos (é uma chapa para um coselho, por exemplo), etão ão mporta quem é escolhdo prmero. O total de chapas possíves será dado pelo úmero de arrajos, descotado-se uma vez escolhda a chapa, trocado-se as posções a mesma (sto é, fazedo permutações) teremos uma chapa dêtca. Portato, o úmero de chapas será dado por C 5,3 (lê-se combações de 5 elemetos, 3 a 3) calculado por: C 5,3 = A P 5,3 3 = 5!! 3! = Geeralzado: C,k =! k!( - k)!.a.5 Trâgulo de Pascal Uma maera smples de calcular combações é através do Trâgulo de Pascal: A costrução do Trâgulo é smples. Cada lha começa e terma com. Os outros úmeros de cada lha são obtdos através da soma do úmero acma com o úmero à sua esquerda. Por exemplo, o 3 o úmero da lha correspodete ao úmero 5 (que é ) pode ser obtdo pela soma do o e do 3 o úmeros da lha acma (4 + 6). E assm pode ser feto com qualquer úmero apresetado o Trâgulo, clusve para lhas que ão foram mostradas (8,9,, etc.). As combações podem ser obtdas medatamete. Poe exemplo, se qusermos combações de 6 elemetos, devemos utlzar os úmeros da lha correspodete, que são, 6, 5,, 5, 6 e. Temos que (verfque!): C 6, = C 6, = 6 C 6, = 5 C 6,3 = C 6,4 = 5 C 6,5 = 6 C 6,6 = E assm podemos obter quasquer combações que qusermos dretamete do Trâgulo. Adcoalmete, uma outra propredade (etre mutas) que pode ser obtda do Trâgulo é que a soma dos úmeros de uma lha é exatamete a potêca de do úmero correspodete. Por exemplo, se tomarmos a mesma lha, correspodete ao úmero 6:
24 = 64 = 6
25 APÊNDICE.B Defção Axomátca de Probabldade 3 A déa de se defr probabldade através de axomas vem do desejo de tratar o assuto de uma maera mas rgorosa. Estabelecer axomas sgfca estabelecer um cojuto de regras. Estas regras devem ser o meor úmero possível. O cojuto de axomas, etretato, deve ser completo, o setdo de que qualquer afrmação evolvedo probabldades possa ser demostrada utlzado apeas estes axomas. Façamos ates algumas defções: O cojuto S de todos os resultados possíves de um expermeto aleatóro é chamado de espaço amostral. Chamemos I um cojuto de subcojutos de S, para o qual a probabldade será defda. A este cojuto deomamos espaço de evetos. A defção de que subcojutos de S farão parte do espaço de evetos é smples se S for dscreto, pos, este caso, basta que defamos I como o cojuto de todos os subcojutos possíves de S (cludo o própro S e o vazo). No caso de um cojuto S cotíuo, ou mesmo o caso de um S muto grade devemos os cotetar com uma defção mas restrta para I. O espaço de evetos I deverá ter as segutes propredades : I ) S I II ) Se A I, etão A I. III) Se A e B I, etão A B I. IV) Se A, A,... I, etão A I. = A probabldade é etão uma fução que assoca um elemeto de I a um úmero real, sto é: P: I ú Obedecedo aos segutes axomas: Axoma : Para qualquer A I, P(A) Axoma P(S) = Axoma 3 Dados A, A,..., A I, dsjutos dos a dos, temos: P( = A ) = P(A = ) Isto é, a probabldade da uão dos evetos, em sedo dsjutos, é a soma das probabldades de cada um deles. Se I segue estas propredades é dto um σ feld (sgma feld).
26 O espaço de probabldade será a tera (S, I, P) ode S é o cojuto uverso (espaço amostral), I um cojuto de subcojutos de S e P uma fução que assoca as probabldades aos elemetos de I. Todas as propredades de probabldade podem ser estabelecdas a partr dos três axomas estabelecdos acma. Vejamos algumas delas: Teorema.B. Se A I, etão P(A) = - P( A ) Demostração: Pela própra defção de complemetar, temos: A A= S Pelo axoma : P(S) = P(A A ) = E como A e A são dsjutos, temos, pelo axoma 3: P(A A ) = P(A) + P( A) = Portato: P(A) = - P(A ) Teorema.B. P( ) = Demostração: Se A =, etão A = S. Lembrado que, P(S) = pelo axoma e utlzado o teorema.b.: P( ) = P(S) = = Teorema.B.3 Se A, B I, etão P(A) = P(A B) + P(A B) Demostração: A S = A Pela defção de complemetar: A (B B) = A Como a tersecção tem a propredade dstrbutva: (A B) (A B ) = A E sedo os cojutos A B e A B dsjutos temos, pelo axoma 3: P(A) = P[(A B) (A B)] = P(A B) + P(A B) Teorema.B.4 Se A, B I, etão P(A B) = P(A) + P(B) - P(A B) Demostração: 4 Estes axomas foram estabelecdos por Adre Kolmogorov, matemátco russo cosderado o pa da modera teora de probabldade, em 933. Ates de Kolmogorov, o axoma 3 era lmtado ao caso de dos cojutos, sto é: se A e B são dsjutos, etão P(A B) = P(A) + P(B).
27 Temos que: (A B) S = A B 5 Pela defção de complemetar: (A B) (B B) = A B Como a uão também tem a propredade dstrbutva, colocado B em evdêca : B (A B) = A B Os evetos B e A B são dsjutos, pelo axoma 3 temos: P[B (A B )] = P(B) + P(A B ) E, pelo teorema.b.3 temos: P(A) = P(A B) + P(A B) P(A B ) = P(A) P(A B) Logo: P(A B) = P[B (A B )] = P(B) + P(A) P(A B)
28 6
29 CAPÍTULO - MEDIDAS DE POSIÇÃO E DISPERSÃO 7. Varável aleatóra Varável aleatóra (v.a.) é uma varável que está assocada a uma dstrbução de probabldade. Portato, é uma varável que ão tem um valor fxo, pode assumr város valores. O valor que ca ao se jogar um dado, por exemplo, pode ser,, 3, 4, 5 ou 6, com probabldade gual a 6 para cada um dos valores (se o dado ão estver vcado). É, portato, uma varável aleatóra. Assm como são varáves aleatóras: o valor de uma ação ao fal do da de amahã; o úmero de potos de um tme um campeoato que está começado esta semaa; a quatdade de chuva que va car o mês que vem; a altura de uma craça em fase de crescmeto daqu a ses meses; a taxa de flação o mês que vem. Todas estas varáves podem assumr dferetes valores e estes por sua vez estão assocados a probabldades E ão são varáves aleatóras: o valor de uma ação o fal do pregão de otem; o úmero de potos de um tme um campeoato que já acabou; a altura de uma pessoa a faxa dos 3 aos de dade daqu a ses meses; a área útl de um apartameto; a velocdade de processameto de um computador. Todas estas varáves têm valores fxos... Meddas de posção cetral.. Méda Há dferetes tpos de méda: a méda artmétca, a mas comum, é a soma dos elemetos de um cojuto dvddo pelo úmero de elemetos. Assm, um grupo de 5 pessoas, com dades de, 3, 5, 8 e 3, terá méda (artmétca) de dade dada por: X = = 5,6 aos 5 De um modo geral, a méda artmétca será dada por: X = X + X +...+X Ou, escrevedo de uma maera mas resumda: X= X = A méda artmétca também pode ser poderada sto ão é um tpo dferete de méda poderar sgfca atrbur pesos. Ter um peso maor sgfca smplesmete que aquele valor etrará mas vezes a méda. Dgamos, por exemplo, que em três provas um aluo teha trado 4, 6 e 8. Se a méda ão for poderada, é óbvo que será 6. Se, o etato, a méda for poderada da segute forma: a prmera prova com peso, a seguda com e a tercera 3. A méda será calculada como se as provas com maor peso tvessem ocorrdo mas vezes, ou seja X = Voltaremos ao coceto de dstrbução de probabldade o próxmo capítulo.
30 8 Ou, smplesmete: X = ,7 6 Os pesos podem ser o úmero de vezes que um valor aparece. Supohamos que uma classe de aluos haja 8 com dade de aos, 7 de 3, 3 de 5, um de 8 e um de 3. A quatdade que cada úmero aparece o cojuto é chamada de freqüêca (freqüêca absoluta este caso, pos se trata da quatdade de aluos com determada dade). A méda de dade etão será dada por: X= = 3,5 aos A freqüêca também pode ser expressa em proporções, sedo chamada este caso de freqüêca relatva. No exemplo ateror, há 8 aluos com aos de dade em um total de, portato esta classe há 8 =,4 = 4% dos aluos com esta dade. Da mesma forma, temos 35% com 3, 5% com 5 e 5% com 8 e 3, respectvamete. A méda de dade pode ser calculada da segute forma: X =,4 + 3,35 + 5,5 + 8,5 + 3,5 = 3,5 Repare que o segudo jeto de calcular (usado a freqüêca relatva) ada mas é do que o prmero (usado a freqüêca absoluta) smplfcado-se a fração (dvddo o valor dos pesos pelo úmero total). Um outro tpo de méda é a méda geométrca. A méda geométrca para o aluo que trou otas 4, 6 e 8 será: 3 G = ,8 Ou, geercamete: G = X X... X Ou ada, de uma maera mas resumda: G = X = Repare que a méda geométrca zera se um dos elemetos for zero. A méda geométrca também pode ser poderada: se os pesos das provas forem, e 3, ela será dada por: 6 3 G = ,5 Há ada um tercero tpo de méda, a méda harmôca. No exemplo das otas, ela será dada por: 3 H = = 5, De um modo geral: H = X X X
31 Ou ada: H = = X Também é possível que a méda harmôca seja poderada. Repetdo o exemplo ateror: 6 H = 4 6, Fo possível otar, tato para as médas smples (sem pesos) como para as poderadas que, em geral, a méda artmétca é maor do que a méda geométrca e esta por sua vez é maor do que a harmôca. Isto é verdade, exceto, obvamete, quado os valores são todos guas. Temos etão que: X G H Exemplo... Um aluo tra as segutes otas bmestras: 3; 4,5; 7 e 8,5. Determe qual sera sua méda fal se esta fosse calculada dos três modos (artmétca, geométrca e harmôca), em cada um dos casos: a) as otas dos bmestres têm os mesmos pesos Neste caso, a méda artmétca fal sera: 3 + 4, ,5 3 X = = 4 4 X = 5,75 A méda geométrca sera: G = 4 3 4,5 7 8, 5 = 4 83, 5 G 5,3 E a harmôca sera: H = 3 + H 4,9 4,5 b) Supodo que os pesos para as otas bmestras sejam,, 3 e ,5 Agora os pesos dos quatro bmestres totalzam, portato a méda artmétca fal será: 3 + 4, ,5 67 X= = X = 6,7 A geométrca será: G = ,5 7 8,5 G 6,36 E a harmôca: 9
32 H = 3 H 5, , ,5 3 c) Supodo que os pesos sejam, respectvamete, 3%, 5%, 5% e %. Agora os pesos são dados em termos relatvos (percetuas) e somam, portato,. O cálculo da méda artmétca será, etão: X =,3 3 +,5 4,5 +,5 7+, 8 X = 5,475 O da méda geométrca será: G = 3,3 4,5,5 7,5 8,5, G 5,5 E a harmôca: H =, ,5,5 + 7,5 + 8,5, H 4,66 Exemplo... (dados agrupados) Foram meddas as alturas de 3 pessoas que estão mostradas a tabela abaxo (as meddas são em cetímetros) Agrupe estas pessoas em classes de cm e faça o hstograma correspodete. Para agrupar em classes de cm, o mas lógco (mas ão obrgatóro) sera agrupar em: de 5 a 6; de 6 a 7, e assm sucessvamete. O problema é, ode clur aqueles que têm, por exemplo, exatamete 7 cm? Na classe de 6 a 7 ou a de 7 a 8? Há que se escolher uma, mas esta escolha é completamete arbtrára. Vamos optar por clur sempre o lmte feror, por exemplo, a classe de 7 a 8 clu todas as pessoas com 7 cm (clusve) até 8 cm (exclusve) 3, para o que utlzaremos a otação [7; 8[. Etão, para os valores da tabela acma, teremos: [5; 6[ [6; 7[ 8 [7; 8[ 4 [8; 9[ 4 [9; [ 3 Em lguagem de cojutos equvalera a dzer que o cojuto é fechado em 7 e aberto em 8.
33 [; [ 3 Um hstograma é uma maera gráfca de represetar este agrupameto, utlzado-se de retâgulos cuja altura é proporcoal ao úmero de elemetos em cada classe. O hstograma para o agrupameto realzado é mostrado a fgura abaxo: Exemplo...3 A partr dos dados agrupados do exemplo ateror, calcule a méda 4. Utlzaremos como dados os agrupametos, é como se (e freqüetemete sso acotece) ão tvéssemos cohecmeto dos dados que orgaram este agrupameto. Já que a ossa úca formação é o agrupameto (seja pela tabela, seja pelo hstograma), ão é possível saber como os dados se dstrbuem pelo agrupameto, etão a melhor cosa que podemos fazer (a falta de outra opção) é supormos que os dados se dstrbuem gualmete por cada agrupameto, de modo que, por exemplo, o agrupameto que va de 7 a 8 é como se tvéssemos 4 pessoas com altura de 75 cm. Em outras palavras, tomaremos a méda de cada classe para o cálculo da méda total. Obvamete, a ão ser por uma grade cocdêca, este ão será o valor correto da méda, mas é uma aproxmação e, de ovo, é o melhor que se pode fazer dada a lmtação da formação. Etão, temos: X = 3 X 75,33 cm Repare que, o valor correto da méda, tomado-se os 3 dados orgas, é de 74,5 cm... Moda Moda é o elemeto de maor freqüêca, ou seja, que aparece o maor úmero de vezes 5. No exemplo das dades a classe com aluos, a moda é aos, que é a dade mas freqüete este cojuto. Pode haver, etretato, mas de uma moda em um cojuto de valores. Se houver apeas uma moda, a dstrbução é chamada de umodal. Se houver duas, bmodal. 4 Quado se fala méda, sem especfcar, supõe-se estar se tratado da méda artmétca. 5 Assm como a lguagem cotdaa dzemos que uma roupa está a moda quado ela é usada pela maora das pessoas.
34 3..3 Medaa Medaa é o valor que dvde um cojuto ao meo. Por exemplo, um grupo de 5 pessoas com alturas de,6m,,65m,,68m,,7m e,73m, a medaa é,68m, pos há o mesmo úmero de pessoas mas altas e mas baxas (duas). A medaa apreseta uma vatagem em relação à méda: o grupo acma, a méda é,67m, etão, este caso, tato a méda como a medaa os dão uma déa razoável do grupo de pessoas que estamos cosderado. Se, o etato, retrarmos a pessoa de,73m, substtudo-a por outra de,m, a méda passará a ser,746m. Neste caso, a méda ão sera muto represetatva de um grupo que, afal de cotas, tem apeas uma pessoa acma de,7m. A medaa, etretato, fca alterada. A medaa, ao cotráro da méda, ão é sesível a valores extremos. Segudo a mesma lógca, os quarts são os elemetos que dvdem o cojuto em quatro partes guas. Assm, o prmero quartl é aquele elemeto que é maor do que 4 dos elemetos e, portato, meor do que 4 3 dos mesmos; o segudo quartl (que cocde com a medaa) é aquele que dvde, 4 para cma 4 para baxo; falmete o tercero quartl é aquele elemeto que tem 3 abaxo e acma. 4 4 Da mesma forma, se dvdrmos em 8 pedaços guas, teremos os octs, decs se dvdrmos em, e, mas geercamete os percets: o percetl de ordem é aquele que tem abaxo de s % dos elemetos, e 8% acma. Exemplo..3. A partr da tabela apresetada o exemplo..., determe: a) a moda O elemeto que aparece mas vezes (3) é 74 cm, portato: Mo = 74 cm E só há uma moda, o que ão é ecessáro que ocorra. No caso deste exemplo, bastara que houvesse mas uma pessoa com 68 cm de altura para que esta dstrbução se torasse bmodal. b) a medaa Há 3 dados. Do meor para o maor, o 5 o dado é, pela ordem, 73 cm, equato o 6 o é 74 cm. Como a medaa deve ter 5 elemetos abaxo e 5 acma, tomaremos o poto médo etre o 5 o e o 6 o dado: Md = Md = 73,5 cm c) o o e o quarts. Devemos dvdr o total de elemetos por 4, o que dá 7,5. Como o 7 o e o 8 o elemeto, do do meor para o maor, são guas, temos: o quartl = 68 cm
35 33 O o quartl cocde com a medaa: o quartl = Md = 73,5 cm.3. Meddas de dspersão É muto comum ouvrmos: em estatístca, quado uma pessoa come dos fragos equato outra passa fome, a méda ambas comem um frago e estão, portato, bem almetadas; ou, se uma pessoa está com os pés em um foro e a cabeça em um freezer, a méda, expermeta uma temperatura agradável. É claro que estas stuações tem que ser percebdas (e são!) pela estatístca. Para sso que servem as meddas de dspersão, sto é, meddas de como os dados estão agrupados : mas ou meos próxmos etre s (meos ou mas dspersos)..3. Varâca Uma das meddas mas comus de dspersão é a varâca. Tomemos o exemplo dos fragos para três dvíduos. Na stuação há uma dvsão eqütatva equato a stuação, um dvíduo come demas e outro passa fome. Stuação Stuação dvíduo dvíduo dvíduo3 É claro que, em ambas as stuações, a méda é frago por dvíduo. Para ecotrar uma maera de dstgur umercamete as duas stuações, uma tetatva podera ser subtrar a méda de cada valor: Stuação Stuação dvíduo - = = dvíduo - = = dvíduo3 - = - = - MÉDIA O que ão resolveu muto, pos a méda dos desvos em relação à méda 6 (valor meos a méda) cotua gual. Mas precsamete, ambas são zero. Isto ocorre porque, a stuação, os valores abaxo da méda (que fcam egatvos) compesam os que fcam acma da méda (postvos). Para se lvrar deste coveete dos sas podemos elevar todos os valores ecotrados ao quadrado. Stuação Stuação dvíduo ( - ) = ( - ) = dvíduo ( - ) = ( - ) = 6 Alás, valera a pea lembrar que sempre a soma dos desvos em relação à méda é zero.
36 dvíduo3 ( - ) = ( - ) = 34 MÉDIA /3 E, desta forma, cosegumos ecotrar uma medda que dstgue a dspersão etre as duas stuações. Na stuação, ão há dspersão todos os dados são guas a varâca é zero. Na stuação, a dspersão é (obvamete) maor ecotramos uma varâca de /3,67. Bascamete, ecotramos a varâca subtrado todos os elemetos do cojuto pela méda, elevamos o resultado ao quadrado e tramos a méda dos valores ecotrados. Portato, a varâca de um cojuto de valores X, que chamaremos de var(x) ou σ X será dada por: Ou ada: var(x) σ X = var(x) = = (X - X) + (X - X) +...+(X - X) (X - X) Varâca é, portato, uma medda de dspersão, que lembra quadrados. Este últmo aspecto, alás, pode ser um problema a utlzação da varâca. Na stuação do exemplo ateror (que tratava de fragos), ecotramos uma varâca de,67... fragos ao quadrado? Sm, porque elevamos, por exemplo, frago ao quadrado. Da mesma forma que, a geometra, um quadrado de lado m tem área de (m) = 4m, temos que ( frago) = frago! E assm também valera para outras varáves: reda medda em reas ou dólares tera varâca medda em reas ao quadrado ou dólares ao quadrado. Além da estraheza que sto podera causar, dfculta, por exemplo uma comparação com a méda. Para elmar este efeto, utlza-se uma outra medda de dspersão que é, a verdade, uma pequea alteração da varâca. Exemplo.3.. (varâca a partr de dados agrupados) Utlzado o agrupameto do exemplo..., determe a varâca. A varâca é calculada com o mesmo prcípo utlzado para a méda, ou seja, tomado-se o valor médo de cada classe como represetatvo da mesma. Assm: var(x) = [(55-75,33) 3 +(65-75,33) 8+(75-75,33) 4+(85-75,33) 4+(95-75,33) +(5-75,33) ] var(x) 8,89 Mas uma vez, é uma aproxmação. Verfque que o valor correto da varâca (utlzado os dados cas) é de 86, Desvo padrão
37 35 Para elmar o efeto dos quadrados exstete a varâca basta extrarmos a raz quadrada. Chamaremos de desvo padrão da varável X (dp(x) ou σ X ): dp(x) σ X = var(x) Portato, o desvo padrão a stuação do exemplo dos fragos será dado por: dp(x) = 67,,8 fragos Estado a mesma udade dos dados (e da méda), o caso específco, fragos, é possível comparar o desvo padrão com a méda: este caso, o desvo padrão é 8% 7 da méda. Note-se que, se o objetvo é a comparação etre dos cojutos de dados, tato faz usar a varâca ou o desvo padrão. Se a varâca é maor, o desvo padrão também é maor (e vceversa) ecessaramete Outra maera de calcular a varâca Se, a partr da defção de varâca, desevolvermos algebrcamete, obteremos: var(x) = = (X - X) var (X) = = (X - X X + X ) var(x) = X = - X X + = X = var(x) = X = - X = X + X var(x) = X = - X + X var(x) = X - X = Ou, em outras palavras: var(x) = méda dos quadrados - quadrado da méda Utlzado este método para calcular a varâca da stuação do exemplo dos fragos: Stuação ao quadrado dvíduo 4 dvíduo dvíduo3 MÉDIA 5/3 var(x) = méda dos quadrados - quadrado da méda = 5/3 - = /3 7 Esta proporção, que é obtda através da dvsão do desvo padrão pela méda, é também chamada de coefcete de varação.
38 Ecotramos o mesmo valor. Tomemos agora o exemplo de um aluo muto fraco, que tem as segutes otas em três dscplas: aluo A otas ao quadrado ecooma 3 9 cotabldade 4 admstração 4 6 matemátca 36 MÉDIA,5 7,5 Para este aluo, temos: X =,5 var(x) = 7,5 -,5 =,5 dp(x) =, Supoha agora um aluo B, mas estudoso, cujas otas são exatamete o dobro: aluo B otas ao quadrado ecooma 6 36 cotabldade 4 6 admstração 8 64 matemátca 4 MÉDIA 5 3 Para o aluo B, os valores são: X = 5 Isto é, se os valores dobram, a méda dobra. var(x) = 3-5 = 5 = 4,5 Ou seja, se os valores dobram, a varâca quadruplca. Isto porque varâca lembra quadrados. Em outras palavras, vale a relação 8 : var(ax) = a var(x) (.3.3.) dp(x) =,4 Isto é, o desvo padrão dobra, assm como a méda. Vale, portato, a relação: dp(ax) = a.dp(x) (.3.3.) Agora tomemos um aluo C, ada mas estudoso, que tra 5 potos a mas do que o aluo A em todas as matéras: aluo C otas ao quadrado 8 Veja demostração o apêdce
39 ecooma 8 64 cotabldade 7 49 admstração 9 8 matemátca MÉDIA 7,5 57,5 Para este aluo teremos: X = 7,5 Se o aluo tra 5 potos a mas em cada dscpla, a méda também será de 5 potos a mas var(x) = 57,5-7,5 =,5 dp(x) =, A varâca e o desvo padrão são os mesmos do aluo A. Isto porque são meddas de dspersão se somarmos o mesmo valor a todas as otas de A elas cotuarão dspersas, espalhadas da mesma forma, apeas mudarão de posção. Valem portato as relações 9 : var(x+a) = var(x) (.3.3.3) dp(x+a) = dp(x) (.3.3.4).3.4. Relações etre varáves covarâca A covarâca pode ser etedda como uma varâca cojuta etre duas varáves. Equato a varâca sa de quadrados (da varável meos a méda), a covarâca é defda através de produtos: cov(x,y) = (X - X)(Y - Y) = Que, assm como a varâca, pode ser calculada de outra forma: cov(x,y) = méda dos produtos - produto da méda (.3.4.) Vejamos um exemplo do cosumo e da taxa de juros de um país: Ao cosumo (X) taxa de juros (Y) produto (XY) MÉDIA cov(x,y) = x = -75 E agora etre o cosumo e a reda: 9 Cujas demostrações também podem ser vstas o apêdce.
40 38
41 39 tabela.3.4. Ao cosumo (X) reda (Y) produto (XY) MÉDIA cov(x,y) = x. = 7.5 A prmera dfereça que se ota etre os dos últmos exemplos é o sal da covarâca em cada um deles. A covarâca é egatva etre o cosumo e a taxa de juros e postva etre o cosumo e a reda. Isto porque cosumo e reda camham a mesma dreção (quado aumeta um, aumeta outro e vce-versa) e quado sto ocorre o sal da covarâca é postvo. Já o cosumo e a taxa de juros se movem em dreções opostas (quado aumeta um, ca outro e vce-versa), assm sedo, o sal da covarâca é egatvo. A covarâca etre duas varáves é fluecada pela mportâca que uma varável tem sobre a outra, de tal modo que duas varáves depedetes têm covarâca zero. Etretato, ão é possível coclur, pelos valores obtdos, que a reda é mas mportate do que a taxa de juros para a determação do cosumo só porque o valor da covarâca etre o cosumo e a reda é bem maor do que o etre o cosumo e a taxa de juros. Isto porque a covarâca também é afetada pelos valores das varáves. A covarâca etre cosumo e reda é maor também porque os valores da reda são bem maores que os da taxa de juros..3.5 Coefcete de correlação O coefcete de correlação é obtdo retrado-se o efeto dos valores de cada uma das varáves da covarâca. Isto é feto dvddo-se esta últma pelos desvos padrão das varáves. O coefcete de correlação é dado, etão, por: corr(x,y) ρ XY = cov(x,y) dp(x).dp(y) No exemplo do cosumo e da reda os desvos padrão são, respectvamete,8 e 58, (verfque!). O coefcete de correlação será dado por: ρ XY = 7. 5 =,99 8, 58, O sal do coefcete de correlação é o mesmo da covarâca (e deve ser terpretado da mesma forma). Mas a recíproca ão é verdadera.
42 4 Os seus valores varam apeas o tervalo de - a e podem sem terpretados como um percetual. Portato, um valor de,99 (quase ) dca que a reda é muto mportate para a determação do cosumo. O valor de (ou -) para o coefcete de correlação só é ecotrado para duas varáves que teham uma relação exata e dada por uma fução do o grau. Por exemplo, o úmero de caderas e de assetos em uma sala de aula; o úmero de pessoas e dedos da mão (supodo que ão haja dvíduos poldáctlos, acdetados ou com defetos cogêtos etre estas pessoas); a área útl e a área total em apartametos de um mesmo edfíco. Valores muto pequeos (em módulo) dcam que a varável tem pouca fluêca uma sobre a outra Outras propredades. No exemplo do cosumo e da taxa de juros, multplquemos o cosumo por 3 e a taxa de juros por : ao 3X Y produto MÉDIA A ova covarâca será dada por: cov(3x,y) = x4 = -5 = 6 (-75) Ou seja, o sêxtuplo da covarâca etre as varáves orgas. A propredade apresetada aqu pode ser assm resumda: cov(ax,by) = a.b.cov(x,y) (.3.6.) Com ressalvas, pos ele é calculado sem cosderar a fluêca de outras varáves.
43 Tomemos agora duas varáves X e Y: X Y X Y XY MÉDIA 5 4 4,5 3,5 Podemos calcular: var(x) = 4-5 = 7 var(y) = 4,5 - =,5 cov(x,y) = 3,5-5x =,5 Vamos vetar duas ovas varáves: X+Y e X-Y X+Y X-Y (X+Y) (X-Y) MÉDIA ,5 85,5 Etão temos: var(x+y) = 37,5-7 = 8,5 var(x-y) = 85,5-3 = 6,5 Note que poderíamos obtê-las dos valores aterores da segute forma: var(x+y) = 7 +,5 +,5 =8,5 var(x-y) = 7 +,5 -,5 = 6,5 Geeralzado, vem : var(x+y) = var(x) + var(y) + cov(x,y) (.3.6.) var(x-y) = var(x) + var(y) - cov(x,y) (.3.6.3) Note que é muto semelhate à forma do produto otável (a+b) = a + b + ab, fazedo a varâca aáloga ao quadrado e a covarâca aáloga ao produto.
44 4 Exercícos. Num sstema de avalação há duas provas (com otas varado de a ) e, para ser aprovado, o aluo deve ter méda fal 5. Qual é a ota míma que é precso trar a prmera prova para ter chace de ser aprovado, supodo: a) méda artmétca poderada, com a prmera prova tedo peso e a seguda. b) méda geométrca (smples). c) méda harmôca (smples).. Dados o cojuto {; 3; 5; 8; }, calcule as médas artmétca, geométrca e harmôca, supodo: a) pesos guas. b) pesos 9, 7, 5, 3 e c) pesos %, %, 3%, 5%, 5% 3. A partr dos dados do exemplo...: a) agrupe os dados em classes de 5 cm. b) calcule a méda e a varâca. c) comete os resultados obtdos o tem ateror. d) trace o hstograma correspodete. 4. Com base os hstogramas abaxo, calcule a méda, a varâca e o desvo padrão. a) b) Calcule o coefcete de correlação etre o cosumo e a taxa de juros da tabela Para os dados das tabelas abaxo, calcule:
45 ) a varâca e o desvo-padrão de X. ) a varâca e o desvo-padrão de Y. ) a covarâca etre X e Y. v) o coefcete de correlação etre X e Y. 43 a) X Y b) X Y Cosdere duas varáves aleatóras depedetes, X e Y, cujas médas são e, respectvamete e suas varâcas são 5 e 6. Usado as abrevações abaxo: m(x) = méda artmétca de X. var(x) = varâca de X. dp(x) = desvo-padrão de X. Determe: a) m(x + 5) b) m(5y) c) m(3x 4Y + 7) d) var(x) e) var(y + 6) f) var(4x) - var(y + ) g) dp(5x) + dp(6y) h) dp(3x - 5) - dp(4y - 8) 8. Dadas as varáves aleatóras X, Y e Z, sedo: var(x) = 4 cov(y,z) = -3 var(y) = 9 X e Y são depedetes var(z) = X e Z são depedetes Calcule: a) var(x+y) b) var(x-y) c) var(x+3y) d) var(y+z)
46 e) var(y-3z+5) f) var(4x-) g) corr(z,y) h) cov(4z,5y) ) cov(z,-y) j) corr(,5z; Y) O coefcete de correlação etre X e Y é,6. Se W = 3 + 4X e Z = Y, determe o coefcete de correlação etre W e Z.. O coefcete de correlação etre X e Y é ρ. Se W = a + bx e Z = c + dy, determe o coefcete de correlação etre W e Z
47 Apêdce.B - Demostrações.B. Demostração da expressão.3.3. var(ax) = a var(x) 45 var(ax) = = = ( a X a - X) ) var(ax) = [ a (X - X ] var(ax) = = a (X - X) var(ax) = a (X - X) = var(ax) = a var(x) (c.q.d).b. Demostração da expressão.3.3. dp(ax) = a.dp(x) dp(ax) = var(a X) dp(ax) = dp(ax) = a a var(x) var(x) dp(ax) = a.dp(x) (c.q.d.).b.3 Demostração da expressão var(x+a) = var(x) var(x+a) = [ X + a - (X a ] + = = ) ) var(x+a) = [ X + a - X - a ] var(x+a) = (X - X) = var(x+a) = var(x) (c.q.d.).b.4 Demostração da expressão dp(x+a) = dp(x) dp(x+a) = var(x + a ) dp(x+a) = var(x)
48 dp(x+a) = dp(x) (c.q.d.) 46.B.5 Demostração da expressão.3.4. cov(x,y) = méda dos produtos - produto da méda cov(x,y) = = (X - X)(Y - Y) cov(x,y) = cov(x,y) = cov(x,y) = cov(x,y) = cov(x,y) = = = = = XY XY XY XY = - (X Y - X Y - XY + XY) = - Y XY X = - = - X - XY - XY + XY - XY XY + Y = cov(x,y) = méda dos produtos - produto da méda = XY + XY (c.q.d.).b.6 Demostração da expressão.3.6. cov(ax,by) = a.b.cov(x,y) cov(ax,by) = cov(ax,by) = = = ( a X b - ax)( by - Y) a (X b - X) (Y - Y) cov(ax,by) = a.b. (X - X)(Y - Y) = cov(ax,by) = a.b.cov(x,y).b.7 Demostração da expressão.3.6. var(x+y) = var(x) + var(y) + cov(x,y) var(x+y) = var(x+y) = (X + Y ) - ( X+ Y) = (X + Y + XY ) - ( X + Y + XY) = var(x+y) =( X = - X ) + ( Y = - Y ) + ( XY - XY ) =
49 var(x+y) = var(x) + var(y) + cov(x,y) (c.q.d.) 47.B.8 Demostração da expressão var(x-y) = var(x) + var(y) - cov(x,y) var(x-y) = var[x+(-y)] var(x-y) = var(x) + var(-y) + cov(x,-y) var(x-y) = var(x) + var(y) - cov(x,y) (c.q.d.)
50 48
51 49 CAPÍTULO 3 DISTIBUIÇÃO DE PROBABILIDADE Supoha que você compra uma ação de uma compaha ao preço de R$ e que, após um mês, pretede vedê-la. Supoha ada que, por algum motvo qualquer, ao fal de um mês, esta ação só pode estar valedo os mesmos R$, com probabldade de 5%; ter caído para R$ 5, com probabldade de 3%; ou ada, ter subdo para R$ 5, com probabldade de %. Só estes três valores são possíves, tedo em vsta que as respectvas probabldades somam exatamete %. Temos aí uma dstrbução de probabldade assocada ao preço da ação, sto é, cada um dos valores possíves desta ação (só 3, este caso) tem uma probabldade correspodete. Como defmos o capítulo ateror, sto caracterza o preço da ação como uma varável aleatóra. E, como o cojuto de valores do preço da ação é um cojuto dscreto, esta é uma dstrbução de probabldade dscreta ou, em outras palavras, é uma dstrbução de probabldade de uma varável aleatóra dscreta. Poderíamos ter uma dstrbução cotíua (o que, alás, provavelmete sera mas adequado cosderado-se que se trata do preço de uma ação), mas sto fca para mas adate o capítulo. Por equato trataremos de dstrbuções dscretas. 3. Esperaça Matemátca Uma pessoa que compre a ação ctada acma pode sar gahado, pode perder ou até fcar a mesma, depededo do que acoteça com o preço da ação. Etão, a méda, dá a mesma, certo? Errado! A probabldade de que a ação caa é maor do que a ação suba. O valor médo do preço da ação é: 5,3 +,5 + 5, = R$ 9,5 O valor médo é 5 cetavos abaxo do preço cal da ação, o que sgfca que, em méda, quem comprar esta ação sará perdedo. Mas este é um valor médo esperado. É uma méda do que pode acotecer com a varável, baseado a sua dstrbução de probabldade. É o que chamamos de Esperaça Matemátca ou, smplesmete, Esperaça. A Esperaça de uma varável aleatóra dscreta X, E(X), pode ser defda, etão, como: E(X) = X P(X ) + X P(X ) X P(X ) = X P(X = ) A probabldade aqu tem o mesmo papel da freqüêca relatva do capítulo ateror. A dfereça é que, quado falamos em freqüêca relatva usualmete os refermos a uma quatdade obtda, equato probabldade se refere, obvamete, a proporções que a varável pode assumr determado valor 3. 3 A dfereça fcará mas clara o capítulo 5 quado falarmos em valores amostras e populacoas. Podemos magar a freqüêca relatva como sedo o valor amostral, equato a probabldade é o valor populacoal. Ou ada, lembrado o capítulo, pela abordagem freqüetsta, a probabldade é o lmte da freqüêca relatva quado temos um úmero muto grade de expermetos.
52 Alás, podemos pesar em P(X) como uma fução que assoca o valor de X à sua probabldade, que é chamada de fução de probabldade. Uma outra fução mportate que pode ser assocada às probabldades é a fução que, dado o valor de X, os forece a probabldade acumulada, e que chamamos fução de dstrbução acumulada, ou smplesmete, fução de dstrbução, que represetamos por F(X). Se X for o preço da ação que falamos o íco do capítulo, etão X só pode assumr 3 valores, sto é, 5, e 5. F(5) sera a probabldade do preço da ação ser, o máxmo, 5, o que é exatamete 3%. F() é a probabldade de ser até que, este caso, equvale à probabldade de ser 5 ou, que é 8%. Falmete, F(5) é a probabldade de ser, o máxmo, 5, sto é, de ser 5,, ou 5 que é, obvamete %. Esta é uma característca das fuções de dstrbução, o últmo valor 4 da fução é (%). 5 P(X) 6% 5% 4% 3% % % % 5 5 Fução de probabldade F(X) % % 8% 6% 4% % % 5 5 Fução dstrbução acumulada Nos gráfcos acma o formato de hstograma fo utlzado para uma melhor vsualzação, ão sedo, evdetemete, obrgatóro, embora seja adequado para uma varável aleatóra dscreta. Exemplo 3.. Num sorteo de úmeros teros de a 5, a probabldade de um úmero ser sorteado é proporcoal a este úmero (sto é, a probabldade do úmero 5 ser sorteado é cco vezes a probabldade do úmero ser sorteado). Qual a probabldade de cada úmero ser sorteado. 4 Ou o lmte para quado X tede ao fto.
53 5 Se chamarmos a probabldade do úmero ser sorteado (P()) de uma costate descohecda A, temos que: P() = A P(3) = 3A P(4) = 4A P(5) = 5A Ora, sabemos que a soma de todas as probabldades, sedo os evetos mutuamete exclusvos, tem que ser gual a : P() + P() + P(3) + P(4) + P(5) = A + A + 3A + 4A + 5A = 5 A = A = 5 Portato: P() = /5 P() = /5 P(3) = 3/5 = /5 P(4) = 4/5 P(5) = 5/5 = /3 Voltado à Esperaça, ela é uma méda poderada pelas probabldades. Valem portato, para a Esperaça, as mesmas propredades da méda: E(aX + b) = ae(x) + b E(X + Y) = E(X) + E(Y) Podemos, clusve, escrever a varâca em termos da Esperaça. Como a varâca é defda como a méda dos quadrados dos desvos em relação à méda, temos que: var(x) = E[X E(X)] Ou ada, podemos calcular a varâca como sedo a méda dos quadrados meos o quadrado da méda, portato: var(x) = E(X ) [E(X)] Da mesma forma, a covarâca etre duas varáves pode ser escrta utlzado a esperaça: cov(x,y) = E[(X-E(X))(Y-E(Y)] = E(XY) E(X)E(Y) Exemplo 3.. Uma ação comprada por R$ pode assumr, após 3 das, os segutes valores: R$ 5, com probabldade %; R$, com probabldade 3%; R$ 6, com probabldade 5% e R$, com probabldade 5%. Determe o valor esperado da ação e a sua varâca. O valor esperado (esperaça) da ação será dado por:
54 5 E(X) = 5, +,3 + 6,5 +,5 E(X) =, = 4,5 Como o preço da ação fo de R$, o lucro médo (esperado) desta ação é R$ 4,5. Quato à varâca: E(X ) = 5, +,3 + 6,5 +,5 E(X ) = 5, +,3 + 56,5 + 4,5 E(X ) =, = 6,5 var(x) = E(X ) [E(X)] var(x) = 6,5 4,5 var(x) =,5 Repare que a varâca, ao medr a dspersão dos possíves valores da ação, é uma medda do rsco da ação. 3. Algumas dstrbuções dscretas especas Há dstrbuções que, por sua mportâca, merecem um destaque especal e até um ome. Trataremos de algumas delas agora. 3.. Dstrbução uforme dscreta A dstrbução uforme é aquela em que todos os elemetos têm a mesma probabldade de ocorrer. Image, por exemplo o marcador das horas em um relógo dgtal Qual a probabldade de que, ao olhar para ele um mometo qualquer do da, ele esteja mostrado um partcular úmero? Obvamete, é / para qualquer úmero, cosderado um mostrador de doze horas, ou /4 para um mostrador de vte e quatro horas. Também é gual a probabldade de ocorrêca de um úmero qualquer em um dado ão vcado, /6. Também se trata de uma dstrbução uforme. O gráfco da fução de probabldade para o caso do dado é mostrado abaxo (de ovo, em forma de hstograma): P(X) / Exemplo 3... Joga-se um dado uma úca vez. Qual o valor esperado do úmero obtdo? E a sua varâca? O valor esperado (esperaça) será dado por:
55 53 E(X) = = 6 = 3,5 Repare que, ão por cocdêca: + 6 E(X) = 3,5 = Ou seja, o caso de uma dstrbução uforme dscreta, a méda é a própra méda artmétca dos valores extremos (desde que, é claro, estes valores cresçam um tervalo costate). E a varâca será: E(X ) = E(X ) = = 6 9 var(x) = E(X ) [E(X)] 9 5 var(x) = =, Dstrbução de Beroull A dstrbução de Beroull se caracterza pela exstêca de apeas dos evetos, mutuamete exclusvos, que deomaremos de sucesso e fracasso, um expermeto que é realzado uma úca vez. Se a probabldade de sucesso é p, a probabldade de fracasso é, evdetemete 5, p. É uma dstrbução deste tpo o laçameto de uma moeda uma úca vez. Se apostamos a cara, sedo esta etão o sucesso temos que a probabldade de sucesso é p = / e a probabldade de fracasso (coroa) é p = /. Da mesma forma se, um laçameto de uma dado apostamos um úmero, dgamos, o 3, este será o sucesso, sedo qualquer um dos outros cco úmeros fracasso. Neste caso, a probabldade de sucesso é p = /6 e a probabldade de fracasso é p = 5/6. Há outros exemplos: dgamos que a teção de voto para um caddato é 3%. Se, ao escolhermos um eletor ao acaso e defmos como sucesso se este eletor pretede votar o referdo caddato, a probabldade de sucesso será p =,3 e a probabldade de fracasso será p =,7; da mesma forma, se há 5% de peças defetuosas em um lote, defdo como sucesso escolher, ao acaso, uma peça que ão seja defetuosa, a probabldade será p =,95, equato a probabldade de fracasso será p =,5. Exemplo 3... No caso da cara ou coroa, atrbudo o valor para o sucesso e para o fracasso, determe a méda e a varâca do resultado após uma jogada. A méda será dada por: 5 Já que só exstem estes dos evetos e eles são mutuamete exclusvos.
56 54 E(X) = + = =,5 E a varâca: E(X ) = + = =,5 var(x) = E(X ) [E(X)] =,5,5 =,5 Exemplo 3... No caso do dado, em que se aposta em um úco úmero, atrbudo o valor para o sucesso e para o fracasso, determe a méda e a varâca do resultado após uma jogada. A méda será dada por: E(X) = = 6 E a varâca: E(X ) = + 5 = var(x) = E(X ) [E(X)] 5 = = Pelos dos exemplos acma, podemos verfcar que 6, uma dstrbução de Beroull: E(X) = p var(x) = p( p) Assm, podemos utlzar o resultado para o caso do caddato que tem 3% das teções de voto. Temos que (verfque!): E(X) = p =,3 var(x) = p( p) =,3,7 =, E mesmo para o caso das peças defetuosas ou para qualquer stuação que se equadre em uma dstrbução de Beroull. Especfcamete o caso do caddato, é possível, como veremos adate 7, através da varâca, motar as chamadas marges de erro das pesqusas eletoras Dstrbução Bomal 6 A demostração é dada o apêdce 3.B 7 No capítulo 6.
57 A dstrbução Bomal ada mas é do que a geeralzação da dstrbução de Beroull. Há um sucesso, com probabldade p e um fracasso, com probabldade p, mas o úmero de expermetos (de jogadas ) pode ser qualquer. Tomemos o exemplo mas smples, que é o da cara ou coroa, com três jogadas, que represetamos a árvore abaxo: 3 caras caras cara ca co ca co coroa ca co coroas 3 coroas 55 Já cohecemos o resultado da prmera jogada: P( cara) = p = P( coroa) = p = Para a seguda jogada, observado a árvore, verfcamos que, da orgem, há 4 camhos possíves e, este caso, todos com a mesma probabldade. Destes 4, em deles chegaríamos a caras ou coroas. Etretato, para cara e coroa há camhos possíves. Portato, para duas jogadas temos: P( caras) = 4 P( cara e coroa) = 4 P( coroas) = 4 Repare que: P( caras) = p p P( cara e coroa) = p ( p) P( coroas) = ( p) ( p) O úmero que aparece para cara e coroa se deve ao fato de que este resultado é possível de ocorrer de duas maeras, sto é, dado cara a prmera jogada ou dado coroa logo a prmera. Para 3 jogadas, há 8 camhos possíves (verfque!). Destes 8, em apeas ocorrem só caras ou só coroas. Em 3 deles ocorrem caras e coroa e em outros 3, coroas e cara.
58 P(3 caras) = 8 56 P( caras e coroa) = 8 3 P( cara e coroas) = 8 3 P(3 coroas) = 8 Temos agora que: P(3 caras) = p p p P( caras e coroa) = 3 p p ( p) P( cara e coroas) = 3 p ( p) ( p) P(3 coroas) = ( p) ( p) ( p) E agora aparece o úmero 3 para caras e coroa (ou cara e coroas). De ode? Bom, há realmete 3 possbldades: a cara, a cara e 3 a coroa; ou, a cara, a coroa e 3 a cara; ou ada, a coroa, a cara, 3 a cara. Podemos combar as posções das caras de 3 maeras dferetes. O úmero 3, a verdade, é a quatdade de combações 8 de 3 elemetos em grupos de. Portato: P(3 caras) = C 3,3 p p p P( caras e coroa) = C 3, p p ( p) P( cara e coroas) = C 3, p ( p) ( p) P(3 coroas) = C 3, ( p) ( p) ( p) Nota: as combações de elemetos em grupos de k também é podem ser escrtas como: C,k = k Que se lê bomal de, k (por razões que agora são óbvas). Portato, as probabldades para 3 jogadas podem ser escrtas assm: 3 P(3 caras) = p p p 3 3 P( caras e coroa) = p p ( p) 3 P( cara e coroas) = p ( p) ( p) 3 P(3 coroas) = ( p) ( p) ( p) Podemos geeralzar, para um expermeto qualquer, ode a probabldade de sucesso é p e a probabldade de fracasso é p, a probabldade de que, em jogadas, ocorram k sucessos é: 8 Veja apêdce.a.
59 57 P(x = k) = p k ( p) -k k Exemplo Supoha um jogo de dados em que se aposta em um úco úmero. Determe a probabldade de: a) em 3 jogadas, gahar É uma dstrbução bomal ode p = /6, temos 3 jogadas e o sucesso ocorre em delas: 3 P(x = ) = 6 5 P(x = ) = P(x = ) = 6 b) em 4 jogadas, gahar. 4 P(x = ) = 6 5 P(x = ) = P(x = ) = 96 c) em 5 jogadas, gahar P(x = 3) = P(x = 3) = P(x = 3) = 7776 Exemplo Calcule a méda e a varâca o jogo de cara ou coroa, atrbudo valor para cara e para coroa, cosderado, e 3 jogadas. Para jogada, fcamos reduzdos ao caso partcular da dstrbução de Beroull, cujo resultado já cohecemos: E(x) = p = var(x) = p( p) = 4 Façamos etão, o cálculo para e 3 jogadas. Para jogadas, temos:
60 58 E(x) = = 4 4 = E(x ) = = 4 6 =,5 var(x) =,5 =,5 E, para 3 jogadas, temos: 3 3 E(x) = = =, E(x ) = = = var(x) = 3,5 =,75 Note que é váldo que: E(x) = p var(x) = p( p) Dstrbução Geométrca A dstrbução geométrca também se refere a sucessos e fracassos mas, dferete da bomal é a probabldade de que o sucesso ocorra (exatamete) a k-ésma jogada. Por exemplo, a cara ou coroa, qual a probabldade de que a cara só ocorra a tercera jogada? Ou, qual a probabldade de que o dado só dê o úmero desejado a quarta jogada. Assm sedo, a forma geral da dstrbução geométrca será dada por: P(x = k) = ( p) k- p Ou seja, uma seqüêca de fracassos as k- prmeras jogadas, culmado com sucesso apeas a k-ésma jogada. Exemplo Um tme de basquete ão está muto bem esta temporada, de tal forma que a probabldade de que gahe um jogo qualquer é %. Qual é a probabldade de que a prmera vtóra ocorra: a) a prmera partda? Aí é medato: P(x = ) =, = % b) a seguda partda? c) a quta partda? P(x = ) =,8, =,6 = 6% P(x = 5) =,8 4, =,89 8,% Exemplo Qual é a partda esperada em que ocorrerá a prmera vtóra?
61 59 O valor esperado da k-ésma partda em que ocorrerá a tão sohada vtóra é: E(x) =, +,8, + 3,8, + 4,8 3, +... E(x) =, [ +,8 + 3,8 + 4, ] A expressão etre colchetes é quase uma progressão geométrca, exceto pelos úmeros,, 3, 4, etc. Na verdade, é uma soma de progressões geométrcas como podemos ver abaxo: +,8 +,8 +, ,8 +,8 +, ,8 +, , ,8 + 3,8 + 4, Relembrado que a soma de uma progressão geométrca fta cujo prmero termo é a cuja razão (q) é meor do que, em módulo, é dada por 9 : S = a q Temos etão que:,8,8 3 E(x) =, ( ),8,8,8, E(x) = ( +,8 +,8 +, ),8 O termo etre parêteses é também uma progressão geométrca, equato o termo multplcado é exatamete : E(x) =,8 = = 5, Portato, o esperado é que a vtóra ocorra a quta partda. Repare que o resultado obtdo pode ser geeralzado para: E(x) = p Que é a méda de uma dstrbução geométrca Dstrbução Hpergeométrca A dstrbução Hpergeométrca se refere a probabldade de ao retrarmos, sem reposção, elemetos em um cojuto de N, k elemetos com o atrbuto sucesso, sedo que, do total de N elemetos, s possuem este atrbuto e, portato, N s possuem o atrbuto fracasso. Fca claro que, da maera como defmos p aterormete: 9 O que é mostrado o apêdce 3.A
62 6 p = N s A perguta aqu, etão, é: qual a probabldade de que, retrado-se elemetos, k possuam o atrbuto sucesso e -k o atrbuto fracasso. Do total de N elemetos, podemos trar N grupos de elemetos. Dos s que possuem o s atrbuto sucesso, há grupos de k elemetos que poderam sar esta extração. Falmete, k N - s dos N-r que possuem o atrbuto fracasso, há grupos de -k elemetos. Etão, a - k probabldade de ecotrarmos k elemetos com o atrbuto sucesso é: P(x = k) = s N - s k - k N Exemplo Sabe-se que há % de peças defetuosas em um lote de 5. Ao retrar 8 peças deste lote, sem reposção, qual a probabldade de que delas sejam defetuosas? Como são % de peças defetuosas em um total de 5, há 5 peças defetuosas. Pede-se a probabldade de retrar (do total de 5) peças defetuosas e 6 (de um total de 45) peças em bom estado. Esta probabldade é calculada como se segue: P(x = ) = ,57 = 5,7% 3..6 Dstrbução de Posso Você é capaz de dzer quatas vezes, em méda, toca o telefoe por da a sua casa ou o seu escrtóro? Provavelmete, sm. Mas quatas vezes ão toca o telefoe? Esta perguta é muto dfícl de se respoder. Quado uma varável aleatóra tem um comportameto parecdo com este, dzemos que ela segue uma dstrbução de Posso. Se cosderarmos que sucesso é tocar o telefoe, é muto dfícl calcular o p, a probabldade dsso ocorrer, já que ão temos como calcular a ão ocorrêca do eveto. A solução é magar que o p é muto pequeo, já que o toque do telefoe dura apeas algus segudos em um da de 4 horas. Portato, o úmero de vezes que este expermeto é realzado (telefoe toca ou ão toca), que é o da dstrbução Bomal, é realzado mutas vezes.
63 6 Assm que modelamos este tpo de dstrbução: partdo de uma dstrbução Bomal, cosderado que p é muto pequeo (tede a zero) e é muto grade (tede a fto). p Mas de tal modo que o produto p é um úmero fto dferete de zero. p = λ Mas o que sgfca este ovo parâmetro λ? Como partmos de uma dstrbução Bomal, temos que: E(x) = p = λ Portato, λ é exatamete o úmero médo de vezes que o eveto ocorre. No exemplo do telefoe, é o úmero de vezes que o telefoe toca por da. Ada é possível calcular a varâca partdo de uma dstrbução Bomal: var(x) = p( p) Mas, como p tede a zero, p tede a. Portato: var(x) = p = λ A dstrbução de Posso se caracterza, desta forma, por ter méda gual a varâca. Para calcularmos a probabldade de uma varável como esta, partmos da dstrbução Bomal e fazemos p e. Fazedo sto 3, chegamos a: P(x = k) = -λ k e λ k! Exemplo Supoha que, em méda, o telefoe toque 4 vezes ao da em uma casa. Qual a probabldade de que, um certo da, ele toque, o máxmo, vezes? É uma dstrbução de Posso, cujo parâmetro é λ = 4. A probabldade de tocar o máxmo vezes é equvalete à probabldade de tocar, ou vezes. P(x = ) = P(x = ) = P(x = ) = -4 e 4! -4 e 4! -4 e 4! = e -4 = 4e -4 = 8e -4 3 Veja a demostração o apêdce 3.B.
64 Portato: P(x ) = 3e -4,38 = 3,8% 6 A dstrbução de Posso também pode ser útl como uma aproxmação da bomal quado, embora ão seja mpossível, o valor de p seja tão pequeo de modo que os cálculos se torem um tato quato trabalhosos, como o exemplo abaxo. Exemplo Um caddato tem apeas % das teções de voto. Qual a probabldade de que, em eletores escolhdos ao acaso, ecotremos 5 que desejem votar este caddato? Usado a bomal pura e smplesmete, temos: P(x = 5) =, 5,98 95,353 = 3,53% 5 Podemos, etretato, usar a dstrbução de Posso como aproxmação, tedo como parâmetro λ = p =, = P(x = 5) = - e 5! 5,36 = 3,6% Que é um valor bem próxmo do ecotrado através da bomal. Exercícos. Calcule a méda, a varâca e o desvo padrão das segutes varáves aleatóras dscretas: a) valor de uma ação: $ 5 com probabldade 35% $ 4 com probabldade 3% $ 3 com probabldade % $ com probabldade 5% b) potos de um tme ao fal do campeoato: 4 com probabldade de 5% 36 com probabldade de % 3 com probabldade de 5% 8 com probabldade de 5% 4 com probabldade de % com probabldade de 5% c) o valor em uma jogada de um dado ão vcado. d) o valor em uma jogada de um dado vcado em que a probabldade é versamete proporcoal a cada úmero (sto é, a probabldade de dar é ses vezes maor do que dar 6). e) gahos em jogo de cara ou coroa (com uma moeda ão vcada) ode, após 4 jogadas:
65 gahado 4, segudas: prêmo de $ 6 gahado 3, segudas: prêmo de $ 3 gahado 3, alteradas: prêmo de $ gahado, segudas: prêmo de $ gahado, alteradas: prêmo de $ gahado : pealdade de $ perdedo todas: pealdade de $5 63 f) gahos em jogo de dados tetraédrcos (apostado em um úco úmero) ode, após 3 jogadas: gahado 3 : prêmo de $ gahado, segudas: prêmo de $ gahado, alteradas: prêmo de $ gahado : pealdade de $ perdedo todas: pealdade de $ g) Z =,, 3, 4 P(Z=k) =,48 k. Dada uma v.a. X, ode X é um úmero tero postvo cuja probabldade é P(X = k) = A(,8) k. Determe o valor de A. 3. A probabldade de que um aluo atrase a mesaldade é %. Qual a probabldade de que, em aluos, o máxmo atrasem a mesaldade? 4. Um caddato tem % das teções de voto. Qual a probabldade de que, em 5 eletores escolhdos ao acaso, 7 teham a teção de votar este caddato? 5. Num grupo de pessoas, são casadas. Qual a probabldade de, um grupo de 5 pessoas escolhdas ao acaso, sejam solteras? 6. Uma pessoa está teressada em veder um móvel e fo formada de que, a probabldade de ecotrar um comprador dsposto a pagar o preço peddo em qualquer da é 3%. Qual a probabldade de que ela cosga veder o móvel em até 3 das? 7. Numa grade cdade braslera ocorrem, em méda, 5 echetes por ao. Qual a probabldade de que um determado ao ocorram o máxmo 3 echetes? 8. Uma alua, quado assste aulas em salas com ar codcoado, esprra, em méda, 3 vezes por hora. Qual a probabldade de que, em 3 horas, ela esprre vezes? 9. Calcule a probabldade pedda usado a bomal e a respectva aproxmação pela Posso: a) em um lote de peças, % são defetuosas. Qual a probabldade de que um lote de peças ão apresete ehuma defetuosa. b) um caddato tem 3% das teções de voto. Qual a probabldade de que, etrevstados eletores, 35 afrmem que vão votar este caddato.
66 APÊNDICE 3.A Progressão geométrca 64 Chamamos de Progressão Geométrca (ou, smplesmete, PG) uma seqüêca de úmeros em que, dado um úmero da sére, o úmero segute será ecotrado multplcado-se por um valor fxo. Por exemplo, a seqüêca de úmeros abaxo: {, 6, 8, 54, 6} É uma PG, pos partdo do, multplcado-o por 3, temos 3 = 6, que é o úmero segute; para acharmos o próxmo, fazemos 6 3 = 8, e assm sucessvamete para ecotrarmos os segutes. Esta é uma PG de 5 termos; o úmero 3, que é aquele que se multplca para ecotrar o próxmo úmero da seqüêca é chamado de razão da PG. Nosso prcpal teresse é a soma dos termos de uma PG. No caso específco, porém, ela pode ser faclmete ecotrada, pos são poucos termos: S = S = 4 (3.A.) Há que se ecotrar, o etato, uma fórmula geral para que possa ser aplcada a qualquer PG, ão mporta seu tamaho. Para sto, multplquemos a equação (3.A.) por 3, que é a razão da PG. 3S = (3.A.) Note que todos os termos se repetram, exceto o prmero. Subtraamos a equação (3.A.) da equação (3.A.): 3S = (S = ) S = S = 484 S = 484 = 4 Desta forma, podemos repetr o procedmeto para uma PG qualquer de termos, com o termo deomado a e razão q. A soma desta PG será dada por: S = a + aq + aq + aq aq - (3.A.3) Multplcado a equação (3.A.3) por q, vem: qs = aq + aq + aq aq - + aq (3.A.4) Subtrado (3.A.3) de (3.A.4), temos: qs = aq + aq + aq aq - + aq -(S = a + aq + aq + aq aq - )
67 qs-s = aq - a S(q-) = a (q -) 65 S = a(q ) q - Assm, cosegumos ecotrar um termo geral para calcular a soma de uma PG. Para sso, devemos detfcar o prmero termo da sére (o a da fórmula), a razão (q) e o úmero de termos (). E se a PG for fta? É possível que a soma seja fta? A resposta é sm. Tomemos, por exemplo, uma pessoa que come um chocolate segudo uma regra: em cada mordda, ela come exatamete metade do que falta. Quatos chocolates ela rá comer ao fal de ftas morddas? Obvamete, chocolate. Mas sto só acotece porque em cada mordda ela come sempre uma fração do que falta. Isto é, é ecessáro que a razão seja (em módulo) meor do que. A soma que represeta as morddas do chocolate é dada por: S = = Que é uma PG com ftos termo, cujo prmero é e a razão também é e que, sabemos, é gual a. Neste caso temos uma PG fta, portato: S = a + aq + aq + aq (3.A.5) Que, se multplcarmos por q e subtrarmos, temos: S = a + aq + aq + aq (qs = aq + aq + aq ) S - qs = a (- q)s = a a S = q APÊNDICE 3.B Tópcos adcoas em dstrbuções de probabldade dscretas 3.B. Méda e varâca de uma dstrbução de Beroull E(X) = p + ( p) E(X) = p E(X ) = p + ( p) E(X ) = p var(x) = E(X ) [E(X)] var(x) = p p
68 66 var(x) = p( p) 3.B. Da Bomal à Posso A probabldade em uma dstrbução Bomal é dada por: deles: P(x = k) = p k ( p) -k k Pela defção de bomal (combações):! P(x = k) = p k ( p) -k ( - k)!k! ( -)( - )...( - k + )( - k)! P(x = k) = p k ( p) -k ( - k)!k! ( -)( - )...( - k + ) P(x = k) = p k ( p) -k k! No umerador da fração acma temos k fatores. Colocado em evdêca em cada um P(x = k) = k k - [(- )(- )...(- )]p k ( p) -k k! Como tede ao fto,,, etc. tedem a zero. P(x = k) = k p k ( p) -k k! Como, por defção, λ = p, temos que p = λ. k P(x = k) = k λ λ k! k ( ) -k Do cálculo dferecal, sabemos que: E assm chegamos a: lm ( λ ) -k = e -λ P(x = k) = -λ k e λ k! 3.B.3 Quadro resumdo as prcpas dstrbuções dscretas Dstrbução Bomal Geométrca Forma Geral P(X = k) Méda Varâca p p( p) p k ( p) -k k ( p) k- p p p p
69 67 Hpergeométrca Posso s N - s k - k N p = N s -λ k e λ p = λ λ k! s N - s N - N N N -
70 CAPÍTULO 4 - DISTRIBUIÇÕES CONTÍNUAS E TEOREMA DE TCHEBICHEV Dstrbuções cotíuas Image o marcador das horas de um relógo dgtal. Agora, pese o potero das horas de um relógo aalógco. Há uma dfereça sgfcatva, além da tecologa empregada. Equato o potero passa por qualquer posção do marcador, se atrburmos esta sua posção a um valor, este será exatamete quado for potualmete duas horas, valerá,5 quado forem duas horas e trta mutos, 3,5 às três e quze e assm sucessvamete. O que se quer dzer aqu é que o valor atrbuído à posção do potero das horas pode ser qualquer um etre (exclusve) e (clusve). Já o relógo dgtal, o mostrador só assume, obvamete, valores teros. Esta dfereça pode ser vsta grafcamete. Prmero, um gráfco para o relógo dgtal: P(X) X A varável X é o valor assumdo pelo marcador das horas do relógo dgtal. Se olharmos para ele uma hora qualquer do da a probabldade de que ela teha um dos valores acma é exatamete. Não há a possbldade de que ela assuma outros valores. A dfereça o gráfco para o relógo aalógco é que ele assume, em prcípo, qualquer valor, portato devemos preecher a lha que ue os doze potos. f(x) A varável x pode assumr, portato, ftos valores. Como vmos o capítulo, embora o potero das horas passe pelo, a probabldade de que x seja exatamete gual a é zero, já que é um valor etre ftos possíves. Como calcular a probabldade de que x assuma um valor etre, dgamos, e 3? Do capítulo, já sabemos a resposta, que é o mesmo, já que o tervalo de a 3 x é do tervalo total (e todos os tervalos do mesmo tamaho tem a mesma probabldade de ocorrer).
71 Uma outra maera de chegar a este cálculo é se retomarmos o gráfco para o relógo dgtal, mas desta vez em forma de hstograma: 69 P(X) X Uma maera de terpretarmos a probabldade do mostrador estar dcado duas horas, sto é, P(X = ) é a área do retâgulo correspodete a X =. A base deste retâgulo é e a altura é. A área é, portato, =. Para uma dstrbução cotíua, usaremos um racocío aálogo, sto é, para determar a probabldade de x estar etre e 3, calcularemos a área defda pela fução este tervalo. f(x) x A área é, de ovo, de um retâgulo, cuja base é e a altura. Portato: P( < x < 3) = = Repare que, como a probabldade de um poto é gual a zero, tato faz, este caso, se utlzamos os símbolos de meor ou meor ou gual, pos a probabldade será a mesma: P( < x < 3) = P( x < 3) = P( < x 3) = P( x 3) = Uma dstrbução como essa do relógo aalógco é uforme (cotíua). Note uma cosa mportate: A fução f(x) ão forece dretamete a probabldade de x, até porque esta é zero, já que se trata de uma dstrbução cotíua. Ela é chamada de fução desdade de probabldade (f.d.p.) e as probabldades são obtdas através das áreas defdas por esta fução.
72 As probabldades de probabldade, etretato, devem ser matdas para que f(x) seja uma f.d.p. A soma das probabldades tem que ser gual a, o que vale dzer que a área total tem que ser gual 3 a. De fato, a área total defda por f(x) é =. 7 Além dsso, a probabldade ão pode ser egatva. Portato, f(x) tem que ser ão egatvo, sto é, maor ou gual a zero. Exemplo 4.. Uma varável aleatóra (v.a.) cotíua, com dstrbução uforme, pode assumr qualquer valor real etre 3 e 6. Determe a fução desdade de probabldade desta fução. O gráfco desta fução é: f(x) A 3 6 Ode A é um valor que ada temos que determar. Como temos que f(x) é sempre postva ou zero, aplcamos a codção de que a área total delmtada pelo gráfco tem que ser gual a. A base do retâgulo é 3 (= 6 3) e a altura gual a A. Portato: A 3 = A = 3 Ou seja, f(x) = 3 quado x está etre 3 e 6 e é gual a zero para todos os demas valores de x, o que pode ser represetado como se segue: f(x) =, x < 3 ou x > 6, 3 x 6 3 Exemplo 4.. Partdo da f.d.p. do exemplo ateror, determe as probabldades de que: a) x = 4 Embora seja possível, como se trata de dstrbução cotíua, a probabldade de x ser exatamete gual a um valor é gual a zero. Portato: b) x esteja etre 4,6 e 5,5 P(x = 4) = 3 Embora f(x) possa ser maor do que.
73 7 A fução é dada por: f(x) =, x < 3 ou x > 6, 3 x 6 3 Cujo gráfco é mostrado abaxo: f(x) /3 3 4,6 5,5 6 A probabldade será dada pela área delmtada o gráfco, que correspode a um trâgulo de base,9 e altura 3. c) x esteja etre e 4. P(4,6 x 5,5) =,9 3 =,3 Como x só assume valores etre 3 e 6, a área relevate a ser calculada correspode aos potos etre 3 e 4, já que para qualquer tervalo ates de 3, a probabldade é gual a zero. P( x 4) = P( x 3) + P(3 x 4) P( x 4) = + 3 P( x 4),33 Exemplo 4..3 Dada a f.d.p. de uma v.a. cotíua abaxo: Ax, x 3 f(x) =, x < ou x > 3 Determe: a) o valor de A. O gráfco desta fução é dado abaxo:
74 7 Como f(x) = Ax, f(3) = 3A e f() =. A fgura defda pelo gráfco é um trâgulo de base 3 e altura 3A. Sabemos que f(x) é sempre ão egatvo, portato basta aplcarmos a propredade de que a área total seja gual a : 3 A 3 = 9A = A = 9 b) a probabldade de que x esteja etre e 3. Agora temos que f() = 9 = 9 4 e f(3) = 3 9 = 9 6 = 3. A área correspodete a esta probabldade está assalada o gráfco: Que determa um trapézo. Podemos calcular dretamete a área do trapézo ou calcular a dfereça etre a área dos dos trâgulos (o maor, cuja base va de a 3, e o meor, cuja base va de a ): P( x 3) =
75 P( x 3) = 9 4 = Exemplo 4..4 Dada a f.d.p. de uma v.a. cotíua abaxo: Ax, x f(x) =, x < ou x > Determe: a) o valor da costate A. O gráfco desta fução é dado abaxo: Como ão se trata mas de uma fução cujo gráfco é retlíeo como as fuções aterores, temos que recorrer ao cálculo tegral. Sabemos 3 que a área sobre uma curva é dada pela tegral da fução correspodete. Portato, a codção de que a área total tem que ser gual a pode ser escrta como: + f ( x) dx = Neste caso específco, a fução vale zero para valores de x abaxo de ou acma de. Portato, os lmtes de tegração relevates são, este caso, e : f ( x )dx = Ax dx = A x dx = 3 x A 3 = A 3 3 = 3 Veja apêdce 3.A.
76 74 A 3 = A = b) a probabldade de que x esteja etre,5 e. De ovo, para calcularmos a área etre x =,5 e x =, determado assm, a probabldade, basta ecotramos a tegral com estes lmtes de tegração: P(,5 x ) = 3x dx,5 3 P(,5 x ) = [ x ], 5 P(,5 x ) = 3,5 3 P(,5 x ) =,5 P(,5 x ) =,875 = 87,5% É óbvo que é possível usar o cálculo tegral para os exemplos aterores também. Assm, podemos resumr as codções para que uma fução qualquer seja uma fução desdade de probabldade: + f ( x) dx = e Exemplo 4..5 (dstrbução expoecal) Dada a f.d.p. da v.a. cotíua x dada abaxo: Ae -αx, x f(x) =, x < Determe o valor de A. f(x) para todos os valores de x Esta partcular dstrbução é cohecda como dstrbução expoecal. Temos que: + f ( x) dx = E, como esta fução é ula para valores de x egatvos: + Ae + A e -αx -αx - e A α dx = dx = αx + =
77 75 A ( ) α A = α = A = α 4. Fução de dstrbução de varáves cotíuas A fução de dstrbução acumulada, ou smplesmete fução de dstrbução, o caso de varáves cotíuas, segue a mesma lógca do caso dscreto. No caso dscreto, a fução de dstrbução F(x) é a soma das probabldades de todos os valores possíves que a varável x pode assumr até o valor de x propramete dto. Assm, se x é um úmero tero ão egatvo, a fução de dstrbução é dada por: F() = P() F() = P() + P() F() = P() + P() + P() F(3) = P() + P() + P(3) E assm sucessvamete. Para o caso de uma varável cotíua, porém, devemos somar todos os valores possíves, o que é feto pela tegral. Desta forma, temos: x F(x) = f( t)dt Portato, do poto de vsta matemátco, f(x) é a dervada da fução F(x): f(x) = df( x) dx Exemplo 4.. Dada a f.d.p. de uma dstrbução expoecal abaxo, determe a fução de dstrbução correspodete: e -x, x f(x) =, x < Como a fução só e defda para x, o lmte de tegração feror será zero. x F(x) = f( t)dt x F(x) = e - t d t -t F(x) = [ e ] x F(x) = e -x + e F(x) = e -x
78 A fução de dstrbução será dada etão, por: e -x, x F(x) =, x < 76 Exemplo 4.. Dada a fução de dstrbução abaxo, determe a fução desdade de probabldade correspodete.,5(x 3 + ), - x F(x) =, x < -, x > A fução desdade de probabldade será dada por: f(x) = df( x) dx d(,5x 3 +) f(x) = dx f(x) = 3,5x + f(x) =,5x f(x) = Portato, a f.d.p. será:,5x, - x, x < - ou x > A fução de dstrbução F(x), assm como a fução desdade, deve preecher algus requstos : o prmero é que, em se tratado de uma soma de probabldades, jamas pode ser egatva. E, como a soma das probabldades tem que ser, F(x) ão pode ser ucamaor do que e, além dsso, o seu valor fal tem que ser, ecessaramete,. Portato: F(x) lm x F(x) = É fácl verfcar que, tato o exemplo 4.. como o 4.. as fuções F(x) apresetadas atedem a estas codções. 4.3 Esperaça e varâca de varáves aleatóras cotíuas Para uma v.a. dscreta, a esperaça é dada por: E(X) = X P(X ) + X P(X ) X P(X ) = X P(X = )
79 Para uma v.a. cotíua, teríamos que somar cotuamete todos os valores de x pelas suas respectvas probabldades. Uma soma cotíua e a tegral e, por sua vez, a probabldade é ecotrada pela f.d.p. Etão, temos que, o caso cotíuo: + E(x) = xf ( x) dx A varâca, por sua vez, é: var(x) = E[X E(X)] Chamado, por smplcdade, E(X) (que é a méda de X) de µ, temos que: var(x) = E(X µ) 77 Para o caso cotíuo, bastara substtur (x µ) teríamos: + var(x) = ( x µ ) f ( x) dx a expressão da esperaça acma e Ou podemos utlzar a expressão de que a varâca é a soma dos quadrados meos o quadrado da méda: var(x) = E(x ) [E(x)] Ode: + E(x) = xf ( x) dx e + E(x ) = x f ( x) dx Exemplo 4.3. Da f.d.p. do exemplo 3.3.4, determe: a) o valor médo de x Trata-se aqu de calcular a esperaça de x: + E(x) = xf ( x) dx O que, para esta varável, equvale a: E(x) = x 3x dx E(x) = 3 x 3 dx 4 x E(x) = 3 4
80 E(x) = E(x) = 4 3 =,75 b) a varâca de x. A méda dos quadrados de x é dada por: + E(x ) = x f ( x) dx E(x ) = x 3x dx E(x ) = 3 x 4 dx E(x 5 x ) = 3 5 E(x ) = 3 5 E(x ) = 5 3 =,6 E, assm, podemos calcular a varâca: var(x) = E(x ) [E(x)] var(x) =,6,75 var(x) =,6,565 var(x) =,375 c) o desvo padrão de x. dp(x) =, 375 dp(x),94 Exemplo 4.3. Dada a dstrbução expoecal abaxo: e -x, x f(x) =, x < Determe: a) a méda de x. + E(x) = xf ( x) dx + x E(x) = xe dx b) a medaa de x. x x E(x) = [ xe e ] + E(x) =
81 79 A medaa de uma varável é o valor de que dvde a dstrbução em duas. Se chamarmos a medaa de m, vale dzer que, para uma v.a. cotíua: + P(x > m) = f ( x )dx =,5 m m P(x < m) = f ( x )dx =,5 Utlzado a prmera delas (podera ser qualquer uma) à f.d.p. em questão, temos: + m e x x [ ] + dx =,5 e m =,5 e -m =,5 Aplcado logartmo atural em ambos os lados: l(e -m ) = l,5 m,693 m, A dstrbução Normal Voltemos à dstrbução bomal. Se =, ela reca a dstrbução de Beroull. Supodo que p =,5, o gráfco em forma de hstograma desta dstrbução é dado abaxo: Para =, temos: E assm para = 3:
82 8 Para = 5: Ou mesmo para = : Supoha que aumetemos defdamete, de tal forma que os retâgulos do hstograma se torem cada vez mas espremdos ou os potos de um gráfco comum se colapsem se torado uma fução cotíua. Esta fução tera a segute aparêca :
83 8 Esta dstrbução de probabldade é cohecda como ormal ou gaussaa 33, cuja f.d.p. é dada por: f(x) = πσ e (x µ) σ Ode µ é a méda e σ é o desvo padrão. Se a varável x tem dstrbução ormal (sto é, é ormalmete dstrbuída) costumamos smbolzar por: x ~ N(µ, σ) Que se lê: x segue uma dstrbução ormal com méda µ desvo padrão σ. Note que defmos completamete uma dstrbução ormal com a méda e o desvo padrão (ou a varâca), já que ão há ehum outro parâmetro a ser especfcado a fução acma. A méda determa a posção da curva em relação à orgem, equato o desvo padrão determa se a curva será mas gorda (mas dspersa, maor desvo padrão) ou mas magra (mas cocetrada, meor desvo padrão). O cálculo das probabldades sob uma dstrbução ormal pode se torar um tato quato trabalhoso, já que ão há uma fução cuja dervada é e -x. Este cálculo deve ser feto por métodos umércos. Uma partcular dstrbução Normal, cohecda por Normal padrozada, que tem méda e desvo padrão gual a, tem seus resultados das tegras tabeladas. Esta tabela 34 ecotramos ao fm do lvro. Chamado de z a varável ormal padrozada, ecotramos a tabela a probabldade de z estar etre e o valor especfcado 35. Por exemplo, se qusermos ecotrar a probabldade de z estar etre e,3, ecotramos dretamete a probabldade a tabela, como mostra o gráfco: 33 Devdo ao matemátco alemão Carl Fredrch Gauss ( ). 34 A utldade desta tabela é lmtada hoje em da, tedo em vsta que há város softwares de computador que se utlzam destes métodos umércos e calculam rapdamete as tegras sob a curva ormal (a própra tabela o fal do lvro fo calculada assm). A tabela hoje serve para fs ddátcos e para utlzação em exames. 35 Nas lhas da tabela ecotramos o valor de z até a prmera casa decmal, equato os valores da seguda casa decmal se ecotram as coluas.
84 8 P( < z <,3),397 = 39,7% Para um valor de z que esteja etre,7 e,43, temos: Os valores ecotrados a tabela para z =,7 e z =,43 são as tegras de até cada um deles. A área que va de,7 a,43 é a dfereça etre estes dos valores: P(,7 < z <,43) = P( < z <,43) P( < z <,7) P(,7 < z <,43),436,64 =,37 = 3,7% Para valores egatvos (como a méda é zero, vale dzer para valores abaxo da méda), há que se otar que a Normal é smétrca, portato o que vale para os valores de z postvos vale também para os egatvos. Supoha etão que queramos calcular a probabldade de z estar etre,38 e,97. Neste caso, claramete somamos as duas áreas: P(-,38 < z <,97) = P(-,38 < z < ) + P( < z <,97) P(-,38 < z <,97) = P( < z <,38) + P( < z <,97) P(-,38 < z <,97),46 +,334 =,75 = 75,% E se qusermos calcular a probabldade de z ser maor do que,:
85 83 Aí, vale lembrar que, como a dstrbução é smétrca, em cada metade temos uma probabldade total de,5. Pela tabela sabemos a probabldade de z estar etre e,, para saber de, em date, basta subtrar de,5. P(z >,) =,5 P( < z <,) P(z >,),5,4868 =,3 =,3% O problema é que, evdetemete, em todas as varáves que são ormalmete dstrbuídas têm méda e desvo padrão. A prmera questão é fácl de resolver: basta subtrarmos a méda da varável. Esta ova varável terá méda zero. Quato ao desvo padrão, basta lembrarmos que: dp(ax) = adp(x) Portato, se o desvo padrão de uma varável aleatóra x é σ, o desvo padrão da varável σ x será: dp( σ x ) = σ dp(x) = σ σ = Portato, para que a varável teha desvo padrão gual a, temos que dvd-la pelo seu desvo padrão. O processo de trasformar uma varável qualquer em uma varável qualquer em uma cuja méda é zero e o desvo padrão é um, que chamamos de padrozação, cosste em subtrar a méda e dvdr pelo desvo padrão. Portato, se uma v.a. x possu méda µ e desvo padrão σ, a varável z, assm defda: z = x µ σ Terá méda zero e desvo padrão um e, se for ormalmete dstrbuída, podemos utlzar os valores da tabela para calcular as suas probabldades.
86 Exemplo 4.4. O faturameto mesal de uma loja segue uma dstrbução ormal com méda R$., e desvo padrão R$ 4.,. Calcule a probabldade de que, um determado mês, o faturameto esteja etre R$ 9., e R$ 5.,. A varável é ormal, mas ão padrozada. Devemos, portato, padrozar os seus valores ates de utlzar a tabela: 84 z = z = x µ 9 = σ 4 µ 5 = σ 4 x =,5 =,5 Portato: P(9 < x < 5) = P(,5 < z <,5) Que é o caso em que temos um valor acma e outro abaxo de zero. P(9 < x < 5) = P(,5 < z < ) + P( < z <,5) P(9 < x < 5) = P( < z <,5) + P( < z <,5) P(9 < x < 5),987 +,3944 =,493 = 49,3% 4.5 Trasformações de varáves Supoha que tehamos uma v.a. x cuja fução desdade é dada por f(x). Se y é fução de x, de modo que y = u(x), qual é a f.d.p. de y? Para começar a respoder esta perguta, partamos de um caso smples (em que u(x) é uma fução afm) mostrado o exemplo que se segue: Exemplo 4.5. Dada uma v.a. x, cotíua, com fução desdade dada por f(x). Se y = ax + b, com a e b postvos, determe a fução desdade de probabldade de y. Se f(x) é a f.d.p. de x, etão sabemos que: + f ( x) dx = Como y = ax + b, temos que: Etão: x = y b a (4.5.) + y b f ( )dx = a Mas a fução desdade de y, dgamos, g(y) deve ser tal que:
87 85 + g ( y) dy = Isto é, a fução, tegrada em relação a y (e ão a x) deve ser gual a. Mas, dferecado a equação (4.5.) temos: dx = a dy Substtudo: + y b f ( ) dy = a a Portato, a fução: y b g(y) = f( ) a a Têm as característcas de uma f.d.p. e é, portato, a f.d.p. da varável y. Este resultado é um caso partcular de um teorema mas geral que é eucado abaxo: Teorema 4.5. Dada uma v.a. x com f.d.p. dada por f(x), e sedo y = u(x), exstdo uma fução versa x = v(y) e v (y) a sua dervada, a fução desdade de probabldade de y será dada por: g(y) = v (y) f(v(y)) Nos potos em que v(y) exstr e u (x), e em caso cotráro. A preseça do módulo é ecessára para garatr a ão egatvdade da fução desdade de probabldade de y. A aplcação dreta do teorema o exemplo ateror os levara a: u(x) = ax + b y b v(y) = a v (y) = a g(y) = v (y) f(v(y)) y b g(y) = f( ) a a E, como a é postvo: y b g(y) = f( ) a a
88 Exemplo 4.5. Dada a v.a. x cuja f.d.p. é: e -x, x f(x) =, x < Supodo y = x, determe a f.d.p. de y. 86 Temos que u(x) = x, portato v(y) = y, desde que, é claro, y seja postvo, e: v'(y) = y Aplcado o Teorema 4.5., vem: g(y) = y e y E, como y tem que ser postvo, assm como y, a f.d.p. de y será dada por: g(y) = y e, y y, y < 4.6 Teorema de Tchebchev 36 Se cohecemos a fução desdade de uma varável, é possível cohecer sua méda e varâca. A recíproca ão é verdadera, mas é possível se estabelecer um lmte para uma dstrbução de probabldade qualquer (seja dscreta ou cotíua), lmte este que é dado pelo Teorema de Tchebchev Teorema 4.6. (Teorema de Tchebchev) Dada uma v.a. x com méda µ e desvo padrão σ. A probabldade desta varável estar, acma ou abaxo da méda, o máxmo, k desvos padrão (k é uma costate postva) é, o mímo, gual a k. Ou: P( x µ < kσ) k Coseqüetemete, a probabldade de ultrapassar este valor será, o máxmo,, sto é: k P( x µ kσ) k 36 Devdo ao matemátco russo Pafut Lvovtch Tchebchev (8-894).
89 O que vale dzer que a probabldade de uma varável aleatóra qualquer, estar etre dos desvos padrão acma ou abaxo é de, o mímo 37, 4 = 4 3 = 75%. 87 Exemplo 4.6. Uma v.a. cotíua x tem méda 5 e desvo padrão. Calcule a probabldade míma de que x esteja etre 35 e 65. Exercícos Pede-se portato: P(35 < x < 5) =? O que é a probabldade de x estar,5 desvos padrão acma ou abaxo da méda, ou seja: P(35 < x < 5) = P( x µ <,5σ) Pelo Teorema de Tchebchev: P(35 < x < 5),5 P(35 < x < 5),5556 = 55,56%. É possível ecotrar um valor de A para que a fução f(x) represetada o gráfco abaxo seja uma f.d.p.? Justfque. Determe os valores de A para que as fuções abaxo sejam f.d.p.(fuções desdade de probabldade): a), x< ou x>8 f(x) = A, x 8 b), x< ou x>4 f(x) = Ax, x 4 c), x< ou x>3 37 Note que, para a dstrbução Normal, esta probabldade é de cerca de 95%.
90 88 f(x) = Ax, x 3 d), x<- ou x>3 f(x) = A(x + ), - x 3 e), x< f(x) = Ae -3x, x f), x<- ou x> f(x) = Ax, - x g), x<- ou x> f(x) = Ax 3, - x h), x<- ou x> f(x) = Ax, - x 3. Para cada uma das varáves apresetadas o exercíco, determe a fução de dstrbução correspodete. 3. Para cada uma das varáves apresetadas o exercíco, determe a méda, a varâca, o desvo padrão, a medaa e a moda 4. Determe a f.d.p. de uma varável x que pode assumr qualquer valor o tervalo [a, b] e tem dstrbução uforme. 5. Dada a f.d.p. abaxo:, x< ou x>9 f(x) = /8, x 9 Determe as probabldades de: a) x > 5 b) x 6 c) x = 4 d) < x < 7 e) x < 4 f) 4 < x 8 6. Dada a f.d.p. abaxo:, x< ou x> f(x) = 4x 3, x Determe as probabldades de:
91 a) x >,5 b) x,7 c), < x <,6 d), x <,3 e),4 < x, Dada a f.d.p. abaxo:, x< f(x) = e -x, x Determe as probabldades de: a) x > b) x - c) < x < 5 d) x < 3 e) 4 < x 8. Numa ormal padrozada, determe a probabldade de z estar etre: a) desvo padrão acma ou abaxo da méda. b) desvos padrão acma ou abaxo da méda. c) 3 desvos padrão acma ou abaxo da méda. 9. Os lucros auas de uma frma seguem uma dstrbução ormal com méda R$ 7 ml e desvo padrão R$ 5 ml. Calcule a probabldade de, um dado ao, os lucros: a) serem maores do que R$ 8 ml. b) serem maores do que R$ 6ml. c) serem meores do que R$ 9 ml. d) serem meores do que R$ 65 ml. e) estarem etre R$ 55 ml e R$ 77 ml. f) estarem etre R$ 35 ml e R$ 5 ml. g) estarem etre R$ 7 ml e R$ 85 ml.. As otas bmestras de um aluo seguem uma dstrbução ormal com méda 5 e varâca 4,84 Calcule a probabldade de, um dado bmestre, sua ota: a) ser maor do que 8. b) ser maor do que 4,5. c) ser meor do que 9. d) ser meor do que 4. e) estar etre 3,5 e 6,5. f) estar etre,5 e 4,5. g) estar etre 6 e 8,5.. As otas bmestras de um aluo são, em méda, 4 e tem varâca,56, mas a dstrbução ão é cohecda. Determe um lmte para probabldade de, um dado bmestre, sua ota: a) estar etre,5 e 6,5. b) estar etre e 6. c) ser meor do que ou maor do que 7.. Uma varável aleatóra x tem f.d.p. dada por f(x). Se y = x, determe a f.d.p. de y.
92 9 3. Se y = x e x é uma v.a. cotíua cuja f.d.p. é dada por: 3x, x f(x) =, x < ou x > Determe a f.d.p. de y. 4. Determe a méda e a varâca de uma varável aleatóra x cuja f.d.p. é dada por: αe -αx, x f(x) =, x < 5. Dada uma varável aleatóra cotíua x cuja méda é e a varâca é 5. Determe lmtes para as probabldades abaxo: a) P ( < x < 3) b) P (4 < x < 6) c) P (x <,5 ou x > 7,5) 6. Mostre que, para uma v.a. com méda µ e varâca σ, é válda a expressão: σ P( x µ < k) k
93 Apêdce 4.A - Cálculo dferecal e tegral 9 4.A. Dervadas Dervada é a varação statâea. Se você percorre, com seu carro, km em h, sua velocdade méda é km/h. É pouco provável, etretato, que durate todo este percurso a velocdade teha sdo costate. A velocdade que marca o velocímetro (ou o radar) é a velocdade do carro aquele state. A defção formal é a segute: d y y = lm x dx x y Ode é a taxa de varação méda (a velocdade méda, por exemplo). Se tomamos uma x varação de x muto pequea, etão a taxa de varação méda tede a cocdr com a taxa de varação statâea (a dervada). Os termos dy e dx (dferecas de y e x) dcam que se trata de uma varação (dfereça) ftamete pequea destas varáves, em cotraste com os símbolos y e x, que represetam a dfereça (varação) fta. Se usamos a otação y = f(x), a dervada também pode ser escrta como f (x). 4.A.. Regras de dervação A partr da defção acma é possível calcular a dervada de qualquer fução, se ela exstr. Etretato, ormalmete se usam algumas regras geras, que são mostradas a tabela abaxo: f(x) f'(x) a (costate) x x x x x - e x e x l x /x se x cos x cos x se x ag(x) ag'(x) g(x) + h(x) g'(x) + h (x) g(x).h(x) g'(x).h(x) + g(x).h (x) g(x)/h(x) [g (x).h(x) g(x).h (x)]/[h(x)] g(h(x)) h (x).g (h(x)) 4.A. Itegral A tegral de uma fução é o lmte de uma soma
94 9 b a f ( x ) dx = lm = f(x ) x Daí a sua utldade em cálculos de áreas, por exemplo. É como se aproxmássemos a curva em questão através de um cojuto de retâgulos e calculássemos o a área destes retâgulos. Quato maor o úmero de retâgulos, e portato meor o seu tamaho, mas próxmo estaremos da área correta da fgura. Demostra-se, através do Teorema do Valor Médo, que: b a f ( x ) dx = F(b) F(a) Ode F(x) é chamada de prmtva de f(x), sto é, é a fução cuja dervada é f(x), ou seja: F (x) = f(x) Na tabela abaxo apresetamos algumas prmtvas: f(x) F(x) a ax x x / x ( -) x + /(+) /x l x e x e x e -x e -x xe -x xe -x e -x x e -x e -x (x + x + ) 4.A.3 Máxmos e mímos Podemos ecotrar os máxmos e mímos da fução resolvedo a segute equação: f (x) = Isto é, dervado e gualado a zero. Para saber se é poto de máxmo, substtuímos o(s) valor(es) ecotrado(s) acma, que chamaremos de x a dervada seguda (codção de a ordem), ode valem as segutes regras: f (x ) > poto de mímo f (x ) < poto de máxmo f (x ) = poto de flexão
95 Apêdce 4.B Demostração dos teoremas e mometos de uma dstrbução 93 4.B. Demostração do Teorema 4.5. Cosderaremos dos casos: em que u(x) é uma fução crescete (sedo assm, sua dervada é postva); e o caso em que u(x) é uma fução decrescete (com dervada egatva, portato). Relembrado que y = u(x), cuja fução versa é dada por x = v(y). Para o caso de u(x) crescete, tomado duas costates a e b quasquer, temos: P(a < y < b) = P[v(a) < x < v(b)] v( b) P(a < y < b) = f ( x )dx v( a) Como f(x) = f(v(y)) e dx = v (y)dy, e ada: se x = v(a), etão y = a se x = v(b), etão y = b Substtudo, temos: b P(a < y < b) = f (v( y))v'( y) dy a Portato, a f.d.p. de y, este caso é g(y) = v (y)f(v(y)) Para u(x) decrescete, há que se fazer uma versão: P(a < y < b) = P[v(b) < x < v(a)] v( a) P(a < y < b) = f ( x )dx v( b) De ovo, substtudo, temos: a P(a < y < b) = f (v( y))v'( y) dy b O que é equvalete a: b P(a < y < b) = a f (v( y))v'( y) dy Sedo assm, agora a f.d.p. de y é g(y) = v (y)f(v(y)) Ou seja, v (y), quado é egatvo, fca com o sal de meos à frete de modo a torá-lo postvo, o que equvale a calcular o seu módulo. Etão, vale a regra geral: g(y) = v (y) f(v(y)) 4.B. Demostração do Teorema de Tchebchev
96 Nos lmtaremos aqu ao caso de dstrbuções cotíuas. 94 Sabemos que: + σ = var(x) = ( x µ ) f ( x) dx Dvddo esta tegral em três partes, temos: µ kσ σ = ( x µ ) f ( x) dx + ( x µ ) µ + kσ µ kσ f ( x) dx + + ( µ + kσ x µ ) f ( x) dx E, como todos os três termos são ão egatvos, já que f(x) é ão egatva e (x - µ) está elevado ao quadrado, se retrarmos a tegral do meo teremos: µ kσ + σ ( x µ ) f ( x) dx + ( x µ ) f ( x) dx µ + kσ E agora temos x em dos tervalos: um, ode x µ kσ e o outro, ode x µ + kσ. Em ambos os casos, temos que (x µ) k σ. Portato, é váldo que: µ kσ σ k σ f ( x) dx + + k µ + kσ σ f ( Dvddo por k σ em ambos os lados: x) dx f ( x) dx + f k µ kσ + µ + kσ ( x) dx E sabemos que: µ kσ + f µ + kσ f ( x) dx = P(x µ kσ) = P(x µ kσ) ( x) dx = P(x µ + kσ) = P(x µ kσ) Substtudo: P(x µ kσ) + P(x µ kσ) k O que equvale a: P( x µ kσ) k Cujo complemetar é: P( x µ < kσ) k 4.B.3 Dstrbução log-normal
97 Se x é uma varável cuja dstrbução é ormal com méda µ e desvo padrão σ, e seja y defda como y = e x (ou seja, x = l y), dzemos que y segue uma dstrbução cohecda como log- Normal. Aplcado o Teorema 3.6., temos que: u(x) = e x v(y) = l y v (y) = y 95 A f.d.p. de uma varável ormal é: f(x) = πσ e (x µ) σ A f.d.p. da varável log-normal (y) será etão: g(y) = y σ µ + πσ e ( l y µ) σ Cuja méda é e e a varâca é e µ ( e σ e σ ). 4.B.4 Mometos de uma dstrbução Defmos o mometo de uma dstrbução (de uma varável aleatóra x) de ordem k, em relação à méda 38 (M k ) como: M k = E(x µ) k É medato que o prmero mometo em relação à méda é sempre zero: M = E(x µ) = E(x) µ = µ µ = E o segudo mometo é a varâca: M = E(x µ) = σ O tercero mometo, defdo por: M 3 = E(x µ) 3 Tem a ver com o grau de smetra da dstrbução. Uma dstrbução smétrca (como a Normal) tem o tercero mometo em relação à méda gual a zero. Defe-se, clusve, um coefcete de assmetra por: M α 3 = 3 3 σ 38 Também podemos defr o mometo em relação à orgem, M k = E(x k ).
98 Que é tão maor (em módulo) quato mas assmétrca for a dstrbução. 96 O quarto mometo: M 4 = E(x µ) 4 Tem a ver com a curtose, que é o grau de achatameto de uma dstrbução. Se uma dstrbução é muto achatada, ela é dta platcúrtca, se é mas para potaguda, é chamada leptocúrtca. A referêca para esta defção é a dstrbução Normal, que é dta mesocúrtca. Defe-se o coefcete de curtose como: M α 4 = 4 4 σ Cujo valor, para a Normal, é 3. Se for maor do que 3, a dstrbução é leptocúrtca, caso cotráro, platcúrtca.
99 97
100 98 CAPÍTULO 5 DISTRIBUIÇÃO DE PROBABILIDADE CONJUNTA Chamamos de cojuta a probabldade que se refere a duas (ou mas) varáves aleatóras smultaeamete. Podemos ada dzer que é a dstrbução de probabldade de um vetor aleatóro 39 (X,Y) para o caso bdmesoal, sto é, com duas varáves. Estas varáves podem, evdetemete, ser dscretas ou cotíuas. 5. Dstrbução cojuta de varáves dscretas Image um tme de vôle que va dsputar um campeoato muto equlbrado (de modo que a probabldade de gahar ou perder uma partda seja,5). O técco pede ao aalsta de úmeros da equpe que faça uma aálse das probabldades das 3 prmeras partdas, que são cosderadas vtas para o restate da competção. Em partcular, a vtóra a prmera partda é cosderada vtal pela comssão técca. O aalsta, etão, defe duas varáves, X e Y, desta forma: X é o úmero de vtóras obtdas os três prmeros jogos e Y é gual a, caso ocorra vtóra o prmero jogo e caso cotráro (X e Y são varáves depedetes?). Há 8 possíves resultados as três prmeras partdas (, em cada partda), todos com a mesma probabldade (já que a probabldade de vtóra em cada jogo é,5). Os possíves resultados, e os correspodetes valores de X e Y, são mostrados a tabela abaxo: tabela 5. resultados possíves X Y VVV 3 VVD VDV VDD DVV DDV DVD DDD Ode V represeta vtóra e D represeta a derrota. O resultado VDV, por exemplo, represeta vtóra o prmero jogo, derrota o segudo e vtóra o tercero. A segur, o aalsta costró uma tabela que apreseta as probabldades cojutas de X e Y. O preechmeto desta tabela é feto através da tabela ateror. Assm, a posção da tabela que correspode a X = e Y = devemos colocar a probabldade dsto ocorrer, sto é P(X= e Y=). Pela tabela acma, verfcamos que, em 8 resultados possíves, temos em que há duas vtóras (X = ) e há vtóra o prmero jogo (Y = ). Portato, P(X= e Y=) = 8. E assm procededo obtemos: 39 Chamamos o vetor (X,Y) de vetor aleatóro se X e Y forem varáves aleatóras.
101 99 tabela 5. Y X Com a tabela 5. prota, tora-se desecessáro utlzar a tabela 5. para se obter as probabldades cojutas. Assm, dretamete pela tabela 5., temos, por exemplo: P(X= e Y=) = 8 P(X= e Y=) = 8 P(X=3 e Y=) = Da tabela 5. podemos obter também as dstrbuções de probabldade só de X e só de Y. Como? A probabldade, dgamos, de X ser gual a, depedete do valor de Y é a probabldade de X = e Y = ou X = e Y =, portato 4 : P(X=) = P[(X= e Y=) ou (X= e Y=)] = = 8 3 Isto é, a probabldade de X ( só de X, sem cosderar o que ocorre com Y) é dada pela soma das probabldades ao logo da colua, ou seja, somado-se as probabldades de todos os valores possíves de Y. Etão, a tabela, 5.3, além da dstrbução cojuta de X e Y, mostramos também a dstrbução margal de X, a dstrbução só de X (chama-se de margal à margem porque fo obtda de uma dstrbução cojuta), represetada por P(X): tabela 5.3 Y X P(X) Lembrado que Y = e Y = são evetos mutuamete exclusvos, portato vale a regra P(A ou B) = P(A) + P(B).
102 A dstrbução de probabldade só de Y é obtda da mesma forma, ou seja, somado-se as probabldades ao logo da lha, sto é, somam-se todos os valores possíves de X. Por exemplo, a probabldade de Y ser gual a é dada por: P(Y=) = P(Y= e X=) + P(Y= e X=) + P(Y= e X=) + P(Y= e X=3) P(Y=) = = 8 4 = Fazedo o mesmo para Y gual a, obtemos a dstrbução margal de Y, represetada por P(Y) a tabela 5.4: tabela 5.4 Y X 3 P(Y) P(X) O úmero colocado o cato feror dreto da tabela represeta a soma das probabldades margas (e da cojuta também), que tem que ser, obvamete, gual a. Repare que as probabldades margas de X e Y obtdas pela soma das probabldades cojutas são as mesmas (e em podera ser dferete) que seram obtdas dretamete da tabela 5.. Por exemplo, dos 8 resultados possíves, há 3 em que X é gual a, portato P(X=) = 8 3 ; e há 4 em que Y é gual a, portato P(Y=) = 8 4 =. É possível utlzar a tabela 5.4 para calcular as probabldades codcoas, embora elas ão possam ser obtdas dretamete da tabela. Supohamos que queramos saber qual a probabldade de X ser gual a, dado que Y é (sto é, se acotecer uma vtóra o prmero jogo, qual a probabldade de que só acoteça uma vtóra os três jogos). Pela defção de probabldade codcoal, temos: P(X= Y=) = P(X = e Y = ) P(Y = ) E, da tabela 5.4 temos os valores: P(X= Y=) = 8 = 4 Este resultado também é compatível com as formações da tabela 5., pos se Y já é, só há, etão, 4 resultados possíves, dos quas em apeas deles X é gual a.
103 Da mesma forma, podemos calcular a probabldade de, dgamos, Y ser gual a, dado que X é gual a (sto é, se duas vtóras ocorreram, a probabldade de que o prmero jogo teha sdo uma derrota). P(Y= X=) = P(Y = e X = ) P(X = ) = = 3 Ou, se ocorreram duas vtóras, os resultados possíves se reduzem a 3. Destes, em apeas o prmero jogo ocorre uma derrota. Voltado a perguta formulada o íco do capítulo: X e Y são depedetes? Como sabemos o que represetam X e Y, a resposta é smples: se o prmero jogo o tme for derrotado, é mpossível que haja vtóra em 3 jogos (portato, se Y é gual a é mpossível que X seja 3); da mesma forma, se Y é gual a é mpossível que X seja. Portato, X e Y ão são depedetes. Isto, o etato, pode ser verfcado mesmo que ão tvéssemos outra formação além da tabela 5.4, já que, por exemplo: P(X= Y=) = 4 e P(X=) = 8 3 Portato: P(X= Y=) P(X=) E, portato, pela defção de depedêca dada o capítulo, X e Y são depedetes, já que ão vale a gualdade etre a probabldade codcoal e a codcoal 4. Exemplo 5.. Calcule o valor esperado e a varâca das varáves aleatóras X e Y defdas o texto, bem como a covarâca e o coefcete de correlação etre as mesmas. As dstrbuções cojuta e margal de X e Y foram apresetadas a tabela 5.4: tabela 5.4 Y X 3 P(Y) Para mostrar que as varáves ão são depedetes, basta ecotrar uma stuação em que a gualdade ão vale. Para o cotráro, o etato, é ecessáro que a gualdade valha para todos os valores de X e Y, pos é possível que, para um par de valores partculares de X e Y, valha, por cocdêca, a gualdade, ada que X e Y ão sejam depedetes.
104 P(X) Para calcular E(X) e var(x) usamos as probabldades dadas pela dstrbução margal de X, que pode assumr os valores,, e 3: 3 3 E(X) = = =, E(X ) = = = 8 4 = 3 var(x) = E(X ) [E(X)] =,875,5 = 3,565 =,4375 Para Y vale o mesmo racocío: E(Y) = + =,5 E(Y ) = + = + =,5 var(y) = E(Y ) [E(Y)] =,5,5 =,5,5 =,5 Para se calcular a covarâca de X e Y podemos utlzar a expressão: covar(x,y) = E(XY) E(X)E(Y) Como já cohecemos as esperaças de X e Y, temos que calcular a esperaça dos produtos. Os produtos são mostrados a tabela abaxo: tabela 5.5 X Y XY 3 3 Pela tabela 5.5 temos que: P(XY = ) = 8 4 P(XY = ) = 8 P(XY = ) = 8 P(XY = 3) = 8
105 Portato, a esperaça dos produtos será dada por: E(XY) = = 8 8 = 3 E a covarâca: covar(x,y) = E(XY) E(X)E(Y) =,5,5 =,65 =,375 ρ XY = E, falmete, o coefcete de correlação: covar(x,y),375 =,655 var(x)var(y),4375,5 Exemplo 5.. Dadas as varáves aleatóras X e Y defdas o texto, determe E(X Y=). Para calcularmos a esperaça codcoada precsamos das probabldades codcoas para todos os valores de X: P(X= Y=) = 4 P(X= Y=) = P(X= Y=) = 4 P(X=3 Y=) = Portato: E(X Y=) = = Exemplo 5..3 Dadas as varáves aleatóras X e Y defdas o texto, determe var(y X=). De ovo, precsamos das probabldades codcoas: P(Y= X=) = 3 P(Y= X=) = 3 Temos etão: E(Y X=) = = 3 E(Y X=) = = = 3 var(y X=) = E(Y X=) [E(Y X=)] = - = - = =,
106 4 Exemplo 5..4 Para casas de flhos, defem-se duas varáves, W e Z. W é o sexo do prmero flho, sedo para masculo e para femo. Z é gual a se as duas craças são do mesmo sexo, se formam um casal. Costrua uma tabela com as dstrbuções cojuta e margal de W e Z e determe se são varáves depedetes. Para um casal com flhos, há quatro possbldades. Represetado os meos por H e as meas por M, temos: possbldades W Z HH HM MM MH Cujas probabldades são mostradas a tabela abaxo: W P(Z) Z P(W) Note que, para quasquer valores de Z ou W: P(Z=Z W=W ) = P(Z=Z ) e P(W=W Z=Z ) = P(W=W ) Por exemplo: P(Z= W=) = 4 = = e 4 P(Z=) = Portato, Z e W são depedetes, o que é lógco, pos os dos flhos serem ou ão do mesmo sexo depede do sexo do prmero flho. Exemplo 5..5 A tabela abaxo mostra a dstrbução cojuta das varáves aleatóras dscretas U e V. Ecotre as dstrbuções margas, verfque se U e V são depedetes e calcule a covarâca das duas varáves. V U
107 As dstrbuções margas de U e V são dadas pela soma ao logo das lhas (a de V) e ao logo das coluas (a de U). A tabela abaxo mostra também as dstrbuções margas: V - P(U) U P(V) Podemos ver que: P(U= V=) = P(U=) = 8 e Portato: P(U= V=) P(U=) Etão U e V ão são depedetes. Os valores esperados de U e V são: E(U) = = 8 8 = E(V) = 8 3 (-) = Para calcularmos a covarâca de U e V, precsamos das probabldades do produto UV: E(UV) = 8 (-) + 8 (-) = Etão: covar(u,v) = E(UV) E(U)E(V) = = Isto é, apesar da covarâca ser zero, as varáves U e V são depedetes Dstrbução cojuta de varáves cotíuas Se as varáves aleatóras forem cotíuas o procedmeto é smlar àquele para uma úca varável. Defe-se uma fução desdade de probabldade (f.d.p) cojuta f(x,y), de tal modo que a probabldade de x estar etre os valores a e b e y etre c e d é dada por: 4 Lembre-se que, se as varáves são depedetes, a covarâca é zero, mas a recíproca ão é verdadera, sto é, covarâca zero ão mplca depedêca como pode ser vsto o exemplo acma.
108 6 d b P(a<x<b e c<y<d) = c a f ( x, y) dxdy Ou seja, a f.d.p. cojuta, assm como a dstrbução de probabldade cojuta dscreta, os dá a probabldade do e. E, em se tratado de varáves cotíuas (seja uma ou mas de uma), a probabldade só pode ser calculada para um tervalo, sto é: P(x=x e y=y ) = Mesmo que x=x e y=y sejam evetos possíves. A f.d.p. cojuta deve segur as mesmas propredades da f.d.p. para uma varável, sto é, ão pode ser egatva: f(x,y) E a soma de todas as probabldades tem que ser gual a : + + f ( x, y) dxdy = Exemplo 5.. Dada a fução: Axy, para < x < e < y < f(x,y) =, demas valores Determe o valor de A para que f(x,y) seja uma f.d.p. Para ser uma f.d.p. deve obedecer: + + f ( x, y) dxdy = Ou, o caso específco, como tato x como y varam etre e : f ( x, y) dxdy = Axydxdy = Ay xdxdy = x Ay dy =
109 7 Ay dy = A ydy = A y = A = A = 4 A = 4 Exemplo 5.. Dada a f.d.p. do exemplo 5.., determe a probabldade de x estar etre, e,4 e y estar etre,6 e,8. A f.d.p. é dada por: 4xy, para < x < e < y < f(x,y) =, demas valores A probabldade do e é dada dretamete pela tegral da f.d.p.:,8,4 P(,<x<,4 e,6<y<,8) = f ( x, y) dxdy,6,,8,4 P(,<x<,4 e,6<y<,8) = 4xydxdy P(,<x<,4 e,6<y<,8) = P(,<x<,4 e,6<y<,8) = P(,<x<,4 e,6<y<,8) = P(,<x<,4 e,6<y<,8) = P(,<x<,4 e,6<y<,8) =,6,,8,6,8,6,8,6,8,6,4 4y xdxdy, x 4y,4 4y,4 ydy,8,4 ydy,6 y P(,<x<,4 e,6<y<,8) =,4,4,,8,6 dy,,4, dy
110 8,8 P(,<x<,4 e,6<y<,8) =,4 P(,<x<,4 e,6<y<,8) =,336, 6 Exemplo 5..3 Dada a f.d.p. do exemplo 5.., determe as f.d.p. margas de x e y. No caso de varáves aleatóras dscretas, a dstrbução margal de X era ecotrada somado-se as probabldades para todos os Y e vce-versa. Com varáves cotíuas, a f.d.p. margal de x (chamada aqu de g(x) ) é ecotrada de forma aáloga, sto é, tegrado (somado) em y. De um modo geral, a f.d.p. margal de x pode ser ecotrada assm: + g(x) = f ( x, y) dy E, o caso específco: g(x) = 4xydy g(x) = g(x) = g(x) = g(x) = x 4x ydy y 4x 4 x De forma aáloga, a f.d.p. margal de y, chamada aqu de h(y), será dada por: h(y) = 4xydx h(y) = y Exemplo 5..4 Dada a f.d.p. cojuta do exemplo 5.., determe a probabldade de x estar etre,3 e,7. Como só se pedu a probabldade de x, utlzaremos a f.d.p. margal de x:,7 P(,3<x<,7) =,3 xdx = [ ], 7, 3 x =,7,3 =,49,9 =,4
111 Exemplo 5..5 Dada a f.d.p. cojuta do exemplo 5.., determe as f.d.p. codcoas de x e y. 9 A probabldade codcoal para dos evetos A e B quasquer é dada por: P(A B) = P(AeB) P(B) A probabldade da tersecção (do e ) é a própra probabldade cojuta, sto é, a probabldade de x e y é obtda pela f.d.p. cojuta. Portato a f.d.p. codcoal de x (dado y), que será represetada por f x y é dada por: f x y = f ( x, y) h( y) No caso da f.d.p. cojuta do exemplo 5.., temos: 4xy f x y = y f x y = x Da mesma forma para a f.d.p. codcoal de y (dado x), deomada f y x, temos: f ( x, y) f y x = g( x) 4xy f y x = x f y x = y Note que: f x y = g(x) e f y x = h(y) Ou seja, as probabldades codcoas são guas às ão codcoas. Portato, x e y são varáves depedetes. Repare que, para esta fução, é válda a gualdade: Já que: f(x,y) = g(x)h(y) (5..) 4xy = x.y Igualdade esta (5..) que é válda sempre 43 que as varáves forem depedetes. 43 O que é demostrado o apêdce 5.B
112 Assm sedo, uma maera de verfcar se as varáves em uma f.d.p. cojuta são depedetes é verfcar se esta fução pode ser fatorada em uma fução só de x e outra só de y, ou seja, se for possível separar x e y. Exemplo 5..6 Dada a f.d.p. do exemplo 5.. determe E(x) Podemos calcular o valor esperado de x dretamete da f.d.p. cojuta. De um modo geral, temos, de maera aáloga às f.d.p. com uma úca varável: + + E(x) = xf ( x, y) dxdy E para o caso partcular da f.d.p. apresetada o exemplo 5.., temos: E(x) = xf ( x, y) dxdy E(x) = x 4xydxdy E(x) = y E(x) = E(x) = E(x) = E(x) = 4 x dxdy 4 3 x y 3 4 ydy E(x) = 3 y 4 3 dy Ou podemos utlzar smplesmete a f.d.p. margal de x, cálculo que cuja forma geral é: + E(x) = x g( x) dx E para o caso específco deste exemplo: E(x) = x xdx E(x) = x dx
113 E(x) = E(x) = E(x) = 3 3 x 3 3 Exemplo 5..7 Dada a f.d.p. do exercíco 5.., determe a varâca de x. De ovo, podemos calcular a varâca dretamete da f.d.p. cojuta, que, de forma aáloga às f.d.p. de uma úca varável é dada por: var(x) = [ x E( x)] f ( x, y) dxdy = x f ( x, y) dxdy - f (, ) x x y dxdy Sedo o últmo termo ada mas do que uma ova forma para uma já cohecda expressão (méda dos quadrados meos o quadrado da méda). Ou podemos utlzar, como fzemos para a esperaça de x, utlzar dretamete a fução margal: var(x) = [ x E( x)] g( x) dx = x g( x) dx - g( ) x x dx Como já calculamos a méda o exemplo ateror, fcamos com a últma expressão: + var(x) = x g( x) dx - Que, este exemplo, será: var(x) = x g( x) dx - var(x) = 4 x xdx var(x) = x dx x var(x) = 4 4 var(x) = var(x) = g( ) x x dx 3
114 Exemplo 5..8 Dada a f.d.p. do exemplo 5.., determe cov(x,y): Lembrado que: cov(x,y) = E[(x-E(x) E(y-E(y)] = E(xy) E(x)E(y) O que, para uma f.d.p. cojuta, pode ser escrto como: + + cov(x,y) = ( x E( x))( y E( y)) dxdy = xyf ( x, y) dxdy xg( x) dx + - y h( y) dy Como já calculamos aterormete a méda de x (e é fácl ver que esta será gual à méda de y), fcamos com a seguda expressão que, para este exemplo, será dada por: cov(x,y) = xy 4xydxdy cov(x,y) = 4 y x dxdy - 9 cov(x,y) = cov(x,y) = x 4 y dy y dy y 4 cov(x,y) = cov(x,y) = cov(x,y) = cov(x,y) = O que, dga-se de passagem, já era um resultado esperado, tedo em vsta que se tratam de varáves depedetes, como já fo vsto aterormete. Exemplo 5..9 Dada a fução: B( x + y ), para < x < e < y < f(x,y) =, demas valores a) determe o valor da costate B de modo que a fução dada seja uma f.d.p. b) determe as f.d.p. margas de x e y. c) determe as f.d.p. codcoas de x e y. d) x e y são varáves aleatóras depedetes? e) calcule P(x<,5 y =,5). a) Para ser uma f.d.p. deve obedecer à codção:
115 3 + + f ( x, y) dxdy = E, como o exemplo 5.., tato x como y varam etre e : f ( x, y) dxdy = x + ( y ) dxdy B = x + ( y ) dxdy B = B 3 x 3 + y x dy = ( y ) dy = 3 B + 3 B y + y = 3 3 B + = 3 3 B = 3 B = 3 b) Para ecotrar a f.d.p. margal de x, tegramos (somamos) em y: 3 g(x) = ( x + y ) dy = x y = (x + ) 3 + y 3 E, da mesma forma, para a f.d.p. margal de y: x 3 h(y) = ( x + y ) dx = + y x = ( + y ) 3 3 c) As f.d.p. margas de x e y serão dadas por: f x y = f ( x, y) h( y) = 3 ( x + y ) 3 ( + y ) 3 = x + y + y 3
116 4 f y x = f ( x, y) g( x) = 3 ( x + y ) 3 ( + x ) 3 = x + y + x 3 d) As varáves x e y são depedetes, já que, pelos resultados obtdos os tes aterores: f x y g(x) f y x h(y) e Mas esta coclusão já podera ser trada ates mesmo da resolução dos tes b e c, já que é mpossível fatorar a fução x + y em uma fução só de x e outra só de y. e) Para calcular a probabldade pedda, usamos a f.d.p. codcoal de x (dado que y =,5). por: x + = x + x + x + y f x y=,5 = = 4 = 4 = (x + ) + y Neste caso a probabldade de x ser meor do que,5 (dado que y é gual a,5) será dada P(x<,5 y =,5) = ( x + ) dx = 7 4,5 7 3 x 3 + x 4,5 = ( + ) =, Exemplo 5.. Com a f.d.p. do exemplo 5..9, determe E(x y =,5) Do exemplo ateror, temos que: f x y=,5 = (x + ) 7 4 A esperaça codcoal de x será dada por: E(x y = y ) = + xf x y O que, este exemplo, sera calculado como se segue: dx E(x y =,5) = x ( x + ) dx E(x y =,5) = ( x E(x y =,5) = x + x E(x y =,5) = x) dx
117 3 E(x y =,5) = E(x y =,5) = 4 5 Exemplo 5.. Dada a fução: f(x,y) = C, para < x < y <, demas valores Determe o valor da costate C para que esta fução seja uma f.d.p. Aqu devemos tomar o cudado de que os lmtes de tegração são dferetes pos, embora x e y varem de a, há que se otar que x a verdade va de a y (se y é gual a, etão x va de a mesmo, mas se y for, por exemplo,,34, x va de a,34). Portato, os lmtes de tegração quado tegramos em relação a x devem ser e y. Uma vez elmado x, os lmtes de tegração para y são mesmo e. Assm, aplcado a codção de que a soma de todas as probabldades deve ser gual a : y Cdxdy = [ Cx ] y dy = Cydy = y C = C = C = Repare que a ordem em que as varáves são tegradas, mesmo este caso, ão é mportate. Se qusermos tegrar prmero em relação a y, devemos otar que y va de x a e, uma vez elmado y, x vara de a. x Cdydx = [ ] Cy x dx =
118 6 ( C Cx) dx = Cx Cx = C C = C = C = Exemplo 5.. Supoha que x e y são duas varáves aleatóras depedetes, com dstrbução ormal, detcamete dstrbuídas (mesma méda e mesmo desvo padrão 44 ). Determe a f.d.p. cojuta para estas duas varáves. por: Em se tratado de varáves cuja dstrbução é ormal, as f.d.p. de cada uma delas é dada g(x) = h(y) = x µ ( ) σ e πσ y µ ( ) σ e πσ Como são varáves depedetes, temos: f(x,y) = g(x)h(y) f(x,y) = x µ ( ) σ e πσ y µ ( ) σ e πσ x µ y ( ) ( σ σ f(x,y) = e πσ [( x µ ) + ( y µ ) ] σ f(x,y) = e πσ Esta é uma f.d.p. de uma dstrbução ormal bvarada (ode as varáves são depedetes). µ ) 44 Já que a méda e o desvo padrão defem uma dstrbução ormal.
119 Exercícos 7. Dadas as dstrbuções de probabldade abaxo, determe: a) as dstrbuções margas de X e Y b) as probabldades peddas: b.) P(X =) b.) P(Y = ) b.3) P(X =) b.4) P(X = e Y = -) b.5) P(X = 3 e Y = ) b.6) P(X = Y =-) b.7) P(X = Y =) b.8) P(Y = X = ) c) se X e Y são varáves depedetes (justfque). d) E(X), E(Y), var(x), var(y), covar(x,y) e ρ XY. e) E(X Y = -); E (Y X = ). f) var (X Y =) ) Y X 3 - /8 /8 /8 /8 /8 /8 /8 ) Y X 3 - /8 /8 /8 /8 /8 /8 /8 Eucado para os exercícos a 4: supoha que o aalsta do texto trabalhasse para um tme de futebol, em vez de um tme de vôle. Ele defe, etão, três varáves para os três prmeros jogos: X é o úmero de potos do tme (3 potos para vtóra, para empate); Y é o úmero de vtóras; Z é o úmero de vezes em que o resultado de um jogo é o mesmo do ateror (por exemplo, para três vtóras segudas, Z=; para uma vtóra, um empate e uma derrota, Z=).. Numa tabela, mostre a dstrbução cojuta e as margas de X e Y. Calcule a covarâca de X e Y e determe se são varáves depedetes. 3. Numa tabela, mostre a dstrbução cojuta e as margas de Y e Z. Calcule a covarâca de Y e Z e determe se são varáves depedetes. 4. Numa tabela, mostre a dstrbução cojuta e as margas de X e Z. Calcule a covarâca de X e Z e determe se são varáves depedetes. 5. Uma ura cotem 8 bolas, 4 vermelhas e 4 bracas, umeradas, respectvamete, de a 4 e 5 a 8. Para três bolas sorteadas, sem reposção, defa X como o úmero de bolas vermelhas e Y como sedo para úmero ímpar e para úmero par. a) Determe a dstrbução cojuta de X e Y b) Determe as dstrbuções margas de X e Y. c) X e Y são depedetes? d) Calcule E(X), E(Y). e) Calcule var(x), var(y). f) Calcule a covarâca e o coefcete de correlação etre X e Y. 6. Dada a dstrbução de probabldade cojuta: K L -,,,5,5,,,5,5, a) determe as dstrbuções margas de K e L.
120 b) determe o valor esperado de K e L. c) determe a covarâca de K e L. d) K e L são varáves aleatóras depedetes? e) determe E(K L=) e E(L K=) Dadas as dstrbuções de probabldade abaxo, preecha o espaço vazo com o valor aproprado e determe as dstrbuções margas. a) W Z 3 /9 /9 /9 /9 /9 /3 /9 b) F G 4 6,,, 3,5,5 5,5,,5 8. Dada a f.d.p. cojuta do exemplo 5.., determe as probabldades abaxo: a) P(,<x<,7) b) P(,<y<,4) c) P(x>,5) d) P(y<,8) e) P(x<,7 e y>,) f) P(,<x<,3 e,4<y<,8) g) P(x<,9 y =,) h) P(y>,6 x =,45) 9. Dada a f.d.p. cojuta do exemplo 5.., determe: a) E(x) b) E(y) c) var(x) d) var(y) e) covar(x,y). Dada a f.d.p. cojuta do exemplo 5..6, determe as probabldades abaxo: a) P(,3<x<,8) b) P(,<y<,3) c) P(x<,6) d) P(y>,7) e) P(x<,4 e y>,3) f) P(,<x<,5 e,3<y<,9) g) P(x>,3 y =,) h) P(y<,5 x =,4). Dada a f.d.p. cojuta do exemplo 5..6, determe: a) E(x) b) E(y) c) var(x) d) var(y) e) covar(x,y). Dada a f.d.p. cojuta do exemplo 5..7, determe:
121 a) as f.d.p. margas de x e y. b) as f.d.p. codcoas de x e y. c) E(x) d) E(y) e) var(x) f) var(y) g) covar(x,y) 9 3. Determe o valor da costate A em cada uma das fuções abaxo de tal modo que elas sejam f.d.p. Ax y, para - < x < e < y < a) f(x,y) =, demas valores b) f(x,y) = c) f(x,y) = d) f(x,y) = e) f(x,y) = A( x + y ), para < x < e - < y <, demas valores ( x+ y) Ae, para x > e y >, demas valores A, para 3 < x < 7 e - < y <, demas valores A, para ( x e y x) ou ( x, demas valores e y x) 4. Dada a f.d.p. cojuta abaxo: 6x y, para < x < e < y < f(x,y) =, demas valores Determe: a) as f.d.p. margas de x e y. b) as f.d.p. codcoas de x e y c) se x e y são depedetes. d) P(x>,4) e) P(y<,8) f) P(x<, e y>,3) 5. Dada a fução abaxo: B( x xy), para < x < e -x < y < x f(x,y) =, demas valores a) Determe o valor de B para que f(x,y) seja uma f.d.p. b) Determe as f.d.p. margas e codcoas de x e y
122 c) Calcule E(y x = ). 6. Se defrmos as varáves X e Y como se segue: X = se o eveto A ocorre, e em caso cotráro Y = se o eveto B ocorre, e em caso cotráro Se P(A) e P(B) são ão ulas, mostre que, este caso, se o coefcete de correlação etre X e Y for gual a zero, etão X e Y são depedetes. 7. Supoha x e y duas varáves aleatóras depedetes com dstrbução ormal e méda e desvo padrão dados, respectvamete, por e (para x) e e (para y). Determe a f.d.p. cojuta de x e y. 8. Supoha w e z duas varáves aleatóras depedetes com dstrbução expoecal e méda dadas, respectvamete, por,5 e,75. Determe a f.d.p. cojuta de w e z.
123 APÊNDICE 5.B Tópcos Adcoas em Dstrbução Cojuta 5.B. Probabldade codcoal Algum letor mas descofado pode ter suspetado da valdade, por exemplo, da expressão abaxo para o caso de dstrbuções cotíuas: P(x>,5 y =,5) =? E a suspeta é válda, já que P(y = y ) = para qualquer valor de y quado se trata de uma dstrbução cotíua. Uma probabldade codcoal, este caso, só podera ser defda quado a codção fosse também um tervalo (e ão um poto), sto é, sera alguma cosa do tpo: P(a<x<b c<y<d) =? Que sera dada por: P(a<x<b c<y<d) = P[( a < x < b) e ( c < y < d) ] P( c < y < d) O umerador da fração acma sara automatcamete de uma (dada) f.d.p. cojuta: P[(a<x<b) e (c<y<d)] = d b c a f( x, y) dxdy Já o deomador é obtdo pela f.d.p margal de y, que por sua vez é dada por: + h(y) = f ( x, y) dx Portato, a expressão o deomador será: d + P(c<y<d) = f( x, y) dxdy = h (y)dy c Fazedo: c = y e d = y + y d c Temos que a desgualdade c<y<d colapsa em y=y quado d se aproxma de c, sto é, quado y se aproxma de (tede a) zero. Portato, podemos terpretar a probabldade codcoal com uma gualdade a codção como um caso lmte do caso geral: lm d c P(a<x<b c<y<d) = lm y P(a<x<b c<y<d) = P(a<x<b y = y ) Mas, do cálculo dferecal, sabemos que tomar o lmte para y equvale à dervada em relação a y o poto em questão, o caso y.
124 O deomador etão, será dado por: lm y P(c<y<d) = lm y O que equvale a: y + y h y ( y) dy lm y y + y y h ( y) dy = y y h ( t) dt Que é uma dervada de uma fução defda por uma tegral que é o própro valor da fução a ser tegrada, calculada o poto y, sto é: lm y P(c<y<d) = y y h ( t) dt = h(y ) Da mesma forma, para a expressão o umerador temos: lm y P[(a<x<b) e (c<y<d)] = lm y lm y P[(a<x<b) e (c<y<d)] = lm y P[(a<x<b) e (c<y<d)] = y b y b a a y + y b y a f( x, t) dxdt f( x, y ) dx f( x, y) dxdy por: Portato, a probabldade codcoal (com a codção equvaledo a um poto)será dada P(a<x<b y = y ) = b a f( x, y h( y ) dx ) E, como h(y ) é uma costate em relação a x, podemos escrever: b f ( x, y ) P(a<x<b y = y ) = dx h( y ) Falmete, defdo: a f x y (x,y ) = f ( x, y h( y ) ) Temos o cálculo da probabldade codcoal como fo feto o texto: P(a<x<b y = y ) = b f x y ( x, y ) a dx Portato, como um caso lmte do caso geral em que a codção é um tervalo.
125 3 5.B. Idepedêca em uma Dstrbução Cojuta Nesta seção vamos demostrar (o caso cotíuo) que a expressão (5..) é válda se, e somete se, as varáves x e y são depedetes. f(x,y) = g(x)h(y) Se as varáves são depedetes, etão é váldo que: f x y = g(x) f y x = h(y) (5.B..) (5.B..) Mas, pela defção de codcoal, temos que: Logo: f ( x, y) f x y = h( y) f(x,y) = f x y h(y) Substtudo pela equação (5.B..): f(x,y) = g(x)h(y) Como queríamos demostrar. 5.B.3 Valor Esperado de uma Esperaça Codcoal O título desta seção fo propostalmete elaborado de modo a evtar a redudâca, pos podera perfetamete ser a esperaça da esperaça codcoal. Problemas semâtcos a parte, faz setdo falarmos sso se levarmos em cota que a esperaça codcoal abaxo é fução do valor de x. E(Y X = x) O valor esperado desta esperaça codcoal é a méda cosderado todos os possíves valores de x: E[E(Y X)] = E(Y X = x ) P(X = x ) + E(Y X = x ) P(X = x ) E(Y X = x ) P(X = x ) Ou, o caso cotíuo: + E[E(Y X)] = E(Y X)g(x)dx E como: + E(Y X) = yf dy Y X Temos que:
126 4 + E[E(Y X)] = y f Y X g( x) dxdy Mas, pela própra defção de f.d.p. codcoal, temos que: f Y X g(x) = f(x,y) Chegamos a: + E[E(Y X)] = y f( x, y) dxdy = E(Y) Portato, o valor esperado da esperaça codcoal de Y é o própro valor esperado de Y B.4 Dstrbução de probabldade com 3 varáves Uma f.d.p cojuta para 3 varáves será uma fução f: ú 3 ú com as segutes propredades: f(x,y,z) para todo x,y,z ú e f ( x, y, z) dxdydz = E, com ela, podemos calcular a probabldade abaxo: f d b P(a<x<b e c<y<d e e<z<f) = f ( x, y, z) dxdydz e c a As f.d.p. margas são dadas por: + + g(x) = f ( x, y, z) dydz h(y) = f ( x, y, z) dxdz k(z) = f ( x, y, z) dxdy - E as f.d.p. codcoas são dadas por: + f ( x, y, z) dz - f x y = h( y) E, de maera aáloga para y e z. Note, que é possível defr uma f.d.p. cojuta apeas para varáves, por exemplo: + G(x,y) = f ( x, y, z) dz 45 A demostração fo feta para o caso cotíuo, mas o resultado também é váldo para o caso dscreto.
127 E mesmo uma f.d.p codcoal ode a codção seja dada por duas varáves: 5 f x y e z = + f ( x, y, z) f ( x, y, z) dx Note que, de maera aáloga, é possível trabalhar com dstrbuções com um úmero qualquer de varáves.
128 6
129 CAPÍTULO 6 ESTIMAÇÃO 7 6. O que é ferêca estatístca? Iferêca é algo que todo mudo (ou, pelo meos, muta gete) já fez a vda. Ao se cozhar, por exemplo: para ver se um molho está bom, já o poto para ser servdo, ão é ecessáro prová-lo por tero, basta uma colheradha. Ao fazer um exame de sague, ão é ecessáro (ada bem!) trar o sague tero. Tato o caso do molho, como o sague, a formação sobre o todo é extraída de um pedaço. Nem sempre é tão smples assm, já que, às vezes, o todo sobre o qual queremos uma formação é mas complcado, mas heterogêeo do que o molho, por exemplo. Numa pesqusa para as teções de voto para prefeto, ão basta o pesqusador tomar as opões somete dos moradores dos Jards (se for em São Paulo), de São Corado (se for o Ro) ou a Boa Vagem (se for em Recfe). O resultado da eleção estes barros, tedo em vsta serem regões de reda elevada, pode ser (e muto provavelmete será) dferete do resultado em barros mas pobres. A pesqusa só servra para termos uma déa da teção de voto aqueles barros, e ão a cdade como um todo. Quado o problema é, etão, um pouco mas complcado do que o do molho, ecesstamos de ferrametas estatístcas. É a sso que chamamos de ferêca estatístca 46. Na ferêca estatístca o todo é deomado população; o pedaço é deomado amostra. Portato, a ferêca estatístca trata de, a partr da amostra, obter-se formações da população. 6. Estmadores Se desejamos cohecer alguma cosa sobre uma determada população, por exemplo: a méda de dade; a varâca da reda; o percetual de teções de voto para um determado caddato e esta população é composta de mlhares (às vezes, mlhões) de elemetos (este caso, pessoas, mas podera ser qualquer cosa), de tal modo que sera muto dfícl pesqusar o valor correto, pos sera vável pesqusar todos os elemetos. Neste caso, temos que recorrer aos valores ecotrados em uma amostra. Numa cdade como São Paulo, há mlhões de habtates, cerca de 5 mlhões de eletores. Para uma pesqusa eletoral, são ouvdas uma, duas, três ml pessoas. O úmero de elemetos a amostra geralmete é muto pequeo quado comparado com o da população. Quado é assm, dzemos que a população é fta 47. Repare que, o que é às vezes muto dfícl, por uma questão de úmero, pode ser mpossível. Image uma pessoa que va prestar um exame vestbular para uma faculdade. Ela pode estar ervosa o da e sso va prejudcar o seu desempeho. Ou a prova abrageu, em sua maora, tópcos que ela tha estudado melhor, o que etão fez com que seu desempeho fosse acma do esperado. Qual devera ser o seu desempeho verdadero, ou se preferr, o seu desempeho médo? É uma perguta para a qual ão há resposta pos, para respodê-la, precsaríamos de 46 Ou estatístca ferecal, sto é, a parte da estatístca ode se faz ferêca, dferetemete da estatístca descrtva (vsta a prmera parte) que é usada para a descrção de uma população. 47 Porque, em termos prátcos, ão faz dfereça se a população é cco mlhões, dez mlhões, um blhão ou... fta! Quado a amostra represeta uma fração mportate da população, algus aspectos devem ser cosderados, o que faremos um pouco mas adate.
130 ftas (ou, pelo meos, um úmero muto grade) de repetções deste expermeto que, por defção, ão va se repetr uca. Não adata utlzarmos a ossa amostra o desempeho desta pessoa o vestbular do ao que vem, pos é outra stuação (um ao a mas de estudo, por exemplo). Há stuações em que, mesmo ão cado a armadlha do exemplo dado o parágrafo ateror (em que só é possível obter uma amostra com um elemeto), ada assm é mpossível obter a população completa : dgamos que gostaríamos de obter o preço médo dos móves em um determado barro. Para cada veda, é possível que o vededor seja habldoso e cosga um valor superor ao que ormalmete sera obtdo; ou mesmo que o comprador pechche e cosga um preço mas vatajoso. Para obter o valor correto (populacoal) sera precso que calculássemos a méda de todas as trasações possíves de ocorrer o que, evdetemete, ão está dspoível, ada que tehamos as formações de todas as trasações que foram efetvamete realzadas. Seja qual for o caso (muto dfícl ou mpossível de pesqusar a população tera), o fato é que, em mutos casos, precsamos obter as formações de uma amostra. O valor da população, chamado de parâmetro populacoal, é descohecdo. O que é possível de se obter é um valor da amostra, que supostamete os dá uma déa do valor correto (populacoal) do parâmetro. Este valor amostral é chamado de estmador do parâmetro populacoal. Por exemplo, queremos saber a méda de dade dos estudates uverstáros a cdade de São Paulo. Como há mutos estudates, recorremos a uma amostra de, dgamos elemetos. A méda da amostra ecotrada fo de aos, etão esta é a ossa estmatva 48 para a méda de dade de todos os estudates uverstáros. Mas a méda de dade dos uverstáros é realmete aos? Não dá para saber, a ão ser que todos os estudates uverstáros fossem pesqusados. Portato, são cosas dferetes o parâmetro populacoal e o estmador e, portato, devem ser represetados de maera dferete, por exemplo: µ = méda populacoal (parâmetro populacoal) X = méda amostral (estmador) E ão é só uma dfereça de valores. Equato o parâmetro populacoal é, em geral, um valor fxo, o estmador depede da amostra, portato está assocado a uma dstrbução de probabldade, assm sedo, é uma varável aleatóra. Apeas como uma regra geral para a omeclatura, adotaremos a segute coveção. Se o parâmetro populacoal for θ, o estmador 49 será θ ). A méda, por ser um parâmetro especal, receberá tratameto dferete e será chamada como defmos acma. Já sabemos que o estmador ão é gual ao parâmetro populacoal. É precso (ou, pelo meos, é desejável), o etato, que ele ateda a algumas propredades. 6.3 Estmadores ão vesados A prmera propredade (desejável) de um estmador que veremos é a de que este estmador, a méda, acerte o valor correto. Ou seja, se pudéssemos repetr a experêca (por exemplo, a 48 Não cofudr: estmador é a varável; estmatva é o valor ecotrado para esta varável, sto é, o valor ecotrado para o estmador esta amostra. 49 Há que se fazer uma dstção, pos se tratam de cosas dferetes, mas ão ecessaramete precsa ser esta. Há autores que chamam o parâmetro populacoal por uma letra grega (por exemplo, θ) e o estmador por uma letra lata correspodete (por exemplo, T). 8
131 da méda de dade dos uverstáros) um úmero de vezes muto grade (fto), o valor médo das estmatvas ecotradas em cada expermeto sera o valor correto do parâmetro populacoal. Resumdo: E(θ ) ) = θ A esperaça do estmador deve ser o parâmetro populacoal, o prmero acerta, em méda, o valor do últmo. Se sto ocorre, dzemos que o estmador é ão vesado 5. Se, etretato, o estmador erra, em méda, dzemos que ele é vesado, e a dfereça etre a sua méda e o valor verdadero do parâmetro é chamado de vés: θ ) é vesado E(θ ) ) = θ + vés Fca uma perguta: a méda amostral é um estmador ão vesado da méda amostral? Para respodê-la, vejamos o exemplo abaxo Exemplo 6.3. Tomemos uma população cuja dstrbução é muto smples: uma cdade ode metade da população tem,8m (os altos ) e a outra metade tem,6m (os baxos ). Sem saber dsso, um pesqusador quer saber qual a méda de altura da população da cdade e utlza para sso uma amostra de 5 elemetos. Se soubesse como a população é dstrbuída, fcara fácl para ele (pos a méda pode ser faclmete calculada, é,7 m). Como o pobre cotado ão sabe, ele pode, uma amostra de 5 pessoas, ecotrar 3 possbldades dferetes, que são lstadas a tabela abaxo (ode A represeta altos e B represeta baxos ): 9 tabela 6.3. amostra ecotrada BBBBB BBBBA BBBAB BBABB BABBB ABBBB BBBAA BBAAB BAABB AABBB BBABA BABBA ABBBA BABAB ABBAB ABABB BBAAA BABAA méda amostral,6 m,64 m,64 m,64 m,64 m,64 m,68 m,68 m,68 m,68 m,68 m,68 m,68 m,68 m,68 m,68 m,7 m,7 m 5 Há quem prefra o termo ão tedecoso.
132 3 BAABA BAAAB ABBAA ABAAB ABABA AABAB AAABB AABBA BAAAA ABAAA AABAA AAABA AAAAB AAAAA,7 m,7 m,7 m,7 m,7 m,7 m,7 m,7 m,76 m,76 m,76 m,76 m,76 m,8 m Repare que, em ehuma das amostras, o valor populacoal (,7m) fo obtdo. Mas a questão é: em méda, chega-se o valor correto? Lstadas as possbldades 5, verfcamos que delas a méda é,6m; em 5, a méda é,64m; em,,68m; para,7m há também possbldades; 5 possbldades para,76m e, em uma delas, a méda ecotrada será,8m. Portato, a méda das médas será dada por: E( X ) =,6 + 5,64 +,68 +,7 + 5,76 +,8 3 =,7m Portato, pelo meos este caso, a méda amostral é um estmador ão vesado da méda populacoal. Isto é váldo sempre? Sm! Uma méda amostral (qualquer) é dada por: X= X = = X + X X Para sabermos se este estmador é, ou ão, vesado, devemos calcular a sua esperaça: X E(X) = E( + X X ) Pelas propredades da esperaça matemátca, temos que: E(X ) = E(X + X X ) E(X) = [E(X ) + E(X ) E(X )] 5 Sera absolutamete ecessára a motagem da tabela 6.3. para que ecotrássemos estes valores?
133 Mas qual é a esperaça de X (ou de X, X 3, etc.)? Ates de sortearmos os elemetos da amostra, o valor esperado de seu valor, já que ão sabemos qual elemeto será escolhdo é a própra méda populacoal 5. Assm sedo: 3 E(X) = [µ + µ µ] E(X) = [µ] E(X ) = µ Portato, a esperaça da méda amostral é (sempre) gual à méda populacoal, o que equvale a dzer que a méda amostral é um estmador ão vesado da méda populacoal. Exemplo 6.3. (méda poderada) Dado o estmador para a méda M defdo abaxo, determe se ele é um estmador vesado e, caso seja, determe o vés. X + 3X M = 5 Trata-se de uma méda poderada (com pesos e 3) para uma amostra de elemetos. Isto sgfca que o prmero elemeto a ser sorteado a amostra tem peso meor do que o segudo. Apesar dsso, o estmador M também é ão vesado, como é possível mostrar: X 3X E(M ) = E( + ) 5 E(M ) = [E(X ) + E(3X )] 5 E(M ) = 5 [E(X ) + 3E(X )] E(M ) = 5 [µ + 3µ] E(M ) = 5 [5µ] E(M ) = µ Portato, M é um estmador ão vesado da méda populacoal (apesar da poderação). Exemplo (professor muto rgoroso) Dado o estmador para a méda M defdo abaxo, determe se ele é um estmador vesado e, caso seja, determe o vés. M = = X + 5 Por exemplo, o caso da cdade dos altos e baxos como metade da população é de cada tpo, há gual probabldade de, ao sortearmos os elemetos de uma amostra qualquer, ecotrarmos um alto ou baxo. Sedo assm, a altura esperada para o elemeto da amostra é (,6+,8)/ =,7m, que é a própra méda populacoal.
134 Este é um estmador em, em vez de dvdrmos pelo úmero de elemetos da amostra, dvdmos por um a mas. É como se, por exemplo, para a méda fal de 3 provas, fossem somadas as otas e dvddas por 4; ou, se fossem 4 provas, dvddas por 5. Claramete este procedmeto joga a méda para baxo. Calculemos a esperaça de M : X = E(M ) = E( ) + E(M ) = + E( X ) = E(M ) = + E(X + X X ) E(M ) = + [E(X )+ E(X ) E(X )] E(M ) = [µ + µ µ] + µ E(M ) = µ + Portato, M é um estmador vesado da méda populacoal µ e o vés é dado por: vés(m ) = E(M ) µ µ vés(m ) = µ + µ ( + ) µ vés(m ) = + µ vés(m ) = + O vés é egatvo pos, como já fo dto, este estmador joga para baxo a méda. 6.4 Varâca de estmadores - estmadores efcetes Não basta que um estmador acerte a méda. É desejável que, além dsso, o estmador seja o mas precso possível, ão dsperse muto ou, em outras palavras, teha a meor varâca possível. Um estmador é dto absolutamete efcete, ou smplesmete efcete se: for ão vesado; etre os estmadores ão vesados, apresetar a meor varâca. Portato, para cohecermos as propredades de um estmador, covém que sabamos calcular a sua varâca. Para a méda amostral, a varâca será dada por: X + X X var( X) = var( ) Pelas propredades da varâca, temos que: 3
135 33 var( X) = var(x + X X ) Se supusermos que cada um dos X são depedetes um do outro, o que é bastate razoável a maora dos casos, tedo em vsta que, se, por exemplo, estvermos calculado a méda amostral das dades de algumas pessoas, a dade da prmera pessoa sorteada ão afetará a dade da seguda, assm como a dade da seguda ão afetará a da tercera e assm sucessvamete. Nesta hpótese de depedêca 53 as covarâcas etre X e X j, ( j) são ulas e, assm sedo, podemos calcular a varâca da soma como sedo a soma das varâcas. var( X) = [var(x ) + var(x ) var(x )] E, da mesma forma como fzemos para a esperaça, a varâca que se espera de um elemeto que será sorteado de uma população cuja varâca é dada por σ, será o própro σ. var( X ) = [σ + σ σ ] var( X) = σ σ var( X ) = Portato, a méda amostral depede da varâca da população, o que é lógco, pos, mage que a população em questão sejam as craças matrculadas o a sére do eso fudametal em uma cdade em que, por cocdêca, todas as craças têm a mesma dade. A varâca populacoal da dade é zero. E qualquer que seja o tamaho da amostra, o valor da méda amostral será gual ao da méda populacoal, portato terá varâca zero também. E também depede do tamaho da amostra. Se a amostra for de tamaho o que sgfca, a prátca que a méda será gual aos valores da varável em questão (dade, por exemplo) e, desta forma, a varâca da méda amostral será gual à varâca populacoal. σ = var( X) = = σ Por outro lado, se a amostra cocde com a população, o valor da méda amostral também cocde com a méda populacoal (e é exato!) e portato a varâca é ula. Como estamos cosderado que a população é muto grade (fta), etão uma amostra que cocde com a população correspode a um tededo a fto. var( X ) = lm σ = Exemplo 6.4. Dado o caso da cdade dos altos e baxos do exemplo 6.3. e cosderado uma méda amostral σ obtda a partr de uma amostra de 5 elemetos, verfque que é válda a expressão var( X) =. 53 Dzemos, este caso, que os X são depedetemete dstrbuídos.
136 34 Nesta cdade temos metade dos habtates com,6m e metade com,8m. A varâca populacoal é dada por: σ = var(x) =,5 (,8,7) +,5 (,6,7) σ =,5 (,) +,5 (,) σ =, Cosderado todas as médas amostras obtdas o exemplo 6.3., a varâca da méda amostral será dada por: var( X) = var( X ) =, (,6,7) + 5 (,64,7) + (,68,7) + (,7,7) + 5 (,76,7) + (,8,7) 3 Que é exatamete o valor de σ dvddo por 5 (o tamaho da amostra). σ, var( X) = = 5 =, Exemplo 6.4. Determe a varâca do estmador M apresetado o exemplo X + 3X M = 5 Vmos, o exemplo 6.3., que este é um estmador ão vesado, assm como a méda amostral. A sua varâca será dada por: X + 3X var(m ) = var( ) 5 Pelas propredades de varâca, temos que: var(m ) = var(x + 3X ) 5 E, cosderado que X é dstrbuído depedetemete: var(m ) = [var(x ) + var(3x )] 5 var(m ) = [4var(X ) + 9var(X )] 5 var(m ) = [4σ + 9σ ] 5 3 var(m ) = σ =,5 σ 5 Repare que, para uma amostra de elemetos (que é o caso deste estmador), a varâca da méda amostral será dada por:
137 35 σ var( X) = =,5 σ Portato, embora ambos os estmadores sejam ão vesados, a méda amostral é um estmador melhor do que M, já que possu uma varâca meor. Não dá para afrmar etretato, que X seja um estmador efcete da méda amostral. Para sso, precsaríamos compará-lo com todos os estmadores ão vesados da méda populacoal. É possível, etretato, demostrar que, se a varável X segue uma dstrbução ormal 54, a méda amostral ( X ) é um estmador efcete da méda populacoal. Se ão sabemos ada sobre a dstrbução de X, só dá para dzer que X é relatvamete mas efcete do que M. Portato, etre dos estmadores ão vesados, dzemos que é relatvamete mas efcete aquele que apresetar meor varâca. Mas, e se comparamos dos estmadores quasquer? Para sso, usamos o erro quadrátco médo. Defmos o erro quadrátco médo como sedo a méda da dfereça etre o valor do estmador e do parâmetro ao quadrado. Assm, para um estmador θˆ,temos: EQM(θˆ ) = E(θˆ -θ) Desevolvedo esta expressão, temos: EQM(θˆ ) = E(θˆ - θ θˆ + θ ) Usado as propredades da esperaça, vem: EQM(θˆ ) = E(θˆ ) E(θ θˆ ) + E(θ ) E, como θ é o parâmetro populacoal e é, portato, uma costate: EQM(θˆ ) = E(θˆ ) θe(θˆ ) + θ Somado e subtrado [E(θˆ )], obtemos: EQM(θˆ ) = E(θˆ ) [E(θˆ )] + [E(θˆ )] θe(θˆ ) + θ Os dos prmeros termos da expressão acma correspodem à varâca de θˆ, equato os três últmos formam um quadrado perfeto: EQM(θˆ ) = var(θˆ ) + [E(θˆ ) θ] E a expressão etre colchetes é o vés do estmador θˆ. Assm sedo: EQM(θˆ ) = var(θˆ ) + [vés(θˆ )] Ou seja, o erro (ao quadrado) do estmador tem dos compoetes : o estmador erra o valor do parâmetro em fução do quato vara (sua varâca) e ada, quado for o caso, pelo fato de ão acertar a méda (ser vesado). 54 Através da desgualdade de Cramer-Rao.
138 Para dos estmadores quasquer, θˆ e θˆ, se θˆ tem meor erro quadrátco médo do que θˆ, etão θˆ é relatvamete mas efcete do que θˆ. Note que, para dos estmadores ão vesados, dzer que o erro quadrátco médo é meor equvale a dzer que a varâca é meor (já que o vés é ulo). Exemplo Determe qual dos estmadores da méda dados abaxo é relatvamete mas efcete X 3X M = + 5 X + X M 3 = 3 Para sabermos qual dos estmadores é relatvamete mas efcete precsamos calcular o erro quadrátco médo de cada um 55. Para o estmador M, já sabemos que ele ão é vesado e sua varâca fo determada o exemplo EQM(M ) = var(m ) + [vés(m )] EQM(M ) = var(m ) + EQM(M ) =,5σ + EQM(M ) =,5σ Para o estmador M 3, prmeramete devemos verfcar se é um estmador ão vesado: X X E(M 3 ) = E( + ) 3 E(M 3 ) = E(X + X ) 3 E(M 3 ) = 3 (µ + µ) E(M 3 ) = 3 µ Portato, M 3 é um estmador vesado, e seu vés é dado por: vés(m 3 ) = E(M 3 ) - µ vés(m 3 ) = 3 µ - µ vés(m 3 ) = - 3 µ E sua varâca é: X + X var(m 3 ) = var( ) 3 var(m 3 ) = var(x + X ) 9 var(m 3 ) = 9 (σ + σ ) Repare que o estmador M 3 é um caso partcular do estmador M apresetado o exemplo 6.3.3, bastado substtur por.
139 37 var(m 3 ) = 9 σ Desta forma, o erro quadrátco médo do estmador M 3 será dado por: EQM(M 3 ) = var(m 3 ) + [vés(m 3 )] EQM(M 3 ) = 9 σ + [- 3 µ] EQM(M 3 ) = 9 σ + 9 µ Como podemos ver, ão dá para dzer qual dos dos é relatvamete mas efcete sem que sabamos os verdaderos valores de σ e µ. Se, por exemplo, µ =, teremos: EQM(M 3 ) = 9 σ =,...σ < EQM(M ) E, portato, este caso, M 3 sera um estmador relatvamete mas efcete do que M. Mas, de um modo geral, ão cohecemos o verdadero valor de σ (varâca populacoal), assm como também descohecemos o valor correto de µ (méda populacoal). Para estmarmos µ podemos utlzar a méda amostral que, como já vmos, é um estmador ão vesado e efcete (se a dstrbução for ormal) da méda populacoal. Etretato, ão temos ada um estmador para a varâca populacoal σ. 6.5 Estmador para a varâca varâca amostral Assm como procedemos para a méda, o óbvo sera que o estmador da varâca fosse a varâca calculada a amostra, sto é: ˆ σ = = (X X) A prmera questão que surge é: este estmador ( σ ) é um estmador ão vesado da varâca populacoal (σ )? Vejamos: E( ˆ σ ) = E = (X X) E( ˆ σ ) = E[ (X X) ] = Façamos um pequeo artfíco: somemos e subtraímos a méda populacoal (µ): ˆ
140 E( ˆ σ ) = E[ (X - µ + µ - X) ] = Temos aí um quadrado da soma ode cosderamos o prmero termo como sedo X - µ e o segudo µ - X. E( ˆ σ ) = E[ = (X - µ) + = (X - µ)(µ - X) +( µ - X) ] Como, para qualquer valor do ídce, µ e X têm sempre o mesmo valor, podemos escrever: E( ˆ σ ) = E[ (X - µ) + (µ - X)(X - µ) + (µ - X) ] E sabemos que: Portato: Ou: = = (X ) = X E( ˆ σ ) = E[ (X - µ) + (µ - X)(X - µ) + (µ - X) ] = E( ˆ σ ) = E[ (X - µ) (µ - X)(µ - X) + (µ - X) ] = = E( ˆ σ ) = E[ (X - µ) (µ - X ) + (µ - X ) ] = E( ˆ σ ) = E[ (X - µ) (µ - X) ] = E, uma expressão elevada ao quadrado, o sal o teror dos parêteses ão mporta, portato podemos verter o sal da seguda expressão sem problemas E( ˆ σ ) = E[ (X - µ) ( X -µ) ] = Aplcado a esperaça a expressão, vem: E( ˆ σ ) = {E[ (X - µ) ] E( X-µ) } = E, como a esperaça da soma é a soma das esperaças, temos que: = 38 E( ˆ σ ) = [ = E(X - µ) E( X-µ) ] Mas, pela própra defção de varâca: E(X - µ) = var(x) = σ E( X-µ) = var( X) = σ e
141 Portato: E( ˆ σ ) = [σ σ - ] 39 ˆ E( σ ) = [σ - σ ] ˆ E( σ ) = σ (-) ˆ E( σ ) = - σ σ Cocluímos etão que o estmador ˆ σ é um estmador vesado da varâca populacoal σ. Isto etretato, pode ser faclmete corrgdo se utlzarmos um estmador para a varâca (que chamaremos de S ) tal que: S = S = S = ˆ σ - (X X) = - = (X - X) E podemos verfcar que S é um estmador ão vesado da varâca populacoal σ pos: E(S ) = E(S ) = E( ˆ σ ) - - σ = σ - Portato, para obtermos um estmador ão vesado da méda amostral, devemos dvdr por - e ão por. Qual é a razão dsso? A resposta está o artfíco que utlzamos para a demostração, de somar e subtrar a méda populacoal (µ). Não temos a méda populacoal, mas a méda amostral, ou seja, a méda que utlzamos o cálculo da varâca é, ela própra, um estmador. Repare que, se soubéssemos a méda verdadera, o estmador ˆ σ ão sera vesado. Image que escolhêssemos uma amostra de apeas um elemeto, o que é perfetamete vável para a méda (ada que ão muto acoselhável), mas torara mpossível uma estmação ão vesada para a varâca, pos o valor de ˆ σ sera sempre zero para qualquer amostra de qualquer população, o que claramete é vesado. Em outras palavras, só faz setdo estmarmos a varâca em uma amostra que tem, o mímo, dos elemetos. Assm sedo, de agora em date, quado falarmos de varâca amostral, ou de estmador da varâca, estaremos os referdo a S, a ão ser que seja explctamete dto o cotráro. Exemplo 6.5. Em uma fábrca ode trabalham mutas pessoas, fo pergutado a cco delas o seu saláro. As respostas foram R$., R$., R$.5, R$ 8 e R$ 7. Determe a méda amostral, a varâca amostral e a varâca da méda amostral.
142 4 A méda amostral é dada por: X = = R$. 5 A varâca amostral (S ) é: S ( ) + ( ) + (5 ) = 4 S = 95. σ E a varâca da méda amostral sera dada por σ, utlzaremos 56 seu estmador S. + (8 ) + (7 ), mas, como ão cohecemos o valor de var( X) = S = 95 = Melhor estmador lear ão vesado. Uma tercera propredade desejável de um estmador é que ele seja um MELNV (melhor estmador lear ão vesado 57 ). Para ser um MELNV o estmador tem que: ser ão vesado; ser lear; etre os estmadores leares e ão vesados, apresetar a meor varâca. Um estmador é lear se for obtdo através de uma combação lear das observações da amostra. Por exemplo, o estmador X ~ mostrado abaxo é lear: X ~ = a X = a X + a X a X = Se cada um dos a for uma costate. Claramete a méda amostral é um estmador lear, pos é um caso partcular do X ~ exposto acma ode: a = a =... = a = E, dga-se de passagem, é um MELNV, pos ão há outro estmador lear com meor varâca. 56 E, portato, a varâca da méda amostral a ser calculada é, a verdade, um estmador da varâca da méda amostral. 57 Há quem prefra a sgla MELNT (trocado o vesado por tedecoso ) ou mesmo a sgla em glês BLUE (best lear ubased estmator).
143 Os cocetos de estmador efcete e MELNV são parecdos. De fato, se um estmador efcete for lear, será um MELNV. Mas um estmador que seja MELNV pode ão ser efcete se houver um estmador ão vesado e ão lear que apresete varâca meor. Pode-se dzer, etretato, que um estmador MELNV é um estmador efcete detro da classe dos estmadores leares (sto é, apreseta meor varâca etre os estmadores leares, mas ão ecessaramete etre todos). Resumdo as propredades vstas até agora I) Estmador ão vesado É aquele que a méda, acerta : E(θˆ ) = θ II) Estmador efcete É aquele que, etre os estmadores ão vesados, apresetar meor varâca. III) Melhor estmador lear ão vesado (MELNV) É aquele que, etre os estmadores leares e ão vesados, apresetar meor varâca Propredades asstótcas estmadores asstotcamete ão vesados Todas as três propredades vstas aterormete se aplcam a qualquer tamaho de amostra e, em partcular, a amostras pequeas. Quado a amostra cresce (tede ao fto), há propredades desejáves que seram aplcáves este caso. As propredades dos estmadores quado o tamaho da amostra tede para o fto são chamadas de propredades asstótcas. A prmera propredade que vmos é a de que um estmador seja ão vesado. Há estmadores que, embora vesados, quado a amostra cresce, o vés dmu, sto é, ele va desaparecedo à medda que o tamaho da amostra aumeta. Estes estmadores são chamados de asstotcamete ão vesados. Um estmador é dto asstotcamete ão vesado se: lm E(θˆ ) = θ É claro que, se o estmador for ão vesado, será asstotcamete ão vesado. A recíproca ão é verdadera, como poderemos ver os exemplos abaxo. Exemplo 6.7. Verfque que o estmador M do exemplo é asstotcamete ão vesado. X = M = + Como vmos o exemplo 6.3.3, este estmador é vesado, pos sua esperaça é dada por: E(M ) = µ + Mas, quado a amostra cresce, temos que:
144 4 lm E(M ) = lm µ = µ + Pos, quado é muto grade, é pratcamete gual a +. Portato, embora M seja um estmador vesado da méda, é um estmador asstotcamete ão vesado. Isso equvale a dzer que, a prátca, se a amostra é grade, tato faz dvdr por ou + porque a dfereça será muto pequea (ula, quado tede a fto). Exemplo 6.7. Verfque que ˆ σ é um estmador asstotcamete ão vesado da varâca populacoal. Como vmos a seção 6.5 ˆ σ é um estmador vesado da varâca, já que: - E( ˆ σ ) = σ Mas, se tomarmos o lmte para tededo ao fto: ˆ lm E( σ ) = lm - σ = σ E, sedo assm, ˆ σ é um estmador asstotcamete ão vesado de σ. De ovo, quado a amostra é grade, é pratcamete rrelevate se dvdmos por ou Estmadores cosstetes Um estmador é dto cosstete se, à medda que a amostra cresce, ele va covergdo para o valor verdadero do parâmetro. Ou seja, quado o tamaho da amostra va aumetado, o vés (se exstr) va sumdo e a varâca também. Pode-se dzer que um estmador cosstete é aquele que colapsa o valor verdadero do parâmetro quado o tamaho da amostra va para o fto. Um estmador θˆ será cosstete se: lm E(θˆ ) = θ e lm var(θˆ ) = A méda amostral é um estmador cosstete da méda, pos é um estmador ão vesado e: σ lm var( X ) = lm = Da mesma forma, podemos verfcar que os estmadores dos exemplos 6.7. e 6.7. são cosstetes. Uma maera alteratva de verfcar se um estmador é cosstete é através do erro quadrátco médo. Como o erro quadrátco médo é composto da varâca e do vés ao quadrado, o estmador θˆ será cosstete se: lm EQM(θˆ ) =
145 Esta é uma codção sufcete 58, mas ão ecessára. Ou seja, se o erro quadrátco médo teder a zero com o aumeto da amostra, sto mplca que o estmador é cosstete, mas a recíproca ão é verdadera. Por sorte, os casos em que sto ocorre (o erro quadrátco médo ão va para zero, mas o estmador é cosstete) são raros 59. Exemplo 6.8. Verfque se o estmador da méda M 4 dado abaxo é ão vesado e cosstete. 43 M 4 = X + ( -) X = Vejamos se ele é, ou ão, vesado: E(M 4 ) = E[ X + X ] ( -) = E(M 4 ) = E( X ) + E[ X ] ( -) = E(M 4 ) = E(X ) + ( -) E(X + X X ) E(M 4 ) = E(X ) + ( -) [E(X )+ E(X 3 ) E(X )] E(M 4 ) = µ + ( -) [µ + µ µ] E(M 4 ) = µ + ( -) (-)µ E(M 4 ) = µ + µ = µ Portato M 4 é um estmador ão vesado da méda. E, como ele é ão vesado, o erro quadrátco médo cocde com a varâca. EQM(M 4 ) = var(m 4 ) = var( X + ( -) EQM(M 4 ) = var( X ) + var( ( -) EQM(M 4 ) = var(x ) + 4 4( -) EQM(M 4 ) = σ + 4 4( -) EQM(M 4 ) = σ + (-)σ 4 4( -) X = X = ) var(x + X X ) (σ + σ σ ) ) 58 Também se dz, quado esta codção é válda, que o estmador apreseta cosstêca do erro quadrado. A cosstêca do erro quadrado mplca cosstêca, mas em sempre (embora quase sempre) um estmador cosstete apresete cosstêca do erro ao quadrado. 59 São estmadores para os quas a varâca ou a méda da dstrbução asstótca ão exstem.
146 EQM(M 4 ) = 4 σ + 4( -) σ 44 Quado tomamos o lmte para tededo ao fto: lm EQM(M 4 ) = lm [ 4 σ + 4( -) σ ] O segudo termo va para zero, pos tem - o deomador, mas o mesmo ão ocorre com o prmero termo. Desta forma: lm EQM(M 4 ) = 4 σ Portato, M 4 ão é cosstete 6, ada que seja ão vesado. Isto podera ser percebdo sem a ecessdade de cálculos, tedo em vsta que, o prmero elemeto a ser sorteado a amostra (X ), tem peso 5%, ão mportado o tamaho da amostra. Portato, ada que o vés ão exsta, por maor que seja a amostra a varâca ão rá desaparecer, tedo em vsta o peso desproporcoal que tem o prmero elemeto da amostra (depededo de quem car prmero, o valor de M 4 será dferete, ada que a amostra seja muto grade). Vmos etão duas propredades asstótcas: I) Estmador asstotcamete ão vesado: lm E(θˆ ) = θ II) Estmador cosstete: Aquele que colapsa o verdadero valor do parâmetro quado a amostra aumeta. Codção sufcete: se lm EQM(θˆ ) = etão θˆ é cosstete. 6.9 Le dos Grades Números A Le dos Grades Números (LGN) dz que, quado a amostra cresce (tede a fto) a méda amostral coverge para a méda populacoal. Isto é, quato maor a amostra, mas o valor obtdo pela méda amostral estará próxmo do valor correto da méda. Repare que a LGN equvale à afrmação de que a méda amostral é um estmador cosstete da méda populacoal. 6. Teorema do Lmte Cetral Retomemos o exemplo 6.3. (aquele da cdade dos altos e baxos ). Com amostras de 5 elemetos, vmos que há 3 possbldades (já que só há dos resultados possíves para cada elemeto da amostra), sedo estas possbldades lstadas a tabela abaxo: méda amostral obtda o de possbldades,6 m,64 m 5,68 m,7 m 6 A rgor, ão fo demostrado que ele ão é cosstete pos, como fo dto, a codção do erro quadrátco médo é ecessára, ão sufcete.
147 45,76 m 5,8 m Estes resultados podem ser represetados um hstograma: Se aumetarmos o tamaho da amostra para 6, as possbldades 6 passam a ser (verfque!): méda amostral obtda o de possbldades,6 m,63 m 6,67 m 5,7 m,73 m 5,77 m 6,8 m O hstograma será etão: Se aumetarmos o tamaho da amostra para, dgamos, =, o hstograma 6 passa a ser: 6 Num total de 64 = 6. 6 Agora teríamos um total de 4 (= ) possbldades.
148 Algo famlar? Pos é, à medda que o tamaho da amostra aumeta, mas o hstograma que represeta a dstrbução da méda amostral se aproxma de uma ormal. De fato, é sso que dz o teorema do lmte cetral: Teorema do Lmte Cetral(TLC): dada uma varável X,..d (depedete 63 e detcamete 64 dstrbuída) com méda µ e varâca σ, a méda amostral X segue (desde que a amostra seja σ sufcetemete grade) uma dstrbução ormal com méda µ e varâca, qualquer que seja a dstrbução de X. Se padrozarmos a varável X, ou seja, subtrarmos a méda e dvdrmos pelo desvo padrão, (lembrado que o desvo padrão será dado por X - µ (X - µ) = σ σ σ = σ ), obteremos: E assm, podemos escrever o TLC em uma úca seteça matemátca: (X - µ) D N(, ) σ Ode a seta com o D em cma se lê coverge em dstrbução. Portato, a seteça (X - µ) acma pode ser lda como coverge em dstrbução para uma ormal com méda zero e σ desvo padrão um. Motamos os hstogramas baseado-se a ossa cdade estraha apresetada o exemplo 6.3., mas o resultado sera o mesmo qualquer que fosse a dstrbução utlzada. O TLC os permte dzer que, se for méda, é ormal. Quato ao tamaho de amostra sufcetemete grade, é comum se utlzar uma receta de bolo, de que devemos ter uma amostra de o mímo 3 elemetos. Na verdade, o que devemos levar em cota é que a dstrbução da méda amostral é aproxmadamete uma ormal e que esta aproxmação é tão melhor quato maor for a amostra. Se partrmos de uma amostra muto pequea, ão é que a aproxmação ão seja válda, mas será muto grossera. 63 Sgfca que os dversos X são depedetes us dos outros. 64 Sgfca que os mesmos parâmetros da dstrbução (seja ela qual for) se aplcam a todos os X.
149 Exemplo 6.. Uma varável X tem méda gual a e varâca gual a 44. Qual a probabldade de que, uma amostra com 36 elemetos, ecotremos uma méda amostral superor a. Sabemos que: E(X ) = 44 var(x) = = 4 36 E, pelo TLC, sabemos que a méda amostral segue uma dstrbução ormal com méda e desvo padrão (= 4 ). Queremos saber a probabldade de X ser maor do que. Padrozado (para podermos cosultar a tabela), temos: Z = Portato: 6. População fta =,5 P(X > ) = P(Z >,5) =,5 -,95 =,385 = 3,85% Por população fta etede-se, a prátca, por uma população cujo tamaho é comparável com amostra a ser estudada. No caso de uma pesqusa eletoral em que ml, dos ml eletores são pesqusados em uma população de mlhões, a amostra é muto pequea em relação à população. Esta ão é, a rgor, fta mas, para efetos prátcos, é como se fosse. O mesmo ão ocorre se, dgamos, em uma escola com aluos, tomamos uma amostra de 5, ou em uma fazeda com cabeças de gado, utlzamos uma amostra de. No prmero caso, a amostra represeta 5% da população; o segudo, %; é em casos como estes que cosderamos a população como sedo fta. Mas qual é a dfereça? É que, quado calculamos a varâca da méda amostral, assummos que a varâca esperada de cada elemeto da amostra é gual a varâca populacoal σ. Ocorre que, quado retramos o prmero elemeto da amostra, a varâca dos que sobram fo alterada. Portato, a varâca esperada do segudo elemeto da amostra (bem como de todos os outros) ão será σ. Se a população é fta (a prátca, se for muto maor do que a amostra), a retrada de um elemeto ão terá efetos sobre a varâca dos demas. Repare que este racocío da população fta ão se aplca se a amostra for retrada com reposção. Portato, se a população for fta ou mesmo se for fta, desde que a amostra seja retrada com reposção, é válda a expressão: var(x) = σ Agora, se a população for fta e a amostra retrada sem reposção, esta expressão precsa ser corrgda. Se a população tem tamaho gual a N, a varâca da méda amostral será dada por: 47
150 48 σ N - var(x) = N - Repare que, se o tamaho da amostra () é muto pequeo em relação ao tamaho da N - população (N), o fator de correção é pratcamete gual a, e desta forma a expressão da N - varâca da méda amostral é pratcamete a mesma da utlzada quado a população é fta. E, se o tamaho da amostra é gual ao da população ( = N), a méda amostral é gual a méda populacoal e a varâca de X é ula. Exemplo 6.. Numa classe de 5 aluos, são escolhdos, ao acaso, 5 aluos para realzar um teste, cujas otas vão de a, para aferr o aprovetameto da turma. Se o desvo padrão hstórco desta turma em testes deste tpo é, determe a varâca e o desvo padrão da méda amostral este teste. Como se trata de uma população fta e a amostragem é feta sem reposção e, assumdo que o desvo padrão populacoal se matém o valor hstórco, temos: σ N - var(x) = N var(x ) = var(x) = 5 49 var(x) 6,45 dp(x) σ = var( X) ˆ X ˆ σ = 6,45 X ˆ σ 5,4 6. Estmação por máxma verossmlhaça X O prcípo da estmação por máxma verossmlhaça 65 é o segute: se soubermos qual é a dstrbução de probabldade da população 66, os valores dos parâmetros a serem estmados serão aqueles que maxmzarão a chace (a probabldade, a verossmlhaça) de que os valores obtdos a amostra sgam, de fato, a dstrbução em questão. Dgamos que uma varável aleatóra x tem uma fução desdade de probabldade dada por: f.d.p. de x = f(x ; θ k ) Nesta otação, depos do poto e vírgula temos os parâmetros da fução. Isto é, f é uma fução dos valores de x (até aí, ehuma ovdade), dados os parâmetros da dstrbução, θ k, supostamete cohecdos. 65 Verossmlhaça = qualdade do que é verossíml. 66 E sto é uma codção absolutamete ecessára para que possamos fazer uma estmação por máxma verossmlhaça.
151 Por exemplo, para uma dstrbução ormal, os parâmetros são a méda e a varâca (ou o desvo padrão). Se cohecermos ambos, dado um certo valor de x, é fácl calcular o valor de f. E se ão cohecermos os parâmetros. Temos os valores de x, que obtemos de uma amostra, e precsarmos estmar os parâmetros. Isto é, temos os valores de x, portato a fução agora depede dos parâmetros θ. Quado é assm, a fução passa a ser chamada de fução de verossmlhaça: fução de verossmlhaça = L(θ k ; x ) 49 A estmação por máxma verossmlhaça cosste em achar os valores dos parâmetros θ k que maxmzem a fução de verossmlhaça ou, em outras palavras, que maxmze a probabldade de que a amostra perteça de fato, a uma população cuja dstrbução de probabldade tem fução de desdade 67 dada por f. Exemplo 6.. Uma varável aleatóra x tem dstrbução ormal (depedetemete dstrbuída) com méda e varâca descohecdas. Dada uma amostra {x, x,..., x }, determe os estmadores de máxma verossmlhaça para a méda e a varâca. Se a dstrbução é ormal, etão a fução de verossmlhaça terá a mesma forma fucoal de uma ormal multvarada 68 : Ode exp(x) e x. L(µ, σ ; x ) = (πσ ) exp[ σ = ( µ ) ] x Os valores de µ e σ serão obtdos pela maxmzação da fução de verossmlhaça L. Mas esta fução é um pouquho complcada. Para smplfcar o osso trabalho, lembramos que uma fução quado sofre uma trasformação mootôca 69 crescete, a fução resultate terá os mesmos potos de máxmo e/ou mímo. Tomemos, etão, o logartmo de L: l(µ, σ ; x ) l[l(µ, σ ; x )] = l{ exp[ σ (πσ ) l(µ, σ ; x ) = l ( ) ( x µ ) σ = (πσ ) l(µ, σ ; x ) = l ( πσ ) σ l(µ, σ ; x ) = l ( πσ ) σ = ( µ = x ) ( µ x ) = ( µ ) ]} x 67 Note que a fução de verossmlhaça e a f.d.p. têm a mesma cara, sto é, a mesma forma fucoal, vertedo-se a lógca: equato a f.d.p. é uma fução dos valores da varável aleatóra x, sedo dados os parâmetros, a fução de verossmlhaça é uma fução dos parâmetros, sedo dados os valores de x. 68 Ver capítulo Sempre crescete ou sempre decrescete.
152 Para ecotrarmos o poto de máxmo desta fução, devemos ecotrar as dervadas de l em relação a µ e σ. Dervado em relação a µ, vem: l = ( x ˆ) µ = µ σ = = ( ˆ) µ = x x = ˆµ = = E, como µ é uma costate: x = µˆ = µˆ = x = Ou seja, o estmador de máxma verossmlhaça da méda de uma dstrbução ormal é a própra méda amostral x. Dervado em relação a σ e já cludo o resultado acma, vem: l = σ ˆ σ + ( x 4 x) = 4 ˆ σ = ˆ σ + ( x x) = ˆ σ = = = ( x x) Portato, o estmador de máxma verossmlhaça para σ é, como já vmos, vesado. Coclu-se que o fato de o estmador ser de máxma verossmlhaça ão garate que ele seja ão vesado. Os estmadores de máxma verossmlhaça têm, etretato, algumas propredades muto útes: são cosstetes; têm dstrbução asstótca ormal; são asstotcamete efcetes 7. Exemplo 6.. Uma varável aleatóra x tem dstrbução uforme. Dada uma amostra {x, x,..., x }, determe os estmadores de máxma verossmlhaça para os parâmetros da dstrbução. 5 7 Esta propredade será dscutda o apêdce 6.B.
153 Uma dstrbução uforme apreseta uma fução desdade f(x) =, para a x b. Os b a parâmetros a serem ecotrados são justamete a e b, que são os valores mímo e máxmo, respectvamete, que a varável x pode apresetar. Os valores da amostra que têm a maor chace de ser estes valores são justamete o mímo e o máxmo valor ecotrado a amostra. Assm, os estmadores de máxma verossmlhaça para a e b são: â = m {x, x,..., x } bˆ = max {x, x,..., x } Exemplo 6..3 Uma varável aleatóra x tem dstrbução Bomal com parâmetro p. Em uma amostra de N elemetos, Y apresetaram o atrbuto sucesso. Determe o estmador de máxma verossmlhaça para p. O valor amostral para p que dá a maor chace desta amostra pertecer a uma população com estas característcas é justamete a proporção amostral. O estmador de máxma verossmlhaça será, portato: pˆ = N Y 5
154 Exercícos. Para as amostras dadas abaxo, determe a méda amostral, a varâca amostral e a varâca da méda amostral: a) {; 4; 6; 9; } b) {,6;,8;,9;,;,5;,7} c) {; ; 3; 6; 9; 7; 4} Eucado para os exercícos a 6: A varável aleatóra X tem méda µ e varâca σ. Um pesqusador resolve utlzar os segutes estmadores para a méda: X + X M = 4 3X 4X M = + 7. Determe quas estmadores são vesados e o vés, se houver. 3. Determe a varâca dos estmadores. 4. Determe o erro quadrátco médo dos estmadores. 5. Supoha que a µ =. Qual dos estmadores é relatvamete mas efcete? 6. Supoha agora que µ = e σ =. Agora, qual é o estmador relatvamete mas efcete. Eucado para os exercícos 7 a 3: A varável aleatóra X tem méda µ e varâca σ. Um pesqusador resolve utlzar os segutes estmadores para a méda: M 3 = = X - M 4 = X + = X - 7. Determe quas estmadores são vesados e o vés, se houver. 8. Determe a varâca dos estmadores. 9. Determe o erro quadrátco médo dos estmadores.. Supoha que a µ =. Qual dos estmadores é relatvamete mas efcete?. Supoha agora que µ = e σ = 3. Agora, qual é o estmador relatvamete mas efcete.. Determe quas estmadores são asstotcamete ão vesados. 3. Determe se os estmadores apresetam cosstêca do erro quadrado. 5
155 53 4. Uma varável aleatóra X tem méda e desvo padrão 6. Determe a méda e a varâca de uma varável Y defda a partr de uma amostra de elemetos da varável X como se segue: Y = X = 5. Uma varável aleatóra X tem méda 9 e desvo padrão. Determe a méda e a varâca de uma varável W defda a partr de uma amostra de 5 elemetos da varável X como se segue: W = 5 = 5 = X 6. Uma varável aleatóra X tem méda e varâca 64. Determe a probabldade de que, em uma amostra de 49 elemetos, a méda amostral seja feror a Uma varável aleatóra X tem dstrbução de Posso com parâmetro 9. Determe a probabldade de que, em uma amostra de 36 elemetos, a méda amostral esteja etre 8 e. 8. Uma varável aleatóra X tem dstrbução bomal em que a proporção de sucessos é,8. Determe a probabldade de que, em uma amostra de elemetos, ecotremos meos de 75 sucessos. 9. Em uma classe de 5 aluos, fo retrada uma amostra de 5. As otas destes aluos foram, respectvamete, 7, 5, 3, 8 e 5. Determe a méda amostral, a varâca amostral e a varâca da méda amostral. Utlze a amostra abaxo para os exercícos a : {5, 3, 8, 9, 3, 35,, 33, 6, 7}. Supoha que esta amostra fo retrada de uma população cuja dstrbução é Normal. Estme os parâmetros da dstrbução por máxma verossmlhaça.. Supoha que esta amostra fo retrada de uma população cuja dstrbução é uforme. Estme os parâmetros da dstrbução por máxma verossmlhaça.. Supoha que esta amostra fo retrada de uma população cuja dstrbução é expoecal. Estme os parâmetros da dstrbução por máxma verossmlhaça. 3. Assale verdadero ou falso. a) A méda amostral é um estmador vesado para a méda populacoal quado a amostra é muto pequea. b) A méda amostral é um estmador efcete para a méda populacoal. c) Embora ˆ σ seja um estmador vesado para a varâca populacoal, sua varâca é meor do que a de S. d) Todo estmador ão vesado é cosstete. e) Todo estmador vesado é cosstete. f) Todo estmador cosstete é ão vesado. g) Todo estmador efcete é ão vesado. h) Dados dos estmadores, um deles vesado e outro ão, este últmo será sempre preferível.
156 ) Dados dos estmadores, um deles vesado e outro ão, este últmo terá sempre meor erro quadrátco médo. j) A varâca da méda em uma população fta é gual a de uma população fta desde que a amostragem teha sdo feta com reposção. k) Para se fazer uma estmação por máxma verossmlhaça é ecessáro saber qual é a dstrbução populacoal. l) Um estmador de máxma verossmlhaça é sempre ão vesado. m) Um estmador de máxma verossmlhaça é sempre cosstete. ) A le dos grades úmeros garate que a méda amostral segue uma dstrbução asstótca Normal. o) A le dos grades úmeros garate que a méda amostral é um estmador cosstete da méda amostral. p) a méda amostral segue uma dstrbução Normal para qualquer tamaho de amostra. 54
157 Apêdce 6.B Covergêcas e mas propredades de estmadores 55 6.B. Covergêcas Dado um estmador θˆ de um parâmetro populacoal θ. Como vmos o texto, se: lm P( θˆ θ < ε) = Dz-se que θˆ coverge em probabldade para θ ou: θˆ P θ Se o estmador θˆ coverge para θ de outra forma, como mostrado abaxo: P(lm θˆ = θ) = Dz-se que θˆ apreseta covergêca quase certa para θ, ou covergêca com probabldade para θ, que é represetado por: θˆ QC θ Note que a covergêca quase certa mplca a covergêca em probabldade, mas a recíproca ão é verdadera. Isto é, a covergêca quase certa é mas forte do que a covergêca em probabldade. No caso da méda amostral como estmador da méda populacoal: vmos que a Le dos Grades Números estabelece que a méda amostral coverge para a méda populacoal à medda que a amostra cresce. A Le dos Grades Números, etretato, aparece em duas versões, de acordo com o tpo de covergêca. A Le Fraca dos Grades Números estabelece que a méda amostral coverge em probabldade para a méda populacoal, equato a Le Forte dos Grades Números estabelece que a méda amostral coverge quase certamete para a méda populacoal. LGN versão fraca: X P µ LGN versão forte: X QC µ Como é óbvo, as codções para que se verfquem a Le Forte são mas restrtas. Para que se verfque a Le Fraca, basta que os X ( =,,..., ) sejam uma seqüêca de úmeros aleatóros com varâca fta, mas ão ecessaramete depedetes. Para que se verfque a Le Forte, é ecessáro que os X sejam IID (depedetes e detcamete dstrbuídos). 6.B. Efcêca asstótca No texto defmos duas propredades asstótcas desejáves de estmadores: ser asstotcamete ão vesado e cosstêca. Para um estmador θˆ de um parâmetro populacoal θ, defmos a varâca asstótca como:
158 56 var-ass(θˆ ) = lm E[ (θˆ lm E(θˆ ))] O que, o caso de estmadores asstotcamete ão vesados se reduz a: var-ass(θˆ ) = lm E[ (θˆ θ)] O estmador θˆ tem a propredade de efcêca asstótca se: apreseta dstrbução asstótca com méda e varâca ftas; é cosstete; etre os estmadores cosstetes de θ for aquele que apresetar meor varâca asstótca.
159 57
160 CAPÍTULO 7 INTERVALO DE CONFIANÇA E TESTES DE HIPÓTESES 7. Itervalo de cofaça A cada aos (ormalmete), os acostumamos a acompahar as pesqusas eletoras. Geralmete elas são mostradas assm: Caddato Iteção de voto João da Slva 35% Mara Aparecda 3% José Severo 6% E, ormalmete, temos uma afrmação adcoal: a famosa margem de erro da pesqusa. Supohamos que, para o caso da pesqusa acma, ela seja de potos percetuas para cma ou para baxo, o que vale dzer que o caddato João da Slva tem etre 33% e 37% das teções de voto, equato Mara Aparecda tem etre 3% e 34%. Portato, embora o mas provável é que o caddato João da Slva esteja gahado, é possível que ele teha 33% dos votos equato sua adversára dreta teha 34%, estado assm ela, e ão ele, a frete da corrda eletoral. Em resumo, ão dá para afrmar quem está a frete, é o famoso empate técco etre os caddatos. Mas dá para ter certeza que João da Slva tem o mímo 33% dos votos e o máxmo 37%? Ora, essa formação fo obtda através de uma amostra que, ada que grade, é pequea em relação ao total da população. Mesmo que a amostragem teha sdo feta de maera correta, é possível (por mas que seja pouco provável) que a amostra coteha, por cocdêca, um úmero exageradamete grade (ou pequeo) de eletores do referdo caddato. Assm, falta uma formação referete ao quato estes valores, mesmo que cludo a margem de erro, são cofáves 7. Costrur um tervalo de cofaça ada mas é do que estabelecer uma margem de erro para um estmador e calcular o grau de cofaça correspodete a esta margem. Ou, como é mas comum, estabelecdo um grau de cofaça, calcular a margem de erro que correspoda a esta cofaça. Como se faz sso? É ecessáro que se coheça a dstrbução de probabldade do estmador. Exemplo 7.. Numa amostra de estudates fo ecotrada uma dade méda de 3, aos. Sabedo-se que a varâca das dades é 5, costrua um tervalo de 95% de cofaça para a méda. Pelo Teorema do Lmte Cetral vsto o capítulo ateror, sabemos que a méda segue uma dstrbução que se aproxma da ormal (e é um tamaho de amostra sufcetemete grade). A varâca da méda amostral, como também sabemos do capítulo ateror, é dada por: var( X ) = var(x) 7 Nem sempre esta formação é omtda quado da dvulgação das pesqusas. Por vezes, esta formação pode ser ecotrada a mpresa escrta (embora dfclmete a machete). 58
161 Ou, se qusermos abrevar mas a otação: 59 σ = X σ E o desvo padrão da méda amostral pode ser calculado dretamete por : σ σ σ = X = Cujo valor, este caso será dado por 7 : 5 σ = =,5 X Queremos um tervalo com 95% de cofaça. Como a dstrbução de probabldade é a ormal (que é smétrca), temos que ecotrar o valor a tabela correspodete à área de 47,5%. O valor (para z) de,96 a tabela de dstrbução ormal é,475, portato bem próxmo dos 47,5%. Lembrado que a tabela represeta uma ormal padrozada, sto é, com méda zero e desvo padrão gual a um, para que os valores da méda amostral fquem compatíves com os da tabela devemos subtrar a méda e dvdr pelo desvo padrão. Como sabemos, a méda da méda amostral é a própra méda populacoal (µ) e o seu desvo padrão já calculamos, é gual a,5. Portato, temos que: X - µ =,96 σ X A dfereça é em módulo porque o valor ecotrado para a méda amostral pode estar tato abaxo como acma da méda populacoal. O valor ecotrado para a méda amostral fo 3,. Substtudo, temos: 3, µ =,96,5 3, µ =,5,96 7 Lembrado que, se a varâca populacoal é 5, o desvo padrão populacoal é 5.
162 6 3, µ =,98 Como é em módulo, sto é, a méda pode ser acma ou abaxo de 3,, temos duas possbldades: 3, µ =,98 ou 3, µ =,98 µ =,98 3, µ =,98 3, µ = 3,,98 µ = 3, +,98 µ =, µ = 4,8 Ou seja, a méda populacoal pode estar etre, e 4,8. Repare que estes valores foram obtdos somado-se e subtrado-se,98 da méda amostral calmete obtda (3,). Vale dzer que,98 é a tal da margem de erro, e fo obtda multplcado-se o desvo padrão pelo valor ecotrado a tabela. Portato, o tervalo de cofaça é dado por: IC 95% = [,; 4,8] Com 95% de cofaça, como assalado. Mas o que sgfca sso, afal? Sgfca que, se repetíssemos a experêca (calcular a méda de dade a partr de uma amostra de pessoas) um úmero muto grade (fto) de vezes, em 95% delas o tervalo coterá o valor verdadero da méda populacoal. Não é, a rgor, a probabldade de que o tervalo, uma vez costruído, coteha a verdadera méda populacoal pos, se ele já fo costruído, ou ele cotém ou ão cotém o valor verdadero (seja ele qual for), a probabldade sera um ou zero, respectvamete. Exemplo 7.. Após etrevstar 49 membros de uma categora profssoal, um pesqusador ecotrou um saláro médo de R$ 8. O desvo padrão dos saláros desta categora, cohecdo, é R$ 4. Costrua um tervalo para a méda: a) com 8% de cofaça. Com 8% de cofaça, temos que procurar a tabela metade, sto é, 4%. O valor mas próxmo é,39977 que correspode ao valor de z de,8. Como a méda amostral tem dstrbução aproxmadamete ormal, temos que; ode: X = 8 e 4 σ = X = 49 X - µ =,8 σ X 8 - µ =,8 8 - µ = 5,6
163 A chamada margem de erro é 5,6. Os potos extremos do tervalo de cofaça podem ser ecotrados somado-se e subtrado 5,6 da méda amostral. b) com 9% de cofaça. IC 8% = [794,4; 845,6] Agora temos que procurar a tabela o valor correspodete a 45%. Este valor está etre,64 e,65. De fato, o valor de z é aproxmadamete, µ =, µ = 3,9 E, portato, o tervalo de cofaça é: IC 9% = [787,; 85,9] Acotece aqu um problema de cobertor curto (quado se cobre o pescoço, descobrem-se os pés): se aumetamos o grau de cofaça, a precsão do tervalo ca (a margem de erro aumeta). Como fazer para aumetar tato a precsão do tervalo como a sua cofaça (ou, pelo meos, aumetar uma sem dmur a outra) é precso aumetar o pao do cobertor, sto é, aumetar a amostra. Vejamos o exemplo segute. Exemplo 7..3 Do exemplo ateror, qual é o tamaho de amostra ecessáro para que, matdos os 9% de cofaça, a margem de erro seja de, o máxmo,? Temos que, para 9% de cofaça: Ode: X - µ =,645 σ X σ = X σ Substtudo, temos: X - µ =,645 σ A margem de erro será dada por: σ,645 = 4,645 = 3,3 = 6
164 3,3 = =,55 6 Elevado ao quadrado os dos lados da equação: ( ) = (,55) = 3,59 Como a perguta é qual o tamaho mímo da amostra (e este deve ser um úmero tero), a resposta é 33 elemetos. Exemplo 7..4 (pesqusa eletoral) Em uma pesqusa eletoral, etre eletores, 4 declararam que pretedem votar o caddato A. Costrua um tervalo de 95% de cofaça para as teções de voto para este caddato. Neste exemplo a resposta pedda é exatamete o que é apresetado pelos meos de comucação quado dvulgam uma pesqusa eletoral. O valor (amostral) para a proporção de eletores que desejam votar este caddato é: 4 pˆ = =,4 = 4% Mas é precso calcular a margem de erro para que o resultado (o tervalo de cofaça) seja completo. Para sso precsamos calcular a varâca deste estmador. Como fazê-lo? Supoha que 4% é o valor correto das teções de voto. Isto sgfca que, para cada eletor etrevstado, é como se fosse um jogo ode há 4% deste eletor votar o caddato A e 76% de votar em outros caddatos (cludo aí votos bracos e ulos). Da mesma forma que quado jogamos uma moeda, há 5% de chace de dar cara e 5% de ão dar cara (dar coroa); ou de quado jogamos um dado, há /6 de chaces de car um certo úmero desejado e 5/6 de chaces de ão car. Portato, é como se, cada eletor etrevstado fosse uma dstrbução de Beroull, cuja varâca é calculada, como já vmos, por: σ = p(-p) Ode p é a probabldade de ocorrêca de sucesso (dar cara a moeda, dar 6 o dado ou... ecotrar um eletor que vote o caddato A) e (-p) é a probabldade de ocorrêca do fracasso. Como temos eletores, a proporção ecotrada é, a verdade, uma proporção méda, cuja varâca será dada, a exemplo da méda amostral comum, por 73 : pˆ(- pˆ) var( pˆ ) = Que, este caso, será dada por: 73 Note que, também a exemplo da méda amostral, esta varâca é estmada, já ão cohecemos o valor correto de p.
165 63 var( pˆ ) = E o desvo padrão:,4,76 =,84 dp( pˆ ) =, 84,35 =,35% Já temos o valor do estmador e seu desvo padrão, podemos, portato calcular o tervalo de cofaça da proporção verdadera (populacoal) p (o valor tabelado para 95% é,96): pˆ - p =,96 dp(pˆ) 4 - p,35 =,96 4 p,6% Portato, o tervalo de 95% de cofaça para as teções de voto para o caddato A é: IC 95% = [,4%; 6,6%] Ou, como preferem os meos de comucação, o caddato A tem 4% das teções de voto com margem de erro de,6 potos percetuas, para cma ou para baxo... sto se cosderarmos, evdetemete, 95% de cofaça. 7. Testes de Hpóteses Todo mudo já fez um da a vda... talvez ão com as ferrametas mas adequadas, mas já fez sm. Image uma mea de us, aos 74 que, o tervalo da aula va à lachoete da escola e lá está aquele garoto que sempre olha estraho para ela. Ela va à quadra e lá está o garoto de ovo. Etão ela volta para a classe um pouco ates e advhe quem também voltou? Aí, a mea para e pesa: é muta cocdêca, este garoto gosta de mm! A mea estabeleceu duas hpóteses: a hpótese : o garoto ão gosta dela a hpótese : o garoto gosta dela. Supohamos que fosse verdade a a hpótese. Etão o garoto só estara os mesmos lugares que ela, quado sto ocorresse, por mera cocdêca, ão tecoalmete. Como ele esteve, em 3 lugares dferetes, próxmo à mea durate um curto período de tempo, sto ão deve ser cocdêca, portato a a hpótese deve ser rejetada. Duas observações devem ser fetas: uma é o crtéro do que é cocdêca ou ão. Este é arbtráro. Uma mea que estvesse torcedo para que o garoto gostasse dela podera ser meos rgorosa e acetar que bastaram, dgamos, dos lugares dferetes para que se cosderasse muta cocdêca. Outra podera querer que o feômeo se repetsse em outros das para que se cosderasse muta cocdêca. 74 Talvez meos, hoje em da uca se sabe.
166 A outra é que ada que o racocío esteja correto, é possível que a coclusão seja correta pos, ada que pouco provável, ão é mpossível que o garoto estvesse em todos aqueles lugares por mera cocdêca. Nestes casos, uca dá para ter certeza absoluta. Os testes que vamos fazer, etretato, ão ldam com cosas tão complexas como o coração humao (qualquer que seja a dade). Nos lmtaremos a cosas que possamos medr em úmeros. O método, todava, é parecdo. O prmero passo é estabelecer as duas hpóteses. A a hpótese também é cohecda como hpótese ula (que chamaremos de H ), geralmete é uma gualdade. Isto é, supõe-se que determado parâmetro é gual a um úmero. A seguda hpótese, a chamada hpótese alteratva (que deomaremos de H ) cotradz a hpótese ula de alguma forma, portato é uma desgualdade: pode ser o parâmetro é dferete do úmero, maor do que o úmero ou meor do que o úmero. Podemos ter, etão, três pares de hpóteses possíves um teste para um determado parâmetro θ: 64 ou ou H : θ = θ H : θ θ H : θ = θ H : θ <θ H : θ = θ H : θ >θ Ode θ é um valor qualquer que o parâmetro θ pode assumr. A seguda parte é estabelecer o que é muta cocdêca, sto é, qual a probabldade que será cosderada muta cocdêca. Esta probabldade é cohecda como sgfcâca do teste. Isto sgfca que a realzação do teste depede do cohecmeto da dstrbução de probabldade do parâmetro. Por sso mesmo, quado usamos o prmero par de hpóteses acma, o teste se chama bcaudal, já que dferete pode ser maor ou meor, dcado que serão utlzadas as duas caudas da dstrbução. Quado o teste é feto com um dos dos últmos pares de hpóteses, ele é cohecdo como moocaudal. Tomemos um exemplo bem smples; uma moeda que sste em dar cara. Será que ela é vcada? O prmero passo é estabelecer as hpóteses: se ela ão é vcada, a proporção populacoal de caras é,5. Caso cotráro, é dferete 75. H : p =,5 H : p,5 O segudo passo é estabelecer a sgfcâca do teste ou, em outras palavras, defr o que é muta cocdêca. Arbtraramete escolhemos %. A dstrbução de probabldade aqu é uma bomal. Supohamos que as duas prmeras jogadas, o resultado teha sdo cara. Supodo que a moeda ão fosse vcada, a probabldade dsso ocorrer é: 75 Como já fo estabelecdo que ela está dado mas caras, podera ser utlzada a hpótese de ser maor do que,5. Aí é uma questão de crtéro.
167 65 P( caras) =,5,5 =,5 = 5% O que é bem possível de ocorrer, de acordo com o osso crtéro. Nada os dca que a moeda esteja vcada, fo um resultado absolutamete ormal, é perfetamete possível que a hpótese ula seja verdadera. Costuma-se dzer que a hpótese ula é aceta. Agora, mage que teha dado cara em 3 laçametos da moeda: P(3 caras) =,5,5,5 =,5 =,5% Ou seja, uma moeda ão vcada tem apeas,5% de chace de apresetar este resultado. Mas,5% ão é cosderado muta cocdêca pelo osso crtéro, que é de %. Etão, cotuamos acredtado a hoestdade da moeda, sto é, cotuamos acetado a hpótese ula. Mas supoha que sejam 4 caras segudas: P(4 caras) =,5,5,5,5 =,65 = 6,5% Estabelecemos que % é muta cocdêca. Mas uma moeda ão vcada tera apeas 6,5% de dar este resultado. Etão, a ossa coclusão é de que a moeda ão pode ser hoesta. Rejetamos a hpótese ula de que a moeda tem proporção gual a,5, ou seja, ela é vcada. Como o caso da mea, ada que mprovável, o resultado pode ocorrer (com 6,5% de chaces) mesmo que se trate de uma moeda ão vcada. Note-se que, se o osso crtéro fosse 5%, cotuaríamos acredtado a hoestdade da moeda 76. Exemplo 7.. Afrma-se que a altura méda dos jogadores de basquete que dsputam uma determada lga é,95m. Numa amostra de 36 jogadores, fo ecotrada uma méda de,93m. Sabe-se que o desvo padrão da altura dos jogadores é cm. Teste, com um ível de sgfcâca de %, se a afrmação é verdadera. A hpótese ula deve ser a própra afrmação, sto é, que a méda é,95. A hpótese alteratva é que a afrmação é falsa, ou seja, dferete de,95. H : µ =,95 H : µ,95 Trata-se de um teste bcaudal, portato. Qual a dstrbução de probabldade a ser usada? Estamos falado de méda, o que vale dzer, pelo Teorema do Lmte Cetral, que é uma varável cuja dstrbução é ormal. Se a sgfcâca do teste é % e o teste é bcaudal, etão sso equvale a 5% em cada cauda. Na tabela da dstrbução ormal padrozada, sso equvale a um valor de z de, Se a sgfcâca do teste fosse qualquer valor abaxo de 6,5%, acetaríamos a hpótese ula e, para qualquer valor acma, a rejetaríamos. Este valor (o caso, 6,5%) que dá o lmte etre a acetação e a rejeção, que em sempre é muto fácl de ser calculado sem o auxílo de computadores ou calculadoras, é cohecdo como p-valor ou valor p.
168 66 Cohecda a dstrbução de probabldade, o procedmeto é parecdo com o tervalo de cofaça: vamos costrur um tervalo, supodo que a hpótese ula seja verdadera, que coteha 9% dos possíves valores amostras. Fora deste tervalo, ão é que seja mpossível, mas a probabldade é meor do que %, o que, pelo crtéro estabelecdo (sgfcâca do teste) é muta cocdêca. Temos que: X - µ =,645 σ X Ode µ é (supostamete),95 e o desvo padrão da méda ( σ ) é dado por: σ = X, =, 36 Substtudo, temos: X -,95 =,645, X -,95,33 Portato, os valores que podem ocorrer uma amostra de 36 jogadores, com 9% de probabldade estão etre,95 +,33 e,95,33. Se o valor amostral estver detro deste tervalo, etão acetamos a hpótese ula. Por sso, chamaremos este tervalo de regão de acetação (RA) 77. RA = [,97;,983] O valor amostral fo,93 que está detro da RA, portato acetamos a hpótese ula. Acetar a hpótese ula pode sgfcar que vamos vver a vda como se ela fosse verdade e, de fato, há respaldo para sso. Mas talvez o mas correto fosse dzer que ão é possível rejetar a hpótese ula. Na verdade, é sso que ocorre: pelo valor obtdo a amostra, ão é possível cotestar a formação cal, mas também é possível que o valor verdadero seja um outro. 77 O cojuto dos potos que ão pertecem a regão de acetação são também chamados de regão de rejeção ou regão crítca. X
169 67 Note que é possível fazer o teste de uma outra maera, totalmete equvalete, motado a RA através dos valores da ormal padrozada. A RA em termos dos valores da ormal é: RA = [-,645;,645] E o valor obtdo a amostra (lembrado que X =,93, µ =,95 e σ =,): X X - µ,93,95 = = - σ, X Que pertece à RA, portato acetamos a hpótese ula. Como fo dto, estas duas formas são totalmete equvaletes e vão dar o mesmo resultado. Note que o módulo é desecessáro agora, já que cluímos os valores egatvos a RA. Exemplo 7.. Em uma amostra com famílas em uma cdade do teror, fo ecotrada uma reda méda de R$ 58. Segudo o prefeto, esta pesqusa está errada, pos a reda méda em sua cdade é de, o mímo, R$ 65. Teste a afrmação do prefeto com % de sgfcâca, sabedo-se que o desvo padrão da reda é de R$. O prefeto ão afrma que a reda é exatamete R$ 65, mas que é o mímo R$ 65. Pode ser R$ 7, R$ 8, etc. A hpótese alteratva (cotrára a do prefeto) deve ser que a reda méda seja meor do que R$ 65. H : µ = 65 H : µ < 65 Ou seja, estamos falado aqu de um teste moocaudal. Os % devem estar cocetrados a cauda esquerda 78 da curva ormal. 78 Na verdade, como a ormal é smétrca, tato faz a dreta ou a esquerda, o que mporta é que os % estejam cocetrados em um só lado.
170 Assm sedo, o valor a ser utlzado da tabela ormal padrozada é,8 (em módulo). Portato: 68 X - µ =,8 σ X Sedo que: σ = X = X - 65 =,8 X - 65 = 5,36 Como estamos testado a hpótese alteratva de ser meor (se a amostra apresetasse um valor maor do que R$ 65 o prefeto ão tera feto ehuma objeção), a RA clu todos os valores maores do que R$ 65. O que realmete mporta são os valores meores, que tem seu lmte feror dado por 65 5,36 = 634,64. Portato, a RA será dada por: RA = [634,36; [ O valor ecotrado a amostra fo R$ 58, que ão pertece a este tervalo. Vale dzer que, se a reda fosse realmete R$ 65 o mímo, a chace de ecotrarmos R$ 58 uma amostra de elemetos é feror a %, etão rejetamos a hpótese ula, ou seja, cocluímos que o prefeto está equvocado. Exemplo 7..3 (ovamete pesqusas eletoras) Uma pesqusa feta com 3 eletores revelou que 3% votaram o caddato A. O caddato B, etretato, afrma que o seu opoete tem, o máxmo, % dos votos. Teste a afrmação do caddato B, utlzado um ível de sgfcâca de 5%. As hpóteses este caso são: H : p =, H : p >, Já que a alteratva à hpótese laçada pelo caddato B é a de que A teha, de fato, mas do que % das teções de voto. De ovo, é um teste moocaudal, desta vez sedo utlzada a cauda da dreta
171 69 A varâca da proporção ecotrada uma amostra de 3 eletores é:,,8 var( pˆ ) = =, dp( pˆ ),3 =,3% 3 Temos etão que: pˆ - p =,645 dp(pˆ) pˆ - =,645,3 pˆ - 3,8 E, ovamete, como o teste é moocaudal, só precsamos os preocupar com a parte superor do tervalo. RA = ]- ; 3,8%] Como o valor amostral fo 3%, o que está detro da RA, etão acetamos a hpótese ula (cosderado 5% de sgfcâca) ou, em outras palavras, ão é possível cotestar a afrmação do caddato B (ada que o caddato A teha o máxmo % dos votos, a probabldade de que, uma amostra de 3 eletores, ecotremos 3% que votem em A, é superor a 5%). Exemplo 7..4 Fez-se um estudo sobre alugués em dos barros, A e B. No prmero, em resdêcas, o aluguel médo ecotrado fo R$ 33. No segudo, em 9 resdêcas, o aluguel médo fo de R$ 8. Sabe-se que o desvo padrão dos alugués o barro A é R$ 5 e o barro B é R$ 4. Afrma-se que os alugués médos são guas os dos barros. Teste esta afrmação com % de sgfcâca. Aqu ão se trata de testar uma méda como sedo gual ou ão a um determado valor, mas sm comparar duas médas. Queremos saber se as médas são, ou ão, guas. As hpóteses são: H : µ A = µ B H : µ A µ B É um pouco dferete do que estávamos fazedo, mas podemos com uma smples trasformação, dexá-lo a mesma forma, já que dzer que a méda é gual e a mesma cosa que dzer que a dfereça das médas é zero. Portato, as hpóteses acma são equvaletes a:
172 7 H : µ A - µ B = H : µ A - µ B É como se crássemos uma ova varável Y (= X A X B ) e fzéssemos o teste de hpóteses para a méda de Y ser gual a zero. Lembrado que: var(y) = var (X A X B ) = var(x A ) + var(x B ) cov(x A, X B ) Mas, supodo que os alugués em cada barro sejam varáves depedetes: var(y) = var (X A X B ) = var(x A ) + var(x B ) já que a covarâca é zero. O mesmo vale para a varâca da méda: E temos que: var( Y ) = var( X A ) + var( X B ) 5 var(x A ) = 8,3 4 var(x B ) = 84, 9 Portato, a varâca da méda (da dfereça) será: var(y ) 9,5 E o desvo padrão: σ 9, 5 7, Y Como se trata de um teste a % de sgfcâca, bcaudal, o valor ecotrado a dstrbução ormal é,645. Etão: Y - 7, =,645 Y - = 8,3 Portato, a regão de acetação para a dfereça será: RA = [-8,3; 8,3] Como a dfereça amostral ecotrada fo 5 (= 33 8), o que extrapola a RA, rejetamos a hpótese ula, sto é, os alugués médos são dferetes os dos barros.
173 6.3 Testado a varâca 7 Nos exemplos aterores, fazíamos teste para a méda porque, evdetemete, ão cohecíamos ao certo o seu valor, tíhamos o valor amostral e apeas algum tpo de suposção ou afrmação de alguém sobre o valor populacoal. Etretato, o desvo padrão (e, por tabela, a varâca) era cohecdo 79, o que é, o mímo um pouco estraho. Se ão sabemos qual é a méda, por que etão saberíamos a varâca? A úca resposta plausível é que, em geral, ão sabemos mesmo. A varâca também é obtda pela amostra e portato passível de teste. O próxmo passo é testar a varâca. Quado obtda da amostra, a varâca (amostral) é dada por: S = = ( X X) - Podemos escrever: (-)S = ( X X) = Se dvdrmos dos dos lados pela varâca populacoal σ, teremos: ( ) σ = X X σ S (-) = Ou: S (-) σ = X X = σ Repare que, se X for uma varável cuja dstrbução é ormal (e sto é mportate!) a expressão detro dos parêteses é quase uma ormal padrozada, já que se subtra a méda e dvde-se pelo desvo padrão. Para ser exatamete uma ormal padrozada teríamos que ter a méda populacoal e ão a méda amostral. Do capítulo ateror 8 sabemos etretato que: X = = = ( X) ( X - µ) ( X -µ) Substtudo, temos: S (-) σ = X µ = σ Ou ada: S (-) σ = X µ = σ X µ σ X µ σ 79 Com exceção dos exemplos de proporção (pesqusas eletoras). Dscutremos sto mas adate. 8 Quado procurávamos ecotrar um estmador ão vesado para a varâca.
174 7 Agora temos do lado dreto da equação um somatóro de varáves ormas padrozadas, já que estamos subtrado a méda populacoal µ. Além dsso, subtraímos uma outra varável ormal padrozada, já que X é uma varável com dstrbução ormal (Teorema do Lmte Cetral) com méda µ e desvo padrão dado por σ/. Portato temos uma soma de varáves ormas padrozadas. Como cohecemos a dstrbução ormal padrozada, é possível obter os valores da dstrbução desta ova varável desde que coheçamos o valor de. De fato, esta dstrbução leva o ome de χ (qu quadrado). A dstrbução χ é a dstrbução de uma varável que é a soma de varáves ormas padrozadas. Dz-se que esta varável tem dstrbução χ com graus de lberdade. S Portato, a expressão (-) segue uma dstrbução χ com - graus de lberdade σ (porque é uma soma de - varáves ormas padrozadas), desde que, é claro, S teha sdo obtda de uma varável cuja dstrbução é ormal. Escreve-se, resumdamete, da segute forma: S (-) σ ~ χ (-) As curvas que represetam a f.d.p. de varáves com dstrbução χ são mostradas abaxo: χ com grau de lberdade χ com 3 graus de lberdade
175 73 χ com 5 graus de lberdade Repare que a dstrbução va se torado mas smétrca à medda que se aumetam os graus de lberdade 8, mas em geral ela ão é smétrca, o que tem mplcações para os testes pos os valores as caudas dreta e esquerda serão dferetes. Exemplo 7.3. Numa determada empresa, empregados que desempeham a mesma fução têm saláros dferetes em fução do tempo de casa e bofcações por desempeho. Segudo a empresa, o desvo padrão para o saláro de uma certa fução é R$ 5. Etrevstado 5 fucoáros que desempeham esta fução verfcou-se que os seus saláros eram, respectvamete, R$, R$, R$ 5, R$ 3 e R$ 9. Teste a afrmação da empresa com sgfcâca de 5%, supodo que os saláros sejam ormalmete dstrbuídos. A hpótese apresetada pela empresa é de que o desvo padrão é 5, portato a varâca é 5 = 5. As hpóteses ula e alteratva devem ser: H : σ = 5 H : σ 5 Como os saláros seguem uma dstrbução ormal, a varâca amostral dos mesmos segue uma dstrbução χ com 4 graus de lberdade (já que temos 5 elemetos a amostra, - = 5- = 4) e o teste é bcaudal, o que vale dzer que tomaremos uma área equvalete a,5% em cada cauda da dstrbução. Na tabela da dstrbução χ, a lha correspodete aos 4 graus de lberdade, devemos ecotrar os valores as coluas,5% (que correspode a cauda esquerda) e 97,5% (cauda dreta). 8 Na verdade, quado é grade, a χ se aproxma de uma ormal.
176 74 Os valores ecotrados são,48 e,4. A regão de acetação, em termos dos valores tabelados, é: RA = [,48;,4] Estamos supodo que a varâca verdadera (populacoal) é 5. Pela amostra, a varâca obtda é: S = ( -8) S = 57 + ( -8) + (5-8) 4 Já que a méda amostral é 8 (verfque!). Para fazer o teste, temos que calcular a expressão: S (-) σ = 4 57,3 5 + (3-8) + ( 9-8) Que está detro da RA, portato acetamos a hpótese ula para um ível de 5% de sgfcâca. A afrmação da empresa ão pode ser cotestada. Exemplo 7.3. Uma caxa de fósforos de uma certa marca vem com a scrção: cotém, em méda, 4 paltos. Segudo o fabrcate, o desvo padrão é de, o máxmo, paltos. Em uma amostra com 5 caxas, etretato, fo ecotrado um desvo padrão amostral de 3 paltos. Supodo que o úmero de paltos por caxa seja uma varável ormal, teste a afrmatva do fabrcate utlzado um ível de sgfcâca de %. As hpóteses são: H : σ = 4 H : σ > 4 A expressão: S (-) σ = 5 9 =,5 4
177 Que sabemos, segue uma dstrbução χ com 5 graus de lberdade. Para % de sgfcâca, um teste moocaudal, devemos procurar a tabela a colua de 99% (já que estamos testado a hpótese alteratva maor ). 75 será 8 : O valor ecotrado fo 76,5. O que sgfca que, em termos dos valores tabelados, a RA RA = [; 76,5] Como o valor ecotrado ão pertece à RA, rejetamos a hpótese ula quado o ível de sgfcâca é %. A afrmação do fabrcate ão é correta. Exemplo Do exemplo 7.3., costrua um tervalo de 9% de cofaça para a varâca. A exemplo de um tervalo de cofaça para a méda, para um tervalo de cofaça de 9% para a varâca utlzaremos 45% abaxo e 45% acma da varâca amostral ecotrada. O que equvale, a tabela, às coluas 5% e 95% da lha correspodete aos 4 graus de lberdade que temos o exemplo Os valores tabelados são,7 e 9,49. Chamado de χ t os valores tabelados ecotrados, temos que, as extremdades do tervalo de cofaça será váldo: S (-) σ = χ t Rearrajado, temos: σ = (-)S /χ t Para ecotrarmos os valores lmtes do tervalo, basta substtur por cada um dos valores tabelados ecotrados: σ = 4 57/9,49 45,3 σ = 4 57/,7 36,8 Portato, o tervalo com 9% de cofaça para a varâca será: 8 Note que como é um teste para a varâca, o meor valor possível é zero, já que ão exste varâca egatva.
178 IC 9% = [45,3; 36,8] 76 Ou, se preferr o tervalo de cofaça para o desvo padrão: IC 9% = [55,; 566,7] 7.4 Testado a méda quado a varâca é descohecda e... Agora que cohecemos a dstrbução da varâca (pelo meos quado se trata de uma varável ormal), podemos retomar a questão do teste da méda quado a varâca também é obtda da amostra. O cálculo da estatístca, ao vés de ser dado pela expressão: X - µ σ Será calculado por: X - µ S Já que a varâca populacoal σ ão é cohecda e que portato só é possível obter a varâca amostral S. A méda amostral, já é sabdo, segue uma dstrbução ormal. A expressão (-)S /σ segue uma dstrbução χ com - graus de lberdade, sedo o tamaho da amostra 83. Portato, a seguda expressão acma é um quocete de uma varável que tem dstrbução ormal padrozada por uma varável que, ao quadrado, tem dstrbução 84 χ. Para perceber sso, basta dvdr por σ o umerador e o deomador: X - µ σ S σ Esta combação, embora pareça complcada, vem de duas dstrbuções já cohecdas. Etão, é possível costrur a dstrbução desta expressão, que é cohecda como t de Studet. A dstrbução t, como vem (também) da χ, depede dos mesmos graus de lberdade desta últma. Mas, como a ormal padrozada, ela é smétrca e tem méda zero 85. Portato, dz-se que a últma expressão segue uma dstrbução t, de Studet, com - graus de lberdade. Ou: X - µ ~ t(-) S 83 Isto, é claro, se S fo obtdo a partr de uma varável ormal. 84 Exceto pelo fator (-). 85 A f.d.p. de uma varável que se dstrbu como uma t de Studet se assemelha a uma ormal achatada.
179 77 E, como para a dstrbução χ ecesstamos que a amostra seja extraída de uma população cuja dstrbução é ormal, o mesmo vale para a dstrbução t, de Studet. Portato esta é uma codção ecessára para que usemos a dstrbução t de Studet em um teste de hpóteses. Exemplo 7.4. Do exemplo 7.3., supoha que o empregador afrme ada que o saláro médo é, o mímo, R$ 5. Teste a afrmação do empregador utlzado um ível de % de sgfcâca. As hpóteses são: H : µ = 5 H : µ < 5 A méda amostral obtda o exemplo 7.3. fo 8 e a varâca amostral 57. Portato, o desvo padrão amostral é: S = 57 38,75 E o desvo padrão da méda é: S = X S 38, = 575 6,8 E, como este desvo padrão fo obtdo a partr de uma amostra (que, o caso do exemplo 7.3., veo de uma população ormalmete dstrbuída), a dstrbução a ser utlzada é a t, de Studet, com 4 (= 5 ) graus de lberdade. Na dstrbução t de Studet, com 4 graus de lberdade e % de sgfcâca, moocaudal, o valor ecotrado é,53. X - µ =,53 S X X -5 =,53 6,8 X - 5 = 63,4 Como é um teste moocaudal, a RA será dada por: RA = [86,6; [ Como o valor ecotrado a amostra (8) pertece à RA, acetamos a hpótese ula, sto é, ão podemos desmetr a afrmação do empregador. Alteratvamete, podemos costrur a RA em termos dos valores tabelados da dstrbução de Studet: RA = [-,53; [
180 O valor é egatvo porque estamos testado a hpótese alteratva de que a méda é meor do que 5. O cálculo da estatístca será: 78 X - µ 8 5 = 6, 8 S X -,655 Que, da mesma forma, pertece à RA, etão acetamos a hpótese ula. Exemplo 7.4. Para verfcar a formação de que a temperatura méda de uma cdade, o verão, é de 35 o C, um estudate coletou a temperatura durate das e ecotrou uma méda amostral de 33 o C, com desvo padrão de,7 o C. Supodo que a temperatura se dstrbua ormalmete o verão aquela cdade, teste a formação cal com % de sgfcâca. As hpóteses são: H : µ = 35 H : µ 35 O desvo padrão da méda é: S = X S =,7, E, como o desvo padrão fo obtdo da amostra (e sabemos que a dstrbução é ormal!), a dstrbução a ser utlzada é a de Studet, com 9 graus de lberdade. Com % de sgfcâca (teste bcaudal) o valor ecotrado é,83. X - µ =,83 S X X - 35 =,83, X - 35 =,4 A regão de acetação será dada por: RA = [34,6; 35,4] Como o valor ecotrado a amostra (33 o C) ão pertece à RA, rejetamos a hpótese ula e, portato, cocluímos que a temperatura méda da cdade o verão ão é 35 o C. O título desta seção está completo. ( varâca descohecda e... ). Repare a tabela t de Studet, por exemplo, a colua de 5% bcaudal. Se a varâca fosse cohecda, o valor a dstrbução ormal a ser utlzado sera,96. Na t de Studet, com 5 graus de lberdade é,57; se aumetarmos os graus de lberdade para, passa a ser,3; com 3 graus de lberdade, é,4 (dfereça de meos de,). À medda que aumetamos a amostra e, por cosegute, os graus de
181 lberdade, o valor ecotrado a tabela t de Studet se aproxma do valor da ormal 86. De fato, o valor a lha f (ftos graus de lberdade) é exatamete o valor ecotrado a dstrbução ormal 87. Portato, se a varâca for descohecda, mas a amostra for grade, fará pouca dfereça se usarmos a ormal ou a t de Studet (e fará meos dfereça quato maor for a amostra). Assm, o título completo desta seção sera teste para a méda com varâca descohecda e... amostra pequea. Repare que os exemplo 7..4, a rgor teríamos que usar a dstrbução de Studet para costrur o tervalo de cofaça, pos a varâca também fo obtda da amostra. Isto, o etato, é desecessáro, pos se trata de uma amostra de eletores. 7.5 Comparação de varâcas No exemplo 7..4 fzemos um teste comparado duas médas. Isto é, a partr de médas obtdas de duas amostras dferetes, procuramos testar se a méda populacoal em ambas era gual. E se qusermos fazer a mesma cosa com varâcas obtdas de amostras dferetes? Exemplo 7.5. Uma maera (bem smples, dga-se) de se ter uma déa sobre dstrbução de reda é calculado a varâca. Supoha que, em duas comudades, tomou-se duas amostras, de 9 famílas para a comudade A e 5 famílas para comudade B. Foram coletados os segutes valores para as redas mesas destas famílas: comudade A: 8, 6, 55, 4, 3, 5, 9, 6, 7 comudade B: 7,, 3, 5, Teste, com % de sgfcâca, se a dstrbução de reda (medda pela varâca) é dferete as duas comudades. Supoha que, em ambas, a reda é ormalmete dstrbuída. A varâca amostral da reda a comudade A é, aproxmadamete, 486, equato que, a comudade B é 33 (verfque!). A perguta é: poderam ser estas duas varâcas (populacoas) guas, sedo a dfereça obtda resultado de uma cocdêca a extração da amostra? A resposta vem através do segute teste de hpóteses: 79 H : σ A = σ B H : σ A σ B Como fazê-lo? Sabemos que, como a dstrbução é ormal, a expressão (-)S /σ é uma dstrbução χ com - graus de lberdade para ambas comudades (8 para A e 4 para B). Se tomarmos a razão das varâcas amostras e dvdrmos pelas respectvas varâcas populacoas (que supostamete são guas), teremos: 86 O que faz todo o setdo se pesarmos em termos da cosstêca do estmador da varâca ou mesmo em termos de Le dos Grades Números. 87 O que vale dzer que a t de Studet tede, asstotcamete, a uma dstrbução ormal.
182 8 S = S B A S σ S σ A B Teremos o umerador e o deomador uma estatístca χ dvdda pelos respectvos graus de lberdade. Esta dstrbução resultate deste quocete recebe o ome de dstrbução de Fsher- Sedecor ou, smplesmete dstrbução F. Ela obvamete depederá dos graus de lberdade do umerador e do deomador. S = S B A S σ S σ B A = χ 4 4 χ 8 8 ~ F 4,8 Dzemos etão que o quocete das duas varâcas segue uma dstrbução F com 4 graus de lberdade o umerador e 8 graus de lberdade o deomador. Note que, como a dstrbução χ vem, ecessaramete, de uma população ormal, a dstrbução F terá de vr de duas populações ormas também. O gráfco da f.d.p de uma varável que tem como dstrbução uma F é semelhate ao de uma como uma χ. Não é uma dstrbução smétrca, portato. Do poto de vsta de quem utlza uma tabela, há uma lmtação que advém do papel ter só suas dmesões 88, etão as coluas fcam reservadas aos graus de lberdade do umerador, equato as lhas aos graus de lberdade do deomador (por exemplo). Não há como represetar dferetes íves de sgfcâca, portato. Para cada ível de sgfcâca é ecessára uma tabela. Na tabela F para sgfcâca de % bcaudal (que é a mesma de 5% moocaudal), o valor máxmo da RA pode ser ecotrado dretamete a colua dos 4 graus de lberdade (umerador) e 8 graus de lberdade (deomador). Este valor é 3,84. O valor feror do tervalo é o verso do valor da dstrbução quado vertemos a posção do umerador e do deomador. O valor da tabela para 8 graus de lberdade o umerador e 4 o deomador é 6,4. O lmte feror do tervalo será etão: = 6, 4 F 8,4,7 88 Evdetemete o papel tem espessura, mas usualmete só usamos a altura e a largura para escrever.
183 8 A regão de acetação será etão: RA = [,7; 3,84] Dca: se sempre dvdrmos a maor varâca amostral pela meor, esta últma cota será desecessára, pos já estaremos descosderado valores meores do que. O valor calculado pela amostra será: S 33 =,7 S 486 B A Que pertece à RA, portato acetamos a hpótese ula, assm sedo, ão podemos afrmar que a dstrbução de reda seja dferete as duas comudades. Exemplo 7.5. A méda e o desvo padrão amostral dos saláros a empresa A são, respectvamete, R$ 6 e R$ 5, valores obtdos a partr de uma amostra de trabalhadores. Na empresa B, utlzado uma amostra de 8 trabalhadores, a méda e o desvo padrão amostral ecotrados foram R$ 5 e R$ 8, respectvamete. Aparetemete o desvo padrão é maor a empresa B. Teste esta hpótese com sgfcâca de 5%. O teste é, de ovo, uma comparação etre varâcas, só que desta vez é moocaudal. H : σ A = σ B H : σ A < σ B Como foram dados os desvos padrão, temos que ecotrar as varâcas amostras: S A = 5 = 5 S B = 8 = 64 A estatístca a ser calculada é: S B 64 =,6 S 5 A
184 Pela tabela, o valor lmte da dstrbução F, com 7 graus de lberdade o umerador e 9 o deomador, é: F 7,9 =, Etão rejetamos a hpótese ula de que as varâcas são guas (e, portato, os desvos padrão), etão cosderamos que, de fato, o desvo padrão da empresa B é maor. 7.6 Erros e poder de um teste Image um julgameto: em países democrátcos e/ou cvlzados, costuma-se estabelecer uma regra de que todo mudo é ocete até prova em cotráro. Quado se faz uma acusação, o acusador é que tem provar e, se ão cosegur, o acusado é cosderado ocete. Desta forma, se procura elmar (ou pelo meos mmzar) a possbldade de se codear um ocete. O problema é que aí se aumeta a possbldade de que um culpado acabe escapado da codeação. É um preço que se tem que pagar pos, se fosse o cotráro (o acusado tvesse que provar a sua ocêca), embora certamete reduzra a chace de que um culpado escapasse, mas também aumetara a chace de se codear ocetes. Com testes de hpóteses acotece a mesma cosa (embora de uma forma meos dramátca). O resultado de um teste de hpóteses sempre tem alguma chace de estar errado. Na verdade, há dos tpos de erro. O erro do tpo I é quado rejetamos a hpótese ula quado ela é verdadera. E o erro do tpo II é quato acetamos a hpótese ula, quado ela é falsa. Fazedo a aaloga com julgametos, se cosderarmos a hpótese ula como sedo o acusado é ocete e, portato, a hpótese alteratva sedo o acusado é culpado, o erro do tpo I sera codear um ocete, equato o erro do tpo II sera aálogo a absolver um culpado. A probabldade de cometer o erro do tpo I é a própra sgfcâca do teste, portato ela é defda a pror. P(erro do tpo I) = α = sgfcâca do teste Supohamos uma stuação em que o valor a ser testado ão é o valor verdadero. Evdetemete, o pesqusador que está fazedo o teste ão sabe dsto. A stuação pode ser lustrada o gráfco abaxo: 8
185 83 A área achurada represeta a sgfcâca do teste e, pelo meos do poto de vsta do pesqusador que ão sabe qual é o valor verdadero, a probabldade de se cometer o erro do tpo I. A área czeta represeta 89 a probabldade do erro do tpo II pos, se o valor amostral car a regão czeta, acetaremos a hpótese ula de que o valor testado é o correto, o que ão é verdade. Repare que, se fzer um teste mas rgoroso, sto é, dmur a sgfcâca, aumetará a probabldade de cometer um erro do tpo II. Portato, mas rgoroso aí sgfca que a chace de rejetar a hpótese ula quado ela é falsa é meor. Mas (ão tem jeto) a chace de acetarmos a hpótese ula, sedo ela falsa, aumeta, o que pode ser vsto o gráfco abaxo. II. Ao se dmur a sgfcâca (área hachurada) aumeta-se a probabldade de erro do tpo 89 Na verdade, essas áreas vão até o fto, se as dstrbuções forem ormas, como é o caso do exemplo. Evdetemete, ão é possível ptar um gráfco até o fto, mas devemos ter sto em mete.
186 Mas ão tem jeto mesmo? Como um julgameto, um maor úmero de provas pode levar a um veredto mas correto, o caso de um teste de hpóteses, cosegur mas provas sgfca aumetar a amostra. Aumetar a amostra sgfca que os valores amostras (estmadores) apresetarão varâca meor. Com varâca meor, as curvas de dstrbução se torarão mas fhas, portato é possível reduzr-se a probabldade dos dos erros, como pode ser vsto a fgura abaxo: 84 Chamamos a probabldade de cometer o erro do tpo II de β. P(erro do tpo II) = β A probabldade de se cometer o erro do tpo II, etretato, ão é cohecda em geral, pos ão sabemos o valor verdadero. Como a sgfcâca é prevamete estabelecda,um teste de hpóteses será tão melhor quato meor for a probabldade de cometer o erro do tpo II. De fato, chamamos de poder do teste justamete a probabldade de ão cometer o erro do tpo II, sto é, a probabldade de rejetar a hpótese ula quado ela é falsa: Exercícos Poder do teste = β. Tomado-se uma amostra de 3 aluos de uma faculdade, verfcou-se que a ota méda do provão fo de 4,. Sabedo-se que o desvo padrão das otas é de,5, determe: a) um tervalo que coteha 6% dos aluos desta faculdade. b) um tervalo de 9% de cofaça para a méda obtda pela faculdade. c) Você utlzou alguma hpótese adcoal para resolver os tes aterores? Se sm, qual(s) hpótese(s) em qual(s) tem(s)?. Num estudo sobre a reda em uma determada cdade com uma amostra de 36 habtates ecotrou uma reda méda de R$ 83,. Estudo ateror ecotrou um valor de R$ 8,. Teste se este estudo cotua váldo com um ível de sgfcâca de %, sedo cohecda a varâca da reda de 96.
187 85 3. Estudo feto sobre a mortaldade fatl em 4 cdades em um estado ecotrou um valor de 8 por ml craças ascdas. O goverador afrma, o etato, que a mortaldade fatl ão passa de 7 por ml. Teste esta afrmação utlzado sgfcâca de %, sabedo-se que o desvo padrão da mortaldade fatl é. 4. Numa pesqusa etre 5 eletores, declararam teção de votar o caddato A. a) Costrua um tervalo de cofaça de 95% para as teções de voto em A. b) O caddato A afrma que possu, o mímo, 5% das teções de voto. Teste a afrmação do caddato com 5% de sgfcâca. c) Quatos deveram ser os eletores pesqusados de tal modo que a margem de erro do tem a seja de % (dos potos percetuas). 5. O valor médo dos alugués em um barro, obtda através de uma amostra de 3 móves, é de R$ 9. Num outro barro, uma amostra de 6 móves, fo obtdo um valor de R$ 3. Teste a afrmação de que o valor médo do aluguel é dêtco os dos barros, com sgfcâca de 5%, sabedo-se que os desvos padrão são guas a 5 e 4, respectvamete. 6. O fabrcate de uma máqua de empacotar afrma que o desvo padrão máxmo dos pacotes embalados por ela é de 9g.. Numa amostra de 5 pacotes, o desvo padrão ecotrado fo de g. Teste a afrmação do fabrcate com um ível de sgfcâca de 5%, admtdo que a dstrbução seja ormal. 7. Imaga-se que o desvo padrão das dades de uma classe é de aos. Tomado-se 5 pessoas aleatoramete, as dades foram de: 3, 7, 5, 9 e. Teste com % de sgfcâca a valdade da afrmação cal, supodo dstrbução ormal para as dades. 8. Numa pesqusa com ecoomstas, os valores da méda e do desvo padrão dos saláros foram de R$ e R$ 5.Se os saláros são dstrbuídos ormalmete, teste a afrmação de que o saláro médo dos ecoomstas é, o mímo, R$ 5 utlzado um ível de 5% de sgfcâca. 9. Com os dados do exercíco 7, teste a % de sgfcâca a afrmação de que a méda de dade da classe é 3 aos.. Na cdade X, através de uma amostra de 6 habtates, fo obtda uma reda méda de R$ 6 com desvo-padrão de R$. Na cdade Y, com uma amostra de habtates, fo obtda a mesma reda méda, mas com desvo padrão de R$ 3. Afrma-se que a dstrbução de reda a cdade Y é por do que a da cdade X. Teste esta afrmação com 5% de sgfcâca, admtdo que a dstrbução da reda é ormal as duas cdades.. Fo feto um estudo em duas fábrcas para vestgar a uformdade da produção em ambas. Teste com % de sgfcâca se as duas fábrcas varam a sua produção da mesma forma, admtdo que a dstrbução seja ormal em ambos os casos. produção fábrca da da da 3 da 4 da 5 I II A méda de uma varável aleatóra é. Sem saber dsto, um pesqusador usa uma amostra de 5 elemetos para testar a hpótese de que a méda é gual a (teste bcaudal). Sabedo-se que a varâca desta varável é 4 (e sto também é sabdo pelo pesqusador), se o ível de sgfcâca
188 utlzado é %, qual é o poder do teste? E se o ível de sgfcâca for 5%? Qual será o poder do teste se o teste for para a méda gual a 9? 3. Uma caxa cotém bolas bracas e pretas. Quer-se testar a hpótese de que a proporção seja de metade para cada cor. Para sso, retram-se 5 bolas (com reposção). O crtéro adotado é o segute: se o úmero de bolas bracas retradas for de a 3 (clusve), aceta-se a hpótese ula de que as proporções são guas. Determe a sgfcâca deste teste. 4. Para pesqusar o gasto médo mesal em cema em uma comudade foram pesqusadas 5 famílas. O gasto delas em um mês fo de 4, 5, 3, e 3 reas, respectvamete. a) Afrma-se que a o gasto médo mesal desta comudade é de 4 reas. Teste esta afrmação a % de sgfcâca. b) Afrma-se que o desvo padrão do gasto é de R$ /mês. Teste esta afrmação a % de sgfcâca. c) É ecessára alguma hpótese adcoal para a resolução dos tes aterores? Justfque. 5. Em uma prova, um aluo afrma que o professor ão deu a matéra cobrada em uma questão de múltpla escolha com 5 alteratvas. O professor argumeta que sso é mpossível, porque em uma classe com 5 aluos, 9 acertaram a questão. Teste, com 5% de sgfcâca, a hpótese de que os aluos teham acertado a questão o chute. 6. O resposável pelo cotrole de qualdade de uma fábrca afrma que, o máxmo, % dos seus produtos são defetuosos. Numa amostra de produtos, foram ecotrados 4 com defeto. Teste a hpótese do resposável com 8% de sgfcâca. 7. Assale verdadero ou falso: a) Num teste para a méda, podemos sempre utlzar a dstrbução ormal. b) Dada a varâca amostral S, obtda uma amostra de elemetos, sabemos que a expressão (- )S /σ segue uma dstrbução χ com - graus de lberdade. c) A dstrbução χ com graus de lberdade é a dstrbução de uma varável que é a soma de varáves ormas. d) A dstrbução χ com graus de lberdade é a dstrbução de uma varável que é a soma de varáves ormas padrozadas. e) Não é possível realzar testes de comparação de varâcas se as médas são dferetes. f) A méda de uma varável, cuja dstrbução é a t de Studet, é zero. g) Um teste é realzado a 5% de sgcâca. Se o mesmo teste for repetdo, com a mesma amostra, a % de sgfcâca, terá um poder maor. h) Um teste é realzado a 5% de sgfcâca. Se for utlzada uma amostra maor, matdos os 5% de sgfcâca, a probabldade de erro do tpo I será meor. ) Um teste é realzado a 5% de sgfcâca. Se for utlzada uma amostra maor, matdos os 5% de sgfcâca, a probabldade de erro do tpo II será meor. 86
189 Apêdce 7.B Propredades e cocetos adcoas de testes de hpóteses 87 7.B. Caso geral dos testes de hpóteses Ao logo do texto os testes sempre são do tpo varável = valor, ou varável = varável, sempre sedo estas varáves e valores escalares. No caso mas geral, a hpótese ula sera que o parâmetro θ pertece a um cojuto ω. A hpótese alteratva que θ pertece, a verdade, ao complemetar de ω: H : θ ω H : θ ω Neste setdo, os testes de hpótese moocaudas apresetados o texto seram melhor represetados se a hpótese ula também fosse uma desgualdade, de modo que a hpótese alteratva represetassem de fato o complemetar, desta forma: H : θ θ H : θ > θ Para a hpótese alteratva maor que. Ou: H : θ θ H : θ < θ Para a hpótese alteratva meor que. Ao logo do texto, etretato, fo matda a coveção da maora dos lvros texto de que a hpótese ula deve ser sempre represetada por uma gualdade. 7.B. Propredades desejáves de testes de hpóteses Assm como estmadores, testes de hpóteses também devem ter algumas propredades. Um teste de hpóteses é dto ão vesado se a probabldade de rejetar a hpótese ula quado ela é falsa é maor do que a de rejetar a hpótese ula quado ela é verdadera. Em outras palavras, ele será ão vesado se o poder do teste for maor do que a sua sgfcâca. Um teste T com sgfcâca α e tedo β como a probabldade de cometer o erro do tpo II é dto admssível se houver um teste T de tal modo que α α e β β (com a desgualdade estrta valedo em pelo meos um dos casos). Falmete, um teste é dto o mas poderoso se, para um dado ível de sgfcâca, for o teste que apresetar o maor poder, sto é, a maor probabldade de rejetar a hpótese ula quado ela é falsa. 7.B.3 Teste de comparação de médas quado a varâca é descohecda Este teste tem as segutes hpótese, o caso bcaudal: H : µ A = µ B H : µ A µ B
190 88 Ou, como vmos, alteratvamete: H : µ A µ B = H : µ A µ B As duas populações são ormalmete dstrbuídas. O tamaho das amostras são A e B ; as médas amostras são A X e B X ; e as varâcas amostras são A S e B S. Há duas possbldades: a prmera é a de que, embora as varâcas amostras sejam dferetes, sejam estmadores de uma mesma varâca populacoal. O estmador desta varâca será dado por uma méda poderada das varâcas amostras: S = )S ( )S ( B A B B A A + A estatístca do teste será dada por: B A B A S S X X + = B A B A S X X + Que, sob a hpótese ula, segue uma dstrbução t de Studet com A + B graus de lberdade. A outra possbldade é a de que as varâcas sejam, a verdade, dferetes. Etão a estatístca será dada por: B B A A B A S S X X + Que é possível demostrar que segue (aproxmadamete) uma dstrbução t de Studet com η graus de lberdade, ode η é dado por: η = S S S S B B B A A A B B A A B.4 Quadro resumdo algumas das prcpas dstrbuções cotíuas Dstrbução fução desdade Méda Varâca Normal ) ( σ µ πσ X e µ σ
191 com graus de lberdade χ t de Studet X X / ) e Γ( / ) ( Γ[( + ) / ] Γ( / ) Γ(/ ) X + Fsher-Sedecor m / m Γ[( m + ) / ] Γ( m / ) Γ( / ) [ ( + ) / X m ( m ) / X ( m+ ) / + ( / ) ] ( > ), > (>) ( m + ) m( ) ( 4) (>4) 89 Ode Γ(α) = e x x α dx e, se α for um tero postvo, Γ(α) = (α )!
192 9
193 CAPÍTULO 8 - Regressão Lear 9 Image duas varáves chamemos geercamete de Y e X mas poderam ser cosumo e reda; saláros e aos de estudo; pressão de um gás e sua temperatura; vedas e gastos em propagada, efm quasquer duas varáves que, supostamete, teham relação etre s. Supohamos ada que X é a varável depedete e Y é a varável depedete, sto é, Y que é afetado por X, e ão o cotráro. No gráfco acma, verfcamos que exste sm uma depedêca etre Y e X. O processo de ecotrar a relação etre Y e X é chamado de regressão. Se este processo é uma reta (como parece ser o caso), é uma regressão lear. E se for apeas uma varável depedete ( só tem um X ) é uma regressão lear smples. 8. Regressão lear smples Como a relação expressa pelo gráfco abaxo é, aparetemete, uma fução afm ( lear ), cada Y pode ser escrto em fução de cada X da segute forma: Y = α + βx + ε Ode α + βx é a equação da reta e ε é o termo de erro. Este últmo termo tem que ser cluído porque, como podemos ver, o valor de Y ão será dado exatamete pelo poto da reta a ser ecotrada, como pose ser vsto o gráfco abaxo:
194 9 Qual a razão de exstr este erro? (Repare que ada ão estamos falado de estmadores, esta relação é, supostamete, exata!). Bom, uma razão sera a exstêca de mprecsões em meddas, o que é o mas comum em expermetos de laboratóro por mas precso que seja um strumeto de medda, sempre haverá um lmte para esta precsão. No caso de modelos ecoômcos ou que evolvam qualquer tpo de cêca socal, este erro é um compoete mas mportate. Image que Y seja o preço de um móvel e X a área do mesmo. Supoha ada que o barro seja o mesmo, o padrão de costrução também, etc. etc., de modo que a úca varável (cohecda) que flueca o preço do móvel é a área do própro. Ada assm, havera potos acma e abaxo da reta. Um poto abaxo podera ser o da Doa Marcota, smpátca sehora aposetada e vúva que, precsado com urgêca de um dhero para um tratameto médco e ão estado formada a respeto do mercado mobláro da regão, vedeu uma casa que seu mardo dexou de heraça por um preço abaxo do que sera o de mercado. Um poto acma podera ser o do seu João, atgo morador do barro que, depos de se torar um comercate bem suceddo, fez questão de voltar às suas orges e fez uma oferta rrecusável por uma casa do barro. Note que é mpossível um emarahado de potos cohecermos todas as hstóras. E, mesmo que cohecêssemos, estas varáves seram muto dfíces de medr. Como sera dfícl de medr a eufora causada por uma grade coqusta esportva ou mltar (ou a depressão pela derrota) que fara com que o cosumo, aquele ao, fosse proporcoalmete maor (ou meor) em relação à reda. Efm, o erro dá cota de todos estes evetos que são dfíces de medr, mas que são (supostamete) aleatóros. Mas do que sso, se o modelo (a reta) estver corretamete especfcado, podemos supor que o erro, em méda, será zero. Traduzdo: a probabldade do erro ser x udades acma da reta é a mesma de ser x udades abaxo. Esta é a prmera hpótese a ser feta sobre o erro: em méda, ele é zero, sto é: E(ε ) = Bom, o próxmo passo é ecotrar ou, melhor dzedo, estmar a reta de regressão, já que sempre estaremos trabalhado com uma amostra, o que mplca que, ão teremos os valores verdaderos de α e β, mas seus estmadores. 8. Método dos mímos quadrados Ecotrar (estmar, a verdade) a reta de regressão sgfca ecotrar estmadores para α e β. Façamos um pequeo truque para torar este trabalho mas fácl. Vamos defr as varáves x e y da segute forma: x = X X y = Y Y As varáves x e y são dtas cetradas a méda.
195 93 Assm, como a méda dos erros é zero, temos que, tomado as médas da equação da reta: Y = α + βx + ε Y = α + β X + E, se subtrarmos a seguda equação da prmera: Y Y= (α α) + β(x X) + ε y = βx + ε Ou seja, se cosderarmos as varáves cetradas a méda, ao vés das varáves orgas reduzmos osso trabalho o que se refere ao úmero de parâmetros a ser estmado. O método a ser utlzado pressupõe que queramos estmar uma reta que teha meos erro. Mas somar os erros, pura e smplesmete, ão os acresceta muta formação, pos haverá erros postvos e egatvos (de potos acma e abaxo da reta), que rão se cacelar uma soma smples. Mas resolvemos um problema parecdo quado defmos a varâca: basta tomarmos os quadrados, elmado assm os úmeros egatvos. Etão, a melhor reta será aquela cuja soma dos quadrados dos erros for míma. Daí o ome método dos mímos quadrados. Da equação da reta usado as varáves cetradas, o(s) erro(s) será(ão) dado(s) por: ε = y βx A soma dos quadrados dos erros será: ( ε ) = = = ( y βx ) Ou, omtdo, por mera ecooma de otação, os ídces = a, temos: Σε = Σ(y βx ) Σε = Σ(y + β x βx y ) Utlzado as propredades da soma, vem: Σε = Σy + Σβ x Σβx y E como β é uma costate em todo o somatóro: Σε = Σy + β Σx βσx y Para ecotrar o valor de β que dê o mímo desta soma, o procedmeto é dervar e gualar a zero. Como este valor de β é um estmador, a partr de agora utlzaremos βˆ. Dervado em relação a β: βˆ Σx Σx y =
196 Dvddo por em ambos os lados: 94 βˆ Σx Σx y = βˆ = x y x E o estmador para α pode ser faclmete ecotrado da equação da reta para as médas: Y = α + β X Substtudo pelos respectvos estmadores: Y= αˆ + βˆ X Portato: αˆ = Y βˆ X Exemplo 8.. Dados os valores de Y e X a tabela abaxo, estme a reta que exprme a relação etre Y e X. X Y O prmero passo é calcular a méda de Y e X e ecotrar as varáves cetradas: X Y x y 3 6-5, -54, , -47, , -7, , -4, ,8 4,8 9 56,8 75, ,8,8 55 9,8-5,
197 , -, 56 9,8 4, ,8, ,8 9, ,8 58, ,8 57, , -33, 66-4, -48, , -53, , -9, 44 -, -3, ,8 4,8 soma méda 54, 4, zero. Note que, se a varável é cetrada a méda, sua soma e, por cosegute, sua méda, será E, agora, ecotramos x, y e xy: X Y x y x y xy 3 6-5, -54, 6,44 937,64 775, , -47, 973,44 7,84 47, , -7, 84,64 5,84 66, , -4, 795,4 697,44 6, ,8 4,8,4 747,4 454, ,8 75,8 36,4 5745,64 435, ,8,8 566,44 59,84 54, ,8-5,,64 7,4-4, , -, 74,4 449,44 79, ,8 4,8 3,4 3,4 8, ,8,8 39,4 43,64 45, ,8 9,8 65,4 39,4 49, ,8 58,8 83, ,44 56, ,8 57,8 48,4 334,84 878, , -33, 85,64,4 969, , -48, 78,84 33,4 34, , -53, 7,84 83,4 5, , -9, 368,64 368,64 368, , -3, 4,4 74,4 34, ,8 4,8 4,44 664,64 379,4 soma , 353, 559, méda 54, 4, 59,96 575,66 79,56 Agora, podemos faclmete estmar a reta de regressão: x y 79,56 βˆ = =,7 x 59,96 αˆ = Y βˆ X = 4,,7 54, 8,5 Portato, a reta estmada será dada por: Ŷ = 8,5 +,7X Isso quer dzer que, se X for gual a 3, um valor estmado (médo) para Y será dado por:
198 96 Ŷ = 8,5 +,7 3 39, Mas fca uma questão: esta prevsão é cofável? Ou, uma questão ada ateror: esta regressão é boa? Vejamos o exemplo segute. Exemplo 8.. Teste a valdade da regressão do exemplo 8.. Embora ão seja muto rgorosa, uma speção gráfca, a base do olhômetro é sempre útl. Se colocarmos, o mesmo plao cartesao, os potos dados a tabela e a reta obtda pela regressão, temos: Vsualmete, podemos costatar que, de fato, a relação é uma reta e que a reta de regressão prevê com boa precsão os valores verdaderos de Y. Como podemos verfcar sso de maera mas rgorosa? A prmera cosa é calcular a dfereça etre os Y dados o exemplo e os calculados pela reta de regressão ( Ŷ ) X Y Ŷ Y- Ŷ 3 6 5,39 7, ,54-9, ,9 3, ,6-7, , -, 9 8,77 7, ,93-5, ,7-6, ,7-5, ,37, ,44 6, ,4 -, ,87 7, ,3 -, ,95, ,6, , 3, , 3,98 44,89 -,89
199 ,, soma méda 54, 4, 4, De fato, verfcamos que as dfereças são bem pequeas quado comparadas com os valores de Y. Estas dfereças alás, podem ser precptadamete cofuddas com os erros. É quase sso. Os erros são as dfereças etre os valores de Y e a reta verdadera, sto é, a reta dada pelos valores populacoas de α e β (que ão são cohecdos). As dfereças que ecotramos são etre os valores de Y e os dados pela reta com os valores estmados (amostras) de α e β. São portato, ão os erros, mas os estmadores dos erros, ou smplesmete os resíduos da regressão. Façamos agora uma aálse com os quadrados dos resíduos e, coseqüetemete, com a varâca dos mesmos. Esta aálse é cohecda como aálse de varâca ou pela sua sgla em lígua glesa, ANOVA. X Y Ŷ resíduos quadrados dos resíduos 3 6 5,39 7,6 57, ,54-9,54 9, ,9 3,9 5, ,6-7,6 5, , -,,4 9 8,77 7,3 5, ,93-5,93 35, ,7-6,7 38, ,7-5,7 7, ,37,63 6, ,44 6,56 4, ,4 -,4, ,87 7,3 5, ,3 -,3 5, ,95,5 4, 66 63,6,74 7, , 3,78 4, , 3,98 5,8 44,89 -,89, ,,, soma ,8 méda 54, 4, 4, 3,4 A aálse de varâca evolve dvdr a varável Y duas partes: a parte explcada pela regressão e a ão explcada (resíduos). Etão, o prmero passo é calcular a soma dos quadrados da varável Y e de suas partes explcada e ão explcada. Como se trata de varâca, estamos tratado aqu da varável meos a méda, sto é das varáves cetradas a méda. Calculemos etão, a soma dos quadrados dos totas (SQT) de Y (cetrado), a soma dos quadrados explcados (SQE), sto é, do Y estmado e a soma dos quadrados dos resíduos (SQR). A soma dos quadrados totas já fo calculada o exemplo 8.. SQT = Σy = 353,
200 Para o cálculo das soma dos quadrados explcados, há duas maeras: ou calculamos um a um, tramos a méda e elevamos ao quadrado, ou podemos utlzar a equação da reta: 98 ŷ = βˆ x SQE = Σ ŷ = Σ( βˆ x ) = Σ βˆ x = βˆ Σx = 3893, E a soma dos quadrados dos resíduos fo calculada já este exemplo, a últma tabela: Repare que: SQR = 6,8 SQT = SQE + SQR acma. Portato, ão sera ecessáro calcular as três, bastaram duas e a tercera sara pela relação Começaremos etão, a preecher a tabela abaxo, começado pelas somas de quadrados: Soma de quadrados SQE = 3893, SQR = 6,8 SQT = 353, Com estas formações já é possível trar uma coclusão a respeto da regressão, já que a soma dos quadrados dos resíduos é uma parcela bem pequea do total ou, o que é equvalete, a soma dos quadrados explcados é uma parcela mportate. Esta proporção é cohecda como poder explcatvo, coefcete de determação, ou smplesmete R : R SQE 3893, = =,983 = 98,3% SQT 353, Repare que é mpossível que SQE seja maor do que SQT, e como é uma soma de quadrados, ão dá para ser egatvo. Etão, em qualquer regressão, R, portato é váldo expressá-lo como um percetual. Como o R ecotrado fo 98,3% dzemos que 98,3% da varâca de Y é explcada pela varável X, o que dca que a regressão de Y por X apresetou um resultado (muto!) bom. Mas a aálse cotua. Na próxma colua colocaremos os graus de lberdade. Para a SQT, os graus de lberdade são os mesmos de uma varâca amostral ormal, sto é, (= = 9). Para a soma de quadrados dos resíduos, temos que lembrar que são resíduos de uma reta. Para uma reta, sabemos, são ecessáros dos potos. Mas, com apeas dos potos, ão teríamos varação ehuma (e portato ehum resíduo). Os graus de lberdade em relação aos resíduos são, desta forma, (= = 8). E, quato à SQE, há dos racocíos: ou a dfereça (9 8 = ) ou o fato de que há apeas uma varável explcatva (afal, é uma regressão smples). Portato: Soma de quadrados g.l. SQE = 3893,
201 SQR = 6,8 8 SQT = 353, 9 99 Agora, os resta calcular as varâcas propramete dtas ou, como preferem algus, os quadrados médos, dvddo-se as somas de quadrados pelos respectvos graus de lberdade. Soma de quadrados g.l. Quadrados médos SQE = 3893, 3893, SQR = 6,8 8,7678 SQT = 353, 9 658,59 O que remos testar, agora, é se estatstcamete falado, a varâca explcada é maor do que a varâca dos resíduos, sto é, um teste de comparação de varâcas. Se rejetarmos a hpótese ula de que as varâcas são guas, a regressão explca mas do que ão explca e etão cosderaremos a regressão como válda. O teste F é feto dvddo-se uma varâca pela outra. Mas, para realzarmos, é ecessáro que as varáves das quas foram obtdas as varâcas sejam ormas. Portato, para realzar este teste ecesstamos que a varável Y seja ormalmete dstrbuída. Como ela é composta de uma reta (fxa), mas um erro aleatóro, a varâca de Y será dada pela varâca do erro. Portato, uma hpótese adcoal sobre o erro, a de que ele segue uma dstrbução ormal. Façamos etão o teste F: Soma de quadrados g.l. Quadrados médos teste F SQE = 3893, 3893, 896,75 SQR = 6,8 8 34,45 SQT = 353, 9 658,59 Pela tabela, o valor lmte da dstrbução F com grau de lberdade o umerador e 8 graus de lberdade o deomador, com 5% de sgfcâca é: F,8 = 4,4 Como O F calculado é maor do que o tabelado (este caso, bem maor) rejetamos a hpótese ula, sto é, a regressão é válda a 5% de sgfcâca. Exemplo 8..3 Teste a sgfcâca dos parâmetros da regressão obtda o exemplo 8.. Testar a sgfcâca dos parâmetros sgfca testar a hpótese ula de que α e β são, a verdade, guas a zero. Isto é, será que α ou β de fato, ão exstem, e o valor que ecotramos é apeas resultado da amostra? Isto equvale a testar as segutes hpóteses para β (e depos também para α): H : β = H : β Como são varáves ormalmete dstrbuídas (matedo-se a hpótese do exemplo ateror) que ão cohecemos ao certo a varâca, a dstrbução a ser utlzada é a t, de Studet. Os valores tabelados com 8 (= ) graus de lberdade com %, 5% e % (bcaudas) são:
202 t (8,%) =,73 t (8,5%) =, t (8,%) =,88 E o valor calculado da estatístca é dado por: ˆ β S ˆ β = ˆ β S ˆ β Isto é, basta dvdr o coefcete ecotrado pelo seu desvo padrão. A questão agora ecotrar o desvo padrão de βˆ. Sabemos que: Etão: βˆ = x y x var(βˆ ) = var( x var(βˆ ) = ( ) x x y x ) var(y ) O estmador desta varâca (valor amostral) será: x S ˆ β = ( ) x var(resíduos) Já que a varâca de Y dado X, sto é, a varâca de Y o modelo de regressão é a própra varâca dos resíduos, que já calculamos a tabela ANOVA e é gual a 34,45 e fo obtda através da expressão SQR/(-). S ˆ β = S ˆ β = O cálculo da estatístca é etão: SQR/( - ) x 34,45,6 S,4 βˆ 99, ˆ β S ˆ β =,7,4 3, Como o valor calculado é superor aos valores tabelados (clusve para %), rejetamos a hpótese ula de que β é gual a zero. Dzemos, etão que β é estatstcamete dferete de zero a % de sgfcâca, ou, smplesmete, é sgfcate a %.
203 O procedmeto para α é quase o mesmo. A dfereça está o cálculo do seu desvo padrão. Sabemos que: αˆ = Y βˆ X var(αˆ ) = var( Y βˆ X ) var(αˆ ) = var( Y) + var(βˆ X) Y var(αˆ ) = var( ) + X var( βˆ ) Cujo estmador será dado por: S ˆ α = - S ˆ α = SQR + X SQR/( - ) x SQR X [ + - x ] 54, S ˆ α = 34,45 ( + ) 4,36 Sαˆ 6,4 99, O cálculo da estatístca será etão: ˆ α S ˆ α = 8,5 6,4 4,4 Que é superor aos valores tabelados, portato α também é sgfcate a %. Exemplo 8..4 Com uma amostra cotedo 6 observações de duas varáves Y e X, foram obtdos os segutes resultados: ΣX = 5775 Σx = 553,4375 ΣY = 885,35 Σy = 58567,4375 ΣXY = 7764,4 Σxy = 3587,59375 ΣX = 869 ΣY = 98, Sedo x = X X e y = Y Y. Estme os parâmetros da reta de regressão e teste sua sgfcâca, assm como a valdade da regressão. Os parâmetros da regressão serão dados por: x y 3587,59375 βˆ = =,35 x 553,4375 αˆ = Y βˆ X = O modelo ecotrado é, etão: Ŷ =,5 +,35X 98, 6 869,35,5 6
204 Para testar a valdade da regressão motamos a tabela ANOVA. Para sso, calculamos as somas dos quadrados: SQT = Σy = 58567, SQE = βˆ Σx = 579,75 SQR = SQT SQE = 5847,37 Soma de quadrados g.l. Quadrados médos teste F SQE = 579,75 579,75 6, SQR = 5847, ,67 SQT = 58567, 5 394,47 Na tabela F, com grau de lberdade o umerador e 4 o deomador, a 5%, o valor ecotrado é 4,6. De ovo, o valor ecotrado é (bem) maor do que o tabelado, portato, acetamos a valdade da regressão (com folga). De quebra, podemos calcular o poder explcatvo (R ): R = 579, , =,9 Quato à sgfcâca de cada um dos parâmetros, temos que os desvos padrão são guas a (verfque!): S αˆ =,95 S =,99 βˆ As estatístcas t serão, portato: ˆ α S =,5,3 ˆ α, 95 ˆ β S =,35,, 99 ˆ β E os valores crítcos para a dstrbução t de Studet, com 4 graus de lberdade são: t (4,%) =,76 t (4,5%) =,4 t (4,%) =,98 Como o valor ecotrado para β é superor a todos estes valores, temos que ele é sgfcate a %. Já para α, ocorre o cotráro, portato cocluímos que α ão é sgfcate, o que vale dzer que ão podemos rejetar a hpótese de que α é zero. Poderíamos dzer smplesmete que o tercepto ão exste (do poto de vsta estatístco). O procedmeto agora sera, portato, retrar o tercepto, sto é, estmar ovamete a regressão sem o coefcete α, o que é feto o exemplo segute.
205 Exemplo 8..5 Tedo em vsta que o tercepto da regressão do exemplo 8..4 se mostrou estatstcamete sgfcate, estme ovamete a regressão, desta vez sem o tercepto. Trata-se, portato, de estmar os parâmetros de uma reta que passa pela orgem, sto é: Y = βx + ε Quado ecotramos o estmador de mímos quadrados, utlzamos um truque de substtur as varáves orgas (X e Y) pelas varáves cetradas. O objetvo era, exatamete, elmar o tercepto da equação. Como ele agora ão exste mesmo, o estmador de mímos quadrados será o mesmo, exceto pelo fato que ão usaremos mas varáves cetradas. 3 βˆ = X Y X Substtudo pelos valores dados o exemplo 8..4: βˆ = 7764,4 5775, O modelo será etão dado por: Ŷ =,X E para o teste do coefcete ecotrado precsaremos do desvo padrão do mesmo. Temos que a soma dos quadrados explcados pela regressão é dada por: SQE = βˆ ΣX 8657,3 A soma dos quadrados dos resíduos será, portato: SQR = SQT SQE = ΣY βˆ ΣX = 885, ,3 = 5854,5 E assm, podemos ecotrar a varâca dos resíduos (que é a própra varâca da regressão): var(resíduos) = S = SQR 5854, 5 = - 5 = 39,7 Repare que usamos e ão como fazíamos quado a regressão cluía o tercepto. Isto é fácl de eteder já que, ao exclur o tercepto, mplctamete supomos cohecer a exstêca de pelo meos um poto da reta, que é a orgem, o que os faz gahar um grau de lberdade. Para calcular a varâca (e o desvo padrão) do coefcete βˆ usamos a mesma fórmula já usada aterormete, apeas trocado o x (cetrado) pelo X : S ˆ β = SQR/( -) X 39,7 =,676 S, βˆ
206 4 Portato, a estatístca t será: ˆ β S =, 7, 8 ˆ β O que, evdetemete, é maor do que os valores tabelados. Em todo o caso, estes valores, para 5 graus de lberdade, são: t (5,%) =,75 t (5,5%) =,3 t (5,%) =,95 E, óbvo, o valor ecotrado, 7, é (bem) maor do que os valores tabelados, etão o coefcete é sgfcate a %. Até o R tem que ser vsto com reservas quado se trata de uma regressão sem tercepto, sto porque à medda que usamos varáves ão cetradas, ele é dferete do R usual, e ambos ão podem ser comparados 9. Este R especal para modelos sem tercepto é cohecdo como R ão cetrado ou R bruto. Neste caso, ele será: R 8657,3 NC = =, ,35 Quado comparamos os resultados obtdos os dos modelos (com e sem tercepto), verfcamos que as dfereças etre os coefcetes β é muto pequea. O desvo padrão, quado a estmação fo realzada sem tercepto, fo meor (o que é uma vatagem). De fato, se a reta realmete passa pela orgem, é razoável que uma estmação que leve sto em cota seja mas precsa. Há que ressaltar, o etato, que uma estmação sem o tercepto tem mplícta a hpótese que a reta passa pela orgem, o que pode, em algus casos, ser uma hpótese um pouco forte. Além dsso, como vmos, os resultados ão são tão dferetes, o que faz com que, a maora dos casos, os beefícos ão compesem os custos (de um possível erro a especfcação e das peculardades a avalação do modelo), assm sedo, a estmação sem o tercepto só é recomedável se exstr uma razão muto forte para acredtar que a reta passe mesmo pela orgem A hpótese de ormaldade Até agora, fzemos duas hpóteses sobre o modelo de regressão: a de que os erros tem méda zero e de que eles são ormalmete dstrbuídos, hpótese esta que fo utlzada para a realzação dos testes de hpótese acerca da regressão e de seus parâmetros. As hpóteses vstas até agora podem ser resumdas assm: I) E(ε ) = (erros têm méda zero). II) erros são ormalmete dstrbuídos. É razoável assumr que os erros sejam ormalmete dstrbuídos? Sm, se partrmos do sgfcado do termo de erro, sto é, uma soma de fatores que ão foram cluídos o modelo (até 9 Repare que, se usarmos o R com as varáves cetradas, o resultado pode ser egatvo.
207 porque ão é possível). Se magarmos que são mutos os fatores, a soma deles segurá uma dstrbução ormal, pelo Teorema do Lmte Cetral 9. Etretato, se sto ão for cosderado satsfatóro, é sempre possível testar a hpótese de que os resíduos sejam ormas e que, portato, são orgados de erros também ormas e assm termos maor seguraça em relação aos testes de hpóteses 9. Um teste muto utlzado para sso é o de Jarque-Bera. O teste de Jarque-Bera utlza os resultados para os mometos 93 da dstrbução ormal, em partcular os coefcetes de assmetra (que é zero para a dstrbução ormal) e de curtose (que vale 3). O coefcete de assmetra para os resíduos é dado por: A = 3 ˆ ε = σ E o de curtose: C = ˆ ε = σ 4 O teste de Jarque-Bera é feto através da segute estatístca: JB = 6 [A + 4 (C 3) ] 5 Demostra-se que, sob a hpótese ula de que os resíduos sejam ormalmete dstrbuídos, a estatístca JB coverge asstotcamete para uma dstrbução χ com graus de lberdade. Exemplo 8.3. Na tabela abaxo são mostrados os resíduos da regressão do exemplo 8..4 Teste a ormaldade dos mesmos.,34-8,453 3,47-3,5 3,98-8,79,33,33 -,67 6,59-7,946-9,839 -,39-6,44 -,96 6,9 Calculamos a varâca deste cojuto de valores (depedete de sabermos que se tratam de resíduos de uma regressão 94 ), e depos o desvo padrão: σ 365,46 σ 9, O coefcete de assmetra é dado por: A = 3 ˆ ε =,35 = σ E o de curtose: 9 Se a méda segue uma dstrbução ormal, basta multplcarmos por e teremos a soma que será, portato, ormalmete dstrbuída também. 9 Isto para amostras pequeas, já que é possível mostrar que a razão etre o coefcete e seu desvo padrão coverge para uma dstrbução ormal padrão sob a hpótese ula de que o coefcete seja zero. 93 Veja o apêdce 4.B. 94 Isto é, dvdmos por e ão -.
208 6 C = = 4 ˆ σ ε =,656 A estatístca de Jarque-Bera será dada etão, por: JB = 6 [A + 4 (C 3) ] =,5443 Na tabela χ verfcamos que, para graus de lberdade o valor crítco (para % de sgfcâca) é 4,6. Como o valor ecotrado para a estatístca JB é feror, acetamos a hpótese ula de que os resíduos são ormas. Ou, em outras palavras, ão é possível, estatstcamete falado, rejetar a hpótese que a dstrbução destes resíduos seja ormal. 8.4 Propredades dos estmadores de mímos quadrados 8.4. O estmador de β é ão vesado? A resposta a esta perguta remete a esperaça do estmador: E( βˆ ) = E x y x E( βˆ ) = E + ) ( x x x ε β E( βˆ ) = E + ) ( x x βx ε Como a esperaça da soma é a soma das esperaças: E( βˆ ) = E x βx + E x x ε E ada temos que β é uma costate, portato: E( βˆ ) = E x x β + E x x ε E( βˆ ) = E(β) + E x x ε E( βˆ ) = β + E x x ε Voltemos a ossa ateção para o termo detro da esperaça: cosderemos que os valores x são fxos ou, para ser mas precso, fxos em amostras repetdas. O que sgfca que, se ossa amostra é de móves, um dado móvel é sorteado a amostra, ele tem uma certa área. Se fzermos uma ova amostragem, e este móvel for sorteado de ovo, rá apresetar exatamete o mesmo valor para área. Este valor é fxo, ão depede de probabldade, portato a área de um móvel se equadra esta hpótese.
209 7 Isto ão se aplcara, por exemplo, se a varável fosse a ota de um aluo em um teste. O mesmo aluo, fazedo um mesmo teste (ou tpo de teste) uma seguda vez ão ecessaramete trara a mesma ota. Isto depede de uma dstrbução de probabldade, x é este caso uma varável estocástca. Se a varável x for fxa em amostras repetdas (como a área de um móvel), etão cada x pode ser tratado como uma costate: E( βˆ ) = β + E( ε x ) x E(ε x ) = x E(ε ) = Já que E(ε ) =. Portato: E( ε x ) E( βˆ ) = β + x = β Desta forma, βˆ é um estmador ão vesado do coefcete β. Adcoamos etão uma tercera hpótese: I) E(ε ) = (erros têm méda zero). II) erros são ormalmete dstrbuídos. III) x são fxos (ão estocástcos). Isto sgfca que, se a varável x for estocástca, o coefcete será ecessaramete vesado? Não, mas para sso teríamos que mater a codção de que E(ε x ) =, o que equvale dzer que a correlação (e a covarâca) etre ε e x é ula. Se ão, vejamos: cov(ε, x ) = E(ε x ) E(ε )E(x ) = E(ε x ) Já que E(ε ) =. Assm, podemos garatr que o estmador é ão vesado com uma hpótese mas fraca. O cojuto de hpóteses sera, este caso: I) E(ε ) = (erros têm méda zero). II) erros são ormalmete dstrbuídos. III*) E(ε x ) = (x ão são correlacoados com os erros) Efcêca e MELNV Se, além das hpóteses I e III, os erros tverem varâca costate e ão forem autocorrelacoados (o erro de uma observação ão é correlacoado com o de outra, sto é, os erros são depedetes), o Teorema de Gauss-Markov 95 mostra que o estmador de mímos quadrados βˆ apreseta a meor varâca etre todos os estmadores de β que são leares e ão vesados, sedo portato um MELNV. Acrescetamos etão, mas duas hpóteses 96 : 95 Veja a demostração o apêdce 8.B. 96 As hpóteses I, II, IV e V podem ser stetzadas por ε ~ N(, σ ), sto é, os erros são ormal e depedetemete dstrbuídos com méda zero e varâca σ.
210 8 I) E(ε ) = (erros têm méda zero). II) erros são ormalmete dstrbuídos. III) x são fxos (ão estocástcos). IV) var(ε ) = σ (costate) V) E(ε ε j ) =, j (erros ão são autocorrelacoados). Se ada levarmos em cota a hpótese de ormaldade, é possível demostrar 97 que o estmador βˆ tem a meor varâca etre todos os estmadores ão vesados de β, ou seja, é um estmador efcete Modelos ão leares Mutos modelos ão leares são faclmete learzáves. Por exemplo, o modelo abaxo: Y = α + βx + ε Pode se torar um modelo lear através da segute trasformação: Z X E, desta forma: Y = α + βz + ε É um modelo lear e pode ser estmado da mesma maera que víhamos fazedo. Dos mutos modelos que podem ser trasformados em leares, dos se destacam. Um deles é o modelo multplcatvo: Y = αx β ε Aplcado logartmo dos dos lados da equação: log Y = log (αx β ε ) log Y = log α + logx β + log ε log Y = log α + β logx + log ε Fazedo: Y = log Y α = log α X = log X µ = log ε Chegamos a um modelo lear: Y = α + βx + µ Em que as varáves estão em logartmos, por sso mesmo este modelo é também cohecdo como log-log. 97 Através da desgualdade de Cramer-Rao.
211 9 É teressate otar o sgfcado do coefcete β este tpo de modelo. Isto pode ser feto dervado Y em relação a X: Y = αβx β- ε = αβx β ε = βy X X X Portato, β será dado por: β = Y X X Y Aproxmado a dervada pelo taxa de varação dscreta: β Y X = X Y Y Y X X = varação percetual de Y varação percetual de X Ou seja, quado o modelo é estmado com as varáves em logartmo, o coefcete β sgfca a razão etre as varações relatvas (percetuas) das varáves Y e X, ao vés das absolutas, quado a regressão é feta com os valores orgas das varáves. Esta razão também é cohecda como elastcdade de Y em relação a X. Um outro tpo de modelo mportate é o expoecal: Y = αe βx ε De ovo, aplcado logartmo 98 os dos lados da equação temos: logy = log(αe βx ε ) logy = log α + log e βx + log ε logy = log α + βx + log ε E, ovamete, fazedo as trasformações: Y = log Y α = log α µ = log ε Temos ovamete um modelo lear: Y = α + βx + µ Ode uma das varáves fo trasformada o seu logartmo e por sso mesmo este modelo é cohecdo como log-lear. β: E, da mesma forma, dervamos Y em relação a X para ecotrar o sgfcado do coefcete Y = βαe βx ε = βy X 98 Embora este caso seja mas prátco aplcar o logartmo atural (base e), é mportate ressaltar que tato faz qual é a base do logartmo, pos o valor do coefcete β será o mesmo.
212 Portato: β = Y Y X Repetdo a aproxmação, temos: Y Y β = = Y varação percetual de Y = Y X X varação absoluta de X Se a varável X represetar o tempo, o coefcete β represeta a taxa de crescmeto (médo) da varável Y ao logo do tempo. Exemplo 8.6. A tabela abaxo forece o volume de vedas em uma empresa ao logo do tempo. Determe sua taxa de crescmeto aual médo. ao vedas ao vedas Para determar a taxa de crescmeto médo, devemos fazer uma regressão do tpo loglear, em que a varável Y é o logartmo das vedas e X é varável tempo. X Y X Y 6, ,5755 7,9 9 8,89 3 7,793 8, ,4955 9, ,8438 9, ,77 3 9, , ,497 Note que a mudaça a varável tempo (X), que em vez de começar por 986, começa por, ão afeta a taxa de crescmeto.(por que?) O resultado da regressão é: Y = 6,77 +,73X (,7) (,8) Ode os úmeros etre parêteses são os desvos padrão dos coefcetes. A taxa méda de crescmeto aual é, portato,,73 ou,73% ao ao. 8.7 Regressão múltpla
213 E se a varável depedete (Y) depeder (com o perdão da redudâca) de mas de uma varável? Temos, etão, que colocar mas X (varáves depedetes) a equação. O modelo etão, de um modo geral, sera como o dado abaxo: Y = β + β X + β 3 X β k X k + ε Como há mas de uma varável depedete, este modelo é cohecdo como de regressão múltpla. Para estmar os coefcetes β faremos da mesma maera que fzemos com a regressão smples, utlzaremos o método dos mímos quadrados. Mas se fzermos exatamete como fzemos aterormete, dá para perceber que será um pouco complcado e será tão mas complcado quato mas varáves depedetes houver. Faremos um pequeo truque que trasformará o modelo acma a uma forma smlar a da regressão smples. Se dspusermos as observações, teremos: Y = β + β X + β 3 X β k X k + ε Y = β + β X + β 3 X β k X k + ε Y = β + β X + β 3 X β k X k + ε As equações acma podem ser reescrtas em forma de matrzes: Y X X 3... X k β ε Y = X X 3... X k. β + ε Y X X 3... X k β k ε (x) (xk) (kx) (x) Ode os valores etre parêteses são as dmesões das matrzes. Repare que fazedo as respectvas operações com as matrzes chegaremos exatamete aos mesmo cojuto de equações. Reduzmos etão a: Y = Xβ + e Ode Y é um vetor (matrz lha) cotedo as observações da varável depedete Y; X é uma matrz que clu as dversas observações das varáves depedetes e clu uma colua de úmeros que correspodem ao tercepto; β é um vetor com os coefcetes a serem estmados e e é o vetor dos termos de erro. Exceto por ser uma equação com matrzes, essa equação é muto parecda com a de regressão smples. Melhor ada, é parecda com a equação de regressão smples sem tercepto. O estmador de mímos quadrados 99 para o vetor β será muto parecdo com o da regressão smples: βˆ = (X X) - (X Y) Repare que o produto X Y é aálogo a Σxy da regressão smples, equato o produto X X é aálogo a Σx. Como ão exste dvsão de matrzes, a multplcação pela matrz versa faz o papel da dvsão. 99 A dervação do estmador é feta o apêdce 8.B.
214 Uma codção para a exstêca de βˆ é a de que a matrz X X seja versível. Para que sto ocorra é ecessáro que ehuma colua da matrz X seja combação lear de outras. Em outras palavras, ão é possível que X seja exatamete o dobro de X 3 ou que X 4 seja gual a X + 3X 3, por exemplo. Assm, adcoamos ao osso cojuto de hpóteses mas uma, esta específca de regressões múltplas: I) E(ε ) = (erros têm méda zero). II) erros são ormalmete dstrbuídos. III) x são fxos (ão estocástcos). IV) var(ε ) = σ (costate) V) E(ε ε j ) =, j (erros ão são autocorrelacoados). VI) Cada varável depedete X ão pode ser combação lear das demas. Em otação matrcal, as hpóteses IV e V podem ser stetzadas como se segue: var(e) = σ I A matrz defda por var(e) é também chamada de matrz de varâca e covarâca dos erros. Nesta matrz a dagoal prcpal cotém as varâcas dos erros e os demas elemetos da matrz são as covarâcas etre os erros. Assm, o termo σ I cobre as duas hpóteses, já que é o mesmo σ que multplca os us da matrz detdade, e as covarâcas etre os erros (autocovarâcas) valem zero, pos a matrz detdade os elemetos fora da dagoal prcpal são zero. Exemplo 8.7. Com os dados da tabela abaxo, estme a regressão de Y em fução de X e X 3 e faça os testes da regressão e de cada um dos parâmetros. Y X X 3 8,8 6 4,7 58 6,5 8,4 89 7, 6, 7,8 89,7 83 9,6 74 8, 38 6,5 6 4,4 O modelo a ser estmado é: Y = β + β X + β 3 X 3 + ε A matrz X é dada por:
215 ,8 4,7 6,5 8,4 7, X =,,8,7 9,6 8, 6,5 4,4 Ode a colua preechda por us, como vmos, se refere à varável X, que a verdade ão é uma varável, é o tercepto. A matrz X X será dada por: 87 5,9 X X = ,9 4 3,53 E a sua versa:,5 -,9 -,4 (X X) - -,9,,3 -,4,3,67 A matrz X Y será: X Y = O estmador βˆ será dado, etão, por: 789,33 βˆ = (X X) - X Y = 49,56-49,6 Assm sedo, o valor de cada um dos parâmetros é: βˆ = 789,33 βˆ = 49,56 βˆ 3 = 49,6 E, portato, o modelo estmado é: Ŷ = 789, ,56X 49,6X 3 Se substturmos os valores de X e X 3 a equação acma, podemos ecotrar os valores de Y explcados pela regressão ( Ŷ ), e daí os resíduos que são mostrados a tabela abaxo: 46,957 37,667-53,893 65,98 99,8-3,8783,949-9,766-97,57 9,8987 -,443-59,864 3
216 Cosderado a forma matrcal, os valores da tabela acma são os compoetes do vetor de resíduos ê. A soma dos quadrados dos resíduos será dada por: SQR = ê ê = 73444, 4 y y. Cosderado y o vetor das varáves Y cetradas, a soma dos quadrados totas será dada por SQT = y y = 7495 E a soma dos quadrados explcados pode ser calculada como: SQE = SQT SQR = , = 57558,98 Com sso, podemos costrur uma tabela ANOVA para esta regressão, da mesma forma que fazíamos para a regressão smples: Soma de quadrados g.l. Quadrados médos teste F SQE = 57558, ,49 66,8 SQR = 73444, 9 97,56 SQT = ,36 Os graus de lberdade dos quadrados explcados são agora (em vez de, como a regressão smples), tedo em vsta que há duas varáves explcatvas (depedetes), X e X 3. Os graus de lberdade dos quadrados dos resíduos são, desta forma, 9 (= 3). Para o modelo geral apresetado: Y = β + β X + β 3 X β k X k + ε Temos k varáves explcatvas, portato os graus de lberdade são, respectvamete, k e k. O teste F é feto comparado-se o valor calculado com o valor tabelado para graus de lberdade o umerador e 9 o deomador. Para 5% de sgfcâca, este valor é 4,6. Como o valor calculado (66,8) é maor, a regressão é válda. O R é calculado da mesma forma: R 57558,98 = =, Para testar a valdade de cada um dos parâmetros, temos que ecotrar a varâca de cada um deles. A varâca do vetor de parâmetros βˆ será dada por: var(βˆ ) = var[(x X) - X Y] O racocío é o mesmo que para a varâca de um escalar. O termo (X X) - X é uma costate, cosderado que X é uma costate. Se fosse um escalar, extraríamos da varâca elevado ao quadrado. Como é uma matrz, usamos a forma quadrátca. Além dsso, sabemos que a varâca de Y é σ I: var(βˆ ) = σ (X X) - X X(X X) - Há autores que chamam o tercepto de β. Neste caso, o úmero de varáves explcatvas sera represetado por k e os graus de lberdade seram k e -k-, respectvamete. Há que se tomar cudado com possíves cofusões: basta lembrar que o úmero de graus de lberdade dos quadrados explcados é o úmero de varáves explcatvas.
217 Como (X X) - X X é gual à detdade (matrz multplcada pela sua versa), temos: 5 var(βˆ ) = σ (X X) - Cujo estmador será dado por: S β ˆ = S (X X) - Que, para este exemplo, será dado por: S β ˆ = 97,56(X X) - 44,99-747,65-999,34 S β ˆ -747,65,34 57,85-999,34 57,85 34,76 Os valores da dagoal prcpal são as varâcas dos parâmetros, equato os demas valores represetam as covarâcas. Deste modo, as varâcas (e os desvos padrão) de cada parâmetro são: S β = 44,99 S β = 55,6 ˆ S β =,34 ˆ S β = 34,76 ˆ3 ˆ S β ˆ = 4, S β ˆ = 79,56 3 Assm, podemos calcular as estatístcas t para cada parâmetro: 789,33 = 5,8 55,6 49,56 =,5 4, 49,6 =,33 79,56 Os valores tabelados para a dstrbução t de Studet com 9 graus de lberdade são: t (9,%) =,83 t (9,5%) =,6 t (9,%) = 3,5 Como os valores calculados para o tercepto (β ) e para β são superores a todos os valores, estes são sgfcates a %. O valor para β 3 é feror ao valor tabelado para %, mas é superor ao tabelado a 5%, portato ele é sgfcate a 5%. Exemplo 8.7. A partr dos dados do exemplo 8.7., faça regressões smples de Y em fução de X e depos de X 3. Se fzermos as regressões smples ecotraremos os segutes resultados (os valores etre parêteses são os desvos padrão) Por exemplo, a covarâca etre os estmadores de β e β 3 é -999,34.
218 6 Ŷ = 59, ,98X R =,8987 (3,9) (6,67) Ŷ = 8,9 84,9X R =,69 (38,) (65,) Como se vê, os coefcetes ecotrados são dferetes daqueles que foram calculados a regressão múltpla. Por que sto acotece? Image que queramos estudar o volume de vedas de um determado bem: logcamete, se o preço ca, as vedas devem aumetar (o coefcete da regressão deve ser egatvo). Mas e se estver ocorredo uma recessão? Mesmo com o preço cado, as vedas podem car também. Se fzermos uma regressão smples com quatdades e preços, podemos ecotrar resultados estrahos (coefcete postvo). Isto sera evtado se cluíssemos a regressão uma varável como a reda, assm teríamos a fluêca da reda cluída em osso modelo. 8.8 Varáves dummy Uma varável dummy serve para represetar a fluêca de uma característca ou atrbuto qualtatvo. Por exemplo, se queremos saber se o sexo flueca o saláro, usamos este últmo varável depedete e cluímos uma sére de varáves que explcam o saláro (aos de estudo, tempo de empresa, etc.) e cluímos uma varável D com as segutes característcas: D =, se for homem, se for mulher Desta forma o coefcete da varável D represeta o quato as mulheres gaham a mas (ou a meos). Assm, se o coefcete da varável D for, por exemplo, sto sgfca que as mulheres, em méda, gaham reas a meos do que os homes. Isto também pode ser feto com uma varável qualtatva que possua 3 estados possíves. Por exemplo, o padrão de costrução de um móvel pode ser alto, médo ou baxo. Neste caso, precsaríamos de duas varáves dummy, que poderíamos defr assm: D =, se for baxo ou alto, se for médo D =, se for baxo ou médo, se for alto Ou, alteratvamete, assm: D =, se for baxo, se for médo ou alto
219 D =, se for baxo ou médo, se for alto 7 Exemplo 8.8. Do exemplo 8.7., adcoamos uma varável qualtatva, que represeta a exstêca ou ão de determado atrbuto. Y X X 3 atrbuto 8,8 sm 6 4,7 sm 58 6,5 sm 8,4 sm 89 7, sm 6, sm 7,8 ão 89,7 ão 83 9,6 ão 74 8, ão 38 6,5 ão 6 4,4 ão Estme a regressão de Y em fução das três varáves e faça as aálses pertetes. por: Para clurmos esta varável qualtatva o modelo, defmos a varável dummy D, defda D =, se ão exstr atrbuto, se exstr o atrbuto Com sto, as varáves seram: Y X X 3 D 8,8 6 4,7 58 6,5 8,4 89 7, 6, 7,8 89,7 83 9,6 74 8, 38 6,5 6 4,4 E devemos estmar o modelo: Y = β + β X + β 3 X 3 + β 4 D + ε Cujos resultados são: Ŷ= 536,9 + 6,87X 37,78X ,8D
220 (64,35) (5,34) (65,48) (3,6) 8 Ode, como de costume, os desvos padrão estão etre parêteses. Todos os coefcetes são sgfcates a % (verfque!). O resultado ecotrado dca que a preseça do atrbuto aumeta o valor de Y em 38,8 (a méda). A tabela ANOVA será: Soma de quadrados g.l. Quadrados médos teste F SQE = 797, ,59 366,56 SQR = 9854, 8 48,78 SQT = ,36 A regressão é válda (já que o valor tabelado para a dstrbução F a 5% é 4,7) e o R é,998. Exemplo 8.8. Supoha que, uma regressão para o preço de um móvel (meddo em reas),levamos em cota a área do mesmo (X ), um ídce que mede a qualdade dos servços dspoíves o barro (X 3 ) e duas varáves dummy que represetam o padrão de costrução do móvel, assm defdas: D = D =, se for baxo, se for médo ou alto, se for baxo ou médo, se for alto Os resultados obtdos foram: Ŷ= 6,34 +,7X +,78X 3 +,4D + 8,D (7,88) (,44) (,3) (5,6) (4,77) Qual a dfereça (em méda) etre o preço de um móvel de padrão baxo e de padrão médo? E etre um móvel de padrão médo e de padrão alto? Para um móvel de baxo padrão, temos D = D =, equato que, para padrão médo, D = e D =. Portato, o coefcete da varável D represeta a dfereça méda o preço de móves de padrão baxo e médo, que é, portato,.4 reas. Se o padrão for alto, etão D = D =. Portato, a dfereça etre móves de padrão alto e médo é represetada pelo coefcete da varável D, que é 8. reas. Um cudado especal deve ser tomado se a varável depedete for qualtatva. Como esta varável deve ter o mesmo tpo de dstrbução que o erro, se ela for ou, ela ão poderá ser, por exemplo, uma varável ormal. Quado este for o caso, algus métodos especas devem ser utlzados para sua estmação, métodos estes que são ecotrados em textos mas avaçados de ecoometra. 8.9 Seleção de modelos 8.9. R ajustado
221 Se atetarmos para os exemplos 8.7. e 8.8. (quado acrescetamos a varável dummy), verfcamos que houve um aumeto do R. Isto etretato, ão sgfca que o modelo estmado o exemplo 8.8. seja melhor, já que, se acrescetarmos varáves explcatvas, este sempre aumetará. O R é uma razão etre a soma dos quadrados explcados e a soma dos quadrados totas. Esta últma será a mesma, ão mportado quatas (ou quas) varáves explcatvas utlzemos. A soma dos quadrados explcados, justamete por ser uma soma de quadrados, quado acrescetamos uma varável explcatva, sempre terá agregada uma parcela postva ao seu total. Assm, o R, se os dá uma medda teressate do ajuste de um certo modelo, ão serve como comparação etre modelos que têm úmero de varáves explcatvas dferete. Para se fazer esta comparação, há que se usar uma medda dferete. O R pode ser calculado de duas maeras: R SQE SQR = = SQT SQT 9 Partdo da seguda forma, se dvdrmos o umerador e o deomador pelos respectvos graus de lberdade, obteremos um ovo R, ajustado pelos graus de lberdade, chamado smplesmete de R ajustado ou ada R : R = SQR/( - k) SQT/( -) Ao se fazer este ajuste pelos graus de lberdade, ecotramos um valor que pode ser usado para comparar modelos com úmero de varáves dferete. Ele ão tem as mesmas propredades do R, etretato: ele será o máxmo (que correspode ao caso em que ão há resíduos), mas pode ser egatvo. Exemplo Compare os modelos dos exemplos 8.7. e 8.8. pelo crtéro do R ajustado. Para o modelo do exemplo 8.7. temos: 73444, / 9 R = =, / Equato para o modelo do exemplo 8.8.: R = 9854,/ / =,99 Como o R ajustado é maor para o modelo do exemplo 8.8. (com a varável dummy), este modelo é melhor por este crtéro Crtéros de formação Ou, muto raramete, fcará a mesma, mas jamas cará.
222 Há quem cosdere que o R ajustado ão pue sufcetemete os graus de lberdade. Uma sére de autores propõem crtéros alteratvos, chamados crtéros de formação, e os mas cohecdos são os de Schwarz (CIS) e de Akake (CIA) 3 : SQR k l CIS = + l π + l + SQR k CIA = + l π + l + O processo de comparação é o mesmo, exceto que, para os crtéros de formação, quato meor o valor calculado, melhor o modelo. Exemplo Compare os modelos dos exemplos 8.7. e 8.8. pelo crtéro de formação de Schwarz. Calculado para o modelo do exemplo 8.7. temos: CIS = 3,4 E para o modelo do exemplo 8.8. (com a varável dummy): CIS =,8 E, ovamete, o melhor modelo é o do exemplo 8.8., pos apresetou meor CIS. Exemplo Compare os modelos dos exemplos 8.7. e 8.8. pelo crtéro de formação de Akake. Calculado para o modelo do exemplo 8.7. temos: CIA =,9 Para o modelo do exemplo 8.8., temos: CIA =,9 De ovo, o modelo do exemplo 8.8. apresetou meor CIA e deve ser cosderado o melhor etre os dos Usado o teste F para selecoar modelos Uma outra maera de escolher etre dos modelos, quado acrescetamos ou retramos varáves é utlzado o teste F. Isto é feto pela comparação da soma dos quadrados dos resíduos etre os dos modelos. O modelo com maor úmero de varáves chamaremos de ão restrto, equato o que tem meos de restrto (já que, este modelo, é como se estvéssemos mpodo a restrção de que algumas das varáves têm coefcete zero). E as somas dos quadrados dos resíduos em cada modelo serão SQRNR e SQRR, respectvamete. 3 A parcela + log π é costate e pode ser omtda para efeto de comparação. A sua preseça decorre do logartmo da verossmlhaça (veja o apêdce 8.B).
223 A estatístca é calculada da segute forma: SQRR - SQRNR F = m SQNR - k Ode m é o úmero de varáves que a equação ão restrta tem a mas. Que, sob a hpótese ula de que ão há melhora o modelo, segue uma dstrbução F com m graus de lberdade o umerador e -k graus de lberdade o deomador. Exemplo Compare os modelos dos exemplos 8.7. e 8.8. pelo teste F. Neste caso, o modelo com a varável dummy (exemplo 8.8.) é o modelo ão restrto e o que ão tem (exemplo 8.7.) é o restrto. Temos que: SQRR = SQRNR = 9854, m = O cálculo da estatístca é dado por: , F = = 6, , 8 E, como o valor tabelado para a dstrbução F com grau de lberdade o umerador e 8 o deomador, a 5% de sgfcâca, é 5,3, rejetamos a hpótese ula e, portato, o modelo que cotém a varável dummy deve ser cosderado o melhor etre os dos.
224 Exercícos. Dados os valores de X e Y a tabela abaxo: X Y 6,9 3 8,7 - -5,8 3,4 3 8, 4,8 - -,6 6 a) estme os parâmetros da reta de regressão. b) costrua a tabela ANOVA. c) calcule R. d) faça os testes t e F.. Dados os valores de X e Y a tabela abaxo: X Y a) estme os parâmetros, calcule o R e faça os testes t e F. b) refaça os cálculos do tem a utlzado, em vez dos valores orgas, os logartmos. c) compare os resultados e explque. 3. Após uma regressão smples, ode se utlzou uma amostra com elemetos, foram tabulados os segutes dados: Soma dos quadrados SQE = 3 SQT = 89 a) complete a tabela ANOVA b) calcule o R c) faça o teste F. 4. Para uma amostra de observações de X e Y foram obtdos: Σx = Σy = 36 Σxy = -88 X = 464 Y = 447, a) estme os parâmetros da reta de regressão. b) costrua a tabela ANOVA. c) calcule R. d) faça os testes t e F.
225 3 5. Os resultados de uma regressão etre preço de móves e suas áreas foram os segutes: PREÇO = +, ÁREA (5) (,3) ode os valores etre parêteses são os desvos padrão. Teste a sgfcâca dos parâmetros, sabedo que fo utlzada uma amostra de observações. 6. Mostre que: Σx = ΣX - X Σy = ΣY - Y Σxy = ΣXY - X Y 7. Mostre que o R em uma regressão smples é o própro coefcete de correlação etre X e Y ao quadrado. 8. Mostre que, uma regressão smples βˆ = cov( X, Y ). var( X ) 9. Em que codções o estmador de mímos quadrados ordáros é ão vesado? Ecotre exemplos em que sto ão ocorre.. Em que codções o estmador de mímos quadrados ordáros é efcete ou, pelo meos, é o MELNV? Ecotre exemplos em que sto ão ocorre.. Os resultados de uma regressão para o PIB de um país são dados abaxo: PIB =,4 +,4t Ode t é o tempo meddo em aos e o PIB é aual, meddo em logartmos.. Qual o sgfcado dos coefcetes ecotrados?. A tabela abaxo mostra o úmero de homcídos regstrados por dversos dstrtos polcas da cdade de São Paulo e a reda méda dos respectvos dstrtos. Faça uma regressão do úmero de homcídos em fução da reda usado as varáves em ível e em logartmos, fazedo os testes relevates. Comete os resultados. homcídos 996 Reda (US$) homcídos 996 Reda (US$) homcídos 996 Reda (US$) 3 58, 9 65, , 7 57, , , ,3 5 7,9 4 5,9 5 58, 4 56, , , , ,9 9 79,68 39, , , , 4 398, ,9 4 55, 3, ,43 388, ,33 5 7, , ,9 34 7, ,34 837, , ,47 9 6, 7 544, ,47 43,4 33, , ,6 6 69, , ,8 39, ,4 5 6, 736, , ,36 544,63 496,8 7 34, , , , , 8,5 3 47,3 897, ,4 3 65,3
226 , , ,3 74,78 8, , 43, , , 34 5,35 876, ,44 Fote: Sartors, A. () Homcídos a Cdade de São Paulo. mmeo. FEA/USP. São Paulo 3. Para cada cojuto de observações abaxo, estme os parâmetros da regressão com e sem tercepto, fazedo os testes relevates. Comete os resultados a) Y X b) X = 4,4 Y =7,79,9, ΣX = 34,95,6 3,5 ΣY = 664,45 3,3 5, ΣXY = 6,63 4,9 6,,6 4,4 4,3 5,6 5,8 7, 4, 6,,8 4,8 7,8 9,8 6,3 7, 5,4 7,7 7,3 8,3 6, 6,8 4,9 5,9 4.. Após uma regressão com 5 varáves explcatvas, ode se utlzou uma amostra com 3 observações, foram tabulados os segutes dados: Soma dos quadrados SQE = 39,7 SQT = 345,8 a) complete a tabela ANOVA b) calcule o R e o R ajustado. c) faça o teste F. 5. Numa regressão com 4 varáves explcatvas e uma amostra de 6 observações, a soma dos quadrados explcados fo 788,56 e a soma dos quadrados dos resíduos 567,34. Ao acrescetarmos duas varáves ao modelo, a soma dos quadrados explcados aumetou para 895,8. Verfque se este modelo é melhor do que o ateror, usado o R ajustado, os crtéros de formação e o teste F. 6. Dados os gráfcos abaxo, qual o resultado esperado para o sal de βˆ e o valor de R?
227 7. Na tabela abaxo são dados, para város móves, a área (em m ), o padrão de costrução (alto, médo ou baxo), o úmero de dormtóros, de baheros, de vagas a garagem, se há ou ão psca e o preço do móvel (em reas). Faça uma regressão do preço em fução destas característcas. A segur, teste a sgfcâca dos parâmetros e, se for o caso, elme um ou mas e refaça a estmação. Use os crtéros vstos o texto e compare os dos modelos. Repta o procedmeto até ecotrar o modelo que melhor explque o preço dos móves. Iterprete os resultados obtdos. área padrão dorm vagas psca baheros preço médo sm 88,9 5 alto 3 sm 49, médo 3 sm 3 94,4 8 médo 3 ão 53,5 3 médo ão,7 89 médo ão 85,9 95 baxo ão 73,5 5 baxo ão 39,9 médo 4 3 sm 89,7 médo 3 sm 3 86,3 5 médo 6 3 sm 3 9,7 8 alto 4 sm 4 7, 35 alto 5 sm 4 339,5 5 alto 3 ão 55, 4 alto 3 ão 3,7 7 baxo ão 68,7 35 alto sm 57, 4 alto 3 sm 5, 8. Teste a ormaldade dos resíduos das regressões fetas os exercícos e Ecotre, em otação matrcal, as expressões para a SQE.. Assale verdadero ou falso: a) se os resíduos ão forem ormas, os testes de hpóteses ão serão váldos para qualquer tamaho de amostra. b) Numa regressão Y = α + βx + ε, o sgfcado de β é a elastcdade. c) O modelo log-lear serve para ecotrar taxas de crescmeto. d) Se a reta verdadera passa pela orgem, a estmação sem o tercepto forecerá estmadores mas precsos para β. e) O teste F para a regressão múltpla tem as segutes hpóteses ula e alteratva: H : β = β 3 =... = β k = H : todos os β f) Se aumetarmos o úmero de varáves explcatvas, o R uca será meor. g) Se as varáves depedetes X forem estocástcas, o estmador de β será vesado. h) Numa regressão Y = α + β X + β X + ε, se X = X + 3, ada assm é possível obter estmatvas para β e β. 5
228 6 Apêdce 8.A Matrzes Uma matrz é uma tabela de úmeros, como a matrz A mostrada abaxo: A = 3 Esta matrz A tem lhas e 3 coluas, dz-se que ela tem dmesões 3. Se uma matrz B tver as mesmas dmesões: B = 3 4 Podemos defr: A + B = 5 4 A B = E ada é possível defr o produto de uma matrz por uma costate: 3 A = A trasposta da matrz A, deomada A ou A t é uma matrz cujas lhas equvalem às coluas de A e vce-versa. A = 3 O produto de duas matrzes também é defdo. Ele é feto multplcado um a um os úmeros de cada lha de uma matrz pelos da colua da outra. Assm, se tvermos uma matrz C, de dmesões 3 : C = O produto AC será dado por: AC = 3 = ) ( 3 3 ) ( = 7 3
229 7 Note que a ordem dos fatores altera o produto quado se trata de matrzes. Veja que só é possível efetuar o produto de matrzes se o úmero de coluas da prmera for gual ao úmero de lhas da seguda e a matrz resultate terá o úmero de lhas da prmera e o úmero de coluas da seguda. A matrz resultate do produto AC é uma matrz que tem o mesmo úmero de lhas e coluas. Quado sto ocorre, dzemos que se trata de uma matrz quadrada. A matrz P = AC é uma matrz quadrada de ordem. Uma matrz quadrada especal é a detdade, cujos valores da dagoal prcpal são guas a e os demas valores são zero. I = I 3 = É fácl verfcar que a detdade é o elemeto eutro a multplcação de matrzes. Para uma matrz quadrada M, temos: IM = MI = M Não se defe dvsão de matrzes, mas, para matrzes quadradas é possível defr a versa, defda assm: MM = M M = I Por exemplo, para a matrz P calculada acma, temos que a sua versa será dada por (verfque!): P = 7 3 Com o coceto de matrz versa é possível, por exemplo, resolver a equação matrcal abaxo: AX = B Bastado, para sso, pré-multplcar os dos lados da equação pela versa de A: A AX = A B X = A B Vale a segute propredade: a trasposta da versa é gual a versa da trasposta: (M ) = (M ) O determate é um úmero assocado à matrz quadrada. Para uma matrz quadrada de ordem, temos:
230 8 det(p) = 7 3 = ( ) ( 3) 7 = Para uma matrz de ordem 3, toma-se a cada úmero da prmera lha, elmam-se a colua e a lha correspodetes e calcula-se o determate da matrz de ordem resultate, somado-se os três resultados: 3 = 3 + ( ) + 3 = + ( ) = 3 Para matrzes de ordes superores, o procedmeto é vertdo. Note que ão é possível verter uma matrz cujo determate é zero. Se uma matrz apresetar uma lha (ou colua) que seja uma combação lear de outra(s) lha(s) (ou coluas) seu determate é zero. Assm: Q = R = Tato a matrz Q, como a matrz R apresetam determate ulo, pos, a matrz Q a tercera lha é a soma das demas e, a matrz R, a tercera colua é o dobro da prmera. Só matrzes quadradas podem ser multplcadas por ela mesmo, ou seja, serem elevadas ao quadrado (ou à qualquer potêca), em fução do problema das dmesões. Portato, a operação: M = MM por: Só é possível se M for uma matrz quadrada. Etretato uma matrz X qualquer defda X = x w y v z t Apreseta as chamadas formas quadrátcas: XX = x + y + z xw + yv + zt xw + yv + zt w + v + t e X X = x + w xy + wv xz + wt xy + wv y + v yz + vt xz + wt yz + vt z + t Uma partcular forma quadrátca é quado X é uma matrz colua (vetor), sto é, de dmesões : x X = y
231 X X = [ y ] x + = x + y 9 Isto é, a forma quadrátca é um escalar (úmero), que é a própra soma dos quadrados. É possível ecotrar dervadas matrcas. Dada uma matrz (varável),, X e um vetor colua (costate),, b, temos: Xb = x z y w b xb + yc = c zb + wc A dervada de Xb é dada por: Xb = X X xb + yc / x / y = zb + wc / z / w xb + yc zb + wc x y = = X z w O operador, embora sozho ão sgfque ada, é tratado como uma matrz qualquer, X composta de operadores que são as dervadas em relação à x, y, z e w, que são multplcados pela matrz Xb como se fossem úmeros ormas. X' X X A dervada da forma quadrátca X X será dada por: x + z xy + wz / x / y x + z = = X xy + wz y + w / z / w xy + wz xy + wz y + w x y = z w = X Como se vê, a dervada de matrzes é aáloga à dervada em escalares. Quato aos operadores esperaça e varâca aplcados à vetores colua: x E(X) = E y E( x) = E( y) A varâca de um escalar é dada por E(x µ). Em otação matrcal, usaremos a forma quadrátca: var(x) = E(X µ)(x µ) = E ( x µ x ) var(x) = E ( x µ x )( y µ y ) x µ x y µ y ( x µ x )( y µ y ) ( y µ y ) [ x µ y µ ] x y Se aplcarmos o operador esperaça em cada um dos elemetos desta matrz, teremos: var(x) = var( x) cov( x, y) cov( x, y) var( y) Por sto a matrz var(x) é também chamada de matrz de varâca e covarâca de X.
232 APÊNDICE 8.B. Mas sobre regressão lear 3 8.B. Demostração do Teorema de Gauss-Markov A demostração será feta para o caso da regressão smples, sedo o da regressão múltpla aálogo. Imagemos um estmador de β qualquer, lear e ão vesado. Para que ele seja lear, ele deve ser obtdo através de uma fução lear das observações de y, o que é feto através dos pesos w : β* = Σw Y Para que ele seja ão vesado, além da codção usual sobre X, é ecessáro que valham as codções: Σw = e Σw X = Σw x = Se ão, vejamos: E(β*) = E(Σw Y ) = E[Σw (α + βx + ε )] = E(αΣw + βσw X + Σw ε ) = β + Σw E(ε ) = β Para o caso específco do estmador de mímos quadrados, o cojuto de pesos é dado por: x m = x Que segue as propredades especfcadas para w (verfque), além de uma adcoal: Σm x = ( ) x = x Estabelecdo que β* é um estmador ão vesado, calculemos a sua varâca: var(β*) = var(σw Y ) Mas sabemos que a varâca de Y é a própra varâca do termo de erro. Admtdo que ela seja costate e que os erros sejam depedetes (portato a varâca da soma é a própra soma das varâcas), temos que: var(β*) = Σw var(y ) var(β*) = Σw σ var(β*) = σ Σw Usado um pequeo truque: E, portato: w = w + m m = m + (w m ) Σw = Σm + Σ(w m ) + Σm (w m )
233 3 Σw = Σm + Σ(w m ) + Σm w Σm Σw = Σ(w m ) + Σm w Σm Σw = Σ(w m ) + x w x x Σw = Σ(w m ) + x x Σw = Σ(w m ) + x Substtudo, vem: var(β*) = σ Σw var(β*) = σ Σ(w m ) σ + x Mas o segudo termo é a própra varâca do estmador de mímos quadrados, assm: var(β*) = var( βˆ ) + σ Σ(w m ) E como o outro termo é uma soma de quadrados, é ecessaramete ão egatvo. Assm, a varâca de um estmador lear e ão vesado qualquer β* é, o mímo, gual a varâca de βˆ. Portato, a varâca de βˆ é a meor etre as varâcas de todos os estmadores leares e ão vesados, ou seja, βˆ é um MELNT. 8.B. Estmação por máxma verossmlhaça Faremos aqu a estmação por máxma verossmlhaça de uma regressão smples. As coclusões para a regressão múltpla são aálogas. O modelo para a regressão smples com as varáves cetradas é dado abaxo: y = βx + ε E o termo de erro é, portato: ε = y βx Se a dstrbução dos erros é ormal e eles são depedetes, ou seja: ε ~ NID (,σ ) Etão a fução de verossmlhaça terá a mesma forma fucoal de uma ormal multvarada 4 : L(β, σ ) = (πσ ) exp[ σ = ( y β x ) ] 4 Ver capítulo 5.
234 3 Ode exp(x) e x. Tomemos, etão, o logartmo de L: l(β, σ ) l[l(β, σ )] = l{ l(β, σ ) = l ( (πσ ) (πσ σ ) l(β, σ ) = l ( πσ ) σ l(β, σ ) = l ( πσ ) σ ) = = exp[ σ ( y β x ) ( y β x ) = ( y β x ) = ( y β x ) ]} Para ecotrarmos o poto de máxmo desta fução, devemos ecotrar as dervadas de l em relação a β e σ. Ecotramos os segutes resultados: x y βˆ = x Portato, o estmador de máxma verossmlhaça de β cocde com o estmador de mímos quadrados quado a dstrbução dos erros é ormal. O estmador de máxma verossmlhaça de σ é dado por: ˆ σ = SQR Dvde-se SQR por e ão por -k como a estmação por mímos quadrados. Repetdo o resultado do capítulo 5, o estmador de máxma verossmlhaça de σ é vesado. Voltado ao logartmo da fução de verossmlhaça: l(β, σ ) = l ( πσ ) σ = ( y β x ) Substtudo σ pelo seu estmador e lembrado que ( y β x ) é a soma dos quadrados dos erros (cujo estmador é SQR), o valor do logartmo da verossmlhaça será dado por: l(β, σ SQR ) = l (π ) SQR SQR l(β, σ SQR ) = l π l =
235 33 l(β, σ SQR ) = [l π + l + ] Assm, os crtéros de formação de Schwarz e Akake podem ser reescrtos da segute forma: CIS = l(β, σ k l ) + CIA = l(β, σ k ) + 8.B.3 Estmador de mímos quadrados da regressão múltpla O modelo de regressão múltpla é dado por: Y = Xβ + e Portato, o vetor de erros será dado por: e = Y Xβ A soma dos quadrados dos erros, em otação matrcal, é dada pela forma quadrátca, que é feta através da pré-multplcação da matrz pela sua trasposta. e e = (Y Xβ) (Y Xβ) e e = Y Y Y Xβ β X Y + β X Xβ e e = Y Y β X Y + β X Xβ Dervado em relação a β e gualado a zero: X Y + X X βˆ = X X βˆ = X Y Pré-multplcado por (X X) - (X X) - X X βˆ = (X X) - X Y Portato: βˆ = (X X) - X Y 8.B.4 Cosstêca do estmador de mímos quadrados Verfcaremos a cosstêca do estmador de mímos quadrados para a regressão smples, sedo a da regressão múltpla aáloga. Temos que: βˆ = x y x
236 34 Para que βˆ seja cosstete é ecessáro que: e lm E( βˆ ) = β lm var( βˆ ) = Para o prmero lmte, se são váldas as hpóteses báscas do modelo de regressão lear, βˆ será ão vesado mesmo para a amostras pequeas, portato ele se verfcará quado cresce também. Resta o segudo lmte. Lembrado que: σ var( βˆ ) = x E, como σ tede a ser meor à medda que a amostra cresce, temos que realmete lm var( βˆ ) = e, portato, βˆ é um estmador cosstete de β.
237 35
238 36 CAPÍTULO 9 VIOLANDO AS HIPÓTESES BÁSICAS No capítulo ateror, chegamos a algumas hpóteses báscas sobre o modelo de regressão lear, que apresetamos ovamete abaxo 5 : I) E(ε ) = (erros têm méda zero). II) erros são ormalmete dstrbuídos. III) x são fxos (ão estocástcos). IV) var(ε ) = σ (costate) V) E(ε ε j ) =, j (erros ão são autocorrelacoados). VI) Cada varável depedete X ão pode ser combação lear das demas. Em mutas stuações, etretato, estas hpóteses ão são verfcadas, especalmete aquelas em que o objeto de estudo é uma relação socal (como as relações ecoômcas, por exemplo), em que os dados ão são produto de um expermeto cotrolado (mas ão ecessaramete só estes casos). Partcularmete as quatro últmas hpóteses mutas vezes ão se verfcam em relações deste tpo. Durate o restate do capítulo, os dedcaremos às coseqüêcas, à detfcação e, se for o caso, o tratameto a ser feto quado cada uma destas quatro hpóteses é volada Volado a hpótese VI: a Multcoleardade A volação da hpótese VI é um caso extremo, que em termos estatístcos pode ser descrta como há correlação exatamete gual a (ou -) etre duas (ou mas) varáves explcatvas (depedetes). Quado ocorre sto, % da varação de uma delas é decorrete da varação de outra, sto é, como eucado a hpótese podemos escrever a prmera como combação lear da seguda, como os exemplos abaxo 7 : X = X X = X + 3 X = 4X - 5 Ou ada evolvedo mas de duas varáves: X = X + 3X Tomemos um deles o racocío será dêtco para todos o prmero em que uma varável é (exatamete) o dobro da outra: qualquer varação da seguda mplcará em varação proporcoalmete dêtca da prmera. É mpossível dstgur qual é a fluêca de uma ou de outra para a varável depedete Y. Por sso mesmo, é mpossível estmar um modelo de regressão lear em que há multcoleardade, pelo meos como etedda até aqu. 5 O úmero de hpóteses pode varar de autor para autor, bem como, obvamete, a ordem em que são apresetadas. Como vmos o capítulo ateror, é possível stetzar as I, II, IV e V em uma só (e ~ N(,σ I)). Algus autores adcoam algumas hpóteses que, embora sejam ecessáras, podem ser cosderadas óbvas, como a de que o úmero de observações tem que ser maor do que o úmero e varáves. 6 As coseqüêcas de que as duas prmeras hpóteses sejam voladas já foram dscutdas o capítulo ateror. 7 Note a ausêca de qualquer termo aleatóro, ao cotráro do que acotece o modelo de regressão.
239 37 Orgaramete, o termo multcoleardade fo defdo para quado a relação etre varáves explcatvas fosse como a descrta acma. Com o passar do tempo, o termo fo esteddo, e esta stuação passou a ser deomada de multcoleardade exata ou perfeta. O termo multcoleardade passou a desgar a alta correlação (alta, mas ão ecessaramete, em módulo), stuação em que é possível estmar o modelo, mas há alguma dor de cabeça assocada. Exemplo 9.. Queremos obter a fução cosumo de uma determada ecooma. Supoha que o cosumo é fução da reda e da taxa real de juros. Se assumrmos ada que esta relação é lear, teremos etão que a especfcação do modelo ecoométrco a ser estmado será dada por: C t = β + β Y t + β r t + µ t Ode C é o cosumo, Y é a reda acoal dspoível e r a taxa real de juros de uma determada ecooma. Os dados estão a tabela abaxo: Tabela 9.. ao/trmestre cosumo (US$ blhões) reda (US$ blhões) 99/ 7, 5,6, 99/ 75,6 97,4,5 99/3 89,6,, 99/4 93,7 8,, 99/ 9,,,5 99/ 84,6 5,3,75 99/3 9,8 5,4,5 99/4 8,9 3,6, 99/ 65,8,7,5 99/ 7,9 93, 3, 99/3 63, 98,3,5 99/4 86,3 8,,75 993/ 87, 5,8,5 993/ 79,3 99,8, 993/3 87,4,5,5 993/4,6 7,8,5 taxa de juros real (% a.a.) Os resultados da estmação do modelo são dados a tabela segute: Tabela 9.. coefcete desvo-padrão estatístca t costate,487 66,84,667 reda,374,88,98 taxa de juros real -6,97 3,34,84 estatístca F = 7,645 Repare que o valor tabelado da estatístca t cosderado-se % de sgfcâca e 3 graus de lberdade é,77, ou seja, apeas o coefcete da taxa de juros é sgfcate; se cosderarmos 5% (,6 como valor tabelado), todos os coefcetes ão são sgfcates.
240 Este resultado é, o mímo, um tato estraho. Imagar que o ível de cosumo ão depede da reda dspoível 8 é algo que surpreedera ão só aqueles famlarzados com a teora ecoômca, mas a qualquer pessoa de bom seso. O pesqusador precptado chegara à rápda e fácl (porém equvocada) coclusão de que a ecooma de que trata o exemplo é muto pecular. Se fosse rgoroso com relação à sgfcâca dos parâmetros, elmara as duas varáves do modelo e, ou formulara um ovo modelo, ou assumra que o cosumo esta ecooma ão pode ser explcado racoalmete; se, etretato, ão fosse tão rgoroso, e acetasse os % de sgfcâca, fcara com uma fução cosumo depededo apeas da taxa de juros. Aquele mas ateto, todava, va otar um pequeo detalhe os resultados apresetados a tabela 9..: a estatístca F. Note que o valor tabelado de F (com graus de lberdade o umerador e 3 o deomador) à 5% de sgfcâca é 3,8! Como o valor ecotrado fo em toro de 7,6, pelo teste F cocluímos que o modelo de regressão é váldo! Se a regressão fo valdada pelo teste F, a perguta que fca é: por que os dos parâmetros ão são sgfcates (pelo meos a 5%)? O que deu errado com o teste t? A resposta, este caso, pode ser ecotrada a própra atureza das varáves em sempre sso é possível, mas freqüetemete o é se lembrarmos que há uma forte fluêca (e portato correlação) da taxa de juros real sobre a reda. De fato, se calcularmos a correlação amostral etre a taxa de juros real e a reda e sto sempre é possível ecotraremos o valor de -,86. (Verfque!) A correlação etre as varáves do modelo é, portato, muto alta (em valores absolutos). E, de fato, esta é a causa do problema (e ão a loucura dos cosumdores desta ecooma) e é o que se chamamos, usualmete, de multcoleardade. Multcoleardade é a (alta) correlação etre duas (ou mas) varáves em um modelo de regressão múltpla. O deal sera, etão, que ão houvesse ehuma correlação etre as varáves? Cudado! Ada que ão exsta correlação populacoal etre as varáves do modelo, é pouco provável (quase mpossível, a verdade) que ão exsta ehuma correlação amostral 9. Além dsso, um modelo ecoômco, terações etre as varáves explcatvas são um fato da vda. Nossa preocupação deve se lmtar a quado esta correlação fca em valores próxmos a (ou -). 9.. Coseqüêcas da multcoleardade Uma delas já vmos o exemplo 9..: os testes t podem resultar sgfcates, ada que as varáves sejam relevates. Isto ocorre porque a varâca dos coefcetes das varáves 38 8 Poder-se-a argumetar que uma especfcação mas adequada da fução cosumo utlzara ão a reda presete, mas a reda passada, vsto que o cosumdor tomara suas decsões em períodos aterores; ou ada, que se devera utlzar a reda permaete. Nehum desses argumetos, o etato, explcara a ão sgfcâca da reda presete, pos esta certamete guarda forte correlação tato com valores passados como com a reda permaete. 9 Ademas, se ão houvesse ehuma correlação etre as varáves, sequer precsaríamos utlzar a regressão múltpla, pos os resultados das regressões smples, em separado, seram os mesmos. Este é um caso típco de expermetos cotrolados, ode as demas varáves são cotroladas, de modo que é possível verfcar a relação da varável depedete com cada uma das varáves em separado. Evdetemete, expermetos cotrolados ão são, em geral, possíves em cêcas socas.
241 explcatvas ( $ β, $ β, etc.) aumeta quado ocorre multcoleardade e daí o motvo dos testes t apresetarem baxa sgfcâca (ou mesmo ão serem sgfcates). Se ão, vejamos: As varâcas dos coefcetes a regressão múltpla são dadas por: S β ˆ = S (X X) - Se o coefcete de correlação for próxmo de (ou -) o valor do determate da matrz X (e, em coseqüêca, da matrz X X) será muto pequeo e, portato, as varâcas de $ β e $ β, etc. serão muto grades, daí os valores ecotrados os testes t. Mas ote: sto ão sgfca que os testes t sejam váldos. A varâca dos coefcetes estmados de fato é muto grade a preseça de multcoleardade. Podemos até ser levados a coclusões erradas do poto de vsta ecoômco, mas, do poto de vsta estatístco, o valor do coefcete, se sgfcate, ão pode ser cosderado dferete de zero em fução da sua alta varâca. E, como a varâca dos β $ é muto grade, podemos ter ada que: os sas dos coefcetes ( β $ ) podem ser o verso daqueles esperados; além do mas, seus valores fcam muto sesíves (mudam demas) quado se acresceta ou se retra uma varável do modelo ou quado há pequeas mudaças a amostra. Com relação às propredades dos estmadores, o etato, mesmo a preseça de multcoleardade, são matdas as propredades usuas do estmador de mímos quadrados, sto é, cotuam ão vesados, efcetes e cosstetes. Como coseqüêcas, as prevsões fetas a partr de um modelo com multcoleardade também têm estas mesmas propredades. 9.. Como detfcar a multcoleardade? De ovo reportado ao exemplo 9.., uma maera de detfcar a multcoleardade, ou, pelo meos, suspetar fortemete que ela exsta, é quado obtemos um teste F bastate sgfcate (ou um R alto) acompahado de estatístcas t para os coefcetes pouco sgfcates, ou até mesmo ão sgfcates. Sas dos coefcetes dferetes do esperado, especalmete quado ele é muto esperado (sal do preço a fução demada e/ou oferta, ou como o exemplo 9.., o sal da reda e da taxa de juros a fução cosumo) já é, pelo meos, uma evdêca de multcoleardade. No própro exemplo 9.., verfcamos que o cálculo dreto da correlação etre as varáves também é uma forma de detfcar a preseça de multcoleardade. O cálculo da correlação, o etato, pode ão fucoar muto bem quado temos mas do que duas varáves o modelo. Quado calculamos a correlação etre as varáves, duas a duas, se ecotramos uma correlação próxma de em valores absolutos para qualquer par de varáves, etão certamete há multcoleardade. A recíproca, o etato, ão é verdadera, porque pode haver ão um par de varáves correlacoadas etre s, mas três (ou mas) varáves correlacoadas No caso de multcoleardade exata, o determate da matrz X, assm como o da matrz X X sera zero e, portato, ehuma delas podera ser vertda. Claro que, como fo vsto o própro exemplo, o fato dos sas serem de acordo com o esperado ão exclu a possbldade de multcoleardade. 39
242 smultaeamete, cujo valor da correlação, tomado-as duas a duas, ão dque um valor muto alto. Neste caso uma solução é observar o comportameto dos coefcetes quado adcoamos ou retramos varáves ou a mudaças a amostra. Se ocorrerem mudaças muto drástcas, clusve os sas dos mesmos, temos aí uma evdêca de que há multcoleardade o modelo. Como decorrêca de tudo sto, podemos otar que um modelo que clua mutas varáves ão é acoselhável, pos é maor a probabldade de ocorrêca de correlações altas etre dversas varáves, torado seu resultado muto pouco cofável O que fazer quado há multcoleardade? A provdêca óbva é retrar varáves correlacoadas do modelo. No caso do exemplo 9.., que só tem duas varáves explcatvas, retraríamos uma delas. A escolha, em prcípo, recara em qualquer uma delas. Como o mas tradcoal é cosderar a fução cosumo tedo como argumeto apeas a reda 3, retramos a taxa de juros. Exemplo Mostramos a tabela abaxo o resultado da estmação do modelo: C t = β + β Y t + µ t Tabela coefcete desvo-padrão estatístca t costate -7,859 7,45,45 reda,83,59 5, estatístca F = 7,64 Neste caso, evdetemete, a multcoleardade ecessaramete fo elmada pos sobrou apeas uma varável explcatva. Mesmo que ão fosse este o caso, a alta sgfcâca apresetada pelo coefcete da reda ão dexa dúvdas. O valor ecotrado para a propesão margal a cosumr ecotrado,,83, é bem mas cofável que o ateror, tedo em vsta a sua meor varâca 4. O crtéro por trás da retrada de varáves é, que, em sedo altamete correlacoadas com a(s) varável(s) restate(s) esta já capta o efeto das alterações a varável retrada, fcado esta desecessára o modelo. A solução pode, etretato, ão ser satsfatóra àquele pesqusador que preteda obter também a fluêca dreta das taxas de juros sobre o cosumo 5. 4 Uma outra solução, este caso, sera fazermos sub-regressões combado as varáves explcatvas do modelo e observado o valor do R das mesmas. Se este fosse alto, detfcaríamos a multcoleardade. Este procedmeto sera muto trabalhoso, especalmete quado tvéssemos mutas varáves, a ão ser que, seja pela teora, por bom seso, ou cohecmeto específco do assuto, tvéssemos uma psta de quas são os grupos de varáves correlacoadas etre s. 3 O que a reduzra à cohecda fução keyesaa de cosumo. 4 Ou, em outros termos, um tervalo de cofaça costruído para este coefcete (a um ível de cofaça dado) será meor do que um costruído para o coefcete obtdo o exemplo O pesqusador pode cosderar, por exemplo, que além do efeto sobre a reda, há o efeto da troca de cosumo presete por cosumo futuro.
243 Mutas vezes é possível reduzr os efetos da multcoleardade através do aumeto da amostra. Isto porque a correlação alta observada pode ser decorrete da própra amostra, sto é, esta correlação ão exstr a população e um aumeto das observações podera refletr melhor este fato; ou ada, ser resultado de algum tpo de polítca ecoômca trastóra, e que se amostra clur observações de períodos em que esta polítca ão fo adotada, a correlação obtda será bem meor. No caso do exemplo 9.., sto provavelmete ão acotecera, pos a relação etre reda e taxa de juros ão é resultado de ehuma cocdêca amostral, em resultado de algum tpo de polítca, mas algo que se supõe exstr sempre 6. Em algus casos, sera possível reespecfcar o modelo. Image um modelo que relacoa o preço de apartametos a dversas característcas, etre elas o úmero de dormtóros e a área útl. Se este estudo fosse realzado em um barro ou uma pequea cdade ode o padrão dos móves ão vara muto, é possível que o tamaho dos aposetos também ão vare, fazedo com que a área útl dos apartametos esteja altamete correlacoada ao úmero de dormtóros. Neste caso, talvez fosse melhor substtur o preço total dos apartametos pelo preço por metro quadrado (obtdo pela smples dvsão do preço total pela área útl). Procedmeto semelhate podera ser adotado o caso de um modelo que explcasse o preço de um produto agrícola em fução da área platada (ou colhda) e da produção, etre outras varáves. Certamete haverá uma forte correlação etre a área platada e a produção. Poderíamos etão substtuí-las por uma úca varável, a produtvdade (que sera a razão etre a produção e a área). Há ada a alteratva de ão se fazer ada. Há sempre que se lembrar que o estmador de mímos quadrados matém as propredades desejáves de um estmador (ão vés, efcêca e cosstêca), mesmo a preseça de multcoleardade. Se o objetvo for, por exemplo, fazer prevsões a respeto da varável explcada, a retrada de varáves correlacoadas só va reduzr a efcêca das prevsões. Para prevermos valores futuros do cosumo aquela ecooma dos exemplos 9.. e 9..3., certamete os resultados obtdos o prmero trarão melhores prevsões, ada que os valores dos coefcetes, em fução de sua alta varâca, refltam muto pouco sua real relação. De toda esta dscussão podemos coclur que a multcoleardade é muto mas uma questão umérca do que um problema. De fato, há quem argumete que há até um certo exagero em atrbur um ome a uma questão como esta. Em seu lvro, Goldberger 7 chega a lteralmete fazer gozação com o termo multcoleardade, vetado a expressão mcroumerosdade, que sera o problema que decorre de termos uma amostra pequea. Se a amostra é pequea, a varâca dos estmadores será grade, portato ão teremos uma estmatva precsa (o que é verdade, mas é também óbvo) e, o caso de mcroumerosdade perfeta, sto é, quado o úmero de observações uma amostra é zero(!) ão sera possível (ovdade!) fazer a estmação. 9. Volado a hpótese V: a autocorrelação Autocorrelação sgfca a correlação de uma varável com valores defasados (com dfereças o tempo) dela mesmo. Se a varável x t (t meddo em aos) tem correlação sstematcamete com seu valor o ao ateror (a correlação etre x t e x t- ão é ula), dzemos que 4 6 Ada assm havera uma chace de que, em uma amostra maor, esta correlação fosse pelo meos meor do que a obtda o exemplo Goldberger, Arthur S. A Course Ecoometrcs. Harvard Uversty Press. 99.
244 x t é uma varável autocorrelacoada. Note que falamos aqu em varáves dstrbuídas o tempo. De fato, usualmete, autocorrelação é algo assocado a séres de tempo 8. A hpótese V faz meção a autocorrelação dos erros. Supõe-se que ão exstam, o que é bastate razoável, pos estamos magado que o erro ão é uma varável especfcamete, mas um cojuto de dversas fluêcas que, pela sua própra atureza, são dfíces de serem meddas, mas ão exercem fluêca uma sobre a outra. Mas, e se exercerem? E por que exerceram? Image, por exemplo, que uma varável relevate esteja sedo omtda. A omssão desta varável joga sua fluêca, sstemátca, para o termo de erro, que supostamete é um cojuto de fluêcas ão sstemátcas a varável depedete. A omssão de uma varável relevate pode, portado, fazer com que tehamos autocorrelação os erros. Outro tpo de erro que podera levar a autocorrelação sera a má especfcação fucoal. Se, por exemplo, assumíssemos que uma relação é lear, quado é, dgamos, quadrátca, o erro apresetará um padrão sstemátco pelo smples fato de estarmos ajustado a curva errada. Mas a autocorrelação pode ocorrer pela própra atureza do processo: por exemplo, a produção a agrcultura. A decsão de produzr ão é smultâea à formação do preço, sto é, decde-o quato se va produzr o mometo do plato, mas só quado se der a colheta é que o produtor saberá qual o preço que poderá obter pelo seu produto. Portato, o preço que flueca a quatdade produzda é o do período ateror, ão o atual. Mas, se produzr demas (ou de meos) um certo período, sto fluecará a decsão de produzr o período segute (se o preço estver muto baxo, produzrá meos), assm sedo este é um processo em que a autocorrelação é parte tegrate, mesmo sem haver algum erro de especfcação. Uma maera possível de represetar um modelo de regressão em que a autocorrelação esteja presete é a segute: 4 Ode Y t = β + β X t + β 3 X 3t + ε t ε t = ρε t- + µ t Sedo que ρ é o coefcete de correlação e µ t é um termo de erro com as característcas das hpóteses do modelo de regressão (sto é, etre outras cosas, sem autocorrelação). Se o erro segue um processo como o descrto acma, é dto um processo autorregressvo de ordem, ou smplesmete AR(). Nada mpede que o processo, seja, a verdade, de ordem, ou seja, algo assm: ε t = ρε t- + µ t Ou assm: ε t = ρ ε t- + ρ ε t- + µ t E, este caso, sera um AR(). 9.. Coseqüêcas da autocorrelação 8 Mas ão ecessaramete. O problema é que, o tempo, só há dos vzhos medatos, a varável o período medatamete ateror e o o período medatamete posteror. No caso de varáves dstrbuídas o espaço, o úmero de vzhos pode ser maor, o que complca a aálse, embora ela seja possível de ser feta, e o é, mas uma lteratura mas especalzada.
245 43 Como vmos o capítulo ateror, a hpótese de ão exstêca de autocorrelação os erros é um pré-requsto para a demostração do Teorema de Gauss-Markov, como o qual se mostra que o estmador de mímos quadrados de uma regressão lear é um MELNV. Portato, a preseça de autocorrelação o estmador de mímos quadrados ordáros 9 ão é mas aquele que tem a meor varâca possível etre todos os estmadores. Isto sm, já pode ser cosderado um problema de fato, algo a ser tratado, já que o estmador ão é o mas precso que poderíamos obter. Há que se otar, etretato, que a hpótese ecessára para que o estmador seja ão vesado e cosstete (que é a de que os regressores, os X, ão sejam correlacoados com o erro) ão é volada e, portato, ada que ão teha a meor varâca, o estmador cotua, em geral, ão vesado e cosstete, mesmo a preseça de autocorrelação. Mas há exceções! As exceções são os modelos que cluem, etre as varáves depedetes (regressores), defasages da varável depedete, como o caso mostrado abaxo: Y t = β + β X t + β 3 Y t- + ε t (9...) Supoha que o erro ε t apresete autocorrelação, com um processo do tpo AR(): ε t = ρε t- + µ t Para que o estmador seja ão vesado deveríamos ter E(Y t- ε t ) =, o que ão ocorre, pos: E(Y t- ε t ) = E[Y t- (ρε t- + µ t )] = E(ρY t- ε t- + Y t- µ t ) = ρe(y t- ε t- ) + E(Y t- µ t ) Embora, por hpótese, Y t- e µ t ão sejam correlacoados, o mesmo ão ocorre com Y t- e ε t-, o que fca óbvo se tomarmos uma defasagem da equação (9...): Y t- = β + β X t- + β 3 Y t- + ε t- Portato Y t- e ε t- são correlacoados e, portato E(Y t- ε t- ) e, coseqüetemete, E(Y t- ε t ). Como Y t- é uma varável depedete o modelo expresso pela equação (9...), este é um caso que a exstêca de autocorrelação mplca o vés do estmador de mímos quadrados ordáros. Além dsso, temos que lembrar que os estmadores para a varâca dos coefcetes foram calculados supodo que ão há autocorrelação etre os erros, sto é, supodo que (em otação matrcal), que var(e) = σ I, o que ão é verdade. Os estmadores das varâcas serão (sempre!) vesados, o que valda os testes de hpóteses realzados a preseça de autocorrelação. 9.. Como detfcar a autocorrelação? A maera mas comum de detfcar a exstêca de autocorrelação é através do teste de Durb-Watso, cuja estatístca é calculada por: 9 Mímos quadrados ordáros é como é chamado o método e o estmador usual de mímos quadrados. É uma tradução o mímo dscutível da expressão em glês ordary least squares.
246 44 DW = = = t t ˆ ) ˆ ˆ ( t t t ε ε ε Para eteder o seu sgfcado, vamos desevolver a expressão acma: DW = = = + t t ˆ ) ˆ ˆ ˆ ˆ ( t t t t t ε ε ε ε ε DW = = = = = + t t t t ˆ ˆ ˆ ˆ ˆ t t t t t ε ε ε ε ε Se a amostra for sufcetemete grade, a dfereça etre a soma de ˆt ε e ˆ t ε é muto pequea, assm como é muto pequea a dfereça etre somar de a ou de a. Etão, podemos dzer que estas somas são (quase) guas: DW = = = t t t ˆ ˆ ˆ ˆ t t t t ε ε ε ε DW ( = = = = t t t t ˆ ˆ ˆ ˆ ˆ t t t t t ε ε ε ε ε ) O prmero termo é obvamete gual a. O segudo é um estmador para o coefcete de correlação dos erros. DW ( ρˆ ) Se ão há autocorrelação (ρ = ), o valor de ρˆ deverá ser em toro de zero e, portato, o valor de DW deverá ser próxmo de. Um valor próxmo de para DW mplca, desta forma, a ão exstêca de autocorrelação. Havedo autocorrelação, esta pode ser postva ou egatva. Os casos extremos seram ρ = ou ρ = -. Se o valor de ρˆ for próxmo de, o valor de DW será próxmo de. Portato, valores de DW (razoavelmete) abaxo de dcam autocorrelação postva. Da mesma forma, se ρˆ for próxmo de, DW será próxmo de 4, sto é, valores (razoavelmete) acma de dcam autocorrelação egatva. Mas quão dstate de deve estar o valor da estatístca DW para que possamos coclur que exste, de fato, autocorrelação? Isto fo resolvdo através de smulações que resultaram uma tabela
247 semelhate àquelas que víhamos utlzado até agora, com a dfereça que ela ão vem de uma fórmula aalítca, como era o caso das dstrbuções dervadas da dstrbução ormal. Observado esta tabela ao fal do lvro, verfcamos que o teste de Durb-Watso apreseta uma lmtação (ão é a úca!). Exste um tervalo de valores em que o teste é coclusvo. Se, por exemplo, estvermos testado um modelo com duas varáves explcatvas, com observações, para um ível de sgfcâca de 5%, ecotramos os valores d =, e d s =,54. Se o valor de DW for abaxo de,, rejetamos a hpótese ula de ão autocorrelação, sto é, cocluímos que exste autocorrelação. Se DW estver etre,54 e, cocluímos que ão há autocorrelação (acetamos a hpótese ula). Se, etretato, o valor de DW car etre, e,54, o teste é coclusvo, ão dá para dzer se há ou ão autocorrelação. Note que a tabela é motada para autocorrelações postvas (DW < ). Se ecotrarmos um DW maor do que, o que dcara uma autocorrelação egatva, basta que façamos DW* = 4 DW, e o valor de DW* pode ser comparado ormalmete com os valores da tabela. 45 Exemplo 9... Na tabela abaxo ecotramos dados de cosumo e reda trmestras de um país durate 5 aos. Estme a fução cosumo (cosumo como fução da reda) e teste a exstêca de autocorrelação, com 5 % de sgfcâca. Tabela 9... ao/trmestre cosumo (US$ blhões) 994/3 757,6 97, 994/4 745, 988,5 995/ 673,4 866,5 995/ 65, 8,4 995/3 676, 845,3 995/4 79, 89,9 996/ 74,7 899,3 996/ 69,8 9, 996/3 696,6 93, 996/4 667,6 94,5 997/ 667, 96,7 997/ 67, 9, 997/3 76,9 958,4 997/4 698,4 934, 998/ 676,7 944,4 998/ 66,4 956,3 998/3 686,8 97,7 998/4 685, 958,9 999/ 684,9 96,9 999/ 675, 966,4 999/3 663, 977,5 999/4 67,8 988,5 / 675,, / 693, 996,7 reda (US$ blhões)
248 /3 7,6 5,6 /4 747,5, / 74,4 4, / 74,5 997,4 /3 74,5,4 /4 7,6 6,6 46 Os resultados da estmação serão dados por (verfque!): coefcete desvo-padrão estatístca t costate 4,67 87,676 4,59 reda,3,9 3,37 estatístca F =,3 Os resultados foram os esperados: o coefcete da reda fo sgfcate (a %) e a regressão fo válda ( aprovada pelo teste F, a %). Ates de cometer a precptação de afrmar que já sabemos como a reda flueca o cosumo, covém, especalmete porque se tratam de dados em séres de tempo, testar a exstêca de autocorrelação. Os resíduos foram obtdos dos resultados acma e estão mostrados a prmera colua da tabela 9... Nas coluas segutes são fetos os cálculos ecessáros para obteção da estatístca DW Tabela 9... ao/trmestre εˆ t - ˆ t resíduos ( εˆ t ) ε ( εˆ t - ε t ) ( εˆ t ) 994/3 53, , /4 35,565-8,449 39,369 64, /,653-33,948 5,33, / -, ,4 9,368 7, /3,3363 3, ,986,74 995/4 9,4673 8,49 339, ,5 996/, ,698 44,866 58, / 6,694-6, ,46 38,66 996/3 3, ,843 53,67 8,7 996/4-5,95-9, , ,48 997/ -7,338 -,83,733 9,94 997/ -7,454 -,39,538 33, /3 6,68 34,376 58,557 75, /4 5,6587 -,954 9,994 3,49 998/ -9,433-4, , ,94 998/ -38,3569-8, ,837 46, /3-7,679,678 45,94 3, /4-5,438,3748 5,6399 3, / -6, ,36,568 7, / -7,679 -,974 5, , /3-43,9-5, , ,5 999/4-36,8349 6,84 39,49 356,8 / -38, ,5438, ,939 / -9,89 9,974 37, ,955 /3 6, ,736 66,354 44,885 /4 3,8596 4,6 583, ,637 ˆ
249 / 7,8897 -,963 8, ,8357 / 8,34,6, ,6853 /3 8,6974,684,47 793,534 /4 7, , , ,945 SOMA 845,88 897,99 47 Portato, a estatístca DW será dada por: DW = t= ( ˆ ε ˆ ε t t= ˆ ε t t ) = 845,88 897,99 =,4454 Como o lmte feror da tabela de DW é, para 5% de sgfcâca, 3 observações e uma varável explcatva, d =,35, ou, para % de sgfcâca,, (em ambos os casos, maor do que,4454), cocluímos que exste autocorrelação (rejetamos a hpótese ula de ão autocorrelação). Como fo dto, o teste de Durb-Watso apreseta algumas lmtações. Além da exstêca de um tervalo em que o teste é coclusvo, o teste ão é váldo se: a regressão ão clur o tercepto (termo costate); a regressão clur, como varáves explcatvas, defasages da varável depedete. Além dsso, como é claro pela própra formulação do teste, ele é feto para testar apeas correlações de prmera ordem O que fazer quado há autocorrelação? Prmero há a questão de qual é a causa da autocorrelação. Se o problema é de especfcação, ele pode ser corrgdo com a clusão de mas varáves ou com a alteração da forma fucoal. Se ão é este o caso, ou seja, a autocorrelação é uma parte tegrate do modelo estmado, a correção passa pelo cohecmeto prévo de como é a estrutura da autocorrelação. Supohamos que seja um modelo com uma varável explcatva como mostrado abaxo: Y t = β + β X t + ε t (9..3.) Em que exste autocorrelação e ela é de prmera ordem (é um AR()), ou seja: ε t = ρε t- + µ t Supohamos ada que o coefcete ρ seja cohecdo. Se multplcarmos a equação (9..3.) defasada por ρ, temos: ρy t- = ρβ + ρβ X t- + ρε t- (9..3.) Subtrado a equação (9..3.) da equação (9.3..): Em textos mas avaçados de ecoometra é possível ecotrar outros testes para autocorrelação.
250 48 Y t ρy t- = β ρβ + β (X t ρx t- ) + (ε t ρε t- ) Mas sabemos que: ε t ρε t- = µ t E, se fzermos com que: Y * t = Y t ρy t- β * = β ρβ X * t = X t ρx t- e Reduzremos a um modelo que será: Y t * = β * + β X t * + µ t Que é um modelo sem autocorrelação (que pode, portato, ser estmado sem problemas por mímos quadrados ordáros) e, mportate, apreseta o mesmo coefcete β do modelo orgal. Mas ada resta o problema de como cohecer o coefcete ρ. Uma estmatva pode ser ecotrada, etretato, através do própro valor de DW, já que: DW ( ρˆ ) Etão: ρˆ DW Exemplo Refaça a estmação do exemplo 9..., corrgdo o problema da autocorrelação. O prmero passo é ecotrar uma estmatva para o coefcete de correlação, o que, como vmos, pode ser feto pela própra estatístca DW: ρˆ DW,4454 =,777 Se, dgamos, cosumo é a varável Y t e reda é a varável X t, as varáves corrgdas, sto é, aquelas cuja regressão ão apresetará autocorrelação (pelo meos assm esperamos), serão dadas por: Y t * = Y t,777y t- X t * = X t,777x t- E são mostradas a tabela abaxo:
251 Tabela ao/trmestre cosumo (Y t ) * Y t reda (X t ) * X t 994/3 757,6 97, 994/4 745, 56, ,5 34,8 995/ 673,4 94, ,5 98, / 65, 8,968 8,4 39,95 995/3 676, 69, ,3 4,65 995/4 79, 83,696 89,9 35,9 996/ 74,7 53, ,3 6, / 69,8 44,48 9,, /3 696,6 59,74 93, 95, /4 667,6 6,348 94,5, / 667, 48, ,7 3, / 67 5,5856 9, 5, /3 76,9 95, ,4 43, /4 698,4 4, , 89,43 998/ 676,7 34,43 944,4 8, / 66,4 35,64 956,3,5 998/3 686,8 7,89 97,7 8, /4 685, 5, ,9 3, / 684,9 5, ,9 6, / 675, 4, ,4 9,37 999/3 663, 38, ,5 6,67 999/4 67,8 57, ,5 8,985 / 675, 5,4344, 33,355 / 693, 68, ,7 8,7676 /3 7,6 83,63 5,6 3,64 /4 747,5 86,868, 9,8488 / 74,4 6,595 4, 8,4976 / 74,5 63, ,4 7,366 /3 74,5 66,35,4 5,4 /4 7,6 46,4545 6,6 9,89 49 Os resultados obtdos agora são: coefcete desvo-padrão estatístca t costate 33,4 7,,94 X *,566,8 6,97 estatístca F = 48,5 DW =,376 O coefcete da reda fo maor, e com um desvo padrão meor (repare que esta últma comparação sequer era ecessára, já que sabemos que o estmador do desvo padrão do exemplo 9... era vesado em fução da autocorrelação). Para fcarmos satsfetos com este ovo resultado, o etato, temos que prestar ateção a estatístca de Durb-Watso. Se compararmos o valor ecotrado (,376) com a tabela para 9 observações (sm, temos uma observação a meos agora), veremos que, para 5% de sgfcâca, d =,34 e d s =,48, portato o teste é coclusvo, o que ão é uma otíca maravlhosa, mas pelo meos ão podemos afrmar que há autocorrelação. A % de sgfcâca, etretato, os valores tabelados são d =, e d s =,5, portato acetamos a hpótese de ão exstêca de autocorrelação com esta sgfcâca.
252 9.3 Volado a hpótese IV: a heteroscedastcdade 5 A hpótese IV estabelece que a varâca dos erros deve ser costate (o que é cohecdo como homoscedastcdade). Imagemos uma regressão em que a varável depedete seja a altura das pessoas. Meddo a altura com uma régua comum podemos, evdetemete, cometer erros em fução da medção desta altura em fução da precsão da régua e mesmo da precsão de como a medda é feta. Não há porque, etretato, acredtarmos que a varâca deste erro de medção será dferete para dferetes grupos de pessoas (altas ou baxas, por exemplo). A hpótese IV, este caso, é bem razoável. Agora mage se estamos fazedo um estudo de saláros em fução dos aos de estudo. A relação certamete exste pos, pessoas com város aos de estudo gaham, em méda, mas do que pessoas com poucos aos de estudo. Mas a stuação muda muto o que se refere ao erro: para aqueles com pouco ou ehum estudo, os saláros ão deverão varar muto (pelo meos para a grade maora), fazedo com que a varâca seja muto pequea. No caso de pessoas com mutos aos de estudo (ível superor, pós-graduação, etc.) embora se espere que gahem mas, as possbldades são bem mas amplas: é possível que uma pessoa deste grupo teha problemas em avaçar a carrera ou se tore presdete de uma grade empresa, o que tora a varâca dos saláros este caso muto alta. Há outros exemplos, como a poupaça das famílas em fução da reda: famílas com reda muto baxa, pouparão valores muto próxmos etre s (um valor muto pequeo, por sal, até porque ão têm muto para poupar), equato que etre famílas mas rcas, temos toda uma gama de que va desde famílas bastate perduláras a outras que são muto poupadoras Coseqüêcas da heteroscedastcdade A hpótese IV (assm como a hpótese V) é uma hpótese ecessára para a demostração do Teorema de Gauss-Markov. Desta forma, as coseqüêcas são bascamete as mesmas da preseça da autocorrelação : os estmadores de mímos quadrados ordáros cotuam ão vesados, mas já ão são aqueles de meor varâca. As varâcas dos estmadores são vesadas, valdado assm os testes de hpóteses Como detfcar a heteroscedastcdade? De város testes exstetes a lteratura que têm como objetvo detfcar a preseça de heteroscedastcdade, fcamos com dos. O teste de Goldfeld e Quadt cosste em separar a regressão em duas, uma com valores meores de X, dgamos, e outra com valores maores e aí fazer um teste para comparar a varâca em cada regressão (um teste comum de comparação de varâcas, sto é, um teste F). Havedo dfereça as varâcas das duas regressões, a hpótese ula de homoscedastcdade é rejetada, e, sedo este o caso, coclu-se que há preseça de heteroscedastcdade, que deverá ser corrgda. Exceto quado há autocorrelação quado usamos defasages da varável depedete como varáves explcatvas, o que tora o estmador de mímos quadrados ordáros vesado, cosa que ão ocorre a preseça de heteroscedastcdade.
253 Exemplo São dados a tabela abaxo os dados dos saláros de trabalhadores e os aos de estudo de cada um. Faça uma regressão dos saláros em fução dos aos de estudo e teste para a exstêca de heteroscedastcdade utlzado o teste de Goldfeld e Quadt. Tabela aos de saláros estudo (R$) 4, 58, ,7 55, , 4 935,5 7 59, ,5 9 37,7 69,5 596, , , 4 67, 6 653, , , , , ,7 Os resultados da regressão tedo o saláro como varável depedete são: 5 coefcete desvo-padrão estatístca t costate 39,74 84,55,755 aos de estudo 5,6 5,4 3,35 F = 78,8 Os resíduos desta regressão são: 65,3477-6,586 95, ,994-4,467-49,89 3, ,633,769-86, , ,487, ,37-346, ,57 33,688-3, ,94 85,878 Vejamos o comportameto dos resíduos um gráfco:
254 O gráfco os dá um díco realmete que os resíduos são mas espalhados quado os saláros são maores. Para testarmos a heteroscedastcdade, dvdremos os dados em dos grupos como mada o fguro do teste de Goldfeld e Quadt. Esta dvsão é arbtrára, mas o teste tede a ser mas efcete se omtrmos os dados do meo, sto é, tomarmos um grupo com os valores de X meores ( a 4 aos de estudo) e outro com valores de X maores (4 ou mas aos de estudo). Grupo I: aos de estudo Teremos etão: saláros (R$) 4, 58, ,7 55, , 4 935,5 Resultado da regressão: coefcete desvo-padrão estatístca t costate (I) 83,797 69,87,66 aos de estudo (I) 96,655 5,844 7,6 F I = 57,9 SQR I = 4694,4 S SQR I = I 4694,4 = = 3673,6 4
255 53 Grupo II: aos de estudo saláros (R$) 4 67, 6 653, , , , , ,7 Resultado da regressão: coefcete desvo-padrão estatístca t costate (II) -37,37 46,67, aos de estudo (II) 394,44 3,59,99 F II = 8,996 SQR II = 79453,67 S SQR II = II 79453,67 = = 34589,73 5 Comparamos etão, a varâca das duas regressões um teste F e, para sto, dvdmos uma varâca pela outra: S 34589,73 = = 94,6 S 3673,6 II I Como o valor lmte a tabela F, com 5% de sgfcâca, para 5 graus de lberdade o umerador e 4 graus de lberdade o deomador é 6,6, rejetamos a hpótese de que as varâcas sejam guas (vale a hpótese de que a varâca da seguda regressão é maor) e, portato, rejetamos a hpótese ula de homoscedastcdade. Cocluímos etão, que o modelo de regressão estmado acma é heteroscedástco. Outro teste que pode ser usado para detecção do problema de heteroscedastcdade é o teste de Whte que cosste em, a partr de um modelo de regressão qualquer : Y = β + β X + β 3 X 3 + ε É feta uma regressão auxlar ode a varável depedete é o resíduo ao quadrado e os regressores são os própros regressores da regressão orgal, seus quadrados e os produtos cruzados, desta forma: εˆ = γ + γ X + γ 3 X 3 + γ 4 X + γ 5 X 3 + γ 6 X X 3 + µ Um R elevado esta regressão auxlar é um díco de que há heteroscedastcdade. Mas precsamete, pode-se demostrar que o produto R, sedo o úmero de observações, segue uma dstrbução de χ com o úmero de graus de lberdade equvalete ao úmero de regressores da regressão auxlar (meos o tercepto). Tomaremos um com duas varáves apeas por smplfcação.
256 54 Exemplo Na tabela abaxo temos os dados de cosumo de eerga elétrca médo por resdêca para 7 cdades. Cada cdade possu uma tarfa dferete e também é dada a reda famlar mesal méda. Estme o cosumo de eerga em fução da tarfa e da reda e verfque se há heteroscedastcdade pelo teste de Whte. Tabela cdade cosumo (kwh/mês) tarfa ($/kwh) A 355,7,5 6 B 393,8,8 4 C 49,, 7 D 5,5, 3 E 484,9,3 6 F 377,,6 7 G 94,3 3, 5 H 38,,5 6 I 498,6, 85 J 444,5,9 55 K 7,,9 3 L 79,8, 7 M 3,9,5 8 N 99,8,4 65 O 798,,3 9 P 483,4,8 5 Q 58,9,4 4 reda ($/mês) Os resultados da regressão foram: coefcete desvo-padrão estatístca t costate 54,457 69,4,9 reda,37,4,8 tarfa 6,79 65,36, F =,65
257 O coefcete da reda fo sgfcate apeas a %, o coefcete da tarfa (assm como o tercepto) ão fo sgfcate (ada bem, pos o sal do coefcete da tarfa supostamete sera egatvo). Além dsso, o teste F dca que a regressão ão é válda. Mas estas coclusões só são váldas se ão exstr heteroscedastcdade, o que ada ão sabemos. Uma speção do gráfco dos resíduos sempre é útl estes casos: No exo horzotal, o úmero correspode à cdade A, o à B e assm sucessvamete. Novamete é possível vsualzar uma dscrepâca a dspersão dos erros, ela parece maor para as últmas cdades da tabela do que para as prmeras. Para termos uma déa mas precsa, usaremos o teste de Whte. Os dados para a regressão auxlar são mostrados abaxo: cdade resíduos resíduos ao tarfa reda tarfa reda reda
258 56 quadrado ($/kwh) ($/mês) ao quadr. ao quadr. tarfa A -3,6 999,6,5 6, B 78,73 698,64,8 4 3,4 6 7 C,3,69, 7 4, 49 4 D -3,48 547,9, 3, E 98, ,7,3 6, F -48, 35,7,6 7,56 49 G -65, ,6 3, 5 9, 5 5 H -65, ,65,5 6 6, I 3,76 89,4, 85 4, J 73, ,6,9 55 3, K -54,79 3,6,9 3,8 9 7 L -4,95 5,5, 7, M -6, ,64,5 8,5 64 N -5,44 49,68,4 65, O 3, ,94,3 9, P 3, 74,3,8 5 3,4 5 9 Q 99,8 3999,95,4 4 5, coefcete desvo-padrão estatístca t costate -46, ,86 -,88 reda -67,38 7,55 -,53 tarfa 83, ,85,74 reda ao quadrado,38, 3,46 tarfa ao quadrado 95,886 3,56,95 reda tarfa -,48 4,447-5,5 R =,794 O valor ecotrado para o R fo alto, o que dca que há mesmo heteroscedastcdade. Etretato, o teste deftvo será feto multplcado-se o R pelo úmero de observações. R = 7,794 3,5 Como o valor lmte 3 da dstrbução χ com 5 graus de lberdade e 5% de sgfcâca é,7, rejetamos a hpótese ula de homoscedastcdade, ou seja, cocluímos que o modelo estmado apreseta, sm, heteroscedastcdade O que fazer quado há heteroscedastcdade? Havedo heteroscedastcdade, o procedmeto de correção é mas smples se soubermos (ou pelo meos, suspetarmos) qual é o padrão da heteroscedastcdade. Tomemos um modelo de regressão abaxo e supohamos que exsta heteroscedastcdade. Y = β + β X + β 3 X 3 + ε Dgamos que seja cohecdo que a varâca dos erros é dada por: 3 Lmte superor, bem eteddo. Portato, a tabela, olharemos a colua dos 95% se qusermos 5% de sgfcâca.
259 57 var(ε ) = σ = z σ Ou seja, que a varâca, que ão é costate, é uma varável z multplcada por uma costate. Se coseguíssemos elmar a varável z da varâca, teríamos etão uma varâca costate e aí estaríamos lvres do problema da heteroscedástcdade. Sabemos do capítulo que, para trasformar uma varável cuja varâca é z σ em outra cuja varâca é smplesmete z σ, devemos dvd-la por 4 z. A solução etão é dvdr todo o modelo de regressão por z : Y z = β z X + β z X + 3 β3 + µ z E etão, a varâca deste ovo termo de erro µ será dada por: var(µ ) = var( ε z ) = var(ε ) = z σ = z z σ = σ z Que é costate e, portato, este modelo trasformado será homoscedástco (se, é claro, a varâca segur de fato o padrão dcado acma). Quado estmamos o modelo trasformado acma por mímos quadrados, o método gaha um ovo sobreome 5, ele é chamado de método dos mímos quadrados poderados. Claro que o método dos mímos quadrados poderados também pode ser usado quado o padrão cohecdo é o do desvo padrão. Dgamos que o desvo padrão dos erros seja dado por: dp(ε ) = σ = z σ E, este caso, a solução é smplesmete dvdr o modelo por z : Y z = β + β z X z X + 3 β3 + µ z E o desvo padrão do erro deste modelo será dado por: ε dp(µ ) = dp( ) = z dp(ε ) = z σ = z z σ = σ z O desvo padrão será, etão, uma costate, e, obvamete, a varâca também, elmado a heteroscedastcdade. Exemplo Estme ovamete a regressão do exemplo 9.3.., corrgdo o problema da heteroscedastcdade. 4 Ressaltado que varâca lembra quadrados. 5 Ou, para aqueles que preferrem, este é uma espéce dferete detro do gêero dos mímos quadrados.
260 Supostamete a causa da heteroscedastcdade aquele exemplo é a de que a varação dos saláros é maor para maor tempo de estudo. Sera possível magar que a varâca ou o desvo padrão sejam proporcoas ao tempo de estudo. Se cosderarmos o desvo padrão proporcoal aos aos de estudo, a solução dcada é dvdr toda a equação pelos aos de estudo. Neste caso, etretato, a varável a ser dvdda é a própra varável depedete do modelo. Ou seja, o modelo cal: 58 Y = β + β X + ε Ode Y são os saláros e X os aos de estudo se tora: Y X = β X X + β + µ X Y X = β X + β + µ Etão, para estmar os coefcetes β e β sem o problema da heteroscedastcdade devemos estmar uma regressão smples ode a varável depedete é a razão saláro/aos de estudo e a varável depedete é o verso dos aos de estudo. Temos etão: aos de saláros /X Y/X estudo (X) (Y) 4,, 4, 58,9,5 54, ,7, ,9 55,3,5 75, ,, , ,5,5 33, ,3,4857 8, ,5,5 87, ,7, 57,5 69,5,999 97,73 596,8,999 36, ,6,7693 8, ,,7693 6, ,,749 9, ,8,65 65, ,,65 83, ,,5884, ,3, , ,3,563 87, ,7,563 57,7
261 59 Os resultados desta ova regressão foram: coefcete desvo-padrão estatístca t βˆ 98,869 9,6,79 βˆ 88,745 9,76 6,35 F = 4,34 Os valores de βˆ e βˆ obtdos agora, por mímos quadrados poderados, represetam uma estmatva mas precsa dos dos coefcetes, além do que é possível cofar os testes de hpóteses tedo em vsta que ão há heteroscedastcdade. Bom, sto se ão houver realmete. Para ter certeza dsso, usamos um dos testes vstos, por exemplo o teste de Whte. Ates dsso, sera teressate observarmos os resíduos um gráfco, depos de tabularmos os mesmos abaxo:, ,86,45-6,977-38,799-7,363 5, , ,63-35, , ,734-7,599 37,6868 -,5568 -,477,8899-8,85-44,896 48, Como se vê, pelo meos aparetemete, os resíduos se mostram mas equlbrados o que se refere a sua dspersão. De fato, como podemos ver o resultado do teste de Whte abaxo: Resultados da regressão auxlar do teste de Whte coefcete desvo-padrão estatístca t costate 7, ,864 3,47 varável depedete -546,96 5,4 -, var. d. ao quadrado 6,67 65,736,77 R =,758
262 6 R =,758,5 Como o valor lmte, a 5% de sgfcâca, com graus de lberdade, a dstrbução χ é 5,99, acetamos a hpótese ula de homoscedastcdade para este modelo. Quado ão cohecemos o padrão da heteroscedastcdade, as formas de correção são um pouco mas complexas. Há uma possbldade, etretato, que já fo até dscutda o capítulo ateror: é que, mutas vezes (mas em sempre), quado o modelo as varáves orgas apreseta heteroscedastcdade, o mesmo ão ocorre se estas varáves estverem em logartmo. Esta é uma possbldade, etão, a de calcular os logartmos das varáves evolvdas a regressão e testar ovamete para a heteroscedastcdade. Temos etão um tercero motvo 6 para o uso de modelos com o logartmo das varáves. 9.4 Volado a hpótese III: o problema da smultaedade A hpótese III estabelece que as varáves depedetes, os regressores, os X, efm, um modelo de regressão devem ser fxos, sto é, ão estocástcos, ão aleatóros. Uma versão mas brada desta hpótese vsta o capítulo ateror estabelece que, se uma (ou mas) varável depedete for estocástca, é precso que, pelo meos, ela ão teha correlação com o termo de erro. E se tver? Isto remete a uma outra questão, que é o que levara uma varável supostamete 7 depedete a ter correlação com o termo de erro? A resposta a esta perguta lembra uma atga propagada de um bscoto em que se dscuta a relação de causa e efeto: ele vede mas porque está sempre fresquho ou está sempre fresquho porque vede mas? Note que o modelo teórco proposto pela propagada, há duas fuções : a quatdade de bscotos veddos é fução da probabldade de que ecotremos bscotos fresquhos ; por outro lado, o úmero de udades fresquhas será maor se as vedas forem maores, já que os bscotos ão fcarão em estoque por muto tempo. Há portato, duas equações smultâeas, em que as varáves estar sempre fresquho e quatdade de vedas se determam mutuamete. Em Ecooma e outras cêcas socas estas stuações ocorrem freqüetemete. Em partcular, o modelo de determação de preços básco a Ecooma, de oferta e demada, é um destes casos: a oferta, o produtor rá produzr maor quatdade quato maor for o preço; a demada, o cosumdor comprará maores quatdades quato meor for o preço. Assm, se o preço estver muto baxo, mutos cosumdores vão querer adqurr o produto, mas a produção será pequea, o que fará com que o preço suba; da mesma forma, se a quatdade produzda for muto grade, os produtores serão obrgados a baxar o preço para veder toda sua produção. Preços e quatdades, portato, se determam mutuamete. Supohamos que a quatdade a ser produzda, chamada de quatdade ofertada, seja fução úca e exclusvamete do preço: Q o = α + α P + µ 6 Os outros seram um evetual melhor ajuste com logartmos e a possbldade de estmação dreta das elastcdades. 7 Note que se ela tem, de fato, correlação com o erro, ela ão é tão depedete assm.
263 6 Ode α >. Já para os cosumdores dgamos que, além do preço, eles levem em cota a reda a sua decsão de cosumr. Etão, para a quatdade demadada teremos: Ode β <. Q D = β + β P + β R + ν Como o equlíbro de mercado, Q O = Q D, e o que é observado são quatdades de equlíbro (já que o que é cosumdo tem que ser gual ao que é veddo), ão há ambgüdade em chamar ambas smplesmete de Q. Etão temos um sstema de duas equações: Q = α + α P + µ (oferta) Q = β + β P + β R + ν (demada) Ode as varáves Q e P se determam mutuamete este modelo, por sso são chamadas de varáves edógeas. Já R é uma varável que é realmete depedete o modelo, seu valor já é predetermado, etão dzemos que é uma varável exógea. A regressão por mímos quadrados ordáros das equações acma levará a estmadores vesados e cosstetes, já que um dos regressores é uma varável edógea, determada pelo própro modelo descrto pelas equações acma, e portato está correlacoado com o termo de erro. Repare que é a mesma stuação do bscoto, pos, dgamos que a reda dos cosumdores aumete: haverá maor procura pelo produto, aumetado o preço; mas o preço maor estmula maor produção. Quatdade afeta o preço que afeta a quatdade A questão da detfcação Partdo do sstema de equações acma, vamos solar as varáves edógeas. Se gualarmos os Q das equações de oferta e demada (e omtdo os ídces por smplcdade de otação), teremos: Q = Q α + α P + µ = β + β P + β R + ν α P β P = β α + β R + ν µ β α β ν µ P = + R + α β α β α β Ecotramos uma equação que coloca o preço em fução apeas de varáves exógeas (uma só, este caso). Observado esta equação fca mas clara a correlação do preço com (os dos) termos de erro. Substtudo a equação do preço que acabamos de ecotrar a equação de oferta: Q = α + α P + µ β α Q = α + α ( α β β ν µ + R + ) + µ α β α β Fazedo as operações adequadas chegamos a:
264 6 αβ α β Q = α β + αβ αν βµ R + α β α β Esta equação também coloca uma das varáves edógeas (Q) em fução da varável exógea R. Temos um ovo sstema de equações, que sola as varáves edógeas em cada equação, e estas equações são chamadas de equações a forma reduzda. O sstema orgal de equações são a chamada forma estrutural do modelo. As equações a forma reduzda são, etão: β α β ν µ P = + R + α β α β α β αβ α β αβ αν βµ Q = + R + α β α β α β Ode: β α π = α β π = Sstema que pode ser escrto de uma maera mas smples como: β α β αβ α β π 3 = α β αβ π 4 = α β ν µ τ = α β αν βµ ξ = α β P = π + π R + τ Q = π 3 + π 4 R + ξ Note que as equações a forma de reduzda ão têm mas o problema de que um ou mas regressores são correlacoados com o termo de erro e etão elas podem perfetamete ser estmadas por mímos quadrados ordáros. Só que estmado as equações a forma reduzda ecotraremos os π e ão os α e β. Fca o problema de, dados os parâmetros da forma reduzda, ecotrar os da forma estrutural. Da equação de oferta: Q = α + α P + µ Substtudo pelas equações da forma reduzda e omtdo os termos de erro (já que estamos falado dos estmadores), temos: πˆ 3 + πˆ 4R = αˆ + αˆ (πˆ + πˆ R) πˆ 3 + πˆ 4R = αˆ + αˆ πˆ + αˆ πˆ R
265 Lembrado que os estmadores πˆ já foram obtdos das equações a forma reduzda por mímos quadrados ordáros, ossas cógtas são os αˆ. Para mater a gualdade acma teremos que ter os coefcetes puros guas em cada lado, bem como os coefcetes da reda: 63 πˆ 3 = αˆ + αˆ πˆ πˆ 4 = αˆ πˆ Que é um sstema de duas equações e duas cógtas que, ão só tem solução, como este caso é até fácl de ecotrar, pos, da seguda equação, temos: ˆ π 4 αˆ = ˆ π E aí, substtudo a prmera, temos: πˆ 3 = αˆ + αˆ πˆ ˆ π 4 πˆ 3 = αˆ + πˆ ˆ π αˆ = πˆ 3 ˆ π 4 πˆ ˆ π Portato, é perfetamete possível ecotrar os coefcetes da oferta a partr dos coefcetes obtdos da estmação a forma reduzda. Vejamos se o mesmo ocorre para a demada: Q = β + β P + β R + ν Fazedo o mesmo procedmeto, sto é, substtudo pelas equações da forma reduzda e omtdo os termos de erro: Que gera as equações: πˆ 3 = βˆ + βˆ πˆ πˆ 4 = βˆ πˆ + βˆ πˆ 3 + πˆ 4R = βˆ + βˆ (πˆ + πˆ R) + βˆ R πˆ 3 + πˆ 4R = βˆ + βˆ πˆ + ( βˆ πˆ + βˆ )R Temos agora três cógtas ( βˆ, βˆ e βˆ ) e apeas duas equações. Não é possível ecotrar os coefcetes da demada a partr dos coefcetes estmados a forma reduzda. Uma outra maera de dzer sto é que ão se pode detfcar a equação de demada, ou, smplesmete, que a equação da demada apresetada o modelo acma é subdetfcada. A equação de oferta, ao cotráro, é possível de ser detfcada. Dzemos que a equação de oferta é exatamete 8 detfcada. Para aqueles famlarzados com a teora ecoômca a aaloga é clara. Como exste a reda a equação da demada, mudaças a mesma mplcam em deslocameto da curva de demada. 8 Já veremos o motvo deste exatamete.
266 Deslocado a curva de demada, podemos ecotrar város potos a curva de oferta e assm, é possível detfcá-la. 64 Fgura 9.4..: uma curva de oferta e dferetes curvas de demada (para dferetes íves de reda) fazedo com que város potos da curva de oferta sejam detfcados. Note que, se além da reda, a equação da demada cotemplasse também, dgamos, o preço de um bem substtuto como varável, sera mas uma varável que podera deslocar a demada e detfcar a oferta. Neste caso, a equação de oferta estara superdetfcada (daí o motvo de termos usado o exatamete para qualfcar a detfcação da oferta). Qual é a regra? Temos duas varáves edógeas em cada equação. Para a equação ser detfcada, temos que ter uma varável exógea fora da equação. Dá para esteder o racocío para três varáves edógeas, aí precsaríamos duas exógeas fora e assm por date. Podemos geeralzar da segute forma: Se: úmero de varáves edógeas cluídas = úmero de varáves exógeas excluídas etão: a equação é exatamete detfcada. Se: úmero de varáves edógeas cluídas > úmero de varáves exógeas excluídas etão: a equação é subdetfcada. Se: úmero de varáves edógeas cluídas < úmero de varáves exógeas excluídas etão: a equação é superdetfcada. Mas ateção: sto se refere apeas à codção ecessára para a detfcação, também cohecda como questão de ordem. Veja que o exemplo vsto acma de oferta e demada, a equação de oferta é exatamete detfcada desde que a reda de fato exsta a equação da demada, sto é, que o coefcete β seja dferete de zero. Uma codção mas geral é vsta o exemplo abaxo: Exemplo Dado o modelo abaxo: () Y t = C t + I t + G t () C t = α + α Y t + α Y t- + α 3 r t + ε t (3) I t = β + β r t + β Y t + ε t (4) r t = γ + γ m t + γ Y t + ε 3t
267 65 Ode Y é a reda acoal, C é o cosumo, I o vestmeto, G são os gastos goverametas, r é a taxa de juros e m é a quatdade de moeda emtda. O govero cotrola os seus gastos e a emssão de moeda. Verfque a codção de detfcação para cada uma das equações. A equação () é uma detdade, ão tem coefcetes a serem estmados, portato ão cabe a questão da detfcação para esta equação. Para as demas, sm, mas fcaremos restrtos à equação (), fcado as demas como exercíco. O govero estpula quas serão seus gastos e a emssão de moeda, portato estas são varáves exógeas. As demas são edógeas, mas quado tomamos valores defasados das mesmas, elas já estão, obvamete, predetermadas (elas vem do passado, afal), etão do poto de vsta do modelo o período atual elas têm o mesmo comportameto que as varáves exógeas. Etão temos: varáves edógeas: Y t, C t, I t, r t varáves exógeas: G t, m t, Y t- No caso da equação () temos: varáves edógeas cluídas = 3 varáves exógeas excluídas = A equação, pela codção de ordem, é exatamete detfcada. Mas temos que verfcar a codção sufcete, o que é mas complcado agora porque temos váras equações. Para sso vamos motar uma tabela com as váras equações, ode preecheremos com us e zeros para o caso da varável ser ou ão cluída a equação: equação Y t C t I t G t r t m t Y t- () () (3) (4) Motemos uma matrz a partr desta tabela com a segute regra: exclur a lha correspodete a equação que estamos estudado e clur as coluas correspodetes às varáves excluídas da equação (I t, G t e m t ). Teremos uma matrz 3 3 mostrada abaxo: Não há ehuma lha ou colua cujos elemetos sejam todos guas a zero, etão a equação está de fato detfcada. Esta codção também é cohecda como codção de posto. Se esta codção ão fosse verfcada, a equação sera subdetfcada Como estmar um modelo de equações smultâeas
268 Um método já fo explctado a seção ateror: estma-se os parâmetros da forma reduzda. Cohecda a relação etre os parâmetros da forma reduzda e da forma estrutural, podemos ecotrar estes últmos 9. Este método é cohecdo como dos mímos quadrados dretos. Mas sto só pode ser feto para equações exatamete detfcadas. Se a equação for subdetfcada, ão dá para estmar mesmo. Mas se a equação for superdetfcada, o que, em prcípo, é uma cosa boa, pos há mas formação, ão dá para ecotrar uma relação um etre os parâmetros da forma estrutural e reduzda que os dê uma úca solução. Um método que pode ser esteddo a equações superdetfcadas é o dos mímos quadrados de dos estágos. Cosste em estmar as equações da forma reduzda. Aí, ecotrar os valores estmados para as varáves edógeas. Como são valores estmados, ão cluem os resíduos e portato, ão têm correlação com o termo de erro. Etão, usam-se estes valores estmados como substtutos das varáves edógeas que, o modelo estrutural, aparecem o lado dreto das equações. 66 Exemplo Dado o modelo estrutural para o mercado de um bem: Q = α + α P + α M + α 3 S + µ Q = β + β P + β R + ν (oferta) (demada) Ode Q é a quatdade comercalzada, P é o preço, R é a reda méda dos cosumdores, M é o preço da matéra prma e S são os saláros médos pagos aos trabalhadores que trabalham a produção deste bem. Com os dados da tabela abaxo, estme os parâmetros do modelo Tabela Q P R M S 98, 399,, 4, 99,4 48,8 95, 45,,3 473,6 89, 45,,5 485,6 85, 4, 4 9,8 498,4 8, 35, 3 9,9 54, 76, 36, 4, 55,6 69, 37,,5 56,4 65, 35, 9,6 47,8 6, 355, 9, 4, 54, 395, 95 9,3 3,8 5, 495, 9 9,88 35, 44, 555, 94,3 376,8 4, 545, 98 9,9 44,8 35, 495, 5 9,5 54,8 3, 39, 9,85 54,8 6, 375, 3 8,6 47,, 345,,4 535, 5, 435, 5,55 585,6, 455, 9 É mportate ressaltar que, em métodos de equações smultâeas, ão é possível, em geral, obter estmadores ão vesados, o que se cosegue é elmar a cosstêca.
269 Há duas varáves edógeas (Q e P) e três varáves exógeas (S, M e R). É fácl verfcar que a equação de demada é superdetfcada e a de oferta é exatamete detfcada. As equações a forma reduzda são: 67 P = π + π R + π 3 M + π 4 S + τ Q = π 5 + π 6 R + π 7 M + π 8 S + ξ Os resultados da estmação por mímos quadrados ordáros das equações a forma reduzda foram: P = -,683 +,867R +,48M +,S (,85) (,75) (,7) (,9) Q = 3,6 +,5R,7M,69S (,56) (,93) (,7) (,6) Os valores etre parêteses são os desvos padrão. A partr destas equações, calculamos as estmatvas de Q e P, que são cluídas a tabela abaxo: Qˆ Pˆ R M S 98,4643 9, ,, 4,,46,59 48,8 95, 45,,357, ,6 89, 45,,489, ,6 85, 4,,448 9, ,4 8, 35,,395 9,978 54, 76, 36,,5895,567 55,6 69, 37, 3,966, 56,4 65, 35,,9549 9,45 47,8 6, 355, 99,686 9,986 4, 54, 395, 94,5756 9,343 3,8 5, 495, 93,3558 9,854 35, 44, 555, 94,997,68 376,8 4, 545, 97,47,577 44,8 35, 495,,449 9,799 54,8 3, 39, 3,4 9,733 54,8 6, 375,,68 8,744 47,, 345,,646,53 535, 5, 435,,5,73 585,6, 455, Como o preço é a úca varável que aparece do lado dreto da equação,estes valores estmados que serão utlzados para a estmação do modelo estrutural, cujos resultados são mostrados abaxo: Q = 4,756 +,479P,53M,474S (,575) (,54) (,97) (,3) Q =,5,568P +,46R (oferta) (demada)
270 (9,85) (,984) (,63) 68 Note que os sas obtdos foram os esperados e os coefcetes ecotrados foram sgfcates a, pelo meos, % (verfque!). Exercícos Eucado para os exercícos a 3: dados os modelos estmados abaxo, verfque (baseado em tução ou teora) se os sas obtdos são adequados bem como outras evdêcas de multcoleardade e detfque as possíves causas e evetuas correções:. CONSENER = 34 -,8 POP +, CASAS +, RENDA -, PREÇO (76) (,7) (,) (,7) (9,3) R =,9 = observações CONSENER = cosumo de eerga elétrca POP = população CASAS = úmero de resdêcas RENDA = reda méda da população PREÇO = preço do kwh de eerga elétrca. SALÁRIO = 3,5 -,89 PONTOS + 8,9 REB +,4 ASSIST +,89 ROUB +, PERC (8,7) (,3) (4,) (,4) (,75) (,8) F = 45, SALÁRIO = saláro pago em uma lga profssoal de basquete PONTOS = úmero de potos por jogo REB = úmero de rebotes por jogo ASSIST = úmero de assstêcas por jogo ROUB = úmero de roubadas de bola por jogo PERC = aprovetameto percetual dos arremessos à cesta 3. CRIME = 8,9 -,9 ÁREA +,3 RENDA +,78 POP - 3, ESCOLA (,) (,76) (,) (,49) (,) R =,86 CRIME = ídce de crmaldade em uma cdade ÁREA = área total da regão urbaa em km RENDA = reda per capta da cdade POP = população da cdade ESCOLA = úmero médo de aos de escolardade da população 4. Dados os valores de Y, X, Z e W a tabela abaxo: Y X Z W 3, 7,6,3,56 4, 8,4 4,5,34,,67 6,7,67,5-3,39 8,9, 6, -,,,39 7,,3,3,7 8,8-5, 4,4,8 5,4-6,83 6,5,77 3,9-6,57 7,8,43 6, -,3 8,,8 a) calcule os coefcetes de correlação smples etre X, W e Z.
271 69 b) é possível estmar o modelo de regressão Y = β + β X + β Z + β W + µ? Justfque. (Sugestão: faça regressões utlzado as varáves X, Z e W). 5. Em uma cdade, foram obtdos os valores da tabela abaxo. Faça uma regressão que tome como varável depedete o preço do móvel e como varáves explcatvas as varáves dstâca ao cetro, úmero de dormtóros, área do móvel e reda mesal do chefe da famíla. Feta esta estmação, calcule as correlações amostras etre as varáves explcatvas; com estes últmos resultados, faça alterações o modelo que você julgar relevate e dscuta os resultados obtdos. Preço (R$) dstâca (km) dormtóros área (m ) reda mesal (R$) Dados os resultados da estmação de um modelo de regressão abaxo, realzada com uma amostra com 5 observações: coefcete desvo-padrão costate 3,4,56 X -,43,4 X,89,77 F =,8 a) Teste a sgfcâca dos parâmetros. b) Teste a valdade da regressão. c) Comete os resultados. 7. Com os dados da tabela abaxo, estme o cosumo em fução da taxa de juros e da reda. Teste a exstêca de autocorrelação e, se for o caso, estme ovamete o modelo corrgdo o problema ao juros reda cosumo , , , , ,
272 , , , , , , , , , , , , , , , , , , , 8. Use o teste de Whte para verfcar se há heteroscedastcdade o exemplo No exemplo supoha que sejam dadas as populações das cdades: cdade população A., B., C 3., D 4., E 6., F., G 5., H 34., I 45., J 57., K 6., L 8., M 95., N.., O.3., P.4., Q.6., Use o teste de Goldfeld-Quadt para testar a heteroscedastcdade deste modelo, usado a população como separador.. Ada o exemplo , faça uma estmação corrgdo o problema da heteroscedastcdade, admtdo-se que a varâca (ou o desvo padrão) seja proporcoal à população da cdade.. Supoha um modelo de oferta e demada dado por: Q t = α + α P t + α P t- + µ t Q t = β + β P t + β R t + ν t (oferta) (demada)
273 Ode Q são as quatdades, P é o preço e R é a reda. Classfque cada equação em relação à detfcação. 7. No exemplo 9.4.., classfque as demas equações em relação à detfcação. 3. No exemplo 9.4.., supoha que a varável saláros ão teha sdo dada. Estme este ovo modelo por mímos quadrados dretos e mímos quadrados de dos estágos e comete os resultados. 4. Assale verdadero ou falso: a) Quado há correlação etre as varáves, ada que ão perfeta, embora a estmação seja possível, devemos fazer ecessaramete as devdas correções. b) Como as varâcas são maores quado há multcoleardade, sto mplca que os estmadores ão são efcetes. c) Se os coefcetes da regressão apresetam desvos-padrão muto altos, etão certamete há multcoleardade. d) A multcoleardade é mas um problema umérco, com os dados, do que um problema o modelo propramete dto. e) Na preseça de autocorrelação os resíduos, o estmador de mímos quadrados ordáros será sempre ão vesado. f) Na preseça de heteroscedastcdade, o estmador de mímos quadrados ordáros será vesado. g) Na preseça de autocorrelação os resíduos, o estmador de mímos quadrados ordáros será efcete. h) Na preseça de heteroscedastcdade, o estmador de mímos quadrados ordáros será efcete. ) Com o teste de Durb-Watso é sempre possível testar autocorrelação, desde que os erros sgam um processo do tpo AR(). j) O método dos mímos quadrados poderados é recomedado quado há heteroscedastcdade. k) Havedo smultaedade, o estmador de mímos quadrados ordáros é ão vesado, porém cosstete. l) O método dos mímos quadrados dretos e de dos estágos produz estmadores ão vesados. Apêdce 9.A O método dos mímos quadrados geeralzados Como vmos, as hpóteses IV e V: IV) var(ε ) = σ (costate) V) E(ε ε j ) =, j (erros ão são autocorrelacoados). Podem ser resumdas, em otação matrcal, como: var(e) = σ I Um modelo que ão sga estas hpóteses pode ter como matrz de varâca e covarâca do vetor de erros, uma matrz qualquer, que chamaremos de Ω. var(e) = Ω
274 Já sabemos que o estmador de mímos quadrados, estas codções, é efcete. Para ecotrar um estmador efcete para esta stuação, supoha uma matrz T tal que: TΩT = I Expressão que também pode ser escrta assm: T T = Ω - O modelo de regressão lear, em otação matrcal, é: Y = Xβ + e Pré-multplcado a equação por T, temos: TY = TXβ + Te A varâca do erros deste ovo modelo pode ser escrta como: var(e) = E(Tee T ) = TΩT = I Que é um caso partcular da hpótese usual (em que σ = ). Portato, o modelo trasformado pode ser estmado por mímos quadrados ordáros. O estmador usual de mímos quadrados ordáros é: βˆ = (X X) - X Y Mas, este modelo trasformado, ão temos X e Y, mas TX e TY, etão: βˆ = (X T TX) - X T TY βˆ = (X Ω - X) - X Ω - Y Este estmador, por levar em cota um caso mas geral em que pode haver autocorrelação e/ou heteroscedastcdade é cohecdo por estmador de mímos quadrados geeralzados. Não é uma grade paacéa, etretato, pos em geral exge-se o cohecmeto da estrutura da matrz Ω. Estmá-la ão é uma solução vável, pos é uma matrz quadrada de ordem, o que sgfca que, uma amostra com observações, teríamos elemetos da matrz a serem estmados. Nos casos vstos este capítulo, por exemplo uma heteroscedastcdade em que sabamos que a varâca dos erros seja dada por z σ, em que os valores de z sejam cohecdos, a matrz Ω será dada por: 7 Ω = σ z... z z
275 Da mesma forma, se houver autocorrelação represetada por um processo autorregressvo de ordem, com coefcete de correlação ρ, a matrz Ω será dada por: 73 ρ Ω = σ ρ... ρ ρ ρ ρ... ρ ρ... ρ ρ ρ ρ 3... E assm, cohecdos os padrões da heteroscedastcdade, ou da autocorrelação, ou de ambas, podemos motar a matrz Ω e fazer dretamete a estmação por mímos quadrados geeralzados e obter um estmador que teha varâca míma.
276 74
277 75 CAPÍTULO SÉRIES DE TEMPO Neste capítulo os dedcaremos à trodução ao tratameto de séres temporas e, a partr delas, a prevsão de valores futuros de uma varável a partr de valores passados da mesma.. Métodos gêuos de prevsão O método mas smples de prevsão de uma varável é aquele em que usamos para a prevsão justamete o últmo valor da varável. Por exemplo o valor de uma ação os últmos cco das fo: 3,, 5, 4 e 3. Etão a ossa prevsão para o valor da ação será 3, que é justamete o últmo valor da sére. O pressuposto deste método de prevsão, a verdade, ão é tão gêuo assm. Este tpo de método só será útl se o comportameto da varável for alguma cosa como o modelo mostrado abaxo: y t = y t- + ε t Ou seja, o valor da varável o período t é o valor que ela tha o período t mas um compoete de erro. Este processo é cohecdo como radom walk ou, traduzdo, passeo aleatóro. O termo de erro tem, evetualmete, as mesmas característcas do erro do modelo de regressão lear (homoscedástco, ão autocorrelacoado, etc.). Mas, prcpalmete, tem méda zero. Vale dzer que ão é um compoete sstemátco, mas aleatóro, que pode subr, descer (ser postvo, egatvo) ao sabor do acaso. É um compoete que, por suas característcas, ão é prevsível. Desta forma, a melhor forma de prevermos y t é mesmo através do valor de y t-. E, de fato, se aplcarmos o operador esperaça a equação acma, teremos: E(y t ) = E(y t- + ε t ) E(y t ) = E(y t- ) + E(ε t ) Como y t- já é cohecdo 3 e o termo erro tem méda zero: E(y t ) = y t- + E(y t ) = y t- Portato, a melhor prevsão para y t é realmete y t-, sto, claro, se a varável y t tver um comportameto de um passeo aleatóro.. Séres estacoáras e regressão espúra Uma sére que segue um comportameto como o do tem ateror, sto é: y t = y t- + ε t 3 Com sto em vsta, o mas correto devera ser E(y t y t- ), ou seja, a esperaça de y t dado y t-, já que este é cohecdo.
278 76 É dta uma sére ão estacoára, porque se um dado período ocorre um choque, que será dado por um valor de ε t dferete de zero, este valor fca corporado eteramete os valores futuros da varável y t. Se o processo, o etato, for dado por: y t =,8y t- + ε t Um choque que ocorra um determado ao será amortecdo os aos segutes. Supoha que o valor de y t vha sedo zero até que, em 99 houve um choque postvo ε t =, sto é, em 99, o valor de y t fo. O que ocorrerá os aos segutes, admtdo que ε t seja gual a zero para os demas aos? y 988 = y 989 =,8y ε 989 = + = y 99 =,8y ε 99 = + = y 99 =,8y 99 + ε 99 =,8 + = 6 y 99 =,8y 99 + ε 99 =,8 6 + =,8 y 993 =,8y 99 + ε 993 =,8,8 + =,4 y 994 =,8y ε 994 =,8,4 + = 8,9 y 995 =,8y ε 995 =,8 8,9 + = 6,5536 y 996 =,8y ε 996 =,8 6, = 5,488 E assm sucessvamete. Verfcamos que y t tede a voltar para o seu valor hstórco (zero), pos o efeto do choque é dsspado ao logo dos aos, o que ão ocorre com o passeo aleatóro. A sére é dta estacoára. Mas precsamete, uma sére é dta estacoára 3 se acotecer: E(y t ) = costate var(y t ) = costate E a cov(y t, y t-s ), s, só depede do valor de s, sto é, só depede do tamaho da defasagem, mas ão do período t. Por exemplo: cov(y 998, y 996 ) = cov(y 997, y 995 ) = cov(y 996, y 994 ) =... Mas adate veremos como testar se uma sére é ou ão estacoára. Para o processo apresetado: y t =,8y t- + ε t Temos que: E(y t ) = E(,8y t- + ε t ) E(y t ) = E(,8y t- ) + E(ε t ) E(y t ) =,8E(y t- ) + E(ε t ) Como a sére é estacoára e E(ε t ) = : E(y t ) =,8E(y t ) + 3 A defção apresetada é para as chamadas séres fracamete estacoáras. A defção de séres fortemete estacoáras clu séres que possuem méda ou varâca ftas.
279 ,E(y t ) = E(y t ) = 77 A méda do processo é zero. É claro que, para ser estacoára, a sére ão precsa ter méda zero, basta ser costate. Um processo semelhate com méda dferete de zero é dado por: y t = y +,8y t- + ε t E, este caso, a méda do processo será dada por (verfque!): E(y t ) = 5y A varâca é dada por: var(y t ) = var(,8y t- + ε t ) var(y t ) = var(,8y t- ) + var(ε t ) var(y t ) =,64var(y t- ) + var(ε t ) De ovo, sedo a sére estacoára e var(ε t ) = σ var(y t ) =,64var(y t ) + σ,36var(y t ) = σ var(y t ) = σ,36 var(y t ),77σ Alguma ateção especal deve ser dada a séres que ão são estacoáras, especalmete quado queremos fazer uma regressão etre elas, como o exemplo a segur. Exemplo.. A tabela a segur mostra o percetual de resdêcas ateddas por servços de esgoto a Meltáva e as exportações de trgo do Kazmestão em mlhares de toeladas. Estme a regressão com as exportações de trgo como varável depedete e o percetual de resdêcas com esgoto como varável depedete. Tabela.. ao % de resdêcas ateddas por esgoto (X) exportações de trgo (Y) 97,5 83,6 97,5 98, 973 4,3 34, 974 7,9 5, 975 3,6 7, ,4 9, , 36, ,9 336, ,6 36,8 98 4,4 379, , 394, 98 45,9 45,8
280 983 48,6 439, 984 5,3 46, ,9 5, ,7 58, ,6 53, ,3 558, ,9 577, ,8 63, ,5 666, 99 68,4 685, ,3 79, 994 7, 739, , 757, ,9 795, ,7 8, ,4 84, ,3 865,8 79, 88, 78 R =,9739 F = 43,8 DW =,336 Os resultados da regressão foram: Y = 93,64 +,59 X (,8) (,36) Os valores etre parêteses são os desvos padrão. O resultado da regressão fo, em prcípo, excepcoal. As estatístcas t foram muto altas, especalmete para o coefcete da varável X (3,3!!) mostrado que ele é, altamete sgfcate. O R é próxmo de e o valor calculado de F também fo muto alto. O mstro da agrcultura do Kazmestão, ao tomar cohecmeto destes resultados, devera tomar provdêcas o setdo de estmular a expasão do servço de esgoto a Meltáva, pos sto aparetemete tem um forte efeto sobre as exportações de trgo de seu país. É claro que sto é um absurdo. Apesar dos resultados aparetemete muto bos, ão é possível que o úmero de casas ateddas por esgoto a Meltáva teha algum efeto sobre as exportações do Kazmestão, quato mas ser tão determate quato dcam os resultados obtdos. Há uma dca que alguma cosa está errada: a estatístca de Durb-Watso ecotrada fo muto próxma de zero, dcado a preseça de uma autocorrelação postva os erros. Se observarmos o comportameto das duas varáves um gráfco:
281 gráfco.. evolução do percetual de resdêcas com esgoto a Meltáva gráfco.. evolução das exportações de trgo o Kazmestão Pelos gráfcos, podemos perceber que ambas as varáves ão são estacoáras, e o resultado obtdo, a verdade, é típco de quado fazemos uma regressão utlzado duas varáves ão estacoáras. Mesmo que uma varável ão teha ada a ver com a outra, o R será muto próxmo de, as estatístcas t e F serão muto grades (mas, evdetemete, ão terão ehum sgfcado 3 ) e a estatístca DW será próxma de zero. Este tpo de regressão é cohecdo como regressão espúra..3 Procedmeto de Box e Jeks (modelos ARIMA) O procedmeto de Box e Jeks 33 cosste em explcar uma varável através de valores passados dela mesma e de valores passados de choques. Como ehuma outra varável está explctamete evolvda o modelo, este é chamado de uvarado..3. Modelos Uma classe dos modelos de Box e Jeks é aquela em que a varável é explcada ucamete por valores passados dela mesma, como este: y t = θ y t- + ε t 3 Mas há exceções como veremos ao logo deste capítulo. 33 Este ome é dado a uma sére de processos que foram stetzados uma úca metodologa por Box e Jeks (Box, G. e G. Jeks. Tme Seres Aalyss, Forecastg ad Cotrol. São Fracsco: Holde Day, 976).
282 8 Neste caso o tercepto pode ou ão ser cluído, como vmos, depededo da méda do processo ser (ou ão) zero. Este processo é uma regressão desta varável por ela mesma, é portato, como já vmos, um processo auto-regressvo. E, como temos uma defasagem da varável, é um processo autoregressvo de ordem ou AR(). O erro ε t represeta os choques que podem ocorrer sobre a varável y t e tem todas as característcas das hpóteses báscas de um modelo de regressão lear, ou seja, ele mesmo é um processo estacoáro com méda zero com o detalhe de ão apresetar autocorrelação. Um processo deste tpo é cohecdo como ruído braco. Podemos ter também um processo AR(): y t = θ y t- + θ y t- + ε t Ou mesmo um processo auto-regressvo de qualquer ordem, por exemplo, um AR(p): y t = θ y t- + θ y t θ p y t-p + ε t Podemos escrever este processo de maera mas resumda se utlzarmos o operador 34 L, defdo da segute forma: Ly t = y t- L y t = LLy t = Ly t- = y t- L y t = y t- Desta forma, o processo AR(p) pode ser escrto assm: y t θ y t- θ y t-... θ p y t-p = ε t y t θ Ly t θ L y t... θ p L P y t = ε t Embora o operador L ão seja um úmero (ele, sozho, ão vale ada), ele pode ser tratado algebrcamete como se fosse um úmero. Se colocarmos y t em evdêca: ( θ L θ L... θ p L p ) y t = ε t Temos, multplcado y t, um polômo de ordem p a varável L, que podemos chamar smplesmete de Θ p (L). Assm: Θ p (L) θ L θ L... θ p L p E etão, podemos escrever o modelo do tpo AR(p) de uma maera mas stétca como: Θ p (L) y t = ε t Uma forma dferete é quado o processo é uma combação de choques passados: y t = ε t ϕ ε t- 34 Do glês last. Algus autores utlzam B (de back).
283 8 Neste caso, a varável y t é uma combação de um choque presete com um choque passado, especfcamete um choque ocorrdo o período medatamete ateror. Este processo é cohecdo como de médas móves, este caso, de ordem, o que é abrevado 35 por MA(). Um processo MA() sera dado por: y t = ε t ϕ ε t- ϕ ε t- E um processo de médas móves de ordem qualquer, dgamos, um MA(q) sera assm: y t = ε t ϕ ε t- ϕ ε t-... ϕ q ε t-q Da mesma forma que um processo auto-regressvo, podemos utlzar o operador L: y t = ε t ϕ Lε t ϕ L ε t... ϕ q L q ε t Colocado ε t em evdêca: y t = ε t ( ϕ L ϕ L... ϕ q L q ) E, de ovo, temos um polômo em L, desta vez de ordem q, que deomaremos Φ q (L): Φ q (L) ϕ L ϕ L... ϕ q L q E o processo MA(q) pode ser escrto como se segue: y t = Φ q (L) ε t Podemos ada ter processos que são combações de processos auto-regressvos e de médas móves, como por exemplo: y t = θ y t- + ε t ϕ ε t- Que é uma combação de um processo auto-regressvo de ordem e de médas móves de ordem, que é cohecdo como ARMA(,) sedo o prmero úmero a ordem do AR e o segudo a ordem do MA. Assm, um ARMA(,3) será dado por: y t = θ y t- + θ y t- + ε t ϕ ε t- ϕ ε t- ϕ 3 ε t-3 E, geercamete, um ARMA(p,q) sera: y t = θ y t- + θ y t θ p y t-p + ε t ϕ ε t- ϕ ε t-... ϕ q ε t-q Ou ada: y t θ y t- θ y t-... θ p y t-p = ε t ϕ ε t- ϕ ε t-... ϕ q ε t-q y t θ Ly t θ L y t... θ p L P y t = ε t ϕ Lε t ϕ L ε t... ϕ q L q ε t ( θ L θ L... θ p L P ) y t = ε t ( ϕ L ϕ L... ϕ q L q ) Ou, smplesmete: 35 Do glês movg average.
284 8 Θ p (L) y t = Φ q (L) ε t Ada temos que prestar ateção a um detalhe: se, estes processos, a varável é explcada por valores passados dela mesma (e/ou choques passados), covém que ela seja uma varável estacoára. Quado a varável y t ão é estacoára, podemos tetar defr uma ova varável z t como sedo a prmera dfereça de y t, sto é: z t = y t y t- = y t Se 36 y t ão é estacoára, mas z t é, dz-se que y t é tegrada 37 de ordem, ou I(). Às vezes, tomar a prmera dfereça ão é sufcete e, para obtermos uma varável estacoára, temos que tomar a seguda dfereça (a dfereça da dfereça), ou seja: z t = y t = ( y t ) = y t y t- Se só assm obtemos uma varável estacoára, etão y t é dta tegrada de ordem, I(). Tomamos quatas dfereças forem ecessáras até obter uma varável estacoára. Se forem d dfereças, etão y t é dta I(d). Evdetemete, uma varável dta I() é uma varável estacoára. Se y t ão é uma varável estacoára, mas a sua d-ésma dfereça é, etão temos: z t = d y t E, se esta varável z t segue um processo ARMA(p,q), sto é: z t = θ z t- + θ z t θ p z t-p + ε t ϕ ε t- ϕ ε t-... ϕ q ε t-q Etão y t segue um processo ARIMA(p,d,q) ode a letra I do meo (e o úmero d também) se referem à ordem de tegração. Isto é, y t é tegrada de ordem d, e a sua d-ésma dfereça segue um processo combado auto-regressvo (de ordem p) e de médas móves (de ordem q). O processo para y t será dado por: d y t = θ d y t- + θ d y t θ p d y t-p + ε t ϕ ε t- ϕ ε t-... ϕ q ε t-q Exemplo.3.. Supoha que uma varável y t segue um processo ARIMA(,,). Escreva este processo em sua forma aalítca. A varável y t é tegrada de ordem (é I()). Portato, a varável z t dada por: z t = y t É estacoára e segue um processo ARMA(,), ou seja: 36 Note que L 37 É uma déa semelhate à do cálculo tegral, porém em termos dscretos, pos y t é obtdo a partr da soma de z t.
285 83 z t = θ z t- + ε t ϕ ε t- ϕ ε t- Portato: y t = θ y t- + ε t ϕ ε t- ϕ ε t-.3. Idetfcação dos modelos ARIMA Ates de estmar um modelo ARIMA é precso descobrr (ou, pelo meos, ter uma boa déa) de qual é o processo a ser estmado. Isto é feto através das fuções de autocorrelação (FAC) e autocorrelação parcal (FACP). Vejamos o comportameto destas fuções para um AR(). Isto é, supomos que o processo seja do tpo: y t = θ y t- + ε t Em sedo estacoára a covarâca (e portato o coefcete de correlação) etre a varável e valores defasados dela mesma é costate se for dado o úmero de defasages. Portato, teremos um valor para a autocorrelação para cada úmero de defasages, sto é: ρ = corr(y t, y t- ) ρ = corr(y t, y t- ) ρ k = corr(y t, y t-k ) E, como sabemos, o coefcete de correlação é dado por: cov( yt, yt-k ) cov( yt, yt-k ) cov( yt, y ρ k = corr(y t, y t-k ) = = = var( y )var( y ) var( y )var( y ) var( y ) t t-k Já que, em se tratado de uma varável estacoára, a varâca é costate. Fazedo: t t t t-k ) γ k = cov(y t, y t-k ) γ = var(y t ) e Etão: γ ρ k = k γ A varâca de y t é dada por: var(y t ) = var(θ y t- + ε t ) var(y t ) = var(θ y t- ) + var(ε t ) var(y t ) = θ var(y t- ) + var(ε t ) var(y t ) = θ var(y t ) + var(ε t ) ( θ )var(y t ) = σ σ γ = var(y t ) = θ
286 84 Etão, para sabermos como se comporta a fução de autocorrelação, basta sabermos como se comporta autocovarâca, sto é, γ, γ, γ 3, etc. γ k = cov(y t, y t-k ) = E(y t y t-k ) E(y t )E(y t-k ) E, como o processo tem méda zero: γ k = E(y t y t-k ) Portato: γ = E(y t y t- ) Sedo que: y t = θ y t- + ε t y t- = θ y t- + ε t- Etão: γ = E(y t y t- ) = E[(θ y t- + ε t ) y t- ) γ = E[θ y t- + ε t y t- ] γ = E(θ y t- ) + E(ε t y t- ) γ = θ E(y t- ) + γ = θ var(y t ) = θγ Assm sedo: ρ = θ O mesmo procedmeto será feto para γ : γ = E(y t y t- ) γ = E[(θ y t- + ε t ) y t- ] γ = E[(θ (θy t- + ε t- ) + ε t ) y t- ] γ = E[θ y t- + θε t- y t- + ε t y t- ] γ = E(θ y t- ) + E(θε t- y t- ) + E(ε t y t- ) γ = θ E(y t- ) + θe(ε t- y t- ) + E(ε t y t- ) γ = θ var(y t ) + + γ = θ γ Portato: ρ = θ E como θ é meor do que, em módulo (porque caso cotráro a sére ão sera estacoára), θ é meor do que θ (em módulo). É fácl ver que os valores segutes para a fução de autocorrelação serão θ 3, θ 4, etc., de modo que a fução de autocorrelação de um processo AR() será declate. Isto, etretato, ão é sufcete para detfcar o processo como AR(). O coceto de correlação parcal se refere à correlação etre duas varáves elmado o efeto de outras varáves, o que é feto através de uma regressão. De fato, a fução de autocorrelação parcal é dada pelos coefcetes φ, φ, φ 3, etc., que são ecotrados assm: O coefcete φ é ecotrado a regressão abaxo:
287 85 y t = α + φ y t- + ν t Equato o coefcete φ será o correspodete estmado pela segute regressão: y t = α + φ y t- + φ y t- + ν t E assm sucessvamete. É fácl ver que, se o processo é AR(), o coefcete φ ão exste (ão será sgfcate uma regressão). De um modo geral, um AR(p) φ k para k meor ou gual a p e φ k = para valores maores do que k. Portato, um processo auto-regressvo apreseta fução de autocorrelação declate 38 e a fução de autocorrelação parcal trucada exatamete a ordem do processo fução de autocorrelação de um AR(p) qualquer p fução de autocorrelação parcal de um AR() 38 Só fzemos para AR() mas o resultado pode ser geeralzado.
288 fução de autocorrelação parcal de um AR(3) Vejamos o comportameto destas duas fuções para um MA(). y t = ε t ϕ ε t- A varâca será dada por: var(y t ) = var(ε t ϕ ε t- ) var(y t ) = var(ε t ) + var(ϕ ε t- ) var(y t ) = var(ε t ) + ϕ var(ε t- ) var(y t ) = var(ε t ) + ϕ var(ε t ) var(y t ) = ( + ϕ )var(ε t ) var(y t ) = ( + ϕ ) σ Determemos as autocovarâca de ordem : Portato: γ = E(y t y t- ) γ = E[(ε t ϕ ε t- )( ε t- ϕ ε t- )] γ = E(ε t ε t- ϕ ε t- ϕ ε t ε t- + ϕ ε t- ε t- ) γ = E(ε t ε t- ) E(ϕ ε t- ) E(ϕ ε t ε t- ) + E(ϕ ε t- ε t- ) γ = E(ε t ε t- ) ϕe(ε t- ) ϕe(ε t ε t- ) + ϕ E(ε t- ε t- ) γ = ϕe(ε t- ) + γ = ϕ var(ε t ) γ = ϕ σ ρ = ϕ / ( + ϕ ) Para ordem, teremos: γ = E(y t y t- ) γ = E[(ε t ϕ ε t- )( ε t- ϕ ε t-3 )] γ = E(ε t ε t- ϕ ε t- ε t- ϕ ε t ε t-3 + ϕ ε t- ε t-3 ) γ = E(ε t ε t- ) E(ϕε t- ε t- ) E(ϕ ε t ε t-3 ) + E(ϕ ε t- ε t-3 ) γ = E(ε t ε t- ) ϕe(ε t- ε t- ) ϕe(ε t ε t-3 ) + ϕ E(ε t- ε t-3 ) γ = + =
289 87 A fução de autocorrelação só é dferete de zero para k = quado se trata de um MA(). Geeralzado, a fução de autocorrelação de um MA(q) é dferete de zero para valores de k meores ou guas a q e é zero para k maor do que q. O poto em que a fução de autocorrelação é trucada determa a ordem do processo MA. Agora, passemos à fução de autocorrelação parcal. Ates, faremos uma trasformação o modelo: y t = ε t ϕ ε t- ε t = y t + ϕ ε t- Mas: ε t- = y t- + ϕ ε t- Substtudo, vem: ε t = y t + ϕ( y t- + ϕ ε t- ) ε t = y t + ϕ y t- + ϕ ε t- De ovo: ε t- = y t- + ϕ ε t-3 E, substtudo mas uma vez, temos: ε t = y t + ϕ y t- + ϕ (y t- + ϕ ε t-3 ) ε t = y t + ϕ y t- + ϕ y t- + ϕ 3 ε t-3 E, se repetrmos o processo defdamete chegaremos a: ε t = y t + ϕ y t- + ϕ y t- + ϕ 3 y t-3 + ϕ 4 y t-4 + ϕ 5 y t Que é uma represetação de um processo auto-regressvo de ordem fta. Portato, um processo MA pode ser escrto como um AR fto. Como o coefcete ϕ tem que ser meor do que, em módulo (caso cotráro, esta versão ão sera possível, pos o valor de ε t ão covergra a expressão acma), os coefcetes são declates. Assm, a fução de autocorrelação parcal de um MA() sera equvalete à desse processo AR fto, sto é, apresetara coefcetes declates fução de autocorrelação de um MA()
290 fução de autocorrelação de um MA() fução de autocorrelação parcal de um MA(q) qualquer q Falmete, se o processo for um ARMA(p,q) ele terá as fuções de autocorrelação e autocorrelação parcal combadas dos dos processos. Desta forma, um processo deste tpo apresetará as duas fuções defdamete declates. O quadro abaxo resume a detfcação de processos ARMA: tpo de processo fução de autocorrelação fução de autocorrelação parcal AR(p) declate trucada em p MA(q) trucada em q declate ARMA(p,q) declate declate Exemplo.3.. Idetfque o processo da varável dada a tabela abaxo: ao Y t ao Y t 96 3, 98 36,5 96 3, , 963 3, ,4
291 964 34, , , , , , , , 968 3, , , ,7 97 3, , ,4 99 3, , , , , , , , , 996 3, , , , , , ,9 33, Se observarmos o gráfco de Y t : Aparetemete, é uma varável estacoára. Etão, passamos a calcular as autocorrelações e autocorrelações parcas. A tabela abaxo mostra os valores de Y t e suas defasages: ao Y t Y t- Y t- Y t-3 Y t-4 Y t , 96 3,7 3, 963 3,4 3,7 3, , 3,4 3,7 3, 965 3,8 34, 3,4 3,7 3, , 3,8 34, 3,4 3,7 3, ,5 35, 3,8 34, 3,4 3, , 33,5 35, 3,8 34, 3,4
292 969 3,7 3, 33,5 35, 3,8 34, 97 3,7 3,7 3, 33,5 35, 3, ,4 3,7 3,7 3, 33,5 35, 97 36,3 34,4 3,7 3,7 3, 33, ,5 36,3 34,4 3,7 3,7 3, , 37,5 36,3 34,4 3,7 3, ,9 38, 37,5 36,3 34,4 3, , 35,9 38, 37,5 36,3 34, ,5 35, 35,9 38, 37,5 36, ,7 35,5 35, 35,9 38, 37, ,4 34,7 35,5 35, 35,9 38, 98 37,9 36,4 34,7 35,5 35, 35, ,5 37,9 36,4 34,7 35,5 35, 98 35, 36,5 37,9 36,4 34,7 35, ,4 35, 36,5 37,9 36,4 34, ,8 36,4 35, 36,5 37,9 36, ,3 36,8 36,4 35, 36,5 37, , 35,3 36,8 36,4 35, 36, , 37, 35,3 36,8 36,4 35, ,5 38, 37, 35,3 36,8 36, ,7 37,5 38, 37, 35,3 36, ,8 34,7 37,5 38, 37, 35,3 99 3,4 34,8 34,7 37,5 38, 37, 99 33,5 3,4 34,8 34,7 37,5 38, 993 3,8 33,5 3,4 34,8 34,7 37, , 3,8 33,5 3,4 34,8 34, ,4 3, 3,8 33,5 3,4 34, ,6 3,4 3, 3,8 33,5 3, ,6 3,6 3,4 3, 3,8 33, , 3,6 3,6 3,4 3, 3, ,9 33, 3,6 3,6 3,4 3, 33,3 3,9 33, 3,6 3,6 3,4 9 Usado a tabela acma, podemos ecotrar os valores da fução de autocorrelação 39 : ρ = corr(y t, Y t- ) =,7538 ρ = corr(y t, Y t- ) =,65 ρ 3 = corr(y t, Y t-3 ) =,398 ρ 4 = corr(y t, Y t-4 ) =,645 ρ 5 = corr(y t, Y t-5 ) =,97 O que dca uma fução de autocorrelação declate, típca de um processo AR ou ARMA. De fato, pode-se mostrar que o tervalo de 95% cofaça é dado por: IC 95% ± = ± 4,36 39 Os valores amostras das FAC e FACP é cohecdo por correlograma.
293 Portato, os valores de ρ, ρ e ρ 3 são sgfcates, etão temos uma fução de autocorrelação declate (possvelmete 4, tedo em vsta os demas valores) ou uma fução trucada em 3. 9 Para ecotrar os valores da fução de autocorrelação parcal, estmamos as regressões com os valores defasados. Os resultados foram: Y t = 9,3 +,737Y t- Y t = 8,5 +,686Y t- +,8Y t- Y t =, +,695Y t- +,4Y t-,66y t-3 Y t = 9,9 +,6959Y t- +,666Y t-,7y t-3 +,57Y t-4 Y t = 8,4 +,799Y t- +,6Y t-,58y t-3,34y t-4 +,67Y t-5 Os valores da fução de autocorrelação parcal, etão, são: φ =,737 φ =,8 φ 3 =,66 φ 4 =,57 φ 5 =,67 Neste caso, fca claro que a fução é trucada em, pos, ão só a queda de φ para φ é abrupta, como todos os valores de φ em date fcam bem abaxo do valor crítco de,36 (em módulo). Temos, portato, uma fução de autocorrelação declate e uma fução de autocorrelação parcal trucada em, o que os dca que o processo é um AR()..3.3 Estmação de modelos ARIMA A estmação de um modelo AR pode ser feta por mímos quadrados ordáros. Para um modelo MA ou ARMA, a estmação deve ser feta por um processo recursvo, já que os erros (choques) passados, que atuam como varáves depedetes o modelo, ão são dretamete observáves. Exemplo.3.3. Estme um modelo ARIMA para a varável apresetada o exemplo.3... A detfcação sugere um modelo AR(), que pode ser estmado por mímos quadrados ordáros o que, alás, já fo feto quado estmávamos a fução de autocorrelação parcal. O resultado fo: Y t = 9,3 +,737Y t- Exemplo.3.3. Dada a sére a tabela abaxo, supoha que ela é um MA() e estme o modelo. ao Z t ao Z t 96 3,8 98, 4 Lembre-se que, como em qualquer processo de estmação (a detfcação sera o prmero passo), estamos ldado com valores amostras.
294 96,9 98, ,3 983,8 964, ,6 965, , 966 3, 986, ,4 987,9 968,8 988, 969 -, , 97 -,6 99 -,6 97 -,3 99 3,3 97 -, 99,7 973,8 993, 974 4, , , 995 4, , , , 997 4,6 978, 998 3, , 999 4,5 98,5 3, 9 Se é um MA(), etão é do tpo: Z t = α + ε t ϕ ε t- Como ε t- ão é observável, uma forma de estmar é dar um chute cal para α e ϕ. O chute cal para α é fácl, pos: E(Z t ) = E(α) + E(ε t ) ϕ E(ε t- ) = α Portato, α é a própra méda do processo, etão chutaremos o valor cal para α como sedo a méda amostral dos Z t, que é dada por,9. Para o chute cal do coefcete ϕ, usamos o fato de que um MA() pode ser escrto como um AR fto, sto é: Ou ε t = y t + ϕ y t- + ϕ y t- + ϕ 3 y t-3 + ϕ 4 y t-4 + ϕ 5 y t y t = ϕ y t- ϕ y t- ϕ 3 y t-3 ϕ 4 y t-4 ϕ 5 y t ε t Evdetemete, ão é possível estmar um AR fto, mas podemos ter uma boa déa do coefcete ϕ se estmarmos um processo AR com váras defasages. Estmamos um AR(5) e o resultado fo: y t =,34 +,67 y t-,4 y t- +,35 y t-3,7 y t-4,4 y t-5 O chute cal será ϕ =,67 Etão, o modelo cal será dado por: Z t =,9 + ε t +,67ε t-
295 93 Cosderado 4 εˆ 96 =, computamos εˆ t a partr de: εˆ t = Z t,9,67 εˆ t- O que é feto a tabela abaxo: ao Z t εˆ t εˆ t- 96 3,,9 96 3,7 -,73, ,4,589 -, , -,5655, ,8,5568 -, ,,55569, ,5,79769, , -,975, ,7 -,6933 -, ,7 -,975 -, ,4 -, , ,3 -, , ,5,64 -, ,,333, ,9,63876, , -,875, ,5 -,557 -, ,7 -,797 -, ,4 -,439 -, ,9,563 -, ,5 -,38447, ,, , ,4,685, ,8,4458, ,3,59648, ,,358, , -,344, ,5 -,66 -, ,7 -,596 -, ,8 -, ,596 4 Podera ser outro crtéro. Note que a estmação feta usado outro crtéro poderá dar resultados dferetes.
296 99 3,4, , ,5 -,9979, ,8,6963 -, ,,385, ,4,344, ,6,7, ,6,579, ,,49897, ,9,566569, ,3 -,696, E etão, usamos εˆ t- computado como uma varável uma ova estmação. O resultado obtdo fo: Z t =,993 + ε t +,63ε t- Repetmos o procedmeto com estes ovos valores. Computamos ovamete εˆ t e εˆ t- e refazemos a estmação, cujo resultado fo: Z t =,973 + ε t +,697ε t- Repetdo ovamete: E ovamete: Z t =,93 + ε t +,695ε t- Z t =,933 + ε t +,696ε t- E repetmos o procedmeto quatas vezes forem ecessáras, até que a as dfereças etre os coefcetes seja sufcetemete pequea detro de um crtéro estabelecdo. Notamos que a dfereça está a tercera casa decmal, sto é, o erro já é meor do que,. Portato, o resultado da estmação é: Z t =,93 + ε t +,63ε t-.3.4 Dagóstco de modelos ARIMA Como é óbvo, quado fazemos a detfcação do modelo, as fuções de autocorrelação e autocorrelação parcal ão são populacoas, mas amostras. Assm sedo, a detfcação, a maora dos casos, ão os dá uma resposta deftva de qual o modelo a ser estmado. Após a estmação, um dagóstco do modelo deve ser feto para termos certeza de que o modelo escolhdo fo adequado 4. E o que é um modelo adequado? É aquele que explca todas as terações etre a varável e valores passados dela mesma ou de choques passados. Isto sgfca que os resíduos devem ser desprovdos de qualquer tpo de autocorrelação, portato devem ter característcas de um ruído braco. 4 Note que é possível que mas de um modelo ARIMA se mostre adequado para estmar uma sére, a escolha do modelo reca etão os crtéros de escolha como os crtéros de formação de Schwarz e de Akake.
297 Para tato, calculamos a fução de autocorrelação dos resíduos. Para se testar a hpótese ula de que todas as autocovarâcas são ulas, usa-se a estatístca de Box e Perce: 95 m Q = ρ k k= Que segue uma dstrbução de χ com m graus de lberdade. Ou ada, a estatístca de Ljug e Box (que costuma apresetar melhor desempeho em amostras pequeas): m ρ Q = ( +) - k= k k Que segue uma dstrbução de χ com os mesmos m graus de lberdade. Exemplo.3.4. Faça o dagóstco do modelo estmado o exemplo.3.3. Os resíduos são mostrados a tabela abaxo: -,59,9947 -,885, ,776,795, ,97,35,334739, ,4643 -,4333 -,3377 -, ,7, ,4865,566 -,365 -,39644,67764, ,4539 -,67 -,494,3883,68398,4593, ,9656 -,4487 -,476,4545,98367,4985,9397 -,467 -,7533 E a partr dos mesmos, calculamos os ρ k e as estatístcas Q, mostradas a tabela abaxo: k ρ k Ljug-Box Box-Perce χ (k, 9%) -,69,56,448,7,4,89,933 4,6 3 -,46,39,57 6,5 4 -,9,675,485 7,78 5 -,883,9738,733 9,4 6,75,47,95,64 7,58 4,363 3,639, 8,854 6,358 4,944 3,36 9 -,77 7,885 6,68 4,68 -,88 9,7595 7,548 5,99 -,9,596 9,485 7,8 -,86 3,344 9,7739 8,55 3,73 3,748,5 9,8 4,45 3,7553,37,6 5,7 6,8968,696,3 Prmeramete, voltemos ossa ateção para a colua dos ρ k. O valor lmte é dado por:
298 96 ± ±,3 39 Todos os valores dvduas de ρ k estão detro do lmte, o que já é aletador, pos, pelo meos tomadas uma a uma, as autocorrelações são ão sgfcates. O teste cojuto é feto pelas estatístcas Q, e tato a de Ljug e Box como a de Box Perce estão abaxo do valor lmte da dstrbução χ com os respectvos graus de lberdade. Portato, acetamos a hpótese ula de que todas as autocorrelações são ulas e, assm sedo, os resíduos se comportam como um ruído braco e, desta forma, coclu-se que o modelo estmado fo adequado..3.5 Codções de estacoaredade e vertbldade de um modelo ARIMA Tomemos um modelo AR(): y t = θ y t- + ε t Sabemos que a sére y t só será estacoára se θ, em módulo, for meor do que, sto é: θ < O que vale dzer, se escrevermos o modelo como se segue: Ode: Θ (L) y t = ε t Θ (L) θl É um polômo em L, cuja raz será dada por (substtudo L por λ): θλ = λ = θ E, se θ for meor do que, em módulo, λ será maor do que (também em módulo). A raz do polômo deve, etão, ser maor do que em valores absolutos, o que se dz, de uma maera um tato sofstcada, que a raz ca fora do círculo utáro. Para um modelo AR(p) qualquer, sto é: y t = θ y t- + θ y t θ p y t-p + ε t Que pode ser escrto como: Θ p (L) y t = ε t Ode Θ p (L) θ L θ L... θ p L p
299 97 A codção de estacoaredade deste processo é a de que todas as raízes de Θ p (L) caam fora do círculo utáro. A cotrapartda da codção de estacoaredade do modelo auto-regressvo é a codção de vertbldade do modelo de médas móves. Dado um modelo MA(): y t = ε t ϕ ε t- Vmos que este modelo pode ser escrto (vertdo) como um AR fto. Mas para sso é ecessáro que o coefcete ϕ seja meor do que, em módulo. Vale dzer que a raz do polômo Φ (L) dado por: Φ (L) ϕl Caa fora do círculo utáro. Da mesma forma, um modelo MA(q) dado por: y t = Φ q (L) ε t Ode: Φ q (L) ϕ L ϕ L... ϕ q L q Para que este modelo possa ser vertdo para um AR fto, é ecessáro que todas as raízes de Φ q (L) caam fora do círculo utáro..4 Testes de raízes utáras Fca clara a mportâca, pelo que fo vsto até agora, de testar, para uma sére y t, se um modelo do tpo AR(): y t = ρy t- + ε t Se o coefcete ρ é gual a. Se sto ocorrer, y t ão é estacoáro e dz-se que apreseta uma raz utára, sto é, a raz do polômo auto-regressvo é gual a. Se ρ for mesmo gual a, a varâca de y t va para fto à medda que t aumeta. Desta forma, os testes usuas (usado a dstrbução de Studet, por exemplo) ão são váldos. Através de smulações, Dckey e Fuller chegaram a valores lmtes que são váldos para quado se testa a hpótese de que ρ é gual a. Na verdade, o que se testa é um pouco dferete: subtra-se y t- do modelo acma: y t y t- = ρy t- y t- + ε t y t = (ρ ) y t- + ε t y t = δ y t- + ε t
300 Testar ρ gual a equvale a testar δ =. O teste é feto computado-se a estatístca t como se fosse um teste comum uma regressão qualquer, mas como os lmtes ão são dados pela dstrbução de Studet, a estatístca é deomada τ e o teste é cohecdo como teste de Dckey e Fuller (DF), cujos valores lmtes são dados ao fal do lvro. Usualmete são testadas também as segutes formas: y t = α + δ y t- + ε t (com tercepto) y t = α + βt + δ y t- + ε t (com tercepto e tedêca determístca 43 ) Cada um deles com valores crítcos própros 98 Exemplo.4. Teste a preseça de raz utára a varável percetual de resdêcas ateddas por esgoto a Meltáva Os valores são repetdos a tabela abaxo: ao y t y t- y t 97,5 97,5,5, ,3,5, ,9 4,3 3, ,6 7,9, ,4 3,6, , 3,4, ,9 35,, ,6 36,9,7 98 4,4 39,6, , 4,4, ,9 43,, ,6 45,9, ,3 48,6, ,9 5,3 3, ,7 54,9, ,6 56,7, ,3 57,6,7 43 Vale uma lembraça: um modelo do tpo y t = α + βt + ε t, sto é, com tedêca determístca, ão é um modelo estacoáro da maera como defmos aterormete, já que a méda ão é costate. Mas, se subtrarmos a tedêca, teremos y t βt, que será uma varável estacoára. Dz-se que y t é estacoára em toro da tedêca.
301 ,9 6,3 3, ,8 63,9, ,5 64,8, ,4 67,5, ,3 68,4, , 69,3, , 7,, ,9 7,, ,7 7,9, ,4 74,7, ,3 77,4,9 79, 78,3,9 y t =,34 y t- τ = 7,4 (,44) y t = 3,35,95 y t- τ µ =, (,88) y t = 3,3,34t,8 y t- τ τ =, (,886) Os valores crítcos da tabela são, para = 5 (o valor mas próxmo, já que utlzamos uma regressão com 9 observações) e % de sgfcâca são:,6 (sem tercepto),,6 (com tercepto) e 3,4 (com tercepto e tedêca). Portato, acetamos a hpótese ula de que δ = e, portato, ρ =, assm sedo, cocluímos que a varável apreseta raz utára e, sedo assm, ão é estacoára. O teste de Dckey e Fuller assm formulado testa apeas a raz utára um processo do tpo AR(). Para um processo AR(p) deve-se utlzar o teste de Dckey e Fuller Aumetado (ADF). Isto é feto fazedo as segutes regressões: p y t = δ y t- + ω y t- + + ε t (sem tercepto) = y t = α + δ y t- + p = y t = α + βt + δ y t- + ω + ε t (com tercepto) y t- + p = ω y t- + + ε t (com tercepto e tedêca) Uma varável pode apresetar mas de uma raz utára, que é o caso que já dscutmos, de varáves que, para se torarem estacoáras, precsam de duas ou mas dfereças. Uma varável I() (estacoára a seguda dfereça), por exemplo, apreseta duas raízes utáras..5 Co-tegração Como vmos aterormete, uma regressão etre suas varáves ão estacoáras pode ser espúra, e os testes usuas ão têm valdade. Portato, se a regressão: Y t = α + βx t + ε t
302 3 Se X e Y apresetam raz utára, há uma boa chace de que a regressão seja espúra. Etretato, se X e Y são tegradas de mesma ordem (são ambas I(), por exemplo), é possível que elas camhem jutas, e assm sedo, o resultado da regressão etre as varáves (bem como os testes) passam a fazer setdo. Quado duas séres são tegradas de mesma ordem e camham jutas, elas são dtas cotegradas. Como testar se duas varáves são co-tegradas? Image os resíduos da regressão de Y por X: se elas ão camham jutas, o resíduo desta regressão tederá a aumetar, em valor absoluto. O resíduo de uma regressão espúra ão é estacoáro (o que é cosstete com o fato de que os resíduos apresetam autocorrelação postva), portato, a maera mas smples 44 de verfcar se duas séres são co-tegradas é testar a exstêca de uma raz utára os resíduos. 44 Para testes mas complexos de co-tegração ou mesmo de raízes utáras, procure textos mas avaçados sobre o tema, como Hamlto, J. Tme Seres Alyss. Prceto Uversty Press, 994 ou Eders, W. Appled Ecoometrc Tme Seres. Nova York: Joh Wley & Sos, 995.
303 Exercícos. Dê a forma aalítca dos segutes processos: a) ARMA(3,) b) ARIMA(,,) c) IMA(,4) d) ARI (,) 3. Teste a exstêca de uma raz utára a varável exportações de trgo do Kazmestão apresetada o exemplo.. 3. Faça a detfcação da varável apresetada o exemplo Com base o exercíco 3, é possível ecotrar algum outro modelo, que ão um MA(), para Z t? Se sm, estme o modelo. 5. Faça o dagóstco do modelo MA() e do modelo estmado (se houver) o exercíco 4 para a varável Z t. Se ambos forem adequados, escolha o melhor modelo usado um dos crtéros de formação vstos o capítulo Usado o teste de Dckey-Fuller para os resíduos, verfque as duas varáves do exemplo.. são co-tegradas. 7. Dado o modelo: Y t = +,7Y t- + ε t a) determe a méda do processo, sto é E(Y t ). b) se Y t = 7, qual o valor prevsto para Y t+? (Isto é, E(Y t+ Y t )?) c) determe a varâca do processo. 8. Dado o modelo: Y t = 6 + ε t +, ε t- a) determe a méda do processo, sto é E(Y t ). b) se Y t = 3,5, qual o valor prevsto para Y t+? (Isto é, E(Y t+ Y t )?) c) determe a varâca do processo. 9. Assale verdadero ou falso: a) Se z t = w z t- + w z t- + w 3 z t-3 + ε t, se w + w + w 3 =, etão z t ão é estacoáro. b) No modelo de regressão Y t = α + βx t + ε t, se Y t e X t apresetam raz utára, etão a regressão é espúra. c) Na regressão Y t = α + βy t- + ε t, é possível testar a hpótese de que β = através da dstrbução t, de Studet.. Cosderado os operadores defasagem (L) e dfereça ( ), mostre que: a) = L + L b) = + L + L + L 3 + L L
304 3
305 33 CAPÍTULO NÚMEROS ÍNDICE. Costrudo úmeros ídce Supoha que esteja se fazedo um estudo das exportações da Xeodáva, meddas em moeda local, o xeodávo. As exportações da Xeodáva a década dos 9 são dadas a tabela abaxo: tabela.. ao valor das exportações em X$ O objetvo da apresetação desta tabele é, evdetemete, mostrar a evolução das exportações daquele país ao logo da década, já que o letor provavelmete ão terá oção do que sgfcam um mlhão de xeodávos. Sedo assm, a apresetação dos valores em s ão é tão mportate. Daí a utldade do úmero ídce: é uma seqüêca que apreseta a mesma evolução da seqüêca orgal (sto é, os úmeros matêm a mesma proporção etre s) mas, como o valor propramete dto ão é mportate, seus úmeros são mas amgáves e, supostamete, de letura mas fácl. Para a costrução do úmero ídce, escolhemos, arbtraramete, um valor qualquer da tabela. Dgamos, o valor correspodete ao ao de 995 (porque a partr daí as exportações passam a crescer muto os aos segutes, mas podera ser por outro motvo qualquer ou mesmo ehuma razão em partcular). Atrbuímos a este ao o valor, o que, dga-se de passagem, é bem mas amgável do que Partmos do valor de 995 (que será etão o ao base) para ecotrarmos os valores dos demas aos, o que pode ser feto através de uma regra de três smples. Por exemplo, para o ao de 99, temos: x Portato, o valor correspodete ao ao de 99 será:.34.3 x = = 38, E, desta forma, podemos estabelecer uma regra prátca para calcular os valores do úmero ídce para os demas aos: multplcar por e dvdr pelo valor da base. Assm:
306 99: : : : : : : : : = 73,4 = 7,64 = 3,3 = = 4, = 65, =,84 = 83,4 = 55,4 34 Repare que a cota referete ao ao de 995 é desecessára já que o valor de 995 fo defdo a pror como sedo. Etão o úmero ídce referete aos valores das exportações do exótco país sera como mostrado a tabela abaxo: tabela.. ao ídce de valor das exportações (base: 995 =) 99 38, , , ,3 995, 996 4, , 998, ,4 55,4 Repare que é fudametal que apareça a tabela qual fo o ao 45 que fo tomado como base, até porque ão ecessaramete ele aparecerá a tabela apresetada (poderíamos, por exemplo, apresetar os valores a partr de 997 usado a mesma base). Com base a tabela com o úmero ídce, podemos faclmete costatar que, etre os aos de 995 e 997 houve um crescmeto de 65% o valor das exportações; ou que, em 99, o valor das exportações era cerca de 7% meor do que Óbvo que é ao este caso específco, podera ser qualquer data, ou mesmo outra varável qualquer..
307 Exemplo.. (mudaça de base) A partr da tabela.., costrua um ovo úmero ídce de tal modo que o ao base seja 99. Supõe-se, etão, que a tabela orgal ão é cohecda, já que partremos da tabela com o úmero ídce cuja base é 995. Trata-se etão, smplesmete, de costrur um úmero ídce da mesma forma que fzemos aterormete, a úca dfereça é que partremos de uma seqüêca de dados que já estão a forma de úmero ídce. Para cada ao, etão, multplcaremos por e dvdremos pelo valor do ao base, que agora é 38,43 (99) : 73,4 = 9,4 38,43 993: 7,64 = 8,6 38,43 994: 3,3 = 68,33 38,43 995: = 6,9 38,43 996: 4, = 37, 38,43 997: 65, = 49,3 38,43 998:,84 = 5,57 38,43 999: 83,4 = 476,5 38,43 : 55,4 = 44,33 38,43 Repare que chegaríamos aos mesmos valores se costruíssemos o ídce a partr dos dados orgas.. Ídces de preços Uma varável que é uma caddata atural a ser represetada por um úmero ídce é o preço, em partcular quado estamos os referdo a ível geral de preços, em vez do preço de um bem específco. Quado se dz que a taxa de flação fo de %, o que é algo perfetamete compreesível para a maora das pessoas, o que se quer dzer exatamete? Que o ível geral de preços subu de... de reas para... reas? Bom, sto ão é muto compreesível. Mas, a verdade, é algo parecdo. A tal da taxa de flação aumetar %, ou, o que talvez seja mas precso, o ível de preços aumetou % sgfca que o preço de uma cesta de bes, que represetara o cosumo da socedade, aumetou em %.
308 Como medr esta varação? Bom, como os preços ão varam todos a mesma proporção ao mesmo tempo, esta resposta ão é óbva. Há, como veremos as seções segutes, mas de uma resposta possível... Ídce agregatvo smples A déa deste ídce é smplesmete comparar os preços etre um período e outro. 36 IAS = = = p p Ode o subscrto represeta o bem e o sobrescrto represeta o período. Assm, p represeta o preço do bem o período zero. Exemplo... Supoha que exstam apeas 3 bes: arroz, fejão e televsão, cujos preços o ao de 999 e são mostrados a tabela abaxo. Determe a varação de preços pelo IAS. bem preços 999 (R$) preços (R$) arroz (kg),, fejão (kg),5, televsão 4, 44, IAS = = = p p +, + 44 = = +, ,,39 4,5 Portato, a varação do ível de preços medda pelo IAS 46 é,39%. Fca fácl perceber que esta ão é uma boa forma de medr a varação de preços pos, como é possível que o arroz dobre de preço, o fejão mas que dobre, e a varação total seja apeas cerca de %, ão por cocdêca, muto próxma da varação do preço da televsão? É que, calculado desta forma, o bem que tem preço maor terá, ada que volutaramete, maor peso a medção, já que uma varação de 7 cetavos o preço do fejão acaba sedo comparada com um preço de 4 reas, da televsão.... Ídce de Sauerbeck O ídce de Sauerbeck apreseta uma mudaça mportate em relação ao IAS. É calculado da segute forma: S = = p p 46 Pode ser obtda faclmete através de (IAS-) %. Ou ada, podemos mater a represetação que estávamos utlzado para os úmeros ídces de um modo geral: se cosderarmos 999 como ao base (valor do ídce gual a ), teremos que o ídce em será,39.
309 Ou seja, é uma méda artmétca smples da razão 47 etre os preços dos bes os dos períodos. Exemplo... Supoha que exstam apeas 3 bes: arroz, fejão e cavar, cujos preços o ao de 999 e são mostrados a tabela abaxo. Determe a varação de preços pelo ídce de Sauerbeck. bem preços 999 (R$) preços (R$) arroz (kg),, fejão (kg),9, cavar (kg), 4, 37 4 S = ( + + ),374 3, 9 Portato, a varação de preços medda pelo ídce de Sauerbeck é de 37,4%. Claramete este resultado também ão é dos mas adequados. O arroz fcou estável, o fejão aumetou %, e estes dos bes (detre os três exstetes) devem ter um peso muto maor o gasto dos cosumdores do que o cavar, que puxou o ídce para cma, certamete bem mas do que devera. É ecessáro levar-se em cota o quato cada bem é cosumdo. Não dá para fazer uma medda que represete a varação dos preços sem que cosderemos também as quatdades que são cosumdas...3. Ídces de Laspeyres e Paasche Quado, ao compararmos preços em dos períodos, levamos em cota as quatdades cosumdas, um problema que temos que ter em mete é o de que as quatdades também podem mudar de um período para outro. Fca a questão de quas devem ser as quatdades escolhdas, o que é respoddo o exemplo segute: Exemplo..3. Numa socedade ode há apeas 3 bes (deomados A, B e C), temos os preços e as quatdades cosumdas em dos aos mostradas a tabela abaxo. Determe a varação de preços o período. 999 preços quatdades preços quatdades bem A $ $ 5 bem B $3 5 $4 bem C $4 $3 Num prmero mometo, poderíamos magar que a poderação dos preços pelas quatdades se dara período a período. Isto é, os preços de seram poderados pelas quatdades daquele ao e o mesmo ocorrera com os preços de 999. Etretato, se o objetvo é a comparação dos preços, o uso de quatdades dferetes em dferetes períodos cotamara a comparação. É precso escolher o período do qual utlzaremos as quatdades 48. E esta escolha é arbtrára: ão há, em prcípo, ehum motvo pelo qual possamos dzer que as quatdades de um período sejam mas adequadas do que outro. Podemos escolher o período 47 Razão esta que é cohecda como relatvo de preços, ou, mas comumete, preço relatvo. 48 Ou, o que também é possível como veremos adate, tomarmos a méda das quatdades.
310 cal, este caso 999. Etão cada preço será multplcado pela respectva quatdade cosumda em L = =, E a varação de preços, calculada desta forma, é de 5,79%. A letra L colocada o cálculo acma se deve ao fato de que, quado utlzamos as quatdades cas, o ídce é chamado ídce de Laspeyres. Se escolhermos as quatdades do período fal, o que é feto a segur, etão chamamos de ídce de Paasche. P = =,56 89 Portato, pelo ídce de Paasche, a varação fo de 5,6%. O resultado fo um tato assustador à prmera vsta, já que a dfereça fo substacal. Etretato, é precso lembrar que, em geral, ídces de preços são calculados para períodos mas curtos (um mês, por exemplo), em que as mudaças as quatdades ão são tão grades. E, mesmo em períodos logos, é pouco provável que observemos uma mudaça tão radcal o cosum de todos os bes de uma ecooma como os três bes do exemplo acma. Idepedete dessas questões, o fato é que, qualquer dos crtéros é váldo. Temos, etão, duas formas de calcular ídce de preços, os ídces de Laspeyres e Paasche: L = P = = = = = p q p p q p q q Exemplo..3. Dada a tabela abaxo, determe a varação de preços pelos ídces de Laspeyres e Paasche. 999 preços quatdades preços quatdades bem A $ $4 8 bem B $6 $6 9 bem C $4 8 $3 L = P = =,3 5 5 =,96 58 Ecotramos um aumeto de,3% o ível de preços por Laspeyres e uma queda de 3,8% por Paasche.
311 39 Note que, de ovo, ecotramos um valor maor para Laspeyres do que para Paasche, sto é, L> P os dos exemplos. Isto vale sempre? Vejamos o exemplo abaxo: Exemplo..3.3 Dada a tabela abaxo, determe a varação de preços pelos ídces de Laspeyres e Paasche. 999 preços quatdades preços quatdades bem A $ $ 4 bem B $ $3 bem C $3 $ 9 L = P = =, =,65 65 Desta vez, houve aumeto de 6,67% calculado por Laspeyres e 6,5% por Paasche. Isto é, agora estamos um caso em que P>L. Respodda a perguta (em sempre L>P), resta saber o que há de dferete este exemplo dos dos aterores. É medato que, este últmo, queda os preços foram acompahadas de queda as quatdades e aumetos os preços de aumeto as quatdades. Fo o cotráro os exemplos aterores. Neste últmo exemplo, preços e quatdades se moveram a mesma dreção, equato os dos prmeros, o movmeto se deu em dreções opostas. Do capítulo, sabemos que o caso do últmo exemplo é o de um coefcete de correlação postvo etre preços e quatdades, equato os dos prmeros temos um coefcete de correlação egatvo 49 etre estas duas varáves. Portato: ρ pq < L > P ρ pq > P > L = P. Vale dzer que, um caso pouco provável, se o coefcete de correlação for ulo, teremos L Os ídces de Laspeyres e Paasche podem ser calculados de uma forma alteratva, que pode ser ecotrada através de trasformações algébrcas da fórmula orgal. Vejamos como sso é feto para o ídce de Laspeyres: L = = = p q p q 49 Este caso pode parecer a prmera vsta o mas comum. De fato o é, de modo que mutas vezes se dz que o ídce de Laspeyres é, em geral, maor que o de Paasche. Etretato, pela teora ecoômca, as duas stuações são possíves, depededo da orgem da varação de preços; se resulta de uma varação da curva de oferta, a correlação é egatva, e é postva se é orgára de um deslocameto da curva de demada.
312 3 Desmembrado, vem: L = = q p q p... q p q p Ou ada: L = = q p q p + = q p q p = q p q p Se multplcarmos e dvdrmos cada termo da equação acma por p, teremos: L = p p = q p q p + p p = q p q p p p = q p q p Desta forma, a exemplo do que ocorra com o ídce de Sauerbeck, calculamos uma méda dos preços relatvos de cada bem, só que desta vez é uma méda poderada 5, cujos pesos são dados por: w = = q p q p E estes pesos têm um sgfcado muto claro, pos a expressão q p (preço vezes a quatdade do bem o período zero) sgfca o gasto o bem o período zero, equato que a expressão = q p sgfca o gasto total (em todos os bes) o mesmo período. Portato, w sgfca a partcpação relatva (percetual) o gasto do bem, o período zero, sto é, cada um dos bes será poderado pela sua partcpação o orçameto das famílas o período zero. Assm, teremos: L = p p w + p p w p p w Ou, resumdamete: L = w p p = Portato, o ídce de Laspeyres pode ser terpretado como uma méda artmétca (poderada) dos preços relatvos, ode os pesos são o percetual que cada bem represeta o orçameto, cosderado-se o período cal (zero). Falamos aterormete em forma alteratva de se calcular o ídce. Na verdade, é esta a forma mas comum, já que uma pesqusa de quatdades é muto mas trabalhosa do que uma 5 Ressalte-se que é uma méda artmétca poderada.
313 3 pesqusa de preços (é muto mas fácl r ao supermercado ou à fera e verfcar qual o preço de determado bem do que saber quato as pessoas compram deste bem). Normalmete, os sttutos que calculam ídces de preços fazem pesqusas sobre as quatdades (a verdade, sobre os orçametos) apeas uma vez em cada certo úmero de aos e aí são estabelecdos os pesos que serão utlzados para as pesqusas de preços. Trasformação semelhate pode ser feta com o ídce de Paasche: P = = = q p q p Que pode ser escrto assm: P = = = q p q p Desmembrado, temos: P = = = = q p q p... q p q p q p q p Multplcado e dvddo cada termo do deomador por p: P = = = = q p q p p p... q p q p p p q p q p p p E temos de ovo os relatvos de preços, só que vertdos e o deomador, multplcados por um peso que agora é defdo por: w = = q p q p Que é a partcpação relatva o gasto o bem, o período um. Assm, o ídce de Paasche pode ser escrto:
314 P = p p w p + p w p p w 3 Que é uma méda harmôca 5 (e poderada) dos preços relatvos, e pode ser escrta resumdamete como se segue: P = = p w p Há que se fazer duas observações mportates: a prmera é que o peso utlzado o cálculo do ídce de Paasche é obtdo através das quatdades cosumdas fas (atuas). Portato, é ecessáro pesqusar quatdades com a mesma perodcdade que se pesqusam preços o que tora a pesqusa muto trabalhosa e muto cara. Não é surpreedete, portato, que os sttutos que pesqusam preços sstematcamete prefram o ídce de Laspeyres. A outra é que o fato do ídce de Laspeyres ser uma méda artmétca dos preços relatvos, equato Paasche é uma méda harmôca duz à oção (errada, como já vmos) que o prmero é sempre maor, sto porque a méda artmétca é sempre maor ou, o mímmo, gual à méda harmôca, desde que, obvamete, os pesos sejam os mesmos, o que ão é o caso. Exemplo..3.3 Calcule a varação do ível de preços pelos ídces de Laspeyres e de Paasche. 999 preços % do gasto preços % do gasto bem A $ 5% $ 4% bem B $5 35% $8 % bem C $ 4% $3 4% Agora temos como dados ão as quatdades, mas as partcpações relatvas o gasto em cada período. Devemos calcular os dos ídces como médas (artmétca e harmôca, respectvamete) dos preços relatvos. 8 3 L =,5 +,35 +,4 =,59 5 P = =,98 5,4 +, +,4 8 3 Portato, verfcou-se um aumeto de 5,9% o ível de preços pelo ídce de Laspeyres e de 9,8% pelo ídce de Paasche...4. Crtéros e ídce de Fsher 5 Sobre méda harmôca, veja o capítulo.
315 Como vmos, há dferetes maeras de calcular ídces de preços. Como dzer se um tpo de ídce de preços é bom ou rum? Uma tetatva de respoder a esta questão fo estabelecmeto de crtéros por Fsher 5. São eles 53 : I) Crtéro de Idetdade: se o período para o qual ídce é calculado é o mesmo do período base, etão o valor do ídce tem que ser gual a. Isto é: I = Este crtéro é ateddo por Laspeyres e Paasche. Se ão, vejamos: 33 L = P = = = p p q q = Já que os dos períodos cocdem. II) Crtéro da homogeedade: o valor do ídce ão deve ser alterado por alterações as udades de medda. É fácl ver que tato Laspeyres como Paasche atedem a este crtéro, já que, se trocarmos os pesos de qulogramas para lbras 54, ou os preços de reas para UFIR, esta alteração se dará tato o umerador como o deomador, dexado alterado o resultado fal. III) Crtéro da Proporcoaldade: se os preços relatvos são todos guas a um certo valor, o ídce também o será. Basta lembrarmos que Laspeyres e Paasche podem ser escrtos como médas de preços relatvos, e méda de valores guas tem que ser o mesmo valor, caso cotráro ão sera méda. IV) Crtéro da determação: o ídce ão pode ser ulo, fto ou determado se um úco preço ou quatdade for ulo. Sera ulo se o umerador fosse zero, fto se o deomador se aulasse e determado o caso de ambos.efm... sto ão ocorrera em em Laspeyres, em em Paasche já que tato o umerador como o deomador são somatóros e, portato, uma úca parcela sedo zero ão torara a soma total zero. V) Crtéro da reversbldade: se calcularmos o ídce de março em relação a feverero, por exemplo, e ecotramos um aumeto os preços, quado calculamos o ídce de feverero em relação a março (vertedo a ordem), deveríamos ecotrar uma queda que cacelara o aumeto ecotrado aterormete. Isto é: I I = Isto ão vale para Laspeyres e Paasche. Vejamos: 5 Irvg Fsher, ecoomsta amercao ( ). 53 Usaremos agora a segute otação: I é o ídce do período em relação ao período zero. 54 Neste caso teríamos que alterar os preços também, já que eles são dados em R$/kg ou R$/lbra, o que matera o total do gasto o bem também alterado.
316 34 L L = = = q p q p = = q p q p P P = = = q p q p = = q p q p VI) Crtéro da crculardade: se, dgamos, calculamos o ídce de feverero em relação a jaero, e o de março em relação a feverero, o acumulado dos dos devera ser gual ao cálculo feto dretamete etre março e jaero. Ou seja: I I =I De ovo, este crtéro ão vale para Laspeyres e Paasche, como é verfcado abaxo: L L = = = q p q p = = q p q p = = q p q p = L P P = = = q p q p = = q p q p = = q p q p = P O fato de Laspeyres e Paasche ão atederem aos dos últmos crtéros pode trazer um certo cômodo. Por sso, Fsher propôs um ovo ídce, chamado, de uma maera talvez um pouco pretesosa, de ídce deal de Fsher, que ada mas é do que a méda geométrca dos ídces de Laspeyres e Paasche. F = P L É fácl verfcar que o ídce de Fsher atede o crtéro da reversbldade, mas também ão atede o da crculardade 55. Exemplo..4. Do exemplo..3., determe a varação de preços pelo ídce de Fsher. 999 preços quatdades preços quatdades bem A $ $ 5 bem B $3 5 $4 bem C $4 $3 Como já calculamos o ídce de Laspeyres e o de Paasche, o cálculo do ídce de Fsher é medato. 55 O que, por s só, tora bastate dscutível o termo deal.
317 35 F = L P =,579, 56 =,59 Portato, pelo ídce de Fsher, medmos um aumeto de,59%. É claro que, depedete de qual seja o maor etre Laspeyres e Paasche, Fsher será sempre um valor termedáro etre os dos, já que é uma méda geométrca de ambos. Quato à utldade prátca do ídce de Fsher, ele tem, o mímo, os mesmos coveetes do ídce de Paasche, já que as quatdades 56 têm que ser atualzadas como os preços. No mímo porque as quatdades cas também têm que ser cohecdas...5 Ídce de Marshall-Edgeworth Na dúvda etre escolher as quatdades cas (Laspeyres) ou as atuas (Paasche), é possível fcar em cma do muro, escolhedo a méda das duas. Quado fazemos sto, calculamos o ídce de Marshall-Edgeworth. O ídce de Marshall-Edgeworth é, portato, calculado da segute forma: ME = = = p p (q (q + q ) + q ) Que, smplfcado, fca: ME = = = p (q + q ) p (q + q ) Do poto de vsta prátco, etretato, o ídce de Marshall-Edgeworth apreseta os mesmos coveetes do ídce de Fsher, pos ecesstamos das quatdades dos dos períodos para calcular o ídce..3 Ídces de quatdades e de valor Da mesma forma que calculamos ídces de preços, o que vale dzer, comparamos preços de períodos dferetes, é possível também comparar quatdades. E, aalogamete, se usamos as quatdades para poderar os preços, usaremos os preços para poderar as quatdades. Desta forma, teremos, por exemplo, ídce de Laspeyres de quatdades e ídce de Paasche de quatdades: L q = = = 56 Ou, evdetemete, a proporção o gasto. p p q q
318 36 P q = = = q p q p Repare que, em ambos os casos acma (e ao cotráro do que ocorre com os ídces de preços), os preços estão fxos e as quatdades é que varam. E se ambos varam? Neste caso, ão estamos em comparado preços em quatdades, mas gasto, ou, mas geercamete, valor. De fato, quado fazemos sto calculamos o chamado ídce de valor: V = = = q p q p Uma propredade teressate para os ídces (que podera ser um sétmo crtéro) é a de que o ídce de preços multplcado pelo ídce de quatdades seja gual ao ídce de valor. Esta propredade ão é atedda pelos ídces de Laspeyres e Paasche como é verfcado abaxo: L p L q = = = q p q p = = q p q p = = q p q p = V P p P q = = = q p q p = = q p q p = = q p q p = V Mas é fácl verfcar que o ídce de Fsher tem esta propredade 57. Exemplo.3. Do exemplo..3., determe a ídce de quatdades de Laspeyres e Paasche e o ídce de valor. 999 preços quatdades preços quatdades bem A $ $ 5 bem B $3 5 $4 bem C $4 $3 L q = =,9368 P q = =, Um argumeto a mas para o deal. Sufcete?
319 37 V = =,9895 Todos os ídces apresetaram queda: o ídce de quatdades apresetou queda de 6,3% medda por Laspeyres e 4,55% medda por Paasche. Já o ídce de valor apresetou queda de,5%..4 Valores omas e reas deflacoameto de séres Tomemos a tabela abaxo que mostra os saláros de uma categora profssoal em um período flacoáro. tabela.4. Mês saláros a preços corretes ídce de preços (base: ja/yy = ) ja/xx R$. 3 fev/xx R$. 3 mar/xx R$. 34 abr/xx R$.3 36 ma/xx R$.4 4 ju/xx R$.5 4 jul/xx R$.6 43 Repare que esta categora teve um aumeto (algus preferem falar reajuste) em feverero de %. O valor, em moeda, fo % maor. Isto sgfca que o trabalhador pertecete a esta categora pode comprar % a mas em bem e servços? A resposta é claramete ão, bastado para sso uma rápda olhadela a colua referete ao ídce de preços. Quado olhamos esta colua, verfcamos que os preços aumetaram de jaero para feverero. De fato, é possível clusve quatfcar este aumeto o ível de preços: 3 =,667 3 Ou seja, houve um aumeto de preços (flação) de 6,67%. O aumeto dos saláros é superor a esta taxa, o que vale dzer que houve sm, um aumeto do poder aqustvo, mas ão de %. Alás, da matemátca facera 58 podemos faclmete ecotrar o quato fo este aumeto de poder aqustvo, que fo de 3,%. Este aumeto de poder aqustvo sgfca aumeto de saláro real, sto é, ão expresso smplesmete o valor moetáro, mas em termos de bes e servços que podem ser adqurdos. Ora, se o aumeto de % em moeda ão sgfca aumeto equvalete em bes e servços, sto sgfca que a moeda perdeu valor. Reas em feverero valem meos do que reas em jaero. Sera útl que ossa udade de medda tvesse um valor costate, de tal modo que fosse possível detfcar dretamete quado o poder aqustvo aumetou ou cau. Isto é possível se todos os valores da tabela estvessem o mesmo real, sto é, fosse estabelecdo o valor da moeda 58 Basta fazermos a cota,/,667 que ada mas é que o aumeto dos saláros (mas ) dvddo pela taxa de flação (mas ).
320 em um mês específco e etão todos os valores seram calculados com base esta moeda. Isto equvale a ecotrar uma sére de valores reas, ou seja, retrado-se os efetos da desvalorzação da moeda (flação), o que é cohecdo como deflacoameto de uma sére. Exemplo.4. Com base a tabela.4., costrua uma sére de saláros reas meddos em reas costates de abrl A questão é: qual sera o valor equvalete ao saláro de cada mês se os preços de abrl fossem váldos em todos os meses? Ou, melhor dzedo, qual o valor do saláro de cada mês a preços costates de abrl? Este cálculo pode ser feto a partr de uma smples regra de três. O valor de mao, por exemplo, a preços de mao (ídce = 4) é R$ 4. Etão, podemos ecotrar o valor de mao a preços de abrl (ídce = 36) por: 4 4 x 36 saláro real de mao (preços de abrl) = 4 36/4 = R$ 6 Portato ota-se que o saláro real em mao sofreu uma queda (dmução de poder aqustvo) de aproxmadamete 3%. Para os outros meses o cálculo é feto da mesma forma: multplca-se pelo ídce de abrl e dvde-se pelo ídce do mês em questão: saláro real de jaero (preços de abrl) = 36/3 = R$, saláro real de feverero (preços de abrl) = 36/3 = R$ 37,5 saláro real de março (preços de abrl) = 36/34 = R$ 7,59 saláro real de abrl (preços de abrl) = 3 36/36 = R$ 3 saláro real de juho (preços de abrl) = 5 36/4 = R$ 37,7 saláro real de julho (preços de abrl) = 6 36/43 = R$ 339,53 Poderíamos etão completar a tabela.4.: 38 Tabela.4. Mês saláros a preços corretes ídce de preços (base: ja/yy = ) saláros reas (preços costates de abrl/xx) ja/xx R$. 3 R$., fev/xx R$. 3 R$.37,5 mar/xx R$. 34 R$.7,59 abr/xx R$.3 36 R$.3, ma/xx R$.4 4 R$.6, ju/xx R$.5 4 R$.37,7 jul/xx R$.6 43 R$.339,53 Houve queda o poder aqustvo do saláro apeas em mao, os demas meses o saláro real aumetou.
321 Repare que, de jaero a feverero, a varação o saláro real fo de 3,%, como havíamos calculado aterormete. Outra cosa mportate é que o mês tomado como base para os valores reas ão tem que ser o mesmo mês base utlzado para o ídce. De fato, o mês base do ídce em sequer aparece a tabela (é jaero de um outro ao)..5 Tpos de ídces de preços Quado lemos sobre o assuto a mpresa, geralmete somos bombardeados com uma fdade de ídces que, freqüetemete, apresetam valores dferetes, mutas vezes de maera sgfcatva. Na verdade são dferetes porque medem cosas dferetes. Os ídces são calculados por dferetes sttutos (o Brasl, por exemplo, temos ídces calculados pelo IBGE, FIPE, Fudação Getúlo Vargas, etre outros), mas esta ão é a úca dfereça. Os ídces podem ser especfcamete de preços fas ao cosumdor. Recebem abrevações do tpo IPC (ídce de preços ao cosumdor) e ICV (ídce de custo de vda). Estes ídces ada varam segudo a faxa de reda da população que abragem (sto é, da faxa de reda das famílas de cujos orçametos são extraídos os pesos para o cálculo do ídce). Os ídces podem ser, etretato, de preços o atacado, ormalmete cohecdos como IPA ou podem se referr especfcamete a um setor específco da ecooma, como a costrução cvl, por exemplo. Há ada ídces geras de preços (usualmete abrevados IGP), que, como o própro ome dz são uma méda de ídces como o de preços ao cosumdor, atacado e costrução cvl. 39 Exercícos. São dados os valores das exportações de um país em moeda local: ao exportações (X$) a) Costrua um ídce tomado como base o ao de 997. b) Trasforme a base do ídce para É dada uma sére de úmeros ídce mês ídce (base: ja/96 = ) jaero/99 4 feverero/99 43 março/99 47 abrl/99 45 mao/99 478
322 3 juho/99 49 julho/ agosto/99 48 a) Calcule a varação percetual em cada mês. b) Trasforme a base do ídce para agosto de Calcule as varações de preços pelos ídces de Laspeyres, Paasche, Fsher e Marshall- Edgeworth. a) preços quatdades preços quatdades bem A $ $ 5 bem B $3 5 $4 bem C $4 $3 5 b) 999 preços quatdades preços quatdades bem $ $ 8 bem $3 $5 5 bem 3 $ 3 $3 5 bem 4 $5 5 $4 7 c) preços quatdades preços quatdades bem X $5 5 $7 8 bem Y $8 5 $6 bem Z $4 $ Calcule as varações de preços pelos ídces de Laspeyres e Paasche preços % do gasto preços % do gasto bem A $ 3% $4 % bem B $ 4% $8 6% bem C $ 3% $5 % 5. Calcule a partcpação percetual de cada bem o gasto total para o ao de preços quatdades bem $5 bem $ bem 3 $5 8 bem 4 $ 6 6. Utlzado os resultados do exercíco ateror, calcule o ídce de Laspeyres em 998, 999 e preços preços preços
323 3 bem $6 $8 $ bem $ $5 $6 bem 3 $4 $3 $ bem 4 $ $3 $5 7. Verfque se o ídce de Fsher atede aos crtéros de reversbldade e crculardade e se tem a propredade de que o ídce de preços multplcado pelo de quatdades é gual ao ídce de valor. 8. Verfque se o ídce de Marshall-Edgeworth atede aos crtéros de Fsher e se tem a propredade de que o ídce de preços multplcado pelo de quatdades é gual ao ídce de valor. 9. O ídce geométrco smples é uma méda geométrca (smples, ão poderada) dos preços relatvos. Verfque se este ídce atede aos crtéros de Fsher.. São dados os saláros omas de uma categora profssoal e o ídce de preços: mês saláro omal (R$) ídce de preços (base: jaero = ) jaero., feverero., março.3, 4 abrl.65, 7 mao.7, 9 juho., a) Determe a varação percetual dos saláros omas. b) Determe a varação percetual dos preços (taxa de flação). c) Determe a varação percetual dos saláros reas.. São dados os valores das mportações de um país em moeda correte local e o ídce de preços deste país: Ao mportações (X$) ídce de preços (base: 99 = ) a) Costrua um ídce para as mportações tomado como base o ao de 997. b) Calcule a taxa de flação (varação o ível de preços) em cada ao. c) Costrua uma sére com os valores reas das mportações (utlze os preços de 999).. São dados: ídce de valor =
324 ídce de quatdades de Laspeyres = 8 Determe a varação de preços medda pelo ídce de Paasche Um produto teve aumeto de %. Se sto represetou um aumeto de,5% o custo de vda, qual é o percetual do orçameto represetado por este produto a época do período base? 4. Assale verdadero ou falso: a) Se há flação, o saláro real sempre ca. b) O ídce de preços de Laspeyres compara o custo de aqusção de uma cesta de bes um certo período com o custo de aqusção desta mesma cesta o período base. c) O ídce de preços de Paasche compara o custo de aqusção de uma cesta de bes um certo período com o custo de aqusção desta mesma cesta o período base. d) O ídce de preços de Laspeyres é sempre maor ou gual do que o ídce de preços de Paasche. e) O ídce de Fsher é sempre maor do que os ídces de Laspeyres e de Paasche. f) A dfereça etre o ídce de preços de Laspeyres e o ídce de preços de Paasche é que, para o prmero, a poderação é fxa a época base e para o segudo é varável a época atual.
325 33
326 Estatístca e Itrodução à Ecoometra Alexadre Sartors Respostas dos exercícos Capítulo Probabldade Respostas a) 4/ b) 6/ c) 8/ d)3/ a) / b) / c) / d) 5/6 3 a) /8 b) c) /6 d) ão 4 a) /6 b) 5/96 c) 5/96 d) 7/96 e) 75/96 5 a) /k 6/k /k 56/k 6/k 5/k (k = ) b), 6,, 56, 6, 5, 6 a) /k b) /k c) 3/k d) 8/k (k = ) 9 a),575 b),35 c),5 d),599 e),5556 f),565 g) ão a) /3 b) 8/3 c) 7/3 d) 9/3 e) 5/6 f) 6/3.,375 a) /7 b) 5/7 c) 4/7 c) 3 a) b) 6/8 c) 5/8 d) 4. /37 5. V F F V F F F F F V F F V 6. 7,4% 7. 6/7 8 a) 35/833 b) 88/465 c) 98/465 d) 6/465 e) /465 f) 77/64974 g) 5/74 h) 9/64974 ) / a) / / 3/ 4/ 5/ 6/ b) 5/ c) 7/44 a) 3/8 b) /6 c) 5/6 d) / a),3747 b),674 c),933 d),5 a) 6% b) 9% c) 4% d),% e) 7% 3. /8 4. P(A) + P(B) + P(C) P(A B) P(A C) P(B C) + P(A B C) 5 a) 3,3% b) 83,69% c) 83,9% 6. 6/ ,8%
327 Estatístca e Itrodução à Ecoometra Capítulo Meddas de posção e dspersão Alexadre Sartors Respostas a),5 b),5 c) 3,33 a) 6 4,9 4,4 b) 4 3,4 3, c) 6, 5,8 4,54 3 b) 74,83 e 94,56 4 a) 6,4 9, 3,4 b) 9,34 37,4 6, 5.,99 6 (.5) a) 69,33 e 8,33 b),67 e,9 c) 6,33 d),589 (.6) a) 63,4 e 7,96 b) 47,4 e,3 c) 7,3 d),783 7 a) 5 b) 6 c) d) e) 6 f) 336 g) 49 h) 8 a) 3 b) 3 c) 97 d) 4 e) 8 f) 64 g) h) 6 ) j) 9.,6. bd bd ρ Capítulo 3 Dstrbução de probabldade Respostas a) 38,5,75,6 b) 8,4 3,4 5,5 c) 3,5,9,7 d),67,,49 e) 3,75 648,44 5,46 f),4 96,46 9,8 g),9,,6., ,4% 4.,38% 5. 39,73% 6. 65,7% 7. 6,5%
328 Estatístca e Itrodução à Ecoometra 8.,86% 9 a) 8,79% e 8,87% b) 4,68% e 4,53% a) 4 b) 8,75%. F V V V F V Alexadre Sartors 3 Capítulo 4 Dstrbuções cotíuas e teorema de Tchebchev Respostas. Não. a) /6 b) /8 c) /4 d) /8 e) 3 f) 3/6 g) /4 h) 3. a) 5 3,73 5 b) 8/3 8/9,948,88 4. f(x) = /(b a), a x b 5. a) / b) 5/8 c) d) 3/4 e) /4 f) / 6. a),9375 b),4 c),8 d),8 e), a) e - b) c) e -4 e - d) e -6 e) e -8 e - 8. a) 68,7% b) 95,45% c) 99,73% 9. a) 5,4% b) 74,86% c) 9,8% d) 37,7% e) 5,% f) 8,9% g) 8,96%. a) 8,69% b) 59,% c) 96,56% d) 3,64% e) 5,35% f) 8,9% g) 7,4%. a) 59,4% b) 36% c) 8,44%. y f(y ) 3. 3/y 4, y 4. /α /α 5. a) 75% b) 3,56% c) 44,44% 7. F V F V F V V Capítulo 5 Dstrbução de probabldade cojuta Respostas A) b) 3/8 / /4 /8 /4 /4 / c) ão d),5,9375,5,58
329 4 Estatístca e Itrodução à Ecoometra Alexadre Sartors e),5 /3 f),5 B) b) 3/8 5/8 /4 /8 /8 /3 /5 / c) ão d),5 /4,9375,9375,875, e) /3 f),4., ão 3. zero ão 4. zero ão 5. c) sm d),5,5 e),5,5 f) 6. b),5,5 c),5 d) ão e) /7 6/7 7 a) b), 8 a),45 b),5 c),75 d),64 e),474 f),384 g),8 h),64 9. a) 3/4 b) 3/8 c) d) /. a) 3x e y b) 3x e y c) sm d),936 e),64 f),78. a) α b) g(x) = αe -αx, (x>) h(y) = α ye -αy, (y > ) f x y = /y (y > ) f y x = αe -α(y x). a) / b) g(x) =,5x, ( < x < ) h(y) = y/, ( < y < ) f x y = /y, ( < y < ) f y x = /( x), ( < x < ) 4. f(x,y) = /(4π) exp [ x /8 (y +) /] 5. f(x,y) = 8/3 exp [ x 4/3y] 6. E[var(X Y)] =,5 var(x) =,75 E[var(X Y)] var(x) Capítulo 6 Estmação Respostas. a) 6,6 5,8 3,6 b),77,47,78 c) 57,4 969,48 374,5. vés(m ) = µ/4 vés(m ) = 3. var(m ) = 5σ /6 var(m ) = 5σ /49 4. EQM(M ) = (5σ +µ )/6 EQM(M ) = 5σ /49 5. M 6. M 7. vés(m 3 ) = µ/( ) vés(m 4 ) = µ/ 8. var(m 3 ) = σ /( ) var(m 4 ) = σ [/4 + /( )] 9. EQM(M 3 ) = (σ + 4µ )/( ) EQM(M 4 ) = σ [/4 + /( )] + µ /4. M 3
330 Estatístca e Itrodução à Ecoometra. M 3. apeas M 3 3. apeas M 3 4. e e /5 6. 4,6% 7. 95,45% 8.,565% 9. 5,6 3,8 e,698. μ = 8,6 σ = 5,44. â = b = 35. β =,35 3. F F V F F F V F F V V F V F V F Alexadre Sartors 5 Capítulo 7 Itervalo de cofaça e testes de hpóteses Respostas. a) [,74; 5,6] b) [3,55; 4,45] c) hpótese de ormaldade para o tem a. aceta 3. rejeta 4 a) [6,5%; 3,5%] b) rejeta c) aceta 6. aceta 7. rejeta 8. rejeta 9. aceta. rejeta. aceta. 98,7% 98,4% 99,99% 3. 5,86% 4. a) aceta b) aceta c) ormaldade 5. rejeta 6. rejeta
331 6 Estatístca e Itrodução à Ecoometra 7. F F F F F V F F V Alexadre Sartors Capítulo 8 Regressão lear Respostas a) Y =,5 +,7X c),988 d) α ão sg. β sg. a % F calculado = 53,9 a) Y = 4,3 +,98X α ão sg. β sg. a 5% R =,653 F calc. =, b) Y =,54 +,6 X α sg. a % β sg. a % R =,77 F calc. = 6,9 3 b),658 c) F calc. = 33,5 4 a) Y = 998,3,87X c),9797 d) F calc. = 386,4 5 α ão sg. β sg. a % a) Y =,59 +,88X (α ão sg. β sg. a %) Y =,79X (β sg. a %) b) Y = 7,43 +,84X (α ão sg. β sg. a 5%) Y =,8X (β sg. a %) 3 b),6693,64 c) F calculado = 9,7 4. modelo com 4 varáves: R ajustado =,733 CIS = 6,5473 CIA = 6,353 modelo com 6 varáves: R ajustado =,747 CIS = 6,5895 CIA = 6,58 Teste F =, Escolhe-se o modelo com 6 varáves pelo R ajustado e CIA; com 4, pelo CIS e pelo teste F. 5. a) R alto (próxmo de ) β postvo b) R baxo β egatvo c) R e β próxmos de. 9. F F V V F V F F Capítulo 9 Volado as hpóteses báscas Respostas 4 a) -,95 -,7478 -,69 5. Preço = 4, + 833, Dst 837, Dorm + 585, Área + 35,7 Reda Nehum coefcete fo sgfcate. correlação etre área e dormtóros =,994 correlação etre dstâca e reda =,998 6 a) β e β ão são sgfcates b) a regressão é válda 7. DW =,85 4. F F F V F F F F F V F F
332 Estatístca e Itrodução à Ecoometra Capítulo Séres de tempo Respostas Alexadre Sartors 7 a) y t = θ y t- + θ y t- + θ 3 y t-3 + ε t ϕ ε t- b) y t = θ y t- + θ y t- + ε t ϕ ε t- c) y t = ε t ϕ ε t- ϕ ε t- ϕ 3 ε t-3 ϕ 4 ε t-4 d) y t = θ y t- + ε t 7. a) 33,33 b),43 c),96var(ε t ) 8. a) 6 b) 5,5 c),4var(ε t ) 9. V F F Capítulo Números ídce Respostas. a) b) 67,6, 73,69 8,96 56,6 83,, 47,88 8, 6, 96,8 4,9. a) b) 85,4 4,88% 89,4 -,7% 88,77 5,39% 93,56 6,% 99,38,5%,87-5,% 96,67 3,44%, 3. a) + 3,7% 5,67%,%,9% b) +34,69% + 3,48% + 3,57% +3,75% c) % +5,5% +,7% +,65% 4.,9%,47%
333 8 5. Estatístca e Itrodução à Ecoometra,78% 33,4% 7,7% 8,8% 6. 3,6% 6,8% 4,%.,%,% -8,33% 8,8% 6,67%,3% 6,9%,43% 4,5% 3,3%,76% -7,8% 7,65% 5,79%,6%. 86, , 8,% 494 3,5 4,% ,8 9,36% 3. 5% 3.,5% 4. F F V F F V Alexadre Sartors
Matemática. Resolução das atividades complementares. M18 Noções de Estatística
Resolução das atvdades complemetares Matemátca M8 Noções de Estatístca p. 3 (UFRJ) Dos estados do país, um certo ao, produzem os mesmos tpos de grãos. Os grácos de setores lustram a relação etre a produção
MA12 - Unidade 4 Somatórios e Binômio de Newton Semana de 11/04 a 17/04
MA1 - Udade 4 Somatóros e Bômo de Newto Semaa de 11/04 a 17/04 Nesta udade troduzremos a otação de somatóro, mostrado como a sua mapulação pode sstematzar e facltar o cálculo de somas Dada a mportâca de
CAPÍTULO 2 - Estatística Descritiva
INF 6 Prof. Luz Alexadre Peterell CAPÍTULO - Estatístca Descrtva Podemos dvdr a Estatístca em duas áreas: estatístca dutva (ferêca estatístca) e estatístca descrtva. Estatístca Idutva: (Iferêca Estatístca)
IND 1115 Inferência Estatística Aula 9
Coteúdo IND 5 Iferêca Estatístca Aula 9 Outubro 2004 Môca Barros Dfereça etre Probabldade e Estatístca Amostra Aleatóra Objetvos da Estatístca Dstrbução Amostral Estmação Potual Estmação Bayesaa Clássca
INTRODUÇÃO ÀS PROBABILIDADES E ESTATÍSTICA
INTRODUÇÃO ÀS PROBABILIDADES E ESTATÍSTICA 003 Iformações: relembra-se os aluos teressados que a realzação de acções presecas só é possível medate solctação vossa, por escrto, à assstete da cadera. A realzação
MAE116 Noções de Estatística
Grupo C - º semestre de 004 Exercíco 0 (3,5 potos) Uma pesqusa com usuáros de trasporte coletvo a cdade de São Paulo dagou sobre os dferetes tpos usados as suas locomoções dáras. Detre ôbus, metrô e trem,
CAPÍTULO 9 - Regressão linear e correlação
INF 6 Prof. Luz Alexadre Peterell CAPÍTULO 9 - Regressão lear e correlação Veremos esse capítulo os segutes assutos essa ordem: Correlação amostral Regressão Lear Smples Regressão Lear Múltpla Correlação
Perguntas Freqüentes - Bandeiras
Pergutas Freqüetes - Baderas Como devo proceder para prestar as formações de quatdade e valor das trasações com cartões de pagameto, os casos em que o portador opte por lqudar a obrgação de forma parcelada
Capítulo 1: Erros em cálculo numérico
Capítulo : Erros em cálculo umérco. Itrodução Um método umérco é um método ão aalítco, que tem como objectvo determar um ou mas valores umércos, que são soluções de um certo problema. Ao cotráro das metodologas
1 SISTEMA FRANCÊS DE AMORTIZAÇÃO
scpla de Matemátca Facera 212/1 Curso de Admstração em Gestão Públca Professora Ms. Valéra Espídola Lessa EMPRÉSTIMOS Um empréstmo ou facameto pode ser feto a curto, médo ou logo prazo. zemos que um empréstmo
MEDIDAS DE POSIÇÃO: X = soma dos valores observados. Onde: i 72 X = 12
MEDIDAS DE POSIÇÃO: São meddas que possbltam represetar resumdamete um cojuto de dados relatvos à observação de um determado feômeo, pos oretam quato à posção da dstrbução o exo dos, permtdo a comparação
Análise de Regressão
Aálse de Regressão Prof. Paulo Rcardo B. Gumarães. Itrodução Os modelos de regressão são largamete utlzados em dversas áreas do cohecmeto, tas como: computação, admstração, egeharas, bologa, agrooma, saúde,
Olá, amigos concursandos de todo o Brasil!
Matemátca Facera ICMS-RJ/008, com gabarto cometado Prof. Wager Carvalho Olá, amgos cocursados de todo o Brasl! Veremos, hoje, a prova do ICMS-RJ/008, com o gabarto cometado. - O artgo º da Le.948 de 8
Média. Mediana. Ponto Médio. Moda. Itabira MEDIDAS DE CENTRO. Prof. Msc. Emerson José de Paiva 1 BAC011 - ESTATÍSTICA. BAC Estatística
BAC 0 - Estatístca Uversdade Federal de Itajubá - Campus Itabra BAC0 - ESTATÍSTICA ESTATÍSTICA DESCRITIVA MEDIDAS DE CENTRO Méda Medda de cetro ecotrada pela somatóra de todos os valores de um cojuto,
Tabela 1 Números de acidentes /mês no Cruzamento X em CG/07. N de acidentes / mês fi f
Lsta de exercícos Gabarto e chave de respostas Estatístca Prof.: Nelse 1) Calcule 1, e para o segute cojuto de valores. A,1,8,0,11,,7,8,6,,9, 1 O úmero que correspode a 5% do rol é o valor. O úmero que
Estudo das relações entre peso e altura de estudantes de estatística através da análise de regressão simples.
Estudo das relações etre peso e altura de estudates de estatístca através da aálse de regressão smples. Waessa Luaa de Brto COSTA 1, Adraa de Souza COSTA 1. Tago Almeda de OLIVEIRA 1 1 Departameto de Estatístca,
CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE PPGEP Medidas de Tendência Central Média Aritmética para Dados Agrupados
3.1. Meddas de Tedêca Cetral CAPÍTULO 3 MEDIDA DE TENDÊNCIA CENTRAL E VARIABILIDADE UFRG 1 Há váras meddas de tedêca cetral. Etre elas ctamos a méda artmétca, a medaa, a méda harmôca, etc. Cada uma dessas
x n = n ESTATÍSTICA STICA DESCRITIVA Conjunto de dados: Organização; Amostra ou Resumo; Apresentação. População
ESTATÍSTICA STICA DESCRITIVA Prof. Lorí Val, Dr. [email protected] http://.ufrgs.br/~val/ Orgazação; Resumo; Apresetação. Cojuto de dados: Amostra ou População Um cojuto de dados é resumdo de acordo com
M = C( 1 + i.n ) J = C.i.n. J = C((1+i) n -1) MATEMÁTICA FINANCEIRA. M = C(1 + i) n BANCO DO BRASIL. Prof Pacher
MATEMÁTICA 1 JUROS SIMPLES J = C.. M C J J = M - C M = C( 1 +. ) Teste exemplo. ados com valores para facltar a memorzação. Aplcado-se R$ 100,00 a juros smples, à taxa omal de 10% ao ao, o motate em reas
SUMÁRIO GOVERNO DO ESTADO DO CEARÁ. Cid Ferreira Gomes Governador. 1. Introdução... 2. Domingos Gomes de Aguiar Filho Vice Governador
INSTITUTO DE PESQUISA E ESTRATÉGIA ECONÔMICA DO CEARÁ - IPECE GOVERNO DO ESTADO DO CEARÁ Cd Ferrera Gomes Goverador Domgos Gomes de Aguar Flho Vce Goverador SECRETARIA DO PLANEJAMENTO E GES- TÃO (SEPLAG)
É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.
É o grau de assocação etre duas ou mas varáves. Pode ser: Prof. Lorí Val, Dr. [email protected] http://www.pucrs.br/famat/val www.pucrs.br/famat/val/ correlacoal ou expermetal. Numa relação expermetal os valores
Notas de aula da disciplina Probabilidade e Estatística
otas de aula da dscpla Probabldade e Estatístca Proessor M Sc Adré Luz DAMAT - UTFPR Esta apostla apreseta os tópcos prcpas abordados em sala de aula, cotedo deções, teoremas, eemplos Sua letura ão é obrgatóra,
Faculdade de Economia, Administração e Contabilidade de Ribeirão Preto
Faculdade de Ecooma, Admstração e Cotabldade de Rberão Preto Ecooma Moetára Curso de Ecooma / º. Semestre de 014 Profa. Dra. Rosel da Slva Nota de aula CAPM Itrodução Há dos modelos bastate utlzados para
Cursos de Licenciatura em Ensino de Matemática e de EGI. Teoria de Probabilidade
Celso Albo FACULDADE DE CIÊNCIAS NATURAIS E MATEMÁTICA DEPARTAMENTO DE MATEMÁTICA Campus de Lhaguee, Av. de Moçambque, km, Tel: +258 240078, Fax: +258 240082, Maputo Cursos de Lcecatura em Eso de Matemátca
UERJ CTC IME Departamento de Informática e Ciência da Computação 2 Cálculo Numérico Professora Mariluci Ferreira Portes
UERJ CTC IE Departameto de Iormátca e Cêca da Computação Udade I - Erros as apromações umércas. I. - Cosderações geras. Há váras stuações em dversos campos da cêca em que operações umércas são utlzadas
Estatística Descritiva. Medidas estatísticas: Localização, Dispersão
Estatístca Descrtva Meddas estatístcas: Localzação, Dspersão Meddas estatístcas Localzação Dspersão Meddas estatístcas - localzação Méda artmétca Dados ão agrupados x x Dados dscretos agrupados x f r x
Estatística Notas de Aulas ESTATÍSTICA. Notas de Aulas. Professor Inácio Andruski Guimarães, DSc. Professor Inácio Andruski Guimarães, DSc.
Estatístca Notas de Aulas ESTATÍSTICA Notas de Aulas Professor Iáco Adrus Gumarães, DSc. Professor Iáco Adrus Gumarães, DSc. Estatístca Notas de Aulas SUMÁRIO CONCEITOS BÁSICOS 5. Estatístca. Estatístca
Econometria: 4 - Regressão Múltipla em Notação Matricial
Ecoometra: 4 - Regressão últpla em Notação atrcal Prof. arcelo C. ederos [email protected] Prof. arco A.F.H. Cavalcat [email protected] Potfíca Uversdade Católca do Ro de Jaero PUC-Ro Sumáro O modelo
FINANCIAMENTOS UTILIZANDO O EXCEL
rofessores Ealdo Vergasta, Glóra Márca e Jodála Arlego ENCONTRO RM 0 FINANCIAMENTOS UTILIZANDO O EXCEL INTRODUÇÃO Numa operação de empréstmo, é comum o pagameto ser efetuado em parcelas peródcas, as quas
Estatística. 2 - Estatística Descritiva
Estatístca - Estatístca Descrtva UNESP FEG DPD Prof. Edgard - 0 0- ESTATÍSTICA DESCRITIVA Possblta descrever as Varáves: DESCRIÇÃO GRÁFICA MEDIDAS DE POSIÇÃO MEDIDAS DE DISPERSÃO MEDIDAS DE ASSIMETRIA
CURSO ON-LINE PROFESSOR: VÍTOR MENEZES
O Danel Slvera pedu para eu resolver mas questões do concurso da CEF. Vou usar como base a numeração do caderno foxtrot Vamos lá: 9) Se, ao descontar uma promssóra com valor de face de R$ 5.000,00, seu
RESUMO DE MATEMÁTICA FINANCEIRA. Juro Bom Investimento C valor aplicado M saldo ao fim da aplicação J rendimento (= M C)
RESUMO DE MATEMÁTICA FINANCEIRA I. JUROS SIMPLES ) Elemetos de uma operação de Juros Smples: Captal (C); Motate (M); Juros (J); Taxa (); Tempo (). ) Relação etre Juros, Motate e Captal: J = M C ) Defção
Faculdade de Tecnologia de Catanduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL
Faculdade de Tecologa de Cataduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL 5. Meddas de Posção cetral ou Meddas de Tedêca Cetral Meddas de posção cetral preocupam-se com a caracterzação e a
PUCRS FAMAT DEPTº DE ESTATÍSTICA ESTATÍSTICA DESCRITIVA SÉRGIO KATO
PUCRS FAMAT DEPTº DE ESTATÍSTICA ESTATÍSTICA DESCRITIVA SÉRGIO KATO A expressão dados, será ctada dversas vezes esta dscpla, em lguagem ormal, dados são ormações (úmeros ou ão) sobre um dvíduo (pessoa,
Professor Mauricio Lutz ESTATÍSTICA BÁSICA
Proessor Maurco Lutz ESTATÍSTICA BÁSICA. Coceto Exstem mutas deções propostas por autores, objetvado estabelecer com clareza o que é estatístca, como por exemplo: Þ A Estatístca é um cojuto de métodos
Matemática Financeira
Cocetos Báscos de Matemátca Facera Uversdade do Porto Faculdade de Egehara Mestrado Itegrado em Egehara Electrotécca e de Computadores Ecooma e Gestão Na prátca As decsões faceras evolvem frequetemete
UNIVERSIDADE FEDERAL FLUMINENSE CENTRO DE ESTUDOS GERAIS INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA NÚMEROS ÍNDICES
UNIVERSIDADE FEDERAL FLUMINENSE CENTRO DE ESTUDOS GERAIS INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA NÚMEROS ÍNDICES Aa Mara Lma de Faras Luz da Costa Laurecel Com a colaboração dos motores Maracajaro
A REGRESSÃO LINEAR EM EVENTOS HIDROLÓGICOS EXTREMOS: enchentes
Mostra Nacoal de Icação Cetífca e Tecológca Iterdscplar VI MICTI Isttuto Federal Catarese Câmpus Camború 30 a 3 de outubro de 03 A REGRESSÃO LINEAR EM EVENTOS HIDROLÓGICOS EXTREMOS: echetes Ester Hasse
12.2.2 CVT: Coeficiente de Variação de Thorndike...45 12.2.3 CVQ: Coeficiente Quartílico de Variação...45 13 MEDIDAS DE ASSIMETRIA...46 13.
SUMARIO 2 MÉTODO ESTATÍSTICO...3 2. A ESTATÍSTICA...3 2.2 FASES DO MÉTODO ESTATÍSTICO...4 3 FERRAMENTAS DE CÁLCULO PARA O ESTUDO DA ESTATÍSTICA...5 3. FRAÇÃO...5 3.. Adção e subtração...5 3..2 Multplcação
Capítulo 6 - Centro de Gravidade de Superfícies Planas
Capítulo 6 - Cetro de ravdade de Superfíces Plaas 6. Itrodução O Cetro de ravdade (C) de um sóldo é um poto localzado o própro sóldo, ou fora dele, pelo qual passa a resultate das forças de gravdade que
MEDIDAS DE TENDÊNCIA CENTRAL I
Núcleo das Cêcas Bológcas e da Saúde Cursos de Bomedca, Ed. Físca, Efermagem, Farmáca, Fsoterapa, Fooaudologa, edca Veterára, uscoterapa, Odotologa, Pscologa EDIDAS DE TENDÊNCIA CENTRAL I 7 7. EDIDAS DE
Capitulo 8 Resolução de Exercícios
FORMULÁRIO Audades Peródcas, Crescetes e Postecpadas, com Termos em P. A. G 1 1 1 1 G SPAC R R s s 1 1 1 1 1 G G C R a R a 1 1 PAC Audades Gradetes Postecpadas S GP G 1 1 ; C GP G 1 1 1 Audades Gradetes
Lista 2 - Introdução à Probabilidade e Estatística
UNIVERSIDADE FEDERAL DO ABC Lista - Itrodução à Probabilidade e Estatística Modelo Probabilístico experimeto. Que eveto represeta ( =1 E )? 1 Uma ura cotém 3 bolas, uma vermelha, uma verde e uma azul.
Prof. Dr. Marco Antonio Leonel Caetano Projeção de Cenários Aplicados ao Orçamento Empresarial Com revisão das Ferramentas de Estatística
Projeção de Ceáros Aplcados ao Orçameto Empresaral Com revsão das Ferrametas de Estatístca Prof. Dr. Marco Atoo Leoel Caetao TÓPICO Tratameto, Quatfcação e Vsualzação de Dados Faceros. Itrodução Na dvulgação
ESTATÍSTICA MÓDULO 2 OS RAMOS DA ESTATÍSTICA
ESTATÍSTICA MÓDULO OS RAMOS DA ESTATÍSTICA Ídce. Os Ramos da Estatístca...3.. Dados Estatístcos...3.. Formas Icas de Tratameto dos Dados....3. Notação por Ídces...5.. Notação Sgma ()...5 Estatístca Módulo
MATERIAL DE ESTATÍSTICA II PROF. MÁRIO ROBERTO
1 VARIÁVEIS ALEATÓRIAS O que se etede por varável aleatóra? Até agora ossos estudos estavam pratcamete voltados mas para defrmos osso Espaço Amostral U, sem assocarmos suas respectvas probabldades aos
Estatística Agosto 2009 Campus do Pontal Prof. MSc. Quintiliano Siqueira Schroden Nomelini
Estatístca Agosto 009 Campus do Potal Prof. MSc. Qutlao Squera Schrode Nomel - ESTATÍSTICA DESCRITIVA. - A NATUREZA DA ESTATÍSTICA COMO SURGIU A ESTATÍSTICA????? A Matemátca surge do covívo socal, da cotagem,
ESTATÍSTICA APLICADA À ZOOTECNIA
ESTATÍSTICA APLICADA À ZOOTECNIA Eucldes Braga MALHEIROS *. INTRODUÇÃO.a) Somatóras e Produtóros Sejam,, 3,...,, valores umércos. A soma desses valores (somatóra) pode ser represetada por: = = = =. e o
Requisitos metrológicos de instrumentos de pesagem de funcionamento não automático
Requstos metrológcos de strumetos de pesagem de fucoameto ão automátco 1. Geeraldades As balaças estão assocadas de uma forma drecta à produção do betão e ao cotrolo da qualdade do mesmo. Se são as balaças
E-mails: [email protected] [email protected] [email protected] http://www. damasceno.info www. damasceno.info damasceno.
Matemátca Facera 2007.1 Prof.: Luz Gozaga Damasceo 1 E-mals: [email protected] [email protected] [email protected] http://www. damasceo.fo www. damasceo.fo damasceo.fo Obs.: (1 Quado
x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:
Professora Jaete Perera Amador 1 9 Meddas Descrtvas Vmos aterormete que um cojuto de dados pode ser resumdo através de uma dstrbução de freqüêcas, e que esta pode ser represetada através de uma tabela
APOSTILA DE ESTATÍSTICA APLICADA A ADMINISTRAÇÃO, ECONOMIA, MATEMÁTICA INDUSTRIAL E ENGENHARIA
UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EATAS DEPARTAMENTO DE ESTATÍSTICA APOSTILA DE ESTATÍSTICA APLICADA A ADMINISTRAÇÃO, ECONOMIA, MATEMÁTICA INDUSTRIAL E ENGENHARIA SONIA ISOLDI MARTY GAMA
REGESD Prolic Matemática e Realidade- Profª Suzi Samá Pinto e Profº Alessandro da Silva Saadi
REGESD Prolc Matemátca e Realdade- Profª Suz Samá Pto e Profº Alessadro da Slva Saad Meddas de Posção ou Tedêca Cetral As meddas de posção ou meddas de tedêca cetral dcam um valor que melhor represeta
2 Avaliação da segurança dinâmica de sistemas de energia elétrica: Teoria
Avalação da seguraça dâmca de sstemas de eerga elétrca: Teora. Itrodução A avalação da seguraça dâmca é realzada através de estudos de establdade trastóra. Nesses estudos, aalsa-se o comportameto dos geradores
MEDIDAS DE DISPERSÃO:
MEDID DE DIPERÃO: fução dessas meddas é avalar o quato estão dspersos os valores observados uma dstrbução de freqüêca ou de probabldades, ou seja, o grau de afastameto ou de cocetração etre os valores.
Capítulo 1 PORCENTAGEM
Professor Joselas Satos da Slva Matemátca Facera Capítulo PORCETAGEM. PORCETAGEM A porcetagem ada mas é do que uma otação ( % ) usada para represetar uma parte de cem partes. Isto é, 20% lê-se 20 por ceto,
É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou. experimental.
É o grau de assocação etre duas ou mas varáves. Pode ser: correlacoal ou Prof. Lorí Val, Dr. [email protected] http://www.mat.ufrgs.r/~val/ expermetal. Numa relação expermetal os valores de uma das varáves
Estatística - exestatmeddisper.doc 25/02/09
Estatístca - exestatmeddsper.doc 5/0/09 Meddas de Dspersão Itrodução ão meddas estatístcas utlzadas para avalar o grau de varabldade, ou dspersão, dos valores em toro da méda. ervem para medr a represetatvdade
1. Conceitos básicos de estatística descritiva 1.3. Noção de extracção aleatória e de probabilidade
Sumáro (3ª aula). Cocetos báscos de estatístca descrtva.3. Noção de etracção aleatóra e de probabldade.4 Meddas de tedêca cetral.4. Méda artmétca smples.4. Méda artmétca poderada.4.3 Méda artmétca calculada
Revisão de Estatística X = X n
Revsão de Estatístca MÉDIA É medda de tedêca cetral mas comumete usada ara descrever resumdamete uma dstrbução de freqüêca. MÉDIA ARIMÉTICA SIMPLES São utlzados os valores do cojuto com esos guas. + +...
Teoria Elementar da Probabilidade. a) Cada experiência poderá ser repetida indefinidamente sob condições essencialmente inalteradas.
Estatístca 47 Estatístca 48 Teora Elemetar da Probabldade SPECTOS PERTINENTES À CRCTERIZÇÃO DE UM EXPERIÊNCI LETÓRI MODELOS MTEMÁTICOS DETERMINÍSTICOS PROBBILÍSTICOS PROCESSO (FENÓMENO) LETÓRIO - Quado
Distribuições Amostrais. Estatística. 8 - Distribuições Amostrais UNESP FEG DPD
Dstrbuções Amostras Estatístca 8 - Dstrbuções Amostras 08- Dstrbuções Amostras Dstrbução Amostral de Objetvo: Estudar a dstrbução da população costtuída de todos os valores que se pode obter para, em fução
Professor Mauricio Lutz REGRESSÃO LINEAR SIMPLES. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: ö ; ø.
Professor Maurco Lutz 1 EGESSÃO LINEA SIMPLES A correlação lear é uma correlação etre duas varáves, cujo gráfco aproma-se de uma lha. O gráfco cartesao que represeta essa lha é deomado dagrama de dspersão.
LEASING UMA OBSERVAÇÃO Economista Antonio Pereira da Silva
LEASING UMA OBSERVAÇÃO Ecoomsta Atoo Perera da Slva AMOR POR DINHEIRO TITÃS Composção: Sérgo Brtto e To Bellotto Acma dos homes, a le E acma da le dos homes A le de Deus Acma dos homes, o céu E acma do
Uma Calculadora Financeira usando métodos numéricos e software livre
Uma Calculadora Facera usado métos umércos e software lvre Jorge edraza Arpas, Julao Sott, Depto de Cêcas e Egeharas, Uversdade Regoal ItegradaI, URI 98400-000-, Frederco Westphale, RS Resumo.- Neste trabalho
Monitoramento ou Inventário Florestal Contínuo
C:\Documets ad Settgs\DISCO_F\MEUS-DOCS\LIVRO_EF_44\ef44_PDF\CAP XIV_IFCOTIUO.doc 6 Motorameto ou Ivetáro Florestal Cotíuo Agosto Lopes de Souza. ITRODUÇÃO Parcelas permaetes de vetáro florestal cotíuo
Construção e Análise de Gráficos
Costrução e Aálse de Gráfcos Por que fazer gráfcos? Facldade de vsualzação de cojutos de dados Faclta a terpretação de dados Exemplos: Egehara Físca Ecooma Bologa Estatístca Y(udade y) 5 15 1 5 Tabela
1. Conceito de variável aleatória Podemos estudar, por exemplo, algumas características dos alunos do Curso de estatística.
CAPÍTULO 7 VARIÁVEL ALEATÓRIA A probabldade teve íco com os jogos de azar (século XVII) com Cavalero de Nere, Fermat e Pascal, porém, coube a Beroull (73) laçar as bases da probabldade e a segur Laplace
Marília Brasil Xavier REITORA. Prof. Rubens Vilhena Fonseca COORDENADOR GERAL DOS CURSOS DE MATEMÁTICA
Maríla Brasl Xaver REITORA Prof. Rubes Vlhea Foseca COORDENADOR GERAL DOS CURSOS DE MATEMÁTICA MATERIAL DIDÁTICO EDITORAÇÃO ELETRONICA Odvaldo Texera Lopes ARTE FINAL DA CAPA Odvaldo Texera Lopes REALIZAÇÃO
Ex: Cálculo da média dos pesos dos terneiros da fazenda Canoas-SC, à partir dos dados originais: x = 20
. MEDIDAS DE TENDÊNCIA CENTRAL (OU DE POSIÇÃO) Coceto: São aquelas que mostram o alor em toro do qual se agrupam as obserações.. MÉDIA ARITMÉTICA ( ) Sea (x, x,..., x ), uma amostra de dados: Se os dados
Macroeconometria Aula 3 Revisão de estatística e teste de hipótese
Macroecoometra 008. Aula 3 Revsão de estatístca e teste de hpótese 3.5. Estmação No estudo das probabldades, o objetvo é calcular a probabldade de evetos préespecfcados. De agora em date o objetvo muda.
Teoria da Amostragem
Teora da Amostragem I- oções fudametas sobre amostragem. Amostragem é todo o processo de recolha de uma parte, geralmete pequea, dos elemetos que costtuem um dado couto. Da aálse dessa parte pretede obter-se
A TORRE DE HANÓI Carlos Yuzo Shine - Colégio Etapa
A TORRE DE HANÓI Carlos Yuzo Shie - Colégio Etapa Artigo baseado em aula miistrada a IV Semaa Olímpica, Salvador - BA Nível Iiciate. A Torre de Haói é um dos quebra-cabeças matemáticos mais populares.
Cap. 5. Testes de Hipóteses
Cap. 5. Testes de Hpóteses Neste capítulo será estudado o segudo problema da ferêca estatístca: o teste de hpóteses. Um teste de hpóteses cosste em verfcar, a partr das observações de uma amostra, se uma
Projeto de rede na cadeia de suprimentos
Projeto de rede a cadea de suprmetos Prof. Ph.D. Cláudo F. Rosso Egehara Logístca II Esboço O papel do projeto de rede a cadea de suprmetos Fatores que fluecam decsões de projeto de rede Modelo para decsões
Econometria: 3 - Regressão Múltipla
Ecoometra: 3 - Regressão Múltpla Prof. Marcelo C. Mederos [email protected] Prof. Marco A.F.H. Cavalcat [email protected] Potfíca Uversdade Católca do Ro de Jaero PUC-Ro Sumáro O modelo de regressão
Y X Baixo Alto Total Baixo 1 (0,025) 7 (0,175) 8 (0,20) Alto 19 (0,475) 13 (0,325) 32 (0,80) Total 20 (0,50) 20 (0,50) 40 (1,00)
Bussab&Morettn Estatístca Básca Capítulo 4 Problema. (b) Grau de Instrução Procedênca º grau º grau Superor Total Interor 3 (,83) 7 (,94) (,) (,33) Captal 4 (,) (,39) (,) (,3) Outra (,39) (,7) (,) 3 (,3)
3 Precificação de resseguro
Precfcação de Resseguro 35 3 Precfcação de resseguro Este capítulo traz prmeramete uma oção ampla das aplcações das metodologas de precfcação de resseguro para melhor compreesão do mesmo Da seção 3 até
Algoritmos de Interseções de Curvas de Bézier com Uma Aplicação à Localização de Raízes de Equações
Algortmos de Iterseções de Curvas de Bézer com Uma Aplcação à Localzação de Raízes de Equações Rodrgo L.R. Madurera Programa de Pós-Graduação em Iformátca, PPGI, UFRJ 21941-59, Cdade Uverstára, Ilha do
