Romeu M agnani Marisa Veiga Capela INSTITUTO DE QUÍMICA UNESP ARARAQUARA

Documentos relacionados
Cap. 4 - Estimação por Intervalo

Distribuições Amostrais

Estimadores de Momentos

Intervalos de Confiança

Teorema do limite central e es/mação da proporção populacional p

6.1 Estimativa de uma média populacional: grandes amostras. Definição: Um estimador é uma característica amostral (como a média amostral

Estimação da média populacional

Estatística. Estatística II - Administração. Prof. Dr. Marcelo Tavares. Distribuições de amostragem. Estatística Descritiva X Estatística Inferencial

Distribuições Amostrais

Distribuições Amostrais

Distribuições de Estatísticas Amostrais e Teorema Central do Limite

Objetivo. Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

n ) uma amostra aleatória da variável aleatória X.

Obtemos, então, uma amostra aleatória de tamanho n de X, que representamos por X 1, X 2,..., X n.

Sumário. 2 Índice Remissivo 19

1 Distribuições Amostrais

Avaliação de Desempenho de Sistemas Discretos

MEDIDAS DESCRITIVAS DE POSIÇÃO, TENDÊNCIA CENTRAL E VARIABILIDADE

ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL p

Lista de Exercícios #4 Assunto: Variáveis Aleatórias Contínuas

Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir da informação

Instruções gerais sobre a Prova:

Estimação da média populacional

NOTAS DE AULA: DISTRIBUIÇÃO AMOSTRAL E INTERVALOS DE CONFIANÇA

Revisando... Distribuição Amostral da Média

d) A partir do item c) encontre um estimador não viciado para σ 2.

Lista de Exercícios #6 Assunto: Propriedade dos Estimadores e Métodos de Estimação

Comparação entre duas populações

Teoria da Estimação 1

Objetivo. Estimar a média de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

7. INTERVALOS DE CONFIANÇA

DESIGUALDADES, LEIS LIMITE E TEOREMA DO LIMITE CENTRAL. todas as repetições). Então, para todo o número positivo ξ, teremos:

10 - Medidas de Variabilidade ou de Dispersão

INTERVALOS DE CONFIANÇA

Sumário. 2 Índice Remissivo 17

ESTIMAÇÃO DE PARÂMETROS

Estimativa de Parâmetros

Prof. Fabrício Maciel Gomes Departamento de Engenharia Química Escola de Engenharia de Lorena EEL

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

Estimação de Parâmetros. 1. Introdução

Estimação por Intervalo (Intervalos de Confiança):

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

1 Estimação de Parâmetros

binomial seria quase simétrica. Nestas condições será também melhor a aproximação pela distribuição normal.

Disciplina: Probabilidade e Estatística (MA70H) Profª Silvana Heidemann Rocha Estudante: Código: APRESENTAÇÃO DE DADOS PARA VARIÁVEL QUANTITATIVA

Stela Adami Vayego DEST/UFPR

DISTRIBUIÇÕES DE PROBABILIDADE

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

ESTATÍSTICA E PROBABILIDADES

População x Amostra. statística descritiva X inferência estatística. Revisão de Estatística e Probabilidade

Nosso objetivo agora é estudar a média de uma variável quantitativa X. Denotamos a média desconhecida como E(X)=µ

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPTO. DE ESTATÍSTICA LISTA 4 PROBABILIDADE A (CE068) Prof. Benito Olivares Aguilera

Contabilometria. Prof.: Patricia Maria Bortolon, D. Sc.

ESTATÍSTICA- II DISTRIBUIÇÃO DE FREQUÊNCIA. 1- CONCEITO É a série estatística que tem o tempo, o espaço e a espécie como variáveis dependentes.

Lista 9 - Introdução à Probabilidade e Estatística

Variáveis Aleatórias e Distribuições de Probabilidade

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

CAPÍTULO 6 - ESTIMAÇÃO E TESTES DE HIPÓTESES

CONHECIMENTOS ESPECÍFICOS

CAPÍTULO 6 ESTIMATIVA DE PARÂMETROS PPGEP. Introdução. Introdução. Estimativa de Parâmetros UFRGS

MATEMÁTICA MÓDULO 6 ESTATÍSTICA. Professor Haroldo Filho

3.4.2 Cálculo da moda para dados tabulados. 3.4 Moda Cálculo da moda para uma lista Cálculo da moda para distribuição de freqüências

Amostras Aleatórias e Distribuições Amostrais. Probabilidade e Estatística: afinal, qual é a diferença?

e, respectivamente. Os valores tabelados para a distribuição t-student dependem do número de graus de liberdade ( n 1 e

1 a Lista de PE Solução

Unidade IX Estimação

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

O teste de McNemar. A tabela 2x2. Depois - Antes

ESTIMAÇÃO PARA A MÉDIA

Stela Adami Vayego DEST/UFPR

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Stela Adami Vayego DEST/UFPR

ESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO

Caderno de Exercício 2

ESTATÍSTICA EXPLORATÓRIA

Estatística. 7 - Distribuições Amostrais

A B C A e B A e C B e C A, B e C

MAE Introdução à Probabilidade e Estatística II Resolução Lista 1

Capítulo 5- Introdução à Inferência estatística. (Versão: para o manual a partir de 2016/17)

AMOSTRAGEM ALEATÓRIA DISTRIBUIÇÕES POR AMOSTRAGEM

CONHECIMENTOS ESPECÍFICOS

Capítulo 5- Introdução à Inferência estatística.

Lista IC, tamanho de amostra e TH

PROVA 1 27/10/ Os dados apresentados na seqüência mostram os resultados de colesterol

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Teste de Hipótese

Virgílio A. F. Almeida DCC-UFMG 1/2005

Faculdade de Economia Universidade Nova de Lisboa ESTATÍSTICA. Exame Final 2ª Época 26 de Junho de Grupo I (3 valores)

MAE Introdução à Probabilidade e Estatística II Resolução Lista 2

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

CONCEITOS BÁSICOS E PRINCÍPIOS DE ESTATÍSTICA

3 Introdução à inferência estatística

Exercícios de Intervalos de Confiança para media, variância e proporção

Cálculo Numérico Lista 02

REVISÃO DE PROBABILIDADE E ESTATÍSTICA. Parte 2

n C) O EMV é igual a i 1

DURAÇÃO 1:30. (o teste consta de 3 páginas com questões, um formulário e uma tabela - 5 folhas no total)

5. ANÁLISE DE SISTEMAS DA CONFIABILIADE DE SISTEMAS SÉRIE-PARALELO

INFERÊNCIA. Fazer inferência (ou inferir) = tirar conclusões

4 Teoria da Probabilidade

DEPARTAMENTO DE ESTATÍSTICA - UFMG PROVA DE ESTATÍSTICA E PROBABILIDADE SELEÇÃO - MESTRADO/ UFMG /2016

Transcrição:

ESTATÍSTICA Romeu Magai Marisa Veiga Capela UNESP INSTITUTO DE QUÍMICA ARARAQUARA

I. ESTATÍSTICA DESCRITIVA. INTRODUÇÃO A Estatística Descritiva trata da maeira de apresetar um cojuto de dados em tabelas ou gráficos e do modo de resumir as iformações cotidas esses dados, através de certas medidas como média, variâcia, desvio padrão, coeficiete de variação, etc.. TIPOS DE VARIÁVEIS Algumas variáveis são qualitativas e outras quatitativas. Uma variável qualitativa pode ser apeas um ome (variável qualitativa omial) ou estabelecer uma ordem (variável qualitativa ordial). As variáveis quatitativas, mais importates este curso, são classificadas em discreta (se referem em geral a cotages) ou cotíua (podem assumir qualquer valor de um itervalo de úmeros reais). Exemplo : Na tabela abaixo são apresetados 6 valores de cada uma de 6 variáveis, que represetam iformações sobre aluos do sexo masculio cursado graduação em Química, em determiado ao (classifique essas variáveis coforme o tipo) No. do aluo No. de irmãos Altura Peso Idade Origem* Grau de istrução do pai,7 7,9 8 AR o. grau 3,7 76, AR o. grau 3,69 7,6 8 OL Superior 4,6 6, CP o. grau 5 3,77 7,3 9 CP o. grau 6,55 53,6 9 OL o. grau 7,66 65,8 AR o. grau 8 5,63 65, 9 OL o. grau 9 3,73 87,8 9 OL Superior 5,7 73,8 AR Superior 4,8 8,3 OL o. grau 3,73 7, 9 OL Superior 3,8 74,7 4 AR o. grau 4 3,77 73,4 9 OL o. grau 5,73 69, OL o. grau 6 3,7 98, AR o. grau 7,74 7, 8 OL Superior 8,7 67,3 9 OE o. grau 9 3,74 69, AR Superior 3,7 79,7 8 OL o. grau,88 85,7 8 OL o. grau 3,76 83,4 9 CP Superior 3,6 64, OL Superior 4,67 7, 3 AR Superior 5 3,64 63,5 9 CP Superior 6,77 69, 9 OE o. grau 7,73 76,8 3 OL Superior 8,8 9, OL o. grau 9,73 64,8 OE Nehum 3,66 68, 9 OL Superior 3,79 8,5 OL Superior 3 3,8 5,7 AR o. grau

No. do aluo No. de irmãos Altura Peso Idade Origem* Grau de istrução do pai 33 3,63 6,8 OL o. grau 34,77 79,4 OL o. grau 35,86 87, 9 AR Superior 36,66 59,9 5 OL o. grau 37,8 8, OL o. grau 38 6,85 79, AR o. grau 39,69 69,4 CP Superior 4 3,58 6, OL o. grau 4 3,77 8,6 8 CP Superior 4,76 7,4 9 OL Superior 43 4,67 65,9 8 OL Superior 44 4,75 74,9 CP o. grau 45,8 83,4 8 OL o. grau 46,7 77,4 8 OL Superior 47 3,78 78,6 9 OL Superior 48,7 78,6 4 CP o. grau 49,75 8,9 CP o. grau 5 3,75 74, AR o. grau 5,8 77, 3 AR Superior 5 4,7 7, CP o. grau 53,74 79, 8 AR Superior 54,78 83,4 OL o. grau 55 5,89 9, CP Superior 56,8 94,6 AR o. grau 57,76 67, OL o. grau 58 4,76 7, 9 CP Superior 59,64 65, OL o. grau 6,65 7,7 8 OL o. grau *AR: Araraquara e região (até 5km) CP: Capital OL: Outros Locais do Estado OE: Outros Estados 3. DISTRIBUIÇÃO DE FREQÜÊNCIAS Muitas vezes, obtém-se iformações relevates sobre uma variável através de sua distribuição de freqüêcias. Esta é uma tabela cotedo valores distitos da variável e as freqüêcias correspodetes. A freqüêcia pode ser absoluta ( de vezes que o valor aparece o cojuto de dados) ou relativa ( de vezes que o valor aparece dividido pelo total de valores) ou percetual (a freqüêcia relativa multiplicada por ). Pode ser útil também o gráfico da distribuição. Os gráficos recomedados depedem do tipo de variável. No caso das variáveis quatitativas, em especial a variável cotíua, são observadas as freqüêcias em itervalos de valores, em vez de freqüêcias idividuais. Para variável quatitativa é de grade importâcia a distribuição de freqüêcias acumuladas. Uma freqüêcia acumulada é a soma das freqüêcias até determiado valor (ou itervalo de valores) Exemplo : Distribuições de freqüêcias da variável origem do exemplo e gráfico em pizza. Origem Freqüêcia Freq. Relativa Freq. Percetual AR 5,5 5% OL 3,5 5% OE 3,5 5% CP, % Total 6, % 5% % 5% 5% AR OL OE CP

Exemplo 3: Distribuições de freqüêcias da variável discreta úmero de irmãos da tabela do exemplo, gráfico de freqüêcias e gráfico de freqüêcias acumuladas. N de irmãos Freqüêcia Freqüêcia acumulada Freqüêcia relativa Freq. relativa acumulada 6 6,, 9 5,5,5 35,333,583 3 6 5,67,85 4 5 56,83,933 5 3 59,5,983 6 6,7, Total 6, 6 Frequêcia 5 5 Frequêcia acumulada 45 3 5 3 4 5 6 No. de irmãos 3 4 5 6 No. de irmãos Observação: Os gráficos de freqüêcia absoluta, freqüêcia relativa e freqüêcia percetual têm o mesmo aspecto. Isso ocorre porque essas freqüêcias são proporcioais. Uma distribuição de freqüêcias de variável cotíua é diferete. A faixa que egloba todos os valores da variável é dividida em diversos itervalos, de preferêcia de mesma amplitude. A freqüêcia se refere ao úmero de valores da variável em cada itervalo. Um critério empregado aqui é o de cosiderar os itervalos fechados à direita, isto é, icluem o valor da extrema direita e ão icluem o valor à esquerda. Ás vezes é coveiete substituir o itervalo pelo seu poto médio. Exemplo 4: As alturas da tabela do exemplo, colocadas em ordem crescete, são:,55;,58;,6;,6;,63;,63;,64;,64;,65;,66;,66;,66;,67;,67;,69;,69;,7;,7;,7;,7;,7;,7;,7;,7;,7;,73;,73;,73;,73;,73;,74;,74;,74;,75;,75;,75;,76;,76;,76;,76;,77;,77;,77;,77;,77;,78;,78;,79;,8;,8;,8;,8;,8;,8;,8;,8;,85;,86;,88;,89; Variação total:,89-,55=,34 metros. Uma sugestão é usar 6 7 ou 8 itervalos. Tomado como variação total,35m e adotado 7 itervalos, cada um terá amplitude,35/7=,5 m. A distribuição de freqüêcias absolutas (simples e acumulada) e a distribuição de freqüêcias relativas (simples e acumulada) são dadas abaixo, assim como os gráficos das distribuições de freqüêcias relativas. Itervalos de alturas Poto médio Freq. Freq. acum. Freq. relativa,55,6,575,33,6,65,65 7 9,7,65,7,675 9 8,5,7,75,75 8 36,3,75,8,775 6 5,67,8,85,85 5 57,83,85,9,875 3 6,5 Total 6, Freq. relativa acumulada,33,5,3,6,867,95, Desidade de freq. rel.,667,333 3, 6, 5,333,667, 3

Frequêcia relativa,3,,,,575,65,675,75,775,85,875 Altura Freq. rel. acumulada,,8,6,4,,,575,65,675,75,775,85,875 Altura O gráfico em coluas retagulares acima é chamado Histograma, equato que o gráfico de freqüêcias acumuladas recebe o ome de Ogiva de Galto. No gráfico de freqüêcias simples, as alturas dos retâgulos são proporcioais as alturas dos retâgulos do gráfico de freqüêcias relativas. Portato, eles têm o mesmo aspecto. Para as freqüêcias acumuladas também ocorre uma proporcioalidade das alturas. Na tabela de distribuições de freqüêcias da variável altura foi icluída uma colua de desidade de freqüêcia relativa. Esta é obtida pela divisão da freqüêcia relativa pela amplitude do itervalo de alturas correspodete. Desse modo, o histograma da desidade de freqüêcia, a área de cada retâgulo é igual a freqüêcia relativa correspodete e a área total é igual a soma das freqüêcias relativas que é. Em termos percetuais, a área de cada retâgulo é a porcetagem de alturas o itervalo base do retâgulo. Ateção: A compreesão do coceito de desidade de freqüêcia relativa é fudametal para o etedimeto de tópicos mais avaçados de Estatística. Na figura tem-se o histograma da desidade de freqüêcias relativas das alturas de um grade úmero de aluos de graduação do sexo masculio. A base de cada retâgulo (itervalo de alturas) é igual a, m e os úmeros idicados represetam uma parte dos potos médios dos itervalos. No eixo vertical estão represetadas as desidades de freqüêcias relativas, cuja uidade é /m. Etão, a área do retâgulo de poto médio,7 é aproximadamete igual a, x 5,5=,. Em outras palavras, % dos aluos têm alturas o itervalo de,7 a,7 m. No itervalo de,7 a Desidade 6,5 6, 5,5 5, 4,5 4, 3,5 3,,5,,5,,5,,55,59,63,67,7,75 Altura,78 m estão aproximadamete 35,5% das alturas. Um problema iteressate é determiar a altura, tal que, o cojuto de todas as alturas meores do que ela represeta % do total. A resposta é a altura de aproximadamete,6 m.,79,83,87,9 4. RELAÇÃO ENTRE DUAS VARIÁVEIS Até aqui as variáveis foram aalisadas idividualmete. Muitas vezes iteressa verificar se há alguma associação etre duas ou mais variáveis. Com apeas duas variáveis pode ser usado o gráfico de dispersão. Exemplo 5: Na figura abaixo está represetado o gráfico de dispersão das variáveis altura e peso da tabela do exemplo. Parece haver uma depedêcia etre as variáveis, pois coforme a altura aumeta, o peso também aumeta. 4

Peso 9 7 5,5,6,7,8,9 Altura 4. USANDO O EXCEL Fuções CONT.SE(matriz*; valor) Cota o de vezes que determiado valor ( ou ão) aparece em uma matriz de dados. FREQÜÊNCIA(matriz; Quado o valor de referêcia é uma célula, dá a Freqüêcia valores de referêcia) acumulada. Para a freqüêcia absoluta é preciso marcar primeiro o itervalo de saída, iserir a fução FREQUÊNCIA e pressioar ao mesmo tempo CONTROL+SHIFT+ENTER MÁXIMO(matriz) valor máximo de uma matriz de dados MÍNIMO(matriz) valor míimo de uma matriz de dados CONT.VALORES(matriz) Total de valores uméricos de uma matriz de dados *cojuto de células de uma plailha dispostos só em liha, só em colua ou tato em liha como em colua. Ferrametas de aálise HISTOGRAMA Forma a distribuição de freqüêcia e costrói o Histograma. PROBLEMAS: ) Abra uma pasta o Excel e coloque a tabela do exemplo em uma plailha. Em seguida, use as fuções idicadas acima para resolver os exemplos de a 5. ) Resolva ovamete o exemplo 4 usado a ferrameta HISTOGRAMA. 3) Estude as distribuições de freqüêcias das outras variáveis da tabela do exemplo : peso, idade e grau de istrução do pai (este caso, use o gráfico de coluas agrupadas). PROBLEMA PROPOSTO PP) Cosidere os dados da tabela abaixo, referetes a 5 estudates do sexo femiio matriculadas o curso de Química do IQAr em 998. Costrua para cada variável as distribuições de freqüêcias e os respectivos gráficos. Faça o gráfico de dispersão para o par de variáveis altura e peso. Que coclusões podem ser obtidas se os resultados para as variáveis da tabela do exemplo forem comparados com os obtidos aqui? N Peso (kg) Altura (m) idade (aos) Peso (kg) Altura (m) idade (aos) 55,6,64 6 53,,65 6,,7 7 63,,7 3 6,,68 3 8 7,,78 4 7,,69 9 48,,59 5 67,,65 3 3 5,,59 6 49,,6 3 85,,73 9 7 7,,68 3 3 57,,65 5 N

8 63,,64 33 65,,6 9 6,,7 34 48,,65 5,,65 35 6,,68 3 58,,7 36 64,,58 5,,6 7 37 49,,6 9 3 55,,65 38 65,,7 4 57,,67 8 39 57,,67 9 5 5,,56 4 55,,55 6 7,,59 3 4 54,,65 7 48,,6 9 4 57,,8 9 8 7,,7 9 43 45,,6 9 54,,6 5 44 6,,7 4 48,5,55 45 89,,65 3 5,,7 46 5,,7 4,,58 9 47 5,,6 8 3 67,,6 9 48 48,,6 4 58,,68 8 49 53,,64 5 57,,66 8 5 73,,74 6

5. MEDIDAS DE POSIÇÃO As medidas de posição mais cohecidas são: média, mediaa e moda. São valores em toro dos quais os dados se distribuem, por isso são cohecidas como medidas de tedêcia cetral. Se uma variável x possui os valores: x, x,..., x, a média aritmética, que represetaremos aqui por m, ou m(x) quado houver ecessidade de idetificar a variável x, é m(x) = x + x + L + x = (x + x + L + x ) = xi i= A mediaa, med, é o valor que ocupa a posição cetral da série de dados, quado estes são colocados em ordem crescete ou decrescete, e a moda, mo, é o valor com maior freqüêcia. Pode haver mais de uma moda. Exemplo 6: Se uma variável têm valores iguais a:, 5, 8,,, 3, a média m, a mediaa med e a moda são, respectivamete, iguais a + 5 + 8 + + + 3 m = = 9,5 6 8 + med = = (pois existem dois valores cetrais) moda = Exemplo 7: Cosiderado as alturas dos aluos a tabela do exemplo, tem-se, em metros, 3,95 m = (,7+,7 +,69 +,6 +... +,64 +,65) = =,733 6 6 med =,735 moda =,7 Essas medidas de posição podem ser determiadas pela distribuição de freqüêcias do exemplo 4 tomado o poto médio dos itervalos. Tem-se: m = (,575 + 7,65 + 9,675 + 8,75 + 6,775 + 5,85 + 3,875) 6 3,8 = =,73 6 med =,75 moda =,75 6. MEDIDAS DE DISPERSÃO As medidas dispersão são valores que mostram o quato os dados estão dispersos em relação ao cetro da distribuição de freqüêcia (em geral, a média). As pricipais medidas de dispersão são: variâcia e desvio padrão, mas existem outras, tais como: amplitude total, desvio médio e coeficiete de variação. Se uma variável x possui os valores: x, x,..., x, a variâcia, idicada por Var ou Var(x), é defiida por Var (x) = [(x m) + (x m) + L + (x m) = (xi m) i= Etededo (x i - m) como o desvio de x i em relação à média m, etão a variâcia é a média 7

desses desvios ao quadrado. O desvio padrão, dp(x), é a raiz quadrada da variâcia, isto é, dp (x) = Var(x) Quato as outras medidas de dispersão, a amplitude total é a difereça etre o maior e o meor valor da série de dados, o desvio médio é a média dos desvios tomados sempre como positivos e o coeficiete de variação, CV, é o quociete etre o desvio padrão e a média, multiplicado por. CV = dp(x) % x Exemplo 8: Cosiderado os dados do exemplo 6, tem-se Var = [( 6 9,5) + (5 9,5) + (8 9,5) + ( 9,5) + ( 9,5) + (3 9,5) ] = [( 9,5) + ( 4,5) + (,5) + (,5) + (,5) + (,5) ] 6 35,5 = = 39,5 6 Observe que os desvios são iguais a -9,5; -4,5; -,5;,5;,5;,5 e a soma desses desvios é igual a zero (isso acotece sempre). O valor 35,5 é a Soma de Quadrados dos Desvios. O desvio padrão é igual a dp = 39,5 = 6, 65 amplitude total = 3 - = 9,5 + 4,5 +,5 +,5 +,5 +,5 desvio médio = desvio médio = = 5, 667 6 6,65 coeficiete de variação = CV = = 3,3% 9,5 Exemplo 9: Para a distribuição de freqüêcias da variável x = altura do exemplo 4, tem-se: Var = [ (,575,73) + 7 (,65,73) + L + 3.(,875,73) ] 6,935 Var = =,49 m 6 Desvio padrão =,49 =,7m,7 CV = = 4,4%,73 Amplitude Total=,875,575 =,3 m 7. POPULAÇÃO E AMOSTRA Os métodos estatísticos são próprios para o estudo de populações. População é um cojuto de dados que descreve algum feômeo de iteresse, ou seja, dados que têm, em comum, determiada característica. Amostra é um subcojuto de dados selecioados de uma população. Pretede-se, a partir da amostra, estudar a população. Portato, uma amostra deve ter as mesmas características que a população de ode foi retirada. Existem procedimetos adequados de amostragem. 8

Cosiderado uma população formada por um cojuto muito grade de valores, é fácil imagiar que o gráfico da desidade de freqüêcia (ver exemplo 4) poderia ser represetado por uma liha cotíua como as figuras abaixo. Em cada uma delas a área abaixo da curva é igual a. O gráfico a esquerda é simétrico em toro do eixo que cotém a média e represeta uma desidade de freqüêcia teórica, chamada distribuição ormal, que será estudada adiate. Desidade Desidade média x x As medidas de posição e de dispersão, defiidas os ites 5 e 6, são válidas tato para população como para amostra, mas, para a amostra, a variâcia e o desvio padrão tem como deomiador ( ) em lugar de. 35,5 Exemplo : No exemplo 8, o correto seria Var = = 47, e dp = 6, 869. 5 Etretato, o exemplo 9 faz pouca difereça dividir por 6 ou 6 -=59. 8. MEDIDAS DE ASSIMETRIA E CURTOSE O coeficiete de assimetria e o coeficiete de curtose são medidas relacioadas com a forma da distribuição de freqüêcia ou da desidade de freqüêcia. A assimetria é uma medida da falta de simetria da distribuição. A curtose idica o grau de achatameto de uma desidade de freqüêcia em relação à distribuição ormal citada o item aterior. Nos gráficos acima, o primeiro tem coeficiete de assimetria e coeficiete de curtose iguais a zero (pois trata-se de uma distribuição ormal). No outro gráfico, tato o coeficiete de assimetria como o de curtose são grades. Para um cojuto de valores x i, com i=,,...,, o coeficiete de assimetria é defiido por ( )( ) xi x ( ) s ode s = dp(x) é o desvio padrão do cojuto x i cosiderado como amostra. O coeficiete de curtose é dado por ( + ) [ ( )( )( 3) xi x 4 3( ) ( ) ] s ( )( 3) 9

9. USANDO O EXCEL Fuções: MÉDIA(matriz) MED(matriz) MODO(matriz) DESVQ(matriz) DESVPAD(matriz) VAR(matriz) CURT(matriz) DISTORÇÃO(matriz) Média de um cojuto de dados Mediaa Moda Soma de quadrados dos desvios em relação à média Desvio padrão amostral Variâcia de uma amostra Coeficiete de curtose Coeficiete de assimetria Observação: as fuções a seguir se referem a população e usam em vez de - o deomiador. VARP(matriz) DESVPADP(matriz) Variâcia de uma população Desvio padrão populacioal Ferrametas de aálise ESTATÍSTICA DESCRITIVA Forece iformações sobre a tedêcia cetral e dispersão dos dados PROBLEMAS: Todas as questões a seguir se referem aos dados da tabela do exemplo (cosiderados como amostra). 4) Determie as medidas de tedêcia cetral e de dispersão para a variável de irmãos. Use as fuções apropriadas. 5) Repita o problema aterior para a variável peso. 6) Use a ferrameta ESTATÍSTICA DESCRITIVA para resolver os problemas 4) e 5) PROBLEMAS ADICIONAIS: 7) Acioe a ajuda do Excel para cohecer as fuções ALEATÓRIO e ALEATÓRIOENTRE. Use essas fuções para sortear aluos da tabela do exemplo. Determie a média, variâcia e desvio padrão das idades dos aluos sorteados. Obteha ajuda sobre a fução PROCV e verifique como usá-la para copiar as idades dos aluos sorteados. PROBLEMAS PROPOSTOS PP) Complete o problema proposto com as medidas expostas aqui. Como ficam as coclusões ateriores? PP3) Procure a literatura um cojuto de dados (mais de 3) de uma variável e faça um estudo usado os procedimetos da Estatística Descritiva. Escreva um pequeo relatório cotedo: a) Do que se trata o cojuto de dados b) de ode foi tirado c) Coloque os resultados em tabelas e gráficos de acordo com as ormas da ABNT (cosulte a Biblioteca) d) tire coclusões.

COMPLEMENTOS. TEOREMA DE CHEBYSHEV (aplicação do desvio padrão) Dado um úmero k, maior do que, etão pelo meos (-/k ) dos valores de uma amostra ou população pertecerão ao itervalo de k desvios padrão ates e k desvios padrão além da média. Este itervalo tem extremos ( m k dp) e ( m + k dp). Exemplo : Para as alturas da tabela do exemplo, obteve-se o exemplos 7 e 9, a média,73 e o desvio padrão,7, respectivamete. Seja o itervalo,73 ± k.,7 Pelo teorema de Chebyshev tem-se: Se k=, pelo meos -/4 = 3/4 (75%) dos valores estão o itervalo,73±(,7) (isto é, etre,59 m e,87 m). Na realidade, este itervalo cotém 93,3% das alturas, como pode ser verificado pela tabela do exemplo. Se k=3, pelo meos -/9 = 8/9 (88,9%) das alturas estão o itervalo,73±3(,7) (isto é, etre,5 e,94). Na realidade este itervalo cotém % das alturas.. MEDIDAS DE ORDENAMENTO A mediaa é uma medida de ordem tal que metade das observações são meores que ela. Existem outras medidas de ordeameto que podem ser úteis. Para cada uma dessas medidas, uma proporção p das observações é meor do que ela. Por exemplo, os quartis dividem uma série de dados em quatro partes. Para cada p, etre e, é determiado um percetil. Exemplo : Seja a série de valores: 45; 33; 4; 36; 3; 49; 37; 3; 48; 38; 43 Série ordeada 3 3 33 36 37 38 4 43 45 48 49 ordem 3 4 5 6 7 8 9 ordem porcetual,,,,3,4,5,6,7,8,9, Tomado, por exemplo, o 43, 7% dos valores da série são meores que ele e 3% maiores. O percetil de p=,7 (ou 7%) é 43. Os quartis são : quartil (ou percetil de,5) = 34,5 (5% dos valores são meores do que 34,5) quartil (ou mediaa) = 38 (5% dos valores são meores do que 38) 3 quartil (ou percetil de,75) = 44 (75% dos valores são meores do que 44) Fuções ORDEM( ; matriz; ordem*) ORDEM.PORCENTUAL(matriz; ; decimais**) PERCENTIL(matriz; p) QUARTIL(matriz; quartil) Posição de um em uma matriz de dados Posição percetual de um *vazio ou zero = ordem decrescete, outro = ordem crescete ** de casas decimais. Vazio = 3 casas decimais o percetil em matriz de dados correspodete a p (<p<) Quartil de uma matriz de dados: = %, =75%; =5%; 3=5%; 4=%. Ferrameta de aálise ORDEM E PERCENTIL Tabela que cotém a ordem percetual e ordial de cada valor de um itervalo de dados

Exemplo : Aplicado a ferrameta ORDEM E PERCENTIL ao cojuto de dados do exemplo, sem classificá-los, obtém-se Poto* Dados Ordem Porcetagem 6 49 9 48 9 45 3 8 43 4 7 3 4 5 6 38 6 5 7 37 7 4 4 36 8 3 33 9 5 3 8 3 * Poto idica a posição de cada elemeto da série iicial. PROBLEMAS: 8) Forme uma série de valores com algus úmeros repetidos e verifique como ficam as ordes. 9) Determie os quartis para as alturas da tabela do exemplo. Iterprete o resultado.

II. DISTRIBUIÇÃO DE PROBABILIDADE. PROBABILIDADE Chama-se experimeto aleatório o experimeto cujo resultado ão pode ser previsto. Em outras palavras, um experimeto é aleatório se, quado executado diversas vezes, produz resultados diferetes. Etretato, pode-se descrever todos os resultados possíveis de um experimeto aleatório. A oção de probabilidade está ligada diretamete a esse tipo de experimeto. Exemplo : Seja o laçameto de uma moeda três vezes. Represetado por o aparecimeto de coroa e por o aparecimeto de cara, os resultados possíveis deste experimeto são: (; ; ), (; ; ), (; ; ), (; ; ), (; ; ), (; ; ), (; ; ) e (; ; ) O cojuto de todos esses resultados forma o espaço amostral e cada um dos 8 resultados é um poto amostral. Qualquer cojuto de potos amostrais é um eveto. Se o espaço amostral é fiito, a probabilidade de ocorrer qualquer poto amostral é um úmero etre e, de modo que a soma das probabilidades de todos os potos amostrais que compõem o espaço amostral seja igual a. Um eveto é qualquer cojuto de potos amostrais. A probabilidade de ocorrer um eveto é a soma das probabilidades de seus potos amostrais. O eveto sem potos amostrais tem probabilidade zero e o eveto com todos os potos amostrais (o próprio espaço amostral) tem probabilidade. Exemplo : Quado uma moeda é laçada parece razoável atribuir probabilidade igual a,5, tato de sair cara como de sair coroa. Assim, a execução do experimeto: laçar uma moeda três vezes, cada poto amostral também deve ter a mesma probabilidade de ocorrêcia. Para ilustrar, tem-se: a) O poto amostral: coroa o laçameto, cara o e cara o 3, isto é, o poto (; ; ), tem probabilidade igual a /8 =,5 (ou,5%) de ocorrer. b) O eveto: exatamete duas caras, isto é, um poto do cojuto (; ; ), (; ; ), (; ; ), tem probabilidade igual a 3/8 =,375 (37,5%) de ocorrer. c) O eveto meos de duas caras, isto é, um poto do cojuto (; ; ), (; ; ), (; ; ), (; ; ) tem probabilidade igual a 4/8=,5 (5%) Exemplo 3: Laçado-se uma moeda um úmero grade de vezes, deverá aparecer cara em metade dos laçametos e coroa o restate. A freqüêcia relativa de caras se aproxima de,5 coforme é aumetado o úmero de laçametos da moeda (Ver Problema ). Portato, a freqüêcia relativa de um poto amostral pode ser tomada, aproximadamete, como sua a probabilidade. Se dois evetos, de um mesmo espaço amostral, ão têm potos em comum, a probabilidade de ocorrer um ou o outro é a soma de suas probabilidades. Se a probabilidade do primeiro ão depede da probabilidade do segudo e vice-versa, a probabilidade desses dois evetos ocorrerem simultaeamete é o produto de suas probabilidades idividuais. Exemplo 4: No laçameto de um dado, a probabilidade de sair ou 5 é /6+/6=/3=,3333. No laçameto de dois dados, a probabilidade de sair e 5 é /6./6=/36=,78. 3

. VARIÁVEL ALEATÓRIA DISCRETA Variável aleatória discreta é uma variável cujos valores x ; x ; x 3 ;...; x ocorrem respectivamete com probabilidades p(x ); p(x ); p(x 3 );...; p(x ) de modo que a soma dessas probabilidades seja igual a. Uma variável aleatória discreta segue uma distribuição de probabilidades, dada por uma fórmula, tabela ou gráfico, que correspode a uma distribuição de freqüêcias relativas teórica. Exemplo 5: No experimeto do exemplo, a variável x = de caras o laçameto da moeda três vezes é uma variável aleatória discreta. Pode assumir os valores ; ; ou 3, com probabilidade respectivamete iguais a p()=/8; p()=3/8; p()=3/8 e p(3)=/8. Essa distribuição pode ser dada por 3! Fórmula: (x=,,,3) p(x) = 8 ( 3 x)!x! Tabela: x 3 p(x) /8 3/8 3/8 /8 Gráfico --> probabilidade 3/8 /4 /8 3 No. de caras Uma distribuição de probabilidade tem média e desvio padrão represetados pelas letras gregas µ e σ, respectivamete. A variâcia é represetada por σ. A média e a variâcia da distribuição de probabilidade de uma variável x podem ser idicadas também por E(x) e V(x), respectivamete. Defiem-se µ i = E(x) = x p(x i i ) σ = V(x) = i (x i µ ) p(x i ) Observa-se que, se as probabilidades p(x i ) forem todas iguais, essas fórmulas são semelhates as de distribuição de freqüêcias. Na verdade, como visto o exemplo 3, uma distribuição de probabilidades pode ser costruída aproximadamete por uma distribuição de freqüêcia. Exemplo 6: Para a variável do exemplo 5, a média, a variâcia e o desvio padrão são: 3 3 3 µ =. +. +. + 3. = = 5, 8 8 8 8 3 3 3 3 3 3 3 σ = ( ) + ( ) + ( ) + ( 3 ) = =, 75 8 8 8 8 4 σ =, 75 = 866, 3. DISTRIBUIÇÃO DE BERNOULLI Uma variável aleatória discreta tem distribuição de Beroulli quado ela represeta um experimeto cujo resultado pode ser um sucesso (se ocorrer o eveto de iteresse) ou um isucesso (o eveto de iteresse ão ocorre). A probabilidade de sucesso é p e a probabilidade de isucesso é q=p-. Exemplo 7: No laçameto de uma moeda pode ocorrer cara (sucesso) ou coroa (isucesso). Portato, o experimeto de laçar uma moeda segue uma distribuição de Beroulli. 4

4. DISTRIBUIÇÃO BINOMIAL Uma variável aleatória tem distribuição biomial quado represeta a execução de vezes um experimeto de Beroulli, sedo cada execução idepedete da outra. Portato, uma variável aleatória com distribuição Biomial descreve um experimeto ode iteressa o úmero de sucessos em tetativas (ou provas) idepedetes, tedo cada prova apeas dois resultados possíveis; sucesso ou isucesso. Em cada tetativa a probabilidade de sucesso é p e de isucesso é q=-p. Se x é uma variável com distribuição Biomial, a probabilidade de x assumir um valor k é dada por k k p(x = k) = C p q,k A média da distribuição Biomial é µ = p e o desvio padrão é Exemplo 8. Seja x = de caras o laçameto de uma moeda 3 vezes do exemplo 5. Os valores de x são:,, e 3. Em cada laçameto a probabilidade de sucesso (cara) é p=,5 e de isucesso (coroa) é q=,5. Cada laçameto (tetativa) é idepedete do outro. Etão, a probabilidade de x assumir um valor k (k=,,,3) quado uma moeda é laçada 3 vezes é: k 3 k 3! p(k) = C3,k ( ) ( ) = C 3, k = 8 8(3 k)!k! que é a mesma fórmula usada o exemplo 5 e, portato, os resultados são os mesmos. Quado a distribuição é biomial tem-se uma fórmula simples para o cálculo da média e do desvio padrão. A média é µ = 3 (,5) =, 5 caras por execução do experimeto completo (laçameto da moeda 3 vezes) e o desvio padrão σ = 3 (,5) (,5) =,866 Esses resultados já foram obtidos o exemplo 5. Exemplo 9: Supodo que a moeda seja defeituosa, de tal forma que a probabilidade de sair cara em cada laçameto é,, a distribuição de probabilidade da variável x= de caras é σ = pq x 3 Probabilidade,5,384,96,8 p,6,4, 3 No. de caras 5. DISTRIBUIÇÃO DE POISSON A distribuição de Poisso é uma caso particular da distribuição biomial, quado é difícil ou sem setido calcular o úmero de isucessos ou o úmero total de tetativas (p é pequeo e muito grade). A média é, λ = p que também é igual a variâcia. A probabilidade da variável x com distribuição de Poisso assumir o valor k é k λ λ p(x = k) = e k! ode e é o úmero irracioal,788... 5

Exemplo : Seja um telefoe que recebe em média duas chamadas por hora. Etão: a) a probabilidade deste telefoe ão receber ehuma chamada em uma hora é p(x = ) = e = e =,353 (λ=)! b) a probabilidade de receber o máximo chamadas em 3 miutos é p(x ) = p(x = ) + p(x = ) + p(x = ) = e + e! + e!! =,997 ( λ = ) 6. USANDO O EXCEL Fuções DISTRBINOM(x; ; p; acumulada) POISSON(x, média; acumulada) Ambas forecem a probabilidade exata p(=x) se acumulada = FALSO e a probabilidade acumulada p( x) se acumulada=verdadeiro PROBLEMAS: ) Utilizado as fuções ALEATÓRIO ou ALEATÓRIOENTRE simule o laçameto de uma moeda 5,,, 5 e vezes. Determie a freqüêcia relativa de caras. Compare as freqüêcias relativa de caras obtidas com os valores teóricos (probabilidades). ) Cosidere o experimeto de laçar uma moeda 3 vezes e observar o úmero de caras. Repita este experimeto vezes. Costrua a distribuição de freqüêcia do de caras, calcule a média e desvio padrão. Compare os resultados com os valores teóricos. 3) Cosidere o laçameto de uma moeda perfeita 3 vezes. Costrua a distribuição de probabilidade e o gráfico da variável de caras os 3 laçametos. Determie a média, variâcia e desvio padrão. Que porcetagem dos valores estão o itervalo de desvios padrão em toro da média. Compare com o valor dado pelo teorema de Chebyshev. 4) Um casal pretede ter 5 filhos e acredita que a probabilidade de ter um filho homem é,55. Nessas codições, qual a probabilidade dos 3 filhos do casal serem: a) 3 homes e mulheres? b) pelo meos uma mulher c) mais de dois homes? 5) a) Cosidere aida a probalidade de um filho homem igual a,55. Escolhedo-se ao acaso casais em uma cidade com 5 filhos, quatos deverão ter exatamete 3 filhos homes? b) Qual a média de filhos homes de casais desta cidade? 6) Um recipiete cotém 5 bactérias. A probabilidade de que uma bactéria escape do recipiete é,8. Qual a probabilidade de que mais de 6 bactérias escapem? 7) Estude o Excel as fuções DIN.BIN.NEG e DIST.HIPERGEOM. Dê exemplos. 6

7. VARIÁVEL ALEATÓRIA CONTÍNUA Variável aleatória cotíua é uma variável cujos itervalos de valores ocorrem com uma certa probabilidade. Uma variável aleatória cotíua possui uma distribuição de probabilidade que é dada por uma fução desidade de probabilidade f(x) ou seu gráfico. 8. DISTRIBUIÇÃO NORMAL (ou de GAUSS) Uma variável aleatória x tem distribuição ormal se a sua fução desidade de probabilidade é f(x) = e σ π ode µ é a média e σ o desvio padrão. (x µ ) / σ 34,% 34,% µ-3σ 3,6%,% µ σ 3,6%,% µ+3σ O gráfico de uma distribuição ormal tem a forma de sio e a área total abaixo da curva é igual a. Qualquer fração da área total represeta a probabilidade da variável x assumir um valor etre os extremos que defiem esta área. Na figura, a probabilidade de um valor de x estar etre um desvio padrão ates da média e um desvio padrão depois é,34+,34=,68. Em outras palavras, 68,% dos valores de x estão etre µ-σ e µ+σ. Exemplo 8: Quato por ceto dos valores de x estão etre dois desvios padrão ates da média e dois desvios padrão depois? E etre três desvios padrão? Observado-se o gráfico aterior pode-se respoder facilmete às questões propostas: Estão etre desvios padrão em toro da média (34,+3,6)=95,4% dos valores. Etre 3 desvios padrão em toro da média tem-se (34,+3,6+,)=99,6% Exemplo 9: Cosiderado que a distribuição ormal é simétrica em toro da média, praticamete % dos valores se localizam etre 3 desvios padrão ates da média e três desvios padrão depois da média e quato maior o desvio padrão mais espalhados estão os valores em toro da média, esboce em um mesmo sistema de coordeadas os gráficos de três distribuições ormais, todas de média, e desvios padrão,5;, e,5. Exemplo : Supoha que uma população de estudates teha altura média,6 m e desvio padrão,8 m. Iterprete a variação das alturas desta população. 7

Uma variável z de distribuição ormal de média e desvio padrão é chamada distribuição ormal padrão. Toda variável x com distribuição ormal de média µ e variâcia σ µ pode ser trasformada para uma variável ormal padrão z, defiida por z = x σ Existem tabelas que forecem áreas da distribuição ormal padrão correspodetes a diversos valores de z. Uma delas, dada o apêdice, dá áreas da ormal padrão acumulada. Exemplo No exemplo, a) qual a probabilidade de uma pessoa escolhida ao acaso da população ter altura meor que,74 m? b) Quato por ceto das pessoas da população têm altura meor do que,74 m? c) Quato por ceto têm alturas etre,58 e,66 m? Em que itervalo simétrico em toro da média estão 86% das alturas? 9. USANDO O EXCEL Fuções DIST.NORM(x; µ; σ; acumulada) INVNORM(p; µ; σ) DIST.NORMP(z) INVNORMP(p) Probabilidade acumulada F(<x) se acumulada =VERDADEIRO e Fução desidade f(x) se acumulada=falso Iversa da ormal: dá x tal que a área até ele é p Normal padrão acumulada: da área até z Iversa da ormal padrão: dá z para área p PROBLEMAS: 8) Se z é uma variável com distribuição ormal padrão, calcule a probabilidade de z assumir um valor a) meor do que,6 b) maior do que,6 c) maior do que - d) etre -,8 e,78 e) etre -,96 e,96 9) Se x tem distribuição ormal de média µ= e σ=, calcule a probabilidade de x assumir um valor a) meor do que,5 b) maior do que 6,5 c) etre 6,5 e,5 ) Resolva o problema 8 usado a distribuição ormal padrão ) Os gráficos da figura são de uma variável x com distribuição ormal de média 3 e desvio padrão 5. Calcule os valores de x. 9% % 47,5% 47,5% µ x µ x -x µ x 8

) A figura abaixo represeta uma distribuição ormal padrão. Calcule o valor de x 5% 5% -x µ x 3) Uma variável x tem distribuição ormal de média,6 e desvio padrão,4. Em que itervalo simétrico em toro da média se ecotram 95% dos valores de x? e 99%? 4) Simule valores das distribuições cotíuas costates da ferrameta de aálise GERAÇÃO DE NÚMEROS ALEATÓRIOS. PROBLEMA PROPOSTO PP4) Supoha que a taxa de glicose o sague das pessoas ormais teha distribuição ormal de média 9 mg/dl e desvio padrão 9 mg/dl. a) Quado uma pessoa poderia ser cosiderada com glicemia fora dos padrões ormais? b) Em geral, são aceitos como referêcia para uma pessoa sã os limites 7 e mg/dl. Que área da distribuição ormal acima é abragida por esses limites? c) Aida cosiderado essa distribuição ormal, 9% das pessoas deveriam ter a taxa de glicose em que itervalo simétrico em toro da média? d) Simule valores desta distribuição, costrua uma distribuição de freqüêcia e, a partir desta, respoda as questões a) b) e c). 9

III. DISTRIBUIÇÃO AMOSTRAL. AMOSTRAGEM ALEATÓRIA Dada uma população, à qual está associada uma variável de iteresse, pretede-se retirar uma amostra de elemetos e, a partir desta amostra, estimar valores populacioais descohecidos, tais como a média, proporção, desvio padrão, etc. Um modo simples de amostragem é a retirada da amostra de tal forma que, durate o processo de seleção, cada elemeto da população teha igual probabilidade de ser escolhido. Seja uma população de média µ e variâcia σ. Para uma amostra com valores x, x,..., x, a média e a variâcia serão idicadas respectivamete por x e s, de modo a distiguir dos valores populacioais µ e σ. A média e a variâcia da amostra são defiidas por: x = x i e s = (x i x). Esses valores baseados a amostra são chamados de estatísticas. Ates de cosiderar uma amostra idividual, tomar-se-á para estudo todas as diferetes amostras de tamaho que podem ser obtidas da população. Neste curso, quado a população for fiita, a amostragem será com reposição. Para populações ifiitas, ou muito grades, ão importa se a amostragem é com ou sem reposição.. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA A média amostral é uma variável aleatória e possui uma distribuição de probabilidades chamada distribuição amostral da média. O mesmo acotece para variâcia, desvio padrão, etc Exemplo : Uma caixa possui a mesma quatidade de bolas com o úmeros,, 3, 4 e 5. Seja a variável x = da bola e todos os modos possíveis de serem retiradas duas bolas desta caixa (isto é, amostras de tamaho =), com reposição da primeira. Amostras = Média amostral População (variável x): (; ; 3; 4; 5) ( ; ) ( ; ) 5 Distribuição de probabilidades ( ; 3) x 3 4 5 média µ =3 ( ; 4) 5 prob,,,,, variâcia σ = ( ; 5) 3 ( ; ) 5 ( ; ) ( ; 3) 5 ( ; 4) 3 ( ; 5) 35 (3 ; ), 3 4 5 (3 ; ) 5 Distribuição amostral de médias (=) (3 ; 3) 3 x = média amostral (3 ; 4) 35 (3 ; 5) 4 x 5 5 3 35 4 45 5 (4 ; ) 5 prob,4,8,,6,,6,,8,4 (4 ; ) 3

(4 ; 3) 35 média = µ ( x) = µ = 3 (4 ; 4) 4 σ (4 ; 5) 45 variâcia = σ (x) = = = (5 ; ) 3 (5 ; ) 35 σ (5 ; 3) 4 desvio padrão = σ( x) = = (5 ; 4) 45 (5 ; 5) 5 gráfico da distribuição de médias Média 3 Variâcia, 5 5 3 35 4 45 5 Exemplo : Na população do exemplo, qual a probabilidade de uma amostra de tamaho ter média meor ou igual a 4? E etre 5 e 4, iclusivos? (R:,88 e,44) TEOREMA DO LIMITE CENTRAL Para amostras aleatórias relativas a uma variável x associada a uma população com média µ e variâcia σ, a distribuição amostral da média x de amostras de tamaho tem média µ e variâcia σ /. Se x é ormal, etão x também é ormal. Mesmo que x ão seja ormal, x se aproxima da ormal a partir de determiados tamahos da amostra (>3). σ O desvio padrão é chamado erro padrão da média. Exemplo 3: Na população do exemplo, qual a probabilidade de uma amostra de tamaho 64 ter média meor ou igual a 4? E etre 5 e 4? (Resp.:,977 e,886) 3. DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO (ou freqüêcia relativa) Exemplo 4: Uma caixa cotém /3 de bolas amarelas e /3 de bolas bracas (população). Duas bolas são retiradas, uma a uma com reposição da primeira (amostras de tamaho ), e é observada a proporção (ou frequêcia relativa) de bolas bracas. Amostras = Proporção amostral população: variável x tal que: x= a bola é braca x= a bola ão é braca (A ; A) p= proporção de bolas bracas = /3 (A ; B ),5 x média = µ(x) = p =/3 =,6667 (A ; B ),5 prob -p p variâcia = σ =p(-p) =/9=, (B ; A),5 (B ; B ) Distribuição amostral de proporções (=) (B ; B ) pˆ = proporção de bolas bracas a amostra (=) (B ; A),5 (B ; B ) pˆ,5 média = µ( pˆ ) = p = /3 (B ; B ) prob /9 4/9 4/9 variâcia = σ ( pˆ ) média /3 = p(-p)/ =/9 variâcia /9 =,

PROPRIEDADE Se >3 a distribuição amostral de pˆ se aproxima de uma distribuição ormal de média µ = p e variâcia σ = p(-p)/. Exemplo 5: No exemplo aterior, retirado-se bolas da caixa, com reposição de cada bola, qual a probabilidade da proporção de bolas bracas ser meor do que 6%? (R:,8) 4. USANDO O EXCEL PROBLEMAS: ) Uma caixa cotém bolas umeradas 6 e 9, a mesma proporção. Forme a distribuição amostral de médias de amostras aleatórias de tamaho 3. Calcule a média e a variâcia da distribuição. ) Qual a probabilidade da média de uma amostra de tamaho retirada da população do problema aterior estar etre 6,5 e 7,8? 3) (Amostragem ormal) Com a ferrameta GERAÇÃO DE NÚMERO ALEATÓRIO obter alturas de uma distribuição ormal de média,6 m e desvio padrão,8 m. Forme a distribuição de freqüêcia, calcule a média e o desvio padrão. 4) Cosidere as alturas do problema 3 como sedo uma população. Com a ferrameta AMOSTRAGEM, sorteie amostras de tamahos 5,, 3 e. Calcule a média e desvio padrão de cada amostra. 5) Cosiderado o problema, forme a distribuição amostral de variâcias. Calcule a média dessa distribuição amostral. Observe que a média das variâcias amostrais é igual a variâcia populacioal. Isso justifica a divisão por (-) em lugar de () o cálculo da variâcia da amostra. 6) Estude o Excel, com a Ferrameta de Aálise AMOSTRAGEM, como fucioa o método de amostragem periódico.

IV. ESTIMAÇÃO DE PARÂMETROS. INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL m caso: A variâcia populacioal s é cohecida Seja x uma variável aleatória de média µ (descohecida) e desvio padrão σ (cohecido). Do capítulo aterior tem-se que a distribuição amostral de médias x de amostras de tamaho, quado x é ormal ou é suficietemete grade, σ também é ormal de média µ e desvio padrão. Na figura é apresetado um itervalo simétrico em toro da média µ, de extremos µ e e µ + e, de tal modo que a probabilidade de x estar este itervalo é α, isto é, -α P( µ e x µ + e ) = α Pela distribuição ormal padrão calcula-se e ( µ + e σ ) µ = z, portato σ = z. e α / Figura. Itervalo de probabilidade (-α) para a média -z α / µ-e µ µ+e z _ x z Assim σ σ (x z µ x + z ) = α e fica defiido um itervalo de extremos P x ± z σ que poderá coter ou ão a média populacioal µ. Como esta é um parâmetro e ão uma variável aleatória, ão tem setido dizer que "a probabilidade µ cair o itervalo é -α", por isso diz-se que os extremos acima defiem um itervalo de cofiaça para a média µ. A iterpretação será reforçada o exemplo a seguir. Exemplo : Sabe-se que uma variável x =altura de aluos tem desvio padrão σ =,9m. Se em uma amostra de 36 aluos foi ecotrada a média x =,7 m, qual o itervalo de 95% de cofiaça para a média µ de x? E o itervalo de 9%? (com uma amostra grade como esta ão é ecessário cohecer o desvio padrão populacioal, pode ser usado o desvio padrão amostral s) Se -α=,95 α=,5, etão z =,96 (ver tabela o apêdice) e um itervalo de,9 95% de cofiaça para µ tem extremos,7 ±,96 =,7 ±, 9, ou seja 36,67<m<,79 Isso sigifica que 95% dos itervalos costruídos com amostras de tamaho =36, retiradas ao acaso desta população coterão a média µ. Se α=, obtém-se um itervalo de 9% de cofiaça,675<m<,75 3

caso: A variâcia populacioal s é descohecida Neste caso, ão se cohece a variâcia populacioal σ. Se a amostra é suficietemete grade, toma-se o desvio padrão da amostra como um valor aproximado do desvio padrão populacioal. Etão, emprega-se a metodologia aterior com s em lugar de σ. Etretato, se a amostra é pequea, desde que a distribuição da população seja ormal, usa-se a distribuição t de Studet. O itervalo terá extremos defiidos por x ± t s ode t é obtido da distribuição de t com - graus de liberdade (ver Tabela aexa). Observação: Equato z depede apeas de x, t depede de x e s. A distribuição de t é simétrica em toro da média t= e tem a forma de sio. Ela se aproxima da ormal coforme cresce. Exemplo : A croometragem de certa operação foreceu os seguites valores para =6 determiações: 4; 5; 5; 6; 8 e 8 (em miutos). Supodo a croometragem uma variável com distribuição aproximadamete ormal, calcule itervalos de 95% e 99% de cofiaça para a média populacioal µ.. Normal(;) t (5 gl) -5-4 -3 - - 3 4 5 (R: média x = 6, variâcia s s,8 =,8 e erro padrão = =, 683, com 5 G.L. 6 Se α=,5 t =,4469 e 4,3<m<7,7 α=, t =4,3 e 3,<m<8,8). INTERVALO DE CONFIANÇA PARA A PROPORÇÃO Para estimar a proporção ρ de elemetos da população com uma certa característica usa-se a proporção pˆ com que essa característica foi observada em uma amostra. Desde que a amostra seja grade, pode-se tomar a distribuição ormal como aproximação para a biomial. Um itervalo de cofiaça aproximado para p, ao ível de cofiaça -α, é dado por pˆ ± z pˆ( pˆ) Exemplo 3: Retirado-se uma amostra de ites da produção de uma máquia, verificou-se que eram defeituosas. Ecotre um itervalo de 95% de cofiaça para a proporção p de peças defeituosas dessa máquia. (R: etre 4% e 6%) 4

3. INTERVALO DE CONFIANÇA PARA A VARIÂNCIA Seja uma população ormal de média µ e variâcia σ. Cosiderado-se as amostras de tamaho, com variâcia s ( )s, desta população, prova-se que a estatística χ = tem σ distribuição de qui-quadrado ( χ ) com - graus de liberdade Um itervalo de cofiaça para σ, com base em uma amostra de tamaho e variâcia s, ao ível cofiaça -α, é dado por ( )s χ SUP σ ( )s χ INF INF SUP ode χ e χ probabilidade -α. defiem a limites da distribuição de qui-quadrado correspodetes à Exemplo 3: Determie um itervalo de 95% de cofiaça para variâcia populacioal da variável croometragem do exemplo. a/=,5 -a=,95 c com 5 g.l. a/=,5 5 5 c INF =,83 c SUP =,83 (R: s 5(,8) 5(,8) =,8, =6 e σ ou,9<s <6,867 Tomado a raiz,83,83 quadrado dos elemetos dessa desigualdade determia-se um itervalo de cofiaça aproximado para o desvio padrão:,44<s <4,7) 4. TAMANHO DAS AMOSTRAS Pode-se estabelecer o tamaho de uma amostra para obter um itervalo de cofiaça com uma semi-amplitude e pré-fixada. Por exemplo, o caso da média σ = z e zσ = e Em geral, σ é descohecido e utiliza-se o desvio padrão de uma amostra piloto suficietemete grade. Exemplo 4: Em relação à variável altura do exemplo, qual o tamaho de uma amostra para se obter um itervalo de 95% de cofiaça com e (semi-amplitude) aproximadamete igual a cm? (R: 78) 5

5. INTERVALO DE CONFIANÇA PARA A DIFERENÇA ENTRE DUAS MÉDIAS de populações ormais. Sejam duas populações: População : variável x com distribuição ormal de média µ e variâcia σ. População : variável x com distribuição ormal de média µ e variâcia σ São retiradas aleatoriamete duas amostras de tamahos e, uma de cada população, cuja médias são x e x e cujas variâcias são s e s, respectivamete. Pretede-se estabelecer um itervalo de cofiaça para a difereça etre as médias populacioais, descohecidas, µ µ. Coforme o ível de cofiaça -α adotado, são usados valores z da distribuição ormal, quado as variâcias populacioais são cohecidas, e valores t da distribuição de t, quado se usa as variâcias das amostras ) As variâcias populacioais são cohecidas Suposição: as amostras são obtidas idepedetemete (x x ) ± z σ σ + ) As variâcias populacioais são descohecidas Suposições: as variâcias populacioais podem ser cosideradas iguais, isto é, σ =σ =σ e as amostras são obtidas idepedetemete ( x x ) ± t.s + ode s ( = )s + ( + )s OBS: Quado ão é possível assumir que σ =σ =σ, é calculado um itervalo de cofiaça aproximado ao ível de -α de cofiaça: s s ( x x ) ± t + ode t tem (s (s ) + + s (s + ) ) + graus de liberdade 7. USANDO O EXCEL Fuções DIST.NORM(x; µ; p; acumulada) INVNORM(α; µ; p) DIST.NORMP(z) INVNORMP(p) DIST.QUI(x; graus de liberdade) INV.QUI(p; graus de liberdade) Probabilidade acumulada se acumulada =VERDADEIRO e Fução desidade se acumulada=falso Iversa da ormal Normal padrão acumulada Iversa da ormal padrão Qui-quadrado Iversa da Qui-quadrado PROBLEMAS: ) Usado o Excel resolva os exemplos de a 4. ) Usado a ferrameta de aálise GERAÇÃO DE NÚMERO ALEATÓRIO obteha 6

valores de uma variável ormal de média 6 e desvio padrão,5. Faça de cota que os valores simulados são da variável: croometragem de certa operação (exemplo ). Tirado uma amostra de tamaho 6 desta população (ver problema 4, págia 9) determie itervalos de 9, 95 e 99% para a média 3) Em uma pesquisa de opiião sobre a trasformação de um jardim em estacioameto, foram cosultados aleatoriamete 5 habitates de uma cidade e 8 se motraram favoráveis. Ecotre os limites de cofiaça de 9% e 95% para a proporção da população favorável a costrução do estacioameto PROBLEMAS ADICIONAIS DE LIVROS TEXTO FONSECA, J.S.; MARTINS, G.A. Curso de Estatística. 3 ed. São Paulo: Ed. Atlas, 98. 4) Foram retiradas 5 peças da produção diária de uma máquia, ecotrado-se para uma certa medida uma média 5, mm. Sabedo-se que as medidas têm distribuição ormal com desvio padrão, mm, costruir itervalos de cofiaça para a média aos íveis de 9%, 95% e 99%. (R: 4,8 µ 5,59; 4,73 µ 5,67; 4,58 µ 5,8) 5) Em uma fábrica, colhida uma amostra de certa peça, obtiveram-se as seguites medidas para os diâmetros: ; ; ; ; ; ; ; ; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 5; 5; 5; 6; 6. a) Estimar a média e variâcia b) Costruir um itervalo de cofiaça para a média ao ível de 5% de sigificâcia (R: a) x = 3, 3 ; s =, 5 b),6 µ 3,66) 6) Uma amostra de 3 habitates de uma cidade mostrou que 8 desejavam a água fluorada. Ecotrar os limites de cofiaça de 9% e 96% para a proporção da população favorável a fluoração. (R:,55 p,65 ;,54 p,66) 7) Uma amostra de tamaho 36 foi extraída de uma população ormal de média µ e variâcia σ = 9, dado média x = 7. Uma outra amostra de tamaho 5 foi extraída de outra população ormal de variâcia 6, dado x = 6. Determiar o itervalo para µ µ ao ível de 96%. (R: 8,7 µ µ,93) 8) Supodo populações ormais, costruir o itervalo de cofiaça para a variâcia ao ível de 9% para as amostras: a) 44,9; 44,; 43,; 4,9; 43,; 44,5 b) ; ; ; 3; 3; 5; 5; 5; 5; 6; 6; 7; 7; 8. (R: a),3 σ 3,3 b),5 σ 8,3) BUSSAB, O.B., MORETTIN, P.A. Estatística básica. São Paulo: Ed. Atual. 987. 9) Um pesquisador está estudado a resistêcia de um determiado material sob determiadas codições. Ele sabe que essa variável é ormalmete distribuída com desvio padrão de uidades. a) Utilizado os valores 4,9; 7,; 8,; 4,5; 5,6; 6,8; 7,; 5,7; 6, uidades, obtidos de uma amostra de tamaho 9, determie o itervalo de cofiaça para a resistêcia média com um coeficiete de cofiaça,9. (R: 5,3<média< 7,3) b) Qual o tamaho da amostra ecessário para que o erro cometido, ao estimarmos a resistêcia média, ão seja superior a, uidades com probabilidade,9? (R: =8) c) Supoha que o item (a) ão fosse cohecido o desvio padrão. Como você procederia para determiar o itervalo de cofiaça? (R: 5,5<média< 6,94) ) Estão sedo estudados dois processos A e B para coservar alimetos, cuja pricipal 7

variável de iteresse é o tempo de duração dos mesmos. Nos dois processos o tempo segue uma distribuição ormal de variâcia é e médias, respectivamete, µ A e µ B. Sorteiam-se duas amostras idepedetes: a amostra de A, com 6 latas, apresetou tempo médio de duração igual a 5, e a de B, com 5 latas, duração média igual a 6. a) Costrua um itervalo de cofiaça para µ A e µ B separadamete (R: 5±4,9 e 6±3,9) b) Para verificar se os dois processos podem ter o mesmo desempeho, decidiu-se costruir um itervalo de cofiaça para a difereça µ A - µ B. Caso o zero perteça ao itervalo, podese cocluir que existe evidêcia de igualdade dos processos. Qual seria a sua resposta? (R: ±6,3, ão iclui o zero) ) Ates de uma eleição em que existiam cadidatos A e B, foi feita uma pesquisa com 4 eleitores escolhidos ao acaso e verificou-se que 8 deles pretediam votar o cadidato A. Costrua um itervalo de cofiaça, ao ível de 95%, para a porcetagem de eleitores favoráveis ao cadidato A a época das eleições. (R:,5±,49) COSTA NETO, P.L.O. Estatística. São Paulo: Ed. Edfgard Blucher, 977. ) Uma amostra extraída de uma população ormal foreceu os seguites valores: 3,; 3,; 3,4;,8; 3,;,9; 3,; 3,. Costrua itervalos de 95% de cofiaça para a a) variâcia da população (R:,9<média<3,3) b) média da população (R:,59<variâcia<,59) 3) Dadas duas amostras aleatórias de tamahos e, extraídas de duas populações ormais idepedetes, as quais foreceram, respectivamete, x =, x = 4, s = 5, e s = 3, 6; estabeleça um itervalo de 95% de cofiaça para a difereça etre as médias populacioais. (R: 4±3,9) 8

V. TESTE DE HIPÓTESES. INTRODUÇÃO Problema ilustrativo: um fabricate de fruta em coserva afirma que os pesos das latas com o seu produto têm média 6 g e desvio padrão 3 g. Suspeita-se, etretato, que o peso médio é meor do que o auciado. Pretede-se decidir se a suspeita sobre a média tem procedêcia ou ão, usado-se uma amostra aleatória, por exemplo, de 36 latas (por equato, o desvio padrão será cosiderado correto). Existem duas hipóteses quato a média µ da população de pesos: uma, chamada hipótese ula, H, de que µ = 6 g (ou µ 6 = ) e outra, mais ampla, chamada hipótese alterativa, H, de que µ < 6 g. Com base a média de uma amostra de aleatória de = 36 pesos de latas com fruta em coserva, será euciado um critério para decidir se H pode ser cotrariada ou ão. Portato, feita uma determiada hipótese sobre um parâmetro de uma população, pretede-se saber se os resultados de uma amostra de tamaho cotrariam ou ão tal afirmação. Seja a variável x=peso, com média µ=6g e desvio padrão σ=3g. A variável aleatória x, média de amostras de =36 pesos, terá distribuição aproximadamete ormal de média 3 6g e desvio padrão = 5 g. 36 Se a hipótese ula for verdadeira, o gráfico da figura represeta a distribuição amostral de médias de 36 pesos. Por exemplo, a probabilidade da média de uma amostra ser meor do que 59 g é: a=,5 59 6 P (x < 59) = P(z < ) = P(z < ) =,8,8 5 isto é, se o fabricate estiver certo,,8% das amostras µ de 36 latas possuem peso médio meor que 59 g. 585 59 595 6 65 6 65 Pode-se fixar uma probabilidade α e determiar 59,8 um valor x c de modo (.α)% das médias amostrais sejam meores do que ele, ou seja, tal que P(x < xc ) = α. Escolhedo α =,5 tem-se: xc 6 P(x < xc ) = P(z < ) =,5 5 Como P (z <,64) =, 5, etão, x c 6 =,64 5 x c = 59,8 g Portato, a probabilidade de uma média amostral de 36 pesos ser meor que 59,8g é,5. Desde que a hipótese ula seja verdadeira, apeas 5% das médias amostrais serão meores do que 59,8g. 575 58 585 m 59 595 59,8 6 65 6 65 Se a iformação do fabricate é icorreta, etão a média real é meor do que 6g e a probabilidade de uma média de 36 pesos ser meor do que 59,8g é superior a 5%. Por exemplo, supodo que a média correta seja 59g, a probabilidade de obter uma amostra de média meor do que 59,8 é 64,6% (ver figura) Coclusão: Se a média x de uma amostra de 36 pesos for meor que x c = 59, 8 g, tem-se uma das duas alterativas abaixo: a) O fabricate está certo, a média da população de pesos é µ=6 g e foi obtida uma amostra com tão pouca chace de ocorrer por puro acaso. b) O fabricate ão diz a verdade, pois obteve-se tal média amostral porque a probabilidade de sua acorrêcia ão era tão pequea, ou seja, a média da população é meor do que 6 g 9,646