9 - INFERÊNCIA ESTATÍSTICA Estimação de Parâmetros



Documentos relacionados
Capítulo 8 Estimativa do Intervalo de Confiança. Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc.

Intervalo de Confiança para uma Média Populacional

Cap. 5. Testes de Hipóteses

Vamos estudar o conceito de variabilidade absoluta considerando o conjunto de notas obtidas por cinco alunos:

Estimação por Intervalo (Intervalos de Confiança):

Estatística II Aula 3. Prof.: Patricia Maria Bortolon, D. Sc.

6.1 Estimativa de uma média populacional: grandes amostras. Definição: Um estimador é uma característica amostral (como a média amostral

Testes de Hipóteses

Cap. 4 - Estimação por Intervalo

O que é Estatística?

MEDIDAS E INCERTEZAS

Distribuições de Estatísticas Amostrais e Teorema Central do Limite

s =, sendo n= n Uma amostra de 60 indivíduos onde a massa corpórea, em kg, tiver média 42kg e um desvio padrão de 3,5 o Erro Padrão da Média será:

AMOSTRAGEM EM AUDITORIAS

n ) uma amostra aleatória da variável aleatória X.

Intervalos de Confiança

5n 3. 1 nsen(n + 327) e)

Métodos de Amostragem

Estatística. Estatística II - Administração. Prof. Dr. Marcelo Tavares. Distribuições de amostragem. Estatística Descritiva X Estatística Inferencial

IND 1115 Inferência Estatística Aula 13

Métodos Quantitativos Aplicados

Lista de Exercícios #6 Assunto: Propriedade dos Estimadores e Métodos de Estimação

AMOSTRAGEM. CENSO: Quando é investigada todas (sem exceção) as unidades de uma população.

Distribuições Amostrais

Sumário. 2 Índice Remissivo 17

Distribuições Amostrais

Teorema do limite central e es/mação da proporção populacional p

Obtemos, então, uma amostra aleatória de tamanho n de X, que representamos por X 1, X 2,..., X n.

Estimativa de Parâmetros

4. Inferência Estatística Estimadores Pontuais

UNICAMP ª Fase MATEMÁTICA BERNOULLI COLÉGIO E PRÉ-VESTIBULAR

Distribuições Amostrais

Estimadores de Momentos

( ) ( ) ( ) ( ) ( ) 3 - INTRODUÇÃO À RESOLUÇÃO DE SISTEMAS NÃO LINEARES. Introdução.

Curso Mentor. Radicais ( ) Definição. Expoente Fracionário. Extração da Raiz Quadrada. Por definição temos que:

AMOSTRAGEM ALEATÓRIA DISTRIBUIÇÕES POR AMOSTRAGEM

Análise de Projectos ESAPL / IPVC. Casos Particulares de VLA e TIR. Efeitos de Impostos, Inflação e Risco.

TESTE DE HIPÓTESES PARA PROPORÇÕES

ESTIMAÇÃO POR INTERVALO (INTERVALOS DE CONFIANÇA)

Sumário. 2 Índice Remissivo 19

Teoria da Estimação 1

e, respectivamente. Os valores tabelados para a distribuição t-student dependem do número de graus de liberdade ( n 1 e

ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL p

Estimar uma proporção p (desconhecida) de elementos em uma população, apresentando certa característica de interesse, a partir da informação

CAPÍTULO III ANÁLISE DOS DADOS. Para responder à primeira pergunta, observe os dois gráficos abaixo

Amostras Aleatórias e Distribuições Amostrais. Probabilidade e Estatística: afinal, qual é a diferença?

CAPÍTULO 6 - ESTIMAÇÃO E TESTES DE HIPÓTESES

Capítulo 4 Inferência Estatística

CAPÍTULO 6 ESTIMATIVA DE PARÂMETROS PPGEP. Introdução. Introdução. Estimativa de Parâmetros UFRGS

10 INFERÊNCIA ESTATÍSTICA Testes de Hipóteses Introdução Lógica dos Testes de Hipóteses

Objetivo Estimar uma proporção p (desconhecida) de elementos uma população, apresentando certa característica de interesse, partir

DESIGUALDADES, LEIS LIMITE E TEOREMA DO LIMITE CENTRAL. todas as repetições). Então, para todo o número positivo ξ, teremos:

Cap. VI Histogramas e Curvas de Distribuição

Objetivo. Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

1 Distribuições Amostrais

Universidade Federal de Mato Grosso Probabilidade e Estatística - Curso: Engenharia Civil Introdução à Inferência Estatística - Prof a Eveliny

1 Estimação de Parâmetros

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

binomial seria quase simétrica. Nestas condições será também melhor a aproximação pela distribuição normal.

INFERÊNCIA. Fazer inferência (ou inferir) = tirar conclusões

Comparação de testes paramétricos e não paramétricos aplicados em delineamentos experimentais

Departamento de Engenharia Civil Nivelação de Terrenos

Stela Adami Vayego DEST/UFPR

ESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

MATEMÁTICA II. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

MATEMÁTICA II. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Neste capítulo, vamos estender o conceito de adição, válido para um número finito de parcelas, à uma soma infinita de parcelas.

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Teoria da amostragem

Prof. Fabrício Maciel Gomes Departamento de Engenharia Química Escola de Engenharia de Lorena EEL

Capítulo 5- Introdução à Inferência estatística. (Versão: para o manual a partir de 2016/17)

Stela Adami Vayego DEST/UFPR

Capítulo 5- Introdução à Inferência estatística.

Aula 8 Intervalos de confiança para proporções amostras grandes

Instruções gerais sobre a Prova:

Testes de Hipóteses sobre uma Proporção Populacional

Objetivo. Estimar a média de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

ESTIMAÇÃO PARA A MÉDIA

ESTIMAÇÃO DE PARÂMETROS

10 - Medidas de Variabilidade ou de Dispersão

Estimação da média populacional

Capítulo. 2.Teoria das Probabilidades Definições Experiência aleatória

CONHECIMENTOS ESPECÍFICOS

8/8/2012. Administração Financeira e Orçamentária. Conteúdo. Conteúdo. Tema 3 O valor do dinheiro no tempo. Tema 4 Risco e Retorno

5 Teoria dos Valores Extremos

Uma amostra aleatória simples de n elementos é selecionada a partir da população. Calcula-se o valor da média a partir da amostra

1. Dados: Deve compreender-se a natureza dos dados que formam a base dos procedimentos

Desigualdades (por Iuri de Silvio ITA-T11)

Coeficiente de Rendimento. Universidade Iguaçu

11 Aplicações da Integral

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Estimação pontual e intervalar

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

Estimação de Parâmetros. 1. Introdução

ESTATÍSTICA- II DISTRIBUIÇÃO DE FREQUÊNCIA. 1- CONCEITO É a série estatística que tem o tempo, o espaço e a espécie como variáveis dependentes.

AULA 04 Estimativas e Tamanhos Amostrais

ESTATÍSTICA EXPLORATÓRIA

Probabilidade II Aula 12

Avaliação de Desempenho de Sistemas Discretos

Guia do Professor. Endireita essa coluna! Série Mundo da Matemática

Transcrição:

INE 7 - Iferêcia Estatística Estimação de Parâmetros 1 9 - INFERÊNCIA ESTATÍSTICA Estimação de Parâmetros 9.1 - Itrodução Estatística é a ciêcia que se ocupa de orgaizar, descrever, aalisar e iterpretar dados para que seja possível a tomada de decisões e/ou a validação cietífica de uma coclusão. Vamos rever algumas defiições dos Capítulos 6 e 7. Os dados são coletados para estudar uma ou mais características de uma POPULAÇÃO: cojuto de elemetos que tem pelo meos uma característica em comum => cojuto das medidas da(s) característica(s) de iteresse em todos os elemetos que a(s) apreseta(m). Uma população pode ser represetada através de um modelo probabilístico: este apreseta codições para uso, uma certa forma para a distribuição de probabilidades, e parâmetros. Os dados ecessários para a obteção do modelo podem ser obtidos através de um CENSO (pesquisa de toda a população), ou através de uma AMOSTRA (subcojuto fiito) da população. Por que usar uma AMOSTRA? - ecoomia; - rapidez; - para evitar a exaustão/extição da população. A AMOSTRA deve ser: represetativa da população, suficiete (para que o resultado teha cofiabilidade), e aleatória (retirada por sorteio ão viciado). A Iferêcia Estatística cosiste em fazer afirmações probabilísticas sobre as características do modelo probabilístico, que se supõe represetar uma população, a partir dos dados de uma amostra aleatória (probabilística) desta mesma população. Fazer uma afirmação probabilística sobre uma característica qualquer é associar à declaração feita uma probabilidade de que tal declaração esteja correta (e, portato, a probabilidade complemetar de que esteja errada). Quado se usa uma amostra da população SEMPRE haverá uma probabilidade de estar cometedo um erro (justamete por ser usada uma amostra): a difereça etre os métodos estatísticos e os outros reside o fato de que os métodos estatísticos permitem calcular essa probabilidade de erro. E para que isso seja possível a amostra da população precisa ser aleatória. As afirmações probabilísticas sobre o modelo da população podem ser basicamete: => estimar quais são os possíveis valores dos parâmetros (Estimação de Parâmetros): - qual é o valor da média de uma variável que segue uma distribuição ormal? - qual é o valor da proporção de um dos resultados possíveis de uma variável que segue uma distribuição biomial. => testar hipóteses sobre as características do modelo: parâmetros, forma da distribuição de probabilidades, etc. (Testes de Hipóteses). - o valor da média de uma variável que segue uma distribuição é maior do que um certo valor? - o modelo probabilístico da população é uma distribuição ormal? - o valor da média de uma variável que segue uma distribuição ormal em uma população é diferete da mesma média em outra população?

INE 7 - Iferêcia Estatística Estimação de Parâmetros 9.1.1- Amostragem Aleatória ou Probabilística Na amostragem aleatória todos os elemetos da população têm chace diferete de zero de pertecer à amostra, uma vez que a seleção dos elemetos é feita por sorteio ão viciado (ver detalhes o Capítulo 7). Amostragem Aleatória Simples => todos os elemetos da população têm a mesma chace de pertecer à amostra (escolha por sorteio ão viciado); => cada elemeto sorteado é reposto a população ates do próximo sorteio. Obviamete em sempre é viável a amostragem com reposição, se a amostragem for feita SEM REPOSIÇÃO os resultados serão praticamete iguais se o tamaho da amostra ão exceder a 5% do tamaho da população 1. Se a população ão for homogêea em relação à variável sob estudo, para garatir a represetatividade da amostra somos obrigados a selecioar elemetos de cada uma de suas subdivisões. 9.1. - Aálise Exploratória de Dados Uma vez tedo coletado os dados, seja através de ceso ou por amostragem, é preciso resumi-los e orgaizá-los de maeira a permitir uma primeira aálise, e posterior uso das iformações. As técicas estatísticas que se ocupam desses aspectos costituem a Aálise Exploratória de Dados. O cojuto de dados pode ser resumido (e apresetado) através das distribuições de freqüêcias, que relacioam os valores que a variável pode assumir com a freqüêcia (cotagem) com que foram ecotrados aquele cojuto. Esta distribuição pode ser apresetada a forma de uma tabela, ou através de um gráfico (estes dois métodos podem ser usados tato para variáveis qualitativas quato para variáveis qualitativas). Há uma terceira forma de resumir o cojuto de dados: as medidas de sítese ou estatísticas. As pricipais estatísticas são a média, o desvio padrão, a variâcia e a proporção. Serão apresetadas suas fórmulas básicas, e o que cada uma sigifica. Média: trata-se de uma estatística que caracteriza o cetro de massa do cojuto de dados (Valor Esperado); quado é a média populacioal recebe o símbolo ; quado é a média amostral recebe o símbolo x x i ; trata-se da média aritmética simples: x ode xi é o i-ésimo valor do cojuto e é o úmero de elemetos da amostra. Variâcia: trata-se de uma estatística que mede a dispersão em toro da média do cojuto (em toro do valor esperado), possuido uma uidade que é o quadrado da uidade da média (e dos valores do cojuto); quado é a variâcia populacioal recebe o símbolo ; quado é a variâcia amostral recebe o símbolo s (xi ) [( x i ) / ] ; s (usa-se - 1 o deomiador quado se 1 1 A reposição garate que as probabilidades de selecioar um determiado elemeto permaecem costates, uma vez que o espaço amostral permaece o mesmo. Quado o tamaho da amostra é meor ou igual a 5% do tamaho da população, mesmo que ão haja reposição supõe-se que as probabilidades ão se modificam substacialmete. Este item foi visto com grade profudidade o Capítulo.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 3 trata de uma amostra) 3. O desvio padrão é a raiz quadrada positiva da variâcia, tedo portato uma uidade que é igual à uidade da média, sedo muitas vezes preferida para efeito de mesuração da dispersão. Proporção: cosiste em calcular a razão etre o úmero de ocorrêcias do valor de iteresse de uma variável qualitativa e o úmero total de ocorrêcias registradas o cojuto (de todos os valores que a variável pode assumir); quado é uma proporção populacioal recebe o símbolo ; quado é uma proporção amostral recebe o símbolo p. Os valores das medidas de sítese, além de resumirem o cojuto de dados, costituem uma idicação dos prováveis valores dos parâmetros. Assim, em estudos baseados em amostras, é comum utilizar tais medidas de sítese como estatísticas que serão utilizadas para estimar os parâmetros do modelo probabilístico que descreve a população. 9. - Distribuição Amostral Os valores dos parâmetros do modelo populacioal calculados em uma amostra são chamados de estatísticas: Parâmetros (População) Estatísticas (Amostra) Média () x Variâcia ( ) s Desvio Padrão () s Proporção () p Número de elemetos (N) Seja uma população qualquer com um parâmetro de iteresse, correspodedo a uma estatística T em uma amostra. Amostras aleatórias são retiradas da população e para cada amostra calcula-se o valor t da estatística T. Os valores de t formam uma ova população que segue uma distribuição de probabilidades que é chamada de distribuição amostral de T. Seja a população abaixo, costituída pelos pesos em kg de oito pessoas adultas: População 64 67 Sortear 3 Amostras 7 57 {64, 67, 6} => Média = 63,67 kg 65 7 {64, 7, 7} => Média = 68,67 kg 7 6 {65, 7, 6} => Média = 65 kg = 65,6 kg Observe que há uma variação a estatística média, e esta variação precisa ser cosiderada quado são realizadas as iferêcias sobre os parâmetros. Figura 1 - Distribuição Amostral - Exemplo Assim sedo, o cohecimeto das distribuições amostrais das pricipais estatísticas é ecessário para fazer iferêcias sobre os parâmetros do modelo probabilístico da população. 3 Há uma razão matemática para isso: garatir que o valor amostral seja um estimador ão viciado do valor populacioal (maiores detalhes o item Estimação por Poto).

INE 7 - Iferêcia Estatística Estimação de Parâmetros 4 Por hora, basta cohecer as distribuições amostrais das estatísticas média de uma variável quatitativa qualquer, e proporção de um dos dois úicos resultados de uma variável qualitativa. Exemplo 9.1 4 - Supoha uma variável quatitativa cujos valores costituem uma população com os seguites valores: (, 3, 4, 5) Para esta população, que tem uma distribuição uiforme, podemos observar que os parâmetros são: = 3,5 = 1,5 (usou-se o deomiador por ser uma população) Se retirarmos todas as amostras aleatórias de elemetos (com reposição) possíveis desta população ( = ), teremos os seguites resultados 5 : (, ) (, 3) (, 4) (, 5) (3, ) (3, 3) (3, 4) (3, 5) (4,) (4, 3) (4, 4) (4, 5) (5, ) (5, 3) (5, 4) (5, 5) O cálculo das médias de todas as amostras acima resultará a matriz abaixo: X _ (,) (,5) (3,) (3,5) (,5) (3,) (3,5) (4,) (3,) (3,5) (4,) (4,5) (3,5) (4,) (4,5) (5,) Se estas médias forem plotadas em um gráfico de freqüêcias (um histograma): Figura - Histograma de médias amostrais Se forem calculados a média e a variâcia das médias de todas as amostras o resultado será: X _ 1,5 56/16 3, 5 V(x),65 Observe como a distribuição das médias amostrais da variável pode ser aproximada por uma distribuição ormal (ão obstate a distribuição da variável a população ão ser ormal), e que o 4 Elaborado pela professora Carme Dolores de Freitas de Lacerda. 5 Há 16 amostras possíveis.

Frequecy Frequecy INE 7 - Iferêcia Estatística Estimação de Parâmetros 5 valor esperado das médias amostrais (média das médias) é IGUAL ao valor da média populacioal da variável e a variâcia das médias amostrais é IGUAL ao valor da variâcia populacioal da variável dividida pelo tamaho da amostra 6. Quato maior o tamaho da amostra (quato maior ) mais o histograma acima aproximar-se-á de uma distribuição ormal, idepedetemete do formato da distribuição da variável a população. Vamos ver outro exemplo. Exemplo 9. - Na Figura 3 abaixo temos a distribuição populacioal de uma variável quatitativa qualquer de iteresse. Ela apreseta média populacioal () igual a 416,99, e variâcia populacioal ( ) igual a 89554,5164. Observe que a distribuição é ASSIMÉTRICA, ou seja, ão é ormal! Vamos imagiar que seja possível retirar várias amostras aleatórias 7 (com reposição) desta população, medir os 6 valores da variável e calcular a média da 5 variável em cada amostra. Posteriormete 4 costruiremos um histograma das médias das 3 amostras, e calcularemos a média das médias e a variâcia das médias. 1 4 6 8 1 1 14 16 18 Dados Figura 3 - Distribuição populacioal de uma variável quatitativa Vamos começar com 4 amostras aleatórias de elemetos cada 7. Veja a Figura 4. 1 5 5 75 Médias amostras = 1 Figura 4 - Distribuição amostral da média ( = ) A média das médias amostrais vale 43,8875, e a variâcia das médias amostrais vale 6758,98666. E, lembrado-se do exemplo aterior, podemos calcular o quociete variâcia populacioal pelo tamaho da amostra: / = 89554,5164/ = 44777,563. Observado o histograma vemos que a distribuição das médias, para amostras de elemetos, cotiua assimétrica, e o valor da média das médias amostrais (43,8875) ão está muito próximo da média populacioal (416,99), bem como a variâcia das médias amostrais (6758,98666), distate de / = 44777,563 Obviamete o tamaho da amostra utilizada ( elemetos) aida ão foi grade o bastate para levar aos resultados obtidos o Exemplo 9.1 (provavelmete porque a distribuição da população é assimétrica). Vamos agora ver os resultados obtidos para 4 amostras aleatórias de 4 elemetos cada. O histograma das médias está a Figura 5. 6 Voltaremos a aalisar o sigificado destes resultados quado estudarmos a Estimação por Poto. 7 A retirada das amostras foi efetuada através do pacote estatístico Miitab.

Frequecy Frequecy Frequecy 1 35 5 65 8 Médias amostras = 4 Figura 5 - Distribuição amostral da média ( = 4) INE 7 - Iferêcia Estatística Estimação de Parâmetros 6 A média das médias amostrais vale 444,5375, e a variâcia das médias amostrais vale 6464,369. E, lembrado-se do exemplo aterior, podemos calcular o quociete variâcia populacioal pelo tamaho da amostra: / = 89554,5164/4 = 388,6816. Observado o histograma vemos que a distribuição das médias, para amostras de 4 elemetos, cotiua assimétrica, e o valor da média das médias amostrais (444,5375) ão está muito próximo da média populacioal (416,99), mas a variâcia das médias amostrais (6464,369) aproxima-se mais de / = 388,6816. Novamete o tamaho da amostra utilizada (4 elemetos) aida ão foi grade o bastate para levar aos resultados obtidos o Exemplo 9.1 Vamos agora ver os resultados obtidos para 4 amostras aleatórias de 16 elemetos cada. O histograma das médias está a Figura 6. 1 5 6 3 38 44 Médias amostras =16 Figura 6 - Distribuição amostral da média ( = 16) 5 A média das médias amostrais vale 394,49, e a variâcia das médias amostrais vale 5568,3945. E, lembrado do exemplo aterior, podemos calcular o quociete variâcia populacioal pelo tamaho da amostra: / = 89554,5164/16 = 5597,1577. Observado o histograma vemos que a distribuição das médias, para amostras de 16 elemetos está mais próxima da simetria, e o valor da média das médias amostrais (394,49) está mais próximo da média populacioal (416,99), e a variâcia das médias amostrais (5568,3945) aproxima-se bastate de / = 5597,1577. Estamos muito próximos de obter um comportameto simétrico, e aproximadamete ormal para o histograma das médias amostrais. Se retirarmos mais 4 amostras, mas agora com 3 elemetos em cada, o resultado poderá ser visto a Figura 7. 7 6 5 4 3 1 3 36 4 48 Médias amostras =3 Figura 7 - Distribuição amostral da média ( = 3) 54 A média das médias amostrais vale 41,917, e a variâcia das médias amostrais vale 945,136. E, lembrado-se do exemplo aterior, podemos calcular o quociete variâcia populacioal pelo tamaho da amostra: / = 89554,5164/3 = 985,158. Observado o histograma vemos que a distribuição das médias, para amostras de 3 elemetos é virtualmete ormal, e o valor da média das médias amostrais (41,917) está bem próximo da média populacioal (416,99), e a variâcia das médias amostrais (945,136) também é muito próxima de / = 985,158.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 7 Podemos etão euciar os teoremas: TEOREMA DAS COMBINAÇÕES LINEARES Se a variável de iteresse segue uma distribuição ormal a população a distribuição amostral das médias de amostras aleatórias retiradas desta população também será ormal, idepedetemete do tamaho destas amostras. TEOREMA DO LIMITE CENTRAL Se a variável de iteresse ão segue uma distribuição ormal a população (ou ão se sabe qual é a sua distribuição) a distribuição amostral das médias de amostras aleatórias retiradas desta população será ormal se o tamaho destas amostras for suficietemete grade 8, com uma média igual à média populacioal e uma variâcia igual à variâcia populacioal dividida pelo tamaho da amostra. Exemplo 9.3 9 - Pese agora em uma variável qualitativa que pode assumir apeas dois valores, e que costitui a seguite população: (,,,, ) Vamos supor que há iteresse o valor (este valor seria o osso sucesso ). A proporção deste valor a população (o valor do parâmetro) será = 1/5. Se retirarmos todas as amostras aleatórias de elemetos (com reposição) possíveis desta população ( = ), teremos os seguites resultados 1 : (,) (,) (,) (,) (, ) (,) (,) (,) (,) (, ) (,) (,) (,) (,) (, ) (,) (,) (,) (,) (, ) (, ) (, ) (, ) (, ) (, ) Figura 8 - Amostras de tamaho para proporção Observe que se defiirmos a variável como o úmero de sucessos (úmero de ) esta terá uma distribuição biomial: há apeas dois resultados possíveis para cada realização, há um úmero limitado de realizações ( = o caso), e cada realização idepede da outra (porque a amostra é aleatória com reposição). Calculado a proporção de em cada uma das amostras, e chamado esta proporção amostral de p, teremos os seguites resultados: 8 Este suficietemete grade varia de distribuição para distribuição, como foi visto uma distribuição uiforme precisa de uma amostra pequea ( = o caso) para que a aproximação seja possível, outras distribuições precisam de amostras maiores. Algus autores costumam chamar de grades amostras aquelas que possuem mais de 3 elemetos, a partir deste tamaho a aproximação poderia ser feita sem maiores preocupações. 9 Elaborado pela professora Carme Dolores de Freitas de Lacerda. 1 Há 5 amostras possíveis.

() () p () () (1/ ) INE 7 - Iferêcia Estatística Estimação de Parâmetros 8 () () () (1/ ) () () () (1/ ) () () () (1/ ) () () () (1/ ) (1/ ) (1/ ) (1/ ) (1) Calculado a média (valor esperado) e a variâcia das proporções acima teremos: 1 1 1 1 X _ 5 5 (1 ) E(p) s,8 5 Observe que o valor esperado (média) das proporções amostrais é IGUAL ao valor da proporção populacioal de, e que a variâcia das proporções amostrais é IGUAL ao produto da proporção populacioal de por seu complemetar, dividido pelo tamaho da amostra 11. Lembrem-se de que uma distribuição biomial pode ser aproximada por uma distribuição ormal se algumas codições forem satisfeitas: se o produto do úmero de realizações pela probabilidade de sucesso ( x p) E o produto do úmero de realizações pela probabilidade de fracasso ( x [1 - p]) forem ambos maiores ou iguais a 5 1. E esta distribuição ormal teria média igual a x p e variâcia igual a x p x (1 - p). Se estamos iteressados apeas a proporção (probabilidade de sucesso ) e ão o úmero de sucessos as expressões ateriores podem ser divididas por (o tamaho da amostra): média igual a p e variâcia igual a [p x (1- p) / ]. Por causa do Teorema do Limite Cetral é que a distribuição ormal é tão importate. É claro que ela represeta muito bem uma grade variedade de feômeos, mas é devido à sua utilização geeralizada em Iferêcia Estatística que o seu estudo é imprescidível. Ressalte-se, porém que a sua aplicação costuma resumir-se ao que se chama de Iferêcia Paramétrica, iferêcias sobre os parâmetros dos modelos probabilísticos que descrevem as variáveis a população. Para fazer iferêcias sobre outros aspectos que ão os parâmetros, ou quado as amostras utilizadas ão forem suficietemete grades para se assumir a validade do Teorema do Limite Cetral, é preciso usar técicas de Iferêcia Não Paramétrica (que ós ão veremos esta disciplia). 9.3 - Estimação por Poto de Parâmetros Uma vez tedo decidido que modelo probabilístico é mais adequado para represetar a variável de iteresse a População resta obter os seus parâmetros. Nos estudos feitos com base em amostras é preciso escolher qual das estatísticas da amostra será o melhor estimador para cada parâmetro do modelo. A Estimação por Poto cosiste em determiar qual será o melhor estimador para o parâmetro de iteresse. 11 Voltaremos a aalisar o sigificado deste resultado quado estudarmos Estimação por Poto. 1 Isto também é decorrêcia do Teorema Cetral do Limite.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 9 Como os parâmetros serão estimados através das estatísticas (estimadores) de uma amostra aleatória, e como para cada amostra aleatória as estatísticas apresetarão diferetes valores, os estimadores também terão valores aleatórios. Em outras palavras um Estimador é uma variável aleatória que segue uma distribuição de probabilidades. Naturalmete haverá várias estatísticas T que poderão ser usadas como estimadores de um parâmetro. Como escolher qual das estatísticas será o melhor estimador para o parâmetro? Há basicamete três critérios para a escolha de um estimador: o estimador precisa ser justo, cosistete e eficiete 13. Um Estimador T é um estimador justo (ão tedecioso) de um parâmetro quado o valor esperado de T é igual ao valor do parâmetro a ser estimado: E(T) = Um Estimador T é um estimador cosistete de um parâmetro quado além ser um estimador justo a sua variâcia tede a zero à medida que o tamaho da amostra aleatória aumeta: lim V(T). Se há dois Estimadores justos de um parâmetro o mais eficiete é aquele que apresetar a meor variâcia. 9.3.1 - Estimação por Poto dos pricipais parâmetros Os pricipais parâmetros que vamos avaliar aqui são: média de uma variável que segue uma distribuição ormal (ou qualquer distribuição se a amostra for suficietemete grade) em uma população (média populacioal - ) e proporção de ocorrêcia de um dos valores de uma variável que segue uma distribuição de Beroulli/Biomial 14 em uma população (proporção populacioal - ). Em suma escolher quais estatísticas amostrais são mais adequadas para estimar estes parâmetros, usado os critérios defiidos acima. Lembrado-se dos Exemplos 9.1, 9. e 9.3, algumas costatações que lá foram feitas passarão a fazer setido agora. Vamos supor que houvesse a iteção de estimar a média populacioal da variável do Exemplo 9.1. Qual das estatísticas dispoíveis seria o melhor estimador? Lembre-se que após retirar todas as amostras aleatórias possíveis daquela população, calcularmos a média de cada amostra, e posteriormete calcularmos a média dessas médias costatou-se que o valor esperado das médias amostrais (média das médias) é IGUAL ao valor da média populacioal da variável e a variâcia das médias amostrais é IGUAL ao valor da variâcia populacioal da variável dividida pelo tamaho da amostra: E (x) V(x) O melhor estimador da média populacioal é a média amostral x, pois se trata de um estimador justo e cosistete: - Justo porque o valor esperado da média amostral será a média populacioal; 13 Na realidade há mais critérios, mas estes são os mais importates, maiores detalhes em COSTA NETO, P.O. Estatística, Ed. Edgard Blücher, 1978. 14 Ambas exigem que experimeto seja um experimeto de Beroulli: que teha (ou possa ser reduzido) a apeas resultados possíveis complemetares.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 1 - Cosistete porque se o tamaho da amostra teder ao ifiito a variâcia da média amostral (do Estimador) tederá a zero. Agora vamos supor que houvesse a iteção de estimar a proporção populacioal do valor da variável do Exemplo 9.3. Qual das estatísticas dispoíveis seria o melhor estimador? Lembre-se que após retirar todas as amostras aleatórias possíveis daquela população, calcularmos a proporção de em cada amostra, e posteriormete calcularmos a média dessas proporções costatou-se que o valor esperado das proporções amostrais (média das proporções) é IGUAL ao valor da proporção populacioal do valor da variável e a variâcia das proporções amostrais é IGUAL ao valor do produto da proporção populacioal do valor da variável pela sua complemetar dividida pelo tamaho da amostra: E (p) (1 ) V(p) O melhor estimador da média populacioal é a proporção amostral p, pois se trata de um estimador justo e cosistete: - Justo porque o valor esperado da proporção amostral será a proporção populacioal; - Cosistete porque se o tamaho da amostra teder ao ifiito a variâcia da proporção amostral (do Estimador) tederá a zero. Poderíamos fazer um procedimeto semelhate para estimar outros parâmetros, como, por exemplo, a variâcia populacioal de uma variável. Este procedimeto ão será demostrado, mas o melhor estimador da variâcia populacioal será a variâcia amostral SE FOR USADO - 1 NO DENOMINADOR DA EXPRESSÃO DE CÁLCULO 15. Somete assim a variâcia amostral será um estimador justo (ão viciado) da variâcia populacioal. Como o desvio padrão é a raiz quadrada da variâcia é comum estimar o desvio padrão populacioal extraido a raiz quadrada da variâcia amostral. 9.4 - Estimação por Itervalo de Parâmetros Geralmete uma iferêcia estatística é feita com base em uma úica amostra: a maior parte dos casos é totalmete iviável retirar todas as amostras possíveis de uma determiada população. Ituitivamete percebemos que as estatísticas calculadas essa úica amostra, mesmo sedo os melhores estimadores para os parâmetros de iteresse, terão uma probabilidade ifiitesimal de coicidir exatamete com os valores reais dos parâmetros. Etão a Estimação por Poto dos parâmetros é isuficiete, e as estimativas assim obtidas servirão apeas como referêcia para a Estimação por Itervalo. A Estimação por Itervalo cosiste em colocar um Itervalo de Cofiaça (I.C.) em toro da estimativa obtida através da Estimação por Poto. O Itervalo de Cofiaça terá uma certa probabilidade chamada de Nível de cofiaça (que costuma ser simbolizado como 1 - ) de coter o valor real do parâmetro: fazer uma Estimação por Itervalo de um parâmetro é efetuar uma afirmação probabilística sobre este parâmetro, idicado 15 Esta é a razão matemática a que se referia a ota 57.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 11 uma faixa de possíveis valores, e a probabilidade de que esta faixa realmete coteha o valor real do parâmetro. A probabilidade de que o Itervalo de Cofiaça ão coteha o valor real do parâmetro é chamada de Nível de Sigificâcia (), e o valor desta probabilidade será o complemetar do Nível de Cofiaça. É comum defiir o Nível de Sigificâcia como uma probabilidade máxima de erro, um risco máximo admissível. A determiação do Itervalo de Cofiaça para um determiado parâmetro resume-se basicamete a defiir o Limite Iferior e o Limite Superior do itervalo, supodo um determiado Nível de Cofiaça (ou Sigificâcia). A defiição dos limites depederá também da distribuição amostral da estatística usada como referêcia para o itervalo e do tamaho da amostra utilizada. Para os dois parâmetros em que temos maior iteresse (média populacioal e proporção populacioal ) a distribuição amostral dos estimadores (média amostral x e proporção amostral p, respectivamete) pode ser aproximada por uma distribuição ormal: o Itervalo de Cofiaça será etão simétrico em relação ao valor calculado da estimativa (média ou proporção amostral), com base a amostra aleatória coletada: Figura 9 - Itervalo de Cofiaça para uma distribuição ormal Ode: Li é o limite iferior e Ls é o limite superior do Itervalo de Cofiaça; 1 - é o Nível de Cofiaça estabelecido, observado que o valor do Nível de Sigificâcia é dividido igualmete etre os valores abaixo de Li e acima de Ls. Para obter os limites em fução do Nível de Cofiaça devemos utilizar a distribuição ormal padrão (variável Z com média zero e variâcia um): fixar um certo valor de probabilidade, obter o valor de Z correspodete, e substituir o valor em Z = (x - média )/ desvio padrão 16, para obter o valor x (valor correspodete ao valor de Z para a probabilidade fixada). Observe a figura abaixo: Figura 1 - Itervalo de Cofiaça para a distribuição ormal padrão O limite Li (iferior) correspode a Z 1 e o limite Ls (superior) correspode a Z. O poto cetral (zero) correspode ao valor calculado da Estimativa. Como a variável Z tem distribuição 16 Foram colocados etre aspas porque os valores depederão dos parâmetros sob aálise e de outros fatores.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 1 ormal com média igual a zero (lembrado que a distribuição ormal é simétrica em relação à média) os valores de Z 1 e Z serão iguais em módulo (Z 1 será egativo e Z positivo): Z 1 será um valor de Z tal que P( Z Z1), e Z será um valor tal que P( Z Z ) 1 Etão obteremos os valores dos limites através das expressões: Z 1 = (Li - média )/ desvio padrão => Li = média + Z 1 desvio padrão Z = (Ls - média )/ desvio padrão => Ls = média + Z desvio padrão Como Z 1 = - Z, podemos substituir: Li = média - Z desvio padrão Ls = média + Z desvio padrão E este valor Z costuma ser chamado de Z crítico, porque correspode aos limites do itervalo 17 : Li = média - Z crítico desvio padrão Ls = média + Z crítico desvio padrão Reparem que o mesmo valor é somado e subtraído da média. Este valor é chamado de semi-itervalo ou precisão do itervalo, e recebe símbolo e : e = Z crítico desvio padrão Resta agora defiir corretamete o valor da média e do desvio padrão para cada um dos parâmetros em que estamos iteressados (média e proporção populacioal). Com base as coclusões obtidas a Estimação por Poto isso será simples. Cotudo, há algus outros aspectos que precisarão ser esmiuçados. 9.4.1 - Estimação por Itervalo da Média Populacioal Lembrado das expressões ateriores: Li = média - Z crítico desvio padrão = média - e Ls = média + Z crítico desvio padrão = média + e Neste caso a média será a média amostral x (ou mais precisamete o seu valor): P( x e x e) 1 O valor de e depederá de outros aspectos. a) Se a variâcia populacioal da variável (cuja média populacioal queremos estimar) for cohecida. Neste caso a variâcia amostral da média poderá ser calculada através da expressão: V(x), e, por coseguite, o desvio padrão será desvio padrao 17 Esta otação é a utilizada a apostila de Roteiros e Tabelas.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 13 E e será: e Zcritico Bastará etão fixar o Nível de Cofiaça (ou de Sigificâcia) para obter Z crítico e calcular e. b) Se a variâcia populacioal da variável for descohecida. Naturalmete este é o caso mais ecotrado a prática. Como se deve proceder? Depederá do tamaho da amostra. b.1 - Grades amostras (mais de 3 elemetos) Nestes casos procede-se como o item aterior, apeas fazedo com que = s, ou seja, cosiderado que o desvio padrão da variável a população é igual ao desvio padrão da variável a amostra (suposição razoável para grades amostras). b. - Pequeas amostras (até 3 elemetos) Nestes casos a aproximação do item b.1 ão será viável. Terá que ser feita uma correção a distribuição ormal padrão (Z) através da distribuição t de Studet. Trata-se de uma distribuição de probabilidades que apreseta média igual a zero (como a ormal padrão), é simétrica em relação à média, mas apreseta uma variâcia igual a / ( -), ou seja seus valores depedem do tamaho da amostra, apresetado maior variâcia para meores valores de amostra 18. Quato maior o tamaho da amostra mais a variâcia de t aproxima-se de 1, (variâcia da ormal padrão) 19. A distribuição t de Studet está a figura abaixo: Figura 11 - Distribuição t de Studet Observe que tal como a distribuição ormal padrão a distribuição t de Studet é simétrica em relação à média (que é igual a zero). O valor -1 (tamaho da amostra meos 1) é chamado de úmero de graus de liberdade da estatística. Quado a variâcia amostral é calculada supõe-se que a média já seja cohecida, assim apeas um determiado úmero de elemetos da amostra poderá ter seus valores variado livremete, este úmero será igual a - 1, porque um dos valores ão poderá variar livremete, pois terá que ter um valor tal que a média permaeça a mesma calculada ateriormete. Assim, a estatística terá - 1 graus de liberdade. A distribuição t de Studet ecotra-se tabelada o apêdice para vários graus de liberdade e valores de probabilidade. 18 Esta é a correção propriamete dita, pois ao usar pequeas amostras o risco de que a variâcia amostral da variável seja diferete da variâcia populacioal é maior, podedo levar a itervalos de cofiaça que ão correspodem à realidade. A ão utilização desta correção foi a fote de muitos erros o passado, e, ifelizmete, de aida algus erros o presete. 19 Para tamahos de amostra maiores do que 3 supõe-se que a variâcia de t é igual a 1: por isso a aproximação do item b.1.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 14 Quado a variâcia populacioal da variável é descohecida e a amostra tem até 3 elemetos substitui-se por s e Z por t -1 em todas as expressões para determiação dos limites do itervalo de cofiaça, obtedo: Li = média - t -1,crítico desvio padrão = média - e Ls = média + t -1,crítico desvio padrão = média + e s E e será: e t 1, critico Os valores de t -1,crítico podem ser obtidos de forma semelhate aos de Z crítico, defiido o Nível de Cofiaça (ou de Sigificâcia), mas precisam também da defiição do úmero de graus de liberdade ( - 1): tedo estes valores basta procurar o valor em uma tabela ou em um programa computacioal. Se o tamaho da amostra () for superior a 5% do tamaho da população (N) os valores de e precisam ser corrigidos. Caso cotrário os limites dos itervalos ão serão acurados. A correção é mostrada a equação a seguir: e e N N 1 corrigido 9.4. - Estimação por Itervalo da Proporção Populacioal No item 9.3 declaramos que o melhor estimador para a proporção populacioal é a proporção amostral p. E que esta proporção amostral teria média igual a e variâcia igual a [ x (1 - )]/ ode é o tamaho da amostra aleatória. A distribuição da proporção amostral p é biomial, e sabe-se que a distribuição biomial pode ser aproximada por uma ormal se algumas codições forem satisfeitas, o caso se: 5 E (1 - ) 5. Ora, se fosse cohecido ão estaríamos aqui os preocupado com a sua Estimação por Itervalo, assim vamos verificar se é possível aproximar a distribuição biomial de p por uma ormal se: p 5 E (1 - p) 5, ou seja usado o próprio valor da proporção amostral observada (trata-se de uma aproximação razoável). SE E SOMENTE SE estas duas codições forem satisfeitas poderemos usar as expressões abaixo (lembrado das expressões ateriores): Li = média - Z crítico desvio padrão = média - e Ls = média + Z crítico desvio padrão = média + e Neste caso a média será a proporção amostral (ou mais precisamete o seu valor): (p e p e ) 1 P ( 1 ) E o valor do desvio padrão será igual a usaremos a proporção amostral p como aproximação.. Novamete, como é descohecido,

INE 7 - Iferêcia Estatística Estimação de Parâmetros 15 p (1 p) Etão e será: e Zcritico Bastará etão fixar o Nível de Cofiaça (ou de Sigificâcia), Z crítico e calcular e. Novamete, precisamos corrigir o valor de e para o caso de população fiita: e e N N 1 corrigido Em suma a Estimação por Itervalo da média e da proporção populacioal cosiste basicamete em calcular a amplitude do semi-itervalo (o e ), de acordo com as codições do problema sob aálise. - Para a média, observar se é viável cosiderar que a distribuição da variável a população é ormal, ou que a amostra seja suficietemete grade para que a distribuição das médias amostrais possa ser cosiderada ormal. Se isso for verificado, idetificar se a variâcia populacioal da variável é cohecida: caso seja deverá ser usada a variável Z da distribuição ormal padrão, para qualquer tamaho de amostra. Se variâcia populacioal da variável é descohecida há duas possibilidades: para amostras com mais de 3 elemetos usar a variável Z, e fazer a variâcia populacioal igual à variâcia amostral da variável; se a amostra tem até 3 elemetos usar a variável t -1 da distribuição de Studet. - Para a proporção, observar se é possível fazer a aproximação pela distribuição ormal. 9.5 - Tamaho Míimo de Amostra para Estimação por Itervalo de parâmetros Como foi observado, a determiação dos limites de um Itervalo de Cofiaça (determiação do e ) depede do tamaho da amostra aleatória coletada, além do Nível de Cofiaça e da distribuição amostral do estimador utilizado. Nada podemos fazer quato à distribuição amostral do estimador, o Nível de Cofiaça ós podemos cotrolar, seria iteressate defiir etão uma precisão (um valor para e ) para o Itervalo de Cofiaça: é muito comum querermos estabelecer previamete qual será a faixa de variação de um determiado parâmetro, com uma certa cofiabilidade. Cotudo, para um mesmo tamaho de amostra: - se aumetarmos o Nível de Cofiaça (reduzirmos o Nível de Sigificâcia) teremos um valor crítico maior, o que aumetará o valor de e, resultado em um Itervalo de Cofiaça mais largo, com meor precisão. - se resolvermos aumetar a precisão (meor valor de e ), obter um Itervalo de Cofiaça mais estreito, teremos uma queda o Nível de Cofiaça. A solução para o dilema acima é obter um tamaho míimo de amostra capaz de ateder simultaeamete ao Nível de Cofiaça (ou de Sigificâcia) e à precisão (e ) especificados. Como as expressões de e são em fução do tamaho de amostra (), seria razoável pesar em reordeálas de forma a fazer com que o tamaho de amostra seja fução do Nível de Cofiaça e da precisão (e ).

INE 7 - Iferêcia Estatística Estimação de Parâmetros 16 9.5.1 - Tamaho Míimo de Amostra para Estimação por Itervalo da média populacioal a) Variâcia populacioal cohecida Zcritico e Zcritico isolado : e Neste caso basta especificar o valor de e (a mesma uidade do desvio padrão populacioal ), e o Nível de Cofiaça (que será usado para ecotrar o Z crítico ) e calcular o tamaho míimo de amostra. b) Variâcia populacioal descohecida s t 1,critico s e t 1, critico isolado : e O procedimeto este caso seria semelhate exceto por um pequeo problema: se estamos calculado o tamaho da amostra como podemos cohecer - 1 e o desvio padrão amostral s? Quado a variâcia populacioal da variável é descohecida o usual é retirar uma amostra piloto com um tamaho * arbitrário. A partir dos resultados desta amostra são calculadas as estatísticas (etre elas o desvio padrão amostral s) que são substituídas a expressão acima. Se * etão a amostra piloto é suficiete para o Nível de Cofiaça e a precisão exigidos. Se > * etão a amostra piloto é isuficiete para o Nível de Cofiaça e a precisão exigidos, sedo etão ecessário retorar à população e retirar os elemetos para completar o tamaho míimo de amostra. O processo cotiua até que a amostra seja cosiderada suficiete. 9.5. - Tamaho Míimo de Amostra para Estimação por Itervalo da proporção populacioal Para a proporção populacioal teremos: e p (1 p) Z critico Zcritico isolado : p (1 p) e É ecessário especificar o Nível de Cofiaça (ou de Sigificâcia) que será usado para ecotrar o Z crítico, e o valor de e (tomado o cuidado de que tato e quato p e 1- p estejam todos como proporções adimesioais ou como percetuais) para que seja possível calcular o valor do tamaho míimo de amostra. Da mesma forma que o caso da Estimação da média quado a variâcia populacioal é descohecida teremos que recorrer à uma amostra piloto, procededo de forma semelhate à letra b) do item 9.5.1. No cálculo do tamaho míimo de amostra para a Estimação por Itervalo da proporção populacioal há, porém uma solução alterativa: utiliza-se uma estimativa exagerada da amostra, supodo o máximo valor possível para o produto p (1 - p), que ocorrerá quado ambas as proporções forem iguais a,5 (5%). Esta solução somete é usada quado a atureza da pesquisa é tal que ão é possível retirar uma amostra piloto: a retirada de uma amostra piloto e a evetual retirada de ovos elemetos da população poderiam prejudicar muito o resultado da pesquisa. Paga-se etão o preço de ter uma amostra substacialmete maior do que talvez fosse ecessário.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 17 Coforme visto o Capítulo 7, se o tamaho da população for cohecido é recomedável corrigir o tamaho da amostra obtida, seja para o itervalo de cofiaça de média ou proporção, através da seguite fórmula: N corrigido ode N é o tamaho da população N Assim procededo, evitamos o icoveiete de obter um tamaho de amostra superior ao tamaho da população, o que pode ocorrer se N ão for muito grade. Exemplo 9.4 - Retirou-se uma amostra aleatória de 4 elemetos de uma produção de cortes bovios o ituito de estimar a média do peso do corte. Obteve-se média de 8, kg e desvio padrão de,4 kg. Supodo população ormal. a) Determiar um itervalo de cofiaça para a média populacioal com 1% de sigificâcia. b) Para estimar a média, com 1% de sigificâcia e precisão de, kg, esta amostra é suficiete a) Seguido o roteiro de Estimação de Parâmetros do apêdice: 1) O parâmetro de iteresse é a média populacioal do peso do corte. ) Adotou-se um ível de sigificâcia de 1%, etão =,1 e 1 - =,99 1. 3) As estatísticas dispoíveis são: média amostral = 8, kg s =,4 kg = 4 elemetos. 4) Defiição da variável de teste: como a variâcia populacioal é DESCONHECIDA, e o tamaho da amostra é meor do que 3 elemetos, ão obstate a população ter distribuição ormal, a distribuição amostral da média será t de Studet, e a variável de teste será t -1. 5) Ecotrar o valor de t -1,crítico : como o Itervalo de Cofiaça para a média é bilateral, teremos uma situação semelhate à da figura abaixo: Para ecotrar o valor crítico devemos procurar a tabela da distribuição de Studet, a liha correspodete a -1 graus de liberdade, ou seja em 4-1 = 3 graus de liberdade. O valor da probabilidade pode ser visto a figura ao lado: os valores críticos serão t 3;,5 e t 3;,995 os quais serão iguais em módulo. E o valor de t -1,crítico será igual a 5,84 (em módulo) 6) Determiam-se os limites do itervalo, através da expressão abaixo (cujo resultado será somado e subtraído da média amostral) para determiar os limites do itervalo: t 1,crítico s 5,84,4 e 1,168kg 4 LI x e 8, 1,168 7,3kg LS x e 8, 1,168 9,368kg 7) Etão o itervalo de 99% de cofiaça para a média populacioal da dimesão é [7,3;9,368] kg. Iterpretação: há 99% de probabilidade de que a verdadeira média populacioal do peso de corte esteja etre 7,3 e 9,368 kg. b) Como a variâcia populacioal é DESCONHECIDA, e o tamaho da amostra é meor do que 3 elemetos, ão obstate a população ter distribuição ormal, a distribuição amostral da média será t de Studet, e a variável de teste será t -1. Assim será usada a seguite expressão para calcular o tamaho míimo de amostra para a estimação por itervalo da média populacioal. 1 Este valor pode ser arbitrado pelo usuário ou pode ser uma exigêcia do problema sob aálise, ou até mesmo uma exigêcia legal. Os íveis de sigificâcia mais comus são de 1%, 5% ou mesmo 1%.

INE 7 - Iferêcia Estatística Estimação de Parâmetros 18 t 1,critico s e O ível de sigificâcia é o mesmo do item a. Sedo assim, o valor crítico cotiuará sedo o mesmo: t -1,crítico = 5,84. O desvio padrão amostral vale,4 kg, e o valor de e, a precisão, foi fixado em, kg. Basta etão substituir os valores a expressão: t 1,critico s 5,84,4 136,4 137 e elemetos, Observe que o tamaho míimo de amostra ecessário para ateder a 1% de sigificâcia e precisão de, kg deveria ser de 137 elemetos. Como a amostra coletada possui apeas 4 elemetos ela é INSUFICIENTE para a sigificâcia e precisão exigidas. Recomeda-se o retoro à população para a retirada aleatória de mais 133 espécimes. Exemplo 9.5 - Retirou-se uma amostra aleatória de 1 peças de um lote. Verificou-se que 35 eram defeituosas. a) Determiar um itervalo de cofiaça de 95% para a proporção peças defeituosas o lote. b) Supodo 99% de cofiaça e precisão de 1%, esta amostra é suficiete para estimar a proporção populacioal a) Seguido o roteiro do Apêdice: 1) O parâmetro de iteresse é a proporção populacioal de peças defeituosas. ) Adotou-se um ível de sigificâcia de 5%, etão =,5 e 1 - =,95 3) As estatísticas são: proporção amostral de peças defeituosas p = 35/1 = 1 elemetos. 4) Defiição da variável de teste: precisamos verificar se é possível fazer a aproximação pela ormal, etão x p = 1 x,35 = 35 > 5 e x (1- p) = 1 x,965 = 965 > 5. Como ambos os produtos satisfazem as codições para a aproximação podemos usar a variável Z da distribuição ormal padrão 5) Ecotrar o valor de Z crítico : como o Itervalo de Cofiaça para a média é bilateral, teremos uma situação semelhate à da figura abaixo: 6) Passa-se agora a determiação dos limites do itervalo, através da expressão abaixo (cujo resultado será somado e subtraído da proporção amostral de peças defeituosas) para determiar os limites do itervalo: p(1 p),35,965 e Zcritico 1,96,114 1 LI p e,35,114,36 LS p e,35,114, 464 7) Etão, o itervalo de 95% de cofiaça para a proporção populacioal de peças defeituosas é [,36%;4,64%]. Para ecotrar o valor crítico devemos procurar a tabela da distribuição ormal padrão pela probabilidade,975 (,95+,5) O valor da probabilidade pode ser visto a figura ao lado: os valores críticos serão Z,5 e Z,975 os quais serão iguais em módulo. E o valor de Z crítico será igual a 1,96 (em módulo).

INE 7 - Iferêcia Estatística Estimação de Parâmetros 19 Iterpretação: há 95% de probabilidade de que a verdadeira proporção populacioal de platas atacadas pelo fugo esteja etre,36% e 4,64%. b) De acordo com o item aterior é possível utilizar a aproximação pela distribuição ormal. A expressão para o cálculo do tamaho míimo de amostra para a proporção populacioal será: Z critico p (1 p) e Os valores de p e 1 - p já são cohecidos: p =,35 1 - p =,965 O ível de cofiaça exigido é de 99%: para ecotrar o valor crítico devemos procurar a tabela da distribuição ormal padrão pela probabilidade,995 (,99+,5); os valores críticos serão Z,5 e Z,995 os quais serão iguais em módulo. E o valor de Z crítico será igual a,58 (em módulo). A precisão foi fixada em 1% (,1). Substituido os valores a expressão acima: Z critico,58 p (1 p),35,965 48,14 49 e,1 Observe que o tamaho míimo de amostra ecessário para ateder a 99% de cofiaça e precisão de 1% deveria ser de 49 elemetos. Como a amostra coletada possui apeas 1 elemetos ela é INSUFICIENTE para a cofiaça e precisão exigidas. Recomeda-se o retoro à população para a retirada aleatória de mais 149 peças. "EMPATE TÉCNICO" Estamos acostumados a ouvir declarações do tipo "os cadidatos A e B estão tecicamete empatados a preferêcia eleitoral". O que sigifica isso? Geralmete as pesquisas de opiião eleitoral cosistem em obter as proporções de etrevistados que declara votar este ou aquele cadidato, aquele mometo. Posteriormete as proporções são geeralizadas estatisticamete para a população, através do cálculo de itervalos de cofiaça para as proporções de cada cadidato. Se os itervalos de cofiaça das proporções de dois ou mais cadidatos apresetam grades superposições declara-se que há um "empate técico": as difereças etre eles devem-se provavelmete ao acaso, e para todos os fis estão em codições virtualmete iguais, aquele mometo. Exemplo 9.6 - Imagie que uma pesquisa de opiião eleitoral apresetasse os seguites resultados (itervalos de cofiaça para a proporção que declara votar o cadidato) sobre a prefeitura do muicípio de Tapioca. Quais cadidatos estão tecicamete empatados? Opiião Limite iferior % Limite superior % Godofredo Astrogildo 31% 37% Filismio Arquibaldo 14% % Urraca Hermegarda 13% 19% Salustiao Quitailha % 8% Idecisos 11% 17% Filismio e Urraca estão tecicamete empatados, pois seus itervalos de cofiaça apresetam grade sobreposição. Godofredo está muito a frete, pois o limite iferior de seu itervalo é maior do que o limite superior de Salustiao, que está em segudo lugar. É importate ressaltar que o úmero de idecisos é razoável, variado de 11 a 17%, quado eles se decidirem poderão mudar completamete o quadro da eleição, ou garatir a vitória folgada de Godofredo.