Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Documentos relacionados
Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

1.1. Definições importantes

Cap. 4 - Estimação por Intervalo

Probabilidade e Estatística

Estatística II. Intervalo de Confiança Lista de Exercícios

Inferência Estatistica

ESTIMAÇÃO DE PARÂMETROS

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Universidade Federal de Lavras

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Teorema central do limite e es/mação da proporção populacional p

AULA 03 Estimativas e tamanhos amostrais

Distribuição Amostral e Estimação Pontual de Parâmetros

Inferência Estatística:

Capítulo 4 Inferência Estatística

Estimação: (A) Propriedades e Distribuições Amostrais

Inferência Estatística

1 Teoria da Decisão Estatística

Intervalos de Confiança Prof. Walter Sousa

Estatística Aplicada

Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Inferência Estatística:

Aula 9: Introdução à Inferência Estatística

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas

Fernando de Pol Mayer

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Estatística Aplicada. Inferência estatística com desvio padrão populacional desconhecido Estimativa de proporção Capítulo 10 Itens 10.4 a 10.

Introdução à Bioestatística Turma Nutrição

Intervalos de Confiança

Estatística Indutiva

Introdução à Inferência Estatística

Lista de Exercicios 1 MEDIDAS RESUMO. ESTIMAÇÃO PONTUAL.

Distribuições Amostrais

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Erro e Tamanho Amostral

Intervalos de Confiança

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

x P(X = x) 0,1 0,7 0,2

Introdução à Inferência Estatística

Professora Ana Hermínia Andrade. Período

CONHECIMENTOS ESPECÍFICOS

Lista de Exercícios #8 Assunto: Teste de Hipóteses

Distribuição Amostral e Estimação Pontual de Parâmetros

TÉCNICAS DE AMOSTRAGEM

Estimador: combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população.

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

CONHECIMENTOS ESPECÍFICOS

Inferência Estatística. Teoria da Estimação

Probabilidade e Estatística

Intervalos de Confiança

Contabilometria. Prof.: Patricia Maria Bortolon, D. Sc.

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

AULA 07 Inferência a Partir de Duas Amostras

Distribuições por Amostragem

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Estatística Aplicada II. } Estimação e Intervalos de Confiança

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2006

Introdução à Probabilidade e à Estatística II

Introdução à Inferência Estatística

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Intervalo de confiança4

Lista de Exercicios 1. Medidas Resumo. Estimação. Distribuições Amostrais

Segunda Lista de Exercícios Cálculo de Probabilidades II Prof. Michel H. Montoril

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

Probabilidade e Estatística. stica. Prof. Dr. Narciso Gonçalves da Silva pessoal.utfpr.edu.

Tópicos em Gestão da Informação II

Intervalos de Confiança

Prof. Eduardo Bezerra. 15 de setembro de 2017

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

AULA 05 Teste de Hipótese

i. f Y (y, θ) = 1/θ... 0 y θ 0... y < 0 ou y > θ Se a amostra selecionada foi ( ), qual será a estimativa para θ?

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Estimação de valores. Luiz Carlos Terra

x P(X = x) 0,1 0,7 0,2

3. Estimação pontual USP-ICMC-SME. USP-ICMC-SME () 3. Estimação pontual / 25

AULA 04 Teste de hipótese

3 2σ 2] = σ 2 C = 1 6

1 Probabilidade - Modelos Probabilísticos

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

TAMANHO AMOSTRAL. Lucas Santana da Cunha 31 de julho de Universidade Estadual de Londrina. Tamanho da Amostra

Estatística Aplicada. Inferência estatística com desvio padrão populacional conhecido Amostragem Capítulo 10 Itens 10.1 a 10.3

Métodos Estatísticos

Fernando de Pol Mayer

CONHECIMENTOS ESPECÍFICOS

x P(X = x) 0,1 0,7 0,2

Lucas Santana da Cunha e 30 de julho de 2018 Londrina

CONHECIMENTOS ESPECÍFICOS

Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média

03/06/2014. Tratamento de Incertezas TIC Aula 18. Conteúdo Inferência Estatística Clássica

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

AULA 02 Distribuição de Probabilidade Normal

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Transcrição:

1. Inferência Estatística Inferência Estatística é o uso da informção (ou experiência ou história) para a redução da incerteza sobre o objeto em estudo. A informação pode ou não ser proveniente de um experimento previamente planejado, pode ser um conjunto de dados ou não. 1.1. Definições Básicas Definição. As quantidades da população, em geral desconhecidas, sobre as quais tem-se interesse, são denominadas parâmetros e, usualmente, representadas por letras gregas tais como α, β, γ, θ, μ, λ, π, ρ, σ, φ, dentre outras. Definição. À combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população, denomina-se estimador ou estatística. Denota-se os estimadores por símbolos com o acento circunflexo, tais como α, β, γ, θ, μ, λ, π, ρ, σ, φ, dentre outras. Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas. 1.2. Propriedades dos estimadores Definição. Um estimadores θ é não viciado ou não viesado para um parâmetro θ se θ = θ. Ou seja, um estimador é não viciado se o seu valor esperado é exatamente o valor do parâmetro. Definição. Um estimador θ é consistente se as duas condições são satisfeitas: ) θ = θ; ) θ = 0. Ou seja, se, à medida que o tamanho da amostra aumenta, seu valor esperado converge para o parâmetro e sua variância converge para zero. Definição. Dado dois estimadores θ e θ, não viciados em relação à θ, diz-se que θ é mais eficiente que θ se θ < θ.

Exercício: Baseado nas definições das propriedades dos estimadores demonstre os resultados que seguem no quadro abaixo: Parâmetro Estimador Propriedades μ = Não viciado e consistente = í í Não viciado e consistente σ = 1 1 ) σ σ = 1 ) Não viciado e consistente Viciado e consistente 1.3. Distribuição Amostral 1.3.1. Distribuição Amostral da Média Seja uma população identificada pela variável aleatória X, cujos parâmetros média populacional = ) e variância populacional = ) são supostamente conhecidos. Retira-se todas as amostras possíveis de tamanho dessa população e para cada uma delas, calcular a média X. Supõe-se a seguinte população 2, 3, 4, 5 com média = 3,5 e variância = 1,25. Vamos relacionar todas as amostras possíveis de tamanho 2, com reposição, desta população. (2,2) (2,3) (2,4) (2,5) (3,2) (3,3) (3,4) (3,5) (4,2) (4,3) (4,4) (4,5) (5,2) (5,3) (5,3) (5,5)

Agora, calcula-se a média de cada amostra. Tem-se: 2,0 2,5 3,0 3,5 2,5 3,0 3,5 4,0 3,0 3,5 4,0 4,5 3,5 4,0 4,5 5,0 Por fim, vamos calcular a média das médias, ou seja, ) = 2,0 + 2,5 + + 5,0 16 = 3,5 Agora, calcula-se a variância: ) = 1 ) = 1 ) + ) + + ) ) = 1 [2,0 3,5) + 2,5 3,5) + + 5,0 3,5) ] ) = 0,625 Sendo assim, ) = ), em que é o tamanho das amostras retiradas da população. No nosso exemplo, ) = ) = 1,25 2 = 0,625 Exemplo: Seja o caso de uma população Normal, isto é, a variável de interesse é ~μ, σ ). Portanto, tem-se que,,, ) representa uma amostra aleatória cujos elementos são independentes, e identicamente distribuídos, com densidade Normal de média μ e variância, ou seja: ~, ), = 1,, ;

é,. Sabe-se que para quaisquer constantes,,,, a combinação linear também tem distribuição de probabilidade dada pelo modelo Normal. A distribuição da média amostral segue diretamente deste resultado ao utilizar-se =, para = 1,,. Assim, ~μ, σ, e, com o auxílio das propriedades da esperança e variância tem-se que: μ = [] = 1 = 1 = 1 [ ] = 1 μ σ = [] = 1 = 1 = 1 [ ] = 1 = 1 σ. = 1 μ = μ; σ = 1 σ Conclui-se que para uma coleção de variáveis aleatórias independentes com uma mesma distribuição de probabilidade, dada por um modelo Normal com média e variância, a média amostral também terá distribuição Normal, com média e variância. Ou seja: ~, = ~0, 1). Observação: Se a população é finita e de tamanho conhecido, e se a amostra de tamanho dela retirada é sem reposição, então: σ = 1. Onde é o fator de correção para população finita. Exemplo: Seja,,, uma amostra aleatória de uma variável aleatória tal que ~80, 26). Calcule:

a. > 83) = > = > 2,94) = 0,001641; b. < 82) = < = < 1,96) = 0,975002; c. μ 2 σ < < μ + 2 σ ) = 80 2 < < 80 + 2 77,96 80 82,04 80 77,96 < < 82,04) = 26 < < 26 25 25 2 < < +2) = 0,954500. Exercício: Seja,,, uma amostra aleatória de uma variável aleatória tal que ~100, 85). Calcule: a. 95 < < 105); b. 98 < < 102); c. μ Z σ < < μ + Z σ = 0,95. Teorema Central do Limite TCL Seja,,, uma amostra aleatória simples de tamanho de uma população com média e variância (note que o modelo da variável aleatória não é especificado), então a média amostral também terá distribuição Normal, com média e variância, ou seja: ~, = ~0, 1). Exercício: Supõe-se que o consumo mensal de água por residência em um certo bairro mineiro tem distribuição normal com média 10 e desvio padrão 2 (em ).

Para uma amostra de 25 dessas residências, qual é a probabilidade de a média amostral não se afastar da verdadeira média por mais de 1? Exercício: Um fabricante afirma que produz em média 75 componentes por dia com desvio padrão de 10 componentes por dia. Para uma amostra de 1 mês (25 dias úteis), qual a probabilidade de a média amostral ficar entre 70 e 80 componentes dia? Se o fabricante estabelecer uma meta média mensal de 80 componentes por dia, qual a probabilidade de ser alcançada? 1.3.2. Distribuição Amostral da Proporção Uma aplicação importante do TCL relaciona-se com a distribuição da proporção amostral, que é definida como a fração dos indivíduos com uma dada característica em uma amostra de tamanho, isto é: = í í. Seja a proporção de indivíduos com a dada característica na população é e que os indivíduos são selecionados aleatóriamente, tem-se assim que,,, formam uma sequência de variáveis aleatórias independentes com distribuição de Bernoulli, ou seja, ~). Desta forma: = 1 çã í = 0 çã ã í Logo, = 1) =, = 0) = 1, [ ] =, [ ] = 1 ). Pode-se reescrever a proporção amostral como: = + + + = =. Logo, a proporção amostral é a média de variáveis aleatórias convenientemente definidas. Calculando a esperança e variância de tem-se que: μ = [ ] = 1 = 1 = 1 [ ] = 1 = 1 = ;

σ = [ ] = 1 = 1 = 1 [ ] = 1 1 ) = 1 1 ) 1 ) = ; Portanto, μ =, σ = ), σ = ). Desta forma, pelo TCL: ~, 1 ) = ~0, 1). 1 ) Observação: Quando é desconhecida e a amostra com reposição é grande, determina-se = e σ ). Para alguns autores e estatísticos, uma amostra é suficientemente grande quando 5 e 1 ) 5. Exemplo: Em uma população, a proporção de pessoas favoráveis a uma determinada lei é de 40%. Retira-se uma amostra de 300 pessoas dessa população. Determine Z σ < < + Z σ = 0,95. Dado que = 300 e = 0,40, então σ = ) que Z,% = 1,96, então: =,,) 0,4 1,96 0,0283 < < 0,4 + 1,96 0,0283) = 0,95 0,4 0,0555 < < 0,4 + 0,0555) = 0,95 0,3445 < < 0,4555) = 0,95 34,45% < < 45,55%) = 0,95 = 0,0283. Tem-se Exemplo: Deseja-se obter a proporção de estudantes de Economia e Administração portadores de habilidades intrínsecas de gestão e liderança. Retira-se uma amostra de 400 estudantes, obtendo-se 8 portadores de tais habilidades. Determine um intervalo de confiabilidade de 99% para a proporção populacional. Z σ < < + Z σ = 0,99

Dado que = 400 e = = = 0,02, então σ ) =,,) = 0,007. Tem-se que Z,% = 2,57, então: 0,02 2,57 0,007 < < 0,02 + 2,57 0,007 = 0,99 0,02 0,018 < < 0,02 + 0,018 = 0,99 0,002 < < 0,038 = 0,99 0,2% < < 3,8% = 0,99. Exercício: Uma fábrica de peças específica em suas embalagens que a proporção de defeitos é de 4%. Um cliente dessa fábrica inspeciona uma amostra de 200 peças e constata que 12 são defeituosas. Baseado nesses dados, em quantas amostras o cliente encontraria uma proporção de defeitos maior que o especificado pelo fabricante? 1.3.3. Distribuição t-student O trabalho desenvolvido por W. S. Gosset (que o divulgou sob o pseudônimo de ), no começo dos anos 1900 resultou na distribuição, ou mais simplesmente a distribuição. Definição. Seja,,, uma amostra aleatória de uma distribuição ~,. A quandidade, σ =, tem distribuição, com 1 graus de liberdade. Ou seja: Pode-se verificar que: ~ = = = = = 1 1 1 0; 1 1

~. A função de densidade de probabilidade de uma variável aleatória que tem distribuição com graus de liberdade (denota-se por ~ ) é: 1 2 2 1 1 1,. Características da distribuição : Simétrica em relação a media; Forma de sino; Quando, a distribuição se torna equivalente a distribuição Gaussiana, conforme pode-se ver pela figura abaixo. Obersvação: A distribuição de Cauchy é um caso particular da distribuição quando 1.

Exemplo: Calcule as probabilidades por meio da tabela da distribuição. a. > 2,2281) = 0,025; b. < 2,2281) = 0,025; c. > 1,9759) = 0,025; d. < 1,9759) = 0,025; e. > 1,9600) = 0,025; f. < 1,9600) = 0,025; g. > 1,4149) = 0,100; h. < 1,4149) = 0,100; i. > 1,8949) = 0,050; j. < 1,8949) = 0,050; k. > 2,3646) = 0,025; l. < 2,3646) = 0,025; m. > 2,9980) = 0,010; n. < 2,9980) = 0,010; o. > 3,4995) = 0,005; p. < 3,4995) = 0,005. Exemplo: Seja,,, uma amostra aleatória de uma variável aleatória tal que ~80, σ ). Dada a variância amostral = 26 e por meio da distribuição pode-se calcular: a. > 83) = > = > 2,94) = 0,003577 ); b. < 82) = < = < 1,96) = 0,969147 ); c. μ 2 σ < < μ + 2 σ ) = 80 2 < < 80 + 2

77,96 80 82,04 80 77,96 < < 82,04) = 26 < < 26 25 25 2 < < +2) = 0,943060 ). Exercício: Por meio da tabela da distribuição : a. Calcule > 0,6864); b. Calcule < 2,4345); c. Calcule > 2,6757); d. Obtenha tal que > ) = 0,250; e. Obtenha tal que > ) = 0,100; f. Obtenha tal que > ) = 0,050; g. Obtenha tal que < ) = 0,010; h. Obtenha tal que < ) = 0,005; Exercício: Seja,,, uma amostra aleatória de uma variável aleatória tal que ~100, σ ). Dada a variância amostral = 85, calcule: a. 95 < < 105); b. 98 < < 102); c. μ σ < < μ + σ = 0,95. 1.4. Intervalo de Confiança (uma população) Em todas as áreas do conhecimento existe a necessidade de se obter conclusões a respeito dos parâmetros de uma população. A estimação destes parâmetros pode ser realizada por meio de estimação pontual ou estimação por intervalo. Estimação Pontual É pontual quando a estimativa do parâmetro é representada apenas por um valor. A principal desvantagem é que a estimativa pontual é pouco informativa. Esta

estimação não fornece nenhuma idéia do erro que se comete ao assumir o valor da estimativa como igual ao verdadeiro valor do parâmetro desconhecido. Estimação Intervalar É intervalar quando estabelece-se um intervalo que contém, com uma determinada probabilidade pré-estabelecida, o verdadeiro valor do parâmetro desconhecido. Uma maneira de se expressar a precisão da estimação é estabelecer limites da forma,, que, probabilidade 1, incluam o verdadeiro valor do parâmetro de interesse. Sendo assim, a estimação por intervalo consiste na fixação de dois valores,, e, tais que 1 seja a probabilidade de que o intervalo, por eles determinado, contenha o real valor de. O intervalo, pode ser constituído a partir das distribuições amostrais. Ou seja, utilizando as distribuições de amostragem, pode-se obter expressões do tipo: 1 1 1 Assim, pode-se interpretar sob as expressões acima que existe 1001 % de confiança que o verdadeiro valor de, e esteja contido no intervalo,. Em outras palavras,, é uma estimativa para, e em que a probabilidade 1 ou 1001 % expressa o grau de confiança que se tem na estimação. Se, é uma estimativa com 1001 % de confiança para, então, O intervalo a, b é chamado intervalo de confiança para θ. a e b são chamados limite inferior e limite superior do intervalo de confiança para θ. A probabilidade 1 α 1001 α% é chamada coeficiente de confiança. A probabilidade α é chamada nível de significância.

1.4.1. Intervalo de confiança para a média populacional 1.4.1.1. Intervalo de confiança para a média populacional com variância populacional conhecida Pelo TCL tem-se que ~, ~0, 1, então: 1 1 1 1 Sendo assim, o intervalo com 1 α 1001 α% de confiança para com conhecida é: ;. Observação: 1. Denota-se por erro padrão ou erro de estimação; 2. Os níveis de confiança de confiança mais usados são: 1 α 0,90,% 1,64; 1 α 0,95,% 1,96; 1 α 0,99,% 2,58. Exemplo: A especificação de uma peça é uma variável aleatória com 9. O setor de controle de qualidade extraiu uma amostra de tamanho 25 e obteve 152. Deseja-se determinar o intervalo de confiança de 90% e o erro de estimação para a média populacional da especificação da peça.

1 25 = 6,08 σ = = 3 25 = 0,60,% 1,64 + = 1 6,08 1,64 0,60 6,08 + 1,64 0,60) = 0,90 5,096 7,064) = 0,90 % 5,096; 7,064] ã = = 1,64 0,60 = 0,984. Exercício: Obtenha os intervalos de confiança de 95% e 99% e o erro de estimação para a média populacional da especificação da peça do exemplo anterior. Exemplo: De uma população de 1000 elementos com distribuição aproximadamente Normal com = 400, tira-se uma amostra de 25 elementos, obtendo-se = 150. Obtenha o intervalo de confiança para um nível de significância de = 5%. σ = 1 = 400 25,% = ±1,96 1000 25 1000 1 = 3,95 + = 1 150 1,96 3,95 150 + 1,96 3,95 = 0,95 142,25 157,75 = 0,95 % = 142,25; 157,75 ã = = 1,96 3,95 = 7,742. 1

Exercício: Obtenha os intervalos de confiança de 90% e 99% para a média populacional e o erro de estimação dos dados do exemplo anterior. 1.4.1.2. Intervalo de Confiança para a média populacional com variância populacional desconhecida Pelo TCL tem-se que ~ ; ~0; 1. No entanto, quando não se conhece a variância populacional, situação mais comum na prática, se as amostras forem pequenas tem-se que utilizar a distribuição. Sabe-se ainda que é: ~, desta forma, um intervalo com 1 α 1001 α% de confiança para ; Onde é o desvio padrão amostral e ;. ; ;. é o valor tabelado da distribuição Observação: 1. Denota-se ; por erro padrão ou erro de estimação; 2. Quando, a distribuição se torna equivalente a distribuição Gaussiana. Por esta razão, alguns autores sugerem o uso da distribuição Gaussiana quando > 30. Exemplo: A amostra 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extraída de uma população aproximadamente normal. Deseja-se construir um intervalo de confiança para com um nível de 95% de confiança.

8,7 = ) 4 2 1 = 1 = 10 1 = 9 ; = ;,% 2,262 ) ) = ; % 8,7 2,262 2 ; + ; 10 % 7,27; 10,13] ; 8,7 + 2,262 2 10 ã = ; = 2,262 2 10 = 1,43. Exercício: Obtenha os intervalos de confiança de 90% e 99% para a média populacional e o erro de estimação dos dados do exemplo anterior. Exercício: Por meio de uma amostra aleatória simples referente ao numero de ocorrências criminais num certo bairro na cidade de São Paulo, coletada durante 30 dias, obteve-se os seguintes valores: 7 11 8 9 10 14 6 8 8 7 8 10 14 12 14 12 9 11 13 13 8 6 8 13 10 14 5 14 10 10 Construa um intervalo de confiança de 90%, 95% e 99%. 1.4.2. Intervalo de confiança para a proporção populacional Pelo TCL tem-se que ~, = intervalo com 1 = 1001 % de confiança para é: = 1 ; + ~0, 1. Logo, o 1. Observação: 1. Denota-se = = por erro padrão ou erro de estimação;

2. Tem-se que e para suficientemente grande σ. Para alguns autores e estatísticos, uma amostra é suficientemente grande quando 5 e 1 ) 5; 3. Se a população é finita e de tamanho conhecido, e se 0,05, σ ), onde é o fator de correção para população finita; 4. Pode-se utilizar 1 ) = se desejar ser conservador na estimativa da variância populacional. Exemplo: Pretende-se estimar a proporção p de peças que atendem às especificações/exigências para exportação. Em uma amostra selecionada de tamanho 200, escolhida ao acaso, observou-se que 160 deles apresentam as exigências atendidas. O que pode-se dizer da proporção p na população em geral? (use = 5%) : = = 160 200 = 80% ) ) =,% = ±1,96 1 ) ; + ) 1 0,81 0,8) 0,81 0,8) % ) = 0,8 1,96 ; 0,8 + 1,96 200 200 %) ) = [0,745; 0,855]. ) 0,81 0,8) ã = 1 = 1,96 = 0,055. 200 Exercício: Obtenha os intervalos de confiança de 90% e 99% para a proporção populacional e o erro de estimação dos dados do exemplo anterior. Exercício: O setor de controle de qualidade esta intervindo em um processo produtivo por acreditar que a proporção de peças fora das especificações esta muito elevado. Uma amostra de 100 peças foi avaliada e observou-se 20 peças fora das

especificações. Sendo 1%, determine um intervalo de confiança para a proporção de peças defeituosas deste processo produtivo. : %) ) = [9,72%; 30,28%] Exercício: Para se estimar a porcentagem de alunos de um curso favoráveis a modificação do currículo escolar, tomou-se uma amostra de 100 alunos, dos quais, 80 foram favoráveis. Construa um intervalo de confiança a 96% para a proporção de todos os alunos favoráveis a modificação. : %) ) = [71,8%; 88,2%] 1.4.3. Intervalo de confiança para a variância populacional Uma variável aleatória obtida por = ) é definida como com 1) graus de liberdade. Desta forma, o intervalo com 1 ) = 1001 )% de confiança para é: ) 1) 1) ) = ;. ; ; Onde = ) é o desvio padrão amostral e ; e ; são os valores tabelados da distribuição. Exemplo: Observou-se a volatilidade (variância) da 4 durante 42 dias úteis e obteve-se uma variância amostral de = 0,45 45% ). Deseja-se construir um intervalo de confiança de 95% para a volatilidade da 4. ; = ;,% = 60,561 ; = ;,% = 25,215 ) 1) 1) ) = ; ; ; % 41 0,45 41 0,45 ) = ; 60,561 25,215 % ) = [30,42%; 73,17%]

Exercício: Obtenha os intervalos de confiança de 98% e 99% para a variância populacional dos dados do exemplo anterior. Exemplo: Observou-se a volatilidade (variância) da 5 durante 42 dias úteis e obteve-se uma variância amostral de = 0,55 55% ). Deseja-se construir um intervalo de confiança de 98% e 99% para a volatilidade da 5. Observação: Quando a média populacional é conhecida, o intervalo com 1 ) = 1001 )% de confiança para é: ) ) = ; ; ;. Onde = ) é o desvio padrão amostral e ; e ; são os valores tabelados da distribuição. 1.5. Cálculo de tamanho de amostra 1.5.1. Cálculo de tamanho de amostra para a estimação da média populacional Pelo TCL tem-se que ~, = ~0, 1), então: = = = = =. Onde = é o erro de estimação aceitável. Para o caso em que a população é finita, inclue-se o fator de correção, então: = 1) +.

1.5.2. Cálculo de tamanho de amostra para a estimação da proporção populacional Pelo TCL tem-se que ~, ) = ) ~0, 1), então: = 1 ) 1 ) = = 1 ) = 1 ) Onde = é o erro de estimação aceitável. = 1 ). Para o caso em que a população é finita, inclue-se o fator de correção, então: = 1 ) 1) + 1 ). Exemplo: O Instituto DataVoto desenvolverá no próximo mês pesquisa de intenção de voto, para um candidado particular, estabelecendo um intervalo de confiança de 99%. Deseja que a proporção amostral esteja entre ±3% da proporção populacional. Em uma campanha eleitoral recente, estimou-se que 220 eleitores, entre 500 entrevistados, preferem este candidato em particular. Deseja-se estimar o tamanho de amostra adequado considerando população finita de tamanhos 1000, 10000, 20000 e população infinita. = 1000 = = = = 220 500 = 44% = 2,576 = 3% 1 ) 1) + 1 ) 10002,576) 0,441 0,44) 1000 1)0,03 + 2,576) 645 ; 0,441 0,44)

100002,576) 0,441 0,44) 10000 = 10000 1)0,03 + 2,576) 1537 ; 0,441 0,44) = 20000 = 200002,576) 0,441 0,44) 20000 1)0,03 + 2,576) 1665 ; 0,441 0,44) = 1 ) = 2,576) 0,441 0,44) 0,03 1817. Exercício: Estime o tamanho de amostra adequado para um erro de estimação de ±2% considerando população finita de tamanhos 5000 e 50000 e população infinita. 1.6. Intervalo de Confiança (duas populações) 1.6.1. Intervalo de confiança para diferença de médias ) com variâncias e conhecidas. Seja ~ ; ) e ~ ; ) variáveis aleatórias associadas às populações 1 e 2. A partir de amostras e retiradas das populações, para e conhecidos, o intervalo com 1 ) = 1001 )% de confiança para ) é: ) ) = ) + ; ) + Onde é a média da amostra e é a média da amostra. +. Observação: O objetivo deste intervalo de confiança é concluir se há diferença entre as duas médias. Assim, se o intervalo de confiança contiver o valor zero, não tem-se evidencias significativas para afirmar que uma média difere da outra. Exemplo: Seja duas variáveis aleatórias Gaussianas e cujas variâncias populacionais são = 3,64 e = 4,03. Deseja-se construir um intervalo de 95% de confiança para a diferença de médias populacionais, considerando as amostras obtidas apresentadas na tabela abaixo: AMOSTRA 1 = 32 = 16,20

AMOSTRA 2 40 = 14,85 ) ) = ) + ; ) + +. % 16,20 14,85) 1,96 3,64 32 + 4,03 40 ; 16,20 14,85) + 1,96 3,64 32 + 4,03 40 % 0,44; 2,26] Observação importante: O intervalo de confiança não contém o zero, ou seja, pode-se concluir, ao nível de 95%, que há evidências estatísticas para afirmar que existe diferença entre as médias populacionais entre as populações. Exercício: Seja o número de peças produzidas, de duas unidades de negócios, duas variáveis aleatórias Gaussianas e cujas variâncias populacionais são = 10,5 e = 15,0. Deseja-se construir um intervalo de 98% de confiança para a diferença de peças produzidas (médias populacionais), considerando as amostras obtidas apresentadas na tabela abaixo. Pode-se afirmar que as unidades de negócio apresentam a mesma produtividade? UNIDADE DE NEGÓCIO 1 = 25 = 121,5 UNIDADE DE NEGÓCIO 2 = 35 = 100,5 1.6.2. Intervalo de confiança para diferença de médias com variâncias e desconhecidas, porém iguais = Neste caso, o intervalo com 1 = 1001 % de confiança para é: = ; 2 1 + 1 ; + ; 2 1 + 1. Onde é a variância amostral ponderada, ou seja, =. 1.6.3. Intervalo de confiança para diferença de médias com variâncias e desconhecidas, porém diferentes Neste caso, o intervalo com 1 = 1001 % de confiança para é: = ; 2 + ; ; 2 +

Onde os graus de liberdade são dados pela fórmula de Satterthwaite 1946): + =. + 1 1 Exercício: Seja as vendas (em $100000) durante e após a crise de 2008 duas variáveis aleatórias Gaussianas e com variâncias populacionais desconhecidas. Construia dois intervalos de 95% de confiança para a diferença das vendas (médias populacionais), um intervalo para o caso em que = e um intervalo para o caso em que, considerando as amostras obtidas apresentadas na tabela abaixo: VENDAS DURANTE A CRISE = 30 = 20,20 = 3,50 VENDAS DEPOIS DA CRISE = 42 = 28,50 = 4,50