Teorema do Limite Central e Intervalo de Confiança



Documentos relacionados
Teorema do Limite Central e Intervalo de Confiança

Capítulo 4 Inferência Estatística

AULA 04 Estimativas e Tamanhos Amostrais

Teorema Central do Limite e Intervalo de Confiança

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

Modelos de Probabilidade e Inferência Estatística

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Probabilidade e Estatística, 2009/2

COMPARAÇÃO DE SISTEMAS USANDO DADOS DE AMOSTRAS. Capítulo 13 do livro: The Art of Computer Systems Performance Analysis

Teste de Hipótese e Intervalo de Confiança. Parte 2

MAE116 - Noções de Estatística

Probabilidade. Distribuição Binomial

Intervalos Estatísticos para Uma Única Amostra

cuja distribuição é t de Student com n 1 graus de liberdade.

Aula 8 Intervalos de confiança para proporções amostras grandes

Aula 12 Teste de hipótese sobre proporções amostras grandes

Aula 8. Teste Binomial a uma proporção p

AULA 12 Inferência a Partir de Duas Amostras

Distribuição Binomial e Normal

IND 1115 Inferência Estatística Aula 8

Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida

Tópico 9. Teste t-student

Estatística II Aula 4. Prof.: Patricia Maria Bortolon, D. Sc.

MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.

Probabilidade e Estatística - EST0003 Intervalos Estatísticos para uma única Amostra

Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos

Estatística - exestatmedposic.doc 25/02/09

Unidade 5.2. Teste de hipóteses. Hipótese estatística. (uma população) Formulando as hipóteses. Teste de Hipóteses X Intervalo de Confiança

Análise de Regressão Linear Simples III

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula Distribuição Uniforme 11/13 1 / 19

Medidas de Tendência Central

AULAS 08 E 09 Distribuição de Probabilidade Normal

Medida de Tendência Central

Aula 6 Propagação de erros

Aula 1 Variáveis aleatórias contínuas

Probabilidade e Estatística, 2011/2

Regressão linear múltipla. Prof. Tatiele Lacerda

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Inferência sobre duas proporções

AULA 03 Estimativas e tamanhos amostrais

Conceitos de Produtividade Industrial. 6. Estudo de Tempos e Métodos. 6. Estudo de Tempos e Métodos 09/05/2012. Profº Spim

CONHECIMENTOS ESPECÍFICOS

Então, a distribuição de converge para a distribuição normal com média nμ e variância nσ 2

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.

x = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem.

Intervalo de Confiança - Margem de Erro

Testes Qui-Quadrado - Teste de Aderência

Testes de variância e Análise de Variância (ANOVA)

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana

Capítulo 5. Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão

1 Introdução. 1.1 Importância da Utilização da Amostragem

A vida sem reflexão não merece ser vivida Sócrates Disciplina: ESTATÍSTICA e PROBABILIDADE

AULA 11 Experimentos Multinomiais e Tabelas de Contingência

Técnicas estatísticas para análise de dados e de resultados de modelos de simulação

Teste de hipóteses para médias e proporções amostrais

Distribuições Conjuntas (Tabelas de Contingência)

Erros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Distribuição Normal de Probabilidade

Probabilidade III. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período

Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292

DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)

BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados

Medidas de dispersão e assimetria

Análise de Regressão. Notas de Aula

MEDIDAS DE TENDÊNCIA CENTRAL II

Aula 6 Medidas de Tendência Central

Introdução. Ou seja, de certo modo esperamos que haja uma certa

Estimativas e Tamanhos de Amostras

AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA

Estatística AMOSTRAGEM

3 Modelos de Simulação

f (x) = a n x n + a n - 1 x n a 0 = 0 (a n > 0)

ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior

ESTATÍSTICA PARTE 1 OBJETIVO DA DISCIPLINA

Estatística. Slide 0. Ana M. Abreu /07

Medidas de Localização

Controle Estátistico de Processo.

ESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL DEPARTAMENTO DE MATEMÁTICA PROBABILIDADES E ESTATÍSTICA Teste Final 2009/2010. Curso: 12/06/2010.

Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência

A lei dos senos. Na Aula 42 vimos que a Lei dos co-senos é. a 2 = b 2 + c 2-2bc cos Â

O QUE SÃO E QUAIS SÃO AS PRINCIPAIS MEDIDAS DE TENDÊNCIA CENTRAL EM ESTATÍSTICA PARTE I

Aula 1 Assimetria e Curtose

5. Derivada. Definição: Se uma função f é definida em um intervalo aberto contendo x 0, então a derivada de f

2 Limites e Derivadas. Copyright Cengage Learning. Todos os direitos reservados.

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

Avaliação e Desempenho Aula 1 - Simulação

Para mais de duas variáveis independentes, em função de uma variável dependente.

Capítulo 8 Estimativa do Intervalo de Confiança. Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc.

População e Amostra POPULAÇÃO AMOSTRA AMOSTRAGEM TIPOS DE AMOSTRAGEM I. Amostra probabilística: II. Amostra não-probabilística

Unidade Medidas de Posição ou de Tendência Central

Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira INEP Ministério da Educação MEC. Cálculo do Conceito ENADE

Lição 5 Medidas Descritivas Medidas de Dispersão

CAPÍTULO 8. de Variância - ANOVA ANOVA. Análise

Química Analítica IV ERRO E TRATAMENTO DE DADOS ANALÍTICOS

Carta de controle para o desvio-padrão

Estatística e Probabilidade Aula 08 Estimativas e Tamanho Amostral. Prof. Gabriel Bádue

3 Distribuições Teóricas Contínuas

Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar:

Transcrição:

Probabilidade e Estatística Teorema do Limite Central e Intervalo de Confiança

Teorema do Limite Central

Teorema do Limite Central Um variável aleatória pode ter uma distribuição qualquer (normal, uniforme,...), possuindo uma média μ e um desvio-padrão σ. Se, ao invés de tirarmos uma única amostra (digamos, 100 coletas), tirarmos várias amostras de tamanho n (digamos, 20 amostras compostas por cinco coletas: 20x5=100 coletas) e analisarmos a distribuição das médias de cada amostra de tamanho n, observaremos que:

Teorema do Limite Central À medida que o tamanho n da amostra aumenta, a distribuição das médias amostrais tende a uma distribuição normal. A média das médias amostrais tenderá à média populacional: μ x = μ = x = m x O desvio padrão das médias amostrais será o Erro-padrão da média, dado por: σ = σ x n

Teorema do Limite Central Observações importantes: Quando maior o tamanho das amostras, a distribuição das médias será mais próxima de uma distribuição normal. Regra prática: para n>30, a distribuição das médias amostrais pode ser aproximada satisfatoriamente por uma distribuição normal. Se a distribuição da variável x for originalmente uma distribuição normal, então a distribuição das médias amostrais terá distribuição normal para qualquer tamanho amostral n.

O QUE HÁ DE EXTRAORDINÁRIO NO TEOREMA DO LIMITE CENTRAL? ELE NOS DIZ QUE QUALQUER QUE SEJA A FORMA DA DISTRIBUIÇÃO ORIGINAL, SUAS MÉDIAS RESULTAM NUMA DISTRIBUIÇÃO NORMAL. PARA ENCONTRARMOS A DISTRIBUIÇÃO DA MÉDIA, BASTA CONHECERMOS A MÉDIA DA POPULAÇÃO E O DESVIO PADRÃO. TODAS AS TRÊS DENSIDADES ACIMA TÊM A MESMA MÉDIA E DESVIO PADRÃO. APESAR DE SUAS FORMAS DIFERENTES, QUANDO n=10, AS DISTRIBUIÇÕES DAS MÉDIAS DAS AMOSTRAS SÃO PRATICAMENTE IDÊNTICAS.

Estimativa de Média Populacional Supondo que coletemos 20 amostras de alturas de alunos e considerando que esta representa efetivamente a população de alunos da universidade. Como estimativa da média da população (μ) de alunos, poderíamos utilizar: A média A moda A mediana Ponto médio

Estimativa de Média Populacional Em geral, entretanto, a média amostral x do conjunto de dados é a melhor estimativa de uma média populacional. Obs.: Uma estimativa é um valor específico, ou um intervalo de valores usados para aproximar um parâmetro populacional. Um estimador é uma característica da amostra (Ex: x ), utilizado para obtermos uma aproximação do parâmetro populacional.

Estimativa de Média Populacional Razões para utilizarmos a média amostral como um estimador de uma média populacional μ: A distribuição das médias amostrais tende a apresentar menor variação do que distribuições de outras características amostrais (mediana ou moda) É um estimador não tendencioso da média populacional μ: tende a centrar-se em torno de μ; tende a um valor central que é o próprio valor de μ x

Estimativa de Média Populacional Como a média amostral é um valor pontual, chamamos a este de estimador pontual. Portanto, a média amostral x é a melhor estimativa pontual da média populacional μ. No nosso exemplo, a suposição da média amostral x das 20 amostras é a melhor estimativa pontual da população de alunos da universidade. Entretanto,...

Estimativa de Média Populacional O que nos garante que as 20 amostras compõem uma boa estimativa da população? Associamos, assim, uma estimativa pontual a uma outra estimativa: INTERVALO DE CONFIANÇA ou ESTIMATIVA INTERVALAR

Intervalo de Confiança É uma amplitude (ou um intervalo) de valores que tem a probabilidade de conter o valor verdadeiro da população Observa-se que, na definição de intervalo de confiança, está associado uma probabilidade. A esta probabilidade chamamos de: Nível de Confiança Grau de Confiança, ou Coeficiente de Confiança

Intervalo de Confiança Probabilidade{ c c 1 2 } 1 μ = α O intervalo (c1,c2) é chamado de intervalo de confiança da média da população. α é o nível de significância. 100(1- α) é o nível de confiança em %. 1- α é o coeficiente de confiança.

Nível de Confiança (NC) É a probabilidade 1-α (comumente expressa percentualmente) do intervalo de confiança conter o valor verdadeiro, o parâmetro populacional Graças ao Teorema do Limite Central, pode-se usar a Distribuição Normal Padronizada (z) para construir os Intervalos de Confiança (calcular os limites do Intervalo) 1- α Nível de Confiança

Nível de Confiança (NC) Comumente utiliza-se NC de: 90% α = 0,1 95% α = 0,05 99% α = 0,01 1- α NC = 95% 0,025 0,025

Intervalo de Confiança Observações: O Intervalo de Confiança consiste em um intervalo na escala z e está associado a um NC. 0,025 1- α NC = 95% 0,025 A B Intervalo de Confiança A < z < B

Intervalo de Confiança Conclusão: Se coletarmos várias amostras de 20 alunos e construirmos um intervalo de 95% de confiança para cada uma, a longo prazo, 95% destes intervalos conteriam efetivamente a média da população μ 0,025 A 1- α NC = 95% Intervalo de Confiança A < z < B B 0,025

CONSIDERE UMA ARQUEIRA ATIRANDO EM UM ALVO. SUPONHA QUE ELA ACERTA NO CENTRO COM RAIO DE 10 CM 95% DAS VEZES. OU SEJA, ERRA APENAS UMA VEZ A CADA 20 TENTATIVAS. SENTADO ATRÁS DO ALVO ENCONTRA-SE UM BRAVO DETETIVE, QUE NÃO VÊ ONDE ESTÁ O CENTRO. A ARQUEIRA ATIRA A PRIMEIRA FLECHA..

CONHECENDO O NÍVEL DA HABILIDADE DA ARQUEIRA, O DETETIVE DESENHA UM CÍRCULO COM 10 CM DE RAIO AO REDOR DA FLECHA. ELE TEM 95% DE CONFIANÇA DE QUE O SEU CÍRCULO INCLUI O CENTRO DO ALVO! ELE RACIOCINOU QUE SE DESENHASSE CÍRCULOS COM 10 CM DE RAIO AO REDOR DE MUITAS FLECHAS, OS SEUS CÍRCULOS INCLUIRIAM O CENTRO DO ALVO EM 95% DOS CASOS..

Significado do I.C.

Como melhorar a confiança? AUMENTANDO O TAMANHO DO CÍRCULO OU, MELHORANDO A MIRA DA ARQUEIRA! O PRIMEIRO MÉTODO É EQUIVALENTE A ALARGAR O INTERVALO DE CONFIANÇA. QUANTO MAIOR FOR A MARGEM DE ERRO, MAIS CERTO VOCÊ ESTÁ DE QUE O VALOR DESEJADO ENCONTRA-SE NO INTERVALO:

Intervalo de Confiança Valor Crítico: Z α/2 Corresponde ao valor de fronteira da área de α/2 na cauda direita da distribuição normal padronizada. É o número na fronteira que separa os valores estatísticos amostrais prováveis de ocorrerem, dos valores que tem pouca chance de ocorrer. 0,025 Z α/2 1- α NC = 95% 0,025 É um escore z com a propriedade de separar uma área de α/2 na cauda direita da distribuição normal padronizada Intervalo de Confiança A < z < B

Observação Importante Pelo Teorema do Limite Central, sabemos que as médias amostrais x tendem a distribuir-se por uma normal. Assim, a área sombreada apresenta chance relativamente pequena de conter uma média amostral. Denotando de α/2 a área sombreada de cada extremo, há uma probabilidade de α da média amostral estar em um dos extremos. Pela regra do complemento, há uma probabilidade de 1 - α da média amostral estar na região não sombreada. Por que se usa a Distribuição Normal Padronizada? Pelo Teorema do Limite Central, as médias amostrais distribuem-se normalmente em torno da média das médias. Então, pode-se usar a Normal Padronizada para cálculo das áreas (probabilidades).

Exercício: Valores Z α/2 Calcule o valor crítico Z α/2 NC de 90%. que corresponde ao NC = 0,90 => α=0,10 => α/2=0,05 Na tabela de Distribuição Normal α/2 = 0,05 Área entre Z=0 e Z=α/2 é 0,45 Z α/2 = 1,645

Exercício Calcule o valor crítico Z α/2 que corresponde ao NC de 95%. NC = 0,95 => α=0,05 => α/2=0,025 Na tabela de Distribuição Normal α/2 = 0,025 Área entre Z=0 e Z=α/2 é 0,475 Z α/2 = 1,96

Exercício Calcule o valor crítico Z α/2 que corresponde ao NC de 99%. NC = 0,99 => α=0,01 => α/2=0,005 Na tabela de Distribuição Normal α/2 = 0,005 Área entre Z=0 e Z=α/2 é 0,495 Z α/2 = 2,575

Exercícios O processo de produção das unidades de caixa de controle de um tipo de motor foi modificado recentemente. Antes da modificação, os dados históricos indicavam que os diâmetros do orifício dos mancais nas caixas eram distribuídos normalmente com σ=0,100mm. Acredita-se que a modificação no processo não tenha alterado a distribuição ou o desvio padrão, mas o valor do diâmetro médio pode ter mudado. Seleciona-se uma amostra de 40 caixas e mede-se o diâmetro do orifício para cada uma, resultando num diâmetro médio de 5,426mm. Calcule um IC para o diâmetro médio real (populacional) do orifício usando um NC de 90%.

Resposta z α 2 = x σ x n xs 5,426 1,645 = 0,026 = xs 5,426 xs = 5,452 0,100 40 xi 5,426 1,645 = 0,026 = xi 5,426 xi = 5,400 0,100 40 O que isto significa? µ=5,426±0,026 ou 5,400<µ<5,452 Existe 90% de probabilidade do intervalo de 5,400mm a 5,452mm conter a média populacional de diâmetro do orifício do mancal

Exercício Na engenharia de produtos, é importante considerar os pesos das pessoas, de modo a evitar sobrecargas (aviões, elevadores) ou falhas (cadeiras que se quebram). Dado que a população de homens dos EUA (ano?) tem pesos distribuídos normalmente com média 78,47Kg e desvio-padrão 13,61Kg, determinar a probabilidade de: (a) um homem escolhido aleatoriamente pesar mais de 81,65Kg. (b) em 36 homens escolhidos aleatoriamente, o peso médio ser superior a 81,65Kg.

Solução (a) um homem escolhido aleatoriamente pesar mais de 81,65Kg. Como trata-se de um valor individual proveniente de uma população com distribuição normal, calcular o valor de z diretamente: z x μ = = σ 81,65 78,47 13,61 = 0,2337 Da Tabela A-2, a área correspondente a z=0,2337 é 0,0910. A probabilidade desejada é, pois: P(z>0,2337) = 0,5 0,0910 = 0,4090

Solução (b) em 36 homens escolhidos aleatoriamente, o peso médio ser superior a 81,65Kg. Como estamos lidando com a média para um grupo de 36 valores, usamos o Teorema do Limite Central (cada valor individual seria uma amostra?) μ σ x x = μ = 78,47 = σ n = 13,61 36 = 2,2683 O escore z de interesse é agora calculado: z x μx 81,65 78,47 = = = 1,4019 P( z σ 13,61 x 36 > 1,4019) = 0,5 0,4192 = 0,0808

Comentários Há uma probabilidade de 0,4090 de um homem pesar mais que 81,65Kg, mas a probabilidade de 36 homens terem peso médio superior a 81,65Kg é de apenas 0,0808! É muito mais fácil um único indivíduo afastarse da média, do que um grupo de 36 indivíduos.