Introdução a Inferência Disciplinas: Cálculo das Probabilidades e Estatística I Universidade Federal da Paraíba Prof a. Izabel Alcantara Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 1 / 25
Definições Algumas definições de Inferência Estatística Parâmetros: são números que caracterizam uma população. Exemplos: X N(µ, σ 2 ), os parâmetros são µ e σ 2 ; X B(n, p), os parâmetros são n e p. Estatística: é um número que caracteriza uma amostra. Uma estatística é uma função apenas dos valores da amostra. Exemplos: X = X n e variância S 2 = x 2 n x 2 n 1 ; proporção amostral número de elementos amostrais com a característica de interesse ˆp = n. Estimador: é uma estatística que tem propriedades ótimas para estimar (inferir) um parâmetro. Exemplos: X é o estimador da média µ; S 2 é o estimador da variância σ 2 ; ˆp é o estimador do parâmetro p da Binomial. Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 2 / 25
Propriedade dos estimadores Não viesado (ou não viciado ou não tendencioso) Refere-se aos estimadores que possuem a propriedade de em média se aproximar do verdadeiro valor do parâmetro. Em outras palavras, Seja {X 1, X 2,..., X n } uma amostra aleatória simples retirada da população X caracterizada pelo parâmetro θ e seja ˆθ um estimador de θ, Então, ˆθ é um estimador não viesado se Exemplos: E(ˆθ) = θ. 1. X é um estimador não viesado de µ (E( X) = µ); 2. S 2 = 3. ˆσ 2 = (X X) 2 n 1 é um estimador não viesado de σ 2 (E(S 2 ) = σ 2 ); (X X) 2 n é um estimador viesado de σ 2 (E(ˆσ 2 ) = (n 1)σ2 n ). Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 3 / 25
Propriedade dos estimadores Consistência Refere-se aos estimadores nos quais a diferença entre o estimador ˆθ e o parâmetro θ tende a ser pequena a medida que o tamanho da amostra aumenta, isto é, quando n, temos E[ˆθ] = θ e V ar[ˆθ] = 0. Exemplos: Se X tem distribuição Normal(µ, σ 2 ), então: 1. X é consistente para µ: E( X) = µ e lim V ar( X) σ 2 = lim n n n = 0; 2. S 2 é consistente para σ 2 : E(S 2 ) = σ 2 e lim V 2σ 4 n ar(s2 ) = lim n n 1 = 0; 3. ˆσ 2 é consistente para σ 2 : (n 1)σ 2 lim n E(ˆσ2 ) = lim = σ 2 e n n lim V n 1 n ar(ˆσ2 ) = lim n n 2 2σ 4 = 0. Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 4 / 25
Propriedade dos estimadores Eficiência Estatística Dado dois estimadores ˆθ 1 e ˆθ 2 para o parâmetro θ, dizemos que o estimador ˆθ 1 é mais eficiente que o estimador ˆθ 2 se V ar(ˆθ 1 ) < V ar(ˆθ 2 ). Exemplo: ˆσ 2 é mais eficiente que S 2, isto é, (n 1) 2 < n 2 1 n 2 < 1 (n 1) 2 n 1 n 2 < 1 (n 1)2σ4 n 1 n 2 < 2σ4 n 1 V ar(ˆσ 2 ) < V ar(s 2 ) Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 5 / 25
Propriedade dos estimadores Exemplo de Eficiência Estatística: Desejamos comprar um rifle dos quatro rifles: (a), (b), (c) e (d). Foi feito um teste em cada rifle, que consiste em fixá-lo num cavalete, mirar o centro de um alvo e disparar 15 tiros. Os resultados estão apresentados na figura abaixo: Os rifles (a) e (b) se comportam como os estimadores não viesados, isto é, em média acertam o centro do alvo (parâmetro). O rifle (c) é o mais eficiente de todos os rifles, visto que ele apresenta a menor variação dos tiros, porém ele não tende a acertar o alvo. Queremos um rifle que em média acerte o alvo e que tenha uma boa precisão, isto é, queremos o rifle mais consistente e eficiente. Nesse contexto, os rifles (a) e (b) são consistentes, só que o rifle (a) é mais eficiente. Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 6 / 25
Em estatística, um intervalo de confiança (IC) é um intervalo estimado de um parâmetro estatístico. Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. Quão prováveis são estas estimativas é determinado pelo coeficiente de confiança (denotado por (1 α)). Os valores Li e Ls que satisfaze P (Li θ Ls) = 1 α, são os limites do intervalo de confiança denotado por IC(θ, 1 α) = [Li; ls]. O comprimento do intervalo de confiança é definido por Comp(θ, 1 α) = Ls Li. Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 7 / 25
Quanto maior a probabilidade do intervalo conter o parâmetro, maior será o intervalo. Intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Por exemplo, um IC pode ser usado para descrever quão confiáveis são os resultados de uma pesquisa. Sendo todas as outras coisas iguais, uma pesquisa que resulte num IC com comprimento pequeno é mais confiável do que uma que resulte num IC com comprimento maior. Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 8 / 25
Considere que uma amostra {X 1, X 2,..., X n } foi retirada da população X e sejam: z tal que P (0 Z z) = 1 α 2 (Tabela da Normal Padrão) e t (gl) o valor crítico da Tabela da t-student com gl graus de liberdade (Bilateral). Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 9 / 25
IC para média µ com X N(µ, σ 2 ) e σ 2 conhecido [ IC(µ, 1 α) = X zσ ] zσ ; X +, n n em que z tal que P (0 Z z) = 1 α 2 (Tabela da Normal Padrão) Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 10 / 25
IC para média µ com X N(µ, σ 2 ) e σ 2 conhecido Exemplo (1): Uma máquina enche pacotes de café segundo uma distribuição normal com uma variância igual a 100g 2. Ela estava regulada para encher os pacotes com 500g, em média. Agora, ela se desregulou, e queremos saber qual a nova média µ. Uma amostra de 25 pacotes apresentou uma média igual a 485g. Construa um intervalo de confiança, com 95% de confiança para µ. Solução: Temos que a máquina enche os pacotes de café segundo N(µ, 100) e que uma amostra de tamanho n = 25 resultou em X = 485. Então, [ IC(µ, 95%) = X zσ ] zσ 1, 96 10 1, 96 10 ; X + = [485 ; 485 + ] n n 25 25 IC(µ, 95%) = [481,08; 488,92] Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 11 / 25
IC para média µ com X N(µ, σ 2 ) e σ 2 conhecido Exemplo (2): A resistência à tração do aço inoxidável produzido numa certa usina permanecia estável, com uma resistência média de 72kg/mm 2 e um desvio-padrão de 2,0kg/mm 2 com distribuição normal. Recentemente a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas. Os testes apresentaram resistência média de 75kg/mm 2. Considere que o desvio-padrão não mudou. Com uma confiança de 95%, determine o intervalo de confiança para resistência média. Solução: A resistência à tração do aço inoxidável tem distribuição N(µ, 2 2 ) (σ = 2) e uma amostra de tamanho n = 10 resultou em X = 75. Então, [ IC(µ, 95%) = X zσ ] zσ 1, 96 2 1, 96 2 ; X + = [75 ; 75 + ] n n 10 10 IC(µ, 95%) = [73,76; 76,24] Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 12 / 25
IC para média µ com X N(µ, σ 2 ) e σ 2 desconhecido [ IC(µ, 1 α) = X ts ] ts ; X + n, n em que t é o valor da tabela da t-student com gl = n 1 graus de liberdade e significância α (bilateral). α = Significância; 1 α = Confiância. significância = 1 - confiança. Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 13 / 25
IC para média µ com X N(µ, σ 2 ) e σ 2 desconhecido Exemplo (3): De 50.000 válvulas fabricadas por uma companhia retira-se uma amostra de 30 válvulas e obtém-se a vida média de 800 horas e a variância de 100 horas. Sabendo que o tempo de vida das válvulas X segue distribuição normal, qual o intervalo de confiança de 99% para vida média das válvulas? Solução: Neste caso, desconhecemos σ 2 e então usamos o desvio-padrão amostral S e a Tabela da t-student com n 1 graus de liberdade. Temos que n = 30, X = 800, S = 100 = 10, α = 1 0,99 = 0,01 e gl = 30 1 = 29, que corresponde a t = 2, 756. Então: [ IC(µ, 99%) = X ts ] ts 2, 756 10 2, 756 10 ; X + n = [800 ; 800+ ] n 30 30 IC(µ, 99%) = [794,97; 805,03] Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 14 / 25
IC para média µ com X N(µ, σ 2 ) e σ 2 desconhecido Exemplo (4): A DeBug Company vende um repelente de insetos que alega ser eficiente pelo prazo de 400 horas. Supondo que o tempo de eficiência do repelente segue distribuição normal. Uma análise de nove itens escolhidos aleatoriamente acusou uma média de eficiência de 380 horas com desvio-padrão de 60 horas. Determine o intervalo de confiança com 90% de confiança para o tempo médio em horas de ação do repelente. Solução: Como desconhecemos σ 2, vamos usar o desvio-padrão amostral S e a Tabela da t-student com n 1 graus de liberdade. Temos que n = 9, X = 380, S = 60, α = 1 0,90 = 0,10 e gl = 9 1 = 8, que corresponde a t = 1,86. Então: [ IC(µ, 90%) = X ts ] ts 1, 86 60 1, 86 60 ; X + n = [380 ; 380 + ] n 9 9 IC(µ, 90%) = [342,8; 417,2] Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 15 / 25
IC para média µ, para grandes amostras [ IC(µ, 1 α) = X zs ] zs ; X +, n n em que z tal que P (0 Z z) = 1 α 2 (Tabela da Normal Padrão) Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 16 / 25
IC para média µ, para grandes amostras Exemplo (5): De experiências passadas, sabe-se que a altura das crianças de 5 a série do 1 a grau é de aproximadamente 150 cm. Colhendo uma amostra de 40 crianças, observou-se a média de 154 cm com desvio-padrão de 10 cm. Qual é o intervalo de confiança de 99% para média da população? Solução: Temos que n = 40, X = 154, S = 10 e z = 2,57. Então: [ IC(µ, 99%) = X zs ] zs 2, 57 10 2, 57 10 ; X + = [154 ; 154 + ] n n 40 40 IC(µ, 99%) = [149,94; 158,06] Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 17 / 25
IC para média µ, para grandes amostras Exemplo (6): Uma companhia de seguros iniciará uma campanha extensa de propaganda para vender apólices de seguro de vida, se verificar que a quantia média segurada por família é inferior a R$10.000,00. Tomou-se uma amostra aleatória de 50 famílias que acusou um seguro médio de R$9.600,00 com desvio padrão de R$1.000,00. Com base na evidência amostral, determine o intervalo de confiança, com 99% de confiança para quantia média segurada por família. Solução: Temos que n = 50, X = 9.600, S = 1.000 e z = 2,57. Então: [ IC(µ, 99%) = X zs ] zs ; X + n n 2, 57 1000 2, 57 1000 IC(µ, 99%) = [9600 ; 9600+ ] = [9.236,5; 9.963,5] 50 50 Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 18 / 25
IC para proporção p [ ( ) ( )] ˆp(1 ˆp) ˆp(1 ˆp) IC(p; 1 α) = ˆp z ; ˆp + z n n em que z tal que P (0 Z z) = 1 α 2 (Tabela da Normal Padrão) Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 19 / 25
IC para proporção p Exemplo (7): Uma pesquisa de mercado para a Ford Motor Company revela que de uma amostra de 1220 residenciais selecionados aleatoriamente inclui 1054 que possuem um veículo (dados do Bureau of Census). Com base nesses dados, construa um intervalo de confiança de 95% de confiança para o percentual de todos os residências que possuem um veículo. Solução: Seja p a proporção de residências com veículo. Então, n = 1220, ˆp = 1054 1220 = 0, 86 e z = 1,96. Então: [ ( ) ( )] ˆp(1 ˆp) ˆp(1 ˆp) IC(p, 99%) = ˆp z ; ˆp + z n n [ ( ) ( )] 0,86 0,14 0,86 0,14 IC(p, 99%) = 0,86 1,96 ; 0,86 + 1,96 1220 1220 IC(p, 99%) = [0,8405; 0,8795] Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 20 / 25
IC para proporção p Exemplo (8): A cadeia de hotéis American Resort dá um teste de aptidão aos candidatos a emprego, e considera fácil uma questão do tipo múltipla escolha se ao menos 80% das respostas são corretas. Uma amostra aleatória de 6503 respostas a determinada questão apresenta 84% de respostas corretas. Construa o intervalo de confiança de 99% para a verdadeira percentagem de respostas corretas. Solução: Seja p a proporção de residências com veículo. Então, n = 6503, ˆp = 0,84 e z = 2,57. Então: [ ( ) ( )] ˆp(1 ˆp) ˆp(1 ˆp) IC(p, 99%) = ˆp z ; ˆp + z n n [ ( ) ( )] 0,84 0,16 0,84 0,16 IC(p, 99%) = 0,84 2,57 ; 0,84 + 2,57 6503 6503 IC(p, 99%) = [0,8283; 0,8517] Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 21 / 25
Tamanho da amostra Tamanho da amostra Estimar o parâmetro Tamanho da Amostra (n) µ n = z2 σ 2 E 2 (população infinita) µ n = Nz 2 σ 2 (N 1)E 2 +z 2 σ 2 (população finita) p n = z2 p E 2 0 (1 p 0 ) (a partir de um p 0 conhecido) p n = z2 4 E 2 (p desconhecido) E margem de erro; z é tal que P (0 < Z < z) = 1 α 2 (Tabela da Normal); N tamanho da população; p 0 uma estimativa prévia do parâmetro p, obtida por exemplo, numa amostra piloto. Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 22 / 25
Tamanho da amostra b 0.00 0.05 0.10 0.15 0.20 0.25 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 a Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 23 / 25
Tamanho da amostra f(p) = p(1 p) = p p 2 f (p) = 1 2p O máximo ocorre em p = 1 2, com valor máximo f(1 2 ) = 1 4. Note que, f(p) = p(1 p) 1 4 = f(1 2 ), Então, o maior tamanho de amostra que podemos ter é: n = z2 z2 1 p(1 p) E2 E 2 4 Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 24 / 25
Tamanho da amostra Tamanho da amostra n em função da Margem de erro E, com 95% de confiança d 0 50 100 150 200 250 300 350 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 c Departamento de Estatística (UFPB) Introdução a Inferência Prof a. Izabel Alcantara 25 / 25