Introdução à Inferência Estatística

Introdução à Inferência Estatística 1. População: conjunto de indivíduos, ou itens, com pelo menos uma característica em comum. Também será denotada por população objetivo, que é sobre a qual desejamos obter informações e/ou fazer inferências. Pode, ainda, ser chamada de Universo. Será denotada por: U u,u,u, u unidades elementares, i = 1,,..., N. i 1 3,u N N = n o de elementos, ou tamanho, da população. Exemplos: a) Residentes da cidade de São Carlos; b) Lote de peças produzido numa linha de produção de uma indústria; c) Eleitores do município de São Paulo, aptos a votar na eleição; d) Indivíduos do sexo masculino que sofrem de diabetes; etc, etc, etc... 1.1. Amostra: subconjunto, necessariamente finito, de uma população. é selecionada de forma que todos os elementos da população tenham a mesma chance de serem escolhidos. 1.1.1. Planejamentos Amostrais: são esquemas para coletas de dados numa pesquisa amostral. Existem vários tipos de planejamentos dos quais destacaremos: Amostra Aleatória Simples AAS Amostra Aleatória Estratificada AAE Amostra Aleatória por Conglomerados AAC

1.. Estudo Experimental: experimento no qual um tratamento é deliberadamente aplicado aos indivíduos (ou itens) a fim de observar a sua resposta. Exemplos: a) ensaios para se verificar a dureza de materiais; b) estudos caso-controle em epidemiologia; c) pesos de cobaias submetidas à diferentes dietas; Requer um Planejamento Experimental. No estudo experimental é muito importante determinar o número de elementos necessários, ou seja, o tamanho da amostra; É importante, também, planejar adequadamente a amostra de maneira a não interferir nos resultados.. Levantamentos de dados: a seguir, serão apresentadas algumas situações envolvendo levantamentos de dados..1. Uma amostra: sortear ao acaso n elementos de uma população para participar da amostra. Exemplos: a) dentre os eleitores de um município, sortear uma amostra para participar de uma pesquisa de intenção de votos; b) produzir uma amostra de peças de espuma, segundo uma específica formulação, para serem colocadas num teste de resistência à tração. Normalmente compara-se a amostra com um padrão já conhecido; Espera-se que a população seja homogênea (pouca variabilidade).

1 1 3 N n População Amostra.. Duas Amostras: amostras são retiradas de uma ou duas populações. quando dispomos de duas amostras, geralmente queremos realizar uma comparação entre as mesmas...1. Amostras independentes: nenhum elemento da primeira amostra interfere nos da segunda. a) dois tratamentos: tomar n elementos de uma única população e dividílos em dois grupos, de preferência de mesmo tamanho. (ou sortear, independentemente, duas amostras de uma mesma população) 1 1 3 n 1 n 1 + n = n 1 N n População Amostras

b) Duas populações: sortear n 1 elementos da primeira população e n da segunda e aplicar o mesmo tratamento em ambas. 1 1 3 n 1 N 1 n 1 + n = n 1 1 3 n N Populações Amostras... Amostras pareadas ou emparelhadas (dependentes): uma amostra observada em dois instantes diferentes: (antes/depois), (tempo 1, tempo ). 1 1 Fazer as diferenças: t d i = y i y i1 n n t 1 t Amostras

..3. k amostras: quando se tem k 3 amostras para comparar. a) k grupos independentes: classificar, ao acaso, n elementos em k grupos tal que n = n 1 + n +... + n k. O ideal é que todos os grupos sejam de mesmo tamanho: n 1 = n =... = n k A 1 : 1,,..., n 1 A : 1,,..., n k grupos independentes A k : 1,,..., n k A variável A é chamada de fator e os grupos A 1, A,..., A k são os tratamentos ou níveis do fator A. b) Medidas Repetidas: o mesmo grupo, de tamanho n, é observado em k instantes diferentes. 1 1 1 1... n n n n t 1 t t 3 t k

c) k grupos independentes com duas classificações: classificação de vários grupos quando se tem dois critérios (ou fatores) para a divisão dos mesmos. Considere, por exemplo, um fator com três níveis (A 1, A, A 3 ) e um segundo fator com dois níveis (B 1, B ), terem-se k = 3 = 6 grupos para serem comparados. A 1 B 1 A 1 B 1 B A 1 B A B 1 A B 1 B A B 6 grupos A 3 B 1 A 3 B 1 B A 3 B RESUMO 1 amostra 1 população amostras k amostras ( k 3 ) Independentes Dependentes Independentes Dependentes tratamentos (1 pop) 1 tratamento ( pop) dados pareados 1 fator fatores medidas repetidas

3. Conceitos em Inferência 3.1. Parâmetro Populacional Geralmente denotado por, é uma característica populacional de interesse que pode ser expressa através de uma quantidade numérica. É desconhecido e fixo. Exemplos: n o de desempregados, salário médio de uma categoria ou população, opinião a respeito de uma dada atitude, casos de dengue, tempo gasto com filhotes, tamanho da população tempo de vida n o de votos para um determinado candidato, produção agrícola, etc... 3.. Espaço Paramétrico Denotado por, é o conjunto dos possíveis valores de. Exemplos: = { < < }; = { 0 < < }; = { 0 1 }; = { ( 1, ) < 1 < e 0 < < }.

3.3. Amostra aleatória: representada pelas iniciais aa, é formada pela observação de n variáveis aleatórias X 1, X,..., X n, independentes e identicamente distribuídas, iid. 1, X, X n F (x) X, iid 3.4. Variável aleatória: uma variável aleatória ou va, é uma característica desconhecida, que pode variar de um indivíduo para outro da população e que, ao ser observada ou mensurada, deve gerar uma única resposta. Tipos de variáveis: a) Variáveis qualitativas: variáveis cujos possíveis resultados são atributos ou qualidades. São NÃO NUMÉRICAS. Podem ser classificadas em: ORDINAIS, quando obedecem a uma ordem natural ou NOMINAIS, quando não seguem nenhuma ordem. b) Variáveis quantitativas: variáveis cujos possíveis resultados são valores NUMÉRICOS, resultantes de mensuração ou contagem. Podem ser classificadas em: DISCRETAS, quando assumem valores num espaço finito ou infinito enumerável ou CONTÍNUAS, quando assumem valores num conjunto não enuméral (conjunto dos números reais).

3.5. Estatística: é uma medida numérica, S(X), que descreve uma característica da amostra e que não depende de parâmetros desconhecidos. A estatística é uma função da amostra: S(X) = f (X 1, X,..., X n ) toda estatística S(X) é uma va Exemplos: n X i i X 1 média amostral, n s n i1 X i X n 1 variância amostral, X (1) = mínimo 1ª estatística de ordem, X (n) = máximo n-ésima estatística de ordem. PARÂMETROS E ESTATÍSTICAS ESTATÍSTICA PARÂMETRO Nome Amostra População Média X Variância s Correlação r X,Y X,Y Proporção pˆ p 3.6. Estimador: é uma quantidade, obtida a partir de uma amostra, que estima o valor de um parâmetro populacional. Será denotado por T(X).

{ T(X) } { S(X) }, ou seja, todo estimador é uma função da amostra e, portanto, é uma estatística, porém, nem toda estatística é um estimador. todo estimador T(X) é uma va Notação: Como T(X) estima o parâmetro, uma notação simplificada para o estimador é dada por: T (X) ˆ 3.6.1. Estimativa: estimativa é o valor de T(X) obtido de uma aa. 3.7. A Inferência Estatística: A Inferência Estatística busca obter informações de parâmetros populacionais por intermédio das características de uma amostra e de suas distribuições de probabilidade. Amostra aleatória = parâmetro ˆ = estimador Intervalos de Confiança Testes de Hipótese

ESQUEMATICAMENTE 3.7.1. Questões que surgem: Quantos estimadores existem para um parâmetro populacional? Quais as qualidades que se deseja de um estimador? Como escolher o melhor estimador? Resposta: Teoria da Otimalidade.

3.8. O Estimador Ótimo A teoria da Otimalidade estuda as propriedades dos estimadores e define critérios para a escolha do estimador ótimo. Segundo essa teoria um estimador é ótimo basicamente se for: não viesado e de mínima variância. 3.8.1. Estimador não viesado (não viciado): o viés, do inglês bias, é definido pela diferença entre o valor esperado do estimador e o parâmetro o qual este está estimando. Seja ˆ, estimador de, então o viés de ˆ é definido por: B(ˆ ) = E(ˆ ) em que é o espaço paramétrico. Se E(ˆ ) =, ˆ é dito não viesado (ou não viciado) e B(ˆ ) = 0 3.8.. Precisão: uma propriedade importante para um estimador é que seja preciso, em outras palavras, que tenha baixa variabilidade ˆ deve ser escolhido tal que sua variância seja a menor possível ˆ Var (ˆ ) seja mínima

3.8.3. Consistência: além de ser não viesado e de variância mínima deseja-se que o estimador ˆ seja consistente. Um estimador ˆ é dito ser consistente para se lim E(ˆ) n e lim Var (ˆ) 0 n Conforme aumenta o tamanho da amostra, mais ˆ se aproxima de. 3.8.4. O Erro Quadrático Médio (EQM): o erro quadrático médio de um estimador ˆ é definido por Prova-se facilmente que EQM(ˆ )= E[(ˆ ) ] EQM(ˆ ) = Var(ˆ ) + [B()] Logo, se o estimador ˆ é não viesado, então, seu EQM é mínimo e EQM(ˆ ) = Var(ˆ ) Assim, a teoria da otimalidade procura, dentre os estimadores não viesados, aquele de menor variância.

Exemplo: estimadores para a média populacional -. 1) Estimar a média das alturas dos alunos da turma B de Estatística. Quais os estimadores possíveis? Vamos propor 4 estimadores: a) a média amostral: ˆ A X X n i b) o ponto médio entre os valores máximo e o mínimo da amostra: X( n ) X(1) ˆ B ~ c) a mediana da amostra: ˆ X d) a 5ª observação: ˆ D X5 C

4. Estimadores para a média A maioria das aplicações em estatística envolvem a estimação da média populacional. Quais os possíveis estimadores e qual deles é o melhor (estimador ótimo). Média aritmética ou média amostral ( X ); Média geométrica; Média harmônica; Média aparada; Média ponderada; Mediana amostral ( X ~ ); Extimadores do tipo ˆ e ˆ (ver exemplo). B D Qual desses estimadores é o melhor para estimar? a) 1º - escolher os não viesados; b) º - dentre os não viesados, encontrar o de menor variância. A teoria estatística (otimalidade) resolve esse problema e mostra qual o estimador ótimo para. Segundo essa teoria, o estimador ótimo para é a média amostral (aritmética) X.

Estudo das propriedades dos estimadores: média amostral, média harmônica, média geométrica e média ponderada ( X 1 /3 + *X /3 ) para amostras de tamanho n =, com reposição. População 3 5 6 8 Parâmetros Populacionais Média = 4.8 Variância = 4.56 Tamanho N = 5 =.8 n Amostras Estimadores X1 X X M. Harm. M. Geom. M. Pond..000.000.000 3.5.400.449.667 5 3.5.857 3.16 4.000 6 4 3.000 3.464 4.667 8 5 3.00 4.000 6.000 3.5.400.449.333 3 3 3 3.000 3.000 3.000 3 5 4 3.750 3.873 4.333 3 6 4.5 4.000 4.43 5.000 3 8 5.5 4.364 4.899 6.333 5 3.5.857 3.16 3.000 5 3 4 3.750 3.873 3.667 5 5 5 5.000 5.000 5.000 5 6 5.5 5.455 5.477 5.667 5 8 6.5 6.154 6.35 7.000 6 4 3.000 3.464 3.333 6 3 4.5 4.000 4.43 4.000 6 5 5.5 5.455 5.477 5.333 6 6 6 6.000 6.000 6.000 6 8 7 6.857 6.98 7.333 8 5 3.00 4.000 4.000 8 3 5.5 4.364 4.899 4.667 8 5 6.5 6.154 6.35 6.000 8 6 7 6.857 6.98 6.667 8 8 8 8.000 8.000 8.000 Médias 4.8 4.33 4.546 4.80 Variâncias.8.585.377.5333

Tabela resumo dos estimadores para a Média Populacional. Estimadores X M. Harm. M. Geom. M. Pond. Média do Estimador 4.8 4.39 4.5456 4.8 Vício 0-0.4771-0.544 0 Vício ao quadrado 0 0.77 0.0647 0 Variância do Estimador.8.585.377.5333 EQM.8.819.4419.5333 Relação da variância de X com as demais 1 1.1339 1.046 1.1111

Métodos de Estimação: A teoria estatística define diversos métodos de estimação, dentre os quais destacamos: 4.1. Método da máxima verossimilhança: o estimador é dado pelo valor que maximiza a distribuição conjunta da amostra, também chamada de função de verossimilhança. n L( dados) f ( ) ˆ max[ L( )] i1 x i MV 4.. Métodos dos momentos: o estimador é obtido igualando os momentos amostrais com os momentos populacionais. Depende da distribuição de probabilidade da população O momento de ordem k de uma va é definido como k E( X ), k 1, se k = 1 E( ) k 1 X O momento amostral de ordem k de uma va é definido como m k k Xi, se k = 1 m1 X n Para estimar a média populacional, faz-se: ˆ ˆ1 m 1 ou seja, ˆ X

Para um parâmetro qualquer, se k k E( X ) f ( ) ˆ MM f 1 (ˆ k ). Se k = 1, f ( ) 1 e o estimador dos momentos para é ˆ MM f 1 ( X ) 4.3. Método mínimos quadrados: o estimador é aquele que minimiza uma soma de quadrados de erros entre os valores da amostra e uma função do parâmetro g (). Se queremos estimar a média, então g( ) E( X ). Nesse caso, o erro e para cada observação é calculado por e [ x g ( )], i = 1,,... n, e i i i n SQE( ) [ x i g i ( )]. i1 O estimador de mínimos quadrados é dado pelo valor de que minimiza SQE(): ˆ MQ min[ SQE( )] O estimador de mínimos quadrados é mais utilizado no ajuste de modelos de regressão linear.

4.4. Estimador Bayesiano: o estimador Bayesiano é obtido a partir de uma ponderação da função de verossimilhança por uma distribuição de probabilidade para. Seja uma distribuição de probabilidade (), denominada de distribuição a priori de, então ( dados) ()L( dados), ( dados) é a distribuição a posteriori de, dada a amostra. Um estimador Bayesiano muito utilizado é dado pelo valor que maximiza a posteriori, ou seja, pela moda de ( dados): ˆ Bay max[ ( dados)] 5. O Estimador para a média. 5.1. Mostrar que a média amostral X atende às propriedades de estimador ótimo para. 5.. A distribuição da média amostral X. 5..1. O Teorema do Limite Central (TLC). 5.3. O estimador para a proporção p. 5.3.1. A distribuição da proporção amostral pˆ.

5.4. Determinação do tamanho da amostra na estimação da média 5.5. O estimador para a variância populacional. 5.5.1. A distribuição da variância amostral s. Exemplos: 1) Um elevador de capacidade 500kg serve um edifício. Se a distribuição do peso dos usuários for N(70, 100), determine: a) A probabilidade de que 7 passageiros ultrapassem esse limite. b) E 6 passageiros? ) Um produto da marca XIS é comercializado em pacotes de 1kg, sendo que a distribuição do peso dos pacotes, em gramas, é N(1000, 51.). A fiscalização inspeciona o produto por amostras de 5 pacotes e aplica uma multa se a média for menor do que 4g a menos do peso especificado. a) Qual a probabilidade de que o produto XIS seja multado? Os produtores de XIS pretendem diminuir essa probabilidade. Para isso o Estatístico da empresa deu duas sugestões: deslocar a média, aumentando o peso dos pacotes ou aplicar ações visando reduzir a variabilidade do processo de empacotamento. b) Para quanto deve ser regulada a nova média de tal forma que a probabilidade em (a) seja de no máximo 0.03? c) Caso se escolha a segunda opção, de quanto deve ser a nova variância para se obter o mesmo resultado?

Considere, agora, que a produtora tenha um custo adicional de 5 centavos por cada pacote com peso acima de 1008g. Qual a alteração no custo em cada um dos casos para um produção de 5 toneladas? 3) Para estimar o nível de dureza de peças de espuma injetada com boa precisão o técnico responsável decide selecionar uma amostra da produção para medição. Como os ensaios de medição são destrutivos, o número de peças para análise deve ser bem determinado para evitar gastos desnecessários. (dados históricos registram a variância do processo de produção como =.96). Inicialmente fixou-se como precisão = 0.5ud. a) Determinar o número de peças tal que a probabilidade de que a precisão seja alcançada seja de 0.99. b) A gerência achou esse número muito elevado e decidiu reduzir a precisão para 0.75ud. Que o número de peças deve ser inspecionado com esse novo valor? 4) Numa pesquisa eleitoral foi realizada uma pré-amostra de tamanho 40 obtendo-se p ˆ 0. 4 de eleitores que votam no candidato do partido PX. a) Qual deve ser o tamanho da amostra para que, com probabilidade 0.95, a estimativa pˆ não se distancie de p mais do que 0.0? b) Refazer o cálculo do tamanho da amostra pelo método conservativo. 5) Seja uma população com 0 e. 567. a) Numa amostra de tamanho n = 9, qual a probabilidade de que a variância amostral seja superior a 4.3? b) Determine um limite inferior k para o qual a probabilidade de que ser menor do que k seja de 0.05. s

Exercícios de Revisão 6) Um produto pesa em média 10g com desvio-padrão de 3g. Este é embalado em caixas de 150 unidades. A caixa vazia pesa, em média, 00g com desvio-padrão de 9g. Admitindo que as variáveis em questão tenham distribuições normais e que as 150 unidades que são colocadas em uma caixa são tomadas ao acaso, determine a probabilidade de uma caixa cheia pesar mais de 1610g. Resolução: Sejam as va s X P : peso do produto N( 10 ; 9 ) X C : peso da caixa N( 00 ; 81 ) X T : peso total da caixa cheia? Resultados: i) Se X 1 N( 1 ; 1 ) e X N( ; ), independentes, então X 1 ± X N( 1 ± ; 1 + ) ii) Se X 1, X,..., X n N( ; ), iid X 1 + X +... + X n N(n ; n ) De (i) e (ii), temos que X T = X P1 + X P +... + X P150 + X C e, X T N( T ; ou seja, X T N( 1700 ; 1431 ). T ), em que: T = 15010 + 00 = 1700g = 1509 + 81 = 1431g T P( X T 1610) P( Z.38) 0.9913.

7) Uma máquina automática enche latas, baseada no peso bruto das mesmas. O peso bruto tem distribuição normal com média 1.000g e desvio padrão 0g. As latas têm pesos distribuídos normalmente com média 90g e desvio padrão 10g. Qual a probabilidade de que uma lata escolhida ao acaso tenha de peso líquido: a) menor do que 830g? b) maior do que 870 g? c) entre 860 e 930g? Resolução: Sejam as va s X B : peso do produto N( 1000 ; 400 ) X L : peso da caixa N( 90 ; 100 ) X Q : peso total da caixa cheia N( Q ; De (i) temos que X Q = X B X L e, ou seja, X Q N( 910 ; 500 ). Q = 1000 90 = 910g Q ), Q = 400 + 100 = 500g a) ( X 830) P( Z 3.58) 0.0001718 P Q b) ( X 870) P( Z 1.79) 1 0.0367 0.9633 P Q c) P( 860 X 930) P(.4 Z 0.89) 0.8133 0.015 Q P ( 860 X 930) 0.80 Q

8) Seja X uma única observação de uma va com distribuição Bernoulli(). Sejam ˆ 1= X e ˆ = 1/, dois estimadores para : a) verifique se os estimadores são não viesados para ; b) compare os EQM s construa um gráfico como função de. X Bernoulli( ), 0 1, tal que E (X ) e Var ( X ) (1 ) a) E ( ˆ 1 ) E( X ) ˆ 1 não é viesado para 1 E ( ˆ ) E(1/ ) ˆ é viesado para, sendo B ( ˆ ) [1/ b) ] EQM ( ˆ 1 ) Var(ˆ 1) [ B(ˆ 1)] EQM ( ˆ ) Var(1/ ) [ B(ˆ )] 0. 5 Os EQM s podem ser comparados obtendo-se os valores de tal que ˆ EQM ) EQM (ˆ ), ou seja,: 0.5 ( 1 Desta forma, se : 0 a ou b 1 ˆ 1 é melhor a b ˆ é melhor a ou b tanto faz

9) Sejam X 1, X,..., X n uma aa de tamanho n da distribuição uniforme no intervalo (0, ). Considere os estimadores ˆ 1 c 1 X e ˆ X 1 X c n. a) Ache c 1 e c tais que ˆ 1 e ˆ sejam não viesados para ; b) encontre os EQM s dos dois estimadores X U( 0, ), a) E (X ) e ˆ E ( 1) E( c1 X ) c1 para c 1, ˆ 1 não é viesado para Var ( X ) 1 ˆ X1 X n E( X1) E( X E ) Ec c para c, ˆ não é viesado para ( c ) Logo, ˆ1 X e ˆ X1 X não são viesados para. b) EQM ( ˆ) Var(ˆ) [ B(ˆ)] EQM (ˆ EQM (ˆ 1 1 ) Var(ˆ ) 3n 1 ) Var(X ) ( / n) 4 1 X1 X n EQM (ˆ ) 4Var EQM (ˆ ) 6 Var( X 1 ) Var( X ) 1