Introdução à Estatística ESQUEMA DO CAPÍTULO 0.1 VISÃO GERAL DOS MÉTODOS COMPUTACIONALMENTE INTENSIVOS EM ESTATÍSTICA 1
mente Intensivos Definição: Do Handbook of Computational Statistics: Concepts and Methods, (Gentle et al., 2012) : Computação estatística refere-se aos métodos computacionais que são auxiliares aos métodos estatísticos, tais como análise numérica, banco de dados, computação gráfica, engenharia de software e interface homem/máquina; Estatística computacional tem significado mais amplo, por incluir não só os métodos de computação estatística, como também métodos estatísticos que são computacionalmente intensivos. 2
mente Intensivos Dois exemplos: As ferramentas da estatística computacional podem ser úteis em situações de interesse prático em que: os pressupostos para aplicação dos métodos clássicos não se aplicam ou tais pressupostos são de difícil verificação. Exemplos (a serem detalhados na disciplina): 1 - testes de permutação; 2 - bootstrap. 3
mente Intensivos Exemplo 1: Teste de hipóteses para diferenças de médias via testes de permutação (Manly, 2007); 4
mente Intensivos Teste de hipótese para diferença de médias: As situações reais diferenciam a aplicação da teoria: variâncias conhecidas vs. variâncias desconhecidas; grandes amostras vs. pequenas amostras; dados pareados vs. dados não pareados; As abordagens são específicas para cada situação (Triola, 2005). 5
mente Intensivos Teste de hipótese para diferença de médias com variância conhecida: Hipótese nula: H 0 : μ 1 -μ 2 = δ 0 Fazendo δ 0 = 0, estaremos testando a igualdade das duas médias m 1 e m 2. A estatística de teste para este caso terá uma distribuição normal padrão, N(0,1). Podemos ainda afirmar que encontrar uma diferença considerável entre os valores das médias m 1 e m 2 é uma evidência de que a hipótese alternativa, H 1, é verdadeira. 6
mente Intensivos Teste de hipótese para diferença de médias com variância conhecida: Estatística de teste: Z 0 X X 1 2 0 n n 2 2 1 2 1 2 Hipóteses alternativas Critério de rejeição H 1 : m 1 -m 2 δ 0 z 0 > z a/2 ou z 0 < -z a/2 H 1 : m 1 -m 2 > δ 0 z 0 > z a H 1 : m 1 -m 2 < δ 0 z 0 < -z a 7
mente Intensivos Teste de hipótese para diferença de médias com via testes de permutação (Manly, 2007): consiste em simples permutações dos dados originais; comparamos então o valor da estatística observada nos dados originais, com as estatísticas obtidas destas amostras permutadas; se estas saídas produzem estatísticas com valores semelhantes à estatística observada, esta terá sido um mero acaso e os dados são provenientes da mesma população. 8
mente Intensivos Algoritmo do teste de permutação algoritmo leia amostra 1 e amostra 2 crie amostra 3, justapondo amostras (simulação da hipótese nula) repetir permute amostra 3 e redistribua entre amostra 4 e amostra 5 calcule a diferença entre as médias da amostra 4 e amostra 5 acumule a diferença atualize o valor-p por comparação com a diferença observada até número de replicações ser alcançado escreva resultados fim algoritmo 9
mente Intensivos Resultados experimentais para dados reais: Serão utilizados dados reais apresentados em Santos (1998); Através de 18 amostras retiradas de camadas superficiais dos solos de dois locais diferentes (Central Soil Salinity Research Institute), foram coletados dados sobre seus devidos valores de ph; O processo utilizado foi a retirada de 9 amostras de cada uma das duas regiões pesquisadas; O objetivo é tentar provar se realmente as amostras podem ser classificadas em dois grupos distintos ou não. 10
mente Intensivos Resultados experimentais para dados reais (cont.): Localidade A: 8,53 8,52 8,01 7,99 7,93 7,89 7,85 7,82 7,80 Localidade B: 7,85 7,73 7,58 7,40 7,35 7,30 7,27 7,27 7,23 11
mente Intensivos Chamada ao programa (em R) e saída do teste de permutação: local1<-c(8.53,8.52,8.01,7.99,7.93,7.89,7.85,7.82,7.80) local2<-c(7.85,7.73,7.58,7.40,7.35,7.30,7.27,7.27,7.23) replicas <- 1000 set.seed(13579) THpermuta(local1,local2,replicas) Diferenca observada= 0.5955556 Valor-p= 0 12
Frequencia 0 50 100 150 200 mente Intensivos Histograma sob H 0, gerado pelo programa, e a evidência da sua rejeição: Histograma sob H 0 e diferenca observada 0.596-0.6-0.4-0.2 0.0 0.2 0.4 0.6 Diferenca entre medias (amostra1-amostra2) 13
mente Intensivos Exemplo 2: Intervalos de confiança (ICs) via bootstrap; 14
mente Intensivos Método clássico para construção de ICs: ICs para a média amostral: Precisamos encontrar C L e C U tal que: P C g X, X..., X ; ) C - a L ( 1 2 n U 1 Encontramos então: L X, X..., X n ) X Z / ( 1 2 a / 2 n U X, X..., X n ) X Z / ( 1 2 a / 2 n 15
mente Intensivos Método bootstrap para construção de ICs: 16
mente Intensivos Método bootstrap para construção de ICs (cont.): As seguinte estimativas são obtidas: * * * ˆ m1, ˆ m2,, ˆ mb Elas são colocadas em ordem: ˆ m * * * ( 1) ˆ m ˆ (2) m( B) O IC de (1-a)100% é dado por: * * ˆ m q, ˆ m ( 1 ) ( q2 ) a em que q parteinteira B e q B q 1. 1 2 2 1 17
mente Intensivos Método bootstrap para construção de ICs (cont.): Resultados experimentais 18
mente Intensivos Resultados experimentais com dados reais: Medidas de porcentagem de não enriquecimento de 12 bastões (Montgomery & Runger, 2018): 97,06; 97,25; 97,25; 97,19; 97,10; 97,10; 97,18; 97,05; 97,00; 97,05; 97,00; 96,95. Observação: Caso de pequenas amostras e distribuição provavelmente não-normal. 19
mente Intensivos Resultados experimentais com dados reais (cont.): 20
mente Intensivos Bibliografia: Gentle, J. E., Härdle, W. K. & Mori, Y. (Eds.) (2012). Handbook of Computational Statistics: Concepts and Methods. Springer-Verlag Berlin Heidelberg. Manly, B. F. J. (2007). Randomization, Bootstrap and Monte Carlo Methods in Biology. 3ª ed., Chapman & Hall/CR Press, Boca Raton. Montgomery, D. C. & Runger, G. C. (2018). Estatística Aplicada e Probabilidade para Engenheiros. 6ª ed., LTC Livros Técnicos e Científicos Editora S.A., Rio de Janeiro, RJ. Santos, M. A. C. (1998). Noções de Estatística. RTE- 03/1998, EST-ICEx-UFMG, Belo Horizonte, MG. Triola, M. F. (2005). Introdução à Estatística. 9ª ed., LTC Livros Técnicos e Científicos Editora S.A., Rio de Janeiro, RJ. 21