Ralph S. Silva
|
|
|
- Davi Vasques Furtado
- 8 Há anos
- Visualizações:
Transcrição
1 ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S. Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro
2 Sumário
3 Inferência sobre o vetor de médias (Johnson & Wichern, Cáp. 5) Considere o problema univariado no qual tem-se uma amostra aleatória de tamanho n da distribuição N (µ, σ 2 ), em que ambos os parâmetros de média e variância são desconhecidos. A estatística dada por t = X µ S2 /n tem distribuição t-student com n 1 graus de liberdade. n n X = 1 n X i, S 2 = 1 i=1 n 1 (X i X) 2 e (X 1, X 2,..., X i=1 n) compõem a amostra aleatória da N (µ, σ 2 ).
4 Podemos tomar o quadrado da estatística t na forma t 2 = n(x µ) ( S 2) 1 n(x µ). Neste caso, a distribuição t 2 é uma F-Snedecor com 1 e n 1 graus de liberdade. Notação: t 2 F 1,n 1. Esta última expressão nos sugere uma versão multivariada desta estatística, a saber, T 2 = n(x µ) S 1 (X µ), sendo X = 1 n n i=1 X i, S = 1 n 1 n i=1 (X i X)(X i X) e (X 1, X 2,..., X n) compõem uma amostra aleatória da N p(µ, Σ). A estatística T 2 é chamada Estatística T 2 de Hotelling em homenagem a Harold Hotelling, pioneiro na Análise Multivariada e o primeiro a obter a sua distribuição amostral.
5 Proposição 1: Sejam X 1, X 2,..., X n uma amostra aleatória da distribuição N p(µ, Σ) e T 2 = n(x µ) S 1 (X µ). Então, Natureza da estatística T 2 : n(x µ) }{{} N p(0,σ) n p (n 1)p T 2 F p,n p. Wp(n 1, Σ) n 1 {}}{ { 1 n n 1 sendo n(x µ) e n independentes. i=1 (X i X)(X i X) } 1 n(x µ) }{{} N p(0,σ) i=1 (X i X)(X i X) Notação: W p(ν, A) significa distribuição de Wishart com ν graus de liberdade e matriz de escala A (p p).
6 Teste de hipóteses Teste de hipóteses Considere o problema de testar as hipóteses { H0 : µ = µ 0 H 1 : µ µ 0, quando se tem uma amostra aleatória da distribuição normal multivariada. A estatística de teste neste caso será dada por T 2 = n(x µ) S 1 (X µ). Sob H 0, a estatística T 2 (n 1)p tem distribuição Fp,n p de acordo com a n p proposição 1. Assim, ao nível de significância α, rejeitamos H 0 se T 2 > (n 1)p n p F p,n p,1 α com F p,n p,1 α representando o quantil de 100(1 α)% da distribuição F p,n p.
7 Teste de hipóteses Exemplo: A transpiração de 20 mulheres saudáveis foi analisada. As observações aqui são tri-variadas, a saber, X 1 - taxa de suor, X 2 - conteúdo de sódio e X 3 - conteúdo de potássio. Os dados estão disponíveis no arquivo T5-1.dat dos autores. Deseja-se testar, ao nível de significância de 10%, as hipóteses { H0 : µ = (4, 50, 10) H 1 : µ (Ver suor.r) (4, 50, 10). Lembrem-se antes de verificar a normalidade dos dados! A normalidade univariada é simples e rápida de ser verificada e a distribuição normal univariada é aceitável para as três medidas isoladamente. Após os cálculos, obteve-se T 2 9, 74 e RC = {T 2 : T 2 > 8, 17}. Logo, ao nível de significância de 10%, rejeitamos a hipótese nula. Qual é o valor p deste teste? Calcule T 2 (n p)/(p(n 1)) e obtenha a cauda superior da distribuição F p,n p associada a este valor. Temos, p = 0, Portanto, para qualquer nível de significância menor que 6,5%, H 0 não seria rejeitada.
8 Invariância da estatística T 2 Invariância da estatística T 2 A estatística T 2 é invariante sob transformações de posição e escala. Defina Y = CX + d, com X (p 1), Y (p 1) vetores aleatórios, d vetor (p 1) de constantes fixadas e C matriz (p p) não-singular de constantes fixadas. Então, Y = CX + d e S Y = CS X C. Além disso, µ y = Cµ X + d. Assim, T 2 Y = n(y µ Y ) S 1 Y (Y µ Y ) = n(cx Cµ X ) ( CS X C ) 1 (CX Cµ X ) = n(x µ X ) C (C ) 1 S }{{} I p = n(x µ X ) S 1 X (X µ X ) = T 2 X. 1 X C 1 C }{{} (X µ X ) I p
9 A estatística T 2 e os testes de razão de verossimilhanças A estatística T 2 e os testes de razão de verossimilhanças Uma metodologia muito usada na construção de testes de hipóteses é conhecida como teste de razão de verossimilhanças (teste RV). Em linhas gerais, se temos uma amostra aleatória de uma distribuição que depende de um vetor de parâmetros θ cuja densidade é f n(x θ) e desejamos testar { H0 : θ Θ 0 a estatística do teste RV é dada por H 1 : θ Θ 0, Λ(x) = max θ Θ 0 L(θ x) max θ L(θ x) com L(θ x) a função de verossimilhança.
10 A estatística T 2 e os testes de razão de verossimilhanças Observe que a estatística Λ(x) é um número entre 0 e 1. Se o máximo sob H 0 for o máximo global, teremos Λ(x) = 1. Caso contrário, Λ(x) < 1 e como Λ(x) representa uma razão entre quantidades positivas, segue que 0 < Λ(x) 1. Assim, é razoável dizer que a hipótese nula será rejeitada para valores pequenos de Λ(x) tal que as regiões críticas nos testes RV são da forma Λ(x) c. Para obter o valor de c é necessário conhecer a distribuição amostral de Λ(x). Esta distribuição nem sempre é fácil de ser obtida e muitas vezes são necessários métodos aproximados para avaliar o valor de c para um dado nível de significância.
11 Distribuição assintótica da estatística Λ Distribuição assintótica da estatística Λ 2 ln Λ a χ 2 ν ν 0 em que ν é a dimensão do espaço de parâmetros e ν 0 é a dimensão do sub-espaço correspondente à hipótese nula. Vamos calcular a estatística Λ(x) no contexto do teste das hipóteses { H0 : µ = µ 0 H 1 : µ µ 0, quando se tem uma amostra aleatória da distribuição normal multivariada.
12 Distribuição assintótica da estatística Λ Já vimos que o máximo global da função de verossimilhança é obtido quando µ = X e Σ = n 1 S e é dado por n L( µ, Σ) = (2π) np/2 Σ n/2 e np/2. Portanto, já temos o denominador da estatística Λ(x), neste caso. Para obter o numerador, observe que sob H 0 há apenas um valor possível para µ dado por µ 0. Neste caso, usando os resultados apresentados na seção de estimação por máxima verossimilhança, é fácil ver que a matriz que maximiza a verossimilhança sob H 0 é dada por Σ 0 = 1 n n i=1 (X i µ 0 )(X i µ 0 ).
13 Distribuição assintótica da estatística Λ Assim, o numerador de Λ(x) é Logo, L(µ 0, Σ 0 ) = (2π) np/2 Σ 0 n/2 e np/2. ( ) n/2 Σ n Λ = = (X i X)(X i X) i=1 Σ 0 n (X i µ 0 )(X i µ 0 ) i=1 A estatística equivalente Λ 2/n = Σ / Σ 0 é chamada lambda de Wilks. É fácil, por meio de artifícios algébricos, mostrar que as estatísticas T 2 e Λ para o teste aqui considerado satisfazem a relação Λ 2/n = (1 + T 2 n 1 ) 1 e, usando esta relação, chegamos a uma outra expressão para o cálculo da estatística T 2 : T 2 = (n 1) ˆΣ 0 (n 1). ˆΣ n/2.
14 Distribuição assintótica da estatística Λ Exemplo: (continuação) Calcule a estatística do teste RV para os dados (T5-1.dat) do exemplo anterior. Verifique a relação entre as estatísticas T 2 e Λ. (Ver suor.r) Exercícios do capítulo 5 para entregar: 1 a 4. FAÇAM!
15 Regiões de Confiança e Intervalos Simultâneos Regiões de Confiança e Intervalos Simultâneos Dizemos que R(X) é uma região de 100(1 α)% de confiança para θ se Pr (R(X) compreender θ) = 1 α. A região de confiança para o vetor de médias µ quando se dispõe de uma amostra aleatória da distribuição N p(µ, Σ) é dada por n(x µ) S 1 (X µ) (n 1)p n p F p,n p,1 α, sendo F p,n p,1 α o quantil acumulado de 100(1 α)% da distribuição F p,n p. Este resultado é obtido usando-se a distribuição amostral da estatística T 2 apresentada anteriormente.
16 Regiões de Confiança e Intervalos Simultâneos Observe que a região de confiança é dada pelo hiper-elipsóide de eixos determinados pelos autovetores da matriz de covariância amostral S e cujas medidas são proporcionais às raizes quadradas dos respectivos autovalores. Para verificar se um dado vetor µ 0 pertence à região de confiança, basta calcular n(x µ 0 ) S 1 (n 1)p (X µ 0 ) e comparar com n p F p,n p,1 α. Para p 4 não é possível representar visualmente a região de confiança. No entanto, podemos calcular as medidas dos eixos do hiper-elipsóide de confiança centrado em X: n(x µ) S 1 (X µ) c 2 = (n 1)p n p F p,n p,1 α. Lembre-se que os semi-eixos têm medida c (n 1)p λj n = λ j n(n p) F p,n p,1 α.
17 Regiões de Confiança e Intervalos Simultâneos Exemplo: O departamento de controle de qualidade de uma fabricante de fornos de microondas foi cobrado pelo governo federal a monitorar a quantidade de radiação quando as portas dos microondas são fechadas. Observações da radiação emitida através das portas fechadas de n = 42 fornos selecionados ao acaso foram feitas. Medidas de radiação também foram feitas com as portas abertas dos 42 fornos selecionados. (Ver T4-1.DAT e T4-5.DAT.) Se verificarmos a suposição de normalidade, veremos que esta não é apropriada e uma transformação potência dos dados é buscada. Sugerimos trabalhar aqui com a potência 0, 25 ou seja, a raiz quarta da escala original da medida de radiação. Pede-se construir uma elipse de 95% de confiança para o vetor de médias, considerando a escala dos dados transformados de modo que a suposição de normalidade seja razoável. (Ver microondas.r)
18 Regiões de Confiança e Intervalos Simultâneos No gráfico a seguir, é possível ver que com esta transformação nas duas medidas, os pontos nos qq-plots apresentam um comportamento mais próximo do linear. Fechada sem transformação Aberta sem transformação Quantis amostrais Quantis amostrais Quantis teóricos Quantis teóricos Fechada com transformação Aberta com transformação Quantis amostrais Quantis amostrais Quantis teóricos Quantis teóricos
19 Regiões de Confiança e Intervalos Simultâneos Porta aberta Porta fechada
20 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Seja X N p(µ, Σ). Vimos que se a é um vetor de constantes em R p, então Z = a X N (a µ, a Σa). Logo, se X 1, X 2,..., X n é uma amostra aleatória da N p(µ, Σ), segue que Z 1, Z 2,..., Z n, definidos por Z i = a X i, i = 1,..., n, é uma amostra aleatória da N (a µ, a }{{}} {{ Σa } ). µ Z σ 2 Z Da teoria normal univariada, temos que um intervalo de 100(1 α)% de confiança para µ Z = a µ é dado por ( ) IC 100(1 α)% (µ Z ) = a a Sa a X t n 1,1 α 2 n, Sa a X + t n 1,(1 α 2 ) n
21 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Claramente, poderíamos construir vários intervalos de confiança sobre combinações lineares dos componentes do vetor µ, cada um associado com um coeficiente de confiança 1 α, escolhendo diferentes vetores de constantes a. Porém, o coeficiente de confiança conjunto do conjunto de intervalos resultantes não seria mais 1 α. É desejável associar um coeficiente de confiança coletivo de 1 α aos intervalos de confiança que podem ser gerados para todas as escolhas de a. Naturalmente, um preço deverá ser pago pela conveniência de uma confiança simultânea grande para todos os intervalos: intervalos que têm amplitudes maiores (mais largos, menos precisos) do que os intervalos apresentados anteriormente via a distribuição amostral t-student com n 1 graus de liberdade.
22 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Dado o conjunto de dados observados x 1, x 2,..., x n e um a particular n(a x a µ) t = t n 1,1 α a Sa 2 ou, equivalentemente, t 2 = n(a x a µ) 2 a Sa t 2 n 1,1 α 2. Uma região de confiança simultânea é dada para o conjunto de valores a µ tais que t 2 é relativamente pequeno para todas as escolhas de a. Parece razoável esperar que o valor t 2 n 1,1 α 2 seja substituído por um valor maior, c 2, quando afirmações são feitas para muitas escolhas de a.
23 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Considerando os valores de a para os quais t 2 c 2, somos naturalmente levados a max t 2 n(a x a µ) 2 (a) = max. a a a Sa Usando os resultados sobre desigualdades (ver capítulo 2 do livro texto), percebemos que o máximo ocorrerá para a S 1 (x µ). Ora, isto nos levará à estatística T 2. Por conveniência, costuma se referir a esses intervalos como intervalos-t 2. Em particular, tomando os vetores a s como os vetores da base canônica do R p, obtém-se ( ) sjj IC 100(1 α)% (µ j ) = x j φ n,p,1 α n, x sjj j + φ n,p,1 α, j = 1, 2,..., p, n sendo φ n,p,1 α = p(n 1) n p F p,n p,1 α.
24 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Agora os intervalos-t 2 coletivamente têm nível de confiança 1 α. Observe que também podemos construir intervalos de confiança para relações estruturais entre os componentes do vetor µ como, por exemplo, intervalos para as diferenças entre os componentes de µ. Fazendo a = (0,..., 0, }{{} 1, 0,..., 0, 1, 0,..., 0), }{{} i-ésima entrada r-ésima entrada teremos a µ = µ i µ r, a x = x i x r e a Sa = s ii + s rr 2s ir. O intervalo para a diferença µ i µ r será dado por p(n 1) (x i x r ) ± n p F sii + s rr 2s ir p,n p,1 α. n
25 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Exemplo: Obtivemos uma elipse de 95% de confiança para o vetor µ nos dados sobre radiação em microondas. Pede-se construir os intervalos-t 2 de 95% de confiança para os componentes individuais do vetor µ, identificando-os como as sombras da elipse de 95% de confiança sobre os eixos coordenados. Pede-se também construir os intervalos baseados na distribuição t-student e compará-los com os correspondentes intervalos T 2. (Ver microondas.r)
26 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Porta aberta Porta fechada
27 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Uma Comparação entre os Intervalos-T 2 e os Intervalos Separados A tabela a seguir mostra uma comparação entre os comprimentos dos intervalos de confiança separados e os intervalos simultâneos T 2 para alguns valores selecionados de p, n e α = 0, 05. n t n 1 (0, 975) φ n;p;0,95 p = 4 p = ,145 4,14 11, ,064 3,60 6, ,010 3,31 5, ,970 3,19 4,61 1,960 3,08 4,28 Os valores nas duas últimas colunas da tabela correspondem a (n 1)p φ n;p;0,95 = Fp,n p(0, 95). n p
28 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias A comparação feita é imprópria, pois o nível de confiança associado a qualquer coleção de intervalos-t 2, para p fixado, é 0,95, e o nível global associado com uma coleção de intervalos separados via distribuição t-student deve ser menor do que 0,95. Uma outra abordagem, conhecida como Método de Bonferroni de Comparações Múltiplas, será considerada. O método leva este nome devido à desigualdade de Bonferroni. Seja A 1, A 2,..., A m uma coleção de eventos em um espaço de probabilidade tais que Pr(A i ) = 1 α i, i = 1,..., m. Então, Pr ( m ) i=1a i = 1 P( pelo menos um dos A i s é falso ) 1 m i=1 Pr(Ac i ) = 1 m α i i=1 = 1 (α 1 + α α m).
29 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias A desigualdade de Bonferroni permite ao investigador controlar a taxa de erro α 1 + α α m, sem olhar a estrutura de correlação por trás dos intervalos de confiança. Assim, se o problema envolve a construção de m intervalos importantes, a ideia é fazer α i = α/m e tomar os intervalos separados dados por a X ± t n 1,1 α 2m a Sa n. Observe que agora vale que o coeficiente coletivo de confiança é pelo menos 1 α m + α m + + α }{{ m = 1 α. } m termos
30 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Portanto, com um coeficiente de confiança global de pelo menos 1 α, podemos construir os seguintes m = p intervalos para os componentes do vetor µ: ( ) sjj IC 100(1 α)% (µ j ) = x j t n 1,1 α 2p n, x sjj j + t n 1,1 α 2p, j = 1, 2,..., p. n Esses intervalos, podem então, de forma mais apropriada, ser comparados aos intervalos-t 2. Exemplo: Usando novamente os dados sobre radiação em fornos de microondas, pede-se comparar os intervalos-t 2 para os componentes do vetor de médias com os intervalos via Bonferroni. (Ver microondas.r)
31 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias Porta aberta Porta fechada
32 Intervalos de Confiança Simultâneos para as Componentes do Vetor de Médias A tabela a seguir ilustra uma comparação entre os comprimentos dos intervalos via Bonferroni e T 2 para alguns valores selecionados de p, m = p, n e α = 0, 05. As entradas nas três colunas referentes aos diferentes valores de p selecionados representam a razão entre o comprimento do intervalo via Bonferroni e o comprimento do intervalo-t 2. n p ,88 0,69 0, ,90 0,75 0, ,91 0,78 0, ,91 0,80 0,62 0,91 0,81 0,66 Podemos ver desta tabela que os intervalos via Bonferroni produzem intervalos mais estreitos quando m = p. Devido à facilidade de aplicação e aos resultados mais eficientes em termos de estimação, geralmente é preferível usar os intervalos simultâneos via Bonferroni.
33 Inferências sobre um vetor de médias para grandes amostras Inferências sobre um vetor de médias para grandes amostras Quando o tamanho da amostra é grande, testes de hipóteses e regiões de confiança para µ podem ser construídos mesmo que a população subjacente não seja normal. Veja os exercícios 5.15, 5.16 e 5.17 do livro texto. Neles, para n grande, somos capazes de fazer inferências sobre o vetor de médias da população apesar da distribuição populacional ser discreta. De fato, desvios fortes de uma população normal podem ser superados para tamanhos amostrais grandes. Ambos, testes de hipóteses e intervalos de confiança simultâneos, terão níveis nominais aproximados. As vantagens associadas com grandes amostras podem ser parcialmente compensadas por uma perda de informação amostral causada pelo uso somente das estatísticas sumário X e S. Por outro lado, como (X, S) é uma estatística suficiente para populações normais, quanto mais próximas da normal multivariada forem as distribuições das populações, mais eficientemente a informação amostral será utilizada ao fazer inferências.
34 Inferências sobre um vetor de médias para grandes amostras Todas as inferências sobre µ quando se tem grandes amostras são baseadas na distribuição de qui-quadrado. Proposição 1: Seja x 1, x 2,..., x n uma amostra aleatória de uma população com vetor de médias µ e matriz de covariâncias positiva definida Σ. Quando n p é grande, a hipótese H 0 : µ = µ 0 é rejeitada em favor de H 1 : µ µ 0, ao nível de significância α, se n(x µ 0 ) S 1 (x µ 0 ) > χ 2 p,1 α. Comparando este teste com o obtido via teoria normal, no início destas notas, vemos que a estatística de teste é a mesma, o que muda é o valor crítico. Um exame mais minucioso revela, porém, que ambos os testes produzirão os mesmos resultados em situações nas quais o teste χ 2 é apropriado (amostras realmente grandes). De fato, n >> p. (n 1)p n p F p,n p,1 α e χ 2 p,1 α são aproximadamente iguais para
35 Inferências sobre um vetor de médias para grandes amostras Proposição 2: x 1, x 2,..., x n uma amostra aleatória de uma população com vetor de médias µ e matriz de covariâncias positiva definida Σ. Se n p é grande, a a X ± χ 2 Sa p,1 α n compreederá a µ, para todo a com probabilidade aproximadamente 1 α. Consequentemente, podemos fazer afirmações simultâneas para os p componentes do vetor de médias dadas por x j ± χ 2 p,1 α sjj, j = 1, 2,..., p. n Observação: elipses de confiança para pares de componentes também podem ser facilmente construídas.
36 Inferências sobre um vetor de médias para grandes amostras A questão de quão grande deve ser o tamanho da amostra não é simples de ser respondida. Em uma ou duas dimensões, tamanhos amostrais em torno de 30 a 50 podem geralmente ser considerados grandes. A medida que o número de características torna-se maior, certamente tamanhos amostrais maiores serão exigidos para que as distribuições assintóticas forneçam boas aproximações das verdadeiras distribuições das várias estatísticas de teste. Na falta de estudos definitivos os autores simplesmente propõem que n p deve ser grande, reconhecendo que o caso real pode ser mais complicado do que isso. Uma aplicação com p = 2 e n = 50 é muito diferente de uma aplicação com p = 52 e n = 100 apesar de ambas apresentarem n p = 48.
37 Inferências sobre um vetor de médias para grandes amostras Deve-se realizar as mesmas verificações exigidas para os métodos baseados na normal. Apesar de pequenos desvios da normalidade não causarem quaisquer dificuldades para n grande, desvios extremos podem causar problemas. Especificamente, a taxa de erro verdadeira pode estar bem afastada do nível nominal α. Se, com base nos qq-plots e outros esquemas de investigação pontos extremos (outliers) e outras formas de desvios extremos aparecem, ações corretivas apropriadas, incluindo transformações, são desejáveis. Exercícios do capítulo 5 para entregar: 5 a 11, 15, 16 e 17, 18 a 24. FAÇAM TODOS OS EXERCÍCIOS!
Inferências sobre o vetor de Média. (Johnson & Wichern, Cap. 5) Considere o problema univariado no qual temse uma amostra aleatória de tamanho n da
Inferências sobre o vetor de Média (Johnson & Wichern, Cap. 5) Considere o problema univariado no qual temse uma amostra aleatória de tamanho n da distribuição N(µ, σ 2 ), em que ambos os parâmetros de
Ralph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:
Análise de Variância Multivariada (MANOVA) (Johnson & Wichern, Cap. 6)
Análise de Variância Multivariada (MANOVA) (Johnson & Wichern, Cap. 6) 1. Comparações emparelhadas Começaremos com uma breve revisão deste problema no caso univariado. O problema aqui pode ser descrito
Inferência para duas populações
Inferência para duas populações Capítulo 13, Estatística Básica (Bussab&Morettin, 8a Edição) 7a AULA 27/04/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 7a aula (27/04/2015) MAE229 1 / 27 1.
Capítulo 4 Inferência Estatística
Capítulo 4 Inferência Estatística Slide 1 Resenha Intervalo de Confiança para uma proporção Intervalo de Confiança para o valor médio de uma variável aleatória Intervalo de Confiança para a diferença de
AULA 05 Teste de Hipótese
1 AULA 05 Teste de Hipótese Ernesto F. L. Amaral 03 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução
Estimação e Testes de Hipóteses
Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas
Aula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
AULA 7 - Inferência em MQO: ICs e Testes de
AULA 7 - Inferência em MQO: ICs e Testes de Hipóteses Susan Schommer Econometria I - IE/UFRJ Nosso primeiro objetivo aqui é relembrar a diferença entre estimação de ponto vs estimação de intervalo. Vamos
AULA 04 Teste de hipótese
1 AULA 04 Teste de hipótese Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal
Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo
Testes de Hipóteses Ricardo Ehlers [email protected] Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais
MAE Introdução à Probabilidade e Estatística II Resolução Lista 5
MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão
Inferência Estatistica
Inferência Estatistica Ricardo Ehlers [email protected] Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Modelos e Inferência Um modelo é uma simplificação da realidade (e alguns
AULA 07 Inferência a Partir de Duas Amostras
1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,
TESTES DE HIPÓTESES Notas de aula. Prof.: Idemauro Antonio Rodrigues de Lara
1 TESTES DE HIPÓTESES Notas de aula Prof.: Idemauro Antonio Rodrigues de Lara 2 Conteúdo 1. Fundamentos e conceitos básicos; 2. Função poder; 3. Testes mais poderosos e Lema de Neyman-Pearson; 4. Teste
Distribuições derivadas da distribuição Normal. Distribuição Normal., x real.
Distribuições derivadas da distribuição Normal Distribuição Normal Uma variável aleatória X tem distribuição normal com parâmetros µ e σ, quando sua densidade de probabilidade é f ( x) π σ e ( x µ ) σ,
Inferência a partir de duas amostras
Inferência a partir de duas amostras Inferência a partir de duas amostras. Inferência sobre duas médias: amostras dependentes. Inferência sobre duas médias: amostras grandes e independêntes 3. Comparação
Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07
-027/031 07/06/2018 10:07 9 ESQUEMA DO CAPÍTULO 9.1 TESTE DE HIPÓTESES 9.2 TESTES PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 9.3 TESTES PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA
Unidade IV Inferência estatística
6//5 Unidade IV Inferência estatística 4.. Introdução e histórico 4.. Conceitos fundamentais 4.3. Distribuições amostrais e Teorema central do limite 4.4. Estimação de parâmetros 4.5. Testes de hipóteses
Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas
Teoria da Estimação Fabricio Goecking Avelar Universidade Federal de Alfenas - Instituto de Ciências Exatas junho - 2018 Algumas distribuições importantes Sumário 1 Algumas distribuições importantes 2
Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo
Testes de Hipóteses Ricardo Ehlers [email protected] Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais
Probabilidade e Estatística
Probabilidade e Estatística Aula 7: Intervalos de Confiança com uma amostra Leitura obrigatória: Devore, cap 7 ou Montgomery e Runger, cap 8 Chap 8-1 Objetivos Como inferir sobre um parâmetro da população,
Métodos Estatísticos Avançados em Epidemiologia
1 / 44 Métodos Estatísticos Avançados em Epidemiologia Análise de Variância - ANOVA Referência: Cap. 12 - Pagano e Gauvreau (2004) - p.254 Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 2 / 44
Cap. 4 - Estimação por Intervalo
Cap. 4 - Estimação por Intervalo Amostragem e inferência estatística População: consiste na totalidade das observações em que estamos interessados. Nº de observações na população é denominado tamanho=n.
INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.
INTRODUÇÃO Exemplos Para curar uma certa doença existem quatro tratamentos possíveis: A, B, C e D. Pretende-se saber se existem diferenças significativas nos tratamentos no que diz respeito ao tempo necessário
Universidade Federal de Lavras
Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 6 a Lista de Exercícios Teoria da Estimação pontual e intervalar 1) Marcar como verdadeira ou falsa as seguintes
Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski
Testes de hipóteses Wagner H. Bonat Fernando P. Mayer Elias T. Krainski Universidade Federal do Paraná Departamento de Estatística Laboratório de Estatística e Geoinformação 07/06/2018 WB, FM, EK ( LEG/DEST/UFPR
BIOESTATÍSTICA. Parte 5 Testes de Hipóteses
BIOESTATÍSTICA Parte 5 Testes de Hipóteses Aulas Teóricas de 05/05/2011 a 19/05/2011 5.1. Conceito de erro, estatística de teste, região de rejeição, nível de significância, valor de prova, potência do
Distribuições de probabilidade de variáveis aleatórias contínuas
Distribuições de probabilidade de variáveis aleatórias contínuas Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Distribuição Exponencial Introdução É utilizada frequentemente como modelo para
Técnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança
Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva http://páginapessoal.utfpr.edu.br/ngsilva Estimação de Parâmetros Intervalo de Confiança Introdução A inferência estatística é o processo
TÉCNICAS DE AMOSTRAGEM
TÉCNICAS DE AMOSTRAGEM Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Teorema Central do Limite (TCL) Se y 1, y 2,...,
LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%
. Definição dos acontecimentos: M T-shirt tem manchas C T-shirt tem costuras defeituosas D T-shirt é defeituosa A Preço da t-shirt é alterado a) PM) = % PC) = 5% PM C) = % LEEC Probabilidades e Estatística
3. Estimação pontual USP-ICMC-SME. USP-ICMC-SME () 3. Estimação pontual / 25
3. Estimação pontual USP-ICMC-SME 2013 USP-ICMC-SME () 3. Estimação pontual 2013 1 / 25 Roteiro Formulação do problema. O problema envolve um fenômeno aleatório. Interesse em alguma característica da população.
Cap. 8 - Intervalos Estatísticos para uma Única Amostra
Intervalos Estatísticos para ESQUEMA DO CAPÍTULO 8.1 INTRODUÇÃO 8.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 8.3 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO
1 Probabilidade - Modelos Probabilísticos
1 Probabilidade - Modelos Probabilísticos Modelos probabilísticos devem, de alguma forma, 1. identificar o conjunto de resultados possíveis do fenômeno aleatório, que costumamos chamar de espaço amostral,
Introdução à probabilidade e estatística II
Introdução à probabilidade e estatística II Testes de hipóteses para duas médias populacionais Prof. Alexandre G Patriota Sala: 98A Email: [email protected] Site: www.ime.usp.br/ patriota Testes de hipóteses
TESTE DE KOLMOGOROV-SMIRNOV. Professor Ewaldo Santana Universidade Estadual do Maranhão - UEMA
TESTE DE KOLMOGOROV-SMIRNOV Professor Ewaldo Santana Universidade Estadual do Maranhão - UEMA Conteúdo 2 Ewaldo Santana Introdução 3 Ewaldo Santana Introdução Testes estatísticos paramétricos, tais como
Probabilidade e Estatística
Probabilidade e Estatística Aula 9 Fundamentos de Testes de Hipóteses Leitura: Devore, Capítulo 8 Chap 9-1 Objetivos Neste capítulo, vamos aprender: Os princípios básicos de testes de hipóteses Estabelecer
Testes de Hipóteses sobre a média: Várias Amostras
Testes de Hipóteses sobre a média: Várias Amostras Na aula de hoje veremos como comparar mais de duas populações, baseados em dados fornecidos por amostras dessas populações. A Análise de Variância (ANOVA)
Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza
Inferência 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média Renata Souza Aspectos Gerais A estatística descritiva tem por objetivo resumir ou descrever características importantes
6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA
6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 2019 Problemas de inferência Inferir significa fazer afirmações sobre algo desconhecido. A inferência estatística tem como objetivo fazer afirmações sobre uma característica
MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS As variáveis aleatórias X e Y seguem uma distribuição de Bernoulli com probabilidade de sucesso igual a 0,4. Considerando S = X + Y e que os eventos aleatórios A = [X = 1] e B
6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA
6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 214 Problemas de inferência Inferir significa fazer afirmações sobre algo desconhecido. A inferência estatística tem como objetivo fazer afirmações sobre uma característica
Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:
Pessoal, trago a vocês a resolução da prova de Estatística do concurso para Auditor Fiscal aplicada pela FCC. Foram 10 questões de estatística! Não identifiquei possibilidade para recursos. Considero a
Modelo de Regressão Múltipla
Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão
CONHECIMENTOS ESPECÍFICOS
fonte de graus de soma de quadrado variação liberdade quadrados médio teste F regressão 1 1,4 1,4 46,2 resíduo 28 0,8 0,03 total 2,2 A tabela de análise de variância (ANOVA) ilustrada acima resulta de
7 Teste de Hipóteses
7 Teste de Hipóteses 7-1 Aspectos Gerais 7-2 Fundamentos do Teste de Hipóteses 7-3 Teste de uma Afirmação sobre a Média: Grandes Amostras 7-4 Teste de uma Afirmação sobre a Média : Pequenas Amostras 7-5
TÓPICOS DE RESOLUÇÃO - Exame de Época de Recurso (Nocturno) 2009/2010. Primeira Parte. P (X a) =1 F (a). 0 f(x) 1. P (X a X b) = F (a) F (b)
TÓPICOS DE RESOLUÇÃO - Exame de Época de Recurso (Nocturno) 009/00 Primeira Parte [,0]. Considere a variável aleatória (v.a.) X e seja F (x) a sua função distribuição. Considere as seguintes afirmações:
Introdução à probabilidade e estatística II
Introdução à probabilidade e estatística II Testes de hipóteses para duas médias populacionais Prof. Alexandre G Patriota Sala: 98A Email: [email protected] Site: www.ime.usp.br/ patriota Testes de hipóteses
Disciplina de Modelos Lineares Professora Ariane Ferreira
Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável
Capítulo 9 - Regressão Linear Simples (RLS): Notas breves
Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou
TÓPICOS DE RESOLUÇÃO - Exame de Época de Recurso (Diurno) 2009/2010. Primeira Parte. F (b) F (a) =P (a <X<b) P (a <X<b)=
TÓPICOS DE RESOLUÇÃO - Exame de Época de Recurso (Diurno) 009/010 [,0] 1. Considere as seguintes afirmações: Primeira Parte I. Sendo F a função de distribuição da variável aleatória (v.a.) discreta X,
ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt
ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt [email protected] Estimação de parâmetros Média Variância Proporção Estimação de parâmetros Média: " estimador
EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari
EXPERIMENTAÇÃO ZOOTÉCNICA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari [email protected] TESTES PARA COMPARAÇÃO DE MÉDIAS O teste F permite tirar conclusões muito gerais relacionadas com os
Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza
Inferência 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média Renata Souza Aspectos Gerais A estatística descritiva tem por objetivo resumir ou descrever características importantes
DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)
1. Sabe-se que o nível de significância é a probabilidade de cometermos um determinado tipo de erro quando da realização de um teste de hipóteses. Então: a) A escolha ideal seria um nível de significância
MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência
MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência Introdução 1 Muito frequentemente fazemos perguntas do tipo se alguma coisa tem relação com outra. Estatisticamente
1. Conceitos básicos de estatística Níveis de medição Medidas características de distribuições univariadas 21
OS SABERES INDISPENSÁVEIS 7 Índice Prefácio 13 Capítulo 1 Os Saberes Indispensáveis 1. Conceitos básicos de estatística 17 1.1. Níveis de medição 18 1.2. Medidas características de distribuições univariadas
AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1
AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 Susan Schommer Econometria I - IE/UFRJ Distribuições amostrais dos estimadores MQO Nas aulas passadas derivamos o valor esperado e variância
Delineamento e Análise Experimental Aula 3
Aula 3 Castro Soares de Oliveira Teste de hipótese Teste de hipótese é uma metodologia estatística que permite tomar decisões sobre uma ou mais populações baseando-se no conhecimento de informações da
Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa
2011 O 1. Formular duas hipóteses sobre um valor que é desconhecido na população. 2. Fixar um nível de significância 3. Escolher a Estatística do Teste 4. Calcular o p-valor 5. Tomar a decisão mediante
TESTE DE COMPARAÇÃO MÚLTIPLA
SUMÁRIO 1 TESTE DE COMPARAÇÃO MÚLTIPLA Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos evidência de que existem diferenças entre as médias populacionais. Mas, entre
Professora Ana Hermínia Andrade. Período
Estimação intervalar Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2017.1 Estimação Intervalar Vimos que como
AULA 03 Estimativas e tamanhos amostrais
1 AULA 03 Estimativas e tamanhos amostrais Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade
Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin Estatística Básica 7ª Edição
Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin Estatística Básica 7ª Edição Procedimento teste de hipótese para proporção. Resumo. (1) Estabelecer as hipóteses: H: p = p 0 contra uma das alternativas
mat.ufrgs..ufrgs.br br/~viali/ mat.ufrgs..ufrgs.br
Prof. Lorí Viali, Dr. http://www. ://www.mat mat.ufrgs..ufrgs.br br/~viali/ viali@mat mat.ufrgs..ufrgs.br Média Uma amostra Proporção Variância Dependentes Diferença de médias m Duas amostras Independentes
MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ 13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 3 4 5 6 7 8 9 10 11 1 13 14 15 e 16 Introdução à probabilidade (eventos,
Esse material foi extraído de Barbetta (2007 cap 13)
Esse material foi extraído de Barbetta (2007 cap 13) - Predizer valores de uma variável dependente (Y) em função de uma variável independente (X). - Conhecer o quanto variações de X podem afetar Y. Exemplos
A Análise Multivariada é um conjunto de métodos estatísticos utilizados em situações nas quais várias
Sumário i Aula 1 Introdução A Análise Multivariada é um conjunto de métodos estatísticos utilizados em situações nas quais várias variáveis são medidas simultaneamente, em cada elemento amostral. Em geral,
Capítulo 9 - Regressão Linear Simples (RLS): Notas breves
Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou
AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012
1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à
MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS
MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS 1 Diversas distribuições podem ser consideradas para a modelagem de dados positivos com distribuição contínua e assimétrica, como, por exemplo, as
Intervalos de Confiança
Intervalos de Confiança Carla Henriques e Nuno Bastos Departamento de Matemática Escola Superior de Tecnologia de Viseu Carla Henriques e Nuno Bastos (DepMAT) Intervalos de Confiança 2010/2011 1 / 33 Introdução
Testes de Hipótese PARA COMPUTAÇÃO
Testes de Hipótese MONITORIA DE ESTATÍSTICA E PROBABILIDADE PARA COMPUTAÇÃO Testes de Hipóteses Um teste de hipótese é uma técnica de análise usada para estimar se uma hipótese sobre a população está correta,
Distribuição Amostral e Estimação Pontual de Parâmetros
Roteiro Distribuição Amostral e Estimação Pontual de Parâmetros 1. Introdução 2. Teorema Central do Limite 3. Conceitos de Estimação Pontual 4. Métodos de Estimação Pontual 5. Referências População e Amostra
1 Teoria da Decisão Estatística
1 Teoria da Decisão Estatística 1.1 Teste de Hipótese É uma metodologia estatística que permite tomar decisão sobre uma ou mais populações baseando no conhecimento de informações da amostra. Ao tentarmos
X 2. (σ 2 + µ 2 ) = 1 n (nσ 2 + nµ 2 ) = σ 2 + µ 2. µ = 0 E(T ) = σ 2
Estatística II (GET00182) Turma A1 Prova 1 20/10/2017 2/2017 NOME: GABARITO 1. Seja X 1, X 2,, X n uma amostra aleatória simples de uma população X com média µ e variância σ 2. (a) Mostre que, se µ = 0,
Distribuições Amostrais e Estimação Pontual de Parâmetros
Distribuições Amostrais e Estimação Pontual de Parâmetros ESQUEMA DO CAPÍTULO 7.1 INTRODUÇÃO 7.2 DISTRIBUIÇÕES AMOSTRAIS E TEOREMA DO LIMITE CENTRAL 7.3 CONCEITOS GERAIS DE ESTIMAÇÃO PONTUAL 7.3.1 Estimadores
