Análise Multivariada
|
|
- Silvana Prada de Oliveira
- 6 Há anos
- Visualizações:
Transcrição
1 Análise Multivariada Getúlio Amaral Universidade Federal de Pernambuco 2006
2 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional.
3 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional. Livros Textos Anderson, T. A. (1984), An Introduction To Multivariate Statistical
4 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional. Livros Textos Anderson, T. A. (1984), An Introduction To Multivariate Statistical Mardia, Kent and Bibby (1979) Multivariate Analysis
5 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional. Livros Textos Anderson, T. A. (1984), An Introduction To Multivariate Statistical Mardia, Kent and Bibby (1979) Multivariate Analysis Johnson and Wichern (1982) Applied Multivariate Statistical Analysis
6 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional. Livros Textos Anderson, T. A. (1984), An Introduction To Multivariate Statistical Mardia, Kent and Bibby (1979) Multivariate Analysis Johnson and Wichern (1982) Applied Multivariate Statistical Analysis Avaliação 1 Prova 2 Trabalho (artigo, apresentação, relatório, 5 perguntas, respostas) Sorteio toda aula 3 Conjunto de Dados
7 Pesquisas Históricas Normal Bivariada: Adrian (1808) Laplace (1811) Gauss (1823) Galton Geneticista - Correlação, Regressão e Homocedasticidade Karl Pearson - Coeficiente de correlação para estudar problemas em genética, biologia e outras áreas. Fisher - Métodos para agricultura, botanica e outras áreas.
8 Normal Multivariada Tem sido adequada para problemas de várias áreas do conhecimento como psicologia, engenharia, economia e outros. Métodos não Paramétricos (serão abordados em seminários) Modernos, boas possibilidades de pulicações, melhores resultados em muitos casos. Bootstrap Distribuição Empírica c/reamostragem Kernel Distribuição estimada dos dados
9 Matrix de dados X = x x 1p.. x n1... x np Seja x i a i-ésima linha escrita como coluna, que é dada por Seja x (j) a j-ésima coluna de X x i = (x i1,..., x ip ) x (j) = (x 1j,..., x nj )
10 Vetor de Médias Análise Multivariada x = ( x 1,..., x p ) onde x i = 1 n n r=1 x ri. Matriz de covariância S = (s ij ), onde s ij = 1 n n r=1 (x ri x i )(x rj x j ). Notação Matricial x = 1 n X 1, onde 1 = (1,..., 1) é um vetor de dimensão n. Para a matriz de covarianância ou ainda, se H = I 1 n 11, S = 1 n (X X 1 n X 11 X ), S = 1 n X HX
11 Matriz de Correlação R = (r ij ), onde r ij = s ij s i s j. Exercício 1 (Mardia et al, 1979, p. 11) Exemplo (dados de 28 árvores). Calcular, usando o R ou outro programa, o vetor de médias, a matriz de covariância e a matriz de correlação. Exercício 2 Fazer o download do "Atlas do desenvolvimento Humano do Recife."Escolher uma variável quantitativa e calcular as mesmas quantidades do exercício 1.
12 Combinações lineares Análise Multivariada Transformação de Escala y r = a 1 x r1 +,..., a p x rp y r = D 1 (x r x), onde r = 1,..., n, D = diag(s i ) e diag(.) denota uma matriz diagonal. Esta mudança torna unitária a variância das variáveis. Transformação de Mahalanobis z r = S 1/2 (x r x), onde S 1/2 S 1/2 = S é inversa da matriz raiz quadrada de S. S 1/2 é definida a partir dos autovalores e autovetores de S. Se Γ é matriz de autovetores de S e λ 1,..., λ p os autovalores de S,a matriz raiz quadrada é dada por onde Λ 1/2 = diag(λ 1/2 i ). A inversa de S 1/2 é por S 1/2 = ΓΛ 1/2 Γ, S 1/2 = ΓΛ 1/2 Γ,
13 Notação X :Matriz de Dados; x i : uma observação; x (j) uma variável; X i um vetor aletório cujo o valor observado é x i.
14 Distribuições Multivariadas Considere p variáveis aleatórias X 1,..., X p, a função de distribuição de probabilidade (fdp) é dada por F (x 1,..., x p ) = P(X 1 x 1 ),..., X p x p ). A função de densidade (fd) é definida por e F (x 1,..., x n ) x 1... x p = f (x 1,..., x p ). F (x 1,..., x p ) = xp x1... f (u 1,..., u p )du 1... du p.
15 Independência Seja F (x 1,..., x p ) a fdp de X 1,..., X p, o conjunto de variáveis aleatórias X 1,..., X p, é mutuamente independente se F (x 1,..., x p ) = F 1 (x 1 )... F p (x p ), onde F i (x i ) =... f (u 1,..., u p )du 1... du p, onde u j x i
16 Transformação de Variáveis Se a densidade de X 1,..., X p é f (x 1,..., x p ), considere as seguintes p funções Análise Multivariada y i = y i (x 1,..., x p ) A transformaç ao inversa é x i = x i (y 1,..., y p ). Considere as p variáveis aleatórias Y i = y i (x 1,..., x p ) A densidade de Y 1,..., Y p é onde g(y 1,..., y p ) = f (x 1 (y 1,..., y p ),..., xp(y 1,..., y p )) J(y 1,..., y p ) = x 1 y 1... J(y 1,..., y p ), x 1 y p.. x p... x p
17 Amostra Aleatória Seja X 1,..., X n uma amostra aleatória de uma distribuição F (x) com vetor de médias µ e matriz de covariância Σ. O estimador é centrado, isto é, E( X ) = µ. Além disto, cov( X ) = 1 n Σ. X = n i=1 X i n
18 É possível mostrar também que E(S n ) = n 1 n Σ, onde S n = n j=1 (X j X )(X j X ). Exercício 3 Se um vetor aleatório V tem E(V ) = µ v e Cov(V ) = Σ v, prove que E(VV ) = Σ v + µ v µ v.
19 Normal Multivarida Normal univariada Análise Multivariada f (x; µ, σ) = k exp 1 2 (x µ)σ 1 (x µ) As quantidades univariadas podem ser redefinidas para o caso multivariado x = µ = x 1. x n µ 1. µ n
20 σ 1,1... σ 1,m Σ =..... σ k,1... σ k,m Substituindo-se x, µ e σ por suas versões multivariadas, temos f (x; µ, σ) = k exp 1 2 (x µ) Σ 1 (x µ). A única incógnita para determinar a distribuição de x é k.
21 Cálculo da Constante k k =... exp 1 2 (x µ) Σ 1 (x µ) dx p... dx 1. Usando-se o corolário A.1.6 (Vide Anderson, 1984, p. 586), se Σ é positiva definida, então existe uma matriz não singular C tal que Análise Multivariada C Σ 1 C = I, I é a matriz identidade e C é a tranposta de C. Considere onde y = (y 1,..., y p ). Temos que x µ = Cy, Como (x µ) Σ 1 (x µ) = y C Σ 1 Cy = y y. J = C, a constante de interesse é dada por
22 1 Simplificando-se o integrando, temos exp { 1 2 y y} = p i=1 exp 1 2 y 2 i. O valor da constante de interesse é dado por Análise Multivariada k = Mod C... exp 1 2 y exp 1 2 y 2 p dyp... dy 1 = Mod C exp 1 2 y 2 1 dy1 = Mod C ( 2π) p. exp 1 2 y 2 p dyp... Calculando-se o determinante de C, tem-se o que resulta em C Σ 1 C = I,
23 Exercício 4 Considere uma distribuição multivariada do vetor (x, y). Para obter este vetor, seja u and v N(0, 1) independentes e defina x = u se uv 0 enquanto x = u se uv < 0. Defina y = v. Mostre que x e y são N(0, 1), porém (x, y) não tem distribuição normal bivariada.
24 Esperança e Covariância Esperança de Um Vetor Se X = (X 1,..., X p ), o valor esperado de X é dado por E(X ) = E(X 1 ). E(X p ).
25 Se Y = DX + b, onde X é um vetor aleatório, podemos afirmar que e E(Y ) = DE(X ) + b Prova: Anderson (1984, p. 19). V (Y ) = DV (X )D.
26 Se a função de densidade de X é definida como Temos que e A (2π) 1 2 p 1 2 (x µ) Σ 1 (x µ) exp E(X ) = µ V (X ) = Σ. Prova: Anderson (1984, pp ). Notação: N(µ, Σ) denota uma normal multivariada com média µ e matriz de covariância Σ.
27 Teorema. Se X N(µ, Σ), a transformação Y = CX tem distribuição N(Cµ, CΣC ), onde C é não singular. Prova: Vide Anderson (1984, pp ).
28 Teorema. A função característica de X N(µ, Σ) é igual a φ(t) = E(exp it X ) = exp it µ 1 2 t Σt, onde t é um vetor real. Prova: Anderson (1984, p. 46).
29 Exercício 5 Encontre µ e Σ nas densidades: a) 1 2π exp 1 2 [(x 1)2 +(y 2) 2 ] b) 1 2π exp 1 2 [x 2 +y 2 +4x 6y+13] Exercício 6 Prove que se Σ é positiva definida, tem-se (Vide Anderson, 1984, p. 35). Σ = Σ 11 Σ 12 Σ 1 22 Σ 21 Σ 22.
30 Exercício 7 Se X N(µ, Σ), onde e Σ 1 = µ = qual é a distribuição de X 1 + 2X 2 3X 3. Exercício 8 Quais são as densidades marginais de X e Y em (a) e (b) do exercício 5.,
31 Distribuição de (X µ) Σ 1 (X µ) Seja X distribuida como uma N(µ, Σ), com Σ > 0, os seguintes resultados são válidos: 1. (X µ) Σ 1 (X µ) χ 2 p. 2. P[(X µ) Σ 1 (X µ) χ 2 p] = 1 α é um elipsoide.
32 Verificação da Hipótese de Normalidade Multivariada 1. Obter q-q plots e aplicar testes de normalidade (Kolmogorov ou outro), para cada variável individualmente. 2. Fazer diagramas de dispersão (XY) e verifique se o conjunto dos pontos possuem aproximadamente a forma de uma elipse. 3. Verificar se existem pontos aberrantes que precisam ser cuidadosamente analisados.
33 4 Calcular dj 2 = (x j x) S 1 (x j x) j = 1,..., n, onde x 1,..., x n são as observações amostrais. Em seguida, verificar por um Q-Q plot se os d j s seguem uma distribuição χ 2 p.
34 Estimação de Máxima Verossimilhança Análise Multivariada Função de Verossimilhança Considere uma a.a. X 1,..., X n onde X i tem f.d.p f (x i ; θ), onde θ é um vetor de parâmetros. A função de verossimilhança é definida como L(x 1,..., x n ; θ) = n f (x i ; µ). i=1
35 Estimação de Máxima Verossimilhança Análise Multivariada Função de Verossimilhança Considere uma a.a. X 1,..., X n onde X i tem f.d.p f (x i ; θ), onde θ é um vetor de parâmetros. A função de verossimilhança é definida como L(x 1,..., x n ; θ) = n f (x i ; µ). i=1 O log da função de verossimilhança é é dado por l(x 1,..., x n ; θ) = n log f (x i ; µ). i=1
36 Estimação de Máxima Verossimilhança Análise Multivariada Função de Verossimilhança Considere uma a.a. X 1,..., X n onde X i tem f.d.p f (x i ; θ), onde θ é um vetor de parâmetros. A função de verossimilhança é definida como L(x 1,..., x n ; θ) = n f (x i ; µ). i=1 O log da função de verossimilhança é é dado por l(x 1,..., x n ; θ) = n log f (x i ; µ). i=1
37 Distribuição Normal Análise Multivariada Caso da Normal Multivariada l(x 1,..., x n ; θ) = n 2 log 2πΣ 1 2 n (x i µ) Σ 1 (x i µ) i=1
38 Distribuição Normal Análise Multivariada Caso da Normal Multivariada l(x 1,..., x n ; θ) = n 2 log 2πΣ 1 2 ou n (x i µ) Σ 1 (x i µ) i=1 l(x 1,..., x n ; θ) = n 2 log 2πΣ n 2 trσ 1 S n 2 ( x µ) Σ 1 ( x µ). (Vide Mardia et al, 1979, pp ).
39 Escores e Matrix de Informação Análise Multivariada Função Escore S(x 1,..., x n ; θ) = l(x ; θ) θ Matriz de Informação de Fisher ( 2 ) l F = E θ θ
40 Estimadores de Máxima Verossimilhaça Análise Multivariada O máximo de l(x ; θ) é obtido quando ( l/ θ) = 0, para um certo valor ˆθ, que é o estimador de máxima verossimilhança de θ. Exercício 9 Verifique que no exemplo (Vide Mardia et al, 1979, p. 100) têm-se l(x ; θ) = log c n log 4+x 1 log 2 + θ+(x 2 +x 3 )log(1 θ)+x 4 log θ, e s(x ; θ) = l(x ; θ) θ = x θ x 2 + x 3 1 θ + x 4 θ F = n(1 + 2θ) 2θ(1 θ)(2 + θ).
41 Exercício 10 Encontre o estimador de máxima verossimilhança do exercício 9 por solucionar a equação s(x ; θ) = 0. Os problemas descritos acima tratam da distribuição descrita por Fisher (1970, p. 305), que é um experimento com 4 resultados cujas as probabilidades destes resultados são (2 + θ)/4, (1 θ)/4, (1 θ)/4 e θ/4. Esta distribuição é uma multinomial.
42 Maximizando a Verossimilhaça da Normal Multivariada Análise Multivariada Log Verossimilhança l(x 1,..., x n ; θ) = n 2 log 2πΣ n 2 trσ 1 S n 2 ( x µ) Σ 1 ( x µ). Estimadores ˆµ = x, ˆΣ = S. Para garantir que o ponto crítico é o máximo, usa-se Teorema Se A é uma matrix p p fixa, o máximo de é Σ = n 1 A. f (Σ) = Σ n/2 exp( 1 2 trσ 1 A)
43 Inferência Bayesiana (Vide Gelman et al, 1995, pp. 3-82). 1. Existe um modelo probabilístico completo, isto é, uma distribuição de probabilidade conjunta para todas as quantidades observáveis e não observáveis. 2. Obter uma distribuição condicionada aos dados observados. 3. Avaliar o modelo e a distribuição obtida a posteriori. Caso o modelo não seja adequado, as etapas 1, 2 e 3 devem ser repetidas. O pensamento Bayesiano facilita uma interpretação das conclusões estatísticas associadas ao bom senso. Um intervalo de confiança bayesiano para uma quantidade de interese desconhecida pode ser considerado como tendo uma alta probabilidade de conter o parâmetro verdadeiro. Por outro lado, o intervalo frequentista, não pode ter a mesma interpretação. O que pode ser dito é que em uma grande quantidade de realizações de um experimento espera-se que o intervalo contenha o valor verdadeiro em uma grande proporção destas realizações. Análise Multivariada
44 Notação Bayesiana θ - Vetor de quantidades não observáveis. y - Dados observados ỹ - Quantidade desconhecida que, porém, é potencialmente observável. p(θ) - Priori, representa o conhecimento subjetivo que o pesquisador da área de estudo (medicina, oceanografia, engenharia) têm a respeito de θ. p(y θ) - Verossimilhança, representa as informações provinientes dos dados. p(θ y) - Posteriori, é a distribuição final que é utilizada para construir regiões de confiança e para testar hipóteses. Regra de Bayes p(θ y) = p(θ)p(y θ).
45 Verossimillhança para um ponto da Normal univariada Verossimilhança P(y θ) = 1 2πσ exp 1 2σ 2 (y θ)2 Análise Multivariada Priori p(θ) exp( 1 τ0 2 (θ µ 0 ) 2 ), θ N(µ 0, τ0 2), onde µ 0 e τ0 2 são hyperparâmetros. Posteriori P(θ y) exp( 1 [ (y θ) 2 2 σ 2 + (θ µ 0) 2 ] τ0 2 Simplificandos-se (completando-se quadrados e etc), onde P(θ y) exp( 1 2τ1 2 (θ µ 1 ) 2, µ 1 = 1 τ 2 0 µ σ 2 y 1 τ σ 2
46 Normal Multivariada Verossimilhança P(y µ, Σ) Σ exp ( 1 ) 2 (y µ) Σ 1 (y µ) Análise Multivariada para uma amostra Y 1,..., Y n, P(y 1,..., y n ) Σ n/2 exp Posterior Distribution P(µ y, Σ) exp ou ainda, ( 1 2 [ n (y i µ) Σ 1 (y i µ) i=1 (µ µ 0 ) Λ 1 0 (µ µ 0) + P(µ y, Σ) = N(µ µ n, Λ n ), ]) n (y i µ) Σ 1 (y i µ), i=1 µ n = (Λ nσ 1 ) 1 (Λ 1 0 µ 0 + nσ 1 ȳ), Λ 1 n = Λ nσ 1.
47 Testes de Hipóteses Análise Multivariada Teste da Razão de Verossimilhança Seja X 1,..., X n uma a.a. de F (θ). Sejam H 0 : θ Ω 0 e H 1 : θ Ω 1. A razão de verossimilhança é definida por λ(x) = L 0 L, 1 onde L i é o maior valor que a função de verossimilhança assume na região Ω i, i = 0, 1. Para simplificar, usa-se a estatística onde l 1 = log L 1 e l 0 = log L 0. 2logλ = 2(l 1 l 0 ),
48 Hipótese H 0 : µ = µ 0, ΣConhecido Análise Multivariada l 0 = l(µ 0, Σ) = 1 2 nlog 2 piσ 1 2 trσ 1 S 1 2 n( x µ 0) Σ 1 ( x µ 0 ) Não existe restrições para µ em H 1, logo, E.M.V de µ é x. Usando-se a razão de verossimilança, 2logλ = 2(l 1 l 0 ) = n( x µ 0 ) Σ 1 ( x µ 0 )
49 Hipótese H 0 : µ = µ 0, Σ desconhecido (Teste de Hotelling para Uma Amostra) Análise Multivariada Σ deve ser estimado sob H 0 e H 1. Usando os resultados de Mardia et al (1979, pp ), Sob H 0, ˆµ = µ 0 e ˆΣ = S + dd onde d = x µ 0. Sob H 1, ˆµ = x e ˆΣ = S. Logo, l0 = l(µ 0, S +dd ) = 1 2 {plog2π+log S +log(1+d S 1 d)+p} e l1 = l( x, S) é obtido por colocar d = 0 na expressão acima. Logo, 2logλ = 2(l1 l0 ) = nlog(1 + d S 1 d). A estatística d S 1 d é chamada de T 2 de Hotelling.
50 A distribuição da estatística n p d S 1 d F p,n p. p falicita o uso do teste acima em muitos problemas reais.
51 Hipótese H 0 : Σ = Σ 0, onde µ Desconhecido Análise Multivariada Sob H 0, temos ˆµ = x e Σ = Σ 0. Sob H 1, temos ˆµ = x e Σ = S Logo, l 0 = 12nlog 2πΣ ntrσ 1 0 S, e l 1 = 12nlog 2πΣ 1 2 np 2logλ = ntrσ 1 0 S nlog Σ 1 0 S np. Distribuição muito complexa, alternativas: bootstrap, verossimilhança empírica.
52 Se w e v são variáveis aletórias unidimensionais independentes e suas distribuições são σ 2 χ 2 α e σ 2 χ 2 β, respectivamente, o termo w/v têm distribuição F α,β. Distribuição de Wishart Se M(p) pode ser escrita como M = X X, one X (n) é uma matriz de dados de N(0, Σ), a distribuição da matriz M é uma Wishart com matriz de escala Σ e com n graus de liberdade. A forma padrão da distribuição ocorre quando M = I. A distribuição de Wishart é denotada po W p (Σ, n).
53 No caso multivariado, Se A W (Σ, m) e B W (Σ, n) são independentes, define-se que Λ = A / A + B = I + A 1 B 1 Λ(p, m, n), onde Λ(p, m, n) é a distribuição lambda de Wilks.
54 Teste T 2 de Hotelling para 2 Amostras Análise Multivariada Se x e M são independentes e distribuidas como N(µ, Σ) e W p (Σ, m), respectivamente, têm-se m(x µ) M 1 (x µ) T 2 (p, m), onde T 2 (p, m) é a distribuição de Hotelling com parâmetros m e p. Theorem T 2 (p, n) = {np/(n p + 1)} F p,n p+1 Logo, {(n p)/p}( x µ)σ 1 ( x µ) F p,n p Suponha duas amostras de tamanho n 1 e n 2, onde n 1 + n 2 = n.
55 Teste de Hotelling p/ Duas Populações H 0 : µ 1 = µ 2 Considera-se que as matrizes de covariância são iguais. O núcleo da estatística do teste é D 2 = ( x 1 x 2 ) S 1 c ( x 1 x 2 ), onde (S c = n 1 S 1 + n 2 S 2 )/(n 2) é a matriz de covariância combinada. Usando os resultados anteriores, temos n 1 n 2 (n p 1) D 2 F (p,n p 1). n(n 2)p
56 Problema de Várias Amostras Análise de Variância com um Fator Considere H 0 : µ 1 =... = µ p, dado que Σ 1 =... = Σ k Sob H 0, os EMV s de µ e Σ são x e S, respectivamente. Sob H 1, a log-verossimilhaça é dada por Análise Multivariada l 0 = 1 2 p i=1 [n i log 2πΣ + n i trσ 1 (S i + d i d i )], onde S i é a matriz de covariância da i-ésima amostra e d i = x i µ i. O EMV de µ i é x i e l 0 = 1 2 log 2πΣ 1 2 trσ 1 W, onde W = p n i S i. Derivando a equação acima com respeito a Σ e igualando a zero, temos ˆΣ = n 1 W. i=1
57 Problema de Várias Amostras Análise Multivariada W = soma de quadrados e produtos (SQP) dentro dos grupos A razão das verossimilhanças é dada por λ = { } n/2 W = T 1 W n/2, ns onde T = ns é a SQP total. Como W é a SQPD e T é a SQPT, temos a seguinte relação B = T W = n i ( x i x)( x i x), onde a matriz B é considerada a SQP entre os grupos ou SQPE. Logo podemos escrever λ = W B + W = I + W 1 B 1. Antes de determinar a distribuição desta estatística, é necessário introduzir algumas definições.
58 Exercício 11 A densidade de uma normal bivariada é Existe uma elipse associada a esta densidade. Os eixos e faça um gráfico desta elipse. Exercício 12 Se X N(0, Σ), onde = ( ), Ache a tal que X = a Y e Y tem distribuição normal não singular. Apresente a densidade de Y.
59 Exercício 13 Considere (X 1, Y 1 ), (X 2, Y 2 ), (X 3, Y 3 ), onde (X i, Y i ) são i.i.d com distribuição N(µ, Σ), com e µ = (µ x, µ y ) Σ =.
60 Análise de Agrupamento Análise Multivariada Histórico Hindus usaram o sexo, características físicas e comportamentais para classificar pessoas em seis tipos, os quais eles usaram nomes de animais. Romanos usaram Caraterísticas Físicas e gregos nove temperamentos. Existem muitos critérios para classificar, o genêro, a espécie e outros.
61 Matriz de Dados x x 1p X =....., x n1... x np Classificação das técnicas de agrupamento: i)técnicas Hierárquicas; ii)técnicas de Partição-Otimização.
62 Idéia geral de alguns métodos: 1)Cálculo das distâncias; 2)Algoritmo para agrupar as observações. Distância Euclideana A distância entre os objetos "i"e "j"pode ser calculada por d(x i, x j ) = (x i1 x j1 ) 2 +,..., +(x ip x jp ) 2
63 Métodos Aglomerativos Análise Multivariada Inicia com o cálculo das distâncias ou similaridades entre os objetos, o que produz uma matriz n n com estas medidas. Como existem vários métodos para calcular distâncias ou similaridades, existirá para um certo método aglomerativo várias opções. Além das medidas de distâncias e similaridades, é fundamental estabelecer o algoritmo utilizado para formar os grupos de entidades.
64 Método do Vizinho Mais Próximo Inicialmente, se existem n indivíduos, existirão n grupos. Em cada etapa existe uma fusão entre os grupos mais próximos. Exemplo: Suponha que a matriz de distâncias é: D 1 = , No primeiro passo, ocorre o agrupamento de 1 e 2, e novas distâncias são calculadas usando Análise Multivariada A nova matriz é: d (12)3 = Min{d 13, d 23 } = d 23 = 5.0 D 2 = ,
65 Método da Ligação Completa Análise Multivariada As mesmas etapas devem ser seguidas. Porém, em cada agrupamento a nova distância deve ser calculada como d (12)3 = max{d 13, d 23 } = d 13 = 6.0
66 Método do Centróide Análise Multivariada Calcula-se a matriz de distâncias entre todos os objetos. Os objetos com a menor distância irão forma um novo grupo. Calcula-se o centróide de um novo grupo e usa-se esta medida para obter a matriz distância relativa a este grupo. A distância entre os grupos é calculada como a distância entre os centróides dos grupos.
67 Distâncias, Similaridades e seus Axiomas Análise Multivariada 1. D(x, y) 0; 2. D(x, y) = 0 sse x = y; 3. D(x, y) = D(y, x), x, y R d ; 4. D(x, y) D(x, z) + D(y, z), x, y, z R d ; 1. s(a, B) = s(b, A) 2. s(a, B) > 0 3. s(a, B) similaridade entre A e B
68 Medidas de Distância Análise Multivariada Nome Fórmula { p } 1/2 Euclideana j=1 w j(x rj x sj ) 2 1 Karl Pearson w j s 2 k Mahalanobis {(x r x s )Σ 1 (x r x s )} 1/2 p Manhanttan j=1 w j x rj x sk Tabela: Distâncias, Mardia et al. (1979, p. 381) Variáveis Qualitativas r = ad bc (a + b)(c + d)(a + c)(b + d).
69 Método de K-Médias Análise Multivariada Este método adiciona cada item ao grupo que tem o centróide (média) mais próxima. A versão mais simples deste método têm as seguintes etapas: 1. Decidir qual o valor de K 2. Particionar os itens em K grupos 3. Para cada item, verificar que grupo é mais próximo. Caso exista um grupo mais próximo do item do que seu grupo atual, retirar este item do grupo atual e recolocá-lo no grupo mais próximo. Em seguida, os novos centróides de cada grupo devem ser recalculados. 4. repetir a etapa 3 até que nenhum item precise ser movido.
70 Análise Discriminante Análise Multivariada Considere g populações ou grupos Π 1,..., Π g, onde se x i Π j então x i f j (x). O objetivo é alocar um certo objeto "i"a uma das populações Π j, usando o vetor de variáveis x i. Esta alocação deve minimizar o erro de classificação. Duas situações principais de classificação: a)análise de Agrupamento - A população do objeto "i"não é conhecida (classificação não supervisionada) b)análise discriminante - A população do objeto "i"é conhecida (classificação supervisionada)
71 Modelos de Classificação Existem 2 principais casos de interesse: 1. A f.d.p. associada a Π j é f j (x), isto é, uma densidade de forma conhecida; 2. Um método empírico, onde nenhuma forma particular para a f.d.p. associada a Π j é assumida. Regra de alocação: Alocar o objeto x a uma das populações Π 1,..., Π g que produz o maior valor da verossimilhança para x. Assim, Análise Multivariada L i (x) = Max i L i (x). Para os próximos exemplos, considere que P(L i (x) = L k (x)para algum i k Π i ) = 0. Distribuição Normal: Caso de duas Populações Π 1 = N(µ 1, σ1 2) Π 2 = N(µ 2, σ2 2) { L i (x) = (2πσi 2 ) 1/2 exp 1 ( ) ) 2 x µi. 2 σ i
72 { λ = L 1(x) L 2 (x) = σ 2 exp 1 σ 1 2 Simplificando, [ (x ) 2 ( ) ]} 2 µ1 x µ2 + > 1 σ 1 σ 2 x 2 ( 1 σ σ 2 2 ) ( µ1 2x σ1 2 µ ) ( ) 2 µ 2 σ σ1 2 µ2 2 σ2 2 < 2 log σ 2 σ 1 Esta regra é utilizada para alocar x a Π 1 ou Π 2. Teorema Se Π = N p (µ i, Σ), i = 1,..., g e Σ > 0, x é alocado a Π j se (x µ j ) Σ 1 (x µ j ) é o valor mínimo de a i Σ 1 a i, onde a i = (x µ i ), para i = 1,..., g.
73 Quando g = 2, a regra é alocar x a Π 1 se α (x µ) = [Σ 1 (µ 1 µ 2 )] (x 1 2 (µ 1 µ 2 )) = (µ 1 µ 2 ) Σ 1 (x µ 1 2 µ 2 2 ) > 0.
74 Estimando a Regra Discriminante Análise Multivariada Condições: 1. Matriz de Dados X (n p); 2. Π 1,..., Π g são conhecidos com f i (µ, Σ) normal, e µ e Σ devem ser estimados; 3. As linhas de X são particionadas em g grupos X = (X 1,..., X g ); 4. x 1,..., x g P e S u = ni S i (n g) µ 1,..., µ g e Σ. Se g = 2, A regra é alocar x a Π 1 se são os estimadores não viesados de ( x 1 x 2 )S 1 {x 1/2( x 1 + x} > 0.
75 Componentes Principais Análise Multivariada A média representa uma combinação linear que é dada por 1 5 1x = ( ) x. Porém, esta combinação linear atribui o mesmo peso à todas as variáveis. O método de componentes principais fornece uma combinação linear com pesos diferentes. Definição Se x é um vetor aleatório com média µ e matriz de covariância Σ, as componentes principais são definidas por y = Γ (x µ), onde Γ é ortogonal, Γ ΣΓ = Λ = diag{λ 1,..., λ p.} Tem-se que λ 1 λ 2... λ p 0 e Γ é a matriz de autovetores.
76 Teorema Se x (µ, Σ), a transformação y = Γ (x µ) satisfaz os seguintes resultados a)e(y i ) = 0 b) V (Y i ) = λ i c) Cov(Y i, Y j ) = 0, i j b)v (Y 1 ) V (Y 2 )... V (Y p ) 0 e) p i=1 V (Y i) = trσ f) p i=1 V (Y i) = Σ Teorema: Nenhuma combinação linear de x tem variância maior do que λ 1, a variância da primeira componente principal.
77 Se α = a x é uma combinação linear de x que não é correlacionada com as com as primeiras k componentes principais de x, então a variância de α é maximizada quando α é a (k + 1) ésima componente principal. Componentes Principais Amostrais Análise Multivariada X = (x 1,..., x n ) Xa é uma soma ponderada das colunas de X. V (Xa) = a Sa Primeira componente principal e Y (1) = (X 1 X )e (1) Y (i) = (X 1 X )e (i). O conjunto dos componentes principais é dado por Y = (X 1 X )G.
78 Propriedades das Componentes Principais Análise Multivariada a)a proporção da variabilidade explicada pelas k componentes principais é dado por (λ λ k ) (λ λ p ). b)componentes principais são afetadas por mudança de escala. Isto pode ser solucionada por padrozinar as variáveis ou usar a matriz de correlação. c)o posto de x = r < p, a variabilidade total pode ser explicada pelas r primeiras componentes. d)elipsóide (x µ)s 1 (x µ) = T α
79 Eliminação de Componentes Análise Multivariada hipóteses H 0 : λ p = λ p 1 =... = λ k+1. O log da estatística da razão de verossimilhança é dada por 2logλ = np(a 1 log g), onde a e g são as médias geométricas dos autovalores de Σ 1 S, onde Σ de Σ. Os autovalores de S são os mesmos de Σ. Sejam a 0 = (λ k+1,...,+λp) (p k) e g 0 = (λ k+1,..., λ p ). A estatística para testar a hipótese acima, com a aplicação da correção de Bartlett, é dada (n 2p + 11 )(p k) log( a 0 ) χ 2 (p k+2)(p k 1)/2, 6 g 0 O mesmo pode ser feito com a matriz de correlação (Vide Mardia et al (1979, p. 236).
80 Componentes Principais e Análise de Regressão Análise Multivariada Para várias explicativas muito correlacionadas, o método de componentes principais torna-se uma boa alternativa. O critério de escolha das componentes não é mais o teste anteriormente descrito. Este critério é o mesmo usado para as variáveis explicativas do modelo de regressão, onde estas variáveis explicativas são as componentes principais. As principais vantagens do uso de componentes principais em análise regressão são: O uso de componentes principais faz com que todas as variáveis possam ser utilizadas na análise. As componentes principais permitem que o efeito individual de cada variável seja melhor quantificado.
81 Formulação do Modelo Análise Multivariada Modelo de regressão y = X β + ɛ, onde ɛ N(0, σ 2 H) e H = I n O modelo de regressão com as componentes principais W = XG é definido como onde α = G β. y = W α + ɛ,
82 Regressão Múltipla Multivariada Análise Multivariada Modelo onde Y (n m) = Z n (p+1) β (p+1) m) + ɛ (n m), z 11 z z 1m Z = z n1 z n2... z nm β 01 β β 0m β = β p1 β p2... β pm ɛ 11 ɛ ɛ 1m ɛ = ɛ n1 ɛ n2... ɛ nm
83
84
85
86 Anderson, T. W., (1971). An Introduction to Multivariate Statistical Analysis, John Wiley & Sons, New York. Everitt, B., (1974). Cluster Analysis, Heinemann Educational Books, London. Mardia, K. V., Kent, J. T. and Bibby, J. M. (1979). Multivariate Analysis, Academic Press, London.
87 Critérios de Avaliação - Atlas Banco de Dados Análise Multivariada 1. Usar latex; 2. Usar R ou OX; 3. A avaliação é competitiva, isto é, o melhor trabalho recebe a melhor nota e força a redução das notas dos outros trabalhos; 4. Justificar a escolha das variáveis e o objetivo de sua análise; 5. Usar as informações dos livros porque as notas de aula são apenas slides; 6. Explicar os modelos utilizados (equações e idéias); 7. Colocar referências bibliográficas; 8. Escrever notas explicativas nos programas desenvolvidos e colocar todos os programas em um apêndice. As melhores análises serão enviadas para secretaria de planejamento da cidade do Recife. Nossa expectativa é receber alguma retroalimentação.
88 Calendário Análise Multivariada Prova Análise do Banco de Dados: Atlas (Recife) Seminário:
89 Os trabalhos entregues 2 dias antes do prazo têm um acréscimo de 20% no valor da nota. Método Data Abraão Fábio Juliana da Entrega Agrupamento ,6 2,4 2,2 Discriminante ,6 2,4 2,4 Componentes ,4 2,4 2,2 Principais Regressão Multivariada ,6 2,4 2,3 Tabela: Cronograma e Avaliação
90 Os alunos José Luis e Edson já estão reprovados. Aluno SeminárioProva Análise Dados Média Final Abraão 9,5 7,5 10 9,0 Edson 4 0,7 0 Fábio 8,5 7,0 9,6 8,4 Jose Luis Juliana 8,5 4, ,4 Tabela: Resultados Parciais
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um
Leia maisVetor de Variáveis Aleatórias
Vetor de Variáveis Aleatórias Luis Henrique Assumpção Lolis 25 de junho de 2013 Luis Henrique Assumpção Lolis Vetor de Variáveis Aleatórias 1 Conteúdo 1 Vetor de Variáveis Aleatórias 2 Função de Várias
Leia maisTécnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
Leia maisCC-226 Aula 07 - Estimação de Parâmetros
CC-226 Aula 07 - Estimação de Parâmetros Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Estimação de Parâmetros Para construir o classificador bayesiano, assumimos as distribuições
Leia maisTécnicas computacionais em probabilidade e estatística II
Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.
Leia maisRalph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:
Leia maisInferências sobre o vetor de Média. (Johnson & Wichern, Cap. 5) Considere o problema univariado no qual temse uma amostra aleatória de tamanho n da
Inferências sobre o vetor de Média (Johnson & Wichern, Cap. 5) Considere o problema univariado no qual temse uma amostra aleatória de tamanho n da distribuição N(µ, σ 2 ), em que ambos os parâmetros de
Leia maisInferência Estatistica
Inferência Estatistica Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Modelos e Inferência Um modelo é uma simplificação da realidade (e alguns
Leia maisModelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados
Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Erica Castilho Rodrigues 23 de Maio de 207 Introdução 2 3 Vimos como encontrar o EMV usando algoritmos numéricos. Duas possibilidades:
Leia maisModelo de Regressão Múltipla
Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão
Leia maisUniversidade Federal de Pernambuco Departamento de Estatística Inferência Estatística (PGE 951) Método de Máxima Verossimilhança (M.M.V.
Universidade Federal de Pernambuco Departamento de Estatística Inferência Estatística (PGE 95) Método de Máxima Verossimilhança (MMV) Definição: Qualquer ˆθ = ˆθ(X,, X n ) Θ tal que L(ˆθ; x,, x n ) = Sup{L(θ)
Leia maisUniversidade Federal do Rio de Janeiro. Centro de Ciências Matemáticas e da Natureza. Instituto de Matemática. Departamento de Estatística
Universidade Federal do Rio de Janeiro Centro de Ciências Matemáticas e da Natureza Instituto de Matemática Departamento de Estatística Uma Revisão da Análise de Variância Multivariada com Aplicações em
Leia maisAnálise de regressão linear simples. Diagrama de dispersão
Introdução Análise de regressão linear simples Departamento de Matemática Escola Superior de Tecnologia de Viseu A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente
Leia maisEstatísticas Inferenciais Distribuições Amostrais. Estatística
Estatística Na descrição dos conjuntos de dados x 1,..., x n, não foi feita menção ao conceito de população. Estatísticas inferenciais: preocupadas com a fonte dos dados e em tentar fazer generalizações
Leia maisVetor de Variáveis Aleatórias
Vetor de Variáveis Aleatórias Luis Henrique Assumpção Lolis 14 de abril de 2014 Luis Henrique Assumpção Lolis Vetor de Variáveis Aleatórias 1 Conteúdo 1 Vetor de Variáveis Aleatórias 2 Função de Várias
Leia maisAnálise de Regressão Linear Simples e
Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável
Leia maisCONHECIMENTOS ESPECÍFICOS
fonte de graus de soma de quadrado variação liberdade quadrados médio teste F regressão 1 1,4 1,4 46,2 resíduo 28 0,8 0,03 total 2,2 A tabela de análise de variância (ANOVA) ilustrada acima resulta de
Leia maisMOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ 3 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 2 3 4 5 6 7 8 9 0 2 3 4 5 e 6 Introdução à probabilidade (eventos, espaço
Leia mais26 de dezembro de 2007
Curso de UFRPE e UFPE 26 de dezembro de 2007 1 2 3 4 Seja l(θ) a log-verossimilhança. A esperança e a covariância da função escore são dadas por: e Cov(U) = E respectivamente. ( UT θ E(U) = 0 (1.1) ) (
Leia maisRalph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S. Silva http://www.im.ufrj.br/ralph/multivariada.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário
Leia maisModelos de Regressão Linear Simples - parte III
1 Modelos de Regressão Linear Simples - parte III Erica Castilho Rodrigues 20 de Setembro de 2016 2 3 4 A variável X é um bom preditor da resposta Y? Quanto da variação da variável resposta é explicada
Leia maisAmostra Aleatória Simples
Amostra Aleatória Simples Airlane Pereira Alencar 4 de Abril de 2018 Alencar, A.P. (IME-USP) Amostra Aleatória Simples 4 de Abril de 2018 1 / 34 Definições e Notações Notações População ou Universo U =
Leia maisESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Introdução Solução de equações não lineares
Leia maisAnálise de Dados Longitudinais Aula
1/35 Análise de Dados Longitudinais Aula 08.08.2018 José Luiz Padilha da Silva - UFPR www.docs.ufpr.br/ jlpadilha 2/35 Sumário 1 Revisão para dados transversais 2 Como analisar dados longitudinais 3 Perspectiva
Leia maisAnálise de Regressão EST036
Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Distribuição beta não central; Coef. de determinação; Quando X for aleatório. Distribuição
Leia maisRevisões de Matemática e Estatística
Revisões de Matemática e Estatística Joaquim J.S. Ramalho Contents 1 Operadores matemáticos 2 1.1 Somatório........................................ 2 1.2 Duplo somatório....................................
Leia maisRalph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S. Silva http://www.im.ufrj.br/ralph/multivariada.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Agradecimentos
Leia maisAvaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação
Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Vanessa Siqueira Peres da Silva 1 2 Daniel Furtado Ferreira 1 1 Introdução É comum em determinadas
Leia maisAula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Leia maisLEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%
. Definição dos acontecimentos: M T-shirt tem manchas C T-shirt tem costuras defeituosas D T-shirt é defeituosa A Preço da t-shirt é alterado a) PM) = % PC) = 5% PM C) = % LEEC Probabilidades e Estatística
Leia maisProfessora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.
Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2017.1 Distribuições Amostrais O intuito de fazer uma amostragem
Leia maisMOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,
Leia maisAnálise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Leia maisAULA 7 - Inferência em MQO: ICs e Testes de
AULA 7 - Inferência em MQO: ICs e Testes de Hipóteses Susan Schommer Econometria I - IE/UFRJ Nosso primeiro objetivo aqui é relembrar a diferença entre estimação de ponto vs estimação de intervalo. Vamos
Leia mais8. Análise em Componentes Principais - ACP
8. Análise em Componentes Principais - ACP 8.1 Introdução O propósito principal da ACP é substituir as variáveis originais por um número menor de variáveis que são função das variáveis originais. A ACP
Leia maisPROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1)
PROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1) 1 Procedimentos não supervisionados Não se conhece a classificação das amostras de treinamento Qual é o interesse? 1) Coletar e rotular
Leia maisCC-226 Aula 05 - Teoria da Decisão Bayesiana
CC-226 Aula 05 - Teoria da Decisão Bayesiana Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Classificador Bayesiano Considerando M classes C 1... C M. N observações x j. L atributos
Leia maisPROVA DE ESTATÍSTICA e PROBABILIDADES SELEÇÃO - MESTRADO/UFMG /2012
PROVA DE ESTATÍSTICA e PROBABILIDADES SELEÇÃO - MESTRADO/UFMG - 0/0 Instruções:. Cada questão respondida corretamente vale (um) ponto.. Cada questão respondida incorretamente vale - (menos um) ponto. 3.
Leia maisPar de Variáveis Aleatórias
Par de Variáveis Aleatórias Luis Henrique Assumpção Lolis 7 de abril de 2014 Luis Henrique Assumpção Lolis Par de Variáveis Aleatórias 1 Conteúdo 1 Introdução 2 Par de Variáveis Aleatórias Discretas 3
Leia maisAULA 17 - Distribuição Uniforme e Normal
AULA 17 - Distribuição Uniforme e Normal Susan Schommer Introdução à Estatística Econômica - IE/UFRJ Distribuições Contínuas Em muitos problemas se torna matematicamente mais simples considerar um espaço
Leia maisDisciplina de Modelos Lineares Professora Ariane Ferreira
Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável
Leia maisUniversidade Federal de Lavras
Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 6 a Lista de Exercícios Teoria da Estimação pontual e intervalar 1) Marcar como verdadeira ou falsa as seguintes
Leia maisMAB-515 Avaliação e Desempenho (DCC/UFRJ)
MAB-515 Avaliação e Desempenho (DCC/UFRJ) Aula 7: Intervalos de Confiança 13 de novembro de 2012 1 2 3 4 Percentil 100p%-percentil O ponto t 0 tal que t 0 = F 1 X (p) = min{t : F X (t) p}, 0 < p < 1 é
Leia maisSME0822 Análise Multivariada 2 o semestre de 2014
SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 6 de agosto de 2014
Leia maisSME0822 Análise Multivariada 2 o semestre de 2014
SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 7 de agosto de 2014
Leia maisAULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)
AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) Susan Schommer Econometria I - IE/UFRJ Variância dos estimadores MQO Vamos incluir mais uma hipótese: H1 [Linear nos parâmetros]
Leia maisTécnicas Multivariadas em Saúde
Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de
Leia mais6. Amostragem e estimação pontual
6. Amostragem e estimação pontual Definição 6.1: População é um conjunto cujos elementos possuem qualquer característica em comum. Definição 6.2: Amostra é um subconjunto da população. Exemplo 6.1: Um
Leia maisCap. 8 - Intervalos Estatísticos para uma Única Amostra
Intervalos Estatísticos para ESQUEMA DO CAPÍTULO 8.1 INTRODUÇÃO 8.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 8.3 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO
Leia maisCONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS As variáveis aleatórias X e Y seguem uma distribuição de Bernoulli com probabilidade de sucesso igual a 0,4. Considerando S = X + Y e que os eventos aleatórios A = [X = 1] e B
Leia maisModelos Lineares Generalizados - Verificação do Ajuste do Modelo
1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma
Leia maisModelos de regressão para dados correlacionados. Cibele Russo
Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo
Leia maisIND 1115 Inferência Estatística Aula 6
Conteúdo IND 5 Inferência Estatística Aula 6 Setembro de 004 A distribuição Lognormal A distribuição Beta e sua relação com a Uniforme(0,) Mônica Barros mbarros.com mbarros.com A distribuição Lognormal
Leia maisSumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47
CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................
Leia maisRicardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo
Geração de Números Aleatórios Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo 1 / 61 Simulando de Distribuições Discretas Assume-se que um
Leia maisINTRODUÇÃO À INFERÊNCIA ESTATÍSTICA
UFPE - Universidade Federal de Pernambuco Departamento de Estatística Disciplina: ET-406 Estatística Econômica Professor: Waldemar A. de Santa Cruz Oliveira Júnior INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Podemos
Leia maisMP-208: Filtragem Ótima com Aplicações Aeroespaciais
MP-208: Filtragem Ótima com Aplicações Aeroespaciais Seção 2.1: Álgebra Linear e Matrizes Davi Antônio dos Santos Departamento de Mecatrônica Instituto Tecnológico de Aeronáutica davists@ita.br São José
Leia maisCE085 - Estatística Inferencial. derivadas. Prof. Wagner Hugo Bonat. 5 de setembro de Curso de Bacharelado em Estatatística
CE085 - Estatística Inferencial Função de Verossimilhança e suas derivadas Prof. Wagner Hugo Bonat Laboratório de Estatística e Geoinformação - LEG Curso de Bacharelado em Estatatística Universidade Federal
Leia maisProbabilidades e Estatística MEEC, LEIC-A, LEGM
Departamento de Matemática Probabilidades e Estatística MEEC, LEIC-A, LEGM Exame a Época / o Teste (Grupos III e IV) o semestre 009/00 Duração: 80 / 90 minutos /06/00 9:00 horas Grupo I Exercício 5 valores
Leia maisAULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)
AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) Susan Schommer Econometria I - IE/UFRJ Variância dos estimadores MQO Vamos incluir mais uma hipótese: H1 [Linear nos parâmetros]
Leia maisAula 7 - Revisão de Álgebra Matricial
23 de Abril de 2018 // 26 de Abril de 2018 Introdução Objetivo da revisão: revisar a notação matricial, técnicas de álgebra linear e alguns resultados importantes Conteúdos: 1 Vetores e matrizes 2 Operações
Leia maisEstudo dirigido de Análise Multivariada
Estudo dirigido de Análise Multivariada Conceitos Iniciais De um modo geral, os métodos estatísticos de análise multivariada são aplicados para analisar múltiplas medidas sobre cada indivíduo ou objeto
Leia maisMOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ 13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 3 4 5 6 7 8 9 10 11 1 13 14 15 e 16 Introdução à probabilidade (eventos,
Leia maisModelos de Regressão Linear Simples - Análise de Resíduos
Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro
Leia maisEventos coletivamente exaustivos: A união dos eventos é o espaço amostral.
DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíveis resultados de um experimento. Evento é qualquer subconjunto do espaço amostral. Evento combinado: Possui duas
Leia maisSME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo. Sala 3-113
SME0822 Análise Multivariada 2 o semestre de 2016 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Sala 3-113 2. semestre 2016 1 / 25 Principais objetivos do curso Estudar e desenvolver
Leia mais29 e 30 de julho de 2013
Programa de Pós-Graduação em Estatística e Experimentação Agronômica ESALQ/USP 29 e 30 de julho de 2013 Dia 2 - Conteúdo 1 2 3 Dados multivariados Estrutura: n observações tomadas de p variáveis resposta.
Leia mais1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27
Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4
Leia maisInferência Bayesiana
Inferência Bayesiana Joaquim Neto joaquim.neto@ufjf.edu.br www.ufjf.br/joaquim_neto Departamento de Estatística - ICE Universidade Federal de Juiz de Fora (UFJF) Versão 3.0 Joaquim Neto (UFJF) ICE - UFJF
Leia maisEventos coletivamente exaustivos: A união dos eventos é o espaço amostral.
DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíveis resultados de um experimento. Evento é qualquer subconjunto do espaço amostral. Evento combinado: Possui duas
Leia maisCONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS quantidade São Paulo (j = 1) Rio de Janeiro (j = 2) Minas Gerais (j = 3) Rio Grande do Sul (j = 4) total casos novos (X, em milhões) casos pendentes (Y, em milhões) processos
Leia maisRegressão Linear - Parte I
UFPE - Universidade Federal de Pernambuco Curso: Economia Disciplina: ET-406 Estatística Econômica Professor: Waldemar Araújo de S. Cruz Oliveira Júnior Regressão Linear - Parte I 1 Introdução Podemos
Leia maisTópicos de matrizes e Distribuição Normal Multivariada
Tópicos de matrizes e Distribuição Normal Multivariada CAPÍTULO 1 Alguns resultados importantes 11 definições I n : matriz Identidade de dimensão (n n) J n : 11 t 111 Traço Sejam A p p, B p p, C p p, D
Leia maisModelos de Regressão
Renato Martins Assunção DCC - UFMG 2015 Renato Martins Assunção (DCC - UFMG) 2015 1 / 19 Exemplo de preço de apto Y = y 1 y 2 y 1499 y 1500 b 0 1 1 1 1 + b 1 área 1 área 2 área 1499 área 1500 + b 2 idade
Leia maisMestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015
Mestrado Profissional em Administração Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes º trimestre de 05 Inferência Multivariada MANOVA MANLY, Cap. 4 HAIR et al., Cap. 6 Exemplo Uma
Leia maisMAE Introdução à Probabilidade e Estatística II Resolução Lista 5
MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão
Leia maisProcessos Estocásticos
Processos Estocásticos Luis Henrique Assumpção Lolis 26 de maio de 2014 Luis Henrique Assumpção Lolis Processos Estocásticos 1 Conteúdo 1 Introdução 2 Definição 3 Especificando um processo aleatório 4
Leia maisEstimação e Testes de Hipóteses
Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas
Leia maisReconhecimento de Padrões. Reconhecimento de Padrões
Reconhecimento de Padrões 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Escola Superior de Tecnologia Engenharia Informática Reconhecimento de Padrões Prof. João Ascenso e Prof.
Leia maisSUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS
4 SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS Em muitos problemas de probabilidade que requerem o uso de variáveis aleatórias, uma completa especificação da função de densidade de probabilidade ou não está
Leia mais3 a Lista de Exercícios de Introdução à Álgebra Linear IMPA - Verão e B =
3 a Lista de Exercícios de Introdução à Álgebra Linear IMPA - Verão 2008. (a) Ache os auto-valores e auto-vetores de A = 3 4 2 0 2 0 0 0 e B = 0 0 2 0 2 0 2 0 0 (b) Mostre que λ + λ 2 + λ 3 é igual ao
Leia maisCorrelação e Regressão
Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe
Leia maisInferência para CS Tópico 10 - Princípios de Estimação Pontual
Inferência para CS Tópico 10 - Princípios de Estimação Pontual Renato Martins Assunção DCC - UFMG 2013 Renato Martins Assunção (DCC - UFMG) Inferência para CS Tópico 10 - Princípios de Estimação Pontual
Leia maisProbabilidades e Estatística - LEIC + LERCI + LEE 2 o semestre 2004/05
Departamento de Matemática Secção de Estatística e Aplicações - IST Probabilidades e Estatística - LEIC + LERCI + LEE 2 o semestre 2004/05 3 o Teste 4/6/2005 9h O Teste que vai realizar tem a duração total
Leia maisModelos Lineares Generalizados
Modelos Lineares Generalizados Emilly Malveira de Lima Análise de Dados Categóricos Universidade Federal de Minas Gerais - UFMG 10 de Maio de 2018 Emilly Malveira (PGEST-UFMG) 10 de Maio de 2018 1 / 20
Leia maisProfessora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados
UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise
Leia maisCapítulo 9 - Regressão Linear Simples (RLS): Notas breves
Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou
Leia maisEstatística Básica. 13 de maio de 2009
13 de maio de 2009 1 2 3 4 5 Tipos de Testes Exemplos Teste para amostras independentes com variâncias iguais Teste para amostras independentes com variâncias diferentes Teste para amostras dependentes
Leia mais5.3 Variáveis aleatórias gaussianas conjuntas
M. Eisencraft 5.3 Variáveis aleatórias gaussianas conjuntas 64 respectivamente. São as chamadas funções características marginais: Φ X (ω ) = Φ X,Y (ω,0) (5.0) Φ Y (ω ) = Φ X,Y (0,ω ) (5.) Os momentos
Leia maisCM005 Álgebra Linear Lista 3
CM005 Álgebra Linear Lista 3 Alberto Ramos Seja T : V V uma transformação linear. Se temos que T v = λv, v 0, para λ K. Dizemos que λ é um autovalor de T e v autovetor de T associado a λ. Observe que λ
Leia maisMAE Planejamento e Pesquisa II
MAE0327 - Planejamento e Pesquisa II EXPERIMENTOS/ESTUDOS NÃO-BALANCEADOS COM FATORES FIXOS - PARTE 1 7 de agosto de 2016 Denise A Botter MAE0327 7 de agosto de 2016 1 / 1 PLANEJAMENTO E PESQUISA I Estudos
Leia maisp(x) Note que 1/p(x), que não depende de θ, funciona como uma constante normalizadora
Capítulo 1 Introdução A informação que se tem sobre uma quantidade de interesse θ é fundamental na Estatística. O verdadeiro valor de θ é desconhecido e a idéia é tentar reduzir este desconhecimento. Além
Leia maisAULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1
AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 Susan Schommer Econometria I - IE/UFRJ Distribuições amostrais dos estimadores MQO Nas aulas passadas derivamos o valor esperado e variância
Leia maisTESTES DE HIPÓTESES Notas de aula. Prof.: Idemauro Antonio Rodrigues de Lara
1 TESTES DE HIPÓTESES Notas de aula Prof.: Idemauro Antonio Rodrigues de Lara 2 Conteúdo 1. Fundamentos e conceitos básicos; 2. Função poder; 3. Testes mais poderosos e Lema de Neyman-Pearson; 4. Teste
Leia maisSeminário de Análise Multivariada
Seminário de Análise Multivariada Capítulo 1 - Introdução Conteúdo 1 Introdução 1 11 Aplicações de Técnicas Multivariadas 2 12 Organização de Dados 3 121 Arranjos 3 122 Exemplo 11 - Seleção de recibos
Leia maisESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Se a integração analítica não é possível ou
Leia maisTécnicas computacionais em probabilidade e estatística II
Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco Métodos de Monte Carlo baseados em Cadeias de Markov:
Leia maisMais sobre Modelos Continuos
Mais sobre Modelos Continuos Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo 1 / 41 Transformação Linear da Uniforme Seja X uma variável aleatória
Leia maisProfessora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.
Estimação pontual Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2017.1 Introdução Exemplo Desejamos comprar um
Leia maisMinera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33
Mineração de Dados Aula 6: Finalização de Regressão e Classificação Rafael Izbicki 1 / 33 Como fazer um IC para o risco estimado? Vamos assumir que ( X 1, Ỹ1),..., ( X s, Ỹs) são elementos de um conjunto
Leia mais