Análise Multivariada

Tamanho: px
Começar a partir da página:

Download "Análise Multivariada"

Transcrição

1 Análise Multivariada Getúlio Amaral Universidade Federal de Pernambuco 2006

2 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional.

3 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional. Livros Textos Anderson, T. A. (1984), An Introduction To Multivariate Statistical

4 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional. Livros Textos Anderson, T. A. (1984), An Introduction To Multivariate Statistical Mardia, Kent and Bibby (1979) Multivariate Analysis

5 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional. Livros Textos Anderson, T. A. (1984), An Introduction To Multivariate Statistical Mardia, Kent and Bibby (1979) Multivariate Analysis Johnson and Wichern (1982) Applied Multivariate Statistical Analysis

6 As notas de aula Apenas apresentam os tópicos de Interesse. O aluno precisa consultar os livros abaixo para obter os conhecimentos necessários para as provas e, futuramente, para sua vida profissional. Livros Textos Anderson, T. A. (1984), An Introduction To Multivariate Statistical Mardia, Kent and Bibby (1979) Multivariate Analysis Johnson and Wichern (1982) Applied Multivariate Statistical Analysis Avaliação 1 Prova 2 Trabalho (artigo, apresentação, relatório, 5 perguntas, respostas) Sorteio toda aula 3 Conjunto de Dados

7 Pesquisas Históricas Normal Bivariada: Adrian (1808) Laplace (1811) Gauss (1823) Galton Geneticista - Correlação, Regressão e Homocedasticidade Karl Pearson - Coeficiente de correlação para estudar problemas em genética, biologia e outras áreas. Fisher - Métodos para agricultura, botanica e outras áreas.

8 Normal Multivariada Tem sido adequada para problemas de várias áreas do conhecimento como psicologia, engenharia, economia e outros. Métodos não Paramétricos (serão abordados em seminários) Modernos, boas possibilidades de pulicações, melhores resultados em muitos casos. Bootstrap Distribuição Empírica c/reamostragem Kernel Distribuição estimada dos dados

9 Matrix de dados X = x x 1p.. x n1... x np Seja x i a i-ésima linha escrita como coluna, que é dada por Seja x (j) a j-ésima coluna de X x i = (x i1,..., x ip ) x (j) = (x 1j,..., x nj )

10 Vetor de Médias Análise Multivariada x = ( x 1,..., x p ) onde x i = 1 n n r=1 x ri. Matriz de covariância S = (s ij ), onde s ij = 1 n n r=1 (x ri x i )(x rj x j ). Notação Matricial x = 1 n X 1, onde 1 = (1,..., 1) é um vetor de dimensão n. Para a matriz de covarianância ou ainda, se H = I 1 n 11, S = 1 n (X X 1 n X 11 X ), S = 1 n X HX

11 Matriz de Correlação R = (r ij ), onde r ij = s ij s i s j. Exercício 1 (Mardia et al, 1979, p. 11) Exemplo (dados de 28 árvores). Calcular, usando o R ou outro programa, o vetor de médias, a matriz de covariância e a matriz de correlação. Exercício 2 Fazer o download do "Atlas do desenvolvimento Humano do Recife."Escolher uma variável quantitativa e calcular as mesmas quantidades do exercício 1.

12 Combinações lineares Análise Multivariada Transformação de Escala y r = a 1 x r1 +,..., a p x rp y r = D 1 (x r x), onde r = 1,..., n, D = diag(s i ) e diag(.) denota uma matriz diagonal. Esta mudança torna unitária a variância das variáveis. Transformação de Mahalanobis z r = S 1/2 (x r x), onde S 1/2 S 1/2 = S é inversa da matriz raiz quadrada de S. S 1/2 é definida a partir dos autovalores e autovetores de S. Se Γ é matriz de autovetores de S e λ 1,..., λ p os autovalores de S,a matriz raiz quadrada é dada por onde Λ 1/2 = diag(λ 1/2 i ). A inversa de S 1/2 é por S 1/2 = ΓΛ 1/2 Γ, S 1/2 = ΓΛ 1/2 Γ,

13 Notação X :Matriz de Dados; x i : uma observação; x (j) uma variável; X i um vetor aletório cujo o valor observado é x i.

14 Distribuições Multivariadas Considere p variáveis aleatórias X 1,..., X p, a função de distribuição de probabilidade (fdp) é dada por F (x 1,..., x p ) = P(X 1 x 1 ),..., X p x p ). A função de densidade (fd) é definida por e F (x 1,..., x n ) x 1... x p = f (x 1,..., x p ). F (x 1,..., x p ) = xp x1... f (u 1,..., u p )du 1... du p.

15 Independência Seja F (x 1,..., x p ) a fdp de X 1,..., X p, o conjunto de variáveis aleatórias X 1,..., X p, é mutuamente independente se F (x 1,..., x p ) = F 1 (x 1 )... F p (x p ), onde F i (x i ) =... f (u 1,..., u p )du 1... du p, onde u j x i

16 Transformação de Variáveis Se a densidade de X 1,..., X p é f (x 1,..., x p ), considere as seguintes p funções Análise Multivariada y i = y i (x 1,..., x p ) A transformaç ao inversa é x i = x i (y 1,..., y p ). Considere as p variáveis aleatórias Y i = y i (x 1,..., x p ) A densidade de Y 1,..., Y p é onde g(y 1,..., y p ) = f (x 1 (y 1,..., y p ),..., xp(y 1,..., y p )) J(y 1,..., y p ) = x 1 y 1... J(y 1,..., y p ), x 1 y p.. x p... x p

17 Amostra Aleatória Seja X 1,..., X n uma amostra aleatória de uma distribuição F (x) com vetor de médias µ e matriz de covariância Σ. O estimador é centrado, isto é, E( X ) = µ. Além disto, cov( X ) = 1 n Σ. X = n i=1 X i n

18 É possível mostrar também que E(S n ) = n 1 n Σ, onde S n = n j=1 (X j X )(X j X ). Exercício 3 Se um vetor aleatório V tem E(V ) = µ v e Cov(V ) = Σ v, prove que E(VV ) = Σ v + µ v µ v.

19 Normal Multivarida Normal univariada Análise Multivariada f (x; µ, σ) = k exp 1 2 (x µ)σ 1 (x µ) As quantidades univariadas podem ser redefinidas para o caso multivariado x = µ = x 1. x n µ 1. µ n

20 σ 1,1... σ 1,m Σ =..... σ k,1... σ k,m Substituindo-se x, µ e σ por suas versões multivariadas, temos f (x; µ, σ) = k exp 1 2 (x µ) Σ 1 (x µ). A única incógnita para determinar a distribuição de x é k.

21 Cálculo da Constante k k =... exp 1 2 (x µ) Σ 1 (x µ) dx p... dx 1. Usando-se o corolário A.1.6 (Vide Anderson, 1984, p. 586), se Σ é positiva definida, então existe uma matriz não singular C tal que Análise Multivariada C Σ 1 C = I, I é a matriz identidade e C é a tranposta de C. Considere onde y = (y 1,..., y p ). Temos que x µ = Cy, Como (x µ) Σ 1 (x µ) = y C Σ 1 Cy = y y. J = C, a constante de interesse é dada por

22 1 Simplificando-se o integrando, temos exp { 1 2 y y} = p i=1 exp 1 2 y 2 i. O valor da constante de interesse é dado por Análise Multivariada k = Mod C... exp 1 2 y exp 1 2 y 2 p dyp... dy 1 = Mod C exp 1 2 y 2 1 dy1 = Mod C ( 2π) p. exp 1 2 y 2 p dyp... Calculando-se o determinante de C, tem-se o que resulta em C Σ 1 C = I,

23 Exercício 4 Considere uma distribuição multivariada do vetor (x, y). Para obter este vetor, seja u and v N(0, 1) independentes e defina x = u se uv 0 enquanto x = u se uv < 0. Defina y = v. Mostre que x e y são N(0, 1), porém (x, y) não tem distribuição normal bivariada.

24 Esperança e Covariância Esperança de Um Vetor Se X = (X 1,..., X p ), o valor esperado de X é dado por E(X ) = E(X 1 ). E(X p ).

25 Se Y = DX + b, onde X é um vetor aleatório, podemos afirmar que e E(Y ) = DE(X ) + b Prova: Anderson (1984, p. 19). V (Y ) = DV (X )D.

26 Se a função de densidade de X é definida como Temos que e A (2π) 1 2 p 1 2 (x µ) Σ 1 (x µ) exp E(X ) = µ V (X ) = Σ. Prova: Anderson (1984, pp ). Notação: N(µ, Σ) denota uma normal multivariada com média µ e matriz de covariância Σ.

27 Teorema. Se X N(µ, Σ), a transformação Y = CX tem distribuição N(Cµ, CΣC ), onde C é não singular. Prova: Vide Anderson (1984, pp ).

28 Teorema. A função característica de X N(µ, Σ) é igual a φ(t) = E(exp it X ) = exp it µ 1 2 t Σt, onde t é um vetor real. Prova: Anderson (1984, p. 46).

29 Exercício 5 Encontre µ e Σ nas densidades: a) 1 2π exp 1 2 [(x 1)2 +(y 2) 2 ] b) 1 2π exp 1 2 [x 2 +y 2 +4x 6y+13] Exercício 6 Prove que se Σ é positiva definida, tem-se (Vide Anderson, 1984, p. 35). Σ = Σ 11 Σ 12 Σ 1 22 Σ 21 Σ 22.

30 Exercício 7 Se X N(µ, Σ), onde e Σ 1 = µ = qual é a distribuição de X 1 + 2X 2 3X 3. Exercício 8 Quais são as densidades marginais de X e Y em (a) e (b) do exercício 5.,

31 Distribuição de (X µ) Σ 1 (X µ) Seja X distribuida como uma N(µ, Σ), com Σ > 0, os seguintes resultados são válidos: 1. (X µ) Σ 1 (X µ) χ 2 p. 2. P[(X µ) Σ 1 (X µ) χ 2 p] = 1 α é um elipsoide.

32 Verificação da Hipótese de Normalidade Multivariada 1. Obter q-q plots e aplicar testes de normalidade (Kolmogorov ou outro), para cada variável individualmente. 2. Fazer diagramas de dispersão (XY) e verifique se o conjunto dos pontos possuem aproximadamente a forma de uma elipse. 3. Verificar se existem pontos aberrantes que precisam ser cuidadosamente analisados.

33 4 Calcular dj 2 = (x j x) S 1 (x j x) j = 1,..., n, onde x 1,..., x n são as observações amostrais. Em seguida, verificar por um Q-Q plot se os d j s seguem uma distribuição χ 2 p.

34 Estimação de Máxima Verossimilhança Análise Multivariada Função de Verossimilhança Considere uma a.a. X 1,..., X n onde X i tem f.d.p f (x i ; θ), onde θ é um vetor de parâmetros. A função de verossimilhança é definida como L(x 1,..., x n ; θ) = n f (x i ; µ). i=1

35 Estimação de Máxima Verossimilhança Análise Multivariada Função de Verossimilhança Considere uma a.a. X 1,..., X n onde X i tem f.d.p f (x i ; θ), onde θ é um vetor de parâmetros. A função de verossimilhança é definida como L(x 1,..., x n ; θ) = n f (x i ; µ). i=1 O log da função de verossimilhança é é dado por l(x 1,..., x n ; θ) = n log f (x i ; µ). i=1

36 Estimação de Máxima Verossimilhança Análise Multivariada Função de Verossimilhança Considere uma a.a. X 1,..., X n onde X i tem f.d.p f (x i ; θ), onde θ é um vetor de parâmetros. A função de verossimilhança é definida como L(x 1,..., x n ; θ) = n f (x i ; µ). i=1 O log da função de verossimilhança é é dado por l(x 1,..., x n ; θ) = n log f (x i ; µ). i=1

37 Distribuição Normal Análise Multivariada Caso da Normal Multivariada l(x 1,..., x n ; θ) = n 2 log 2πΣ 1 2 n (x i µ) Σ 1 (x i µ) i=1

38 Distribuição Normal Análise Multivariada Caso da Normal Multivariada l(x 1,..., x n ; θ) = n 2 log 2πΣ 1 2 ou n (x i µ) Σ 1 (x i µ) i=1 l(x 1,..., x n ; θ) = n 2 log 2πΣ n 2 trσ 1 S n 2 ( x µ) Σ 1 ( x µ). (Vide Mardia et al, 1979, pp ).

39 Escores e Matrix de Informação Análise Multivariada Função Escore S(x 1,..., x n ; θ) = l(x ; θ) θ Matriz de Informação de Fisher ( 2 ) l F = E θ θ

40 Estimadores de Máxima Verossimilhaça Análise Multivariada O máximo de l(x ; θ) é obtido quando ( l/ θ) = 0, para um certo valor ˆθ, que é o estimador de máxima verossimilhança de θ. Exercício 9 Verifique que no exemplo (Vide Mardia et al, 1979, p. 100) têm-se l(x ; θ) = log c n log 4+x 1 log 2 + θ+(x 2 +x 3 )log(1 θ)+x 4 log θ, e s(x ; θ) = l(x ; θ) θ = x θ x 2 + x 3 1 θ + x 4 θ F = n(1 + 2θ) 2θ(1 θ)(2 + θ).

41 Exercício 10 Encontre o estimador de máxima verossimilhança do exercício 9 por solucionar a equação s(x ; θ) = 0. Os problemas descritos acima tratam da distribuição descrita por Fisher (1970, p. 305), que é um experimento com 4 resultados cujas as probabilidades destes resultados são (2 + θ)/4, (1 θ)/4, (1 θ)/4 e θ/4. Esta distribuição é uma multinomial.

42 Maximizando a Verossimilhaça da Normal Multivariada Análise Multivariada Log Verossimilhança l(x 1,..., x n ; θ) = n 2 log 2πΣ n 2 trσ 1 S n 2 ( x µ) Σ 1 ( x µ). Estimadores ˆµ = x, ˆΣ = S. Para garantir que o ponto crítico é o máximo, usa-se Teorema Se A é uma matrix p p fixa, o máximo de é Σ = n 1 A. f (Σ) = Σ n/2 exp( 1 2 trσ 1 A)

43 Inferência Bayesiana (Vide Gelman et al, 1995, pp. 3-82). 1. Existe um modelo probabilístico completo, isto é, uma distribuição de probabilidade conjunta para todas as quantidades observáveis e não observáveis. 2. Obter uma distribuição condicionada aos dados observados. 3. Avaliar o modelo e a distribuição obtida a posteriori. Caso o modelo não seja adequado, as etapas 1, 2 e 3 devem ser repetidas. O pensamento Bayesiano facilita uma interpretação das conclusões estatísticas associadas ao bom senso. Um intervalo de confiança bayesiano para uma quantidade de interese desconhecida pode ser considerado como tendo uma alta probabilidade de conter o parâmetro verdadeiro. Por outro lado, o intervalo frequentista, não pode ter a mesma interpretação. O que pode ser dito é que em uma grande quantidade de realizações de um experimento espera-se que o intervalo contenha o valor verdadeiro em uma grande proporção destas realizações. Análise Multivariada

44 Notação Bayesiana θ - Vetor de quantidades não observáveis. y - Dados observados ỹ - Quantidade desconhecida que, porém, é potencialmente observável. p(θ) - Priori, representa o conhecimento subjetivo que o pesquisador da área de estudo (medicina, oceanografia, engenharia) têm a respeito de θ. p(y θ) - Verossimilhança, representa as informações provinientes dos dados. p(θ y) - Posteriori, é a distribuição final que é utilizada para construir regiões de confiança e para testar hipóteses. Regra de Bayes p(θ y) = p(θ)p(y θ).

45 Verossimillhança para um ponto da Normal univariada Verossimilhança P(y θ) = 1 2πσ exp 1 2σ 2 (y θ)2 Análise Multivariada Priori p(θ) exp( 1 τ0 2 (θ µ 0 ) 2 ), θ N(µ 0, τ0 2), onde µ 0 e τ0 2 são hyperparâmetros. Posteriori P(θ y) exp( 1 [ (y θ) 2 2 σ 2 + (θ µ 0) 2 ] τ0 2 Simplificandos-se (completando-se quadrados e etc), onde P(θ y) exp( 1 2τ1 2 (θ µ 1 ) 2, µ 1 = 1 τ 2 0 µ σ 2 y 1 τ σ 2

46 Normal Multivariada Verossimilhança P(y µ, Σ) Σ exp ( 1 ) 2 (y µ) Σ 1 (y µ) Análise Multivariada para uma amostra Y 1,..., Y n, P(y 1,..., y n ) Σ n/2 exp Posterior Distribution P(µ y, Σ) exp ou ainda, ( 1 2 [ n (y i µ) Σ 1 (y i µ) i=1 (µ µ 0 ) Λ 1 0 (µ µ 0) + P(µ y, Σ) = N(µ µ n, Λ n ), ]) n (y i µ) Σ 1 (y i µ), i=1 µ n = (Λ nσ 1 ) 1 (Λ 1 0 µ 0 + nσ 1 ȳ), Λ 1 n = Λ nσ 1.

47 Testes de Hipóteses Análise Multivariada Teste da Razão de Verossimilhança Seja X 1,..., X n uma a.a. de F (θ). Sejam H 0 : θ Ω 0 e H 1 : θ Ω 1. A razão de verossimilhança é definida por λ(x) = L 0 L, 1 onde L i é o maior valor que a função de verossimilhança assume na região Ω i, i = 0, 1. Para simplificar, usa-se a estatística onde l 1 = log L 1 e l 0 = log L 0. 2logλ = 2(l 1 l 0 ),

48 Hipótese H 0 : µ = µ 0, ΣConhecido Análise Multivariada l 0 = l(µ 0, Σ) = 1 2 nlog 2 piσ 1 2 trσ 1 S 1 2 n( x µ 0) Σ 1 ( x µ 0 ) Não existe restrições para µ em H 1, logo, E.M.V de µ é x. Usando-se a razão de verossimilança, 2logλ = 2(l 1 l 0 ) = n( x µ 0 ) Σ 1 ( x µ 0 )

49 Hipótese H 0 : µ = µ 0, Σ desconhecido (Teste de Hotelling para Uma Amostra) Análise Multivariada Σ deve ser estimado sob H 0 e H 1. Usando os resultados de Mardia et al (1979, pp ), Sob H 0, ˆµ = µ 0 e ˆΣ = S + dd onde d = x µ 0. Sob H 1, ˆµ = x e ˆΣ = S. Logo, l0 = l(µ 0, S +dd ) = 1 2 {plog2π+log S +log(1+d S 1 d)+p} e l1 = l( x, S) é obtido por colocar d = 0 na expressão acima. Logo, 2logλ = 2(l1 l0 ) = nlog(1 + d S 1 d). A estatística d S 1 d é chamada de T 2 de Hotelling.

50 A distribuição da estatística n p d S 1 d F p,n p. p falicita o uso do teste acima em muitos problemas reais.

51 Hipótese H 0 : Σ = Σ 0, onde µ Desconhecido Análise Multivariada Sob H 0, temos ˆµ = x e Σ = Σ 0. Sob H 1, temos ˆµ = x e Σ = S Logo, l 0 = 12nlog 2πΣ ntrσ 1 0 S, e l 1 = 12nlog 2πΣ 1 2 np 2logλ = ntrσ 1 0 S nlog Σ 1 0 S np. Distribuição muito complexa, alternativas: bootstrap, verossimilhança empírica.

52 Se w e v são variáveis aletórias unidimensionais independentes e suas distribuições são σ 2 χ 2 α e σ 2 χ 2 β, respectivamente, o termo w/v têm distribuição F α,β. Distribuição de Wishart Se M(p) pode ser escrita como M = X X, one X (n) é uma matriz de dados de N(0, Σ), a distribuição da matriz M é uma Wishart com matriz de escala Σ e com n graus de liberdade. A forma padrão da distribuição ocorre quando M = I. A distribuição de Wishart é denotada po W p (Σ, n).

53 No caso multivariado, Se A W (Σ, m) e B W (Σ, n) são independentes, define-se que Λ = A / A + B = I + A 1 B 1 Λ(p, m, n), onde Λ(p, m, n) é a distribuição lambda de Wilks.

54 Teste T 2 de Hotelling para 2 Amostras Análise Multivariada Se x e M são independentes e distribuidas como N(µ, Σ) e W p (Σ, m), respectivamente, têm-se m(x µ) M 1 (x µ) T 2 (p, m), onde T 2 (p, m) é a distribuição de Hotelling com parâmetros m e p. Theorem T 2 (p, n) = {np/(n p + 1)} F p,n p+1 Logo, {(n p)/p}( x µ)σ 1 ( x µ) F p,n p Suponha duas amostras de tamanho n 1 e n 2, onde n 1 + n 2 = n.

55 Teste de Hotelling p/ Duas Populações H 0 : µ 1 = µ 2 Considera-se que as matrizes de covariância são iguais. O núcleo da estatística do teste é D 2 = ( x 1 x 2 ) S 1 c ( x 1 x 2 ), onde (S c = n 1 S 1 + n 2 S 2 )/(n 2) é a matriz de covariância combinada. Usando os resultados anteriores, temos n 1 n 2 (n p 1) D 2 F (p,n p 1). n(n 2)p

56 Problema de Várias Amostras Análise de Variância com um Fator Considere H 0 : µ 1 =... = µ p, dado que Σ 1 =... = Σ k Sob H 0, os EMV s de µ e Σ são x e S, respectivamente. Sob H 1, a log-verossimilhaça é dada por Análise Multivariada l 0 = 1 2 p i=1 [n i log 2πΣ + n i trσ 1 (S i + d i d i )], onde S i é a matriz de covariância da i-ésima amostra e d i = x i µ i. O EMV de µ i é x i e l 0 = 1 2 log 2πΣ 1 2 trσ 1 W, onde W = p n i S i. Derivando a equação acima com respeito a Σ e igualando a zero, temos ˆΣ = n 1 W. i=1

57 Problema de Várias Amostras Análise Multivariada W = soma de quadrados e produtos (SQP) dentro dos grupos A razão das verossimilhanças é dada por λ = { } n/2 W = T 1 W n/2, ns onde T = ns é a SQP total. Como W é a SQPD e T é a SQPT, temos a seguinte relação B = T W = n i ( x i x)( x i x), onde a matriz B é considerada a SQP entre os grupos ou SQPE. Logo podemos escrever λ = W B + W = I + W 1 B 1. Antes de determinar a distribuição desta estatística, é necessário introduzir algumas definições.

58 Exercício 11 A densidade de uma normal bivariada é Existe uma elipse associada a esta densidade. Os eixos e faça um gráfico desta elipse. Exercício 12 Se X N(0, Σ), onde = ( ), Ache a tal que X = a Y e Y tem distribuição normal não singular. Apresente a densidade de Y.

59 Exercício 13 Considere (X 1, Y 1 ), (X 2, Y 2 ), (X 3, Y 3 ), onde (X i, Y i ) são i.i.d com distribuição N(µ, Σ), com e µ = (µ x, µ y ) Σ =.

60 Análise de Agrupamento Análise Multivariada Histórico Hindus usaram o sexo, características físicas e comportamentais para classificar pessoas em seis tipos, os quais eles usaram nomes de animais. Romanos usaram Caraterísticas Físicas e gregos nove temperamentos. Existem muitos critérios para classificar, o genêro, a espécie e outros.

61 Matriz de Dados x x 1p X =....., x n1... x np Classificação das técnicas de agrupamento: i)técnicas Hierárquicas; ii)técnicas de Partição-Otimização.

62 Idéia geral de alguns métodos: 1)Cálculo das distâncias; 2)Algoritmo para agrupar as observações. Distância Euclideana A distância entre os objetos "i"e "j"pode ser calculada por d(x i, x j ) = (x i1 x j1 ) 2 +,..., +(x ip x jp ) 2

63 Métodos Aglomerativos Análise Multivariada Inicia com o cálculo das distâncias ou similaridades entre os objetos, o que produz uma matriz n n com estas medidas. Como existem vários métodos para calcular distâncias ou similaridades, existirá para um certo método aglomerativo várias opções. Além das medidas de distâncias e similaridades, é fundamental estabelecer o algoritmo utilizado para formar os grupos de entidades.

64 Método do Vizinho Mais Próximo Inicialmente, se existem n indivíduos, existirão n grupos. Em cada etapa existe uma fusão entre os grupos mais próximos. Exemplo: Suponha que a matriz de distâncias é: D 1 = , No primeiro passo, ocorre o agrupamento de 1 e 2, e novas distâncias são calculadas usando Análise Multivariada A nova matriz é: d (12)3 = Min{d 13, d 23 } = d 23 = 5.0 D 2 = ,

65 Método da Ligação Completa Análise Multivariada As mesmas etapas devem ser seguidas. Porém, em cada agrupamento a nova distância deve ser calculada como d (12)3 = max{d 13, d 23 } = d 13 = 6.0

66 Método do Centróide Análise Multivariada Calcula-se a matriz de distâncias entre todos os objetos. Os objetos com a menor distância irão forma um novo grupo. Calcula-se o centróide de um novo grupo e usa-se esta medida para obter a matriz distância relativa a este grupo. A distância entre os grupos é calculada como a distância entre os centróides dos grupos.

67 Distâncias, Similaridades e seus Axiomas Análise Multivariada 1. D(x, y) 0; 2. D(x, y) = 0 sse x = y; 3. D(x, y) = D(y, x), x, y R d ; 4. D(x, y) D(x, z) + D(y, z), x, y, z R d ; 1. s(a, B) = s(b, A) 2. s(a, B) > 0 3. s(a, B) similaridade entre A e B

68 Medidas de Distância Análise Multivariada Nome Fórmula { p } 1/2 Euclideana j=1 w j(x rj x sj ) 2 1 Karl Pearson w j s 2 k Mahalanobis {(x r x s )Σ 1 (x r x s )} 1/2 p Manhanttan j=1 w j x rj x sk Tabela: Distâncias, Mardia et al. (1979, p. 381) Variáveis Qualitativas r = ad bc (a + b)(c + d)(a + c)(b + d).

69 Método de K-Médias Análise Multivariada Este método adiciona cada item ao grupo que tem o centróide (média) mais próxima. A versão mais simples deste método têm as seguintes etapas: 1. Decidir qual o valor de K 2. Particionar os itens em K grupos 3. Para cada item, verificar que grupo é mais próximo. Caso exista um grupo mais próximo do item do que seu grupo atual, retirar este item do grupo atual e recolocá-lo no grupo mais próximo. Em seguida, os novos centróides de cada grupo devem ser recalculados. 4. repetir a etapa 3 até que nenhum item precise ser movido.

70 Análise Discriminante Análise Multivariada Considere g populações ou grupos Π 1,..., Π g, onde se x i Π j então x i f j (x). O objetivo é alocar um certo objeto "i"a uma das populações Π j, usando o vetor de variáveis x i. Esta alocação deve minimizar o erro de classificação. Duas situações principais de classificação: a)análise de Agrupamento - A população do objeto "i"não é conhecida (classificação não supervisionada) b)análise discriminante - A população do objeto "i"é conhecida (classificação supervisionada)

71 Modelos de Classificação Existem 2 principais casos de interesse: 1. A f.d.p. associada a Π j é f j (x), isto é, uma densidade de forma conhecida; 2. Um método empírico, onde nenhuma forma particular para a f.d.p. associada a Π j é assumida. Regra de alocação: Alocar o objeto x a uma das populações Π 1,..., Π g que produz o maior valor da verossimilhança para x. Assim, Análise Multivariada L i (x) = Max i L i (x). Para os próximos exemplos, considere que P(L i (x) = L k (x)para algum i k Π i ) = 0. Distribuição Normal: Caso de duas Populações Π 1 = N(µ 1, σ1 2) Π 2 = N(µ 2, σ2 2) { L i (x) = (2πσi 2 ) 1/2 exp 1 ( ) ) 2 x µi. 2 σ i

72 { λ = L 1(x) L 2 (x) = σ 2 exp 1 σ 1 2 Simplificando, [ (x ) 2 ( ) ]} 2 µ1 x µ2 + > 1 σ 1 σ 2 x 2 ( 1 σ σ 2 2 ) ( µ1 2x σ1 2 µ ) ( ) 2 µ 2 σ σ1 2 µ2 2 σ2 2 < 2 log σ 2 σ 1 Esta regra é utilizada para alocar x a Π 1 ou Π 2. Teorema Se Π = N p (µ i, Σ), i = 1,..., g e Σ > 0, x é alocado a Π j se (x µ j ) Σ 1 (x µ j ) é o valor mínimo de a i Σ 1 a i, onde a i = (x µ i ), para i = 1,..., g.

73 Quando g = 2, a regra é alocar x a Π 1 se α (x µ) = [Σ 1 (µ 1 µ 2 )] (x 1 2 (µ 1 µ 2 )) = (µ 1 µ 2 ) Σ 1 (x µ 1 2 µ 2 2 ) > 0.

74 Estimando a Regra Discriminante Análise Multivariada Condições: 1. Matriz de Dados X (n p); 2. Π 1,..., Π g são conhecidos com f i (µ, Σ) normal, e µ e Σ devem ser estimados; 3. As linhas de X são particionadas em g grupos X = (X 1,..., X g ); 4. x 1,..., x g P e S u = ni S i (n g) µ 1,..., µ g e Σ. Se g = 2, A regra é alocar x a Π 1 se são os estimadores não viesados de ( x 1 x 2 )S 1 {x 1/2( x 1 + x} > 0.

75 Componentes Principais Análise Multivariada A média representa uma combinação linear que é dada por 1 5 1x = ( ) x. Porém, esta combinação linear atribui o mesmo peso à todas as variáveis. O método de componentes principais fornece uma combinação linear com pesos diferentes. Definição Se x é um vetor aleatório com média µ e matriz de covariância Σ, as componentes principais são definidas por y = Γ (x µ), onde Γ é ortogonal, Γ ΣΓ = Λ = diag{λ 1,..., λ p.} Tem-se que λ 1 λ 2... λ p 0 e Γ é a matriz de autovetores.

76 Teorema Se x (µ, Σ), a transformação y = Γ (x µ) satisfaz os seguintes resultados a)e(y i ) = 0 b) V (Y i ) = λ i c) Cov(Y i, Y j ) = 0, i j b)v (Y 1 ) V (Y 2 )... V (Y p ) 0 e) p i=1 V (Y i) = trσ f) p i=1 V (Y i) = Σ Teorema: Nenhuma combinação linear de x tem variância maior do que λ 1, a variância da primeira componente principal.

77 Se α = a x é uma combinação linear de x que não é correlacionada com as com as primeiras k componentes principais de x, então a variância de α é maximizada quando α é a (k + 1) ésima componente principal. Componentes Principais Amostrais Análise Multivariada X = (x 1,..., x n ) Xa é uma soma ponderada das colunas de X. V (Xa) = a Sa Primeira componente principal e Y (1) = (X 1 X )e (1) Y (i) = (X 1 X )e (i). O conjunto dos componentes principais é dado por Y = (X 1 X )G.

78 Propriedades das Componentes Principais Análise Multivariada a)a proporção da variabilidade explicada pelas k componentes principais é dado por (λ λ k ) (λ λ p ). b)componentes principais são afetadas por mudança de escala. Isto pode ser solucionada por padrozinar as variáveis ou usar a matriz de correlação. c)o posto de x = r < p, a variabilidade total pode ser explicada pelas r primeiras componentes. d)elipsóide (x µ)s 1 (x µ) = T α

79 Eliminação de Componentes Análise Multivariada hipóteses H 0 : λ p = λ p 1 =... = λ k+1. O log da estatística da razão de verossimilhança é dada por 2logλ = np(a 1 log g), onde a e g são as médias geométricas dos autovalores de Σ 1 S, onde Σ de Σ. Os autovalores de S são os mesmos de Σ. Sejam a 0 = (λ k+1,...,+λp) (p k) e g 0 = (λ k+1,..., λ p ). A estatística para testar a hipótese acima, com a aplicação da correção de Bartlett, é dada (n 2p + 11 )(p k) log( a 0 ) χ 2 (p k+2)(p k 1)/2, 6 g 0 O mesmo pode ser feito com a matriz de correlação (Vide Mardia et al (1979, p. 236).

80 Componentes Principais e Análise de Regressão Análise Multivariada Para várias explicativas muito correlacionadas, o método de componentes principais torna-se uma boa alternativa. O critério de escolha das componentes não é mais o teste anteriormente descrito. Este critério é o mesmo usado para as variáveis explicativas do modelo de regressão, onde estas variáveis explicativas são as componentes principais. As principais vantagens do uso de componentes principais em análise regressão são: O uso de componentes principais faz com que todas as variáveis possam ser utilizadas na análise. As componentes principais permitem que o efeito individual de cada variável seja melhor quantificado.

81 Formulação do Modelo Análise Multivariada Modelo de regressão y = X β + ɛ, onde ɛ N(0, σ 2 H) e H = I n O modelo de regressão com as componentes principais W = XG é definido como onde α = G β. y = W α + ɛ,

82 Regressão Múltipla Multivariada Análise Multivariada Modelo onde Y (n m) = Z n (p+1) β (p+1) m) + ɛ (n m), z 11 z z 1m Z = z n1 z n2... z nm β 01 β β 0m β = β p1 β p2... β pm ɛ 11 ɛ ɛ 1m ɛ = ɛ n1 ɛ n2... ɛ nm

83

84

85

86 Anderson, T. W., (1971). An Introduction to Multivariate Statistical Analysis, John Wiley & Sons, New York. Everitt, B., (1974). Cluster Analysis, Heinemann Educational Books, London. Mardia, K. V., Kent, J. T. and Bibby, J. M. (1979). Multivariate Analysis, Academic Press, London.

87 Critérios de Avaliação - Atlas Banco de Dados Análise Multivariada 1. Usar latex; 2. Usar R ou OX; 3. A avaliação é competitiva, isto é, o melhor trabalho recebe a melhor nota e força a redução das notas dos outros trabalhos; 4. Justificar a escolha das variáveis e o objetivo de sua análise; 5. Usar as informações dos livros porque as notas de aula são apenas slides; 6. Explicar os modelos utilizados (equações e idéias); 7. Colocar referências bibliográficas; 8. Escrever notas explicativas nos programas desenvolvidos e colocar todos os programas em um apêndice. As melhores análises serão enviadas para secretaria de planejamento da cidade do Recife. Nossa expectativa é receber alguma retroalimentação.

88 Calendário Análise Multivariada Prova Análise do Banco de Dados: Atlas (Recife) Seminário:

89 Os trabalhos entregues 2 dias antes do prazo têm um acréscimo de 20% no valor da nota. Método Data Abraão Fábio Juliana da Entrega Agrupamento ,6 2,4 2,2 Discriminante ,6 2,4 2,4 Componentes ,4 2,4 2,2 Principais Regressão Multivariada ,6 2,4 2,3 Tabela: Cronograma e Avaliação

90 Os alunos José Luis e Edson já estão reprovados. Aluno SeminárioProva Análise Dados Média Final Abraão 9,5 7,5 10 9,0 Edson 4 0,7 0 Fábio 8,5 7,0 9,6 8,4 Jose Luis Juliana 8,5 4, ,4 Tabela: Resultados Parciais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um

Leia mais

Vetor de Variáveis Aleatórias

Vetor de Variáveis Aleatórias Vetor de Variáveis Aleatórias Luis Henrique Assumpção Lolis 25 de junho de 2013 Luis Henrique Assumpção Lolis Vetor de Variáveis Aleatórias 1 Conteúdo 1 Vetor de Variáveis Aleatórias 2 Função de Várias

Leia mais

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios: Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

CC-226 Aula 07 - Estimação de Parâmetros

CC-226 Aula 07 - Estimação de Parâmetros CC-226 Aula 07 - Estimação de Parâmetros Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Estimação de Parâmetros Para construir o classificador bayesiano, assumimos as distribuições

Leia mais

Técnicas computacionais em probabilidade e estatística II

Técnicas computacionais em probabilidade e estatística II Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:

Leia mais

Inferências sobre o vetor de Média. (Johnson & Wichern, Cap. 5) Considere o problema univariado no qual temse uma amostra aleatória de tamanho n da

Inferências sobre o vetor de Média. (Johnson & Wichern, Cap. 5) Considere o problema univariado no qual temse uma amostra aleatória de tamanho n da Inferências sobre o vetor de Média (Johnson & Wichern, Cap. 5) Considere o problema univariado no qual temse uma amostra aleatória de tamanho n da distribuição N(µ, σ 2 ), em que ambos os parâmetros de

Leia mais

Inferência Estatistica

Inferência Estatistica Inferência Estatistica Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Modelos e Inferência Um modelo é uma simplificação da realidade (e alguns

Leia mais

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Erica Castilho Rodrigues 23 de Maio de 207 Introdução 2 3 Vimos como encontrar o EMV usando algoritmos numéricos. Duas possibilidades:

Leia mais

Modelo de Regressão Múltipla

Modelo de Regressão Múltipla Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão

Leia mais

Universidade Federal de Pernambuco Departamento de Estatística Inferência Estatística (PGE 951) Método de Máxima Verossimilhança (M.M.V.

Universidade Federal de Pernambuco Departamento de Estatística Inferência Estatística (PGE 951) Método de Máxima Verossimilhança (M.M.V. Universidade Federal de Pernambuco Departamento de Estatística Inferência Estatística (PGE 95) Método de Máxima Verossimilhança (MMV) Definição: Qualquer ˆθ = ˆθ(X,, X n ) Θ tal que L(ˆθ; x,, x n ) = Sup{L(θ)

Leia mais

Universidade Federal do Rio de Janeiro. Centro de Ciências Matemáticas e da Natureza. Instituto de Matemática. Departamento de Estatística

Universidade Federal do Rio de Janeiro. Centro de Ciências Matemáticas e da Natureza. Instituto de Matemática. Departamento de Estatística Universidade Federal do Rio de Janeiro Centro de Ciências Matemáticas e da Natureza Instituto de Matemática Departamento de Estatística Uma Revisão da Análise de Variância Multivariada com Aplicações em

Leia mais

Análise de regressão linear simples. Diagrama de dispersão

Análise de regressão linear simples. Diagrama de dispersão Introdução Análise de regressão linear simples Departamento de Matemática Escola Superior de Tecnologia de Viseu A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente

Leia mais

Estatísticas Inferenciais Distribuições Amostrais. Estatística

Estatísticas Inferenciais Distribuições Amostrais. Estatística Estatística Na descrição dos conjuntos de dados x 1,..., x n, não foi feita menção ao conceito de população. Estatísticas inferenciais: preocupadas com a fonte dos dados e em tentar fazer generalizações

Leia mais

Vetor de Variáveis Aleatórias

Vetor de Variáveis Aleatórias Vetor de Variáveis Aleatórias Luis Henrique Assumpção Lolis 14 de abril de 2014 Luis Henrique Assumpção Lolis Vetor de Variáveis Aleatórias 1 Conteúdo 1 Vetor de Variáveis Aleatórias 2 Função de Várias

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS fonte de graus de soma de quadrado variação liberdade quadrados médio teste F regressão 1 1,4 1,4 46,2 resíduo 28 0,8 0,03 total 2,2 A tabela de análise de variância (ANOVA) ilustrada acima resulta de

Leia mais

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ 3 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 2 3 4 5 6 7 8 9 0 2 3 4 5 e 6 Introdução à probabilidade (eventos, espaço

Leia mais

26 de dezembro de 2007

26 de dezembro de 2007 Curso de UFRPE e UFPE 26 de dezembro de 2007 1 2 3 4 Seja l(θ) a log-verossimilhança. A esperança e a covariância da função escore são dadas por: e Cov(U) = E respectivamente. ( UT θ E(U) = 0 (1.1) ) (

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S. Silva http://www.im.ufrj.br/ralph/multivariada.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário

Leia mais

Modelos de Regressão Linear Simples - parte III

Modelos de Regressão Linear Simples - parte III 1 Modelos de Regressão Linear Simples - parte III Erica Castilho Rodrigues 20 de Setembro de 2016 2 3 4 A variável X é um bom preditor da resposta Y? Quanto da variação da variável resposta é explicada

Leia mais

Amostra Aleatória Simples

Amostra Aleatória Simples Amostra Aleatória Simples Airlane Pereira Alencar 4 de Abril de 2018 Alencar, A.P. (IME-USP) Amostra Aleatória Simples 4 de Abril de 2018 1 / 34 Definições e Notações Notações População ou Universo U =

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Introdução Solução de equações não lineares

Leia mais

Análise de Dados Longitudinais Aula

Análise de Dados Longitudinais Aula 1/35 Análise de Dados Longitudinais Aula 08.08.2018 José Luiz Padilha da Silva - UFPR www.docs.ufpr.br/ jlpadilha 2/35 Sumário 1 Revisão para dados transversais 2 Como analisar dados longitudinais 3 Perspectiva

Leia mais

Análise de Regressão EST036

Análise de Regressão EST036 Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Distribuição beta não central; Coef. de determinação; Quando X for aleatório. Distribuição

Leia mais

Revisões de Matemática e Estatística

Revisões de Matemática e Estatística Revisões de Matemática e Estatística Joaquim J.S. Ramalho Contents 1 Operadores matemáticos 2 1.1 Somatório........................................ 2 1.2 Duplo somatório....................................

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S. Silva http://www.im.ufrj.br/ralph/multivariada.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Agradecimentos

Leia mais

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Vanessa Siqueira Peres da Silva 1 2 Daniel Furtado Ferreira 1 1 Introdução É comum em determinadas

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100% . Definição dos acontecimentos: M T-shirt tem manchas C T-shirt tem costuras defeituosas D T-shirt é defeituosa A Preço da t-shirt é alterado a) PM) = % PC) = 5% PM C) = % LEEC Probabilidades e Estatística

Leia mais

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017. Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2017.1 Distribuições Amostrais O intuito de fazer uma amostragem

Leia mais

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

AULA 7 - Inferência em MQO: ICs e Testes de

AULA 7 - Inferência em MQO: ICs e Testes de AULA 7 - Inferência em MQO: ICs e Testes de Hipóteses Susan Schommer Econometria I - IE/UFRJ Nosso primeiro objetivo aqui é relembrar a diferença entre estimação de ponto vs estimação de intervalo. Vamos

Leia mais

8. Análise em Componentes Principais - ACP

8. Análise em Componentes Principais - ACP 8. Análise em Componentes Principais - ACP 8.1 Introdução O propósito principal da ACP é substituir as variáveis originais por um número menor de variáveis que são função das variáveis originais. A ACP

Leia mais

PROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1)

PROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1) PROCEDIMENTOS NÃO SUPERVISIONADOS E TÉCNICAS DE AGRUPAMENTO (parte 1) 1 Procedimentos não supervisionados Não se conhece a classificação das amostras de treinamento Qual é o interesse? 1) Coletar e rotular

Leia mais

CC-226 Aula 05 - Teoria da Decisão Bayesiana

CC-226 Aula 05 - Teoria da Decisão Bayesiana CC-226 Aula 05 - Teoria da Decisão Bayesiana Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Classificador Bayesiano Considerando M classes C 1... C M. N observações x j. L atributos

Leia mais

PROVA DE ESTATÍSTICA e PROBABILIDADES SELEÇÃO - MESTRADO/UFMG /2012

PROVA DE ESTATÍSTICA e PROBABILIDADES SELEÇÃO - MESTRADO/UFMG /2012 PROVA DE ESTATÍSTICA e PROBABILIDADES SELEÇÃO - MESTRADO/UFMG - 0/0 Instruções:. Cada questão respondida corretamente vale (um) ponto.. Cada questão respondida incorretamente vale - (menos um) ponto. 3.

Leia mais

Par de Variáveis Aleatórias

Par de Variáveis Aleatórias Par de Variáveis Aleatórias Luis Henrique Assumpção Lolis 7 de abril de 2014 Luis Henrique Assumpção Lolis Par de Variáveis Aleatórias 1 Conteúdo 1 Introdução 2 Par de Variáveis Aleatórias Discretas 3

Leia mais

AULA 17 - Distribuição Uniforme e Normal

AULA 17 - Distribuição Uniforme e Normal AULA 17 - Distribuição Uniforme e Normal Susan Schommer Introdução à Estatística Econômica - IE/UFRJ Distribuições Contínuas Em muitos problemas se torna matematicamente mais simples considerar um espaço

Leia mais

Disciplina de Modelos Lineares Professora Ariane Ferreira

Disciplina de Modelos Lineares Professora Ariane Ferreira Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável

Leia mais

Universidade Federal de Lavras

Universidade Federal de Lavras Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 6 a Lista de Exercícios Teoria da Estimação pontual e intervalar 1) Marcar como verdadeira ou falsa as seguintes

Leia mais

MAB-515 Avaliação e Desempenho (DCC/UFRJ)

MAB-515 Avaliação e Desempenho (DCC/UFRJ) MAB-515 Avaliação e Desempenho (DCC/UFRJ) Aula 7: Intervalos de Confiança 13 de novembro de 2012 1 2 3 4 Percentil 100p%-percentil O ponto t 0 tal que t 0 = F 1 X (p) = min{t : F X (t) p}, 0 < p < 1 é

Leia mais

SME0822 Análise Multivariada 2 o semestre de 2014

SME0822 Análise Multivariada 2 o semestre de 2014 SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 6 de agosto de 2014

Leia mais

SME0822 Análise Multivariada 2 o semestre de 2014

SME0822 Análise Multivariada 2 o semestre de 2014 SME0822 Análise Multivariada 2 o semestre de 2014 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/ cibele Sala 3-139 Coteia Wiki: http://wiki.icmc.usp.br/index.php/sme0822 7 de agosto de 2014

Leia mais

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) Susan Schommer Econometria I - IE/UFRJ Variância dos estimadores MQO Vamos incluir mais uma hipótese: H1 [Linear nos parâmetros]

Leia mais

Técnicas Multivariadas em Saúde

Técnicas Multivariadas em Saúde Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

6. Amostragem e estimação pontual

6. Amostragem e estimação pontual 6. Amostragem e estimação pontual Definição 6.1: População é um conjunto cujos elementos possuem qualquer característica em comum. Definição 6.2: Amostra é um subconjunto da população. Exemplo 6.1: Um

Leia mais

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Cap. 8 - Intervalos Estatísticos para uma Única Amostra Intervalos Estatísticos para ESQUEMA DO CAPÍTULO 8.1 INTRODUÇÃO 8.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 8.3 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS As variáveis aleatórias X e Y seguem uma distribuição de Bernoulli com probabilidade de sucesso igual a 0,4. Considerando S = X + Y e que os eventos aleatórios A = [X = 1] e B

Leia mais

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo 1 Modelos Lineares Generalizados - Verificação do Ajuste do Modelo Erica Castilho Rodrigues 9 de Abril de 2015 2 3 Função Deviance Podemos ver o ajuste de um modelo a um conjunto de dados como: uma forma

Leia mais

Modelos de regressão para dados correlacionados. Cibele Russo

Modelos de regressão para dados correlacionados. Cibele Russo Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo

Leia mais

IND 1115 Inferência Estatística Aula 6

IND 1115 Inferência Estatística Aula 6 Conteúdo IND 5 Inferência Estatística Aula 6 Setembro de 004 A distribuição Lognormal A distribuição Beta e sua relação com a Uniforme(0,) Mônica Barros mbarros.com mbarros.com A distribuição Lognormal

Leia mais

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47 CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................

Leia mais

Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Geração de Números Aleatórios Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo 1 / 61 Simulando de Distribuições Discretas Assume-se que um

Leia mais

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA UFPE - Universidade Federal de Pernambuco Departamento de Estatística Disciplina: ET-406 Estatística Econômica Professor: Waldemar A. de Santa Cruz Oliveira Júnior INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA Podemos

Leia mais

MP-208: Filtragem Ótima com Aplicações Aeroespaciais

MP-208: Filtragem Ótima com Aplicações Aeroespaciais MP-208: Filtragem Ótima com Aplicações Aeroespaciais Seção 2.1: Álgebra Linear e Matrizes Davi Antônio dos Santos Departamento de Mecatrônica Instituto Tecnológico de Aeronáutica davists@ita.br São José

Leia mais

CE085 - Estatística Inferencial. derivadas. Prof. Wagner Hugo Bonat. 5 de setembro de Curso de Bacharelado em Estatatística

CE085 - Estatística Inferencial. derivadas. Prof. Wagner Hugo Bonat. 5 de setembro de Curso de Bacharelado em Estatatística CE085 - Estatística Inferencial Função de Verossimilhança e suas derivadas Prof. Wagner Hugo Bonat Laboratório de Estatística e Geoinformação - LEG Curso de Bacharelado em Estatatística Universidade Federal

Leia mais

Probabilidades e Estatística MEEC, LEIC-A, LEGM

Probabilidades e Estatística MEEC, LEIC-A, LEGM Departamento de Matemática Probabilidades e Estatística MEEC, LEIC-A, LEGM Exame a Época / o Teste (Grupos III e IV) o semestre 009/00 Duração: 80 / 90 minutos /06/00 9:00 horas Grupo I Exercício 5 valores

Leia mais

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância) Susan Schommer Econometria I - IE/UFRJ Variância dos estimadores MQO Vamos incluir mais uma hipótese: H1 [Linear nos parâmetros]

Leia mais

Aula 7 - Revisão de Álgebra Matricial

Aula 7 - Revisão de Álgebra Matricial 23 de Abril de 2018 // 26 de Abril de 2018 Introdução Objetivo da revisão: revisar a notação matricial, técnicas de álgebra linear e alguns resultados importantes Conteúdos: 1 Vetores e matrizes 2 Operações

Leia mais

Estudo dirigido de Análise Multivariada

Estudo dirigido de Análise Multivariada Estudo dirigido de Análise Multivariada Conceitos Iniciais De um modo geral, os métodos estatísticos de análise multivariada são aplicados para analisar múltiplas medidas sobre cada indivíduo ou objeto

Leia mais

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ 13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 3 4 5 6 7 8 9 10 11 1 13 14 15 e 16 Introdução à probabilidade (eventos,

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro

Leia mais

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral. DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíveis resultados de um experimento. Evento é qualquer subconjunto do espaço amostral. Evento combinado: Possui duas

Leia mais

SME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo. Sala 3-113

SME0822 Análise Multivariada 2 o semestre de Prof. Cibele Russo.  Sala 3-113 SME0822 Análise Multivariada 2 o semestre de 2016 Prof. Cibele Russo cibele@icmc.usp.br http://www.icmc.usp.br/~cibele Sala 3-113 2. semestre 2016 1 / 25 Principais objetivos do curso Estudar e desenvolver

Leia mais

29 e 30 de julho de 2013

29 e 30 de julho de 2013 Programa de Pós-Graduação em Estatística e Experimentação Agronômica ESALQ/USP 29 e 30 de julho de 2013 Dia 2 - Conteúdo 1 2 3 Dados multivariados Estrutura: n observações tomadas de p variáveis resposta.

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

Inferência Bayesiana

Inferência Bayesiana Inferência Bayesiana Joaquim Neto joaquim.neto@ufjf.edu.br www.ufjf.br/joaquim_neto Departamento de Estatística - ICE Universidade Federal de Juiz de Fora (UFJF) Versão 3.0 Joaquim Neto (UFJF) ICE - UFJF

Leia mais

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral. DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíveis resultados de um experimento. Evento é qualquer subconjunto do espaço amostral. Evento combinado: Possui duas

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS quantidade São Paulo (j = 1) Rio de Janeiro (j = 2) Minas Gerais (j = 3) Rio Grande do Sul (j = 4) total casos novos (X, em milhões) casos pendentes (Y, em milhões) processos

Leia mais

Regressão Linear - Parte I

Regressão Linear - Parte I UFPE - Universidade Federal de Pernambuco Curso: Economia Disciplina: ET-406 Estatística Econômica Professor: Waldemar Araújo de S. Cruz Oliveira Júnior Regressão Linear - Parte I 1 Introdução Podemos

Leia mais

Tópicos de matrizes e Distribuição Normal Multivariada

Tópicos de matrizes e Distribuição Normal Multivariada Tópicos de matrizes e Distribuição Normal Multivariada CAPÍTULO 1 Alguns resultados importantes 11 definições I n : matriz Identidade de dimensão (n n) J n : 11 t 111 Traço Sejam A p p, B p p, C p p, D

Leia mais

Modelos de Regressão

Modelos de Regressão Renato Martins Assunção DCC - UFMG 2015 Renato Martins Assunção (DCC - UFMG) 2015 1 / 19 Exemplo de preço de apto Y = y 1 y 2 y 1499 y 1500 b 0 1 1 1 1 + b 1 área 1 área 2 área 1499 área 1500 + b 2 idade

Leia mais

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015 Mestrado Profissional em Administração Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes º trimestre de 05 Inferência Multivariada MANOVA MANLY, Cap. 4 HAIR et al., Cap. 6 Exemplo Uma

Leia mais

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5 MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão

Leia mais

Processos Estocásticos

Processos Estocásticos Processos Estocásticos Luis Henrique Assumpção Lolis 26 de maio de 2014 Luis Henrique Assumpção Lolis Processos Estocásticos 1 Conteúdo 1 Introdução 2 Definição 3 Especificando um processo aleatório 4

Leia mais

Estimação e Testes de Hipóteses

Estimação e Testes de Hipóteses Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas

Leia mais

Reconhecimento de Padrões. Reconhecimento de Padrões

Reconhecimento de Padrões. Reconhecimento de Padrões Reconhecimento de Padrões 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Escola Superior de Tecnologia Engenharia Informática Reconhecimento de Padrões Prof. João Ascenso e Prof.

Leia mais

SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS

SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS 4 SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS Em muitos problemas de probabilidade que requerem o uso de variáveis aleatórias, uma completa especificação da função de densidade de probabilidade ou não está

Leia mais

3 a Lista de Exercícios de Introdução à Álgebra Linear IMPA - Verão e B =

3 a Lista de Exercícios de Introdução à Álgebra Linear IMPA - Verão e B = 3 a Lista de Exercícios de Introdução à Álgebra Linear IMPA - Verão 2008. (a) Ache os auto-valores e auto-vetores de A = 3 4 2 0 2 0 0 0 e B = 0 0 2 0 2 0 2 0 0 (b) Mostre que λ + λ 2 + λ 3 é igual ao

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe

Leia mais

Inferência para CS Tópico 10 - Princípios de Estimação Pontual

Inferência para CS Tópico 10 - Princípios de Estimação Pontual Inferência para CS Tópico 10 - Princípios de Estimação Pontual Renato Martins Assunção DCC - UFMG 2013 Renato Martins Assunção (DCC - UFMG) Inferência para CS Tópico 10 - Princípios de Estimação Pontual

Leia mais

Probabilidades e Estatística - LEIC + LERCI + LEE 2 o semestre 2004/05

Probabilidades e Estatística - LEIC + LERCI + LEE 2 o semestre 2004/05 Departamento de Matemática Secção de Estatística e Aplicações - IST Probabilidades e Estatística - LEIC + LERCI + LEE 2 o semestre 2004/05 3 o Teste 4/6/2005 9h O Teste que vai realizar tem a duração total

Leia mais

Modelos Lineares Generalizados

Modelos Lineares Generalizados Modelos Lineares Generalizados Emilly Malveira de Lima Análise de Dados Categóricos Universidade Federal de Minas Gerais - UFMG 10 de Maio de 2018 Emilly Malveira (PGEST-UFMG) 10 de Maio de 2018 1 / 20

Leia mais

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise

Leia mais

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou

Leia mais

Estatística Básica. 13 de maio de 2009

Estatística Básica. 13 de maio de 2009 13 de maio de 2009 1 2 3 4 5 Tipos de Testes Exemplos Teste para amostras independentes com variâncias iguais Teste para amostras independentes com variâncias diferentes Teste para amostras dependentes

Leia mais

5.3 Variáveis aleatórias gaussianas conjuntas

5.3 Variáveis aleatórias gaussianas conjuntas M. Eisencraft 5.3 Variáveis aleatórias gaussianas conjuntas 64 respectivamente. São as chamadas funções características marginais: Φ X (ω ) = Φ X,Y (ω,0) (5.0) Φ Y (ω ) = Φ X,Y (0,ω ) (5.) Os momentos

Leia mais

CM005 Álgebra Linear Lista 3

CM005 Álgebra Linear Lista 3 CM005 Álgebra Linear Lista 3 Alberto Ramos Seja T : V V uma transformação linear. Se temos que T v = λv, v 0, para λ K. Dizemos que λ é um autovalor de T e v autovetor de T associado a λ. Observe que λ

Leia mais

MAE Planejamento e Pesquisa II

MAE Planejamento e Pesquisa II MAE0327 - Planejamento e Pesquisa II EXPERIMENTOS/ESTUDOS NÃO-BALANCEADOS COM FATORES FIXOS - PARTE 1 7 de agosto de 2016 Denise A Botter MAE0327 7 de agosto de 2016 1 / 1 PLANEJAMENTO E PESQUISA I Estudos

Leia mais

p(x) Note que 1/p(x), que não depende de θ, funciona como uma constante normalizadora

p(x) Note que 1/p(x), que não depende de θ, funciona como uma constante normalizadora Capítulo 1 Introdução A informação que se tem sobre uma quantidade de interesse θ é fundamental na Estatística. O verdadeiro valor de θ é desconhecido e a idéia é tentar reduzir este desconhecimento. Além

Leia mais

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 Susan Schommer Econometria I - IE/UFRJ Distribuições amostrais dos estimadores MQO Nas aulas passadas derivamos o valor esperado e variância

Leia mais

TESTES DE HIPÓTESES Notas de aula. Prof.: Idemauro Antonio Rodrigues de Lara

TESTES DE HIPÓTESES Notas de aula. Prof.: Idemauro Antonio Rodrigues de Lara 1 TESTES DE HIPÓTESES Notas de aula Prof.: Idemauro Antonio Rodrigues de Lara 2 Conteúdo 1. Fundamentos e conceitos básicos; 2. Função poder; 3. Testes mais poderosos e Lema de Neyman-Pearson; 4. Teste

Leia mais

Seminário de Análise Multivariada

Seminário de Análise Multivariada Seminário de Análise Multivariada Capítulo 1 - Introdução Conteúdo 1 Introdução 1 11 Aplicações de Técnicas Multivariadas 2 12 Organização de Dados 3 121 Arranjos 3 122 Exemplo 11 - Seleção de recibos

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Se a integração analítica não é possível ou

Leia mais

Técnicas computacionais em probabilidade e estatística II

Técnicas computacionais em probabilidade e estatística II Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco Métodos de Monte Carlo baseados em Cadeias de Markov:

Leia mais

Mais sobre Modelos Continuos

Mais sobre Modelos Continuos Mais sobre Modelos Continuos Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo 1 / 41 Transformação Linear da Uniforme Seja X uma variável aleatória

Leia mais

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017. Estimação pontual Professora Ana Hermínia Andrade Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise Período 2017.1 Introdução Exemplo Desejamos comprar um

Leia mais

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33 Mineração de Dados Aula 6: Finalização de Regressão e Classificação Rafael Izbicki 1 / 33 Como fazer um IC para o risco estimado? Vamos assumir que ( X 1, Ỹ1),..., ( X s, Ỹs) são elementos de um conjunto

Leia mais