Aluna de Doutorado: Orientador: Paulo Justiniano Ribeiro Junior Universidade Federal do Paraná Programa de Pós-Graduação em Métodos Numéricos em Engenharia 19 de outubro de 2009
Tese Motivação Dados Composicionais - Aitchison (1986) Literatura Objetivo Fundamentos Para Análise de Dados Composicionais TESE 1. Introdução 2. Revisão da Literatura: Modelo Geoestatístico Gaussiano; Predição Linear Espacial- Clássica e Bayesiana; Matriz de Covariância, Correlação e Variograma Cruzado; Modelo Multivariado; Dados Composicionais; 3. Material e Métodos: Modelo Geoestatístico Composicional - Clássica e Bayesiana; Análise de Dados Composicionais Simulados; 4. : Análise de frações granulométricas de um solo; 5..
Tese Motivação Dados Composicionais - Aitchison (1986) Literatura Objetivo Fundamentos Para Análise de Dados Composicionais MOTIVAÇÃO Figura: Quadrante irrigado por sistema pivô-central no campo experimental da ESALQ-USP. SOLO frações granulométricas (composição) propriedades físico hídricas prática agrícola agricultura de precisão
Tese Motivação Dados Composicionais - Aitchison (1986) Literatura Objetivo Fundamentos Para Análise de Dados Composicionais Dados Composicionais - Aitchison (1986) Areia Argila Figura: Diagrama Ternário das composições. Silte Composição: X =(X 1, X 2,..., X B ) X i 0; X 1 + X 2 + + X B = 1 S B ={X R B ; X i >0, 1 X = 1} Base: W =(W 1, W 2,..., W B ) R B +={W R B ; W i >0, i = 1,..., B} Operador fechamento: C : R B + S B W C[W ] = W 1 W
Tese Motivação Dados Composicionais - Aitchison (1986) Literatura Objetivo Fundamentos Para Análise de Dados Composicionais LITERATURA Dados composicionais: Aitchison (1986). Modelos espaciais uni e multivariados: Diggle e Ribeiro Jr (2007); Schmidt e Gelfand (2003); Banerjee, Carlin e Gelfand (2004); Schmidt e Sansó (2006). Combinação de dados composicionais e espaciais: Pawlowsky e Olea (2004); Tjelmeland e Lund (2003).
Tese Motivação Dados Composicionais - Aitchison (1986) Literatura Objetivo Fundamentos Para Análise de Dados Composicionais OBJETIVO Estender o modelo geoestatístico bivariado para dados composicionais, derivando e implementando estimação via inferência bayesiana baseada na verossimilhança; Obter preditores espaciais no simplex que permitam a construção de mapas de predição das frações do solo na área de estudo.
Tese Motivação Dados Composicionais - Aitchison (1986) Literatura Objetivo Fundamentos Para Análise de Dados Composicionais Fundamentos Para Análise de Dados Composicionais Transformação razão log-aditiva (alr): alr : S B R B 1 X (x ) alr ( X (x ) ) = ( ln X ) 1(x ) X B (x ),..., lnx B 1(x ) X B (x ) Composição: X (x ) = (X 1 (x ), X 2 (x ), X 3 (x )) ( = (Areia, Silte, Argila) Ȳ (x ) = (Y 1 (x ), Y 2 (x )) = ln X ) 1(x ) X 3 (x ), lnx 2(x ) X 3 (x ) Transformação logística generalizada aditiva (agl): agl=alr 1 Pawlowsky e Olea (2004).
Tese Motivação Dados Composicionais - Aitchison (1986) Literatura Objetivo Fundamentos Para Análise de Dados Composicionais MODELO ESPACIAL Modelo geoestatístico bivariado para dados composicionais: Y 1 (x i) = µ 1 (x i) + σ 1 U(x i; φ) + τ 1 Z(x i; ρ) Y 2 (x i ) = µ 2(x i ) + σ 2U(x i ; φ) + τ 2Z(x i ; ρ) x i, x i R2 ; i, i = 1,..., n 1, n 1 tamanho amostral; Ȳ n 1 (x ) = ( Y 1 (x 1), Y 2 (x 1),..., Y 1 (x n 1 ), Y 2 (x n 1 ) ) ; U N(0 ; Σ U ), Σ U : var. unitárias, função de ρ U (φ) exponencial; Z N(0 ; Σ Z ), Σ Z : var/cov em função de ρ induzida pela estrutura composicional.
Tese Motivação Dados Composicionais - Aitchison (1986) Literatura Objetivo Fundamentos Para Análise de Dados Composicionais MODELO ESPACIAL θ = (µ 1, µ 2, σ 1, σ 2, τ 1, τ 2, φ, ρ) θ = (η, ν 1, ν 2, φ, ρ) Log-Verossimilhança Normal multivariada com EMV: ˆµ = (D V 1 D) 1 (D V 1 Ȳ ) e ˆσ 1 = ˆQe/n ˆQe = (Ȳ Dˆµ ) V 1 (Ȳ Dˆµ ) Log-verossimilhança concentrada solução numérica: [ ( )] l(θ, Ȳ ) = 0, 5 ln( V ) + n ln(2π) + ln( ˆQe) ln(n) + 1
continuação Passos Para INFERÊNCIA BAYESIANA θ = (µ 1, µ 2, σ 1, σ 2, τ 1, τ 2, φ, ρ) variáveis aleatórias Dist conjunta = veros. x priori: P(Ȳ, θ ) = P(Ȳ θ ) P(θ ). Teorema de Bayes distribuição à posteriori de θ : P(θ Ȳ ) = P(θ, Ȳ ) P(Ȳ ) = P(Ȳ θ )P(θ ) P(Ȳ ) = P(Ȳ θ )P(θ ) P(θ, Ȳ )dθ P(Ȳ θ )P(θ ), Resumos estatísticos como esperanças à posteriori de funções de θ : f (θ )P(θ )P(Ȳ E(f (θ ) Ȳ ) = θ )dθ f (θ )P(θ )P(Ȳ θ )dθ. P(θ )P(Ȳ θ )dθ
continuação Passos Para INFERÊNCIA BAYESIANA (cont.) Resolução: aproximação de Laplace: Nott, Fielding e Leonte (2009), Gelman, Carlin, Stern e Rubin (2003), Gilks, Richardson e Spiegelhalter (1996); quadratura de Gauss-Hermite: Paulino, Turkman e Murteira (2003), Gamerman (2006), Abramowitz e Stegun (1972); integração Monte Carlo - Cadeias de Markov de Monte Carlo (MCMC): Gamerman (2006), Lee (2004), Gelman, Carlin, Stern e Rubin (2003), Gill (2002), Gilks, Richardson e Spiegelhalter (1996).
continuação Passos Para INFERÊNCIA BAYESIANA (cont.) θ = (µ 1, µ 2, σ 1, σ 2, τ 1, τ 2, φ, ρ) θ = (η, ν 1, ν 2, φ, ρ) e (µ, σ 2 1 ) independentes Distribuição à posteriori de θ : P(µ, σ1 2, θ Ȳ ) P(Ȳ µ, σ1 2, θ )P(µ, σ1 2)P(θ )
continuação Passos Para PRIORIS Prioris: P(µ, σ1 2) 1 σ1 2 ; P(µ σ 1 2) = 1; P(η), P(ν 1 ) e P(ν 2 ): lognormais com parâmetros correpondentes àsrazões das estimativas de máxima verossim.; P(φ) = Gama(66, 1); P(ρ) = 1
continuação Passos Para Distribuições à Posteriori θ P(µ, σ2 1, θ Ȳ )dθ P(µ, σ1 2 Ȳ ) P(Ȳ µ, σ2 1, θ ) 1 σ1 2 1 σ1 2 P(Ȳ µ, σ1 2, θ ) [ µ Ȳ, σ1 2 ] ( N ˆµ ; σ2 1 [ σ 2 1 Ȳ ] ( ) χ 2 Sinv n n ; S 2 µ θ P(Ȳ µ, σ2 1, θ )P(µ, σ 1)P(θ 2 )dθ ( ) ) D V 1 Ȳ D 1 ˆµ P(θ θ )dθ. = (D V 1 D) 1 (D V 1 Ȳ ) ( ( Ȳ Dˆµ ) V 1 S 2 Ȳ Ȳ Dˆµ ) =. n nˆµ
continuação Passos Para Algoritmo Metropolis-Hastings θ (t) θ (t+1) : θ de q( θ (t) ) com probabilidade α(θ (t), θ ) Passos: 1. Escolher número de simulações - n 2. Iniciar o contador de iterações - t=1 3. Valor inicial θ (t) 4. Gerar θ de q( θ (t) ) 5. Gerar u U(0; { 1) 6. α(θ; θ ) = min 1; P(Ȳ θ ) P(θ ) q(θ θ } ) P(Ȳ θ) P(θ) q(θ θ) 7. Se u < α(θ; θ ) θ (t) = θ, cc θ (t) = θ (t 1). 8. Se t = n, FIM. 9. Incrementar o contador t fazendo t = t + 1. 10. Voltar para o passo 4. FIM.
continuação Passos Para Passos Para 1. Algoritmo Metropolis-Hastings matriz de covariância do modelo; 2. Calcular e S ˆµ 2 e amostrar σ1 2 de [ ( σ1 2 Ȳ] χ 2 Sinv n n ; S ); 2 µ 3. Calcular Var(µ ): [ ( µ Ȳ, σ1 2 ] N ˆµ ; σ2 1 4. Amostrar um valor de µ de [ µ Ȳ, σ 2 1] ; ( D V 1 Ȳ D ) 1 ); 5. Repetir tantas vezes quanto o número de simulações;
continuação Passos Para Passos Para θ P(µ, σ2 1, θ Ȳ )dθ P(µ, σ1 2 Ȳ ) P(Ȳ µ, σ2 1, θ ) 1 σ1 2 1 σ1 2 P(Ȳ µ, σ1 2, θ ) [ µ Ȳ, σ1 2 ] ( N ˆµ ; σ2 1 [ σ 2 1 Ȳ ] ( ) χ 2 Sinv n n ; S 2 µ θ P(Ȳ µ, σ2 1, θ )P(µ, σ 1)P(θ 2 )dθ ( ) ) D V 1 Ȳ D 1 ˆµ P(θ θ )dθ. = (D V 1 D) 1 (D V 1 Ȳ ) ( ( Ȳ Dˆµ ) V 1 S 2 Ȳ Ȳ Dˆµ ) =. n nˆµ
continuação Passos Para Passos Para (cont.) 6. Predição espacial: 6.1 Cokrigagem de Ȳ 0 em x 0 = (x 10, x 20,..., x n20) com cada conjunto de parâmetros simulados: µ Ȳ 0 Ȳ = µ Ȳ 0 + Σ Ȳ 0 Ȳ Σ 1 Ȳ Ȳ (Ȳ ) µ Ȳ Σ Ȳ 0 Ȳ = Σ Ȳ 0 Ȳ 0 Σ Ȳ 0 Ȳ Σ 1 Ȳ Ȳ Σ Ȳ Ȳ 0 6.2 Gerar uma amostra de NM (µ Ȳ 0 Ȳ ; Σ Ȳ 0 Ȳ ) para cada conjunto de parâmetros simulados. 6.3 Aplicar transformação agl. 6.4 Calcular a média das simulações para cada componente.
Análise de Frações Granulométricas de Um Solo Figura: Distribuição das localizações na área de estudo. Gonçalves (1997): Tese - ESALQ-USP; Área: quadrante irrigado por um sistema pivô-central; Grade de amostragem 20 20m Areia 76 amostras: Silte Argila.
Análise de Frações Granulométricas de Um Solo (cont.) Frequencia 0 5 10 15 20 25 Frequencia 0 5 10 15 20 25 10 15 20 25 30 35 40 45 Areia 15 20 25 30 Silte Frequencia 0 5 10 15 20 25 Argila 30 40 50 60 70 Argila Areia Silte Figura: Distribuição de areia, silte e argila e diagrama ternário das composições.
Análise de Frações Granulométricas de Um Solo (cont.) Frequencia 0 5 10 15 20 Frequencia 0 5 10 15 20 ln(silte/argila) 1.4 1.0 0.6 0.2 2.0 1.0 0.0 ln(areia/argila) 1.6 1.2 0.8 0.4 ln(silte/argila) 1.5 1.0 0.5 0.0 ln(areia/argila) Figura: Distribuição das log-razão e correspondente diagrama de dispersão.
Análise de Frações Granulométricas de Um Solo (cont.) Tabela: Estimativas e intervalos de 95% de confiança obtidos por inferência Bayesiana considerando-se 12000 simulações, burn-in= 1000 e salto= 10. Parâmetros Estimativas LI LS µ 1-0.7467-1.1078-0.4038 µ 2-0.7900-0.8958-0.6887 σ 1 0.1992 0.1273 0.2889 σ 2 0.0512 0.0247 0.0890 τ 1 0.1268 0.0978 0.1625 τ 2 0.1179 0.0884 0.1510 φ 65.7278 53.7055 80.5381 ρ 0.9314 0.85290 0.98854
Análise de Frações Granulométricas de Um Solo (cont.) Y Coord 0.15 0.2 0.25 0.3 0.35 Areia Y Coord 0.2150.220.2250.230.2350.24 Silte Y Coord 0.45 0.5 0.55 0.6 Argila X Coord X Coord X Coord Figura: Mapas das porcentagens de areia, silte e argila obtidos por inferência Bayesiana.
Análise de Frações Granulométricas de Um Solo (cont.) Y Coord 0.15 0.2 0.25 0.3 0.35 (A)Areia/QG Y Coord 0.2150.220.2250.230.235 (B)Silte/QG Y Coord 0.45 0.5 0.55 0.6 (C)Argila/QG X Coord X Coord X Coord Y Coord 0.15 0.2 0.25 0.3 0.35 (D)Areia/Sim Y Coord 0.2150.220.2250.230.2350.24 (E)Silte/Sim Y Coord 0.45 0.5 0.55 0.6 (F)Argila/Sim X Coord X Coord X Coord Y Coord 0.15 0.2 0.25 0.3 0.35 (G)Areia/IB Y Coord 0.2150.220.2250.230.2350.24 (H)Silte/IB Y Coord 0.45 0.5 0.55 0.6 (I)Argila/IB X Coord X Coord X Coord Figura: Mapas das porcentagens de areia, silte e argila por quadratura de Gauss-Hermite (A-C), simulação (D-F) e inferência Bayesiana (G-I).
Construção de mapas de areia, silte e argila garantindo que as frações somem 1, nos pontos observados e preditos; Modelo captura variações espaciais, induzidas pelas composições e não estruturadas; Declaração expĺıcita do modelo permite fazer inferências sobre parâmetros tanto pelo método clássico quanto por inferência Bayesiana considerando nas predições a incerteza associada à estimação dos parâmetros; Estimação de outros funcionais; Necessidade de investigar alternativas para computação mais eficiente e formas de especificação do modelo para um número maior de componentes.
AITCHISON, J., The statistical analysis of compositional data, New Jersey: The Blackburn Press, 1986. DIGGLE, P.J.; RIBEIRO JR, P.J., Model-based geostatistics, USA: Springer Series in Statistics, 2007. GONÇALVES, A.C.A., Variabilidade espacial de propriedades físicas do solo para fins de manejo da irrigação. 1997. 119p. Tese (Doutorado em Agronomia) - ESALQ-USP, São Paulo, Piracicaba. PAWLOWSKY-GLAHN, V.; OLEA, R.A., Geostatistical analysis of compositional data, New York: Oxford University Press, Inc., 2004. CARLIN, B. P.; LOUIS, T. A., Bayesian Methods for Data Analysis, Boca Raton: Chapman and Hall, Third ed., 2009. GELMAN, A.; CARLIN, J. B.; STERN, H. S.; RUBIN, D. B., Bayesian Data Analysis, Boca Raton: Chapman and Hall, Second ed., 2003. GILL, J., Bayesian Methods For The Social And Behavioral Sciences, London: Chapman and Hall, 2002. PAULINO, C. D.; TURKMAN, M. A. A.; MURTEIRA, B., Estatística Bayesiana, Lisboa: Fundação Calouste Gulbenkian, 2003.
OBRIGADA PELA ATENÇÃO!
Agradecimentos DES - Departamento de Estatística, UEM. PPGMNE - Programa de Pós-Graduação em Métodos Numéricos em Engenharia, UFPR. LEG - Laboratório de Estatística e Geoinformação, UFPR. CNPQ - Conselho Nacional de Desenvolvimento Científico e Tecnológico. FINEP projeto CT-INFRA/UFPR.