1 TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO Mario de Andrade Lira Junior www.lira.pro.br direitos autorais.
INTRODUÇÃO À ANÁLISE MULTIVARIADA Apenas uma breve apresentação Para não dizerem que nunca viram Um conjunto de técnicas de análise que usa diversas variáveis dependentes simultaneamente Duh... Mais usada em amostragem que experimentação Linguagem derivada de amostragem Humanas e sociais, particularmente economia e administração 2
CARACTERÍSTICAS Estuda várias variáveis de forma integrada Sintetiza conclusões com menor chance de erro Pela redução do número de testes Análise univariada não reconhece ligação entre as variáveis A discussão fica sem avaliação de possibilidade de erro ph, Ca, Mg, Al, SB, CTC e saturação por alumínio não são independentes Mas a univariada trata como se fossem Encoraja questões mais fundamentais do relacionamento entre tratamentos e respostas 3
PROBLEMAS COMUNS Requerimentos Extensões multivariadas de todos os requisitos da univariada Não se sabe bem as conseqüências de não atingir os requerimentos Tamanho maior Uma recomendação (humanas) é de 5 a 10 participantes (unidades amostrais/experimentais) por variável Ou 200 a 500 amostras/parcelas (também em humanas) Em agrárias usamos com amostras bem menores 4
DIFICULDADE DE INTERPRETAÇÃO A interpretação pode ser difícil devido às camadas que devem ser estudadas Significância geral para determinar probabilidade do efeito ser do acaso no geral Principais variáveis independentes contribuindo Natureza das variáveis dependentes com significância Forma do relacionamento entre variáveis Diferenciar o significado estatístico do real Por exemplo, dar ênfase excessiva à estatística à custa da importância real Muito comum em Análise de Componentes Principais 5
TIPOS E FUNÇÕES Diferenças de grupo avaliar diferenças entre tratamentos Análise de covariância (ANCOVA) Isola o efeito de uma segunda variável quantitativa do efeito do tratamento em uma ANOVA Exemplos: precipitação ou populações de parcela em vários experimentos de campo É a multivariada mais parecida com univariada Análise multivariada de variância (MANOVA) Examina as diferenças entre tratamentos nas combinações de várias variáveis Essencialmente cria nova variável única que combina todas as demais e é analisada Não me lembro de ver com frequência em agrárias, mas me parece intuitivamente interessante 6
CONT. Métodos de previsão permitem prever resultados com base em várias variáveis independentes Para várias independentes contínuas e uma dependente contínua regressão multivariada Várias independentes contínuas e uma dependente categórica análise de função discriminante assume normalidade multivariada e homocedasticidade Por exemplo, vivo/morto é uma dependente categórica Com mistura de variáveis independentes contínuas e categóricas e dependente categórica - regressão logística Várias independentes e dependentes todas contínuas correlação canônica Por exemplo, correlação entre o vetor de variáveis de fertilidade do solo e o vetor de variáveis de planta Lembrando que vetor é estatiquês para um monte de variável junta 7
CONT. Métodos exploratórios dimensionais delimitam as dimensões subjacentes a grande conjunto de variáveis Formam subconjuntos de variáveis Reduzem variáveis correlacionadas a conjuntos menores independentes entre si análise de componentes principais (PCA em inglês) Provavelmente a multivariada mais usada em agrárias Para identificar um conjunto de dimensões teórico que explica a variância comum a um conjunto de variáveis análise de fatores 8
COMBINAÇÕES LINEARES Formação de compostos aditivos das variáveis, cada qual com um peso Componentes principais Componentes Combinação linear de variáveis que maximiza a variância extraída do conjunto original de variáveis Análise de componentes principais (ACP em português, PCA em inglês) Os componentes principais explicam a maior parte da variância das variáveis originais Fatores dimensões latentes que separam a variância em comum de todas as variáveis daquela única a cada variável Às vezes consideradas como a dimensão verdadeira de um conjunto de variáveis 9
INTERPRETAÇÃO Análise global Teste de significância Geralmente é uma razão de variâncias ou covariâncias No estilo do F Para ANCOVA, MANOVA, MANCOVA, DFA Teste F para avaliar diferenças entre tratamentos similar ao F da ANOVA Para métodos correlacionais (RM, CC) Teste F para avaliar se a covariância entre (tratamentos) é maior do que a dentro (resíduo) similar ao F da regressão simples 10
CONT. Efeitos de tamanho Indicam a magnitude dos resultados em um nível geral Podem ser diferenças padronizadas entre médias para tratamentos (exemplo de teste d de Cohen) Freqüentemente é a proporção de variância comum às variáveis independentes e dependentes Valores guia podem ser 0,02; 0,13 e 0,26 para efeitos de tamanho pequeno, médio e grande (Cohen, 1992 em Harlow, 2005) 11
CONT. Comparação de médias Efeito do tamanho padronizado para médias d de Cohen Bonferroni condução de uma série de testes t entre pares de grupos divide o nível de significância geral entre todas as comparações Ex: 0,05 no geral para quatro comparações o t de cada comparação tem p=0,0125 Comparações planejadas comparações múltiplas como Tukey Testes protegidos de Fisher testes de t para cada par de média menos conservativo do que Tukey ou Bonferroni 12
CONCLUSÃO Como disse no início apenas uma apresentação rápida Um livro interessante é Harlow, L. L. The essence of multivariate thinking. London:Lawrence Erlbaum Associates, 2005. Tenho em pdf Análise multivariada merece no mínimo uma disciplina somente para ela Mais importante para amostragem, mas tem usos potenciais em experimentação Em particular para trabalhos com número muito alto de variáveis É um dos caminhos para análise de medições repetidas 13