25 a 30 de novembro de 2013

Documentos relacionados

29 e 30 de julho de 2013

Técnicas Multivariadas em Saúde. Comparações de Médias Multivariadas. Métodos Multivariados em Saúde Roteiro. Testes de Significância

Anova Univariada e Multivariada

Resolução de sistemas lineares

Delineamento em Blocos ao Acaso

APLICAÇÕES DE ALGUMAS TÉCNICAS MULTIVARIADAS (Componentes Principais, Variáveis Canônicas e Correlações Canônicas)

XVIII CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 19 a 23 de outubro de 2009

Análise de componentes principais (PCA)

Ajuste de Curvas. Ajuste de Curvas

Estatística II Antonio Roque Aula 9. Testes de Hipóteses

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

PROGRAMA DO CURSO DE FORMAÇÃO ANÁLISE ESTATÍSTICA DE DADOS COM SPSS (ISSSP, )

P. P. G. em Agricultura de Precisão DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)

Análise de Componente Principais (PCA) Wagner Oliveira de Araujo

uma abordagem estatística

Prova de Admissão para o Mestrado em Matemática IME-USP

PROPOSTA DE FORMAÇÃO FORMAÇÃO NÍVEL I

Relatório Trabalho Prático 2 : Colônia de Formigas para Otimização e Agrupamento

TRANSFORMAÇÃO LINEAR. Álgebra Linear - Prof a Ana Paula

Faculdade Sagrada Família

Modelação 3D. Sumário COMPUTAÇÃO GRÁFICA E INTERFACES. Introdução. Introdução. Carlos Carreto

UNIVERSIDADE ESTADUAL DA PARAÍBA CENTRO DE CIÊNCIAS E TECNOLOGIA DEPARTAMENTO DE ESTATÍSTICA

Análise de componentes independentes aplicada à avaliação de imagens radiográficas de sementes

Documentação da Pesquisa de Satisfação Sistemas de TI 2010

UNIDADE 6 - PROGRAMAÇÃO MODULAR

Controlabilidade e Observabilidade

Regressão Logística. Daniel Araújo Melo - dam2@cin.ufpe.br. Graduação

Os Postulados da Mecânica Quântica

ESTATÍSTICA. Prof. Ari Antonio, Me. Ciências Econômicas. Unemat Sinop 2012

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

Faculdade de Tecnologia Programa de Pós Graduação em Engenharia de Recursos Amazônicos Reologia Prof. Lucas Freitas Berti 1 a Lista de exercícios

MÉTODOS ESTATÍSTICOS I 3ª. AVALIAÇÃO PRESENCIAL 1º Semestre de 2010 Prof. Moisés Lima de Menezes (pode usar calculadora) Versão Tutor

Análise multivariada aplicada em dados de futebol Campeonato Brasileiro de 2011

MÓDULO 1. I - Estatística Básica

36 a Olimpíada Brasileira de Matemática Nível Universitário Primeira Fase

Correlação Canônica. Outubro / Versão preliminar. Fabio Vessoni. fabio@mv2.com.br (011) MV2 Sistemas de Informação

Capítulo III Comparações entre algoritmos para análise dos resultados de SFRA Por Marcelo Eduardo de Carvalho Paulino*

EA616 - Análise Linear de Sistemas Aula 28 - Estabilidade do Estado

Análise de Regressão Linear Simples e Múltipla

Contabilometria. Aula 11 Regressão Linear Múltipla e Variáveis Dummy

Projecto de Programação por Objectos 2007/08 Escalonamento em Multi-processador por Programação Evolutiva MEBiom/MEEC 1 Problema

ESTATÍSTICA. 1. TURNO: Vespertino e Noturno HABILITAÇÃO: Bacharelado. PRAZOS PARA CONCLUSÃO: Mínimo = 4 anos

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

MARCELO RIBEIRO DA LUZ MARCOS FABIANE KUFNER

Matemática SSA 2 REVISÃO GERAL 1

Sistema de equações lineares

Função bayesiana em R para o problema de Behrens-Fisher multivariado

Planejamento Anual. Componente Curricular: Matemática Ano: 6º ano Ano Letivo: 2015 OBJETIVO GERAL

Medidas repetidas No.1

Análise de regressão linear simples. Departamento de Matemática Escola Superior de Tecnologia de Viseu

Regressão Logística. Propriedades

"SISTEMAS DE COTAGEM"

UNIÃO EDUCACIONAL DO NORTE UNINORTE AUTOR (ES) AUTOR (ES) TÍTULO DO PROJETO

3. Fase de Planejamento dos Ciclos de Construção do Software

Guia do professor. Introdução

Seleção Edital N 15/2014

Controlo Estatístico de Processos Industriais

Medição de Nível. Profa. Michelle Mendes Santos

ESTEREOSCOPIA INTRODUÇÃO. Conversão de um par de imagens (a)-(b) em um mapa de profundidade (c)

P R O G R A M A QUARTA FASE. OBJETIVOS ESPECÍFICOS Ao final do semestre o aluno devera ser capaz de:

Aula 9 ESCALA GRÁFICA. Antônio Carlos Campos

Anexo 2 Análise de clusters método K-means

Reconhecimento de Padrões Utilizando Filtros Casados

Lista 13: Gravitação. Lista 13: Gravitação

A Classificação da Pesquisa

Gobooks.com.br. PucQuePariu.com.br

3 Previsão da demanda

Análise operacional do terminal público do porto do Rio Grande usando teoria de filas

UNIVERSIDADE FEDERAL DE SÃO JOÃO DEL REI

Exercícios Teóricos Resolvidos

Quantidade dos Serviços

Testes (Não) Paramétricos

4 Aplicação: Modelo LOGIT para Avaliar o Risco de Crédito

Lista 1 para a P2. Operações com subespaços

Planejamento e Gestão Estratégica

01. Caro(a) candidato(a):

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

Conceitos Básicos em Análise de Sobrevivência Aula Estatística Aplicada

ESPAÇOS MUNIDOS DE PRODUTO INTERNO

Aulas 17 & 18. Comutação Rápida a Pacote. Eytan Modiano MIT

Universidade Federal do Paraná

Aplicações Computacionais em Exploração e Análise de Dados: Introdução ao Excel

Manual de Laboratório Física Experimental I- Hatsumi Mukai e Paulo R.G. Fernandes

LISTA DE EXERCÍCIOS 3

A estatística multivariada na análise econômico-financeira de empresas

ESTATÍSTICA BÁSICA COM ANÁLISE E TRATAMENTO ESTATÍSTICO DE DADOS EM SPSS

O Princípio da Complementaridade e o papel do observador na Mecânica Quântica

Linear Solver Program - Manual do Usuário

Álgebra Linear. André Arbex Hallack Frederico Sercio Feitosa

A otimização é o processo de

O teste de McNemar. A tabela 2x2. Depois

Verificando a situação financeira dos estados brasileiros: uma proposta utilizando análise discriminante

Probabilidade - aula I

FORMAÇÃO O seu sucesso passa por nós!

2ª Lista de Exercícios

UNIVERSIDADE FEDERAL DE SANTA MARIA CENTRO DE TECNOLOGIA AULA 16 PROFª BRUNO CALEGARO

PESQUISA EM INFORMÁTICA -ESTILOS DE PESQUISA EM COMPUTAÇÃO. Prof. Angelo Augusto Frozza, M.Sc.

GRADUAÇÃO EM ENGENHARIA

INSTITUTO TECNOLÓGICO

Universidade Federal do Rio Grande do Sul Escola de Engenharia Departamento de Engenharia Elétrica ENG04037 Sistemas de Controle Digitais

Transcrição:

Programa de Pós-Graduação em Estatística e Experimentação Agronômica ESALQ/USP 25 a 30 de novembro de 2013

Parte 6 - Conteúdo 1 2 3

Dados multivariados Estrutura: n observações tomadas de p variáveis resposta. É imprescindível a presença de correlação entre as respostas. Divide-se em: análise ou de simplicação (, AF...) e técnicas de inferência (teste T 2,,...).

Grande apelo prático. Divide-se basicamente em: métodos e métodos matemáticos de redução dimensional. Muitas vezes dispensam procedimentos inferenciais!

Três métodos bastante úteis são: Draftsman Faces de Cherno 1 Gráco de estrelas 2 1 Pacote R: TeachingDemos 2 Pacote R: graphics

Exemplo 1 Considere de 20 acessos de alho cujas seguintes variáveis foram mensuradas: diâmetro, comprimento, peso médio do bulbo e área foliar. Visualmente, é possível caracterizar os acessos?

Técnicas de redução dimensional Solução para o problema de representar muitas (digamos >10) variáveis. Construção de variáveis índices, da forma: Z = a 1 X 1 + a 2 X 2 +... + a p X p São exemplos: componentes principais, fatores, análise discriminante, escalonamento multidimensional, etc. Em geral, objetiva-se representar os n objetos com os valores de 2 ou 3 variáveis índices com a menor perda possível da informação das p variáveis.

Provavelmente o mais simples e mais utilizado dos métodos multivariados. O objetivo é, a partir de p variáveis resposta, construir p variáveis índices (chamados componentes principais) que sejam não correlacionadas e que descrevam a variação dos. A falta de correlação signica que os estão medindo diferentes dimensões dos. A ordem de importância dos componentes principais (Z) é tal que: Var(Z 1 ) Var(Z 2 )... Var(Z p ) sendo Var(Z j ) = λ j, o autovalor do j-ésimo componente principal.

Procedimento da Seja X (n p) a matriz de. O primeiro componente principal é a seguinte combinação linear: Z 1 = a 11 X 1 + a 12 X 2 +... + a 1p X p sujeito à norma: a 2 11 + a 2 12 +... + a 2 1p = 1 Analogamente, o segundo componente principal é: Z 2 = a 21 X 1 + a 22 X 2 +... + a 2p X p também sujeito a mesma norma, e assim por diante.

Procedimento da O problema consiste em determinar os coecientes a que constituem os autovetores dos CP's. Os cálculos são baseados na matriz R de correlações entre as p variáveis (ou na matriz S de covariâncias), a partir da equação característica: Os escores dos CP's são obtidos por: (R λ j I )a j = 0 Z j = X a j A proporção da variância total de X que é explicada pelo j-ésimo CP é denida por: Var(Z j ) Var.total(X ) = λ j p j λ j

Interpretando uma A interpretação dos CP's deve ser feita em termos das magnitudes dos coecientes a, isto é, do seu autovetor. É esperado que, quando a análise tenha sido bem suscedida, os 2 ou 3 primeiros CP's expliquem conjuntamente 80 ou 90% da variação dos (não é uma regra!). Quando se realiza a análise a partir da matriz de correlações, outro critério é escolher áqueles componentes cujo autovalor é maior que 1. Os escores dos CP's retidos podem ser plotados em 2 ou 3D para o estudo das relações entre os n indivíduos.

Exercício Utilize os de alho (Exemplo 1) para realizar a a partir da matriz de correlações.

: principal component regression Consiste em ajustar modelos de regressão linear em função dos escores dos componentes principais Indicado quando há problemas de multicolinearidade Indicado quando o número de variáveis é grande ou mesmo superior ao n

- exemplo Supõe-se que a produtividade de alho possa ser explicada por variáveis morfológicas. Utilize os do exemplo 1 ( de alho) para ajustar um modelo para predizer a produtividade de alho.

: de variância ANOVA aplicada simultaneamente à todas as variáveis resposta. No caso univariado decompoe-se somas de quadrados, no caso multivariado o procedimento é análogo, com a diferença que a variabilidade é computada e decomposta em matrizes de somas de quadrados e produtos cruzados (MSQPC). Por exemplo, para 3 variáveis resposta tem-se a seguinte matriz de MSQPC: SQtotal(y 1 ) SPtotal(y 1, y 2 ) SPtotal(y 1, y 3 ) MSQPC Total = SPtotal(y 2, y 1 ) SQtotal(y 2 ) SPtotal(y 2, y 3 ) SPtotal(y 3, y 1 ) SPtotal(y 3, y 2 ) SQtotal(y 3 )

: de variância Modelo estatístico de um experimento em DIC: Y ij = µ + t i + ɛ ij Exigências semelhantes ao caso univariado são feitas.

Tabela da FV GL MSQPC Tratamento t 1 B Resíduo n t W Total n 1 T

Hipótese em teste H 0 : µ 1 = µ 2 =... = µ t No caso univariado a F é usada para testar H 0. No multivariado, quatro s são comumente usadas.

Lambda de Wilks Maior raiz de Roy Traço de Pillai Traço de Lawley-Hotelling Estatísticas teste Para todas elas, aproximações pela distribuição F são feitas para testar H 0 apresentada. Embora o lambda de Wilks seja bastante popular, nenhuma delas pode ser considerada como a melhor.

Maior raiz de Roy Aproximação pela F em que ν 1 = max(p, t 1), ν 2 = n t ν 1 1, λ 1 é o maior autovalor da matriz W 1 B. F = ν 2 ν 1 λ 1 d F (ν 1, ν 2 )

Exemplo 2 Descrição do experimento: Tratamento: 6 cultivares de alho 4 repetições Delineamento: inteiramente ao acaso Respostas: diâmetro, comprimento, peso médio do bulbo e área foliar. Há diferenças signicativas entre os vetores de tratamentos.

Dada uma para p variáveis resposta (Y 1, Y 2,..., Y p ), uma função discriminante ou variável, uma combinação linear das variáveis resposta da forma Z = a 1 Y 1 + a 2 Y 2 +... + a p Y p

Testes post-hoc via função discriminante Quando a variável retém grande parte da proporção, digamos 70 ou 80%, uma variância univariada pode ser realizada utilizando os valores dessa variável e o quadrado médio do resíduo para realizar testes.