ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais

Documentos relacionados
ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais

Mapeamento de solos TÓPICOS ESPECIAIS: ANÁLISE ESTATÍSTICA DE DADOS AMBIENTAIS MULTIVARIADOS MODELAGEM DE FENÔMENOS NATURAIS

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

Porque análise de dados?

GAAL - Terceira Prova - 15/junho/2013. Questão 1: Analise se a afirmação abaixo é falsa ou verdadeira:

Formas Quádricas Cônicas hlcs

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada

Estatística Aplicada à Administração II. Tópico. Análise de Componentes Principais

29 e 30 de julho de 2013

. (1) Se S é o espaço vetorial gerado pelos vetores 1 e,0,1

Econometria II. Notas de bolso! Propriedades da E(.), Var(.) e Cov(.) Temos que (a,b) são constantes e (X,Y) são variáveis aleatórias.

5. Seja A uma matriz qualquer. Assinale a afirmativa

Introdução a Regressão Linear

Introdução a Regressão Linear

Forma Canônica de Matrizes 2 2

Introdução. São duas técnicas estreitamente relacionadas, que visa estimar uma relação que possa existir entre duas variáveis na população.

CC-226 Aula 05 - Teoria da Decisão Bayesiana

4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)

Lista de Álgebra Linear Aplicada

Matrizes e Linearidade

Estatística Aplicada à Administração II

TIPO DE PROVA: A. Questão 1. Questão 4. Questão 2. Questão 5. Questão 3. alternativa D. alternativa D. alternativa D. alternativa B.

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

Análise Multivariada Aplicada à Contabilidade

Parte 3 - Produto Interno e Diagonalização

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

Sensoriamento Remoto II

Lista de Exercícios 05 Álgebra Matricial

5. Seja R : R 3 R 3 uma rotação em torno do eixo gerado por (0, 0, 1). Suponha que R mande o vetor

Planejamento e Otimização de Experimentos Ajuste de Modelos de Regressão e Outros Planejamentos

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

2 Processo de Agrupamentos

Exemplo 1: Variáveis padronizadas Z t = ( Z 1 (1), Z 2 (1), Z 1 (2), Z 2 Z 1 (1) Z (1) = Z (2) = Z 2. Matriz de correlações:

Multicolinariedade e Autocorrelação

Matemática I Tecnólogo em Construção de Edifícios e Tecnólogo em Refrigeração e Climatização

(d) p(λ) = λ(λ + 1) (b) 4 (c) 1 (d) Seja A uma matriz n n. Assinale a alternativa FALSA:

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

IGUALDADES EM IR IDENTIDADES NOTÁVEIS

Técnicas Multivariadas em Saúde

Assine e coloque seu número de inscrição no quadro abaixo. Preencha, com traços firmes, o espaço reservado a cada opção na folha de resposta.

GAN00140-Álg. Linear GAN00007 Int à Alg. Linear Aula 3 2ª. Parte: Matrizes e Operações Matriciais

Aula 7 - Revisão de Álgebra Matricial

2. Sendo f(x) = x 4 e g(x) = 4 x calcule:

Reconhecimento de Padrões. Reconhecimento de Padrões

Problemas de Otimização

Aula 5 - Produto Vetorial

Soluções do Nível 3 (Ensino Médio) 1 a Fase

3 a. FASE DO CONCURSO VESTIBULAR DO BACHARELADO EM ESTATÍSTICA 1 a. PROVA DA DISCIPLINA: CE065 ELEMENTOS BÁSICOS PARA ESTATÍSTICA CANDIDATO:

Análise Discriminante

Ao iniciar o programa winmat, abre-se a janela:

UFRJ - Instituto de Matemática

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

4. Tensores cartesianos em 3D simétricos

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Análise Multivariada Aplicada à Contabilidade

Teorema da Triangularização de Schur e Diagonalização de Matrizes Normais

Medidas de Semelhança

INFERÊNCIA EM MODELOS LINEARES GENERALIZADOS ANÁLISE DE DEVIANCE

Análise multivariada

Elementos de Matemática Avançada

G3 de Álgebra Linear I

Análise Multivariada Aplicada à Contabilidade

1.2 Distribuição normal

. Repare que ao multiplicar os vetores (-1,1) e

Geometria Analítica e Álgebra Linear

Matemática A Extensivo V. 3

Análise de Regressão Linear Simples e

Matemática A Intensivo V. 1

Revisão: Matrizes e Sistemas lineares. Parte 01

MÉTODOS DE CALIBRAÇÃO

gráfico de y ax bx c, então, a + b + c vale a) 6 b) 6 c) 0 d) 5 e) 5 d) e) y ax bx c, os valores de a, b e c são

LTDA APES PROF. RANILDO LOPES SITE:

Nome: N.º: Endereço: Data: Telefone: PARA QUEM CURSA O 9 Ọ ANO DO ENSINO FUNDAMENTAL EM Disciplina: MATEMÁTICA

Cap. 13 Correlação e Regressão

Prova Escrita de MATEMÁTICA A - 12o Ano Época especial

SOLICITAÇÕES COMBINADAS (FLEXÃO COMPOSTA)

G3 de Álgebra Linear I

- identificar operadores ortogonais e unitários e conhecer as suas propriedades;

ANÁLISE DISCRIMINANTE

Material Teórico - Módulo Função Quadrática. Funcão Quadrática: Exercícios. Primeiro Ano do Ensino Médio

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações

a) x 2-2x = 0 c) 3x 2 - x = 0 e) -x 2 + 4x = 0 g) 4x 2-5x = 0 a) x 2-4 = 0 4x 2 = 64 x 2 = 64:4 x 2 = 16 x = ± 16 x = ± 4 V = {± 4}

P4 de Álgebra Linear I de junho de 2005 Gabarito

Universidade Federal de Santa Catarina Centro de Ciências Físicas e Matemáticas Departamento de Matemática. MTM Pré-cálculo

Ralph S. Silva

Sinais e Sistemas Aula 1 - Revisão

Matrizes hermitianas e unitárias

QUESTÕES ANPEC CÁLCULO A VÁRIAS VARIÁVEIS. 5. Em cada opção assinale se falsa ou verdadeira:

G4 de Álgebra Linear I

3 de um dia correspondem a é

Estudo dirigido de Análise Multivariada

a) 4x 10 = 0, onde x é a incógnita e 4 é 10 são os coeficientes. b) x + 3 = 4x + 8

INTRODUÇÃO AO PROCESSAMENTO DIGITAL DE IMAGENS SENSORIAMENTO REMOTO

UNIVERSIDADE FEDERAL DE MINAS GERAIS FACULDADE DE FILOSOFIA E CIÊNCIAS HUMANAS DEPARTAMENTO DE CIÊNCIA POLÍTICA CURSO DE GESTÃO PÚBLICA

Transcrição:

Análise de agrupamentos e Análise das componentes principais Ambas as análises são técnicas de redução de dados. ANÁLISE DISCRIMINANTE Objetivo da análise de agrupamentos é formar grupos, reduzindo o número original de elementos a poucos grupos. Objetivo da análise das componentes principais é reduzir o número original de variáveis. Ambas as análises fornecem os mesmos resultados. 1 Análise discriminante Na análise discriminante os grupos ja são conhecidos à priori. Supõe-se que as observações estão corretamente classificadas Função discriminante Objetivo: Verificar se os grupos estão discriminados Classificar observações desconhecidas Verificar quais variáveis são as mais importantes para a discriminação entre os grupos. 3 Região de recobrimento 4 Limites lineares Análise Discriminante Linear Decidir à qual de dois grupos pertenceriam indivíduos Substituir o conjunto original das mensurações por um único valor Di, definido como uma combinação linear Razão mínima entre a diferença entre pares de médias multivariadas e variância multivariada dentro dos dois grupos. Para a aplicação de testes de significância: observações em cada grupo escolhidas ao acaso; probabilidade de um indivíduo desconhecido pertencer a um dos grupos ser a mesma; variáveis com distribuição normal; matrizes de variância dos grupos de mesmo tamanho; observações usadas para o cálculo das funções discriminantes classificadas sem erro. 5 Quando matrizes de variâncias e covariâncias são diferentes escolher função discriminante quadrática. 6 1

7 8 D i = 1 1 + + 3 3 +... p p cálculo das funções discriminantes lineares por regressão linear, onde a variável dependente consiste no vetor de diferenças entre as médias multivariadas de dois grupos e as variáveis independentes matriz de variâncias covariâncias das variáveis em estudo A solução do sistema de equações lineares resultante pode ser resolvido, por cálculo matricial, a partir de: [p]=[vp ]-1 [Rp] Para o cálculo dos coeficientes p, que irão constituir a equação da função discriminante, determina-se o inverso da matriz da variâncias e covariâncias combinadas e em seguida multiplica essa matriz pelo vetor de diferenças entre médias: 9 O valor central do grupo A é determinado por D A = A A1 + A + A3 +... A Ap e do grupo B por D B = B B1 + B B + B B3 +... B Bp O índice discriminante,, ou seja, o ponto na linha descrita pela função discriminante situado eatamente na metade da distância entre os centros dos grupos A e B, é encontrado segundo: D λ ( 0 1 A1 B1 ) λ ( A B )...λ ( p Ap Bp ) 10 Para testar a significância da função encontrada, ou seja, verificar se os dois grupos considerados pertencem a uma única população ou à duas distintas populações, calcula-se a distância entre as duas médias multivariadas. Esta medida de distância é conhecida como distância generalizada de Mehalanobis, ou D², e mede a separação entre as duas médias multivariadas epressa em unidades de variâncias combinadas. D = D A -D B D² é usada na seguinte epressão para ser testada pela distribuição F: (com "p" graus de liberdade para o numerador e " " para o denominador) A contribuição relativa, em percentagem, de cada variável para o distanciamento entre os dois grupos é fornecida pela epressão: C p =[(prp)/d ]*100 na nb p 1 nanb F* D (na nb )p nan B A hipótese nula a ser testada, estabelece que as duas médias multivariadas são iguais, ou que a distância entre ambos os grupos é igual a zero significando que se trata de um único grupo. Cp mede apenas a contribuição direta da variável, sem levar em consideração o seu inter-relacionamento com as demais eistentes. 11 1

Funções discriminantes multigrupos Discriminar entre mais de dois grupos Análise de variância da matriz inicial parcializada em categorias ou grupos Soma de quadrados entre grupos [E] mais a soma de quadrados dentro dos grupos [D] é igual à soma total de quadrados [T]: [T] = [E] + [D] Razão [E]/[D] com alto valor: médias dos grupos bem diferentes entre si e os valores dentro de cada grupo bem concentrados ao redor dos respectivos centroides Encontrar um conjunto de pesos lineares para as variáveis que tornem essa razão máima Distâncias dentro dos grupos são minimizadas Distâncias entre grupos são maimizadas 13 14 Se o conjunto de pesos for o vetor [A1], a análise discriminante pode ser efetuada ao encontrar os valores dos elementos de [A1] de modo que a epressão {[A1] [E] [A1]}/{[A1] [D] [A1]}, seja maimiza Restrição para denominador igual a 1: [A1] [D] [A1] = 1 Razão maimizada quando [A1] for o autovetor correspondente ao maior autovalor de [D]-1 [E] Encontrar,como na análise fatorial, eios ortogonais [A], [A3], etc., funções discriminantes em sucessão decrescente 15 Observações projetadas no espaço definido pelos eios discriminantes: [Z] = [A] [X], onde [X] é a matriz inicial de dados [N p] e [A] a matriz [p t] cujas colunas t são os maiores autovetores a serem usados nas funções discriminantes. Os centroides dos g grupos podem ser projetados no espaço discriminante por [Zmk] = [A1] [Xmk], onde [Xmk] contem as médias de todas as variáveis para cada grupo. Escolher as duas funções discriminantes de maior peso para servir como eios ortogonais para uma distribuição das observações dos diversos grupos e os respectivos centróides. Uma observação multidimensional de origem desconhecida pode ser projetada nesse diagrama pela sua multiplicação 16 pelo transposto de [A] e verificada sua distância aos diversos centróides Eemplo de análise discriminante entre dois grupos Eemplo de análise discriminante entre dois grupos P:Zona mineralizada E: Zona estéril X:? 17 18 3

Análise discriminante multigrupos. O petróleo tanto pode ter origem em carbonatos (C) e folhelhos (F) de origem marinha, como em ambientes deltaicos (D) e para eplicar a sua gênese são utilizadas diversas variáveis em conjunto. 19 São fornecidos dados referentes a 63 amostras de petróleo, nas quais foram obtidas as seguintes variáveis: API = densidade em unidades API S= porcentágem de enofre Pr/Ph= razão pristâneo/fitâneo S/A= razão entre hidrocarbonetos saturados e aromáticos PCIR= razão isotópica de carbono(1c/13c) no petroleo GCIR= razão isotópica de carbono na fração gasolina G-R= diferença entre as razoes isotópicas na fração gasolina e no resíduo 0 Aplicando, inicialmente, análise de agrupamentos (modelo Q, método Ward, distância euclidiana e variáveis não padronizadas) verificar se esse conjunto de amostras pode ser subdividido em grupos e se esses grupos estão de acordo com os ambientes C, F e D. 1 Aplicando a análise de agrupamentos (modelo Q, método Ward, distância euclidiana e variáveis padronizadas) verificar se esse conjunto de amostras pode ser subdividido em grupos e se esses grupos estão de acordo com os ambientes C, F e D. 3 4 4

Variáveis padronizadas: (i ) zi s 5 6 Com a padronização das variáveis os três grupos encontrados agrupam amostras segundo os ambientes carbonatos (C), folhelhos (F) e deltaicos (D). Em seguida, aplicando análise discriminante, verificar se os grupos encontrados estão significativamente separados, segundo ambientes de deposição, e quais as variáveis mais importantes para essa discriminação. 7 8 Para verificar a relação entre amostras e variáveis e, portanto, a influência das variáveis na discriminação entre grupos sobrepor os gráficos 9 30 5

Análise de Componentes Principais Análise Discriminante: XLStat Medidas cranianas foram obtidas em 7 espécies fósseis de oreodontes (mamífero do Eoceno-Oligoceno dos Estados Unidos da América). As afinidades taonômicas entre essas espécies estão no gráfico abaio: 31 Subdesmatochoerus sp. (Su), Megoreodon gigas loomisi (Me), O. osborni (Oo), Psuedodesmatochoerus (Ps), Desmatochoerus hatcheri (De), M. culbertsoni (Mc) e Prodesmatochoerus. meeki (Pr). 3 33 34 BC-W: largura da caia craniana na altura da região parietal-escamosal TR-L: comprimento máimo dos dentes molariformes Bu-L: comprimento máimo da bulla timpânica Bu-HP: comprimento máimo da bulla timpânica medida do bordo dorsal até o processo paroipital. Espécie BC-W TR-L Bu-L Bu-HP Su 47.0 99.0 6.0 15.0 Su 4.0 93.0 6.0 16.0 Su 40.0 90.0.0 13.0 Su 46.0 100.0.0 11.0 Su 46.0 96.0 4.0 16.0 Su 4.0 88.0 6.0 15.0 Su 43.0 89.0 3.0 14.0 Su 44.0 78.0 3.0 13.0 Su 44.0 90.0 5.0 11.0 Su 47.0 99.0 7.0 15.0 Su 47.0 9.0 7.0 13.0 Me 78.0 165.0 35.0 18.0 Me 77.0 165.0 37.0 19.0 35 36 6

37 38 4 grupos indicados pela Análise Discriminante: 1: Prodesmatochoerus meeki + Merychoidodon culbertsoni + O. osborni : Subdesmatochoerus sp 3: Desmatochoerus hatcheri + Psuedodesmatochoerus 4: Megoreodon gigas loomisi 39 40 7