Análise Discriminante

Documentos relacionados
Análise Multivariada Aplicada à Contabilidade

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada

ANÁLISE DISCRIMINANTE

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

Instituto Nacional de Pesquisas Espaciais - INPE. Divisão de Processamento de Imagens - DPI

ANÁLISE DISCRIMINANTE (MÓDULO I)

Correlação e Regressão

Técnicas Multivariadas em Saúde

ÍNDICE Janelas Menus Barras de ferramentas Barra de estado Caixas de diálogo

Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais. Eraylson Galdino

Disciplina de Modelos Lineares

Estatística de Teste: Decisão: p α Rejeita-se H 0. Hipóteses: Ǝ i,j σ 1 σ 2 i,j=1,,k. Estatística de Teste: Decisão: p >α Não se rejeita H 0

Seleção de Variáveis e Construindo o Modelo

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

MATRIZ DE REFERÊNCIA-Ensino Médio Componente Curricular: Matemática

Transformação de dados como alternativa a análise variância. univariada

Modelo de Regressão Múltipla

Multicolinariedade e Autocorrelação

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

Métodos Quantitativos Aplicados

Análise Multivariada Aplicada à Contabilidade

UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR

Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters

Disciplina de Modelos Lineares Professora Ariane Ferreira

Métodos Quantitativos Aplicados

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

Predição do preço médio anual do frango por intermédio de regressão linear

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Regressão linear simples

Mais Informações sobre Itens do Relatório

Estudo dirigido de Análise Multivariada

REGRESSÃO E CORRELAÇÃO

Análise de variância (ANOVA)

Contabilometria. Análise Discriminante

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

1. Iniciação ao IBM-SPSS 22

Análise Multivariada Aplicada à Contabilidade

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

ESCOLA SECUNDÁRIA FERREIRA DIAS, AGUALVA SINTRA

TESTE DE HIPÓTESE. Introdução

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Processamento de erros grosseiros - Identiمحcaچcﷺao

A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE:

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

2 Processo de Agrupamentos

Planejamento de Experimentos

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME:

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES

Análise de Regressão Linear Simples e

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013

CORRELAÇÃO E REGRESSÃO

ESTATÍSTICA EXPERIMENTAL. ANOVA. Aula 05

CONHECIMENTOS ESPECÍFICOS

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Aula 2 Uma breve revisão sobre modelos lineares

Aprendizado de Máquina (Machine Learning)

Peso (mg) Número de cigarros [760,780[ 3 [780,800[ 7 [800,820[ 19 [820,840[ 25 [840,860[ 17 [860,880[ 12 [880,900[ 8

Reconhecimento de Padrões. Reconhecimento de Padrões

Teste de Cochran (Homogeneidade de Variância)

Inferência para várias populações normais análise de variância (ANOVA)

Prof. Lorí Viali, Dr.

AGRUPAMENTO DE ESCOLAS DR. VIEIRA DE CARVALHO. Escola Básica e Secundária Dr. Vieira de Carvalho. Departamento de Matemática e Ciências Experimentais

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Análise de Correlação Canônica

Função prcomp. 1. Introdução

Transformações e Ponderação para corrigir violações do modelo

UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS

Análise de dados, tipos de amostras e análise multivariada

UNIVERSIDADE ESTADUAL DE CAMPINAS Instituto de Física Gleb Wataghin Grupo de Neurofísica. ANOVA e MANOVA

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

Função prcomp em R. 1. Introdução

ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais

Ajustamento de Observações

CORRELAÇÃO. Flávia F. Feitosa

Transcrição:

Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Análise Discriminante Análise Discriminante 1

Análise discriminante - A análise discriminante - Verificação de pressupostos - Determinação de funções discriminantes - Variáveis a considerar na análise - Determinação de funções de classificação - Classificação Análise Discriminante 2

Análise discriminante Método estatístico multivariado que se emprega para descobrir as características que distinguem os membros de um grupo dos de outro, de modo que, conhecidas as características de um novo indivíduo, se possa prever a que grupo pertence. Foi originalmente desenvolvida na botânica tendo por objectivo fazer a distinção de grupos de plantas com base no tamanho e no tipo de folhas o que tornaria possível, posteriormente classificar as novas espécies encontradas. Em 1936, Fisher foi o responsável pelo desenvolvimento da análise para dois grupos. Análise Discriminante 3

Passos da análise Início Verificação de Pressupostos Continua? S Determinação de funções discriminantes N Classifica? N S Geração de Funções de Classificação Fim Classificação Análise Discriminante 4

Verificação de pressupostos - Remoção de outliers - Testes de normalidade às variáveis - Homogeneidade das matrizes de variância-covariância - Existência de diferenças significativas entre os grupos Acção: Executar todos os testes de validade e interpretar Análise Discriminante 5

Remoção de outliers Uma análise discriminante é altamente sensível à presença de outliers ou valores extremos de variáveis que têm um largo impacto nas médias e também aumentam as variâncias podendo erroneamente resultar em significância estatística. Assim, os outliers devem ser identificados e removidos antes da análise. Análise Discriminante 6

Testes de normalidade às variáveis Assume-se que os dados representam uma distribuição normal multivariada. O exame da sua distribuição em termos gráficos através de histogramas permite visualizar se são ou não normalmente distribuídas. Todavia as violações de normalidade, neste particular, não são usualmente fatais o que significa que os testes de significância resultantes são fidedignos. Análise Discriminante 7

Homogeneidade das matrizes de variância-covariância Assume-se que as matrizes de variância/covariância são homogénas entre os grupos. Também neste caso, desvios menores são pouco importantes pelo que é possível uma decisão para prosseguir a análise apesar da violação do pressuposto. Análise Discriminante 8

Existência de diferenças significativas entre os grupos A estatística Λ de Wilks é uma medida inversa do grau de diferenciação entre os grupos: quanto menor o seu valor, maior esse grau de diferenciação Λ = W T = W B + W Determinante de W: medida da variabilidade dentro dos grupos. Determinante de T: medida da variabilidade total. Quanto maior for a semelhança entre os dois determinantes, menores serão as diferenças entre os grupos e mais o valor do Lambda de Wilks se aproximará de 1. Análise Discriminante 9

Determinação de funções discriminantes O número máximo de funções discriminantes é igual ao número de grupos menos um, ou ao número de variáveis discriminantes, sendo o critério de escolha baseado no menor destes dois valores. No caso de dois grupos, a função discriminante é uma função linear do tipo: Y = a + b 1 *x 1 + b 2 *x 2 +...+b m *x m onde a é uma constante e b 1..b m são um conjunto de coeficientes cujo valor representa o seu grau de contribuição para a predição do grupo a que pertence. Análise Discriminante 10

Determinação de funções discriminantes No caso de mais de dois grupos, pode ser estimada mais do que uma função discriminante como a anterior e o significado dos coeficientes é idêntico. No entanto, estes coeficientes não nos dizem entre que grupos as respectivas funções discriminam podendo tal interpretação ser obtida a partir de uma representação gráfica ou do exame das médias das funções entre grupos. Análise Discriminante 11

Variáveis a considerar numa análise Em muitos estudos, um investigador pode querer considerar todas as variáveis no modelo. No entanto, em muitas aplicações, um objectivo chave é identificar um subconjunto útil de variáveis para concretizar a predição. Alguns produtos, como o SPSS, fornecem métodos para construir um modelo de um modo passo a passo (stepwise discriminant analysis): fazendo entrar ou removendo em cada passo uma variável do modelo. Análise Discriminante 12

Método Stepwise O método começa por determinar a variável para a qual a média é mais diferente e continua, passo a passo, a juntar a próxima melhor variável. Reis (1997) apresenta várias estatísticas de apoio à determinação de variáveis a integrar ou remover do modelo, designadamente, o lambda de Wilks, a distância de Mahalanobis, o rácio do F mais pequeno, o V de Rao e a soma da variância não explicada. Análise Discriminante 13

Determinação de funções de classificação As funções de classificação podem ser utilizadas para determinar a que grupo cada caso pertence. Há tantas funções de classificação quantos os grupos. Cada função permite-nos calcular scores de classificação para cada caso em cada grupo aplicando a expressão: S i = c i +w i1 *x 1 + w i2 *x 2 +...+w im *x m onde i representa o grupo respectivo, 1,2,... m as variáveis, c i um valor constante para o gupo i, w ij o peso da variável j no cálculo do scores do grupo i, x j o valor observado do caso respectivo para a variável j. Análise Discriminante 14

Classificação Dispondo das funções de classificação associadas a cada grupo, todos os casos são relacionados com cada uma das funções de classificação. Considera-se que um caso determinado pertence ao grupo para o qual se encontrou o score mais elevado. É possível ter uma avaliação do rigor da predição através da elaboração de uma matriz de classificação onde se mostra para cada grupo o número de casos correctamente classificados e o número de casos mal classificados. Análise Discriminante 15