ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 6 Análise Discriminante

Documentos relacionados
Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

Discriminação e Classificação

Análise Discriminante

Reconhecimento de Padrões. Reconhecimento de Padrões

Exame de Aprendizagem Automática

ANÁLISE DISCRIMINANTE

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Bob Cuspe. Title goes here 1. Reconhecimento de Padrões. Análise de Discrimantes. Objetivos da Análise de Discriminantes. Análise de Discriminantes

CONHECIMENTOS ESPECÍFICOS

3 Modelos e metodologias comparadas

Testes de Hipóteses I

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Avaliação de Classificação

Apontamentos de Introdução às Probabilidades e à Estatística

Ralph S. Silva

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

Universidade Católica Portuguesa Faculdade de Ciências Económicas e Empresariais. ESTATÍSTICA MULTIVARIADA 2º. Semestre 2006/07

Departamento de Matemática - IST(TP)

7 Resultados e Discussão

Teste de hipóteses para proporção populacional p

Ralph S. Silva

TAMANHO AMOSTRAL. Lucas Santana da Cunha 31 de julho de Universidade Estadual de Londrina. Tamanho da Amostra

ESTUDO COMPARATIVO DOS ESCORES FATORIAIS E DE COMPONENTES PRINCIPAIS EM DADOS ARQUEOMÉTRICOS.

Testes de Hipóteses: Média e proporção

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

INSTITUTO SUPERIOR TÉCNICO LEFT LEBL LQ LEAM LEMAT Ano Lectivo: 2006/2007 Semestre: 2 o

5 Avaliação dos estimadores propostos

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2006

Rafael Izbicki 1 / 38

Inferência Estatística:

i. f Y (y, θ) = 1/θ... 0 y θ 0... y < 0 ou y > θ Se a amostra selecionada foi ( ), qual será a estimativa para θ?

Mario de Andrade Lira Junior

TESTES DE HIPÓTESES. Lucas Santana da Cunha Universidade Estadual de Londrina

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

Introdução. Amostragem, amostra aleatória simples, tabela de números aleatórios, erros

Introdução à Bioestatística Turma Nutrição

ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais

Instituto Universitário de Lisboa (ISCTE-IUL) Licenciaturas em Gestão e Finanças & Contabilidade. Estatística I - Exame de 1ª época

INSTITUTO SUPERIOR TÉCNICO Mestrado em Engenharia Electrotécnica e de Computadores Ano Lectivo: 2007/2008 Semestre: 2 o

CONHECIMENTOS ESPECÍFICOS

Estatística e Modelos Probabilísticos - COE241

p( y θ ) depende de um parâmetro desconhecido θ.

Capítulo 3. O Modelo de Regressão Linear Simples: Especificação e Estimação

ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais

Filtro de Kalman. Teoria e Aplicação para Iniciantes. Prof. Dr. Marco Antonio Leonel Caetano. M&V Consultoria e Treinamento

MATRIZ DA PROVA DE EXAME

Módulo 19 - Análise Discriminante Geração de Tabelas

CEFET/RJ. Aprendizado de Máquina - Trabalho 01

Princípios de Modelagem Matemática Aula 10

Exame de Aprendizagem Automática

3º Ano do Ensino Médio. Aula nº06

Lista de Exercícios #8 Assunto: Teste de Hipóteses

Previsão de Insolvência de Cooperativas Agropecuárias por Meio de Modelos Multivariados. Rev. FAE, Curitiba, v.4, n.3, p.65-78, set./dez.

LISTA DE TABELAS. xiv

Fundamentos de Inteligência Artificial [5COP099]

ESCOLA SUPERIOR DE TECNOLOGIA

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

Distribuições Amostrais e Estimação Pontual de Parâmetros

Seção 2.1. Distribuições de freqüência e seus gráficos

Optimização em Redes e Não Linear

Estatística Aplicada I

Análise de dados, tipos de amostras e análise multivariada

Análise de Aderência e de Associação

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais

Análise Multivariada Aplicada à Contabilidade

Estatística 1 - Lista de Exercícios 4-21/06/ Professor José Carlos Fogo

Distribuições Amostrais

ESCOLA SUPERIOR DE TECNOLOGIA

RECONHECIMENTO DE PADRÕES - RP

29 e 30 de julho de 2013

Estatística 1 - Lista de Exercícios 4 Professore José Carlos Fogo

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

SCC0173 Mineração de Dados Biológicos

4 Sistemas de Equações Lineares

CC-226 Aula 05 - Teoria da Decisão Bayesiana

Estatística II. Intervalo de Confiança Lista de Exercícios

Universidade da Beira Interior Departamento de Matemática

CONHECIMENTOS ESPECÍFICOS

TESTES DE HIPÓTESES. O procedimento básico de um teste de hipóteses pode ser decomposto em quatro fases: i) Definição das hipóteses.

Análise de Dados Longitudinais Aula

1 Introdução aos Métodos Estatísticos para Geografia 1

Carlos Antonio Filho

Exercícios. Finanças Benjamin M. Tabak

PERT PERT PERT PERT PERT PERT. O CPM assume que as estimativas de tempo para um projeto são certas (determinísticas);

ESCOLA SUPERIOR DE TECNOLOGIA

TESTE DE HIPÓTESE. Introdução

AULA 7 DISTRIBUIÇÕES CONTÍNUAS E MODELO NORMAL

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

Contabilometria. Análise Discriminante

SOCIEDADE CAMPINEIRA DE EDUCAÇÃO E INSTRUÇÃO PONTIFÍCIA UNIVERSIDADE CATÓLICA DE CAMPINAS Média de Qualidade de cada Aspecto por ano/semestre

MBA em Finanças e Controladoria. Disciplina: Avaliação de Empresas Valuation Tópico 06 Risco e Retorno

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

UFPE - Universidade Federal de Pernambuco Curso: Economia Disciplina: Estatística Econômica Professor: Waldemar Araújo de S. Cruz Oliveira Júnior

Prof. Daniela Barreiro Claro

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

Estatística e Probabilidade

INVESTIGAÇÃO OPERACIONAL. Programação Linear. Exercícios. Cap. IV Modelo Dual

Inferência Estatística:

3 a. FASE DO CONCURSO VESTIBULAR DO BACHARELADO EM ESTATÍSTICA 1 a. PROVA DA DISCIPLINA: CE065 ELEMENTOS BÁSICOS PARA ESTATÍSTICA CANDIDATO:

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Transcrição:

ESTTÍSTIC MULTIVRID 2º SEMESTRE 2010 / 11 EXERCÍCIOS PRÁTICOS - CDERNO 6 nálise Discriminante

6. NÁLISE DISCRIMINNTE 6.1. Considere uma variável X com distribuição normal univariada com variância. Se X for da população a sua média é 10. Se X for da população a sua média é 1. ssuma que são iguais as probabilidades a priori para os acontecimentos = "X pertence a " e = "X pertence a ". Vai construir uma regra de classificação para X por forma que se X m o considera pertencente à população e pertencente à população se for X > m. Designando por R e R estes dois resultados da sua regra de classificação, construa uma tabela em que para diferentes valores de m calcula as probabilidades de uma má classificação, P(R ), P(R ), P(R ), P(R ), P(Erro) e ECM (Custo esperado de má classificação). Será uma tabela do tipo: m P(R ) P(R ) P(R ) P(R ) P(Erro) ECM 10 1 a) Na hipótese de serem iguais os custos de má classificação de X, c ( ) e c ( ), por exemplo iguais a 10. Esperava este resultado? b) Na hipótese de serem iguais as probabilidades a priori de pertença a uma das populações, mas de ser superior o custo de classificar um elemento de como sendo de, por exemplo assumindo c ( ) = 15 e c ( ) = 5. Esperava este resultado? c) E se forem iguais os custos dos dois tipos de erro mas for P() = 0.25 e P() = 0.75? 16-05-11 6.2

6.2 dmita 2 grupos de objectos para os quais se recolheram observações para as variáveis X 1 e X 2 : Grupo : 3 2 7 7 Grupo : 6 2 9 7 8 a) Represente graficamente estes objectos e procure estabelecer, também graficamente, uma função discriminante linear. b) Calcule a função discriminante linear que minimiza o valor esperado do erro de uma má classificação no pressuposto de que os custos de erros de uma má classificação são iguais e de as probabilidades a priori de um objecto de pertencer a um dos grupos são iguais. c) E se o custo de classificar um objecto como sendo do grupo quando ele é do grupo for o dobro do de classificar um objecto como sendo do grupo quando ele é do grupo? d) E se a probabilidade de um objecto ser do grupo for o triplo da probabilidade de um objecto ser do grupo? e) Classifique o objecto [ 2 7 ] na hipótese de b). 6.3. Considere que numa recolha de 23 observações das variáveis X 1 e X 2 para outros tantos indivíduos que manifestam (o que aconteceu em 12 casos), ou não o atributo. Numa tentativa de usar estas duas variáveis como discriminantes, calcularam-se as médias amostrais para cada um dos grupos e a variabilidade (para o conjunto dos dois grupos), obtendo-se: 2 1 1 1.8 S 1.1 1.1 7.3 a) Teste a possibilidade dos dois grupos terem diferentes vectores de médias usando o T 2 de Hotteling (com =0.05). b) Construa a função discriminante linear de Fisher e repita o teste com os valores médios (para cada grupo) desta função. c) Qual a sua previsão quanto à possibilidade do indivíduo [ 0 1 ] ter ou não o atributo? 16-05-11 6.3

6.. Recolheram-se 3 observações para as variáveis X 1 e X 2 de indivíduos que se considerou pertencerem ao grupo e outras tantas e das mesmas variáveis de indivíduos do grupo : Indivíduos que mostraram ser do grupo : 2 3 12 10 8 3 10 ˆ 1 1 1 Indivíduos que mostraram ser do grupo : 5 3 7 9 5 X 7 ˆ 1 1 1 a) Calcule a função discriminante linear de Fisher para a informação disponível, teste a hipótese de igualdade de médias dos dois grupos e calcule a taxa aparente de erro (PER). b) Qual a sua estimativa para a taxa efectiva de erro (ER) com base no método de "holdout" de Lachenbruch? Compare com a PER. 6.5. Suponha as populações e caracterizadas por distribuições normais multivariadas com: População : 10 15 18 12 12 32 População : 10 25 20 7 7 5 ssuma que as probabilidades a priori para cada uma das populações são iguais e que quer discriminar por forma a minimizar a probabilidade total de erro (TPM). a) Calcule a função discriminante e o respectivo valor para os pontos [10, 15], [12, 17],, [30, 35]. dmita agora que conhece os custos associados aos erros de classificação que são c ( ) = 73.89 e c ( ) = 10 pelo que o seu objectivo passa a ser a minimização do valor esperado do custo de erro. b) Reveja os cálculos da questão a). c) Represente, num gráfico para X 1 e X 2, as médias de cada uma das populações, as regiões R e R e os 11 pontos classificados. 16-05-11 6.

X2 (GMT) 6.6. O responsável pelas admissões a um programa de M de uma usiness School americana quer construir um índice a partir da nota média de graduação (GP - Graduate grade point average) e da nota obtida pelo candidato no GMT (Graduate management aptitude test) com o objectivo de o ajudar decidir da admissão de cada candidato. Dos 85 candidatos deste ano, 31 foram admitidos (grupo ), 28 foram rejeitados (grupo ) e os restantes 26 aguardam uma decisão (grupo C). Designando por X 1 a GP e por X 2 a nota do GMT, obtiveram-se as seguintes estimativas: 3.0 561.23 X 2.8 7.07 X C 2.99 6.23 e.0361 S 2.0188 2.0188 3655.9011 ssuma que as probabilidades a priori e as matrizes de variâncias covariâncias para cada um dos grupos são iguais e ainda que são iguais os custos dos erros de classificação. a) Calcule as variáveis discriminantes que lhe permitem classificar um candidato num dos três grupos e utilize-as para classificar um candidato com as notas X 0 ' = [3.21 97]. b) partir dos resultados anteriores divida o quadrante X 1, X 2 em três regiões consoante as decisões de afectação de um indivíduo a cada grupo e coloque nele X 0 '. 700 600 500 00 GRUPO guarda decisão Não admitido 300 2.0 2.5 3.0 3.5.0 dmitido X1 (GP) 16-05-11 6.5