Análise Multivariada

Documentos relacionados
NOTAS DE AULA DA DISCIPLINA CE076 = 2. ], T 2 = conhecido como T 2 de Hotelling

CAP. V AJUSTE DE CURVAS PELO MÉTODO DOS MÍNIMOS QUADRADOS

CAP. V AJUSTE DE CURVAS PELO MÉTODO DOS MÍNIMOS QUADRADOS

Revisão de Estatística X = X n

ESTATÍSTICA MÓDULO 3 MEDIDAS DE TENDÊNCIA CENTRAL

8. DISCRIMINAÇÃO, CLASSIFICAÇÃO E RECONHECIMENTO DE PADRÕES:

Regressão Simples. Parte III: Coeficiente de determinação, regressão na origem e método de máxima verossimilhança

MAE 5776 ANÁLISE MULTIVARIADA. Júlia M Pavan Soler

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

4- Método de Diferenças Finitas Aplicado às Equações Diferenciais Parciais.

Distribuições Amostrais. Estatística. 8 - Distribuições Amostrais UNESP FEG DPD

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

NOTAS DE AULA DA DISCIPLINA CE076. ], T 2 = conhecido como T 2 de Hotelling

1- Qual a diferença entre amostragem probabilística e não-probabilística? Qual é a mais recomendada?

Avaliação da qualidade do ajuste

MAE0229 Introdução à Probabilidade e Estatística II

Hidrologia, Ambiente e Recursos Hídricos 2009 / Rodrigo Proença de Oliveira

CÁLCULO DE RAÍZES DE EQUAÇÕES NÃO LINEARES

Distribuições de Probabilidades

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Estimação Pontual

Cap. 5. Testes de Hipóteses

Técnicas Não Paramétricas

Capítulo 5: Ajuste de curvas pelo método dos mínimos quadrados

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou. experimental.

6. Inferência para Duas Populações USP-ICMC-SME 2013

Estatística - exestatmeddisper.doc 25/02/09

7 Análise de covariância (ANCOVA)

Econometria: 3 - Regressão Múltipla

Teoria das Comunicações

Macroeconometria Aula 3 Revisão de estatística e teste de hipótese

Relatório 2ª Atividade Formativa UC ECS

ESTATÍSTICA MÓDULO 2 OS RAMOS DA ESTATÍSTICA

Modelo de Regressão Simples

Confiabilidade Estrutural

Métodos tipo quadratura de Gauss

Inferência Estatística e Aplicações I. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

Análise de Correspondência

DISTRIBUIÇÃO HIPERGEOMÉTRICA

Estudo das relações entre peso e altura de estudantes de estatística através da análise de regressão simples.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Tópicos Extras 2ª parte. Análise de Correlação e Regressão

Cálculo Numérico. Ajuste de Curvas Método dos Mínimos Quadrados. Profa. Vanessa Rolnik 1º semestre 2015

MEDIDAS DE DISPERSÃO:

? Isso é, d i= ( x i. . Percebeu que

Tabela 1 Números de acidentes /mês no Cruzamento X em CG/07. N de acidentes / mês fi f

Interpolação. Exemplo de Interpolação Linear. Exemplo de Interpolação Polinomial de grau superior a 1.

NOTAS DE AULA DA DISCIPLINA CE076

NOTA BREVE SOBRE O CONCEITO DE MÉDIA 1

tica ou tica como Rui Vilela Mendes CMAF, ICC, CFN dos TPC s

MÓDULO 8 REVISÃO REVISÃO MÓDULO 1

1 (0,8 ln0,8+0,2 ln0,2) 0,512 0,512 0, , , , , , , , , ,

Professor Mauricio Lutz REGRESSÃO LINEAR SIMPLES. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: ö ; ø.

Estatística. 2 - Estatística Descritiva

ESTATÍSTICA Aula 7. Prof. Dr. Marco Antonio Leonel Caetano

ANÁLISE DE ERROS. Todas as medidas das grandezas físicas deverão estar sempre acompanhadas da sua dimensão (unidades)! ERROS

50 Logo, Número de erros de impressão

x n = n ESTATÍSTICA STICA DESCRITIVA Conjunto de dados: Organização; Amostra ou Resumo; Apresentação. População

Estudo do intervalo de confiança da regressão inversa utilizando o software R

Conceitos básicos de metrologia. Prof. Dr. Evandro Leonardo Silva Teixeira Faculdade UnB Gama

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Regressao Simples. Parte I: Introdução

NOTAS DE AULA DA DISCIPLINA CE DENSIDADE NORMAL MULTIVARIADA E SUAS PROPRIEDADES

Dados Experimentais. Isto é chamado de experimento controlado. Uma das vantagens

Reconhecimento de Padrões. Reconhecimento de Padrões

Departamento de Informática. Modelagem Analítica do Desempenho de Sistemas de Computação. Modelagem Analítica. Disciplina:

Nas Instituições de Ensino Superior(IES), há uma relação direta entre a qualidade do ensino e a taxa de inadimplência. A taxa de inadimplência das

CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE PPGEP Medidas de Tendência Central Média Aritmética para Dados Agrupados

Econometria: 4 - Regressão Múltipla em Notação Matricial

O delineamento amostral determina os processos de seleção e de inferência do valor da amostra para o valor populacional.

Probabilidades e Estatística LEE, LEIC-A, LEIC-T, LEMat, LERC, MEBiol, MEBiom, MEEC, MEFT, MEMec, MEQ

Faculdade de Tecnologia de Catanduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL

6.1 - PROCEDIMENTO DE AVALIAÇÃO DE INCERTEZA EM MEDIÇÕES DIRETAS

3. TESTES DE QUALIDADE DE AJUSTAMENTO

Probabilidades e Estatística LEGM, LEIC-A, LEIC-T, MA, MEMec

Atividades Práticas Supervisionadas (APS)

Probabilidades e Estatística

CAPÍTULO 5. Ajuste de curvas pelo Método dos Mínimos Quadrados

Capítulo 9 Problema 01 Problema 03 Problema 04

Média. Mediana. Ponto Médio. Moda. Itabira MEDIDAS DE CENTRO. Prof. Msc. Emerson José de Paiva 1 BAC011 - ESTATÍSTICA. BAC Estatística

NOTAS DE AULA DA DISCIPLINA CE076

Estatística Descritiva

Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Probabilidade de Óbito por Leptospirose Humana em Belém - PA

Probabilidades e Estatística LEAN, LEGI, LEGM, LMAC, MEAer, MEAmbi, MEC

3 Experimento com Mistura com Respostas Não-Normais

Testes de Hipótese Multivariados para Matrizes de Covariâncias em Processos Autocorrelacionados com Aplicações em Controle de Qualidade

ANÁLISE DE REGRESSÃO E CORRELAÇÃO

ESCOLA SUPERIOR DE TECNOLOGIA UNIVERSIDADE DO ALGARVE

Teoria Elementar da Probabilidade. a) Cada experiência poderá ser repetida indefinidamente sob condições essencialmente inalteradas.

HIDROLOGIA E RECURSOS HÍDRICOS. Análise estatística aplicada à hidrologia

CAPÍTULO 7 INTERVALO DE CONFIANÇA E TESTES DE HIPÓTESES

( ) ( IV ) n ( ) Escolha a alternativa correta: A. III, II, I, IV. B. II, III, I, IV. C. IV, III, I, II. D. IV, II, I, III. E. Nenhuma das anteriores.

MEDIDAS DE POSIÇÃO: X = soma dos valores observados. Onde: i 72 X = 12

Análise da Informação Económica e Empresarial

Estatística Descritiva. Medidas estatísticas: Localização, Dispersão

ESTATÍSTICA APLICADA À ZOOTECNIA

Estatística Descritiva

ESTATÍSTICA Exame Final 1ª Época 3 de Junho de 2002 às 14 horas Duração : 3 horas

Controle Estatístico de Qualidade. Capítulo 6 (montgomery)

Transcrição:

Aálse Multvarada Aula 6: Aálse Dscrmate AD Prof. Admr Atoo Betarell Juor Juz de Fora

Aálse Dscrmate Essa técca comara as dfereças searação etre os ruos e classfca o ovo objeto como ertecete ao ruo com erfl mas semelhate. Ao cotráro da AA essa técca é recso cohecer revamete os ruos ara obter uma fução dscrmate usada ara alocar os ovos objetos. Basea-se de uma varável cateórca como deedete omal ou ão métrca e de múltlas varáves métrcas como deedetes ara a dstrbução dos ruos. A varável deedete ode ter mas de cateoras.

Aálse Dscrmate Eemlo: uma fábrca de cortador de ramas está teressa em detfcar as ersectvas das suas vedas avalado aos redmetos e do tamaho do lote das famílas roretáras ou ão desta máqua.

Objetvos eras Determar se estem dfereças estatstcamete sfcatvas etre os dos ou mas ruos já defdos. Idetfcar a mortâca relatva de cada var. deedete a revsão de art. em um ruo. Estabelecer o e comosção das dmesões de dscrmação etre os ruos formados a artr do cojuto de varáves deedetes. Ou seja quado há mas de dos ruos você deve eamar e omear cada fução dscrmate sfcatva. Desevolver rocedmetos ara classfcar objetos em ruos e em seuda eamar a acuráca redtva da fução dscrmate ara ver se a mesma é acetável.

Quado usar? Quado a reocuação rcal é elorar as dfereças de ruos dsttos de observações que foram revamete defdos ara em seuda ermtr a classfcação mas rovável de ovas observações em um dos ruos.

Rera de classfcação É ecessáro costrur uma rera matemátca ou de classfcação ara decdr qual é ruo mas rovável que o ovo objeto ertecerá. Fudameta-se a robabldade de ertecer a um dos ruos que mmze o custo de classfcação correta.e. o erro em afrmar que um objeto ertece um ruo quado a verdade ertece a outro.

Rera de classfcação Sejam e f f as fuções de desdade assocadas ao vetor X ara as oulações e. O esaço amostral R é o cojuto de valores ara a qual se classfca os objetos ertecetes ao ruo ao asso que ao ruo. R Assume-se que é a robabldade a ror de e _ é a de em que.

Rera de classfcação As robabldades lobas de classfcação correta e correta dos objetos são: : Icorretamete classfcadocomo : Corretamete classfcado como : Icorretamete classfcadocomo : Corretamete classfcado como P P R X P P P R X P P P R X P P P R X P

Rera de classfcação Os custos de classfcações corretas estão a matrz: Classfca como: Poulação verdadera: 0 C C Assm o custo médo de classfcação correta ECM é: ECM C P C P Uma rera razoável de classfcação tera um ECM tão equeo quato ossível.

Rera de classfcação As reões que mmzam ECM são defdas or valores ara qual matem-se as seutes desualdades: R : f f C C R : f f C C a razão da fução desdade avalada em uma ova observação ; 0 a razão dos custos; e a razão de robabldade a ror. Usa-se arbtraramete ara classfcação: C / C / É ossível orar os custos e escolher as reões mmzam o total de robabldade de erro de classfcação TPM: TPM que é equvalete a mmzar ECM quado os custos são uas. R f d f d R

Classfcação de oulações ormas Assume-se que e sedo ara as oulações com um vetor de observações fo tem-se: Sedo e são cohecdos alca-se a RV: ~ N f ~ N f ] [ X X X X ] [. e f e e e f f

Classfcação de oulações ormas Assm as reões que mmzam ECM são: Tomado o loartmo atural: e : e : C C R C C R l l ] l[

Classfcação de oulações ormas Se a fução dscrmate será quadrátca. Se tem-se fução dscrmate de Fsher 936: em que : ] l[ a a a m a a a m

Classfcação de oulações ormas Cosequetemete: R R : a : a C m l[ ] 0 l C C m l[ ] 0 l C mas rómo de mas rómo de que que. é m / a uma costate que delmta a reão de classfcação e é combação lear das médas. ara a terretação recomeda-se a adrozação:. a* a a' a

Classfcação de oulações ormas Na rátca e são descohecdos e ortato cosderam-se e a fd: S S l l ] l[ S S S S 0. ] l[ : e 0 ] l[ : Loo: e que : tal ; em que : ] l[ a S a S S a S S S S S S S S a m y R m y R y y y y m y m

Classfcação de oulações ormas Ou melhor a rera de ECM mímo estmada ara duas oulações ormas leva em cota uma arorada combação lear ara as observações de ambas as oulações e etão classfca uma ova observação deededo se y 0 a 0 ca ara a dreta ou ara esquerda do oto médo etre as médas y e y. m

Classfcação de oulações ormas

Classfcação de oulações ormas Eemlo.3. 593 que dfereca as mulheres etre dos ruos de oulações: ruo ormal mulheres que ão carream um ee hemofílco A; ruo ortadores obratóros - mulheres e mães que carream o fator hemofílco A.

Classfcação de oulações ormas Cosequetemete : y 37.6 Além dsso y y O oto médo etre essas duas médas é : m 0.0065.0390 y S 8.9 y S S a a a 0.48 0.483.06 37.6 37.6 0.88 0.0 4.6 S 3.58.065 90.43 0.0065 8.9.0390 0.483 8.9.06 3.58 90.43 90.43 08.47 0.88 0.0 90.43 08.47

Classfcação de oulações ormas Assm : R R : se :se y m y m 4.6; 4.6; 0 0 será alocado oruo ormal será alocado o ruo de ortadora obratóra Se 0.0.044 y a 37.6 8.9 0.0.044 Portato classfca - se a mulher o ruo de ortadora obratóra. 0 6.6 4.6 y D 0.98 S S a 37.6 8.9 0.48 3.58.065 90.43 90.43 0.48 08.47.065

Classfcação de oulações ormas Observa-se que a mesma fca detro de uma estmada robabldade de cotoro de 0.50 do ruo e 0.95 do ruo.

Classfcação de oulações ormas A searação sfcatva ão mlca ecessaramete uma boa classfcação. A efcáca de um rocesso de classfcação ode ser avalada de forma deedete de qualquer teste de searação. Por outro lado se a searação é ão sfcatva a busca or uma rera de classfcação útl rovavelmete rá revelar frutífera.

Rera de classfcação quadrátca

Rera de classfcação quadrátca S S ou de mas dmesões e ode erar resultados desaradáves + dados ão forem ormas. Sedo C / C / em dstrbuções ormas com varâcas dferetes. essa rera quadrátca leva uma reão R em dos cojutos descoeos

Rera de classfcação quadrátca a cauda sera meor que a revsta or uma dstrbução ormal o que ode ter sfcatvas taas de erro. Há ortato fraquezas da rera quadrátca os a mesma é sesível aos desvos de ormaldade.

Dstrbução ormal multvarada Dados que ão seuem dstrbução ormal há oções: Fução quadrátca: estraha com mas de dmesões. Trasformados em quase ormas e deos testar S S ara verfcar se a rera lear ou a rera quadrátca é arorada; aalsar os modelos lear de Fsher e quadrátco e aquele que resultar em meores roorções de erros de classfcação será o melhor. Se rómos deve-se escolher o modelo lear os a matrz de covarâca cojuta é estmada com um maor de tes.

Qualdade de ajuste Para cada tem das oulações é calculado o seu escore a fução dscrmate. A aálse dos escores ermtrá avalar a qualdade da fução em termos de erro de classfcação e caacdade de dscrmação. Se esta qualdade é boa os escores de são dferecados dos de.

Qualdade de ajuste Teste de Hotell: e os escores alcados aos vetores de médas amostras. A dstrbução F tem raus de lberdade. Se F> F c ara α fo rejeta-se a H 0 de ualdade das médas dos escores das oulações. 0 em que : Utlza - se a estatítca abao : : : y y T T F y y H y y H y y

Qualdade de ajuste Probabldade de classfcações corretas: Para avalar o rocesso de classfcação calcula-se a sua taa de erro. O total de robabldade de erro de classfcações é: TPM R P R P O meor TPM é a taa de erro ótma OER. equvalete a mmzar ECM quado. C / C Quato robabldades de erro de classfcação melhor é a fução dscrmate. Desdades: cohecdas ão cohecdas. f d f d

Qualdade de ajuste Desdade oulacoal cohecdas: Hóteses: o termo é uma combação lear:. Loo as suas médas e varâca são: / ~ ~ C C N f N f m y R m y R m y : : ] l[ y a y Y Y a a a a Y

Qualdade de ajuste Desdade oulacoal cohecdas: Tem-se: em que : Y P m Y P P P P TPM mímo TPM a fução de dstrbução acumulada de Z. sedo P Y OER Y P m Y P P Z P Y Y

Qualdade de ajuste Desdade oulacoal cohecdas: Assm se: OER.56.60.56.60 0.80 0. 9 A rera de classfcação ótma tera alocado corretamete cerca de % dos tes em uma oulação ou em outra.

Qualdade de ajuste Desdade ão cohecdas: Neste caso a taa de erro ótma ão ode ser calculada. Estma a taa de erro aarete APER defda em fução de observações a amostra que estão mal classfcadas ela fução dscrmate. Nela os mesmos elemetos artcam da estmação da rera dscrmate e da estmação dos erros de classfcação.

Qualdade de ajuste Desdade ão cohecdas: As frequêcas de classfcações corretas e corretas estão a matrz de cofusão. Poulação classfcada ela rera π π Total Poulação de orem π C M = - C π M = C C : tes de orem π e classfcados corretamete em π ; M : tes de orem π e classfcados corretamete em π.

Qualdade de ajuste Desdade ão cohecdas: A taa de erro aarete é: M M APER : M P P M Os escores de cada elemeto em π e π são calculados sedo a rera dscrmate utlzada ara classfcar os = +. Tede a subestmar a APER e roblema ode desaarecer se os tamahos amostras forem bem rades. Tal roblema ocorre orque os dados ara costrur a FD são também utlzados ara avala-los. Pode servr como uma etaa cal de avalação os se o valor de APER for muto elevado é sal que a FD deve ser reformulada.

Qualdade de ajuste Desdade ão cohecdas: Coforme o eemlo.5 em Johso e Wcher 00.60: Poulação classfcada ela rera π π Total Poulação de orem π C = 0 M = = π M = = 0 = APER : 4 M M 0.67 P 0.67 P 4 0.67

Qualdade de ajuste Desdade ão cohecdas: A taa de erro aarete é: M M APER : M P P M Os escores de cada elemeto em π e π são calculados sedo a rera dscrmate utlzada ara classfcar os = +. Tede a subestmar a APER e roblema ode desaarecer se os tamahos amostras forem bem rades. Tal roblema ocorre orque os dados ara costrur a FD são também utlzados ara avala-los. Pode servr como uma etaa cal de avalação os se o valor de APER for muto elevado é sal que a FD deve ser reformulada.

Qualdade de ajuste Método Holdout: A amostra cojuta = + é artda em duas artes: Costrução da rera de dscrmação; Estmação das rob. de classfcações corretas. P e P Para tato: a faz seleção aleatóra dos tes de π e π deado-os fora da amostra ; b testa a FD feta elos demas tes os sabe-se o ruo dos tes retrados; c comuta as roorções de classfcações corretas como o método tradcoal e ateror. P e P ão são vesadas mas o tamaho da amostra ara a estmação da FD é reduzdo que ode ível de cofabldade. Deve-se dear de fora de 5 a 50% dos tes da amostra cojuta oral.

Qualdade de ajuste Método Holdout de Lachebruch: mas utlzado e cosste uma valdação cruzada elos assos: a retrar um vetor de tes da amostra e utlzar os +- tes restates ara costrur a FD; b utlzar a FD feta ara classfcar o tem retrado verfcado se a rera de dscrmação acertou a sua real rocedêca; c retorar o tem retrado e retrar outro reetdo a e b. Tas assos são reetdos ara Ɏtes da amostra e obtém: E AER : H H H M M M P P H M

Qualdade de ajuste Eemlo.6 de Johso e Wcher 00.603: l[ ] S S Poulação classfcada ela rera π π Total APER 6 0.33 Poulação de orem π C = M = = 3 π M = = = 3

Qualdade de ajuste Eemlo.6 de Johso e Wcher 00.603: Retrado a º tem da [ ] matrz X etão: H É mas rádo ara classfcá-lo com base as suas dstâcas ao quadrado a artr das médas. É o mesmo or comutar o valor de y ah H e comará-lo com : / S m H H H H Como a dstâca H H < H H classfca X H = [ ] Є π está correto.

Qualdade de ajuste Eemlo.6 de Johso e Wcher 00.603: Retrado a º tem : H [4 0] Como a dstâca H H > H H classfca X H = [4 0] Є π está correto. Esse rocedmeto sera feto ara: H [3 8] => correto em π ; H [5 7] => correto em π ; H [3 9] => correto em π ; H [4 5] => correto em π ; E AER : 3 3 H H M M 0.5

Classfcação de váras oulações Ao eeralzar ara > ão é ossível retrar coclusões eras que deedem da localzação das oulações. Dee ara f ~ à e c 0se : N P P f d com P - R Tem-se o custo eserado codcoal ECM de classfcações corretas em relação à π orem : ECM c P c3 P3 c P Obtém-se também o custo eserado codcoal de classfcações corretas. ECM ECM3 ECM c P

Classfcação de váras oulações Multlcado cada ECM or sua resectva robabldade a ror tem-se ECM lobal: Da mesma forma que = a classfcação ótma se dá ela mecm. As reões que mecm são defdas alocado ara a oulação π em que: P c ECM ECM ECM ECM ECM 3 3 é o meor ossível. P c

Classfcação de váras oulações Se ocorrer um emate etre as oulações etão ode ser atrbuído a qualquer das oulações vculadas. Se todos os custos são uas tem-se: O que sfca dzer que o termo omtdo é maor. Ou seja é alocado em π se: A rera de classfcação é dêtca que ma a rob.: é o meor ossível. f f f f f f f f l l f f P refere-se que rovém de π dado que fo observado.

Classfcação de váras oulações O eemlo.9 em Johso e Wcher 00.65:

Classfcação de váras oulações O eemlo.9 em Johso e Wcher 00.65: Loo alca-se o mímo ECM sedo : o é alocado em π P c

Classfcação de váras oulações O eemlo.9 em Johso e Wcher 00.65: Se todos os custos são uas bastara atrbur 0 de acordo com f f ou melhor: o é alocado em π 3

Classfcação de váras oulações O eemlo.9 em Johso e Wcher 00.65: Equvaletemete ode-se calcular as robabldades osterores:

Classfcação oulações ormas Matedo e etão classfca-se _ em _ se for o mámo. Desde: A costate é orada desde que uas ara π. O escore de dscrmação quadrátca ara -ésma oulação: ~ N f c 0 c l f f e ma l l l l l f f l d Q l l

Classfcação oulações ormas Usado o escore dscrmate ecotra-se a rera de classfcação.e. é alocado em se: Na rátca quado são descohecdos usa-se : Se assumr que as matrzes são uas ou rómas: c Q Q Q Q d d mámo d d S d Q l l S S S S S S

Classfcação oulações ormas Tem-se o escore dscrmate lear com : Os rmeros termos são os mesmos ara todo π : Tem-se a rera de classfcação.e. é alocado em π se: S d l l S S S S d l S S d d mámo d d

Classfcação oulações ormas Os escores dscrmates leares odem ser comarados dos de cada vez. Usado os valores de cada é ossível detectar que será maor etre : d d d d d l l Adcoado ambos oslados l l 0 0 S S S S

Classfcação oulações ormas Essa codção defe as reões de classfcação R R or R laos. Se há =3 etão: R d l l : 3. 0 se Para o rocedmeto de Lachebruch a taa de erro atual eserada é:. E AER : H M

Classfcação oulações ormas

Dscrmates caôcas de Fsher Fsher 956 elaborou fuções dscrmates a artr de combações leares das varáves oras. Sua etesão ermte: a reresetações coveetes das oulações em uma dmesão meor. Há erda de formação; b lotar as médas das rcas combações leares ajudado a mostrar as relações e os ossíves aruametos das oulações. c costrur um ráfco de dsersão dos rmeros comoetes dcado rováves outlers. Objetvo: searar as oulações mas ode classfcar as observações mesmo que as oulações ão sejam ormas multvaradas.

Dscrmates caôcas de Fsher Suoha varáves aleatóras oulações ão ecessáro ara dscrmação e. As s combações leares s m- são: Cosequetemete o valor eserado altera quado muda a oulação de _. oulações. ara todasas ; ara a oulação : em forma matrcal e e e X e e X X e e e Cov Y Var E Y E Y y y Y s s Y e X

Dscrmates caôcas de Fsher A méda lobal é: E forma a razão: : soma de rodutos cruzados etre ruos; : varabldade detro dos ruos. Busca-se mamzar razão cujo vetor de coefcetes será os autovetores da matrz tal que. e e e Y Y Varâca dey de Y oulações em relação a méda lobal soma das dstâcas ao quadrado das e e e e B e e e e e e e e e e Y Y B B ee

Dscrmates caôcas de Fsher Suodo amostra aleatóra de tamaho de toda a oulação π =... etão: A matrz W é a matrz da soma de rodutos cruzados detro dos ruos: Cosequetemete que é a matrz de covarâcas amostral combada.. ; j j j j j B j j j S W W / S

Dscrmates caôcas de Fsher Como W é uma costate vezes S loo o mesmo: e e Be e Be que mamza também mamza e Se e We Portato essa razão mede a varabldade etre ruos de em relação à varabldade comum detro dos ruos. Os autovetores ê de W B satsfazem W Be e e S Be e tal que. e We e e e e j j j

Dscrmates caôcas de Fsher Como em ACP a combação lear y e X chamada de rmero dscrmate amostral detém o maor autovalor da matrz W B. Isto sfca que tem o maor oder dscrmate que as sucessvas fuções dscrmates: y e X y e X y e 3 3 X. Y Portato há uma ordeação em termos de mortâca da searação dos ruos. s

Dscrmates caôcas de Fsher O eemlo.3 em Johso e Wcher 00.63 calcula as dscrmates amostras de Fsher ara 3 oulações:

Dscrmates caôcas de Fsher Para calcular os s m-=m= autovalores de : W B Desse modo as dscrmates são: e e.386.938.495. y y e e.386.495.386.938..938..495

Dscrmates caôcas de Fsher Aós a costrução das dscrmates ara cada elemeto j é ossível obter os seus escores elo seu vetor de varáves j : De maera semelhate obtém os escores das dscrmates a artr dos vetores de médas ara π =... : Assm as dstâcas eucldaas etre e são comutadas sedo o corresode elemeto j classfcado a oulação cuja dstâca é a meor. j s j j j y e e e s y e e e j ŷ ŷ

Dscrmates caôcas de Fsher Ou melhor j é classfcado em π coforme a rera baseada sobre os rmeros r s dscrmates amostras: r j j j r j j j r j j j r j j j y y y y ou e e em que j ê é defdo em e We e Be j j y ê e s r.

Dscrmates caôcas de Fsher Retomado os valores do eemlo.3 em Johso e Wcher 00.63:..938.495.386 y y e e

Dscrmates caôcas de Fsher Retomado os valores do eemlo.3 em Johso e Wcher 00.63:

Dscrmates caôcas de Fsher Cometáros fas: É comum aeas a ª dscrmate fazer a classfcação dos objetos os ossu o maor oder de dscrmação. Todava um melhor resultado será obtdo se o usuáro utlzar as fuções dscrmates caôcas mas mortates. Essa escolha oder ser feta como em ACP. Não deede trscamete do ressuosto de ormaldade. Ou seja é smlar à ACP.

Fuções dscrmates loístcas Estem stuações que há varáves quattatvas e qualtatvas ara cada observação. Numa varável bára a robabldade de é um arâmetro de teresse que rede: méda : 0.. varâca : 0.. Loo a varâca ão é costate :. 5.5;.8.6. Se Y for uma varável bára etão em um modelo lear: 0 E Y X X Havera ortato alumas desvataes ara esse modelo: os valores redtos de Y oderam ser maor que ou feror a 0 os a eressão lear ara o valor eserado é lmtado; a varâca ão sera costate.

Fuções dscrmates loístcas É ecessára outra abordaem ara troduzr X.e. o modelo Lot. Em vez de modelar a robabldade dretamete em um modelo lear cosdera-se calmete a razão de chace RC: Y RC Y 0 Cotudo há uma falha de smetra os. 8 4 e. 4. Para evtar esse roblema toma-se l eatamete 4.386 e l 4.386 o oosto. Nesse setdo a reressão loístca modela-se: l l RC tal que : β e X X X l βx 0 X

Fuções dscrmates loístcas Alcado-se o atloarítmo tem-se: RC X X e βx 0 X e 0 βx e βx 0 Os valores do vetor de arâmetros a curva loístca determa o quato rádo X muda com o vetor X. Não obstate a terretação ão é tão smles como a reressão lear os a relação ão é lear.

Fuções dscrmates loístcas Rera de classfcação loístca: Seja Y uma varável resosta que: tem valor se a observação j com o vetor X ertece à π ou valor 0 se ela for da π. Assm tal observação j será alocada à π caso: P Y X X RC e 0 X X X ou l P Y 0 X X X X RC l X X X 0 sedo o vetor estmado β or máma verossmlhaça [ X] [ X] ou equvalet emete X X etão RC 0

Cosderações dos modelos e quado se tem varáves qualtatvas Modelo loístco: sofre fluêca da correlação etre as varáves elcatvas afetado as estmatvas obtdas ara os arâmetros do modelo multcoleardade. Não requer dstrbução ormal multvarada. Arorada ara varáves são cotíuas e qualtatvas. Modelo de Fsher: ode erar resultados obres ou satsfatóros deededo das correlações etre as varáves qualtatvas e cotíuas. A baa correlação em uma oulação mas uma alta correlação a outra ou até mesmo uma mudaça de sal das correlações etre as oulações ode dcar codções desfavoráves ara a fução de Fsher.

Seleção de varáves A qualdade da fução dscrmate deede: a detfcação da dstrbução de robabldade de X em cada oulação; b As varáves escolhdas ara a classfcação devem ossur valores bem dferetes etre as oulações ara dstu-las. Se há mutas varáves => subcojuto equeo de varáves com tata formação quato o oral. A escolha de um subcojuto de varáves é reocuate se a classfcação é o rcal objetvo da esqusa. Os roblemas com a seleção de varáves são amlados se houver altas correlações das varáves ou etre combações leares das varáves. Imortate: aumeto do úmero de varáves ão eleva a caacdade de dscrmação.

Seleção de varáves Aálse da varâca uvarada Comara-se a varâca etre ruos em relação à cada varável searadamete ANOVA. As varáves com valores da estatístca F mas sfcatvos serão as mas mortates ara dscrmar os ruos. Tal rocedmeto ão cosdera a correlação etre as varáves.

Seleção de varáves Foward etrada de varáves. ajusta-se uma aálse de varâca ara cada varável searadamete. No modelo etra aquela de maor sfcâca. Se ão houver qualquer varável sfcatva o alortmo é terromdo.. busca-se uma ova varável sfcatva cosderado a varável caddata a etrar como resosta VD e a que já etrou como elcatva VI elo asso. Isto é feto ara todas as varáves caddatas e escolhe a de maor sfcâca. 3. reete-se ara as varáves caddatas restates cosderado as varáves que etraram o asso e como elcatvas. O rocesso se reete até que ão esta mas varáves sfcatvas ara etrar o modelo.

Seleção de varáves Bacward saída de varáves. testa a sfcâca de cada varável elmado as de meor sfcâca meor oder de dscrmação. Para tato cada varável é tratada como resosta e as - demas como elcatvas. A estatístca F é calculada ara cada varável e se o valor F for meor do que o valor de referêca ara a saída das varáves a varável é elmada;. em cada asso retra a varável de meor sfcâca. Se uma varável é removda o rocedmeto busca uma seuda varável ara remoção cosderado como varável resosta como fução das - varáves restates. O rocedmeto é reetdo até que ão haja mas varáves ara serem removdas.

Seleção de varáves Stewse comba Foward e Bacward eemlo 7.5 da Mot 005.. utlza-se cada varável X XX3X4 como resosta da varável detfcadora do ruo X5 varável elcatva: X =fx5... X4 =fx5. Como em Forward os valores de F arcas e suas sfcâcas são calculados. No eemlo X3 =fx5 se destacou.. A varável X3 etra o modelo como elcatva e alca-se: X=fX3 X5 X=fX3 X5 e X4=fX3 X5. No eemlo as varáves X e X se destacram sedo X a de maor sfcâca.

Seleção de varáves Stewse comba Foward e Bacward eemlo 7.5 da Mot 005. 3. A varável X etra o modelo ara testar a saída da varável X3 como o método Bacward. No eemlo X3=fX X5 é sfcatva e etão ela ermaece o modelo; 4. Por fm como X=fX3 X5 e X3=fX X5 foram sfcatvas etão elas etram como elcatvas e testam-se as demas varáves como resosta: X=fX X3 X5 X4=fX X3 X5. No eemlo tato X quato X4 ão foram estatstcamete sfcatvas. 5. Portato o modelo fal será comosto or X e X3.

Seleção de varáves Stewse comba Foward e Bacward eemlo 7.5 da Mot 005. Portato em cada asso é feto um teste de etrada e saída das varáves. Johso 998 recomeda que ara o método bacward seja cosderado um α=% equato que ara stewse etre 5 a 50% ara etrada e 5% ara saída. Geralmete recomeda-se o uso do método bacward e/ou stewse. Ada assm deve-se semre aalsar a qualdade do ajuste robabldades de erro de classfcação deos da costrução da fução dscrmate.