Métodos Supervisionados vs. não supervisionados
|
|
- Vitória Galindo Sá
- 6 Há anos
- Visualizações:
Transcrição
1 10/4/010 Capítulo 5 Algortmo dos k-vznhos mas próxmos Prepared by James Steck, Graduate Assstant DESCOBRINDO CONHECIMENTO NOS DADOS DANIEL T. LAROSE, PH.D. Copyrght 005 John Wley & Sons, Inc. 1 Métodos Supervsonados vs. não supervsonados Os métodos de mneração de dados são classfcados como supervsonados ou não supervsonados Métodos não supervsonados Uma varável alvo não é especfcada Em vez dsso, o algortmo procura por padrões e estruturas entre as varáves Clusterzação é o método não supervsonado mas comum Por exemplo, consultores polítcos podem analsar clusters de eletores em dstrtos eletoras que podem ser favoráves ao seu canddato Varáves mportantes tas como sexo, dade, renda e raça são entradas do algortmo de clusterzação Copyrght 005 John Wley & Sons, Inc. 1
2 10/4/010 Métodos Supervsonados vs. não supervsonados (contnuação) Perfs de eletores para angarar fundos e fazer publcdade são crados Métodos supervsonados Uma varável alvo é especfcada O algortmo "aprende" a partr dos exemplos, determnando quas os valores das varáves predtoras estão assocados com dferentes valores da varável alvo Por exemplo, os métodos de regressão dscutdos no Capítulo 4 são supervsonadas. Os valores observados da varável resposta (alvo) são ldos pelo algortmo dos mínmos quadrados, enquanto ele tenta mnmzar o erro de predção Todos os métodos de classfcação nos capítulos 5-7 são métodos supervsonados, nclundo: Árvores de Decsão, Redes Neuras, e k- vznhos mas próxmos Copyrght 005 John Wley & Sons, Inc. 3 Metodologa para modelagem supervsonada Métodos de mneração de dados supervsonados usam conjuntos de dados de trenamento, teste e valdação como parte da construção do modelo e processo de avalação Trenamento O conjunto de trenamento nclu regstros com as varáves predtoras e valores pré-classfcados para a varável alvo Esta é a fase ncal onde um modelo de mneração de dados provsóro é construído usando o conjunto de trenamento O modelo "aprende" a partr dos exemplos do conjunto de trenamento O que acontece se o modelo de aplcar cegamente todos os padrões aprenddos a partr do conjunto de trenamento a dados futuros? Copyrght 005 John Wley & Sons, Inc. 4
3 10/4/010 Metodologa para modelagem supervsonada (contnuação) Por exemplo, suponha que todos os clentes em um conjunto de trenamento com o nome "Davd" concdentemente estejam na faxa de renda alta Um modelo de mneração de dados que "memorza" essa dossncrasa presente no conjunto de trenamento está na verdade overfttng os dados Muto provavelmente nós não queremos nosso modelo aplcando esta regra a dados futuros ou dados não prevamente conhecdos Portanto, o passo segunte no processo é examnar o desempenho do modelo de dados provsóro usando um conjunto dferente de dados Copyrght 005 John Wley & Sons, Inc. 5 Metodologa para modelagem supervsonada (contnuação) Teste O conjunto de teste é uma parte dos dados ndependente do conjunto de trenamentoque fo utlzado para construr o modelo de dados provsóro Os verdaderos valores da varável alvo no conjunto de teste estão temporaramente esconddos do modelo de dados provsóro O modelo de dados provsóro smplesmente classfca os regstros no conjunto de teste de acordo com as regras e padrões que aprendeu a partr dos regstros do conjunto de trenamento O desempenho do modelo de dados provsóro é avalada comparando a sua classfcação em relação aos valores reas de varável alvo O modelo de dados provsóro é ajustado num esforço para mnmzar a taxa de erro no conjunto de teste Copyrght 005 John Wley & Sons, Inc. 6 3
4 10/4/010 Metodologa para modelagem supervsonada (contnuação) Valdação Em seguda, ao modelo de dados ajustado é aplcada um outro conjunto de dados chamado o conjunto de valdação O conjunto de valdação é outro pedaço do conjunto dos dados ndependente dos conjuntos de trenamento e de teste O desempenho do modelo de dados ajustado é avalado com conjunto de valdação Se necessáro, o modelo de dados ajustado é modfcado para mnmzar a taxa de erro no conjunto de valdação Estmatvas do desempenho do modelo de dados para dados futuros ou não prevamente conhecdos são computados usando meddas de avalação aplcadas aos resultados obtdos ao classfcar o conjunto de valdação Copyrght 005 John Wley & Sons, Inc. 7 Metodologa para modelagem supervsonada (contnuação) Tranng Set (pre-classfed) Use tranng set to generate a provsonal data mnng model. Provsonal data mnng model. Test Set Apply provsonal model to test set. Adjust provsonal model to mnmze error rate on test set. Adjusted data mnng model. Valdaton Set Apply adjusted model to valdaton set. Adjust the adjusted model to mnmze error rate on valdaton set. Fnal data mnng model. Copyrght 005 John Wley & Sons, Inc. 8 4
5 10/4/010 Metodologa para modelagem supervsonada (contnuação) Underfttng versus Overfttng Geralmente, a precsão do modelo de dados provsóro não é tão elevada quanto aplcado nos conjuntos de teste ou valdação, em comparação aos resultados obtdos com o conjunto de trenamento Isso ocorre quando um modelo de dados tende a overft o conjunto de trenamento, aprendendo todas as tendêncas ou estruturas possíves Na construção do modelo, há uma tensão constante entre desenvolver modelos que são complexas e conseguem generalzar bem Um modelo de dados que permte atngr alta precsão sobre o conjunto de trenamento resulta em aumento da complexdade do modelo No entanto, à medda que aumenta a complexdade do modelo, a generalzação de um modelo de dados para os conjuntos de dados de teste e de valdação dmnu Copyrght 005 John Wley & Sons, Inc. 9 Metodologa para modelagem supervsonada (contnuação) Esta fgura mostra que ncalmente, à medda que a complexdade do modelo aumenta, a taxa de erro dmnu para ambosos conjuntos de trenamento e valdação Em aumentado a complexdade do modelo, a taxa de erro no conjunto de trenamento dmnu No entanto, a taxa de erro no conjunto de valdação começa a aumentar Optmal Level of Model Complexty Error Rate Error Rate on Valdaton Set Underfttng Overfttng Error Rate on Tranng Set Complexty of Model Copyrght 005 John Wley & Sons, Inc. 10 5
6 10/4/010 Metodologa para modelagem supervsonada (contnuação) Como a complexdade do modelo aumenta o modelo de dados provsóro começa a memorzar o conjunto de trenamento, ao nvés de generalzá-lo Portanto, o ponto onde a taxa de erro no conjunto de valdação é mnmzada é o nível ótmo de complexdade do modelo Qualquer complexdade do modelo maor do que este ponto consste em overfttng os dados, complexdade do modelo nferor a esse ponto consste em underfttng os dados Copyrght 005 John Wley & Sons, Inc. 11 Bas-Varance Trade-Off Suponhamos que estamos construndo um modelo de dados que tenta separar os pontos claros e escuros (dos valores possíves para uma varável alvo) na fgura acma A lnha reta se benefca pela baxa complexdade, mas produz erros de classfcação. Por exemplo, apenas 6 / 8 pontos abaxo da lnha são claros A lnha curva reduz o erro de classfcação a zero, mas a função de separação é altamente complexa Copyrght 005 John Wley & Sons, Inc. 1 6
7 10/4/010 Bas-Varance Trade-Off (cont d) Estamos nclnados a adotar a solução de alta complexdade para reduzr a taxa de erro No entanto, sso pode produzr um modelo que depende das dossncrasas encontradas no conjunto de trenamento Suponha que adconemos mas pontos de dados ao gráfco de dspersão A lnha reta é apenas lgeramente alterada para acomodar os pontos adconas, este separador smples tem baxa varânca Copyrght 005 John Wley & Sons, Inc. 13 Bas-Varance Trade-Off (cont d) Em contraste, a lnha curva é alterada consderavelmente para manter a sua precsão na classfcação, e portanto tem grande varânca Embora o separador de alta complexdade (lnha curva) tenha bas menor (menor taxa de erro), ele tem grande varânca O separador de baxa complexdade (lnha reta) tem baxa varânca e bas maor (maor taxa de erro) Este exemplo lustra o que é conhecdo como o Bas-Varânca Trade-Off, e é outra manera de descrever overfttng / underfttng Nosso objetvo é construr um modelo de dados onde nem o bas nem a varânca são muto altos Copyrght 005 John Wley & Sons, Inc. 14 7
8 10/4/010 Bas-Varance Trade-Off (cont d) O erro médo quadrado (MSE) é o método mas comum de avalar a precsão de um modelo Dado dos ou mas modelos de dados potencalmente bons, o melhor modelo pode ser dentfcado pao se escolher aquele com o menor MSE O MSE é uma medda adequada, pos combna tanto o bas quanto a varânca em seu cálculo O MSE é uma função do erro de estmação (SSE) e da complexdade do modelo, e é defndo como: MSE varance + bas Esta equação ndca claramente a relação de complementardade entre a varânca o bas Copyrght 005 John Wley & Sons, Inc. 15 Tarefa de Classfcação A classfcaçãoé provavelmente a tarefa mas comun de mneração de dados Exemplos Bancos: determnar se uma aplcação numa hpoteca é boa Educação:Dreconar um aluno no que dz respeto a necessdades especas Medcna: dagnostcar se a doença está presente Le: determnar se o arbítro é fraudulenta Segurança: dentfcar se uma determnada transação fnancera representa uma ameaça terrorsta Copyrght 005 John Wley & Sons, Inc. 16 8
9 10/4/010 Tarefa de Classfcação (contnuação) A classfcação é um método supervsonado e nclu duas ou mas classes para a varável alvo categórca Por exemplo, a varável alvo faxa de renda pode nclur as categoras de Baxa", Méda" e Alta O algortmo examna as relações entre os valores dos campos do predtor (entrada) e dos valores alvo Suponha que queremos classfcar a faxa de renda de uma pessoa com base nos valores da dade, sexo e ocupação de outras pessoas, que estão contdos em um banco de dados Subject Age Gender Occupaton Income Bracket F Software Engneer Hgh 00 8 M Marketng Consultant Mddle M Unemployed Low Copyrght 005 John Wley & Sons, Inc. 17 Tarefa de Classfcação (contnuação) Prmero, o algortmo de classfcação analsa os valores do conjunto de dados para o predtor e as varáves alvo no conjunto de trenamento Desta forma, o algortmo "aprende" quas os valores das varáves predtoras estão assocadas com os valores da varável alvo Por exemplo, mulheres mas velhas podem ser assocadas com os valores da faxa de renda Alta Agora que o modelo de dados fo construído, o algortmo examna novos regstros para o qual a faxa de renda é desconhecda De acordo com as classfcações no conjunto de trenamento, o algortmo classfca os novos regstros Por exemplo, uma mulher de 63 anos de dade pode ser classfcada na faxa de renda Alta" Copyrght 005 John Wley & Sons, Inc. 18 9
10 10/4/010 Algortmo dos k-vznhos mas próxmos O algortmo dos k-vznhos mas próxmos é um exemplo de aprendzagem baseada em nstâncas onde os regstros contendo o conjunto de trenamento são prmero armazenados Em seguda, a classfcação de um novo regstro anda sem classfcaçãoé feta comparando-o com os regstros no conjunto de trenamento com os quas ele é mas parecdo O algortmo dos k-vznhos mas próxmos é usado na maora das vezes para a classfcação, embora também seja aplcável a tarefas de estmatvas e prevsão Exemplo: Pacente1 Lembre-se do capítulo 1, em que estavamos nteressados em classfcar o tpo de medcamento que devera ser prescrta a um pacente O conjunto de trenamento consste em 00 pacentes com os atrbutos sendo a razão Na/K, dade, e medcamentos Nossa tarefa é classfcar o tpo de medcamento que devera ser prescrto a um pacente novo que tem 40 anos de dade e uam razão Na/K gual a 9 Copyrght 005 John Wley & Sons, Inc. 19 Algortmo dos k-vznhos mas próxmos (contnuação) Este gráfco de dspersão de Na/K versus Idade mostra os regstros no conjunto de trenamento com os quas os pacentes 1, e 3 são mas parecdos A drug overlay é mostrada onde os pontos claros medcamento Y, pontos médos medcamento A ou X, e os pontos escuros medcamento B ou C Patent 1 Patent Patent 3 Copyrght 005 John Wley & Sons, Inc. 0 10
11 10/4/010 Algortmo dos k-vznhos mas próxmos (contnuação) Qual medcamento deve ser prescrto ao pacente 1? Como o perfl dos pacentes 1 os colocam no gráfco de dspersão perto doentes medcados com a droga Y, podemos classfcar o pacente 1 como droga Y A todos os pontos perto do pacente 1 são prescrtos medcamentos Y, tornando uma essa classfcação bem smples Exemplo: Pacente Em seguda, vamos classfcar um novo pacente, que tem 17 anos de dade e uma relação Na / K 1,5. Um close-up mostra a vznhança de pontos de trenamento em proxmdade com o pacente C A Patent Copyrght 005 John Wley & Sons, Inc. 1 B Algortmo dos k-vznhos mas próxmos (contnuação) Suponha que nós fazemos k 1 para o nosso algortmo dos k-vznhos mas próxmos Isso sgnfca que classfcamos o pacente de acordo com qualquer que seja o ponto no conjunto de trenamento ao qual ele é mas próxmo Neste caso, o pacente está mas próxmo ao ponto escuro, e, portanto, nós os classfcamos como droga B ou C Suponha que nós fazemos k e classfcamos novamente Pacente usando os k- vznhos mas próxmos Agora, o pacente está mas próxmo a um ponto escuro a um ponto médo Como é que o algortmo decde qual droga prescrever? Um sstema smples de votação não ajuda Copyrght 005 John Wley & Sons, Inc. 11
12 10/4/010 Algortmo dos k-vznhos mas próxmos (contnuação) No entanto, com k 3, o voto determna que dos dos três pontos mas próxmos para o pacente são médos Portanto, o pacente é classfcado como droga A ou X Note que a classfcação do pacente dferu com base no valor escolhdo para k Exemplo: Pacente 3 O pacente 3 tem 47 anos de dade e tem uma relação Na / K de 13,5. Um close-up mostra pacente 3 no centro, com os 3 pontos de trenamento de dados mas próxmos Copyrght 005 John Wley & Sons, Inc. 3 Algortmo dos k-vznhos mas próxmos (contnuação) Com k 1, pacente 3 está mas próxmo ao ponto escuro, com base em uma medda de dstânca Portanto, pacente 3 é classfcado como droga B ou C Usando k ou k 3, o voto não ajuda, já que cada um dos três pontos de trenamento mas próxmos têm dferentes valores de alvo Consderações ao usar os k-vznhos mas próxmos Quantos vznhos devem ser usados? k? Como é medda a dstânca entre os pontos? Como a nformação obtda de dos ou mas vznhos é combnada tomar uma decsão de classfcação? Todos os pontos deveram ter pesos guas, ou alguns pontos deveram ter mas nfluênca? Copyrght 005 John Wley & Sons, Inc. 4 1
13 10/4/010 Função Dstânca Como é defnda a semelhança entre um regstro não classfcados e os seus vznhos? Uma métrca de dstânca é uma função de valores reas d usada para medr a smlardade entre as coordenadas x, y e z com propredades: d( x, y) 0,and d( x, y) 0 f and only f x y d( x, y) d( y, x) d( x, z) d( x, y) + d( y, z) Propredade 1: A dstânca é sempre não-negatva Propredade : comutatva, a dstânca de "A a B" é a dstânca de "B a A" Propredade 3: a desgualdade trângulo dz que, dstânca de "A a C" deve ser menor ou gual à dstânca de "A a B a C" Copyrght 005 John Wley & Sons, Inc. 5 Função Dstânca (contnuação) A função dstânca eucldana é comumente usada para medr a dstânca Exemplo d Eucldean ( x, y) ( x y) where x x, x,..., x 1 represent the m attrbutes m, and y y, y,..., y Suponha um Pacente que tem 0 anos de dade e tem uma relação Na / K 1, e um Pacente B que tem 30 anos e uma relação Na / K 8 Qual é a dstânca eucldana entre estas nstâncas? 1 m deucldean ( x, y) ( x y ) (0 30) + (1 8) Copyrght 005 John Wley & Sons, Inc. 6 13
14 10/4/010 Função Dstânca (contnuação) Ao medr uma dstânca, um ou mas atrbutos podem ter valores muto grandes, em relação aos outros atrbutos Por exemplo, a faxa de renda pode ser escalada 30, ,000, enquanto os anos de servço assumem os valores de Neste caso, os valores dos rendmentos vão sobrepujar a contrbução dos anos de servço Para evtar esta stuação usamos normalzação Normalzação Valores de dados contínuos devem ser normalzados usando a normalzação Mn-Max ou a padronzação Z-Score X mn( X ) Mn - Max Normalzaton max( X ) mn( X ) X mean( X ) Z - Score Standardzaton standard devaton( X ) Copyrght 005 John Wley & Sons, Inc. 7 Função Dstânca (contnuação) Para atrbutos categórcos, a função dstânca eucldana não é aproprada Em vez dsso, defne-se uma função chamada "dferente 0 dfferent( x, y ) 1 f x y otherwse Nós substtuímos dferente (x, y) para cada atrbuto categórco na função dstânca eucldana Exemplo Qual pacente é mas parecdo com um homem de 50 anos de dade: um homem de 0 anos de dade ou uma mulher de 50 anos de dade? Copyrght 005 John Wley & Sons, Inc. 8 14
15 10/4/010 Função Dstânca (contnuação) Seja o Pacente A homem de 50 anos de dade, Pacente B homem de 0 anos de dade, e Pacente C mulher de 50 anos de dade Suponha que a varável dade tem um ntervalo 50, mínmo 10, méda 45 e desvo padrão 15 A tabela contém os valores de dade orgnas, Mn-Max normalzada, e padronzados pela Z-Score Patent Age Age MMN Age Zscore Gender A Male B Male C Female Copyrght 005 John Wley & Sons, Inc. 9 Função Dstânca (contnuação) Idade não normalzada Suponha que não normalzamos a Idade. Calcular a dstânca entre o pacente A e pacente B, e a dstânca entre o pacente A e o pacente C d( A, B) d ( A, C) (50 0) (50 50) Nós determnamos, embora talvez de forma ncorreta, que o pacente C é mas próxmo ao pacente A O pacente B é realmente 30 vezes mas dstante do pacente A que o pacente C é do pacente A? Talvez dexar de normalzar os valores da dade está crando esta dscrepânca? Copyrght 005 John Wley & Sons, Inc
16 10/4/010 Função Dstânca (contnuação) Idade normalzada utlzando o Mn-Max A dade é normalzada usando a normalzação Mn-Max. Os valores estão no ntervalo [0, 1] Novamente, podemos calcular a dstânca entre o pacente A e o pacente B, e entre o pacente A e o pacente C d MMN ( A, B) (0.8 0.) ( A, C) ( ) d MMN Neste caso, o pacente B é agora mas perto do pacente A Idade padronzada usando Z-Score Desta vez a dade é padronzada utlzando a padronzação Z-Score Copyrght 005 John Wley & Sons, Inc. 31 Função Dstânca (contnuação) d Zscore ( A, B) (0.33 ( 1.67)) ( A, C) ( ) d Zscore Usando a padronzação Z-Score, a maora dos valores estão tpcamente contdos no ntervalo [-3, 3] Agora, o Pacente C é o mas próxmo do Pacente A. Este resultado é dferente daquele obtdo com a normalzação Mn-Max Conclusão O uso de técncas de normalzação dferentes resultaram no pacente A sendo mas próxmo de pacentes dferentes no conjunto de trenamento Isso ressalta a mportânca de compreender qual técnca está sendo usada Copyrght 005 John Wley & Sons, Inc. 3 16
17 10/4/010 Função Dstânca (contnuação) Note que a dstânca (x, y) e as funções de normalzação Mn-Max produzem valores no ntervalo [0, 1] Talvez, ao calcular a dstânca entre os regstros contendo tanto atrbutos numércos e categórcos, a utlzação da normalzação Mn-Max Normalzação seja preferível Copyrght 005 John Wley & Sons, Inc. 33 Função Combnação A função dstânca eucldana determna a semelhança de um novo regstro não classfcado para com aqueles do conjunto de trenamento Como deveram se combnar os mas semelhantes (k) regstros para fornecer uma classfcação? Votação smples não ponderada Esta é a função combnação mas smples Decde sobre o valor de k para determnar o número de regstros smlares que "votam Compare cada regstro não classfcado com os seus k vznhos mas próxmos (maor smlardade) de acordo com a função dstânca eucldana Cada um dos k regstros semelhantes votam Copyrght 005 John Wley & Sons, Inc
18 10/4/010 Função Combnação (contnuação) Lembre-se que classfcamos um novo pacente de 17 anos de dade com uma relação Na / K 1,5, com k 3 A votação smples não ponderada determnou que dos dos três pontos mas próxmos ao pacente são médos Portanto, o pacente é classfcado como droga A ou X com uma confança de 03/0 66,67% Também classfcamos um novo pacente de 47 anos de dade, que tem uma relação Na / K de 13,5, com k 3 No entanto, a votação não ponderada smples não ajudou e resultou em um empate Talvez voto ponderado deva ser consderado? Copyrght 005 John Wley & Sons, Inc. 35 Votação Ponderada Votação Ponderada Neste caso, quanto mas próxmo o vznho for, mas nfluênca ele tem na decsão de classfcação Este método assume que um vznho mas próxmo é mas smlar e que portanto seu voto devera ser ponderado por um fator maor, em comparação com vznhos mas dstantes O peso do regstro específco é nversamente proporconal à sua dstânca para o regstro não classfcado É pouco provável ocorrer um empate" com esta abordagem Copyrght 005 John Wley & Sons, Inc
19 10/4/010 Votação Ponderada (contnuação) Exemplo Mas uma vez, lembre-se que classfcamos um novo pacente de 17 anos de dade com uma relação Na / K 1,5, com k 3 Nós determnamos, usando votação não ponderada, dos dos pontos mas próxmos foram Médos, e o tercero fo escuro No entanto, o ponto escuro é a mas smlar ao novo pacente Agora, vamos classfcar novamente o novo pacente usando um esquema de votação ponderada, utlzando os valores da tabela abaxo Record Age Na/K Age MMN Na/K MMN New Patent A (Dark) B (Med) C (Med) Copyrght 005 John Wley & Sons, Inc. 37 Votação Ponderada (contnuação) As dstâncas dos regstos A, B e C para o novo pacente são: d ( new, A) d ( new, B) d ( new, C) ( ) ( ) ( ) + (.5.471) + ( ) + ( ) Em seguda, os votos desses regstros são ponderados de acordo com o nverso do quadrado da sua dstânca para o novo regstro O regstro A vota para classfcar o novo pacente como escuro (droga B ou C) 1 Votes Dark Gray) d( new, A) ( 51,818. Copyrght 005 John Wley & Sons, Inc
20 10/4/010 Votação Ponderada (contnuação) Regstros B e C votam para classfcar o pacente como novo Médo (droga A ou X) 1 Votes Medum Gray) d( new, B) 1 + d( new, C) ( Convncentemente ( contra 67) o método de votação ponderada classfca o novo pacente como escuro (droga B ou C) Note que este procedmento nverte a nossa decsão de classfcação, determnada através da votação não ponderada, k 3 A dstânca nversa de 0 é ndefnda usando votação ponderada Teorcamente, o valor de k pode ser aumentado, de modo que todos os regstros de trenamento partcpem na votação, no entanto, a complexdade computaconal pode resultar em baxo desempenho 67. Copyrght 005 John Wley & Sons, Inc. 39 Quantfcando a relevânca de um atrbuto: alongando os exos Nem todos os atrbutos podem ser relevantes para a classfcação Por exemplo,as árvores de decsão ncluem apenas os atrbutos que contrbuem para melhorar a exatdão da classfcação Em contraste, o comportamento padrão dos k-vznhos mas próxmos é calcular dstâncas usando todos os atrbutos Um regstro relevante pode estar próxmo para varáves mportantes e, ao mesmo tempo muto longe para outras, as varáves sem mportânca Tomados em conjunto, o regstro relevante pode agora estar moderadamente longe do regstro novo, de modo que ele não partcpe da decsão de classfcação Copyrght 005 John Wley & Sons, Inc. 40 0
21 10/4/010 Quantfcando a relevânca de um atrbuto: alongando os exos (contnuação) Talvez, devamos consderar restrngr o algortmo a usar os campos mas mportantes para a classfcação No entanto, ao nvés de fazer essa determnação a pror, podemos fazer os atrbutos tanto mas como menos mportantes Isso é feto usando a valdação cruzada ou aplcando conhecmentos de domíno Alongando os exos Alongamento dos exos: encontrar o coefcente zj pelo qual se deve multplcar o j-ésmo exo. Valores maores de zj estão assocados com os exos de varável mas mportantes Valdação Cruzada A valdação cruzada selecona um subconjunto aleatóro de dados a partr do conjunto de trenamento e determna o conjunto de z1, z,..., zm que mnmza o erro de classfcação no conjunto de teste Copyrght 005 John Wley & Sons, Inc. 41 Quantfcando a relevânca de um atrbuto: alongando os exos (contnuação) Repetndo o processo leva a um conjunto mas precso de valores para z1, z,..., zm Especalstas do domíno Alternatvamente, pode-se recorrer a especalstas do domíno para recomendar valores de z1, z,..., zm Usando qualquer uma das abordagens, o algortmo dos k- vznhos mas próxmos pode se tornar mas precso Exemplo Suponha que a relação Na / K fo determnada para ser 3 vezes mas mportante do que o atrbuto Idade, para realzar a classfcação dos medcamentos Copyrght 005 John Wley & Sons, Inc. 4 1
22 10/4/010 Quantfcando a relevânca de um atrbuto: alongando os exos (contnuação) A dstânca entre os regstros A, B e C em relação ao novo regstro é calculada da segunte forma: where z Na / 3, z 1 K Age d ( new, A ) ( ) + (( 3)( )) d ( new, B ) ( ) + (( 3)( )) d ( new, C ) ( ) + (( 3)( )) A classfcação não muda pelo alongamento dos exos para a razão Na / K Em mutas stuações, alongar os exos leva a uma maor precsão através da quantfcação da relevânca de cada varável utlzada na decsão de classfcação Copyrght 005 John Wley & Sons, Inc. 43 Consderações sobre o Banco de Dados Métodos de aprendzado baseados em nstânca se benefcam por ter acesso à exemplos de aprendzagem, compostos por mutas combnações de valores dos atrbutos O conjunto de dados deve ser equlbrado, de modo a nclur um número sufcente de regstros com classfcações comuns e menos comuns Uma abordagem para o equlíbro do conjunto de dados é a redução da proporção de regstros com classfcações mas comuns Restrções de espaço na memóra prncpal pode lmtar o tamanho do conjunto de trenamento utlzado O conjunto de trenamento pode ser reduzdo de modo a nclur apenas aqueles regstros que ocorrem perto dos lmtes, frontera de uma classfcação Copyrght 005 John Wley & Sons, Inc. 44
23 10/4/010 Algortmo dos k-vznhos mas próxmos para estmação e predção O algortmo dos k-vznhos mas próxmos pode ser utlzado para a estmatva e prevsão de varáves-alvo de valores contínuos Um método usado para fazer sso é méda localmente Ponderada Exemplo Vamos estmar a pressão sangunea sstólca de um pacente de 17 anos de dade com relação Na / K gual a 1,5, usando k 3 Os predtores são Na / K e a dade e a varável-alvo é a BP Os três vznhos (A, B e C) do conjunto de trenamento são mostrados abaxo Record Age Na/K BP Age MMN Na/K MMN Dstance New ? A B C Copyrght 005 John Wley & Sons, Inc. 45 Algortmo dos k-vznhos mas próxmos para estmação e predção (contnuação) Suponha que a BP tem um ntervalo 80 e mínmo 90 Nós também estcamos os exos para a razão Na / K, para refletr a sua mportânca na estmatva da BP. Além dsso, usamos o nverso do quadrado das dstâncas para os pesos ŷ new w y w w 1, x where for exstng records x1, x, L d ( new, x ) k A pressão arteral sstólca estmada para o novo regstro é: Como o regstro A está mas próxmo do novo regstro, seu valor de pressão arteral de 10 dá uma contrbução sgnfcatva para o valor estmado da BP yˆ new w y w Copyrght 005 John Wley & Sons, Inc. 46 3
24 10/4/010 Escolhendo k Qual é o melhor valor de k? Não há necessaramente uma solução óbva K menor Escolher um valor pequeno para k pode conduzr o algortmo a overft os dados Ruído ou anomalas podem afectar ndevdamente a classfcação K maor Valores maores tendem a suavzar os valores de dados dossncrátcos ou obscuros no conjunto de trenamento Se os valores se tornam muto grandes, valores locas nteressantes serão gnorados Copyrght 005 John Wley & Sons, Inc. 47 Escolhendo k (contnuação) Escolhendo o valor aproprado para k exge o equlíbro destas consderações Usando a valdação cruzada pode ajudar a determnar o valor de k, escolhendo um valor que mnmza o erro de classfcação Copyrght 005 John Wley & Sons, Inc. 48 4
Estatística II Antonio Roque Aula 18. Regressão Linear
Estatístca II Antono Roque Aula 18 Regressão Lnear Quando se consderam duas varáves aleatóras ao mesmo tempo, X e Y, as técncas estatístcas aplcadas são as de regressão e correlação. As duas técncas estão
Leia mais2 Incerteza de medição
2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr
Leia mais7 - Distribuição de Freqüências
7 - Dstrbução de Freqüêncas 7.1 Introdução Em mutas áreas há uma grande quantdade de nformações numércas que precsam ser dvulgadas de forma resumda. O método mas comum de resumr estes dados numércos consste
Leia maisFigura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma
Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas
Leia maisProf. Lorí Viali, Dr.
Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das
Leia maisAlgarismos Significativos Propagação de Erros ou Desvios
Algarsmos Sgnfcatvos Propagação de Erros ou Desvos L1 = 1,35 cm; L = 1,3 cm; L3 = 1,30 cm L4 = 1,4 cm; L5 = 1,7 cm. Qual destas meddas está correta? Qual apresenta algarsmos com sgnfcado? O nstrumento
Leia maisCORRELAÇÃO E REGRESSÃO
CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr
Leia mais1. CORRELAÇÃO E REGRESSÃO LINEAR
1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação
Leia maisProf. Lorí Viali, Dr.
Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca
Leia maisAnálise de Regressão
Análse de Regressão método estatístco que utlza relação entre duas ou mas varáves de modo que uma varável pode ser estmada (ou predta) a partr da outra ou das outras Neter, J. et al. Appled Lnear Statstcal
Leia maisMOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES
MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES 1. Obtenha os estmadores dos coefcentes lnear e angular de um modelo de regressão lnear smples utlzando o método
Leia maisCurso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos
Curso de extensão, MMQ IFUSP, feverero/4 Alguns exercíco báscos I Exercícos (MMQ) Uma grandeza cujo valor verdadero x é desconhecdo, fo medda três vezes, com procedmentos expermentas dêntcos e, portanto,
Leia maisAnálise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA
Análse de Regressão Profa Alcone Mranda dos Santos Departamento de Saúde Públca UFMA Introdução Uma das preocupações estatístcas ao analsar dados, é a de crar modelos que explctem estruturas do fenômeno
Leia maisOs modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.
MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,
Leia maisO problema da superdispersão na análise de dados de contagens
O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão
Leia mais1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA
1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 014 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de
Leia maisUMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR
UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EATAS DEPARTAMENTO DE ESTATÍSTICA UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR
Leia maisReconhecimento Estatístico de Padrões
Reconhecmento Estatístco de Padrões X 3 O paradgma pode ser sumarzado da segunte forma: Cada padrão é representado por um vector de característcas x = x1 x2 x N (,,, ) x x1 x... x d 2 = X 1 X 2 Espaço
Leia maisMOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel
MOQ-14 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Prncípos de cração de modelos empírcos: Modelos (matemátcos, lógcos, ) são comumente utlzados na
Leia maisCAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA
CAPÍTULO DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA. A MÉDIA ARITMÉTICA OU PROMÉDIO Defnção: é gual a soma dos valores do grupo de dados dvdda pelo número de valores. X x Soma dos valores de x número de
Leia maisClassificação de Padrões
Classfcação de Padrões Introdução Classfcadores Paramétrcos Classfcadores Sem-paramétrcos Redução da Dmensonaldade Teste de Sgnfcânca 6.345 Sstema de Reconhecmento de Voz Teora Acústca da Produção de Voz
Leia mais3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas
3.6. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas
Leia maisAnálise de Variância. Comparação de duas ou mais médias
Análse de Varânca Comparação de duas ou mas médas Análse de varânca com um fator Exemplo Um expermento fo realzado para se estudar dabetes gestaconal. Desejava-se avalar o comportamento da hemoglobna (HbA)
Leia mais3 Subtração de Fundo Segmentação por Subtração de Fundo
3 Subtração de Fundo Este capítulo apresenta um estudo sobre algortmos para a detecção de objetos em movmento em uma cena com fundo estátco. Normalmente, estas cenas estão sob a nfluênca de mudanças na
Leia maisNOTA II TABELAS E GRÁFICOS
Depto de Físca/UFMG Laboratóro de Fundamentos de Físca NOTA II TABELAS E GRÁFICOS II.1 - TABELAS A manera mas adequada na apresentação de uma sére de meddas de um certo epermento é através de tabelas.
Leia maisMinistério da Educação. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Cálculo do Conceito Preliminar de Cursos de Graduação
Mnstéro da Educação Insttuto Naconal de Estudos e Pesqusas Educaconas Aníso Texera Cálculo do Conceto Prelmnar de Cursos de Graduação Nota Técnca Nesta nota técnca são descrtos os procedmentos utlzados
Leia maisContabilometria. Aula 8 Regressão Linear Simples
Contalometra Aula 8 Regressão Lnear Smples Orgem hstórca do termo Regressão Le da Regressão Unversal de Galton 1885 Galton verfcou que, apesar da tendênca de que pas altos tvessem flhos altos e pas axos
Leia maisTipo tratamento idade Tipo tratamento sexo
Modelos de Regressão em Saúde Rejane Sobrno Pnhero Tâna Zdenka Gullén de Torres Modelos de Regressão Famíla de técncas estatístcas város fatores meddos (predtor, covarável, varável ndependente) relaconados
Leia mais2 Lógica Fuzzy Introdução
2 Lógca Fuzzy 2.. Introdução A lógca fuzzy é uma extensão da lógca booleana, ntroduzda pelo Dr. Loft Zadeh da Unversdade da Calfórna / Berkeley no ano 965. Fo desenvolvda para expressar o conceto de verdade
Leia maisAULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores.
Estatístca Aplcada à Engenhara AULA 4 UNAMA - Unversdade da Amazôna.8 MEDIDA EPARATRIZE ão valores que separam o rol (os dados ordenados) em quatro (quarts), dez (decs) ou em cem (percents) partes guas.
Leia maisFaculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu
1 Programação Não Lnear com Restrções Aula 9: Programação Não-Lnear - Funções de Váras Varáves com Restrções Ponto Regular; Introdução aos Multplcadores de Lagrange; Multplcadores de Lagrange e Condções
Leia maisAEP FISCAL ESTATÍSTICA
AEP FISCAL ESTATÍSTICA Módulo 11: Varáves Aleatóras (webercampos@gmal.com) VARIÁVEIS ALEATÓRIAS 1. Conceto de Varáves Aleatóras Exemplo: O expermento consste no lançamento de duas moedas: X: nº de caras
Leia maisANÁLISE DA VARIÂNCIA DA REGRESSÃO
ANÁLISE DA VARIÂNCIA DA REGRESSÃO PROCEDIMENTO GERAL DE REGRESSÃO Em um modelo de análse de varânca, como no DIA, o fator em estudo pode ser quanttatvo ou qualtatvo. FATOR QUANTITATIVO: é aquele cujos
Leia maisGestão e Teoria da Decisão
Gestão e Teora da Decsão Logístca e Gestão de Stocks Estratégas de Localzação Lcencatura em Engenhara Cvl Lcencatura em Engenhara do Terrtóro 1 Estratéga de Localzação Agenda 1. Classfcação dos problemas
Leia maisProf. Cláudio Serra, Esp. 1. Produção de Leite x índice Pluviométrico y = 0.8x R 2 =
Análse de Regressão Cap.. Introdução Análse de regressão é uma técnca de modelagem utlzada para analsar a relação entre uma varável dependente () e uma ou mas varáves ndependentes,, 3,..., n. O ojetvo
Leia maisMedidas e resultados em um experimento.
Meddas e resultados em um expermento. I- Introdução O estudo de um fenômeno natural do ponto de vsta expermental envolve algumas etapas que, mutas vezes, necesstam de uma elaboração préva de uma seqüênca
Leia maisAnálise Descritiva com Dados Agrupados
Análse Descrtva com Dados Agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas descrtvas
Leia maisx Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:
Professora Janete Perera Amador 1 8 Meddas Descrtvas Vmos anterormente que um conjunto de dados pode ser resumdo através de uma dstrbução de freqüêncas, e que esta pode ser representada através de uma
Leia maisAnálise de Variância. Introdução. Rejane Sobrino Pinheiro Tania Guillén de Torres
Análse de Varânca Rejane Sobrno Pnhero Tana Gullén de Torres Análse de Varânca Introdução Modelos de análse de varânca consttuem uma classe de modelos que relaconam uma varável resposta contínua com varáves
Leia maisCONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO 2 DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogério Rodrigues
CONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogéro Rodrgues I) TABELA PRIMITIVA E DISTRIBUIÇÃO DE FREQÜÊNCIA : No processo de amostragem, a forma de regstro mas
Leia mais2. Validação e ferramentas estatísticas
. Valdação e ferramentas estatístcas Mutos aspectos relaconados à socedade são suportados, de alguma forma, por algum tpo de medção analítca. Mlhões de medções analítcas são realzadas todos os das, em
Leia maisMODELO RECEPTOR MODELO RECEPTOR MODELO RECEPTOR. Princípio do modelo:
MODELO RECEPTOR Não modela a dspersão do contamnante. MODELO RECEPTOR Prncípo do modelo: Atacar o problema de dentfcação da contrbução da fonte em ordem nversa, partndo da concentração do contamnante no
Leia maisPROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011
Instruções: PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 00/0 Cada uestão respondda corretamente vale (um) ponto. Cada uestão respondda ncorretamente vale - (menos um) ponto. Cada uestão
Leia maisPrograma de Certificação de Medidas de um laboratório
Programa de Certfcação de Meddas de um laboratóro Tratamento de dados Elmnação de dervas Programa de calbração entre laboratóros Programa nterno de calbração justes de meddas a curvas Tratamento dos resultados
Leia maisAplicações de Estimadores Bayesianos Empíricos para Análise Espacial de Taxas de Mortalidade
Aplcações de Estmadores Bayesanos Empírcos para Análse Espacal de Taxas de Mortaldade Alexandre E. dos Santos, Alexandre L. Rodrgues, Danlo L. Lopes Departamento de Estatístca Unversdade Federal de Mnas
Leia maisTeoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva
Teora da Regressão Espacal Aplcada a Modelos Genércos Sérgo Alberto Pres da Slva ITENS DE RELACIONAMENTOS Tópcos Báscos da Regressão Espacal; Banco de Dados Geo-Referencados; Modelos Genércos Robustos;
Leia maisAo se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.
Estatístca Dscplna de Estatístca 0/ Curso Superor de tecnólogo em Gestão Ambental Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos
Leia mais5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial
5 Métodos de cálculo do lmte de retenção em função da ruína e do captal ncal Nesta dssertação serão utlzados dos métodos comparatvos de cálculo de lmte de retenção, onde ambos consderam a necessdade de
Leia maisINTRODUÇÃO À PROBABILIDADE. A probabilidade é uma medida da incerteza dos fenômenos. Traduz-se por um número real compreendido de 0 ( zero) e 1 ( um).
INTRODUÇÃO À PROILIDDE teora das probabldade nada mas é do que o bom senso transformado em cálculo probabldade é o suporte para os estudos de estatístca e expermentação. Exemplos: O problema da concdênca
Leia maisRegressão e Correlação Linear
Probabldade e Estatístca I Antono Roque Aula 5 Regressão e Correlação Lnear Até o momento, vmos técncas estatístcas em que se estuda uma varável de cada vez, estabelecendo-se sua dstrbução de freqüêncas,
Leia maisCQ110 : Princípios de FQ
CQ 110 Prncípos de Físco Químca Curso: Farmáca Prof. Dr. Marco Vdott mvdott@ufpr.br 1 soluções eletrolítcas Qual a dferença entre uma solução 1,0 mol L -1 de glcose e outra de NaCl de mesma concentração?
Leia maisPROPOSTA DE UM MÉTODO DE CLASSIFICAÇÃO BASEADO EM DENSIDADE PARA A DETERMINAÇÃO DO NÚMERO IDEAL DE GRUPOS EM PROBLEMAS DE CLUSTERIZAÇÃO
PROPOSTA DE UM MÉTODO DE CLASSIFICAÇÃO BASEADO EM DENSIDADE PARA A DETERMINAÇÃO DO NÚMERO IDEAL DE GRUPOS EM PROBLEMAS DE CLUSTERIZAÇÃO Gustavo Slva Semaan 1, Marcelo Db Cruz 2, José André de Moura Brto
Leia maisAnálise de influência
Análse de nfluênca Dzemos que uma observação é nfluente caso ela altere, de forma substancal, alguma propredade do modelo ajustado (como as estmatvas dos parâmetros, seus erros padrões, valores ajustados...).
Leia maisCLUSTERIZAÇÃO AUTOMÁTICA NA REDUÇÃO DA DIMENSIONALIDADE DOS DADOS
CLUSTERIZAÇÃO AUTOMÁTICA NA REDUÇÃO DA DIMENSIONALIDADE DOS DADOS Éldman de Olvera Nunes Escola de Admnstração do Exércto Rua Terrtóro do Amapá, 455, 41.540-830, Salvador, BA, Brasl eldman.nunes@gmal.com
Leia maisX = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)
Estatístca p/ Admnstração II - Profª Ana Cláuda Melo Undade : Probabldade Aula: 3 Varável Aleatóra. Varáves Aleatóras Ao descrever um espaço amostral de um expermento, não especfcamos que um resultado
Leia maisGabarito da Lista de Exercícios de Econometria I
Gabarto da sta de Exercícos de Econometra I Professor: Rogéro lva Mattos Montor: eonardo enrque A. lva Questão Y X y x xy x ŷ ˆ ˆ y ŷ (Y - Y ) (X - X ) (Ŷ - Y ) 360 00-76 -00 35.00 40.000 36-4 30.976 3076
Leia maisRepresentação e Descrição de Regiões
Depos de uma magem ter sdo segmentada em regões é necessáro representar e descrever cada regão para posteror processamento A escolha da representação de uma regão envolve a escolha dos elementos que são
Leia maisIMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO
IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO Alne de Paula Sanches 1 ; Adrana Betâna de Paula Molgora 1 Estudante do Curso de Cênca da Computação da UEMS, Undade Unverstára de Dourados;
Leia maisDEFINIÇÃO - MODELO LINEAR GENERALIZADO
DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto
Leia maisPRESSUPOSTOS DO MODELO DE REGRESSÃO
PREUPOTO DO MODELO DE REGREÃO A aplcação do modelo de regressão lnear múltpla (bem como da smples) pressupõe a verfcação de alguns pressupostos que condensamos segudamente.. Os erros E são varáves aleatóras
Leia maisReconhecimento de Padrões
Capítulo 2 Reconhecmento de Padrões 2.1 O que é reconhecmento de padrões? Há duas maneras de se reconhecer e/ou classfcar um padrão [CONNEL, S. D. & JAIN, A. K. (2001)]: () classfcação supervsonada: o
Leia maisMÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel
MÉTODOS MULTIVARIADOS Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multvarados 1 Análse de componentes prncpas Aplcações de análse de componentes
Leia maisMedida de Quatro Pontas Autor: Mauricio Massazumi Oka Versão 1.0 (janeiro 2000)
Medda de Quatro Pontas Autor: Maurco Massazum Oka Versão.0 (janero 000) Introdução A técnca de medda de quatro pontas é largamente usada para a medda de resstvdades e resstêncas de folha. O método em s
Leia maisANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS. Palavras-chave: Tensões térmicas, Propriedades variáveis, Condução de calor, GITT
ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS Dnz, L.S. Santos, C.A.C. Lma, J.A. Unversdade Federal da Paraíba Laboratóro de Energa Solar LES/DTM/CT/UFPB 5859-9 - João Pessoa - PB, Brasl e-mal: cabral@les.ufpb.br
Leia maisCAPÍTULO 2 - Estatística Descritiva
INF 16 Prof. Luz Alexandre Peternell CAPÍTULO - Estatístca Descrtva Exercícos Propostos 1) Consderando os dados amostras abaxo, calcular: méda artmétca, varânca, desvo padrão, erro padrão da méda e coefcente
Leia maisIntrodução a Combinatória- Aplicações, parte II
Introdução a Combnatóra- Aplcações, AULA 7 7.1 Introdução Nesta aula vamos estudar aplcações um pouco dferentes das da aula passada. No caso estudaremos arranjos com repetção, permutações crculares e o
Leia maisO que heterocedasticidade? Heterocedasticidade. Por que se preocupar com heterocedasticidade? Exemplo de heterocedasticidade.
Heterocedastcdade y = β 0 + β + β + β k k + u O que heterocedastcdade? Lembre-se da hpótese de homocedastcdade: condconal às varáves eplcatvas, a varânca do erro, u, é constante Se sso não for verdade,
Leia maisPROJEÇÕES POPULACIONAIS PARA OS MUNICÍPIOS E DISTRITOS DO CEARÁ
GOVERNO DO ESTADO DO CEARÁ SECRETARIA DO PLANEJAMENTO E GESTÃO - SEPLAG INSTITUTO DE PESQUISA E ESTRATÉGIA ECONÔMICA DO CEARÁ - IPECE NOTA TÉCNICA Nº 29 PROJEÇÕES POPULACIONAIS PARA OS MUNICÍPIOS E DISTRITOS
Leia maisDependência Espacial de espécies nativas em fragmentos. florestais
Dependênca Espacal de espéces natvas em fragmentos 1 Introdução florestas 1 Mestranda em Engenhara Florestal LEMAF/DCF UFLA. e-mal: cunhadase@yahoo.com.br 2 Mestrando em Engenhara Florestal LEMAF/DCF UFLA.
Leia mais5.1 Seleção dos melhores regressores univariados (modelo de Índice de Difusão univariado)
5 Aplcação Neste capítulo será apresentada a parte empírca do estudo no qual serão avalados os prncpas regressores, um Modelo de Índce de Dfusão com o resultado dos melhores regressores (aqu chamado de
Leia maisPalavras-Chave: Métodos Interativos da Potência e Inverso, Sistemas Lineares, Autovetores e Autovalores.
MSc leandre Estáco Féo ssocação Educaconal Dom Bosco - Faculdade de Engenhara de Resende Caa Postal 8.698/87 - CEP 75-97 - Resende - RJ Brasl Professor e Doutorando de Engenhara aefeo@yahoo.com.br Resumo
Leia maisCAPÍTULO VI Introdução ao Método de Elementos Finitos (MEF)
PMR 40 - Mecânca Computaconal CAPÍTULO VI Introdução ao Método de Elementos Fntos (MEF). Formulação Teórca - MEF em uma dmensão Consderemos a equação abao que representa a dstrbução de temperatura na barra
Leia maisCAPÍTULO 9 REGRESSÃO LINEAR PPGEP REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES UFRGS. Regressão Linear Simples
CAPÍTULO 9 REGREÃO LINEAR IMPLE REGREÃO LINEAR IMPLE UFRG Em mutos problemas há duas ou mas varáves que são relaconadas, e pode ser mportante modelar essa relação. Por exemplo, a resstênca à abrasão de
Leia maisPUCPR- Pontifícia Universidade Católica Do Paraná PPGIA- Programa de Pós-Graduação Em Informática Aplicada PROF. DR. JACQUES FACON
1 PUCPR- Pontfíca Unversdade Católca Do Paraná PPGIA- Programa de Pós-Graduação Em Informátca Aplcada PROF. DR. JACQUES FACON LIMIARIZAÇÃO ITERATIVA DE LAM E LEUNG Resumo: A proposta para essa sére de
Leia maisRealimentação negativa em ampliadores
Realmentação negatva em ampladores 1 Introdução necessdade de amplfcadores com ganho estável em undades repetdoras em lnhas telefôncas levou o Eng. Harold Black à cração da técnca denomnada realmentação
Leia maisDESENVOLVIMENTO DE UM PRÉ-PROCESSADOR PARA ANÁLISE ISOGEOMÉTRICA
DESENVOLVIMENTO DE UM PRÉ-PROCESSADOR PARA ANÁLISE ISOGEOMÉTRICA Pedro Luz Rocha Evandro Parente Junor pedroluzrr04@gmal.com evandroparentejr@gmal.com Laboratóro de Mecânca Computaconal e Vsualzação, Unversdade
Leia mais2) Como há 6 tipos de peso, e estamos avaliando 2 peças, o espaço amostral será uma matriz 6 x 6:
Lsta de Exercícos - Probabldade INE 700 GABARITO LISTA DE EXERÍIOS PROBABILIDADE ) Vamos medr o tempo de duração da lâmpada. Ao lgarmos a lâmpada ela pode não funconar, ou durar um tempo ndetermnado. a)
Leia maisESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL
Revsta Matz Onlne ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL Valera Ap. Martns Ferrera Vvane Carla Fortulan Valéra Aparecda Martns. Mestre em Cêncas pela Unversdade de São Paulo- USP.
Leia maisDiferença entre a classificação do PIB per capita e a classificação do IDH
Curso Bem Estar Socal Marcelo Ner - www.fgv.br/cps Metas Socas Entre as mutas questões decorrentes da déa de se mplementar uma proposta de metas socas temos: Qual a justfcatva econômca para a exstênca
Leia maisNotas Processos estocásticos. Nestor Caticha 23 de abril de 2012
Notas Processos estocástcos Nestor Catcha 23 de abrl de 2012 notas processos estocástcos 2 O Teorema de Perron Frobenus para matrzes de Markov Consdere um processo estocástco representado por um conunto
Leia mais2 Máquinas de Vetor Suporte 2.1. Introdução
Máqunas de Vetor Suporte.. Introdução Os fundamentos das Máqunas de Vetor Suporte (SVM) foram desenvolvdos por Vapnk e colaboradores [], [3], [4]. A formulação por ele apresentada se basea no prncípo de
Leia maisEXPANSÃO TÉRMICA DOS LÍQUIDOS
Físca II Protocolos das Aulas Prátcas 01 DF - Unversdade do Algarve EXPANSÃO ÉRMICA DOS ÍQUIDOS 1 Resumo Estuda-se a expansão térmca da água destlada e do glcerol utlzando um pcnómetro. Ao aquecer-se,
Leia maisESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Linear
ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11 EERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Lnear 4. EERCÍCIOS PARA RESOLVER NAS AULAS 4.1. O gestor de marketng duma grande cadea de supermercados quer determnar
Leia maisVariabilidade Espacial do Teor de Água de um Argissolo sob Plantio Convencional de Feijão Irrigado
Varabldade Espacal do Teor de Água de um Argssolo sob Planto Convenconal de Fejão Irrgado Elder Sânzo Aguar Cerquera 1 Nerlson Terra Santos 2 Cásso Pnho dos Res 3 1 Introdução O uso da água na rrgação
Leia maisEstatística stica Descritiva
AULA1-AULA5 AULA5 Estatístca stca Descrtva Prof. Vctor Hugo Lachos Davla oo que é a estatístca? Para mutos, a estatístca não passa de conjuntos de tabelas de dados numércos. Os estatístcos são pessoas
Leia maisAnálise dos resíduos e Outlier, Alavancagem e Influência
Análse dos resíduos e Outler, Alavancagem e Influênca Dagnóstco na análse de regressão Usadas para detectar problemas com o ajuste do modelo de regressão. Presença de observações mal ajustadas (pontos
Leia maisQ 1-1,5(Q3-Q1) < X i < Q 3 + 1,5(Q 3 -Q 1 ) Q 3 +1,5(Q 3 -Q 1 ) < X i < Q 3 +3(Q 3 -Q 1 ) Q 1 3(Q 3 -Q 1 ) < X i < Q 1 1,5(Q 3 -Q 1 )
DIGRM OX-PLOT E CRCTERIZÇÃO DE OUTLIERS E VLORES EXTREMOS Outlers e valores extremos são aqueles que estão muto afastados do centro da dstrbução. Uma forma de caracterzá-los é através do desenho esquemátco
Leia maisRedução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma
Redução dos Dados Júlo Osóro Meddas Característcas da Dstrbução Tendênca Central (Localzação) Varação (Dspersão) Forma 1 Meddas Característcas da Dstrbução Meddas Estatístcas Tendênca Central Dspersão
Leia maisCapítulo 16: Equilíbrio Geral e Eficiência Econômica
Capítulo 6: Equlíbro Geral e Efcênca Econômca Pndck & Rubnfeld, Capítulo 6, Equlíbro Geral::EXERCÍCIOS. Em uma análse de trocas entre duas pessoas, suponha que ambas possuam dêntcas preferêncas. A curva
Leia maisMecanismos de Escalonamento
Mecansmos de Escalonamento 1.1 Mecansmos de escalonamento O algortmo de escalonamento decde qual o próxmo pacote que será servdo na fla de espera. Este algortmo é um dos mecansmos responsáves por dstrbur
Leia maisAULA EXTRA Análise de Regressão Logística
1 AULA EXTRA Análse de Regressão Logístca Ernesto F. L. Amaral 13 de dezembro de 2012 Metodologa de Pesqusa (DCP 854B) VARIÁVEL DEPENDENTE BINÁRIA 2 O modelo de regressão logístco é utlzado quando a varável
Leia maisNOTAS DE AULA DA DISCIPLINA CE076
5. COMPONENTES PRINCIPAIS 5. Introdução A análse de Comonentes Prncas está relaconada com a exlcação da estrutura de covarânca or meo de oucas combnações lneares das varáves orgnas em estudo, ou sea, rocura
Leia maisCAPÍTULO 3 CALIBRAÇÃO DE FASE INTERFEROMÉTRICA
CAPÍTULO 3 CALIBRAÇÃO DE FASE INTERFEROMÉTRICA 3. Método Utlzando Ponto de Controle O uso de pontos de controle é o meo mas exato para a determnação do offset da fase nterferométrca. Normalmente utlza-se
Leia maisEstudo e Previsão da Demanda de Energia Elétrica. Parte II
Unversdade Federal de Paraná Setor de Tecnologa Departamento de Engenhara Elétrca Estudo e Prevsão da Demanda de Energa Elétrca Parte II Prof: Clodomro Unshuay-Vla Etapas de um Modelo de Prevsão Objetvo
Leia maisExercícios. Utilizando um novo critério, essa banca avaliadora resolveu descartar a maior e a menor notas atribuídas ao professor.
Estatístca Exercícos 1. (Enem 013) Fo realzado um levantamento nos 00 hotés de uma cdade, no qual foram anotados os valores, em reas, das dáras para um quarto padrão de casal e a quantdade de hotés para
Leia maisSELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE
SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP, NO PÓLO GESSEIRO DO ARARIPE Jáder da Slva Jale Joselme Fernandes Gouvea Alne Santos de Melo Denns Marnho O R Souza Kléber Napoleão Nunes de
Leia mais3 Aproximador de Função para Simulador de Reservatório Petrolífero
Aproxmador de Função para Smulador de Reservatóro Petrolífero 37 3 Aproxmador de Função para Smulador de Reservatóro Petrolífero 3.1. Introdução O desenvolvmento de um campo petrolífero pode ser entenddo
Leia maisSistemas Robóticos. Sumário. Introdução. Introdução. Navegação. Introdução Onde estou? Para onde vou? Como vou lá chegar?
Sumáro Sstemas Robótcos Navegação Introdução Onde estou? Para onde vou? Como vou lá chegar? Carlos Carreto Curso de Engenhara Informátca Ano lectvo 2003/2004 Escola Superor de Tecnologa e Gestão da Guarda
Leia maisMAPEAMENTO DA VARIABILIDADE ESPACIAL
IT 90 Prncípos em Agrcultura de Precsão IT Departamento de Engenhara ÁREA DE MECANIZAÇÃO AGRÍCOLA MAPEAMENTO DA VARIABILIDADE ESPACIAL Carlos Alberto Alves Varella Para o mapeamento da varabldade espacal
Leia mais