Métodos Supervisionados vs. não supervisionados

Tamanho: px
Começar a partir da página:

Download "Métodos Supervisionados vs. não supervisionados"

Transcrição

1 10/4/010 Capítulo 5 Algortmo dos k-vznhos mas próxmos Prepared by James Steck, Graduate Assstant DESCOBRINDO CONHECIMENTO NOS DADOS DANIEL T. LAROSE, PH.D. Copyrght 005 John Wley & Sons, Inc. 1 Métodos Supervsonados vs. não supervsonados Os métodos de mneração de dados são classfcados como supervsonados ou não supervsonados Métodos não supervsonados Uma varável alvo não é especfcada Em vez dsso, o algortmo procura por padrões e estruturas entre as varáves Clusterzação é o método não supervsonado mas comum Por exemplo, consultores polítcos podem analsar clusters de eletores em dstrtos eletoras que podem ser favoráves ao seu canddato Varáves mportantes tas como sexo, dade, renda e raça são entradas do algortmo de clusterzação Copyrght 005 John Wley & Sons, Inc. 1

2 10/4/010 Métodos Supervsonados vs. não supervsonados (contnuação) Perfs de eletores para angarar fundos e fazer publcdade são crados Métodos supervsonados Uma varável alvo é especfcada O algortmo "aprende" a partr dos exemplos, determnando quas os valores das varáves predtoras estão assocados com dferentes valores da varável alvo Por exemplo, os métodos de regressão dscutdos no Capítulo 4 são supervsonadas. Os valores observados da varável resposta (alvo) são ldos pelo algortmo dos mínmos quadrados, enquanto ele tenta mnmzar o erro de predção Todos os métodos de classfcação nos capítulos 5-7 são métodos supervsonados, nclundo: Árvores de Decsão, Redes Neuras, e k- vznhos mas próxmos Copyrght 005 John Wley & Sons, Inc. 3 Metodologa para modelagem supervsonada Métodos de mneração de dados supervsonados usam conjuntos de dados de trenamento, teste e valdação como parte da construção do modelo e processo de avalação Trenamento O conjunto de trenamento nclu regstros com as varáves predtoras e valores pré-classfcados para a varável alvo Esta é a fase ncal onde um modelo de mneração de dados provsóro é construído usando o conjunto de trenamento O modelo "aprende" a partr dos exemplos do conjunto de trenamento O que acontece se o modelo de aplcar cegamente todos os padrões aprenddos a partr do conjunto de trenamento a dados futuros? Copyrght 005 John Wley & Sons, Inc. 4

3 10/4/010 Metodologa para modelagem supervsonada (contnuação) Por exemplo, suponha que todos os clentes em um conjunto de trenamento com o nome "Davd" concdentemente estejam na faxa de renda alta Um modelo de mneração de dados que "memorza" essa dossncrasa presente no conjunto de trenamento está na verdade overfttng os dados Muto provavelmente nós não queremos nosso modelo aplcando esta regra a dados futuros ou dados não prevamente conhecdos Portanto, o passo segunte no processo é examnar o desempenho do modelo de dados provsóro usando um conjunto dferente de dados Copyrght 005 John Wley & Sons, Inc. 5 Metodologa para modelagem supervsonada (contnuação) Teste O conjunto de teste é uma parte dos dados ndependente do conjunto de trenamentoque fo utlzado para construr o modelo de dados provsóro Os verdaderos valores da varável alvo no conjunto de teste estão temporaramente esconddos do modelo de dados provsóro O modelo de dados provsóro smplesmente classfca os regstros no conjunto de teste de acordo com as regras e padrões que aprendeu a partr dos regstros do conjunto de trenamento O desempenho do modelo de dados provsóro é avalada comparando a sua classfcação em relação aos valores reas de varável alvo O modelo de dados provsóro é ajustado num esforço para mnmzar a taxa de erro no conjunto de teste Copyrght 005 John Wley & Sons, Inc. 6 3

4 10/4/010 Metodologa para modelagem supervsonada (contnuação) Valdação Em seguda, ao modelo de dados ajustado é aplcada um outro conjunto de dados chamado o conjunto de valdação O conjunto de valdação é outro pedaço do conjunto dos dados ndependente dos conjuntos de trenamento e de teste O desempenho do modelo de dados ajustado é avalado com conjunto de valdação Se necessáro, o modelo de dados ajustado é modfcado para mnmzar a taxa de erro no conjunto de valdação Estmatvas do desempenho do modelo de dados para dados futuros ou não prevamente conhecdos são computados usando meddas de avalação aplcadas aos resultados obtdos ao classfcar o conjunto de valdação Copyrght 005 John Wley & Sons, Inc. 7 Metodologa para modelagem supervsonada (contnuação) Tranng Set (pre-classfed) Use tranng set to generate a provsonal data mnng model. Provsonal data mnng model. Test Set Apply provsonal model to test set. Adjust provsonal model to mnmze error rate on test set. Adjusted data mnng model. Valdaton Set Apply adjusted model to valdaton set. Adjust the adjusted model to mnmze error rate on valdaton set. Fnal data mnng model. Copyrght 005 John Wley & Sons, Inc. 8 4

5 10/4/010 Metodologa para modelagem supervsonada (contnuação) Underfttng versus Overfttng Geralmente, a precsão do modelo de dados provsóro não é tão elevada quanto aplcado nos conjuntos de teste ou valdação, em comparação aos resultados obtdos com o conjunto de trenamento Isso ocorre quando um modelo de dados tende a overft o conjunto de trenamento, aprendendo todas as tendêncas ou estruturas possíves Na construção do modelo, há uma tensão constante entre desenvolver modelos que são complexas e conseguem generalzar bem Um modelo de dados que permte atngr alta precsão sobre o conjunto de trenamento resulta em aumento da complexdade do modelo No entanto, à medda que aumenta a complexdade do modelo, a generalzação de um modelo de dados para os conjuntos de dados de teste e de valdação dmnu Copyrght 005 John Wley & Sons, Inc. 9 Metodologa para modelagem supervsonada (contnuação) Esta fgura mostra que ncalmente, à medda que a complexdade do modelo aumenta, a taxa de erro dmnu para ambosos conjuntos de trenamento e valdação Em aumentado a complexdade do modelo, a taxa de erro no conjunto de trenamento dmnu No entanto, a taxa de erro no conjunto de valdação começa a aumentar Optmal Level of Model Complexty Error Rate Error Rate on Valdaton Set Underfttng Overfttng Error Rate on Tranng Set Complexty of Model Copyrght 005 John Wley & Sons, Inc. 10 5

6 10/4/010 Metodologa para modelagem supervsonada (contnuação) Como a complexdade do modelo aumenta o modelo de dados provsóro começa a memorzar o conjunto de trenamento, ao nvés de generalzá-lo Portanto, o ponto onde a taxa de erro no conjunto de valdação é mnmzada é o nível ótmo de complexdade do modelo Qualquer complexdade do modelo maor do que este ponto consste em overfttng os dados, complexdade do modelo nferor a esse ponto consste em underfttng os dados Copyrght 005 John Wley & Sons, Inc. 11 Bas-Varance Trade-Off Suponhamos que estamos construndo um modelo de dados que tenta separar os pontos claros e escuros (dos valores possíves para uma varável alvo) na fgura acma A lnha reta se benefca pela baxa complexdade, mas produz erros de classfcação. Por exemplo, apenas 6 / 8 pontos abaxo da lnha são claros A lnha curva reduz o erro de classfcação a zero, mas a função de separação é altamente complexa Copyrght 005 John Wley & Sons, Inc. 1 6

7 10/4/010 Bas-Varance Trade-Off (cont d) Estamos nclnados a adotar a solução de alta complexdade para reduzr a taxa de erro No entanto, sso pode produzr um modelo que depende das dossncrasas encontradas no conjunto de trenamento Suponha que adconemos mas pontos de dados ao gráfco de dspersão A lnha reta é apenas lgeramente alterada para acomodar os pontos adconas, este separador smples tem baxa varânca Copyrght 005 John Wley & Sons, Inc. 13 Bas-Varance Trade-Off (cont d) Em contraste, a lnha curva é alterada consderavelmente para manter a sua precsão na classfcação, e portanto tem grande varânca Embora o separador de alta complexdade (lnha curva) tenha bas menor (menor taxa de erro), ele tem grande varânca O separador de baxa complexdade (lnha reta) tem baxa varânca e bas maor (maor taxa de erro) Este exemplo lustra o que é conhecdo como o Bas-Varânca Trade-Off, e é outra manera de descrever overfttng / underfttng Nosso objetvo é construr um modelo de dados onde nem o bas nem a varânca são muto altos Copyrght 005 John Wley & Sons, Inc. 14 7

8 10/4/010 Bas-Varance Trade-Off (cont d) O erro médo quadrado (MSE) é o método mas comum de avalar a precsão de um modelo Dado dos ou mas modelos de dados potencalmente bons, o melhor modelo pode ser dentfcado pao se escolher aquele com o menor MSE O MSE é uma medda adequada, pos combna tanto o bas quanto a varânca em seu cálculo O MSE é uma função do erro de estmação (SSE) e da complexdade do modelo, e é defndo como: MSE varance + bas Esta equação ndca claramente a relação de complementardade entre a varânca o bas Copyrght 005 John Wley & Sons, Inc. 15 Tarefa de Classfcação A classfcaçãoé provavelmente a tarefa mas comun de mneração de dados Exemplos Bancos: determnar se uma aplcação numa hpoteca é boa Educação:Dreconar um aluno no que dz respeto a necessdades especas Medcna: dagnostcar se a doença está presente Le: determnar se o arbítro é fraudulenta Segurança: dentfcar se uma determnada transação fnancera representa uma ameaça terrorsta Copyrght 005 John Wley & Sons, Inc. 16 8

9 10/4/010 Tarefa de Classfcação (contnuação) A classfcação é um método supervsonado e nclu duas ou mas classes para a varável alvo categórca Por exemplo, a varável alvo faxa de renda pode nclur as categoras de Baxa", Méda" e Alta O algortmo examna as relações entre os valores dos campos do predtor (entrada) e dos valores alvo Suponha que queremos classfcar a faxa de renda de uma pessoa com base nos valores da dade, sexo e ocupação de outras pessoas, que estão contdos em um banco de dados Subject Age Gender Occupaton Income Bracket F Software Engneer Hgh 00 8 M Marketng Consultant Mddle M Unemployed Low Copyrght 005 John Wley & Sons, Inc. 17 Tarefa de Classfcação (contnuação) Prmero, o algortmo de classfcação analsa os valores do conjunto de dados para o predtor e as varáves alvo no conjunto de trenamento Desta forma, o algortmo "aprende" quas os valores das varáves predtoras estão assocadas com os valores da varável alvo Por exemplo, mulheres mas velhas podem ser assocadas com os valores da faxa de renda Alta Agora que o modelo de dados fo construído, o algortmo examna novos regstros para o qual a faxa de renda é desconhecda De acordo com as classfcações no conjunto de trenamento, o algortmo classfca os novos regstros Por exemplo, uma mulher de 63 anos de dade pode ser classfcada na faxa de renda Alta" Copyrght 005 John Wley & Sons, Inc. 18 9

10 10/4/010 Algortmo dos k-vznhos mas próxmos O algortmo dos k-vznhos mas próxmos é um exemplo de aprendzagem baseada em nstâncas onde os regstros contendo o conjunto de trenamento são prmero armazenados Em seguda, a classfcação de um novo regstro anda sem classfcaçãoé feta comparando-o com os regstros no conjunto de trenamento com os quas ele é mas parecdo O algortmo dos k-vznhos mas próxmos é usado na maora das vezes para a classfcação, embora também seja aplcável a tarefas de estmatvas e prevsão Exemplo: Pacente1 Lembre-se do capítulo 1, em que estavamos nteressados em classfcar o tpo de medcamento que devera ser prescrta a um pacente O conjunto de trenamento consste em 00 pacentes com os atrbutos sendo a razão Na/K, dade, e medcamentos Nossa tarefa é classfcar o tpo de medcamento que devera ser prescrto a um pacente novo que tem 40 anos de dade e uam razão Na/K gual a 9 Copyrght 005 John Wley & Sons, Inc. 19 Algortmo dos k-vznhos mas próxmos (contnuação) Este gráfco de dspersão de Na/K versus Idade mostra os regstros no conjunto de trenamento com os quas os pacentes 1, e 3 são mas parecdos A drug overlay é mostrada onde os pontos claros medcamento Y, pontos médos medcamento A ou X, e os pontos escuros medcamento B ou C Patent 1 Patent Patent 3 Copyrght 005 John Wley & Sons, Inc. 0 10

11 10/4/010 Algortmo dos k-vznhos mas próxmos (contnuação) Qual medcamento deve ser prescrto ao pacente 1? Como o perfl dos pacentes 1 os colocam no gráfco de dspersão perto doentes medcados com a droga Y, podemos classfcar o pacente 1 como droga Y A todos os pontos perto do pacente 1 são prescrtos medcamentos Y, tornando uma essa classfcação bem smples Exemplo: Pacente Em seguda, vamos classfcar um novo pacente, que tem 17 anos de dade e uma relação Na / K 1,5. Um close-up mostra a vznhança de pontos de trenamento em proxmdade com o pacente C A Patent Copyrght 005 John Wley & Sons, Inc. 1 B Algortmo dos k-vznhos mas próxmos (contnuação) Suponha que nós fazemos k 1 para o nosso algortmo dos k-vznhos mas próxmos Isso sgnfca que classfcamos o pacente de acordo com qualquer que seja o ponto no conjunto de trenamento ao qual ele é mas próxmo Neste caso, o pacente está mas próxmo ao ponto escuro, e, portanto, nós os classfcamos como droga B ou C Suponha que nós fazemos k e classfcamos novamente Pacente usando os k- vznhos mas próxmos Agora, o pacente está mas próxmo a um ponto escuro a um ponto médo Como é que o algortmo decde qual droga prescrever? Um sstema smples de votação não ajuda Copyrght 005 John Wley & Sons, Inc. 11

12 10/4/010 Algortmo dos k-vznhos mas próxmos (contnuação) No entanto, com k 3, o voto determna que dos dos três pontos mas próxmos para o pacente são médos Portanto, o pacente é classfcado como droga A ou X Note que a classfcação do pacente dferu com base no valor escolhdo para k Exemplo: Pacente 3 O pacente 3 tem 47 anos de dade e tem uma relação Na / K de 13,5. Um close-up mostra pacente 3 no centro, com os 3 pontos de trenamento de dados mas próxmos Copyrght 005 John Wley & Sons, Inc. 3 Algortmo dos k-vznhos mas próxmos (contnuação) Com k 1, pacente 3 está mas próxmo ao ponto escuro, com base em uma medda de dstânca Portanto, pacente 3 é classfcado como droga B ou C Usando k ou k 3, o voto não ajuda, já que cada um dos três pontos de trenamento mas próxmos têm dferentes valores de alvo Consderações ao usar os k-vznhos mas próxmos Quantos vznhos devem ser usados? k? Como é medda a dstânca entre os pontos? Como a nformação obtda de dos ou mas vznhos é combnada tomar uma decsão de classfcação? Todos os pontos deveram ter pesos guas, ou alguns pontos deveram ter mas nfluênca? Copyrght 005 John Wley & Sons, Inc. 4 1

13 10/4/010 Função Dstânca Como é defnda a semelhança entre um regstro não classfcados e os seus vznhos? Uma métrca de dstânca é uma função de valores reas d usada para medr a smlardade entre as coordenadas x, y e z com propredades: d( x, y) 0,and d( x, y) 0 f and only f x y d( x, y) d( y, x) d( x, z) d( x, y) + d( y, z) Propredade 1: A dstânca é sempre não-negatva Propredade : comutatva, a dstânca de "A a B" é a dstânca de "B a A" Propredade 3: a desgualdade trângulo dz que, dstânca de "A a C" deve ser menor ou gual à dstânca de "A a B a C" Copyrght 005 John Wley & Sons, Inc. 5 Função Dstânca (contnuação) A função dstânca eucldana é comumente usada para medr a dstânca Exemplo d Eucldean ( x, y) ( x y) where x x, x,..., x 1 represent the m attrbutes m, and y y, y,..., y Suponha um Pacente que tem 0 anos de dade e tem uma relação Na / K 1, e um Pacente B que tem 30 anos e uma relação Na / K 8 Qual é a dstânca eucldana entre estas nstâncas? 1 m deucldean ( x, y) ( x y ) (0 30) + (1 8) Copyrght 005 John Wley & Sons, Inc. 6 13

14 10/4/010 Função Dstânca (contnuação) Ao medr uma dstânca, um ou mas atrbutos podem ter valores muto grandes, em relação aos outros atrbutos Por exemplo, a faxa de renda pode ser escalada 30, ,000, enquanto os anos de servço assumem os valores de Neste caso, os valores dos rendmentos vão sobrepujar a contrbução dos anos de servço Para evtar esta stuação usamos normalzação Normalzação Valores de dados contínuos devem ser normalzados usando a normalzação Mn-Max ou a padronzação Z-Score X mn( X ) Mn - Max Normalzaton max( X ) mn( X ) X mean( X ) Z - Score Standardzaton standard devaton( X ) Copyrght 005 John Wley & Sons, Inc. 7 Função Dstânca (contnuação) Para atrbutos categórcos, a função dstânca eucldana não é aproprada Em vez dsso, defne-se uma função chamada "dferente 0 dfferent( x, y ) 1 f x y otherwse Nós substtuímos dferente (x, y) para cada atrbuto categórco na função dstânca eucldana Exemplo Qual pacente é mas parecdo com um homem de 50 anos de dade: um homem de 0 anos de dade ou uma mulher de 50 anos de dade? Copyrght 005 John Wley & Sons, Inc. 8 14

15 10/4/010 Função Dstânca (contnuação) Seja o Pacente A homem de 50 anos de dade, Pacente B homem de 0 anos de dade, e Pacente C mulher de 50 anos de dade Suponha que a varável dade tem um ntervalo 50, mínmo 10, méda 45 e desvo padrão 15 A tabela contém os valores de dade orgnas, Mn-Max normalzada, e padronzados pela Z-Score Patent Age Age MMN Age Zscore Gender A Male B Male C Female Copyrght 005 John Wley & Sons, Inc. 9 Função Dstânca (contnuação) Idade não normalzada Suponha que não normalzamos a Idade. Calcular a dstânca entre o pacente A e pacente B, e a dstânca entre o pacente A e o pacente C d( A, B) d ( A, C) (50 0) (50 50) Nós determnamos, embora talvez de forma ncorreta, que o pacente C é mas próxmo ao pacente A O pacente B é realmente 30 vezes mas dstante do pacente A que o pacente C é do pacente A? Talvez dexar de normalzar os valores da dade está crando esta dscrepânca? Copyrght 005 John Wley & Sons, Inc

16 10/4/010 Função Dstânca (contnuação) Idade normalzada utlzando o Mn-Max A dade é normalzada usando a normalzação Mn-Max. Os valores estão no ntervalo [0, 1] Novamente, podemos calcular a dstânca entre o pacente A e o pacente B, e entre o pacente A e o pacente C d MMN ( A, B) (0.8 0.) ( A, C) ( ) d MMN Neste caso, o pacente B é agora mas perto do pacente A Idade padronzada usando Z-Score Desta vez a dade é padronzada utlzando a padronzação Z-Score Copyrght 005 John Wley & Sons, Inc. 31 Função Dstânca (contnuação) d Zscore ( A, B) (0.33 ( 1.67)) ( A, C) ( ) d Zscore Usando a padronzação Z-Score, a maora dos valores estão tpcamente contdos no ntervalo [-3, 3] Agora, o Pacente C é o mas próxmo do Pacente A. Este resultado é dferente daquele obtdo com a normalzação Mn-Max Conclusão O uso de técncas de normalzação dferentes resultaram no pacente A sendo mas próxmo de pacentes dferentes no conjunto de trenamento Isso ressalta a mportânca de compreender qual técnca está sendo usada Copyrght 005 John Wley & Sons, Inc. 3 16

17 10/4/010 Função Dstânca (contnuação) Note que a dstânca (x, y) e as funções de normalzação Mn-Max produzem valores no ntervalo [0, 1] Talvez, ao calcular a dstânca entre os regstros contendo tanto atrbutos numércos e categórcos, a utlzação da normalzação Mn-Max Normalzação seja preferível Copyrght 005 John Wley & Sons, Inc. 33 Função Combnação A função dstânca eucldana determna a semelhança de um novo regstro não classfcado para com aqueles do conjunto de trenamento Como deveram se combnar os mas semelhantes (k) regstros para fornecer uma classfcação? Votação smples não ponderada Esta é a função combnação mas smples Decde sobre o valor de k para determnar o número de regstros smlares que "votam Compare cada regstro não classfcado com os seus k vznhos mas próxmos (maor smlardade) de acordo com a função dstânca eucldana Cada um dos k regstros semelhantes votam Copyrght 005 John Wley & Sons, Inc

18 10/4/010 Função Combnação (contnuação) Lembre-se que classfcamos um novo pacente de 17 anos de dade com uma relação Na / K 1,5, com k 3 A votação smples não ponderada determnou que dos dos três pontos mas próxmos ao pacente são médos Portanto, o pacente é classfcado como droga A ou X com uma confança de 03/0 66,67% Também classfcamos um novo pacente de 47 anos de dade, que tem uma relação Na / K de 13,5, com k 3 No entanto, a votação não ponderada smples não ajudou e resultou em um empate Talvez voto ponderado deva ser consderado? Copyrght 005 John Wley & Sons, Inc. 35 Votação Ponderada Votação Ponderada Neste caso, quanto mas próxmo o vznho for, mas nfluênca ele tem na decsão de classfcação Este método assume que um vznho mas próxmo é mas smlar e que portanto seu voto devera ser ponderado por um fator maor, em comparação com vznhos mas dstantes O peso do regstro específco é nversamente proporconal à sua dstânca para o regstro não classfcado É pouco provável ocorrer um empate" com esta abordagem Copyrght 005 John Wley & Sons, Inc

19 10/4/010 Votação Ponderada (contnuação) Exemplo Mas uma vez, lembre-se que classfcamos um novo pacente de 17 anos de dade com uma relação Na / K 1,5, com k 3 Nós determnamos, usando votação não ponderada, dos dos pontos mas próxmos foram Médos, e o tercero fo escuro No entanto, o ponto escuro é a mas smlar ao novo pacente Agora, vamos classfcar novamente o novo pacente usando um esquema de votação ponderada, utlzando os valores da tabela abaxo Record Age Na/K Age MMN Na/K MMN New Patent A (Dark) B (Med) C (Med) Copyrght 005 John Wley & Sons, Inc. 37 Votação Ponderada (contnuação) As dstâncas dos regstos A, B e C para o novo pacente são: d ( new, A) d ( new, B) d ( new, C) ( ) ( ) ( ) + (.5.471) + ( ) + ( ) Em seguda, os votos desses regstros são ponderados de acordo com o nverso do quadrado da sua dstânca para o novo regstro O regstro A vota para classfcar o novo pacente como escuro (droga B ou C) 1 Votes Dark Gray) d( new, A) ( 51,818. Copyrght 005 John Wley & Sons, Inc

20 10/4/010 Votação Ponderada (contnuação) Regstros B e C votam para classfcar o pacente como novo Médo (droga A ou X) 1 Votes Medum Gray) d( new, B) 1 + d( new, C) ( Convncentemente ( contra 67) o método de votação ponderada classfca o novo pacente como escuro (droga B ou C) Note que este procedmento nverte a nossa decsão de classfcação, determnada através da votação não ponderada, k 3 A dstânca nversa de 0 é ndefnda usando votação ponderada Teorcamente, o valor de k pode ser aumentado, de modo que todos os regstros de trenamento partcpem na votação, no entanto, a complexdade computaconal pode resultar em baxo desempenho 67. Copyrght 005 John Wley & Sons, Inc. 39 Quantfcando a relevânca de um atrbuto: alongando os exos Nem todos os atrbutos podem ser relevantes para a classfcação Por exemplo,as árvores de decsão ncluem apenas os atrbutos que contrbuem para melhorar a exatdão da classfcação Em contraste, o comportamento padrão dos k-vznhos mas próxmos é calcular dstâncas usando todos os atrbutos Um regstro relevante pode estar próxmo para varáves mportantes e, ao mesmo tempo muto longe para outras, as varáves sem mportânca Tomados em conjunto, o regstro relevante pode agora estar moderadamente longe do regstro novo, de modo que ele não partcpe da decsão de classfcação Copyrght 005 John Wley & Sons, Inc. 40 0

21 10/4/010 Quantfcando a relevânca de um atrbuto: alongando os exos (contnuação) Talvez, devamos consderar restrngr o algortmo a usar os campos mas mportantes para a classfcação No entanto, ao nvés de fazer essa determnação a pror, podemos fazer os atrbutos tanto mas como menos mportantes Isso é feto usando a valdação cruzada ou aplcando conhecmentos de domíno Alongando os exos Alongamento dos exos: encontrar o coefcente zj pelo qual se deve multplcar o j-ésmo exo. Valores maores de zj estão assocados com os exos de varável mas mportantes Valdação Cruzada A valdação cruzada selecona um subconjunto aleatóro de dados a partr do conjunto de trenamento e determna o conjunto de z1, z,..., zm que mnmza o erro de classfcação no conjunto de teste Copyrght 005 John Wley & Sons, Inc. 41 Quantfcando a relevânca de um atrbuto: alongando os exos (contnuação) Repetndo o processo leva a um conjunto mas precso de valores para z1, z,..., zm Especalstas do domíno Alternatvamente, pode-se recorrer a especalstas do domíno para recomendar valores de z1, z,..., zm Usando qualquer uma das abordagens, o algortmo dos k- vznhos mas próxmos pode se tornar mas precso Exemplo Suponha que a relação Na / K fo determnada para ser 3 vezes mas mportante do que o atrbuto Idade, para realzar a classfcação dos medcamentos Copyrght 005 John Wley & Sons, Inc. 4 1

22 10/4/010 Quantfcando a relevânca de um atrbuto: alongando os exos (contnuação) A dstânca entre os regstros A, B e C em relação ao novo regstro é calculada da segunte forma: where z Na / 3, z 1 K Age d ( new, A ) ( ) + (( 3)( )) d ( new, B ) ( ) + (( 3)( )) d ( new, C ) ( ) + (( 3)( )) A classfcação não muda pelo alongamento dos exos para a razão Na / K Em mutas stuações, alongar os exos leva a uma maor precsão através da quantfcação da relevânca de cada varável utlzada na decsão de classfcação Copyrght 005 John Wley & Sons, Inc. 43 Consderações sobre o Banco de Dados Métodos de aprendzado baseados em nstânca se benefcam por ter acesso à exemplos de aprendzagem, compostos por mutas combnações de valores dos atrbutos O conjunto de dados deve ser equlbrado, de modo a nclur um número sufcente de regstros com classfcações comuns e menos comuns Uma abordagem para o equlíbro do conjunto de dados é a redução da proporção de regstros com classfcações mas comuns Restrções de espaço na memóra prncpal pode lmtar o tamanho do conjunto de trenamento utlzado O conjunto de trenamento pode ser reduzdo de modo a nclur apenas aqueles regstros que ocorrem perto dos lmtes, frontera de uma classfcação Copyrght 005 John Wley & Sons, Inc. 44

23 10/4/010 Algortmo dos k-vznhos mas próxmos para estmação e predção O algortmo dos k-vznhos mas próxmos pode ser utlzado para a estmatva e prevsão de varáves-alvo de valores contínuos Um método usado para fazer sso é méda localmente Ponderada Exemplo Vamos estmar a pressão sangunea sstólca de um pacente de 17 anos de dade com relação Na / K gual a 1,5, usando k 3 Os predtores são Na / K e a dade e a varável-alvo é a BP Os três vznhos (A, B e C) do conjunto de trenamento são mostrados abaxo Record Age Na/K BP Age MMN Na/K MMN Dstance New ? A B C Copyrght 005 John Wley & Sons, Inc. 45 Algortmo dos k-vznhos mas próxmos para estmação e predção (contnuação) Suponha que a BP tem um ntervalo 80 e mínmo 90 Nós também estcamos os exos para a razão Na / K, para refletr a sua mportânca na estmatva da BP. Além dsso, usamos o nverso do quadrado das dstâncas para os pesos ŷ new w y w w 1, x where for exstng records x1, x, L d ( new, x ) k A pressão arteral sstólca estmada para o novo regstro é: Como o regstro A está mas próxmo do novo regstro, seu valor de pressão arteral de 10 dá uma contrbução sgnfcatva para o valor estmado da BP yˆ new w y w Copyrght 005 John Wley & Sons, Inc. 46 3

24 10/4/010 Escolhendo k Qual é o melhor valor de k? Não há necessaramente uma solução óbva K menor Escolher um valor pequeno para k pode conduzr o algortmo a overft os dados Ruído ou anomalas podem afectar ndevdamente a classfcação K maor Valores maores tendem a suavzar os valores de dados dossncrátcos ou obscuros no conjunto de trenamento Se os valores se tornam muto grandes, valores locas nteressantes serão gnorados Copyrght 005 John Wley & Sons, Inc. 47 Escolhendo k (contnuação) Escolhendo o valor aproprado para k exge o equlíbro destas consderações Usando a valdação cruzada pode ajudar a determnar o valor de k, escolhendo um valor que mnmza o erro de classfcação Copyrght 005 John Wley & Sons, Inc. 48 4

Estatística II Antonio Roque Aula 18. Regressão Linear

Estatística II Antonio Roque Aula 18. Regressão Linear Estatístca II Antono Roque Aula 18 Regressão Lnear Quando se consderam duas varáves aleatóras ao mesmo tempo, X e Y, as técncas estatístcas aplcadas são as de regressão e correlação. As duas técncas estão

Leia mais

2 Incerteza de medição

2 Incerteza de medição 2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr

Leia mais

7 - Distribuição de Freqüências

7 - Distribuição de Freqüências 7 - Dstrbução de Freqüêncas 7.1 Introdução Em mutas áreas há uma grande quantdade de nformações numércas que precsam ser dvulgadas de forma resumda. O método mas comum de resumr estes dados numércos consste

Leia mais

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Algarismos Significativos Propagação de Erros ou Desvios

Algarismos Significativos Propagação de Erros ou Desvios Algarsmos Sgnfcatvos Propagação de Erros ou Desvos L1 = 1,35 cm; L = 1,3 cm; L3 = 1,30 cm L4 = 1,4 cm; L5 = 1,7 cm. Qual destas meddas está correta? Qual apresenta algarsmos com sgnfcado? O nstrumento

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr

Leia mais

1. CORRELAÇÃO E REGRESSÃO LINEAR

1. CORRELAÇÃO E REGRESSÃO LINEAR 1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca

Leia mais

Análise de Regressão

Análise de Regressão Análse de Regressão método estatístco que utlza relação entre duas ou mas varáves de modo que uma varável pode ser estmada (ou predta) a partr da outra ou das outras Neter, J. et al. Appled Lnear Statstcal

Leia mais

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES 1. Obtenha os estmadores dos coefcentes lnear e angular de um modelo de regressão lnear smples utlzando o método

Leia mais

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos Curso de extensão, MMQ IFUSP, feverero/4 Alguns exercíco báscos I Exercícos (MMQ) Uma grandeza cujo valor verdadero x é desconhecdo, fo medda três vezes, com procedmentos expermentas dêntcos e, portanto,

Leia mais

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA Análse de Regressão Profa Alcone Mranda dos Santos Departamento de Saúde Públca UFMA Introdução Uma das preocupações estatístcas ao analsar dados, é a de crar modelos que explctem estruturas do fenômeno

Leia mais

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência. MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 014 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de

Leia mais

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EATAS DEPARTAMENTO DE ESTATÍSTICA UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Leia mais

Reconhecimento Estatístico de Padrões

Reconhecimento Estatístico de Padrões Reconhecmento Estatístco de Padrões X 3 O paradgma pode ser sumarzado da segunte forma: Cada padrão é representado por um vector de característcas x = x1 x2 x N (,,, ) x x1 x... x d 2 = X 1 X 2 Espaço

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Prncípos de cração de modelos empírcos: Modelos (matemátcos, lógcos, ) são comumente utlzados na

Leia mais

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA CAPÍTULO DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA. A MÉDIA ARITMÉTICA OU PROMÉDIO Defnção: é gual a soma dos valores do grupo de dados dvdda pelo número de valores. X x Soma dos valores de x número de

Leia mais

Classificação de Padrões

Classificação de Padrões Classfcação de Padrões Introdução Classfcadores Paramétrcos Classfcadores Sem-paramétrcos Redução da Dmensonaldade Teste de Sgnfcânca 6.345 Sstema de Reconhecmento de Voz Teora Acústca da Produção de Voz

Leia mais

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas 3.6. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas

Leia mais

Análise de Variância. Comparação de duas ou mais médias

Análise de Variância. Comparação de duas ou mais médias Análse de Varânca Comparação de duas ou mas médas Análse de varânca com um fator Exemplo Um expermento fo realzado para se estudar dabetes gestaconal. Desejava-se avalar o comportamento da hemoglobna (HbA)

Leia mais

3 Subtração de Fundo Segmentação por Subtração de Fundo

3 Subtração de Fundo Segmentação por Subtração de Fundo 3 Subtração de Fundo Este capítulo apresenta um estudo sobre algortmos para a detecção de objetos em movmento em uma cena com fundo estátco. Normalmente, estas cenas estão sob a nfluênca de mudanças na

Leia mais

NOTA II TABELAS E GRÁFICOS

NOTA II TABELAS E GRÁFICOS Depto de Físca/UFMG Laboratóro de Fundamentos de Físca NOTA II TABELAS E GRÁFICOS II.1 - TABELAS A manera mas adequada na apresentação de uma sére de meddas de um certo epermento é através de tabelas.

Leia mais

Ministério da Educação. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Cálculo do Conceito Preliminar de Cursos de Graduação

Ministério da Educação. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Cálculo do Conceito Preliminar de Cursos de Graduação Mnstéro da Educação Insttuto Naconal de Estudos e Pesqusas Educaconas Aníso Texera Cálculo do Conceto Prelmnar de Cursos de Graduação Nota Técnca Nesta nota técnca são descrtos os procedmentos utlzados

Leia mais

Contabilometria. Aula 8 Regressão Linear Simples

Contabilometria. Aula 8 Regressão Linear Simples Contalometra Aula 8 Regressão Lnear Smples Orgem hstórca do termo Regressão Le da Regressão Unversal de Galton 1885 Galton verfcou que, apesar da tendênca de que pas altos tvessem flhos altos e pas axos

Leia mais

Tipo tratamento idade Tipo tratamento sexo

Tipo tratamento idade Tipo tratamento sexo Modelos de Regressão em Saúde Rejane Sobrno Pnhero Tâna Zdenka Gullén de Torres Modelos de Regressão Famíla de técncas estatístcas város fatores meddos (predtor, covarável, varável ndependente) relaconados

Leia mais

2 Lógica Fuzzy Introdução

2 Lógica Fuzzy Introdução 2 Lógca Fuzzy 2.. Introdução A lógca fuzzy é uma extensão da lógca booleana, ntroduzda pelo Dr. Loft Zadeh da Unversdade da Calfórna / Berkeley no ano 965. Fo desenvolvda para expressar o conceto de verdade

Leia mais

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores.

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores. Estatístca Aplcada à Engenhara AULA 4 UNAMA - Unversdade da Amazôna.8 MEDIDA EPARATRIZE ão valores que separam o rol (os dados ordenados) em quatro (quarts), dez (decs) ou em cem (percents) partes guas.

Leia mais

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu 1 Programação Não Lnear com Restrções Aula 9: Programação Não-Lnear - Funções de Váras Varáves com Restrções Ponto Regular; Introdução aos Multplcadores de Lagrange; Multplcadores de Lagrange e Condções

Leia mais

AEP FISCAL ESTATÍSTICA

AEP FISCAL ESTATÍSTICA AEP FISCAL ESTATÍSTICA Módulo 11: Varáves Aleatóras (webercampos@gmal.com) VARIÁVEIS ALEATÓRIAS 1. Conceto de Varáves Aleatóras Exemplo: O expermento consste no lançamento de duas moedas: X: nº de caras

Leia mais

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

ANÁLISE DA VARIÂNCIA DA REGRESSÃO ANÁLISE DA VARIÂNCIA DA REGRESSÃO PROCEDIMENTO GERAL DE REGRESSÃO Em um modelo de análse de varânca, como no DIA, o fator em estudo pode ser quanttatvo ou qualtatvo. FATOR QUANTITATIVO: é aquele cujos

Leia mais

Gestão e Teoria da Decisão

Gestão e Teoria da Decisão Gestão e Teora da Decsão Logístca e Gestão de Stocks Estratégas de Localzação Lcencatura em Engenhara Cvl Lcencatura em Engenhara do Terrtóro 1 Estratéga de Localzação Agenda 1. Classfcação dos problemas

Leia mais

Prof. Cláudio Serra, Esp. 1. Produção de Leite x índice Pluviométrico y = 0.8x R 2 =

Prof. Cláudio Serra, Esp. 1. Produção de Leite x índice Pluviométrico y = 0.8x R 2 = Análse de Regressão Cap.. Introdução Análse de regressão é uma técnca de modelagem utlzada para analsar a relação entre uma varável dependente () e uma ou mas varáves ndependentes,, 3,..., n. O ojetvo

Leia mais

Medidas e resultados em um experimento.

Medidas e resultados em um experimento. Meddas e resultados em um expermento. I- Introdução O estudo de um fenômeno natural do ponto de vsta expermental envolve algumas etapas que, mutas vezes, necesstam de uma elaboração préva de uma seqüênca

Leia mais

Análise Descritiva com Dados Agrupados

Análise Descritiva com Dados Agrupados Análse Descrtva com Dados Agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas descrtvas

Leia mais

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma: Professora Janete Perera Amador 1 8 Meddas Descrtvas Vmos anterormente que um conjunto de dados pode ser resumdo através de uma dstrbução de freqüêncas, e que esta pode ser representada através de uma

Leia mais

Análise de Variância. Introdução. Rejane Sobrino Pinheiro Tania Guillén de Torres

Análise de Variância. Introdução. Rejane Sobrino Pinheiro Tania Guillén de Torres Análse de Varânca Rejane Sobrno Pnhero Tana Gullén de Torres Análse de Varânca Introdução Modelos de análse de varânca consttuem uma classe de modelos que relaconam uma varável resposta contínua com varáves

Leia mais

CONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO 2 DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogério Rodrigues

CONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO 2 DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogério Rodrigues CONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogéro Rodrgues I) TABELA PRIMITIVA E DISTRIBUIÇÃO DE FREQÜÊNCIA : No processo de amostragem, a forma de regstro mas

Leia mais

2. Validação e ferramentas estatísticas

2. Validação e ferramentas estatísticas . Valdação e ferramentas estatístcas Mutos aspectos relaconados à socedade são suportados, de alguma forma, por algum tpo de medção analítca. Mlhões de medções analítcas são realzadas todos os das, em

Leia mais

MODELO RECEPTOR MODELO RECEPTOR MODELO RECEPTOR. Princípio do modelo:

MODELO RECEPTOR MODELO RECEPTOR MODELO RECEPTOR. Princípio do modelo: MODELO RECEPTOR Não modela a dspersão do contamnante. MODELO RECEPTOR Prncípo do modelo: Atacar o problema de dentfcação da contrbução da fonte em ordem nversa, partndo da concentração do contamnante no

Leia mais

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011 Instruções: PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 00/0 Cada uestão respondda corretamente vale (um) ponto. Cada uestão respondda ncorretamente vale - (menos um) ponto. Cada uestão

Leia mais

Programa de Certificação de Medidas de um laboratório

Programa de Certificação de Medidas de um laboratório Programa de Certfcação de Meddas de um laboratóro Tratamento de dados Elmnação de dervas Programa de calbração entre laboratóros Programa nterno de calbração justes de meddas a curvas Tratamento dos resultados

Leia mais

Aplicações de Estimadores Bayesianos Empíricos para Análise Espacial de Taxas de Mortalidade

Aplicações de Estimadores Bayesianos Empíricos para Análise Espacial de Taxas de Mortalidade Aplcações de Estmadores Bayesanos Empírcos para Análse Espacal de Taxas de Mortaldade Alexandre E. dos Santos, Alexandre L. Rodrgues, Danlo L. Lopes Departamento de Estatístca Unversdade Federal de Mnas

Leia mais

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva Teora da Regressão Espacal Aplcada a Modelos Genércos Sérgo Alberto Pres da Slva ITENS DE RELACIONAMENTOS Tópcos Báscos da Regressão Espacal; Banco de Dados Geo-Referencados; Modelos Genércos Robustos;

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso Superor de tecnólogo em Gestão Ambental Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos

Leia mais

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial 5 Métodos de cálculo do lmte de retenção em função da ruína e do captal ncal Nesta dssertação serão utlzados dos métodos comparatvos de cálculo de lmte de retenção, onde ambos consderam a necessdade de

Leia mais

INTRODUÇÃO À PROBABILIDADE. A probabilidade é uma medida da incerteza dos fenômenos. Traduz-se por um número real compreendido de 0 ( zero) e 1 ( um).

INTRODUÇÃO À PROBABILIDADE. A probabilidade é uma medida da incerteza dos fenômenos. Traduz-se por um número real compreendido de 0 ( zero) e 1 ( um). INTRODUÇÃO À PROILIDDE teora das probabldade nada mas é do que o bom senso transformado em cálculo probabldade é o suporte para os estudos de estatístca e expermentação. Exemplos: O problema da concdênca

Leia mais

Regressão e Correlação Linear

Regressão e Correlação Linear Probabldade e Estatístca I Antono Roque Aula 5 Regressão e Correlação Lnear Até o momento, vmos técncas estatístcas em que se estuda uma varável de cada vez, estabelecendo-se sua dstrbução de freqüêncas,

Leia mais

CQ110 : Princípios de FQ

CQ110 : Princípios de FQ CQ 110 Prncípos de Físco Químca Curso: Farmáca Prof. Dr. Marco Vdott mvdott@ufpr.br 1 soluções eletrolítcas Qual a dferença entre uma solução 1,0 mol L -1 de glcose e outra de NaCl de mesma concentração?

Leia mais

PROPOSTA DE UM MÉTODO DE CLASSIFICAÇÃO BASEADO EM DENSIDADE PARA A DETERMINAÇÃO DO NÚMERO IDEAL DE GRUPOS EM PROBLEMAS DE CLUSTERIZAÇÃO

PROPOSTA DE UM MÉTODO DE CLASSIFICAÇÃO BASEADO EM DENSIDADE PARA A DETERMINAÇÃO DO NÚMERO IDEAL DE GRUPOS EM PROBLEMAS DE CLUSTERIZAÇÃO PROPOSTA DE UM MÉTODO DE CLASSIFICAÇÃO BASEADO EM DENSIDADE PARA A DETERMINAÇÃO DO NÚMERO IDEAL DE GRUPOS EM PROBLEMAS DE CLUSTERIZAÇÃO Gustavo Slva Semaan 1, Marcelo Db Cruz 2, José André de Moura Brto

Leia mais

Análise de influência

Análise de influência Análse de nfluênca Dzemos que uma observação é nfluente caso ela altere, de forma substancal, alguma propredade do modelo ajustado (como as estmatvas dos parâmetros, seus erros padrões, valores ajustados...).

Leia mais

CLUSTERIZAÇÃO AUTOMÁTICA NA REDUÇÃO DA DIMENSIONALIDADE DOS DADOS

CLUSTERIZAÇÃO AUTOMÁTICA NA REDUÇÃO DA DIMENSIONALIDADE DOS DADOS CLUSTERIZAÇÃO AUTOMÁTICA NA REDUÇÃO DA DIMENSIONALIDADE DOS DADOS Éldman de Olvera Nunes Escola de Admnstração do Exércto Rua Terrtóro do Amapá, 455, 41.540-830, Salvador, BA, Brasl eldman.nunes@gmal.com

Leia mais

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha) Estatístca p/ Admnstração II - Profª Ana Cláuda Melo Undade : Probabldade Aula: 3 Varável Aleatóra. Varáves Aleatóras Ao descrever um espaço amostral de um expermento, não especfcamos que um resultado

Leia mais

Gabarito da Lista de Exercícios de Econometria I

Gabarito da Lista de Exercícios de Econometria I Gabarto da sta de Exercícos de Econometra I Professor: Rogéro lva Mattos Montor: eonardo enrque A. lva Questão Y X y x xy x ŷ ˆ ˆ y ŷ (Y - Y ) (X - X ) (Ŷ - Y ) 360 00-76 -00 35.00 40.000 36-4 30.976 3076

Leia mais

Representação e Descrição de Regiões

Representação e Descrição de Regiões Depos de uma magem ter sdo segmentada em regões é necessáro representar e descrever cada regão para posteror processamento A escolha da representação de uma regão envolve a escolha dos elementos que são

Leia mais

IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO

IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO Alne de Paula Sanches 1 ; Adrana Betâna de Paula Molgora 1 Estudante do Curso de Cênca da Computação da UEMS, Undade Unverstára de Dourados;

Leia mais

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto

Leia mais

PRESSUPOSTOS DO MODELO DE REGRESSÃO

PRESSUPOSTOS DO MODELO DE REGRESSÃO PREUPOTO DO MODELO DE REGREÃO A aplcação do modelo de regressão lnear múltpla (bem como da smples) pressupõe a verfcação de alguns pressupostos que condensamos segudamente.. Os erros E são varáves aleatóras

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Capítulo 2 Reconhecmento de Padrões 2.1 O que é reconhecmento de padrões? Há duas maneras de se reconhecer e/ou classfcar um padrão [CONNEL, S. D. & JAIN, A. K. (2001)]: () classfcação supervsonada: o

Leia mais

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel MÉTODOS MULTIVARIADOS Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multvarados 1 Análse de componentes prncpas Aplcações de análse de componentes

Leia mais

Medida de Quatro Pontas Autor: Mauricio Massazumi Oka Versão 1.0 (janeiro 2000)

Medida de Quatro Pontas Autor: Mauricio Massazumi Oka Versão 1.0 (janeiro 2000) Medda de Quatro Pontas Autor: Maurco Massazum Oka Versão.0 (janero 000) Introdução A técnca de medda de quatro pontas é largamente usada para a medda de resstvdades e resstêncas de folha. O método em s

Leia mais

ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS. Palavras-chave: Tensões térmicas, Propriedades variáveis, Condução de calor, GITT

ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS. Palavras-chave: Tensões térmicas, Propriedades variáveis, Condução de calor, GITT ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS Dnz, L.S. Santos, C.A.C. Lma, J.A. Unversdade Federal da Paraíba Laboratóro de Energa Solar LES/DTM/CT/UFPB 5859-9 - João Pessoa - PB, Brasl e-mal: cabral@les.ufpb.br

Leia mais

CAPÍTULO 2 - Estatística Descritiva

CAPÍTULO 2 - Estatística Descritiva INF 16 Prof. Luz Alexandre Peternell CAPÍTULO - Estatístca Descrtva Exercícos Propostos 1) Consderando os dados amostras abaxo, calcular: méda artmétca, varânca, desvo padrão, erro padrão da méda e coefcente

Leia mais

Introdução a Combinatória- Aplicações, parte II

Introdução a Combinatória- Aplicações, parte II Introdução a Combnatóra- Aplcações, AULA 7 7.1 Introdução Nesta aula vamos estudar aplcações um pouco dferentes das da aula passada. No caso estudaremos arranjos com repetção, permutações crculares e o

Leia mais

O que heterocedasticidade? Heterocedasticidade. Por que se preocupar com heterocedasticidade? Exemplo de heterocedasticidade.

O que heterocedasticidade? Heterocedasticidade. Por que se preocupar com heterocedasticidade? Exemplo de heterocedasticidade. Heterocedastcdade y = β 0 + β + β + β k k + u O que heterocedastcdade? Lembre-se da hpótese de homocedastcdade: condconal às varáves eplcatvas, a varânca do erro, u, é constante Se sso não for verdade,

Leia mais

PROJEÇÕES POPULACIONAIS PARA OS MUNICÍPIOS E DISTRITOS DO CEARÁ

PROJEÇÕES POPULACIONAIS PARA OS MUNICÍPIOS E DISTRITOS DO CEARÁ GOVERNO DO ESTADO DO CEARÁ SECRETARIA DO PLANEJAMENTO E GESTÃO - SEPLAG INSTITUTO DE PESQUISA E ESTRATÉGIA ECONÔMICA DO CEARÁ - IPECE NOTA TÉCNICA Nº 29 PROJEÇÕES POPULACIONAIS PARA OS MUNICÍPIOS E DISTRITOS

Leia mais

Dependência Espacial de espécies nativas em fragmentos. florestais

Dependência Espacial de espécies nativas em fragmentos. florestais Dependênca Espacal de espéces natvas em fragmentos 1 Introdução florestas 1 Mestranda em Engenhara Florestal LEMAF/DCF UFLA. e-mal: cunhadase@yahoo.com.br 2 Mestrando em Engenhara Florestal LEMAF/DCF UFLA.

Leia mais

5.1 Seleção dos melhores regressores univariados (modelo de Índice de Difusão univariado)

5.1 Seleção dos melhores regressores univariados (modelo de Índice de Difusão univariado) 5 Aplcação Neste capítulo será apresentada a parte empírca do estudo no qual serão avalados os prncpas regressores, um Modelo de Índce de Dfusão com o resultado dos melhores regressores (aqu chamado de

Leia mais

Palavras-Chave: Métodos Interativos da Potência e Inverso, Sistemas Lineares, Autovetores e Autovalores.

Palavras-Chave: Métodos Interativos da Potência e Inverso, Sistemas Lineares, Autovetores e Autovalores. MSc leandre Estáco Féo ssocação Educaconal Dom Bosco - Faculdade de Engenhara de Resende Caa Postal 8.698/87 - CEP 75-97 - Resende - RJ Brasl Professor e Doutorando de Engenhara aefeo@yahoo.com.br Resumo

Leia mais

CAPÍTULO VI Introdução ao Método de Elementos Finitos (MEF)

CAPÍTULO VI Introdução ao Método de Elementos Finitos (MEF) PMR 40 - Mecânca Computaconal CAPÍTULO VI Introdução ao Método de Elementos Fntos (MEF). Formulação Teórca - MEF em uma dmensão Consderemos a equação abao que representa a dstrbução de temperatura na barra

Leia mais

CAPÍTULO 9 REGRESSÃO LINEAR PPGEP REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES UFRGS. Regressão Linear Simples

CAPÍTULO 9 REGRESSÃO LINEAR PPGEP REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES REGRESSÃO LINEAR SIMPLES UFRGS. Regressão Linear Simples CAPÍTULO 9 REGREÃO LINEAR IMPLE REGREÃO LINEAR IMPLE UFRG Em mutos problemas há duas ou mas varáves que são relaconadas, e pode ser mportante modelar essa relação. Por exemplo, a resstênca à abrasão de

Leia mais

PUCPR- Pontifícia Universidade Católica Do Paraná PPGIA- Programa de Pós-Graduação Em Informática Aplicada PROF. DR. JACQUES FACON

PUCPR- Pontifícia Universidade Católica Do Paraná PPGIA- Programa de Pós-Graduação Em Informática Aplicada PROF. DR. JACQUES FACON 1 PUCPR- Pontfíca Unversdade Católca Do Paraná PPGIA- Programa de Pós-Graduação Em Informátca Aplcada PROF. DR. JACQUES FACON LIMIARIZAÇÃO ITERATIVA DE LAM E LEUNG Resumo: A proposta para essa sére de

Leia mais

Realimentação negativa em ampliadores

Realimentação negativa em ampliadores Realmentação negatva em ampladores 1 Introdução necessdade de amplfcadores com ganho estável em undades repetdoras em lnhas telefôncas levou o Eng. Harold Black à cração da técnca denomnada realmentação

Leia mais

DESENVOLVIMENTO DE UM PRÉ-PROCESSADOR PARA ANÁLISE ISOGEOMÉTRICA

DESENVOLVIMENTO DE UM PRÉ-PROCESSADOR PARA ANÁLISE ISOGEOMÉTRICA DESENVOLVIMENTO DE UM PRÉ-PROCESSADOR PARA ANÁLISE ISOGEOMÉTRICA Pedro Luz Rocha Evandro Parente Junor pedroluzrr04@gmal.com evandroparentejr@gmal.com Laboratóro de Mecânca Computaconal e Vsualzação, Unversdade

Leia mais

2) Como há 6 tipos de peso, e estamos avaliando 2 peças, o espaço amostral será uma matriz 6 x 6:

2) Como há 6 tipos de peso, e estamos avaliando 2 peças, o espaço amostral será uma matriz 6 x 6: Lsta de Exercícos - Probabldade INE 700 GABARITO LISTA DE EXERÍIOS PROBABILIDADE ) Vamos medr o tempo de duração da lâmpada. Ao lgarmos a lâmpada ela pode não funconar, ou durar um tempo ndetermnado. a)

Leia mais

ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL

ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL Revsta Matz Onlne ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL Valera Ap. Martns Ferrera Vvane Carla Fortulan Valéra Aparecda Martns. Mestre em Cêncas pela Unversdade de São Paulo- USP.

Leia mais

Diferença entre a classificação do PIB per capita e a classificação do IDH

Diferença entre a classificação do PIB per capita e a classificação do IDH Curso Bem Estar Socal Marcelo Ner - www.fgv.br/cps Metas Socas Entre as mutas questões decorrentes da déa de se mplementar uma proposta de metas socas temos: Qual a justfcatva econômca para a exstênca

Leia mais

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012 Notas Processos estocástcos Nestor Catcha 23 de abrl de 2012 notas processos estocástcos 2 O Teorema de Perron Frobenus para matrzes de Markov Consdere um processo estocástco representado por um conunto

Leia mais

2 Máquinas de Vetor Suporte 2.1. Introdução

2 Máquinas de Vetor Suporte 2.1. Introdução Máqunas de Vetor Suporte.. Introdução Os fundamentos das Máqunas de Vetor Suporte (SVM) foram desenvolvdos por Vapnk e colaboradores [], [3], [4]. A formulação por ele apresentada se basea no prncípo de

Leia mais

EXPANSÃO TÉRMICA DOS LÍQUIDOS

EXPANSÃO TÉRMICA DOS LÍQUIDOS Físca II Protocolos das Aulas Prátcas 01 DF - Unversdade do Algarve EXPANSÃO ÉRMICA DOS ÍQUIDOS 1 Resumo Estuda-se a expansão térmca da água destlada e do glcerol utlzando um pcnómetro. Ao aquecer-se,

Leia mais

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Linear

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Linear ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11 EERCÍCIOS PRÁTICOS - CADERNO 4 Regressão Lnear 4. EERCÍCIOS PARA RESOLVER NAS AULAS 4.1. O gestor de marketng duma grande cadea de supermercados quer determnar

Leia mais

Variabilidade Espacial do Teor de Água de um Argissolo sob Plantio Convencional de Feijão Irrigado

Variabilidade Espacial do Teor de Água de um Argissolo sob Plantio Convencional de Feijão Irrigado Varabldade Espacal do Teor de Água de um Argssolo sob Planto Convenconal de Fejão Irrgado Elder Sânzo Aguar Cerquera 1 Nerlson Terra Santos 2 Cásso Pnho dos Res 3 1 Introdução O uso da água na rrgação

Leia mais

Estatística stica Descritiva

Estatística stica Descritiva AULA1-AULA5 AULA5 Estatístca stca Descrtva Prof. Vctor Hugo Lachos Davla oo que é a estatístca? Para mutos, a estatístca não passa de conjuntos de tabelas de dados numércos. Os estatístcos são pessoas

Leia mais

Análise dos resíduos e Outlier, Alavancagem e Influência

Análise dos resíduos e Outlier, Alavancagem e Influência Análse dos resíduos e Outler, Alavancagem e Influênca Dagnóstco na análse de regressão Usadas para detectar problemas com o ajuste do modelo de regressão. Presença de observações mal ajustadas (pontos

Leia mais

Q 1-1,5(Q3-Q1) < X i < Q 3 + 1,5(Q 3 -Q 1 ) Q 3 +1,5(Q 3 -Q 1 ) < X i < Q 3 +3(Q 3 -Q 1 ) Q 1 3(Q 3 -Q 1 ) < X i < Q 1 1,5(Q 3 -Q 1 )

Q 1-1,5(Q3-Q1) < X i < Q 3 + 1,5(Q 3 -Q 1 ) Q 3 +1,5(Q 3 -Q 1 ) < X i < Q 3 +3(Q 3 -Q 1 ) Q 1 3(Q 3 -Q 1 ) < X i < Q 1 1,5(Q 3 -Q 1 ) DIGRM OX-PLOT E CRCTERIZÇÃO DE OUTLIERS E VLORES EXTREMOS Outlers e valores extremos são aqueles que estão muto afastados do centro da dstrbução. Uma forma de caracterzá-los é através do desenho esquemátco

Leia mais

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma Redução dos Dados Júlo Osóro Meddas Característcas da Dstrbução Tendênca Central (Localzação) Varação (Dspersão) Forma 1 Meddas Característcas da Dstrbução Meddas Estatístcas Tendênca Central Dspersão

Leia mais

Capítulo 16: Equilíbrio Geral e Eficiência Econômica

Capítulo 16: Equilíbrio Geral e Eficiência Econômica Capítulo 6: Equlíbro Geral e Efcênca Econômca Pndck & Rubnfeld, Capítulo 6, Equlíbro Geral::EXERCÍCIOS. Em uma análse de trocas entre duas pessoas, suponha que ambas possuam dêntcas preferêncas. A curva

Leia mais

Mecanismos de Escalonamento

Mecanismos de Escalonamento Mecansmos de Escalonamento 1.1 Mecansmos de escalonamento O algortmo de escalonamento decde qual o próxmo pacote que será servdo na fla de espera. Este algortmo é um dos mecansmos responsáves por dstrbur

Leia mais

AULA EXTRA Análise de Regressão Logística

AULA EXTRA Análise de Regressão Logística 1 AULA EXTRA Análse de Regressão Logístca Ernesto F. L. Amaral 13 de dezembro de 2012 Metodologa de Pesqusa (DCP 854B) VARIÁVEL DEPENDENTE BINÁRIA 2 O modelo de regressão logístco é utlzado quando a varável

Leia mais

NOTAS DE AULA DA DISCIPLINA CE076

NOTAS DE AULA DA DISCIPLINA CE076 5. COMPONENTES PRINCIPAIS 5. Introdução A análse de Comonentes Prncas está relaconada com a exlcação da estrutura de covarânca or meo de oucas combnações lneares das varáves orgnas em estudo, ou sea, rocura

Leia mais

CAPÍTULO 3 CALIBRAÇÃO DE FASE INTERFEROMÉTRICA

CAPÍTULO 3 CALIBRAÇÃO DE FASE INTERFEROMÉTRICA CAPÍTULO 3 CALIBRAÇÃO DE FASE INTERFEROMÉTRICA 3. Método Utlzando Ponto de Controle O uso de pontos de controle é o meo mas exato para a determnação do offset da fase nterferométrca. Normalmente utlza-se

Leia mais

Estudo e Previsão da Demanda de Energia Elétrica. Parte II

Estudo e Previsão da Demanda de Energia Elétrica. Parte II Unversdade Federal de Paraná Setor de Tecnologa Departamento de Engenhara Elétrca Estudo e Prevsão da Demanda de Energa Elétrca Parte II Prof: Clodomro Unshuay-Vla Etapas de um Modelo de Prevsão Objetvo

Leia mais

Exercícios. Utilizando um novo critério, essa banca avaliadora resolveu descartar a maior e a menor notas atribuídas ao professor.

Exercícios. Utilizando um novo critério, essa banca avaliadora resolveu descartar a maior e a menor notas atribuídas ao professor. Estatístca Exercícos 1. (Enem 013) Fo realzado um levantamento nos 00 hotés de uma cdade, no qual foram anotados os valores, em reas, das dáras para um quarto padrão de casal e a quantdade de hotés para

Leia mais

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP, NO PÓLO GESSEIRO DO ARARIPE Jáder da Slva Jale Joselme Fernandes Gouvea Alne Santos de Melo Denns Marnho O R Souza Kléber Napoleão Nunes de

Leia mais

3 Aproximador de Função para Simulador de Reservatório Petrolífero

3 Aproximador de Função para Simulador de Reservatório Petrolífero Aproxmador de Função para Smulador de Reservatóro Petrolífero 37 3 Aproxmador de Função para Smulador de Reservatóro Petrolífero 3.1. Introdução O desenvolvmento de um campo petrolífero pode ser entenddo

Leia mais

Sistemas Robóticos. Sumário. Introdução. Introdução. Navegação. Introdução Onde estou? Para onde vou? Como vou lá chegar?

Sistemas Robóticos. Sumário. Introdução. Introdução. Navegação. Introdução Onde estou? Para onde vou? Como vou lá chegar? Sumáro Sstemas Robótcos Navegação Introdução Onde estou? Para onde vou? Como vou lá chegar? Carlos Carreto Curso de Engenhara Informátca Ano lectvo 2003/2004 Escola Superor de Tecnologa e Gestão da Guarda

Leia mais

MAPEAMENTO DA VARIABILIDADE ESPACIAL

MAPEAMENTO DA VARIABILIDADE ESPACIAL IT 90 Prncípos em Agrcultura de Precsão IT Departamento de Engenhara ÁREA DE MECANIZAÇÃO AGRÍCOLA MAPEAMENTO DA VARIABILIDADE ESPACIAL Carlos Alberto Alves Varella Para o mapeamento da varabldade espacal

Leia mais