Mineração em Data Streams - Avaliação. Profa. Elaine Faria UFU

Tamanho: px
Começar a partir da página:

Download "Mineração em Data Streams - Avaliação. Profa. Elaine Faria UFU"

Transcrição

1 Mineração em Data Streams - Avaliação Profa. Elaine Faria UFU

2 Avaliação em Agrupamento

3 Validação de Agrupamento Em tarefas de classificação A avaliação dos resultados do modelo de classificação é parte do processo de desenvolvimento Há medidas e procedimentos de avaliação bem aceitos Ex: acurácia, validação cruzada, etc. Em tarefas de agrupamento A avaliação dos grupos (ou das partições) não está bem desenvolvida ou não é comumente usada como parte da análise de agrupamentos

4 Tendência e Validação Tendência de agrupamento Observar antes de executar um algoritmo de agrupamento Para garantir que existe nos dados uma estrutura significativa (não aleatória) Utiliza testes estatísticos Validade de agrupamento Verificar após executar um algoritmo de agrupamento Estima o desempenho do algoritmo Utiliza testes estatísticos e percepção do especialista (subjetivo)

5 Validação de Agrupamento Refere-se aos procedimentos que avaliam os resultados da análise de agrupamento de uma forma quantitativa e objetiva Como avaliar os grupos gerados por um algoritmo de agrupamento? Por que avaliar agrupamentos?

6 Validação de Agrupamento Questões importantes para o agrupamento Determinar a tendência de agrupamento Distinguir se há estrutura de grupos não-aleatória nos dados Determinar o nro correto de grupos Avaliar o quanto os resultados da análise de agrupamento se adequam aos dados, sem usar referência à informação externa Comparar os resultados da análise de agrupamento a resultados conhecidos Comparar duas partições para determinar qual é a melhor

7 Imagem reitrada de Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, 2006

8 Validação de Agrupamento Questões importantes na validação É fácil propor medidas, mas é difícil interpretá-las Ex: obter o valor 10 para uma medida que avalia o quão bom ficou o agrupamento em relação a um rótulo esperado, indica o que? Bom? Ruim? Mais ou menos?

9 Medidas de avaliação Índice ou critérios internos Medem a qualidade da partição sem usar informação externa Ex: SSE Índice ou critérios externos Medem o quanto os rótulos dos grupos casam com uma estrutura externa (ex: classes verdadeiras) Índice ou critérios relativos Comparam duas partições ou dois grupos

10 Critério de Validação Externo Assumem que o ground-truth (rótulo verdadeiro) do agrupamento é conhecido Informação externa é usada para avaliar a partição dos dados Como obter o rótulo Data sets de classificação, que especificam o rótulo (classe) para cada exemplo podem ser usados Data sets artificiais podem ser criados, com uma estrutura de grupos conhecida, com um rótulo para cada exemplo Experiência do especialista de domínio

11 Critério de Validação Externo Formalizando o problema X i, com i=1,2,..., N data set Y i {1,2,...,K} ground-truth de cada exemplo T = {T 1,T 2,...,T k } ground-truth do agrupamento, onde T j corresponde a todos os pontos com o label j C = {C 1,...,C r } resultado do agrupamento usando algum algoritmo Nomenclatura grupos da partição de referência (ground truth) classes grupos da partição sob avaliação clusters

12 Critério de Validação Externo Orientado a classificação Usam medidas de classificação como entropia, pureza, f-measure,etc. para avaliar o quanto um cluster contém objetos de uma única classe Orientado a similaridade Está relacionado a medidas de similaridade para dados binários como, por exemplo, o coeficiente de Jaccard

13 Critério de Validação Externo Entropia e i Mede o quanto cada cluster contém exemplos de uma única classe Para cada cluster a distribuição de classes dos dados é calculada p ij : probabilidade de que um membro do cluster i pertence a classe j, p ij = m ij /m i, onde m i é nro de elementos do cluster i e m ij é o nro de elementos da classe j no cluster i L j 1 p ij log2 Entropia de cada grupo L é o nro de classes p ij e k i 1 m m i ei Entropia total K é o nro de clusters

14 Critério de Validação Externo Pureza Mede o quanto cada cluster contém exemplos de uma única classe p i max j p ij Pureza do i-ésimo cluster pureza k i 1 mi m Pureza total pi

15 Critério de Validação Externo Exemplo reitrado de Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, 2006

16 Critério de Validação Externo Critérios Orientados a similaridade Comparam duas matrizes A matriz de similaridade do agrupamento 1 na célula ij, se dois objetos i e j estão no mesmo cluster 0, caso contrário A matriz de similaridade das classes 1 na célula ij, se dois objetos i e j estão na mesma classe 0, caso contrário Definindo f 11 : Nro de pares que pertencem à mesma classe e ao mesmo cluster f 10 : Nro de pares que pertencem à mesma classe e a clusters distintos f 01 : Nro de pares que pertencem a classes distintas e ao mesmo cluster f 00 : Nro de pares que pertencem a classes e clusters distintos

17 Critério de Validação Externo Rand Index Medida orientada a similiaridade Compara duas partições Similar ao coeficiente de casamento simples RandIndex f 00 f f f f f 11

18 Critério de Validação Externo Coeficiente de Jaccard Medida orientada a similiaridade Compara duas partições Elimina o termo f 00 Jaccard f 01 f f f 11

19 Critério de Validação Externo Rand Index e Coeficiente de Jaccard Variam no intervalo [0,1] Valores altos para esses índices indicam alto grau de similaridade entre a organização em grupos e a organização das partições

20 Critério de Validação Externo Exemplo 5 objetos: p 1, p 2, p 3, p 4 e p 5 Dois clusters: C 1 ={p 1,p 2,p 3 } e C 2 ={p 4,p 5 } Duas classes: L 1 ={p 1,p 2 } e L 2 ={p 3,p 4,p 5 } Exemplo reitrado de Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, 2006

21 Critério de Validação Externo Exemplo - continuação f 00 = 4 f 01 = 2 f 10 = 2 f 11 = 2 RandIndex= (2+4)/10 = 6/10= 0.6 Jaccard = 2/(2+2+2) = 2/6 = 0.33

22 Critério de Validação Externo de Método Direto Hierarquias Aplicar um critério externo N-2 vezes Um para cada nível intermediário das hierarquias em questão Compor esses resultados (soma, média, etc.) Método Indireto Avaliar a correlação entre duas matrizes que representam as hierarquias sendo comparadas Baseado nos slides do prof. Ricardo J. G. B. Campello disciplina Aprendizado de Máquina ICMC-USP

23 Critério de Validação Externo de Hierarquias Correlação estatística Γde Hubert N 1 N 1 X ( i, j) x Y ( i, j) y M i 1 j i 1 Matrizes: elemento (i,j) é igual a c se os objetos i e j aparecem unidos pela 1a vez no c-ésimo nível hierárquico x y Baseado nos slides do prof. Ricardo J. G. B. Campello disciplina Aprendizado de Máquina ICMC-USP

24 Critério de Validação Interno Usadas quando não se dispõe do ground-truth Medem o quanto os dados se ajustam a estrutura de grupos obtida Divididos em Medidas de coesão dos grupos Determina o quão relacionados estão dois objetos em um grupo Medida de separação dos grupos Determina o quão distintos ou bem separados estão um grupo de outros

25 Critério de Validação Interno Em geral, usam uma matriz de distâncias (ou matriz de proximidade) SSE (já vimos ao estudar o K-Means) Pode ser usado por exemplo para identificar o nro de grupos J k c 1 x j C d( x c j, x c 2 )

26 Critério de Validação Interno de Hierarquias Usar um critério interno em sucessivas partições produzidas por um algoritmo hierárquico O resultado pode indicar um ponto de corte no dendograma regra de parada

27 Critério de Validação Relativos Usado para indicar qual a melhor dentre duas ou mais partições O termo pode ser usado para critério de validação interno depende do contexto Usado para comparar diferentes execuções de um algoritmo com diferentes parâmetros Ex: diferentes valores de k

28 Critério de Validação Relativos Índice Dunn Definido como a razão entre a menor distância inter-clusters (S_Dist) e a maior distância intra-cluster (G_Diam) Dunn S _ Dist G _ Diam Quanto maior o valor, melhor é a organização dos grupos em termos de separabilidade e compacidade Retirada dos slides do prof. Ricardo J. G. B. Campello disciplina Aprendizado de Máquina ICMC-USP

29 Critério de Validação Relativos Davies-Bouldin D l DB max l m{ Dl },m 1 k k l 1 D l D l, m ( dl d d l, m m ) d l e d m são a distância média dentro dos clusters l e m d l,m é a distância inter-clusters desses grupos 1 d l xi xl N l x i C l d x x l, m l m Baseado nos slides do prof. Ricardo J. G. B. Campello disciplina Aprendizado de Máquina ICMC-USP

30 Critério de Validação Relativos Davies-Bouldin Quanto menor o valor do índice, melhor, pois isso significa baixas medidas de dispersão intragrupo e grandes distâncias intergrupo

31 Critério de Validação Relativos Largura da Silhueta (SWC) Combina coesão com separação Calculada para cada objeto que faz parte de um agrupamento Baseada na proximidade entre os objetos de um cluster e na distância dos objetos de um cluster ao cluster mais próximo Mostra quais objetos estão bem situados dentro dos seus clusters e quais estão fora de um cluster apropriado

32 Critério de Validação Relativos Largura da Silhueta (SWC) s( i) SWC b( i) a( i) max{ a( i), b( i)} 1 N N i 1 SWC [ 1, 1] s( i) a(i): dissimilaridade média do i- ésimo objeto ao seu cluster b(i): dissimilaridade média do i- ésimo objeto ao seu cluster vizinho mais próximo Silhueta Original: a(i) e b(i) são calculados como a distância do i- ésimo objeto a todos os demais objetos do cluster em questão Complexidade O(N 2 ) Baseado nos dos slides do prof. Ricardo J. G. B. Campello disciplina Análise de Agrupamento de Dados ICMC-USP

33 Critério de Validação Relativos Largura da Silhueta (SWC) - Algoritmo Algoritmo reitrado de Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, 2006

34 Critério de Validação Relativos Largura da Silhueta Simplificada (SSWC) s( i) SWC b( i) a( i) max{ a( i), b( i)} 1 N N i 1 SWC [ 1, 1] s( i) a(i): dissimilaridade média do i- ésimo objeto ao seu cluster b(i): dissimilaridade média do i- ésimo objeto ao seu cluster vizinho mais próximo Silhueta Simplificada: a(i) e b(i) são calculados como a dissimilaridade média do i-ésimo objeto ao centróide do cluster em questão Complexidade O(N) Baseado nos dos slides do prof. Ricardo J. G. B. Campello disciplina Análise de Agrupamento de Dados ICMC-USP

35 Critério de Validação Relativos Avaliar a execução do algortimo K-means para o cadastro de pacientes abaixo usando a medida de silhueta Exemplo retirado dos slides do prof. André C. P. L. F. Carvalho disciplina Aprendizado de Máquina ICMC-USP

36 Validação de agrupamento em data streams Poucos trabalhos foram desenvolvidos Ideia bastante usada na literatura Avaliar as janelas de dados e plotar a evolução da medida ao longo do tempo Avaliar as janelas de dados e exibir o valor da média das janelas

37 Validação de agrupamento em data streams Medida de Validação Externa - CMM Clustering Mapping Measure (validação externa) É a soma normalizada das penalidades para cada um dos tipos de erro Missed points, Misplaced points e noise inclusion 1: nenhum erro ocorreu 0: erro máximo

38 Avaliação em Classificação

39 Os slides a seguir consistem em adaptações dos slides do prof. Andre Carlos Ponce de Leon Ferreira Carvalho Agradecimento ao prof. Andre Carvalho por gentilmente ceder os seus slides

40 Algoritmos de AM Induzem modelos (hipóteses) a partir de um conjunto de dados Dados precisam Ser estruturados Ter boa qualidade Ser representativos Algoritmos de AM indutivo possuem um viés Tendência a privilegiar uma dada hipótese ou conjunto de hipóteses

41 Viés Indutivo Quando um algoritmo de AM está aprendendo a partir de um conjunto de dados de treinamento, ele está procurando uma hipótese, no espaço de possíveis hipóteses, capaz de descrever as relações entre os objetos e que melhor se ajuste aos dados de treinamento. Cada algoritmo ultiliza uma forma ou representação para descrever a hipótese induzida

42 Viés Indutivo

43 Algoritmos de AM Fontes de erro de algoritmos AM Viés Quando algoritmo aprende um modelo incorreto Associado a underfitting Variância Quando algoritmo presta atenção a detalhes sem importância Associado a overfitting Precisam ser reduzidos

44 Aprender é achar padrões Formar e lembrar de novos conceitos E adaptar conceitos conhecidos Algoritmo que não aprende Não consegue induzir modelo que se ajusta (fit) aos dados Underfitting Não presta atenção aos dados Desatento

45 Aprender é esquecer Aprender é tanto esquecer os detalhes quanto lembrar das partes importantes Prestar muito atenção a detalhes leva a overfitting do modelo induzido Algoritmo de AM acha um padrão nos dados que não é verdadeiro no mundo real Alucinação

46 Overfitting e underfitting Quando uma hipótese apresenta uma baixa capacidade de generalização Pode ser que ela está superajustada aos dados de treinamento (overfitting) A hipótese memorizou ou se especializou nos dados de treinamento. Quando uma hipótese apresenta uma baixa taxa de acerto mesmo no subconjunto de treinamento Pode ser que ela está subajustada (underfitting). Ex: os exemplos de treinamento disponíveis são pouco representativos ou o modelo usado é muito simples e não captura os padrões existentes nos dados.

47 Overfitting e underfitting

48 Bom algoritmo de AM Está sempre percorrendo um caminho estreito entre: Overfitting Underfitting Buscando o melhor compromisso que reduz reduzir ambos

49 Avaliação de desempenho Espera-se de um classificador que ele apresente desempenho adequado para dados não vistos Acurácia, pouca sensibilidade ao uso de diferentes amostras de dados,... Desempenho do classificador deve ser avaliado Para tanto utilizam-se conjuntos distintos de exemplos de treinamento e exemplos de teste Permitem estimar a capacidade de generalização do classificador Permitem avaliar a variância (estabilidade) do classificador

50 Avaliação de classificadores Existem diferentes métodos para organização e utilização dos dados (exemplos) disponíveis em conjuntos de treinamento e teste Por exemplo: Holdout Random Subsampling Cross-Validation

51 Holdout Também conhecido como split-sample Técnica mais simples Faz uma única partição da amostra em: Conjunto de treinamento geralmente 1/2 ou 2/3 dos dados Conjunto de teste dados restantes

52 Holdout Problema: dependência da composição dos conjuntos É mais crítico em pequenas quantidades de dados... Quanto menor o conjunto de treinamento, maior a variância (sensibilidade / instabilidade) do classificador a ser obtido Quanto menor o conjunto de teste, menos confiável a acurácia estimada do classificador para dados não vistos Conjuntos de treinamento e teste podem não ser independentes Classe sub-representada em um será superrepresentada no outro

53 Random Subsampling Múltiplas execuções de Holdout Diferentes partições treinamento-teste são escolhidas de forma aleatória Não pode haver interseção entre os dois conjuntos Desempenho de classificação é avaliado para cada partição Desempenho estimado para dados não vistos é o desempenho médio para as diferentes partições Permite uma estimativa de erro mais precisa Porém, não controla número de vezes que cada exemplo é utilizado nos treinamentos e testes

54 Random Subsampling Exemplo: Supor que o conjunto de dados original seja formado pelos dados: x1, x2, x3, x4, x5, x6, x7, x8 Possíveis partições:

55 Cross-Validation Validação cruzada Classe de métodos para estimativa da taxa de erro k-fold cross-validation Cada objeto participa o mesmo número de vezes do treinamento (k 1 vezes) Cada objeto participa o mesmo número de vezes do teste (1 vez)

56 Cross-Validation Divide conjunto de dados em k partições mutuamente exclusivas A cada iteração, uma das k partições é usada para testar o modelo As outras k 1 são usadas para treinar o modelo Taxa de erro é tomada como a média dos erros de teste das k partições Exemplo Típico 10-fold cross-validation

57 Cross-Validation k-fold cross-validation estratificada Mantém nas pastas as proporções de exemplos das classes presentes no conjunto total de dados

58 Medidas de desempenho Principal objetivo de um modelo é predizer com sucesso o valor de saída para novos exemplos Errar o mínimo possível Existem várias medidas de erro e acerto diferentes medidas podem capturar diferentes aspectos do desempenho de classificadores

59 Taxa de Classificação Incorreta A medida mais básica para estimar a taxa de erro de um classificador é denominada de taxa de classificação incorreta (misclassification rate) É simplesmente a proporção dos exemplos de teste que são classificados incorretamente pelo classificador Usualmente é mensurada indiretamente através do seu complemento, a taxa de classificação correta Denominada de Acurácia Acurácia = 1 taxa de classificação incorreta

60 Acurácia Também chamada de accuracy (do inglês) Trata as classes igualmente... Pode não ser adequada para classes desbalanceadas Classe rara é normalmente mais interessante que a majoritária No entanto, a medida tende a privilegiar a classe majoritária

61 Avaliação de desempenho Limitações da Acurácia Considere um problema de duas classes Número de exemplos da classe 0 = 9990 Número de exemplos da classe 1 = 10 Se o modelo predizer qualquer exemplo como da classe 0, a acurácia será 9990/10000 = 99.9 % Acurácia pode ser enganadora

62 Tipos de Erros Em classificação binária, em geral se adota a convenção de rotular os exemplos da classe de maior interesse como positivos (+) Normalmente a classe rara ou minoritária Demais exemplos são rotulados como negativos ( ) Em alguns casos, os erros têm igual importância Em muitos casos, no entanto, esse não é o caso Ex. diagnóstico negativo para indivíduo doente...

63 Tipos de Erros Dois tipos de erro em classificação binária: Classificação de um exemplo N como P Falso Positivo (FP alarme falso) Ex.: Diagnosticado como doente, mas está saudável Classificação de um exemplo P como N Falso Negativo (FN) Ex.: Diagnosticado como saudável, mas está doente

64 Matriz de Confusão Ou Tabela de Contingência Pode ser usada para distinguir os tipos de erro Base de várias medidas de erro Pode ser usada com duas ou mais classes

65 Avaliação de desempenho Acuracia VP VP VN VN FP FN

66 Avaliação de desempenho

67 Avaliação de desempenho

68 Avaliação de desempenho

69 Avaliação de desempenho Revocação (recall, sensibilidade, taxa de VP) Taxa com que classifica como positivos todos os exemplos que são de fato positivos Só considera os exemplos que são positivos Normalmente classe de maior interesse Precisão (precision) Taxa com que todos os exemplos classificados como positivos são realmente positivos Só considera os exemplos classificados como positivos

70 Avaliação de desempenho Especificidade (Especificity) Taxa com que classifica como negativos todos os exemplos que são de fato negativos Só considera os exemplos negativos

71 Gráficos ROC Do inglês, Receiver Operating Characteristics Medida de desempenho originária da área de processamento de sinais Muito utilizada na área médica Mostra relação entre custo (taxa de FP) e benefício (taxa de VP) Taxa de FP = Erro do Tipo I (alarmes falsos) Taxa de VP (Recall, Sensibilidade) = 1 Erro do Tipo II

72 Exemplo Plotar no gráfico ROC os 3 classificadores do exemplo anterior

73 Exemplo

74 Gráficos ROC Informalmente, melhor classificador é aquele cujo ponto está mais a noroeste Classificadores próximos do canto inferior esquerdo são conservadores Só fazem classificações positivas com forte evidência Assim, cometem poucos erros de FP Classificadores próximos ao canto superior direito são liberais (sob risco de alarme falso)

75 Curvas ROC Classificadores que geram escores: Diferentes valores de limiar para os scores associados à classe Positiva podem ser utilizados para gerar um classificador Cada valor produz um classificador diferente Corresponde a um ponto diferente no gráfico ROC Ligação dos pontos gera uma Curva ROC

76 Curvas ROC

77 Classes Difíceis Alguns problemas de classificação são caracterizados por possuírem classes difíceis de serem aprendidas por um classificador Duas das principais razões são: Distribuição espacial complexa no espaço dos atributos Classes desbalanceadas Classes raras

78 Classes desbalanceadas No. de exemplos varia para as diferentes classes Natural ao domínio; ou Problema com geração / coleta de dados Várias técnicas de DM não conseguem ou têm dificuldade para lidar com esse problema Tendência a classificar na(s) classe(s) majoritária(s)

79 Classes desbalanceadas Alternativa mais simples:balanceamento Artificial Sobre-amostragem Consiste em aumentar artificialmente os exemplos da classe minoritária (classe positiva) até que os dados de treinamento estejam balanceados Sub-amostragem Diminui artificialmente os exemplos da classe majoritária (negativa) até que dados de treinamento estejam balanceados Híbrido Mescla oversampling e undersampling para amenizar os possíveis problemas de cada abordagem

80 Métricas de avaliaçãos em data streams Cross validation e variantes não são apropriadas Alternativas Holdout (se os dados são estacionários) Prequential

81 Métricas de avaliaçãos em data streams Holdout em um conjunto de teste independente Aplicar o modelo de decisão atual ao conjunto de teste em intervalos de tempos regulares Predictive Sequential (Prequential) O erro do modelo é calculado a partir de uma sequência de exemplos Para cada exemplo no stream, o modelo faz uma predição baseado nos valores do atributos do exemplo O erro prequential é baseado na soma acumulada de uma função perda entre os valores predito e obseravdo

82 Métricas de avaliaçãos em data streams Predictive Sequential (Prequential) Pode ser usado em situações onde há feedback limitado (nem todo os exemplos são rotulados) Computa-se a função perda para os exemplos em que o y i (rótulo do exemplo) é conhecido

83 Referências Tan P., SteinBack M. e Kumar V. Introduction to Data Mining, Pearson, Jain, A. K.; Dubes, R. C. Algorithms for Clustering Data, Prentice Hall, Zaki, M. J., Meira, W. Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2014.

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem

Leia mais

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho... DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento

Leia mais

Boas Maneiras em Aprendizado de Máquinas

Boas Maneiras em Aprendizado de Máquinas Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas

Leia mais

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br

Leia mais

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Introdução. Classificação III: Árvores de Decisão SCC073 Mineração de Dados Biológicos Classificação III: Árvores de Decisão Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo Prof. André C. P. L. F.

Leia mais

CLASSIFICADORES ELEMENTARES

CLASSIFICADORES ELEMENTARES CLASSIFICADORES ELEMENTARES Classificação 2 Consiste em tentar discriminar em diferentes classes um conjunto de objetos com características mensuráveis Exemplo: classificação de frutas Forma, cor, sabor,

Leia mais

Aprendizado de Máquinas

Aprendizado de Máquinas Aprendizado de Máquinas Objetivo A área de aprendizado de máquina preocupa-se em construir programas que automaticamente melhorem seu desempenho com a experiência. Conceito AM estuda métodos computacionais

Leia mais

Aula 9. Prof. Adilson Gonzaga

Aula 9. Prof. Adilson Gonzaga Aula 9 Prof. Adilson Gonzaga Mapeamento Atribuir uma Instância a uma classe. Cada Instância é mapeada para um elemento do conjunto de Rótulos de Classe {p,n} p positivo n negativo Atribui uma Instância

Leia mais

Descoberta de Conhecimento em Bancos de Dados - KDD

Descoberta de Conhecimento em Bancos de Dados - KDD Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação

Leia mais

Curso de Data Mining

Curso de Data Mining Curso de Data Mining Sandra de Amo Curvas Roc Uma curva ROC (Receiver Operating Characteristic) é um enfoque gráfico que permite visualizar os trade-offs entre as taxas de positivos verdadeiros e positivos

Leia mais

Tutorial básico de classificação em RapidMiner

Tutorial básico de classificação em RapidMiner Tutorial básico de classificação em RapidMiner Mineração de dados biológicos Ciências físicas e biomoleculares Neste tutorial, aprenderemos a utilizar as funcionalidades básicas para classificação em Rapidminer.

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D. Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte B Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

Inteligência Artificial

Inteligência Artificial Aprendizagem por que? lnteligência Artificial Aprendizagem em IA Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com

Leia mais

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis: Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização

Leia mais

lnteligência Artificial Aprendizagem em IA

lnteligência Artificial Aprendizagem em IA lnteligência Artificial Aprendizagem em IA 1 Aprendizagem por que? Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado permite lidar com

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.4. Outras Redes Neurais Artificiais 2.4.1. Redes RBF 2.4.2. Mapas

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Aprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação

Aprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação Aprendizado em IA Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação Tópicos Agentes baseados em aprendizado Aprendizado indutivo Árvores de decisão Método ID3 Aprendizado em redes neurais

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Modelos preditivos A tarefa de classificação Modelos Preditivos A tarefa de geração de um modelo preditivo consiste em aprender um mapeamento de entrada para a saída. Neste caso,

Leia mais

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters

Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo

Leia mais

2284-ELE/5, 3316-IE/3

2284-ELE/5, 3316-IE/3 INTELIGÊNCIA ARTIFICIAL 2284-ELE/5, 3316-IE/3 Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2007/2008 Aprendizagem Supervisionada 2 Os vários algoritmos de Aprendizagem

Leia mais

Avaliação de Descritores de Imagem

Avaliação de Descritores de Imagem Avaliação de Descritores de Imagem André Tavares da Silva andre.silva@udesc.br Descritor O par descritor de imagem e função de distância descreve como as imagens de uma coleção estão distribuídas no espaço

Leia mais

Medidas de avaliação de agrupamentos (Clustering)

Medidas de avaliação de agrupamentos (Clustering) Medidas de avaliação de agrupamentos (Clustering) Sarajane M. Peres e Clodoaldo A. M. Lima 12 de novembro de 2015 Sarajane M. Peres e Clodoaldo A. M. Lima Medidas de avaliação de agrupamentos (Clustering)

Leia mais

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018

Mineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018 Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar

Leia mais

Métodos de reamostragem

Métodos de reamostragem Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Métodos de reamostragem Eduardo Vargas Ferreira Função custo 2 Função custo Matriz de confusão: é um layout de tabela que

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar

Leia mais

Combinação de Classificadores (fusão)

Combinação de Classificadores (fusão) Combinação de Classificadores (fusão) André Tavares da Silva andre.silva@udesc.br Livro da Kuncheva Roteiro Sistemas com múltiplos classificadores Fusão por voto majoritário voto majoritário ponderado

Leia mais

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21

Thiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 MINERAÇÃO DE DADOS Thiago Marzagão 1 1 marzagao.1@osu.edu ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos

Leia mais

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Avaliando Hipóteses George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Pontos importantes Erro da Amostra e Erro Real Como Calcular Intervalo de Confiança Erros de hipóteses Estimadores Comparando

Leia mais

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências

Leia mais

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular Principais tópicos André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Métodos baseados em distância Aprendizado baseado em instâncias Conceitos básicos KNN

Leia mais

APRENDIZAGEM DE MÁQUINA

APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.

Leia mais

Inteligência Artificial

Inteligência Artificial Inteligência Artificial Aula 14 Aprendizado de Máquina Avaliação de s Preditivos (Classificação) Hold-out K-fold Leave-one-out Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br Curso: Sistemas de Informação

Leia mais

Rafael Izbicki 1 / 38

Rafael Izbicki 1 / 38 Mineração de Dados Aula 7: Classificação Rafael Izbicki 1 / 38 Revisão Um problema de classificação é um problema de predição em que Y é qualitativo. Em um problema de classificação, é comum se usar R(g)

Leia mais

Mineração em Data Streams - Clustering. Profa. Elaine Faria UFU

Mineração em Data Streams - Clustering. Profa. Elaine Faria UFU Mineração em Data Streams - Clustering Profa. Elaine Faria UFU - 2018 Mineração de Dados Tarefas de mineração Tarefas Preditivas Classificação Regressão Detecção de Anomalias Tarefas Descritivas Agrupamento

Leia mais

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR Aprendizagem de Máquina - 2 Prof. Júlio Cesar Nievola PPGIa - PUCPR Inteligência versus Aprendizado Aprendizado é a chave da superioridade da Inteligência Humana Para que uma máquina tenha Comportamento

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos

Leia mais

Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC

Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC Regressão Linear Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Overfitting 2. Treino e Validação 3. Baseline dos modelos 1 Overfitting Overfit Em muitos casos, a amostra de dados coletada

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Considerações de Desempenho

Considerações de Desempenho Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 1 Dicas para o BP Os pesos devem

Leia mais

Back Propagation. Dicas para o BP

Back Propagation. Dicas para o BP Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 11 Dicas para o BP Os pesos devem

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Árvores de Decisão Poda e extensões Prof. Paulo Martins Engel UFRGS 2 Questões sobre Árvores de Decisão Questões práticas do aprendizado de AD incluem: Determinar até quando se

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Duda e Hart Capítulo 1 Reconhecimento de Padrões (imagem) Objetivo: Interpretar um conjunto de dados através de um mapeamento (classificação)

Leia mais

Redes Neurais (Inteligência Artificial)

Redes Neurais (Inteligência Artificial) Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Implementação de um sistema de validação estatística configurável de dados

Implementação de um sistema de validação estatística configurável de dados Implementação de um sistema de validação estatística configurável de dados Eduardo Dias Filho Supervisores: João Eduardo Ferreira e Pedro Losco Takecian 16 de novembro de 2014 Introdução Table of Contents

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto

Leia mais

Inteligência nos Negócios (Business Inteligente)

Inteligência nos Negócios (Business Inteligente) Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 7) Fundamentação da disciplina Analise de dados Decisões

Leia mais

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional Conceitos de Aprendizagem de Máquina e Experimentos Visão Computacional O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos

Leia mais

Aula 8: Árvores. Rafael Izbicki 1 / 33

Aula 8: Árvores. Rafael Izbicki 1 / 33 Mineração de Dados Aula 8: Árvores Rafael Izbicki 1 / 33 Revisão Vimos que a função de risco é dada por R(g) := E[I(Y g(x))] = P (Y g(x)), Nem sempre tal função nos traz toda informação sobre g. É comum

Leia mais

Combinação de Classificadores (seleção)

Combinação de Classificadores (seleção) Combinação de Classificadores (seleção) André Tavares da Silva andre.silva@udesc.br Livro da Kuncheva Roteiro Seleção de classificadores Estimativa independente de decisão Estimativa dependente de decisão

Leia mais

24/11/13. Aprendendo pelas observações. PCS 2428 / PCS 2059 lnteligência Ar9ficial. Prof. Dr. Jaime Simão Sichman Prof. Dra. Anna Helena Reali Costa

24/11/13. Aprendendo pelas observações. PCS 2428 / PCS 2059 lnteligência Ar9ficial. Prof. Dr. Jaime Simão Sichman Prof. Dra. Anna Helena Reali Costa PCS 2428 / PCS 2059 lnteligência Ar9ficial Prof. Dr. Jaime Simão Sichman Prof. Dra. Anna Helena Reali Costa Aprendizagem Indu9va Aprendendo pelas observações Idéia: percepção deve ser usada não somente

Leia mais

21/02/17. Aprendendo pelas observações. PCS 5869 lnteligência Ar9ficial. Prof. Dr. Jaime Simão Sichman Prof. Dra. Anna Helena Reali Costa

21/02/17. Aprendendo pelas observações. PCS 5869 lnteligência Ar9ficial. Prof. Dr. Jaime Simão Sichman Prof. Dra. Anna Helena Reali Costa PCS 5869 lnteligência Ar9ficial Prof. Dr. Jaime Simão Sichman Prof. Dra. Anna Helena Reali Costa Aprendizagem Indu9va Aprendendo pelas observações Idéia: percepção deve ser usada não somente para a atuação

Leia mais

Instituto Nacional de Pesquisas Espaciais - INPE. Divisão de Processamento de Imagens - DPI

Instituto Nacional de Pesquisas Espaciais - INPE. Divisão de Processamento de Imagens - DPI 1 Sumário 2 Introdução Técnicas de ESDA Matrizes de Proximidade Espacial Média Espacial Móvel (m i ) Indicadores Globais de Autocorrelação Espacial Índices Globais de Moran (I), Geary (C) e Getis e Ord

Leia mais

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências

Leia mais

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem e Avaliação de s José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP AM é uma ferramenta poderosa, mas não existe um único algoritmo que apresente o melhor desempenho para todos os

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

Aprendizado de Máquina. André C. P. L. F. de Carvalho Centro de Pesquisa AMDA ICMC-USP

Aprendizado de Máquina. André C. P. L. F. de Carvalho Centro de Pesquisa AMDA ICMC-USP Aprendizado de Máquina André C. P. L. F. de Carvalho Centro de Pesquisa AMDA ICMC-USP Tópicos Introdução Aprendizado de Máquina Métodos Preditivos Algoritmos de treinamento Avaliação de desempenho Métodos

Leia mais

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS Aluno: Fabricio Aparecido Breve Prof.: Dr. André Ponce

Leia mais

Validade interna e externa em estudos epidemiológicos. Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo

Validade interna e externa em estudos epidemiológicos. Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo Validade interna e externa em estudos epidemiológicos Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo Qualidade da Informação Existem dois conceitos fundamentais, em termos

Leia mais

Lista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís

Lista de Exercícios - Capítulo 8 [1] SCC Inteligência Artificial 1o. Semestre de Prof. João Luís ICMC-USP Lista de Exercícios - Capítulo 8 [1] SCC-630 - Inteligência Artificial 1o. Semestre de 2011 - Prof. João Luís 1. Seja breve na resposta às seguintes questões: (a) o que você entende por Aprendizado

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Kuncheva pg. 8 a 25 (seções 1.3 e 1.4) Roteiro da aula Cálculo do erro de um classificador Técnicas de treinamento, avaliação e teste

Leia mais

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos

SEL-0339 Introdução à Visão Computacional. Aula 7 Reconhecimento de Objetos Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 7 Reconhecimento de Objetos Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga mvieira@sc.usp.br

Leia mais

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka

Tópicos Avançados em IA. Prof. Eduardo R. Hruschka Tópicos Avançados em IA Prof. Eduardo R. Hruschka Créditos Este material consiste de adaptações dos originais: Elaborados por Eduardo Hruschka e Ricardo Campello de (Tan et al., 2006) de E. Keogh (SBBD

Leia mais

lnteligência Artificial Introdução a Aprendizado de Máquina

lnteligência Artificial Introdução a Aprendizado de Máquina lnteligência Artificial Introdução a Aprendizado de Máquina 1 Aprendizado por que? Capacidade de aprender é parte fundamental do conceito de inteligência. Um agente aprendiz é mais flexível aprendizado

Leia mais

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CURTA DURAÇÃO ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof.ª Dr.ª Alessandra de Ávila Montini OBJETIVOS Introduzir o conceito de Big Data,

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

3.33pt. AIC Introdução

3.33pt. AIC Introdução 1 3.33pt 1 Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 01 de Julho de 2016 2 3.33pt 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING Asterio K. Tanaka http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Introdução a Data Mining Árvores de Decisão Categorização de Dados Parte II Rogério

Leia mais

Mineração de Dados - II

Mineração de Dados - II Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework

Leia mais

Exame de Aprendizagem Automática

Exame de Aprendizagem Automática Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores

Leia mais

Boas Maneiras Aprendizado Não Supervisionado Regressão

Boas Maneiras Aprendizado Não Supervisionado Regressão Universidade Federal do Paraná (UFPR) Especialização em Engenharia Industrial 4.0 Boas Maneiras Aprendizado Não Supervisionado Regressão David Menotti www.inf.ufpr.br/menotti/am-18b Hoje Boas Maneiras

Leia mais

Múltiplos Classificadores

Múltiplos Classificadores Universidade Federal do Paraná (UFPR) Bacharelado em Informátia Biomédica Múltiplos Classificadores David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Múltiplos classificadores Combinação de classificadores

Leia mais

A procura da melhor partição em Classificação Hierárquica: A abordagem SEP/COP

A procura da melhor partição em Classificação Hierárquica: A abordagem SEP/COP A procura da melhor partição em Classificação Hierárquica: A abordagem SEP/COP Lúcia Sousa Escola Superior de Tecnologia e Gestão, Instituto Politécnico de Viseu Fernanda Sousa Faculdade de Engenharia

Leia mais

Modelos Lineares Generalizados - Regressão Logística

Modelos Lineares Generalizados - Regressão Logística Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 26 de Maio de 2014 AIC 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos de modelo. Mede

Leia mais

Projected Clustering Algorithm

Projected Clustering Algorithm Projected Clustering Algorithm Emanuel Matos 5560105 Disciplina : Análise de Agrupamentos Prof. Dr. Ricardo Campello Dez/2010 View Problema Objetivo Definições/Premissas Algoritmo Acurácia Escalabilidade

Leia mais

Metodologia Aplicada a Computação.

Metodologia Aplicada a Computação. Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Saulo Martiello Mastelini Departamento de Computação - UEL 1 o Semestre Assunto Aula 11 Modelos Preditivos - Árvore de Decisão

Leia mais

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná

SENSOMETRIA. Adilson dos Anjos. Curitiba, PR 21 de maio de Departamento de Estatística Universidade Federal do Paraná SENSOMETRIA Adilson dos Anjos Departamento de Estatística Universidade Federal do Paraná aanjos@ufpr.br Curitiba, PR 21 de maio de 2015 1 / 7 SENSOMETRIA SEGMENTAÇÃO 2 / 7 Introdução Análise de agrupamentos->

Leia mais

Clustering (k-means, SOM e hierárquicos)

Clustering (k-means, SOM e hierárquicos) Clustering (k-means, SOM e hierárquicos) André Tavares da Silva andre.silva@udesc.br (Capítulo 10 de Duda e Hart) Clustering Introdução e tipos Roteiro Agrupamentos hierárquicos AGNES, DIANA e Dendogram

Leia mais

Comparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos

Comparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos Comparação entre intervalos de confiança calculados com métodos strap e intervalos assintóticos Selene Loibel Depto. de Estatística, Matemática Aplicada e Computação, IGCE, UNESP, Rio Claro, SP E-mail:sloibel@rc.unesp.br,

Leia mais

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais Prof. Eduardo Simas (eduardo.simas@ufba.br) Programa de Pós-Graduação em Engenharia Elétrica/PPGEE Universidade Federal

Leia mais