Aprendizagem de Máquina

Documentos relacionados
Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...

Reconhecimento de Padrões

Aprendizagem de Máquina

Mineração de Dados em Biologia Molecular

SCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos

Classificação Automática de Gêneros Musicais

Métodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Descoberta de Conhecimento em Bancos de Dados - KDD

Tutorial básico de classificação em RapidMiner

Aprendizagem de Máquina

CLASSIFICADORES ELEMENTARES

Aprendizado de Máquina. Combinando Classificadores

Redes Perceptron e Multilayer Perceptron aplicadas a base de dados IRIS

Aprendizado de Máquina

Aprendizagem de Máquina

Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

Thiago Zavaschi Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade

Inteligência Artificial. Prof. Tiago A. E. Ferreira Aula 21 Projeto de RNA

Aprendizado de Máquina

Projeto da Disciplina

Aprendizado de Máquinas. Seleção de Características

θ depende de um parâmetro desconhecido θ.

Redes Neurais Artificiais. Everton Gago

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka

ANÁLISE DE ESTRATÉGIAS DE CAPACITAÇÃO DE PROFESSORES DO ENSINO SUPERIOR EM TECNOLOGIAS EDUCACIONAIS

Aprendizado em IA. Prof. Carlos H. C. Ribeiro ITA Divisão de Ciência da Computação

Inteligência nos Negócios (Business Inteligente)

Aprendizado de Máquinas. Multi-Layer Perceptron (MLP)

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning)

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Rede RBF (Radial Basis Function)

PREDIÇÃO À EVASÃO ESCOLAR: Estudo de caso aplicado no IFSULDEMINAS Campus Passos RESUMO

Redes Neurais MLP: Exemplos e Características

5 Experimentos Conjunto de Dados

Aula 3: Random Forests

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Aprendizado de Máquina Introdução às Redes Neurais Artificiais

Curso de Data Mining

Aprendizagem Bayesiana

JAI 6 - Deep Learning Teoria e Prática

Aprendizado de Máquina (Machine Learning)

Redes Neurais Artificial. Prática. Inteligência Artificial

Aprendizagem de Máquina

Avaliação do desempenho das ConvNets na detecção de ovos de esquistossomose PROPOSTA DE TRABALHO DE GRADUAÇÃO

Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC

Transcrição:

Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR)

Mestrado/Doutorado em Informática Aprendizagem de Máquina 2 Introdução Vimos anteriormente muitos algoritmos de aprendizagem A pergunta que sempre se faz é: Qual deles é o melhor? Pode existir uma preferência por aqueles de menor complexidade computacional, ou que levam em conta algum conhecimento a priori da forma dos dados, etc.

Mestrado/Doutorado em Informática Aprendizagem de Máquina 3 Introdução Entretanto, quando isso não importa... Existem razões para escolher um algoritmo em relação a outros?

Mestrado/Doutorado em Informática Aprendizagem de Máquina 4 Introdução Quando temos dois algoritmos que possuem a mesmo desempenho sobre um conjunto de exemplos de treinamento: Escolhemos sempre o mais simples, pois ele deve apresentar um desempenho melhor sobre um conjunto de exemplos de teste!

Mestrado/Doutorado em Informática Aprendizagem de Máquina 5 Introdução Entretanto, a maneira utilizada para avaliar o desempenho de algoritmos de aprendizagem é: Avaliar o erro (ou acerto) em exemplos fora do conjunto de exemplo de treinamento! Ou seja, sobre um Conjunto de Exemplos de Testes.

Mestrado/Doutorado em Informática Aprendizagem de Máquina 6 Avaliação de Desempenho Para que avaliar desempenho (generalização)? 1. Para verificar se o algoritmo possui um desempenho bom o suficiente para ser útil 2. Para comparar seu desempenho com o de outros algoritmos

Mestrado/Doutorado em Informática Aprendizagem de Máquina 7 Instabilidade Um algoritmo de aprendizagem pode ser considera instável se: uma pequena alteração nos dados de treinamento levar a classificadores significativamente diferentes e mudanças relativamente grandes na precisão

Mestrado/Doutorado em Informática Aprendizagem de Máquina 8 Método da Validação Cruzada Particionar aleatoriamente o conjunto de dados em três partes Passo 1: Define pelo menos três conjuntos disjuntos: 1. Conjunto de exemplos de treinamento 2. Conjunto de exemplos de validação 3. Conjunto de exemplos de teste Passo 2: Utiliza o Conjunto de Treinamento para fazer a aprendizagem do algoritmo. Utiliza o Conjunto de Validação para verificar a generalização do algoritmo (ajustar os parâmetros).

Mestrado/Doutorado em Informática Aprendizagem de Máquina 9 Método da Validação Cruzada Passo 3: Depois do algoritmo treinado, avalia sua generalização sobre o Conjunto de Testes. OBS 1: O Conjunto de Testes não pode ser utilizado para ajustar parâmetros! OBS 2: Cuidar com a distribuição de exemplos por classe que compõem os conjuntos. Probabilidades a priori diferentes! OBS 3: Método melhor adaptado a grandes conjuntos de dados.

Mestrado/Doutorado em Informática Aprendizagem de Máquina 10 Método da Validação Cruzada Como calcular o desempenho? 1. Taxa de acerto (%): Num. Exemplos Classif. Corretamente Num Total de Exemplos 2. Taxa de erro (%): Num. Exemplos Classif. Incorretamente Num Total de Exemplos

Mestrado/Doutorado em Informática Aprendizagem de Máquina 11 Método da Validação Cruzada Como calcular o desempenho médio e variância? 1. Treinar n vezes o algoritmo (diferentes parâmetros) 2. Avaliar os n algoritmos treinados (taxa de acerto) 3. Calcular a taxa de acerto média 4. Calcular a variância

Mestrado/Doutorado em Informática Aprendizagem de Máquina 12 Método Validação Cruzada n-fold Chamado de n-fold cross validation É uma generalização do método validação cruzada Passo 1: O conjunto de dados de tamanho n (n exemplos) é dividido em m conjuntos disjuntos de tamanho n/m Passo 2: O algoritmo é treinado m vezes, cada vez com um conjunto diferente sendo deixado de fora para fazer a validação.

Mestrado/Doutorado em Informática Aprendizagem de Máquina 13 Método Validação Cruzada n-fold Passo 3: O desempenho é estimado como sendo o erro médio ou taxa de acerto média sobre estes m conjuntos de validação. Também chamado de Leave-one-out