Classificação Bayesiana
|
|
|
- Paulo Palhares Veiga
- 8 Há anos
- Visualizações:
Transcrição
1 Classificação Bayesiana Victor Lobo Contexto Existem um conjunto de dados conhecidos Conjunto de treino Queremos prever o que vai ocorrer noutros casos Exemplo Empresa de seguros de saúde quer estimar custos com um novo cliente Conjunto de treino (dados históricos) Altura Peso Sexo Idade Ordenado Usa ginásio M S N M S N F N N M N S F N S Encargos para seguradora E o Manel? Altura=1.73 Peso=85 Idade=31 Ordenado=2800 Ginásio=N Terá encargos para a seguradora? 1
2 Tema central: Existe alguma maneira ÓPTIMA de fazer a classificação de um padrão de dados? Sim: classificação Bayesiana (óptima segundo um dado critério...) Conseguimos usar sempre esse método? Não: geralmente é impossível obter o classificador de Bayes É útil conhecê-lo? Sim: Dá um limite e um termo de comparação O nosso exemplo... Dados completos Medição de características C/ 2 variáveis largo estreito pequeno grande pomba pequeno falcão águia grande Comprimento 2
3 Noção de Classificação Bayesiana Escolhe a classe mais provável, dado um padrão de dados max P(C i x) É sempre a escolha óptima! Problema: Estimar P(C i x) Solução: dado um dado, eu posso não saber à priori a classe, mas dado uma classe, eu talvez saiba à priori como são dos dados dessa classe... Teorema de Bayes Formulação do teorema de Bayes P(C,x ) = P(C x)p(x) = P(x C)P(C) logo.. P(C x) = P(x C)P(C) / P(x) Dado um x, P(x) é constante, o classificador Bayesiano escolhe a classe que maximiza P(x C)P(C) Classificador que maximiza P(C x) é conhecido como classificador MAP (maximum a posterioi) 3
4 Custos variáveis A escolha óptima da classe tem que ter em conta os custos de cometer erros Exemplos: detectar aviões num radar, detectar fraudes ou defeitos em peças Custo: ct(c i,c j ) = custo de escolher c j dado que a classe é de facto c j Matriz de custos Matriz com todos os custos de classificação Determinação dos custos... Classificador de Bayes Custo de uma decisão: ct j (x) = ct(c i, c j ) P(c i,x) Custo de escolher A é a soma dos custos de escolher as OUTRAS classes vezes a probabilidade de ocorrerem as OUTRAS classes Classificador de Bayes Escolhe a classe que minimiza o custo de classificação c=c k : k= arg min ct j (x) 4
5 Classificador de máxima verosimilhança Maximum Likelihood (ML) Muitas vezes podemos admitir que, à partida, todas as classes são equiprováveis Nesse caso, o classificador MAP simplifica para: P(C x) = P(x C)P(C) / P(x) P(x C) Ou seja a classe mais provável é a que com maior probabilidade gera esse dado! Na prática, um bom critério! Problemas em estimar P(x,C) Desconhece-se geralmente a forma analítica de P(x,C) Estimação de P(x,C) a partir dos dados Problema central em classificação!!! Estimação paramétrica Assumir que P(x,C) tem uma distribuição conhecida (gausseana, uniforme, etc), e estimar os parâmetros dessa distribuição Estimação não paramétrica Calcular P(x,C) directamente a partir dos dados 5
6 Exemplo de classificação Bayesiana : Jogar ténis ou não? Outlook Temperature Humidity Windy Play Sunny Hot High False No Sunny Hot High True No Overcast Hot High False Yes Rainy Mild High False Yes Rainy Cool Normal False Yes Rainy Cool Normal True No Overcast Cool Normal True Yes Sunny Mild High False No Sunny Cool Normal False Yes Overcast Mild Normal False Yes Sunny Mild Normal True Yes Overcast Mild High True Yes Overcast Hot Normal False Yes Rainy Mild High True No Caso 1: sabendo só o outlook Queremos saber P(jogo outlook), em concreto, se outlook = sunny Classificador MAP: P(jogo outlook) P(outlook jogo)p(jogo) P(jogo=sim)=9/14=0.64 P(jogo=não)=5/14=0.36 P(outlook= sunny jogo=sim)=2/9=0.22 P(outlook= sunny jogo=não)=3/5=0.60 P(jogo=sim outlook= sunny ) 0.22 x 0.64 = 0.14 P(jogo=não outlook= sunny ) 0.60 x 0.36 = 0.22 NÃO! Não joga! 6
7 Caso 1: sabendo só o outlook Classificador ML: P(jogo outlook) P(outlook jogo) P(outlook= sunny jogo=sim)=2/9=0.22 P(outlook= sunny jogo=não)=3/5=0.60 Não! Não joga! Problema quando x tem dimensão grande Se a dimensão de x é muito grande, devido à praga da dimensionalidade, é difícil calcular P(x,C) Solução: Assumir independência entre atributos Exemplo: Classificação de texto 7
8 Classificador naive de Bayes Assume independência dos atributos: P(x,C) = P(x m,c) Na prática tem bons resultados Evitar que P(x m,c) seja 0: Estimativa m: P=( n c + m x p) / (n + m) n c = exemplos de c n= total de exemplos m= ponderação (+/-prioi) p= estimativa à priori (equiprovável?) Algumas considerações... Aprendizagem incremental Um classificador Bayesiano pode ir actualizando as suas estimativas Separababilide P(x,c i )>0 P(x,c j )=0 x j i Erro de Bayes = 0 Não separabilidade Inconsistência (com os atributos conhecidos): Um mesmo x, tanto pode pertencer a c i como c j Erro de Bayes > 0 8
9 Classificadores bayesianos: Classificador de Bayes, com custos Entra em linha de conta com custos MAP ML Assume custos iguais Assume classes equiprováveis Naive de Bayes Assume independência entre atributos Erro de Bayes Erro do classificador bayesiano (geralmente MAP) Aprendizagem baseada em instâncias Victor Lobo 9
10 Tema central Sistemas de aprendizagem que guardam exemplos dos dados Ex: Guardar a pomba típica ou som característico A classificação (ou decisão) é feita comparando a nova instância com os exemplos guardados Exemplos protótipos instâncias neurónios Muitos nomes para a mesma coisa Estatística Kernel-based density estimation (Duda & Hart 68) Locally-weighted regression (Hardle 90) Machine Learning Memory-based classification (Stanfill & Waltz 86) Exemplar-based knowlegde acquisition (Bareiss 89) Instance-based classification (Aha 91) Case-based reasoning (Shank 82) Lazy Learning ( Alpaydin 97) Redes Neuronais Prototype-based networks (Kohonen 95) RBF (Lowe 88), LVQ, etc, etc... E muito, MUITO mais... (k-means, k-nn,etc,etc...) 10
11 Fundamentos: Classificador óptimo escolhe classe mais provável: P(C x) = P(x C)P(C) / P(x) No caso de um classificador MAP, basta saber P(x C) Estimação de P(x C) quando os atributos de x têm valores contínuos: P(x C)=0, mas podemos calcular p(x C) (densidade) No limite temos k n p( x C) / V k=nº de dados da classe (emv) n=nª total de dados (emv) V=Volume considerado Fundamentos kc / k Para que p( x C) V V = um dado volume em torno da nova instância k= nº total de exemplos nesse volume kc=nº de exemplos que pertencem à classe C é necessário que k e Mas isso é impossível lim ΔV 0 n (em princípio teremos também lim kc ) n Duas grandes famílias k = c te k-vizinhos, vizinho mais próximo, etc V =c te Janelas de Parzen 11
12 k-vizinhos k-vizinhos e vizinho mais próximo (k=1) Todos os exemplos são memorizados e usados na fase de aprendizagem. A classificação de um exemplo X consiste em encontrar os k elementos do conjunto de treino mais próximos e decidir por um critério de maioria. Gasta muita memória!!! 12
13 Algoritmo k - vizinhos mais próximos Algoritmo de treino Para cada exemplo de treino (x, c(x)) adicionar à lista de exemplos de treino. Retorna lista de exemplos de treino. Não há dúvida é o mais simples!!! Classificação por k-vizinhos k-nearestneighbor(x, Exemplos de treino) Sejam y 1,, y k, pertencentes à lista de exemplos de treino, os k vizinhos mais próximos de x. k Retorna cˆ x arg max v, cy vv em que V é o conjunto das classes, v é uma classe em particular, c(y) é a classe de y, e 0 x, y 1 i1 i se x y se x y 13
14 Regressão por k-vizinhos Algoritmo de regressão k-nearestneighbor(x, exemplos de treino) Sejam y 1,, y k, pertencentes à lista de exemplos de treino, os k vizinhos mais próximos de x. Retorna k 1 cˆ x c k i1 y i É simplesmente a média dos vizinhos!!! Fronteiras definidas pelo k-nn k grande Fronteiras suaves, ponderadas Estimador razoável da densidade de probabilidade Perde definição quando há variações pequenas k pequeno Fronteiras mais rugosas, sensíveis a outliers Mau estimador de densidade de probabilidade Margens de segurança Pode-se exigir uma diferença mínima para tomar uma decisão 14
15 Regressão linear (quando k n) Fronteiras do discriminante linear de Fisher 1-vizinho mais próximo 15
16 15 vizinhos mais próximos Exemplos de medidas de semelhança Distâncias Euclidiana Hamming Minkowski K D,, M X Y xi y i1 Mahalanobis D Ma 1 i 1 2 T X, Y, X Y X Y KK Correlação Não normalizada X, Y X. Y C i1 Máxima correlação C m K K X, Y max j i1 x i y i x y i i j 16
17 Classificação por k-vizinhos ponderados Algoritmo de classificação k-nearestneighbor(x, Exemplos de treino) Sejam y 1,, y k, pertencentes à lista de exemplos de treino, os k vizinhos mais próximos de x. Retorna k cˆ x arg max v, cy em que vv i1 1 i D x, i y i Regressão pelos k-vizinhos ponderados Algoritmo de classificação k-nearestneighbor(x, Exemplos de treino) Sejam y 1,, y k, pertencentes à lista de exemplos de treino, os k vizinhos mais próximos de x. Retorna k icy i i cˆ 1 x k i1 i 17
18 Vizinho mais próximo (k=1) É simples e eficaz Está muito bem estudado Erro assimptótico (quando n Zero, se as classes forem separáveis 2x erro de Bayes, se não o forem (Cover 67; Ripley 96; Krishna 00) Erro do vizinho mais próximo Com n finito,e c classes E bayes E nneighbour 2E bayes c E c 1 2 bayes sup xx mx cebayes ( x)(1 ) c 1 (x) é a função de semelhança (Drakopoulos 95), que pode ser estimada, e tem geralmente um valor baixo 18
19 Fronteiras do vizinho mais próximo Partição de Voronoi do conjunto de treino Problemas com k-nn Exigem MUITA memória para guardar o conjunto de treino Exigem MUITO tempo na fase de classificação São muito sensíveis a outliers São muito sensíveis à função de distância escolhida Só de pode resolver com conhecimento à priori... 19
20 Variantes sobre k- vizinhos Edited Nearest Neighbors Remover os outliers, e os exemplos demasiado próximos da fronteira Usar a regra de classificação (k-nn) sobre o próprio conjunto de treino, e eliminar os exemplos mal classificados k=3 já produz bons resultados 20
21 Minimização do nº de protótipos Reduzir o nº de protótipos resolve os 2 primeiros problemas! Deixa de ser possível estimar p(x) Enquadramento formal Q-Sets Heurísticas Condensed Nearest Neighbors ( = IB2, RIBL, etc) Condensed Nearest Neighbors [Hart 68] 1 Let 2 3 Train Training Set 4 #train Number of patterns in the training set 5 CNN Condensed Nearest Neighbor set 6 7 Do 8 9 CNN = {Train 1} 10 Repeat 11 Additions =FALSE 12 For i =2 to #train 13 Classify Train i with CNN 14 If Train i is incorrectly classified 15 CNN = CNN {Train i} 16 Additions =TRUE 17 End_if 18 End_for 19 Until Additions = FLASE 21
22 Reduced Nearest Neighbors [Gates 72] 1 Let 2 3 Train Training Set 4 #train Number of patterns in the training set 5 #cnn Number of patterns in the CNN set 6 CNN Condensed Nearest Neighbor set 7 RNN Reduced Nearest Neighbor Set 8 9 Do RNN = CNN 12 For i =1 to #cnn 13 Let Candidate_RNN = RNN { RNN i } 14 Classify all Train with Candidate_RNN 15 If all patterns in Train are correctly classified 16 RNN = Candidate_RNN 17 End_if 18 End_for Toy problem para testes Double F ou Harts Problem Simples visualisação, fronteira complexa Distribuição uniforme nas áreas indicadas Usada por muitos autores como ref Harts problem com 400 padrões 22
23 Avaliação experimental dos métodos 1 - Gerar N pontos para conjunto de treino 2 - Aplicar o método para obter um classificador 3 - Gerar M pontos para conjunto de validação 4 - Calcular o erro E no conjunto de validação 5 - Repetir os passos 1-4 várias vezes, e calcular os valores médios e desvios padrões para: Erro, Nº de protótipos, Tempo de treino e classificação Cálculo do erro Qual o tamanho do conjunto de validação para estimar o erro? Para cada padrão de teste Erro médio y E x p E i ˆ 1( erro) x 0( certo) 1 y N N x i i1 p 1 p pˆ(1 pˆ) N C/ p 1% e N=10e6 = 0.01% 0 ˆ 2 y ( desde que N p (1 p) 5) 23
24 Rotinas Matlab (do Toolbox dos Magos ) Class_plot(x,y,class) [vx,vy]=voronoi_boundary(x,y,class) [ c,cp ] = knn( t_data, t_label, x, k) [ c ] = knn_mat( t_data, t_label, x ) [cnn,cnn_label]=cnn(train, train_label ) [rnn,rnn_label]=rnn(train,train_label,cnn,cnn_label) outclass=selfclassify( dataset,inclass ) [data]=remove_col(data,index) Fronteiras típicas
Cap.2 Aprendizagem Bayesiana e baseada em protótipos V 3.0, V.Lobo, EN/ISEGI, 2005
V 3.0, V.Lobo, E/ISEGI, 005 Classificação Bayesiana (revisões...) Victor Lobo Contexto Existem um conjunto de dados conhecidos Conjunto de treino Queremos prever o que vai ocorrer noutros casos Exemplo
Métodos para Classificação: - Naïve Bayes.
Métodos para Classificação: - 1R; - Naïve Bayes. Visão Geral: Simplicidade em primeiro lugar: 1R; Naïve Bayes. 2 Classificação: Tarefa: Dado um conjunto de exemplos préclassificados, construir um modelo
Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka
Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada
CLASSIFICADORES BAEYSIANOS
CLASSIFICADORES BAEYSIANOS Teorema de Bayes 2 Frequentemente, uma informação é apresentada na forma de probabilidade condicional Probabilidade de um evento ocorrer dada uma condição Probabilidade de um
Classificação. Eduardo Raul Hruschka
Classificação Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada Combinação de Modelos
Aprendizagem Bayesiana
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Aprendizagem Bayesiana David Menotti www.inf.ufpr.br/menotti/ci171-182 Aprendizagem Bayesiana Agenda Introdução Teorema de Bayes
SCC0173 Mineração de Dados Biológicos
SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:
Aprendizado de Máquina. Conteudo. Terminologia. Notes. Notes. Notes. Notes. Aprendizagem Bayesiana. Luiz Eduardo S. Oliveira
Aprendizado de Máquina Aprendizagem Bayesiana Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net Luiz S. Oliveira (UFPR) Aprendizado de Máquina 1
Reconhecimento de Padrões. Reconhecimento de Padrões
Reconhecimento de Padrões 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Escola Superior de Tecnologia Engenharia Informática Reconhecimento de Padrões Prof. João Ascenso e Prof.
Aprendizado por Instâncias Janelas de Parzen & Knn
Universidade Federal do Paraná (UFPR) Especialização em Engenharia Industrial 4.0 Aprendizado por Instâncias Janelas de Parzen & Knn David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Aprendizado por
Métodos Não Paramétricos
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Métodos não Paramétricos Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Métodos Não Paramétricos Introduzir
Weka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining
Weka Universidade de Waikato - Nova Zelândia Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining implementado em Java open source software http://www.cs.waikato.ac.nz/ml/weka/
Aprendizado Bayesiano
Aprendizado Bayesiano Marcelo K. Albertini 26 de Junho de 2014 2/20 Conteúdo Teorema de Bayes Aprendizado MAP Classificador ótimo de Bayes 3/20 Dois papéis para métodos bayesianos Algoritmos de aprendizado
θ depende de um parâmetro desconhecido θ.
73 Método de Máxima Verosimilhança (Maximum Likelihood) Seja uma variável aleatória (v. a.) cuja densidade de probabilidade depende de um parâmetro desconhecido. Admite-se conhecida a forma de Exemplo
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES DE FUNÇÃO DE BASE RADIAL - RBF Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Funções de Base Global Funções de Base Global são usadas pelas redes BP. Estas funções são definidas como funções
Exame de Aprendizagem Automática
Exame de Aprendizagem Automática 2 páginas com 12 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 12 de Janeiro de 2017 Nota: O exame está cotado para 40 valores. Os 20 valores
1 o Teste de Aprendizagem Automática
o Teste de Aprendizagem Automática 3 páginas com 6 perguntas e 2 folhas de resposta. Duração: 2 horas DI, FCT/UNL, 22 de Outubro de 205 Pergunta [4 valores] As figuras abaixo mostram o erro de treino e
Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka
Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser
Minerando regras de associação
Minerando regras de associação Proposto por Rakesh Agrawal em 1993. É o modelo de mineração de dados mais estudado pela comunidade de banco de dados. Utiliza dados categóricos. Não há bons algoritmos para
CLASSIFICADORES ELEMENTARES -II
CLASSIFICADORES ELEMENTARES -II Estimando a densidade 2 A função densidade de probabilidade é um conceito fundamental em estatística Permite associar probabilidades a uma variável aleatória x Especificar
UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
CC-226 Aula 05 - Teoria da Decisão Bayesiana
CC-226 Aula 05 - Teoria da Decisão Bayesiana Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Classificador Bayesiano Considerando M classes C 1... C M. N observações x j. L atributos
INF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Distribuições Amostrais e Estimação Pontual de Parâmetros
Distribuições Amostrais e Estimação Pontual de Parâmetros - parte I 19 de Maio de 2011 Introdução Objetivos Ao final deste capítulo você deve ser capaz de: Entender estimação de parâmetros de uma distribuição
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Inteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões
Aprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que
Árvore de Decisão. Capítulo 18 Russell & Norvig Seções 18.1 a 18.3
Árvore de Decisão Capítulo 18 Russell & Norvig Seções 18.1 a 18.3 Aprendizagem Indutiva Clássica Recebe como entrada o valor correto de uma função desconhecida para entradas específicas e tenta recuperar
Classificadores Lineares
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Classificadores Lineares David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Funções Discriminantes Lineares Perceptron Support
Aprendizagem de Máquina
Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento
Organização. 1. Introdução 2. Medidas de Similaridade. hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters
Organização. Introdução 2. Medidas de Similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de clusters Métodos de Partição Cada exemplo
SUPPORT VECTOR MACHINE - SVM
SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento
Rede RBF (Radial Basis Function)
Rede RBF (Radial Basis Function) André Tavares da Silva [email protected] Roteiro Introdução à rede neural artificial RBF Teorema de Cover da separabilidade de padrões RBF x MLP RBF Função de ativação
Exame de Aprendizagem Automática
Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores
2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.5. Support Vector Machines 2.5. Support Vector Machines (SVM) 2.5.2.
Árvore de Decisão. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE
Árvore de Decisão George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Tópicos Introdução Representando Árvores de Decisão O algoritmo ID3 Definições Entropia Ganho de Informação Overfitting Objetivo
Redes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 13 Support Vector Machines (SVM) Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Redes Neurais. A Rede RBF. Redes RBF: Função de Base Radial. Prof. Paulo Martins Engel. Regressão não paramétrica. Redes RBF: Radial-Basis Functions
Redes RBF: Função de Base Radial Redes Neurais A Rede RBF O LP é baseado em unidades que calculam uma função não-linear do produto escalar do vetor de entrada e um vetor de peso. A rede RBF pertence a
2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.3. Perceptron Multicamadas - MLP 2.3.1. Introdução ao MLP 2.3.2. Treinamento
INF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Aprendizado Bayesiano Anteriormente...
Aprendizado Bayesiano Anteriormente... Conceito de Probabilidade Condicional É a probabilidade de um evento A dada a ocorrência de um evento B Universidade de São Paulo Instituto de Ciências Matemáticas
Distribuições Amostrais e Estimação Pontual de Parâmetros
Distribuições Amostrais e Estimação Pontual de Parâmetros ESQUEMA DO CAPÍTULO 7.1 INTRODUÇÃO 7.2 DISTRIBUIÇÕES AMOSTRAIS E TEOREMA DO LIMITE CENTRAL 7.3 CONCEITOS GERAIS DE ESTIMAÇÃO PONTUAL 7.3.1 Estimadores
Arvores de decisão. O que é uma árvore de decisão? Victor Lobo
Arvores de decisão Victor Lobo O que é uma árvore de decisão? Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença) Nós (testes, ou conceitos)
Aprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar
Arvores de decisão. O que é uma árvore de decisão? Cap.6 Árvores de Decisão V 3.0, V.Lobo, EN/ISEGI, Victor Lobo
V., V.Lobo, EN/ISEGI, 5 Arvores de decisão Victor Lobo O que é uma árvore de decisão? Algorítmo para tomar decisões (ou classificar) Modo de representar conhecimento Tem penas? Arcos (resultados ou pertença)
Árvores de Decisão. Sistemas Inteligentes
Árvores de Decisão Sistemas Inteligentes Exemplos de situações do dia a dia em que a aprendizagem de máquina é importante A partir de informações sobre pacientes relativas a gravidez aprender a prever
