HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.
|
|
- Diogo Carmona Domingos
- 5 Há anos
- Visualizações:
Transcrição
1 HP UFCG Analytics Abril-Maio 2012 Um curso sobre Reconhecimento de Padrões e Redes Neurais Por Herman Martins Gomes hmg@dsc.ufcg.edu.br
2 Programa Visão Geral (2H) Reconhecimento Estatístico de Padrões (3H) Redes Neurais (15H) Introdução ao Reconhecimento de Padrões com foco em Redes Neurais
3 Reconhecimento Estatístico de Padrões (3H) Estimação de Densidades Análise Discriminante Avaliação de Performance Extração e Seleção de Características
4 Conceitos Fundamentais Funções Discriminantes Exercício prático Projetar empiricamente funções discriminantes para realizar a separação entre entre 2 raças de insetos a partir do número médio de cerdas primordiais (X 1 ) e do número médio de cerdas distais (X 2 ) conforme tabela ao lado Raça A Raça B X 1 X 2 X 1 X 2 5,92 5,12 4,56 4,04 5,92 5,36 5,04 4,44 6,36 5,24 5,44 4,88 6,40 5,16 5,48 4,20 6,44 5,64 5,60 4,64 6,56 5,56 5,64 4,96 6,64 5,36 5,64 4,96 6,68 4,96 5,72 5,04 6,72 5,48 5,76 4,80 6,72 5,08 5,96 5,08 6,76 5,60 6,00 4,88
5 Conceitos Fundamentais Funções Discriminantes Abordagem Bayesiana Vs. Análise Discriminante: a forma da função discriminante é especificada e não imposta pela distribuição de probabilidade subjacente Escolha por funções discriminantes Pode depender de conhecimento prévio sobre os padrões a serem classificados ou Pode ser uma função particular cujos parâmetros são ajustados via treinamento Muitos tipos diferentes de funções discriminantes estão disponíveis, como Funções lineares (combinação linear das características descrevendo um padrão) Funções não-lineares multiparamétricas, como as redes neurais do tipo Perceptron de Múltiplas Camadas
6 Conceitos Fundamentais Funções Discriminantes Discriminação também pode ser vista como um problema de regressão em que a variável dependente y é um indicador de classe e os regressores são os vetores x de padrões Muitos modelos de função discriminante levam a estimativas E[y x], que é o objetivo central da análise de regressão (apesar de que, em regressão, y não é necessariamente um indicador de classe) Assim, muitas das técnicas empregadas na otimização de funções discriminantes são igualmente aplicáveis a problemas de regressão
7 Conceitos Fundamentais Funções Discriminantes Lineares São combinações lineares dos componentes de x w e w 0 são respectivamente o vetor de pesos e o limiar Geometricamente, é um hiperplano com vetor normal na direção de w e uma distância perpendicular à origem igual a w 0 / w
8 Conceitos Fundamentais Funções Discriminantes Lineares A avaliação da função discriminante sobre um padrão x é uma medida da distância perpendicular desse padrão ao hiperplano origem Hiperplan o
9 Conceitos Fundamentais Funções Discriminantes Lineares Um classificador de padrões que emprega funções discriminantes lineares é chamado de máquina linear ou classificador linear Um caso especial de máquina linear é o classificador de distância mínima Dado um conjunto de pontos protótipos p 1,..., p C (conjunto de treinamento) para cada uma das C classes w 1,... w C O classificador de distância mínima mapeia um padrão x na classe w i associada com o ponto p i mais próximo a x
10 Conceitos Fundamentais Funções Discriminantes Lineares A distância Euclidiana ao quadrado é dada por Uma decisão é obtida pelo classificador de distância mínima comparando-se as expressões abaixo (para diferentes valores de i que indicam os protótipos das classes)
11 Conceitos Fundamentais Funções Discriminantes Lineares A função discriminante linear é expressa por em que: Logo, o classificador de distância mínima é uma máquina linear Se os pontos protótipo são as médias das classes, então tem-se um classificador de classe média
12 Conceitos Fundamentais Funções Discriminantes Lineares Exemplos de regiões de decisão para um classificador de distância mínima
13 Conceitos Fundamentais Funções Discriminantes Lineares por Partes Generalização do classificador de distância mínima para a situação em que há mais de um protótipo por classe Não necessariamente todos os protótipos que formam o conjunto de treinamento precisam ser utilizados (método dos k- vizinhos mais próximos) Supondo que existam n i protótipos na classe w i (i=1,...,c), a função discriminante para a classe w i é dada por Em que g i j é uma função auxiliar para permitir comparações com os diferentes protótipos de cada classe
14 Conceitos Fundamentais Funções Discriminantes Lineares por Partes Regiões de decisão resultantes (mosaico de Dirichlet ou diagrama de Voronoi) Linhas finas: delimitam regiões de vizinhos mais próximos para os conjuntos de protótipos Linhas espessas: delimitam regiões de separação entre as classes
15 Conceitos Fundamentais Função Discriminante Generalizada Também conhecida como máquina phi, é expressa da seguinte forma: φ= (φ 1(x),..., φ D (x)) T é um vetor função de x Se D=p (o número de características em x) e φ i 1(x) = x i então tem-se uma função discriminante linear
16 Conceitos Fundamentais Função Discriminante Generalizada A função discriminante é linear nas funções φ 1 i mas não em x i Uma função discriminante linear nem sempre conseguirá separar as classes (ver figura abaixo), apesar delas serem separáveis, contudo, se fizermos a transformação então as classes serão linearmente separáveis no espaço φ
17 Conceitos Fundamentais Função Discriminante Generalizada Algumas opções disponíveis para as funções φ i 1(x)
18 Estimação de Densidades Paramétrica A regra de discriminação pode ser construída a partir da estimação explícita das funções de densidade de probabilidade condicionadas à classe p(x ω j ) Uma possível abordagem é assumir um modelo paramétrico simples para as funções de densidade e estimar os parâmetros dos modelos a partir de um conjunto de treinamento
19 Estimação de Densidades Paramétrica Assumir uma certa distribuição (normal, exponencial, Weibull, etc.) Estimar os parâmetros da distribuição a partir das observações Utilizar a distribuição com os parâmetros estimados
20 Estimação de Densidades Densidade Normal
21 Estimação de Densidades 30 observações
22 Estimação de Densidades OK Função densidade de probabilidade estimada (assumindo distribuição normal)
23 Estimação de Densidades Uma Densidade Bimodal
24 Estimação de Densidades 30 observações
25 Estimação de Densidades No Good! Função densidade de probabilidade estimada (assumindo distribuição normal)
26 Estimação de Densidades Paramétrica Distribuição normal univariada Distribuição normal multivariada
27 Estimação de Densidades Paramétrica Classificador Gaussiano: o objetivo é associar o padrão x à classe com maior p(x ω j ) Após algumas manipulações da equação para a distribuição normal multivariada chega-se à regra para o classificador Gaussiano: Associar x a ω i se g i > g i para todo j i A fim de se poder utilizar este classificador é necessário estimar dos dados de treinamento
28 Estimação de Densidades Paramétrica Exemplo Prático: prever o grau de recuperação de pacientes com graves lesões na cabeça a partir de dados coletados imediatamente após as lesões idade agrupada em décadas (0-9, 10-19,..., 60-69, 70+) EMV score: respostas oculares, motoras e verbais numa escala de 7 níveis MRP score: sumário das respostas motoras nos 4 membros (numa escala de 1 a 7(normal) mudança na atividade neurológica nas primeiras 24h: de 1 para deteriorando-se, até 3 (boa) Pupilas: a reação das pupilas à luz (1 para não reativa ou 2 para reativa)
29 Estimação de Densidades Paramétrica Exemplo Prático: prever o grau de recuperação de pacientes com graves lesões na cabeça a partir de dados coletados imediatamente após as lesões Dados: 500 pacientes nos conjuntos de treino e teste distribuídos em 3 classes: (1) morto ou vegetativo, (2) severa desabilidade, e (3) moderada desabilidade ou boa recuperação Número de padrões em cada uma das três classes para os conjuntos de treino e de teste Treinamento: 259, 52,189 Teste: 250, 48, 202 Não há um balanceamento entre as classes e muitos padrões estavam ausentes, mas estes foram substituídos pelas médias das classes no treino e médias da população no teste
30 Estimação de Densidades Paramétrica Exemplo Prático: prever o grau de recuperação de pacientes com graves lesões na cabeça a partir de dados coletados imediatamente após as lesões Modelo: funções discriminantes para os dados de cada classe foram definidas conforme a regra do classificador Gaussiano
31 Estimação de Densidades Paramétrica Exemplo Prático: prever o grau de recuperação de pacientes com graves lesões na cabeça a partir de dados coletados imediatamente após as lesões Treinamento: cálculo das quantidades que denotam as estimativas de máxima probabilidade da média e da matriz de covariância para cada uma das classes As probabilidades a priori das classes foram definidas como sendo Um procedimento numérico precisou ser utilizado para calcular a inversa da matriz de covariância e seu determinante para cada classe
32 Estimação de Densidades Paramétrica Exemplo Prático: prever o grau de recuperação de pacientes com graves lesões na cabeça a partir de dados coletados imediatamente após as lesões Resultados: resultados em conjuntos de treinamento e teste para o classificador Gaussiano apresentados como matrizes de confusão (há um problema com a classe 2) Treinamento Classe verdadeira Teste Classe verdadeira Classe predita Classe predita
33 Estimação de Densidades Não-Paramétrica Nem sempre é possível assumir de forma correta a forma da função densidade de probabilidade Nestes casos, não se pode assumir que a densidade é caracterizada por um conjunto de parâmetros Em métodos não paramétricos, não há uma estrutura formal para a função de densidade Há muitos métodos disponíveis, dentro os quais, se destacam Histogramas K- vizinhos mais próximos (visto anteriormente nesta aula como uma função discriminante linear por partes)
34 Estimação de Densidades Não-Paramétrica Histogramas
35 Estimação de Densidades Não-Paramétrica Histogramas 30 observações
36 Estimação de Densidades Não-Paramétrica Histogramas 10 bins
37 Estimação de Densidades Não-Paramétrica Histogramas 10 bins Ajustar Normalizar
38 Estimação de Densidades Não-Paramétrica Histogramas 1920 observações
39 Estimação de Densidades Não-Paramétrica Estimativas por Kernels K(x) = Função kernel de área unitária h = Parâmetro de alargamento (suavização)
40 Estimação de Densidades Não-Paramétrica Estimativas por Kernels h=1 Kernel Retangular, h=1
41 Estimação de Densidades Não-Paramétrica Estimativas por Kernels h=1 Kernel Retangular, h=1
42 Estimação de Densidades Não-Paramétrica Estimativas por Kernels h=1 Kernel Retangular, h=1
43 Estimação de Densidades Não-Paramétrica Estimativas por Kernels Kernel Triangular, h=1
44 Estimação de Densidades Vantagens Métodos paramétricos: Propriedades teóricas bem fundamentadas Métodos não-paramétricos: Dispensam a escolha a priori de um tipo de distribuição Aplicabilidade mais ampla Simplicidade de uso
45 Estimação de Densidades Desvantagens Métodos paramétricos: Podem levar a resultados inadequados se a população não seguir a distribuição assumida Métodos não-paramétricos: Requerem um número maior de amostras para atingir a mesma qualidade de ajuste Maior dificuldade para o estabelecimento de propriedades formais
46 Avaliação de Performance Matriz de Confusão Múltiplas Classes Classe Verdadeira (Ground Truth) Classe 1 Classe2... Classe C Classe Predita Classe 1 Acerto 1 Erro 1,2 Erro 1,C Classe 2 Erro 2,1 Acerto 2... Erro 2,C... Classe C Erro C,1 Erro C,2 Acerto C
47 Avaliação de Performance Matriz de Confusão Duas classes Classe Verdadeira Positiva Negativa Classe Predita Positiva Verdadeiros Positivos (TP) Falsos Positivos (FP) Negativa Falso Negativos (FN) Verdadeiros Negativos (TN)
48 Avaliação de Performance Tipos de Erro e Relação com Testes Estatísticos A noção de erro estatístico envolve o estabelecimento de uma hipótese nula H 0 que usualmente corresponde a uma condição default da natureza do problema e.g. a assinatura é verdadeira, a região contém uma face, a pessoa é saudável etc. A hipótese alternativa tipicamente é a negação da hipótese nula
49 Avaliação de Performance Tipos de Erro e Relação com Testes Estatísticos Rejeitar a hipótese nula Falha em aceitar a hipótese nula Hipótese nula (H 0 ) é verdadeira Erro tipo I (Falsos Positivos FP) Saída correta (Verdadeiros Negativos TN) Hipótese nula (H 0 ) é falsa Saída correta (Verdadeiros Positivos - TP) Erro tipo II (Falsos Negativos FN)
50 Avaliação de Performance Tipos de Erro e Relação com Testes Estatísticos Taxa de erro tipo I (taxa de falsa aceitação) Também conhecida como tamanho (size) do teste, sendo denotado em Estatística por α (alpha) Usualmente equivale ao nível de significância do teste No caso de uma hipótese nula simples, α é a probabilidade de erro tipo I No caso de uma hipótese composta, α é o máximo de todas as possíveis probabilidades de erro tipo I Taxa de erro tipo II (taxa de falsa rejeição) Denotado em Estatística por β (beta) está relacionada à potência (power) de um teste de hipóteses
51 Avaliação de Performance Regiões de Acerto e Erro
52 Avaliação de Performance Medidas de Performance
53 Avaliação de Performance Curvas ROC Gráfico que relaciona as taxas de verdadeiro positivo e falso positivos à medida que um limiar de classificação é variado Objetivam avaliar o desempenho de classificadores sob diferentes condições operacionais
54 Avaliação de Performance Curvas ROC Exemplo
55 Avaliação de Performance Curvas ROC Exemplo
56 Avaliação de Performance Curvas ROC Outro Exemplo: Detecção de Faces
57 Avaliação de Performance Particionamento dos Dados Dados de treinamento para ajuste dos parâmetros livres dos classificadores Dados de validação para decidir quando parar o treinamento e evitar o overfitting Dados de teste para estimar como será a performance (taxas de acerto e de erro) do sistema num ambiente real Treinamento Validação Teste seleção aleatória 50% 25% 25%
58 Avaliação de Performance Particionamento dos Dados Problema em usar apenas um conjunto de teste Apenas um experimento de avaliação de performance será realizado Mesmo usando seleção aleatória dos padrões que irão compor os conjuntos, há o risco do conjunto de teste ser uma amostra muito fácil ou muito difícil de classificar
59 Avaliação de Performance Particionamento dos Dados Algumas soluções Leave-one-out Cross Validation Reservar um padrão k para teste, treinar com os N-1 restantes, avaliar a performance no padrão k, repetir o experimento para k=1,,n e reportar o erro/acerto médio K-fold Cross Validation Dividir o conjunto de dados em k partições (subconjuntos disjuntos) de mesma dimensão Reservar uma partição i para teste, treinar com as k-1 partições restantes, testar com a partição i, repetir o experimento para i = 1,...,k, e reportar o erro/acerto médio
60 Avaliação de Performance Leave-one-out Cross Validation teste padrão k treinamento Treinar em (N - 1) padrões N padrões
61 Avaliação de Performance K-fold Cross Validation teste Teste treinamento Treinar em (k - 1) partições k-partições
62 Avaliação de Performance O Problema do Overfitting (Super-especialização) Fatores como poucos dados de treinamento, modelo de classificação muito complexo (muitos parâmetros livres) treinado exaustivamente podem levar a erros de treinamento muito pequenos e a erros de teste elevados Emprego de um conjunto de validação pode ajudar quando o treinamento deve ser encerrado
63 Avaliação de Performance O Problema do Overfitting (Super-especialização) parar o treinamento Pontos de treinamento Erro de teste/validação Pontos de teste/validação Erro de treinamento complexidade
64 ? Dúvidas
65 Próximos Passos Reconhecimento Estatístico de Padrões (3H) Extração e Seleção de Características
66 Próximos Passos Redes Neurais (15H) Processo de Aprendizagem Análise de Componentes Principais Perceptrons de Simples e Múltiplas Camadas Mapas Auto Organizáveis Redes Neurais Recorrentes Previsão e Análise de Séries Temporais
HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.
HP UFCG Analytics Abril-Maio 2012 Um curso sobre Reconhecimento de Padrões e Redes Neurais Por Herman Martins Gomes hmg@dsc.ufcg.edu.br Programa Visão Geral (2H) Reconhecimento Estatístico de Padrões (3H)
Leia maisAvaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE
Avaliando Hipóteses George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Pontos importantes Erro da Amostra e Erro Real Como Calcular Intervalo de Confiança Erros de hipóteses Estimadores Comparando
Leia mais2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.4. Outras Redes Neurais Artificiais 2.4.1. Redes RBF 2.4.2. Mapas
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem
Leia maisDCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...
DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar
Leia maisRedes Neurais Artificial. Prática. Inteligência Artificial
Redes Neurais Artificial Prática Inteligência Artificial Professor: Rosalvo Ferreira de Oliveira Neto Estrutura 1. Introdução a MLP 2. Base de dados e Pré-Processamento 3. Prática MLP - Introdução Redes
Leia maisBoas Maneiras em Aprendizado de Máquinas
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas
Leia maisRedes Neurais. A Rede RBF. Redes RBF: Função de Base Radial. Prof. Paulo Martins Engel. Regressão não paramétrica. Redes RBF: Radial-Basis Functions
Redes RBF: Função de Base Radial Redes Neurais A Rede RBF O LP é baseado em unidades que calculam uma função não-linear do produto escalar do vetor de entrada e um vetor de peso. A rede RBF pertence a
Leia maisConceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional
Conceitos de Aprendizagem de Máquina e Experimentos Visão Computacional O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos
Leia maisà Análise de Padrões
CC-226 Introdução à Análise de Padrões Prof. Carlos Henrique Q. Forster Visão Geral do Curso e Introdução a Classificadores Padrões São apresentados como tuplas de variáveis aleatórias O conjunto amostra
Leia maisAprendizado por Instâncias Janelas de Parzen & Knn
Universidade Federal do Paraná (UFPR) Especialização em Engenharia Industrial 4.0 Aprendizado por Instâncias Janelas de Parzen & Knn David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Aprendizado por
Leia maisSUPPORT VECTOR MACHINE - SVM
SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento
Leia maisMétodos Não Paramétricos
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Métodos não Paramétricos Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Métodos Não Paramétricos Introduzir
Leia maisModelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:
Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um
Leia maisRegressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC
Regressão Linear Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Overfitting 2. Treino e Validação 3. Baseline dos modelos 1 Overfitting Overfit Em muitos casos, a amostra de dados coletada
Leia maisCréditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores
SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..
Leia maisCC-226 Aula 05 - Teoria da Decisão Bayesiana
CC-226 Aula 05 - Teoria da Decisão Bayesiana Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Classificador Bayesiano Considerando M classes C 1... C M. N observações x j. L atributos
Leia maisUNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES DE FUNÇÃO DE BASE RADIAL - RBF Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Funções de Base Global Funções de Base Global são usadas pelas redes BP. Estas funções são definidas como funções
Leia maisCC-226 Introdução à Análise de Padrões
CC-226 Introdução à Análise de Padrões Estimação Não-Paramétrica e Aprendizado por Instâncias Carlos Henrique Q. Forster 1 1 Divisão de Ciência da Computação Instituto Tecnológico de Aeronáutica 16 de
Leia maisRafael Izbicki 1 / 38
Mineração de Dados Aula 7: Classificação Rafael Izbicki 1 / 38 Revisão Um problema de classificação é um problema de predição em que Y é qualitativo. Em um problema de classificação, é comum se usar R(g)
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem
Leia maisAula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Leia maisUNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica
REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem
Leia maisReconhecimento de Padrões
Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Kuncheva pg. 8 a 25 (seções 1.3 e 1.4) Roteiro da aula Cálculo do erro de um classificador Técnicas de treinamento, avaliação e teste
Leia maisMestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015
Mestrado Profissional em Administração Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015 Análise Discriminante MANLY, Cap. 8 HAIR et al., Cap. 5 2 Objetivos o Construir
Leia maisClassificação Linear. André Tavares da Silva.
Classificação Linear André Tavares da Silva andre.silva@udesc.br Roteiro Introduzir os o conceito de classificação linear. LDA (Linear Discriminant Analysis) Funções Discriminantes Lineares Perceptron
Leia maisSCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos
Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências
Leia maisSCC Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos
Métodos de Amostragem e Avaliação de Algoritmos SCC-630 - Capítulo 10 Métodos de Amostragem e Avaliação de Algoritmos João Luís Garcia Rosa 1 1 Departamento de Ciências de Computação Instituto de Ciências
Leia maisEstatística e Modelos Probabilísticos - COE241
Estatística e Modelos Probabilísticos - COE241 Aula passada Variância amostral Método de Replicações Independentes Aula de hoje Para que serve a inferência estatística? Método dos Momentos Maximum Likehood
Leia maisRede RBF (Radial Basis Function)
Rede RBF (Radial Basis Function) André Tavares da Silva andre.silva@udesc.br Roteiro Introdução à rede neural artificial RBF Teorema de Cover da separabilidade de padrões RBF x MLP RBF Função de ativação
Leia maisMétodos de Amostragem. Métodos de Amostragem e Avaliação de Algoritmos. Métodos de Amostragem. Métodos de Amostragem. Métodos de Amostragem
e Avaliação de s José Augusto Baranauskas Departamento de Física e Matemática FFCLRP-USP AM é uma ferramenta poderosa, mas não existe um único algoritmo que apresente o melhor desempenho para todos os
Leia maisInteligência Artificial
Inteligência Artificial Aula 14 Aprendizado de Máquina Avaliação de s Preditivos (Classificação) Hold-out K-fold Leave-one-out Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br Curso: Sistemas de Informação
Leia maisAULA 1 - Modelos determinísticos vs Probabiĺısticos
AULA 1 - Modelos determinísticos vs Probabiĺısticos Susan Schommer Econometria I - IE/UFRJ O que é Econometria? Aplicação de métodos estatísticos e matemáticos para analisar os dados econômicos, com o
Leia maisDisciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais
Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais Prof. Eduardo Simas (eduardo.simas@ufba.br) Programa de Pós-Graduação em Engenharia Elétrica/PPGEE Universidade Federal
Leia maisWorkshop LVC-UFCG 5-Maio Palestra: Reconhecimento de Padrões. Por Herman Martins Gomes.
Workshop LVC-UFCG 5-Maio 2014 Palestra: Reconhecimento de Padrões Por Herman Martins Gomes hmg@dsc.ufcg.edu.br Padrões e suas Representações Pattern recognition is formally defined as the process whereby
Leia maisConsiderações de Desempenho
Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 1 Dicas para o BP Os pesos devem
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia
Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br
Leia maisDescoberta de Conhecimento em Bancos de Dados - KDD
Descoberta de Conhecimento em Bancos de Dados - KDD Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Fases do processo 3. Exemplo do DMC 4. Avaliação
Leia maisAula 9. Prof. Adilson Gonzaga
Aula 9 Prof. Adilson Gonzaga Mapeamento Atribuir uma Instância a uma classe. Cada Instância é mapeada para um elemento do conjunto de Rótulos de Classe {p,n} p positivo n negativo Atribui uma Instância
Leia maisBack Propagation. Dicas para o BP
Back Propagation Considerações de Desempenho Dicas para o BP O uso da função de ativação simétrica geralmente acelera o treinamento TANH +1 logistic linear 0 tanh -1-4 +4 11 Dicas para o BP Os pesos devem
Leia maisReconhecimento de Padrões. Reconhecimento de Padrões
Reconhecimento de Padrões 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Escola Superior de Tecnologia Engenharia Informática Reconhecimento de Padrões Prof. João Ascenso e Prof.
Leia maisCLASSIFICADORES ELEMENTARES
CLASSIFICADORES ELEMENTARES Classificação 2 Consiste em tentar discriminar em diferentes classes um conjunto de objetos com características mensuráveis Exemplo: classificação de frutas Forma, cor, sabor,
Leia maisHP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.
HP UFCG Analytics Abril-Maio 2012 Um curso sobre Reconhecimento de Padrões e Redes Neurais Por Herman Martins Gomes hmg@dsc.ufcg.edu.br Programa Visão Geral (2H) Reconhecimento Estatístico de Padrões (3H)
Leia mais2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.3. Perceptron Multicamadas - MLP 2.3.1. Introdução ao MLP 2.3.2. Treinamento
Leia maisAdriana da Costa F. Chaves. Máquina de Vetor Suporte (SVM) para Classificação Binária 2
Máquina de Vetor Suporte (SVM) para Classificação Binária Adriana da Costa F. Chaves Conteúdo da Apresentação Introdução Máquinas de Vetor Suporte para Classificação binária Exemplos Conclusão Máquina
Leia maisProjeto da Disciplina
Projeto da Disciplina Germano C. Vasconcelos Centro de Informática - UFPE Germano C.Vasconcelos 1 Objetivo Realizar um estudo experimental sobre a aplicação de modelos de redes neurais em um problema do
Leia maisA Metodologia de Box & Jenkins
A Metodologia de Box & Jenins Aula 03 Bueno, 0, Capítulo 3 Enders, 009, Capítulo Morettin e Toloi, 006, Capítulos 6 a 8 A Metodologia Box & Jenins Uma abordagem bastante utilizada para a construção de
Leia maisAULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1
AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 Susan Schommer Econometria I - IE/UFRJ Distribuições amostrais dos estimadores MQO Nas aulas passadas derivamos o valor esperado e variância
Leia maisCombinação de Classificadores (fusão)
Combinação de Classificadores (fusão) André Tavares da Silva andre.silva@udesc.br Livro da Kuncheva Roteiro Sistemas com múltiplos classificadores Fusão por voto majoritário voto majoritário ponderado
Leia maisInteligência nos Negócios (Business Inteligente)
Inteligência nos Negócios (Business Inteligente) Sistemas de Informação Sistemas de Apoio a Decisão Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 6) Fundamentação da disciplina Analise de dados Decisões
Leia maisEstatística Inferencial
statística Inferencial A ou inferencial compreende a stimação e o Teste de hipótese. Na verdade, a estatística inferencial forma a base das atividades de controle da qualidade e também pode auxiliar na
Leia mais( ) Aula de Hoje. Introdução a Sistemas Inteligentes. Modelo RBF (revisão) Modelo RBF (revisão)
Introdução a Sistemas Inteligentes ópicos em Redes Neurais III: Redes Neurais RBF ª Parte Prof. Ricardo J. G. B. Campello ICMC / USP Aula de Hoje Revisão de Modelos RBF reinamento de Modelos RBF Estimação
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Modelos preditivos A tarefa de classificação Modelos Preditivos A tarefa de geração de um modelo preditivo consiste em aprender um mapeamento de entrada para a saída. Neste caso,
Leia maisRedes Neurais: RBF. Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação
Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais: RBF DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos Redes de Funções de
Leia maisClassificadores. André Tavares da Silva.
Classificadores André Tavares da Silva andre.silva@udesc.br Reconhecimento de padrões (etapas) Obtenção dos dados (imagens, vídeos, sinais) Pré-processamento Segmentação Extração de características Obs.:
Leia maisTeoria do aprendizado
Teoria do aprendizado Marcelo K. Albertini 7 de Agosto de 2014 2/37 Teoria do aprendizado Teoremas não existe almoço grátis Viés e variância Aprendizado PAC Dimensão VC Máquinas de vetores suporte 3/37
Leia maisReconhecimento de Padrões/Objetos
Reconhecimento de Padrões/Objetos André Tavares da Silva andre.silva@udesc.br Capítulo 12 de Gonzales Reconhecimento de Padrões (imagem) Objetivo: Interpretar o conteúdo da imagem através de um mapeamento
Leia maisAula 7 RNA Redes Auto-Organizáveis de Kohonen
2COP229 Aula 7 RNA Redes Auto-Organizáveis de Kohonen 2COP229 Sumário 1- Introdução 2- Processo de Aprendizado Competitivo 3- Mapas auto-organizáveis de Kohonen (SOM) 4- Projeto Prático 1-Introdução 2COP229
Leia mais2. Redes Neurais Artificiais
Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.5. Support Vector Machines 2.5. Support Vector Machines (SVM) 2.5.2.
Leia mais3 Redes Neurais Artificiais
3 Redes Neurais Artificiais 3.1. Introdução A capacidade de implementar computacionalmente versões simplificadas de neurônios biológicos deu origem a uma subespecialidade da inteligência artificial, conhecida
Leia maisUniversidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Regressão David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Regressão Linear ( e Múltipla ) Não-Linear ( Exponencial / Logística
Leia maisAprendizagem de Máquina
Plano de Aula Aprendizagem de Máquina Bagging,, Support Vector Machines e Combinação de Classificadores Alessandro L. Koerich Uma visão geral de diversos tópicos relacionados à Aprendizagem de Máquina:
Leia maisTeste de Hipóteses. Enrico A. Colosimo/UFMG enricoc/ Depto. Estatística - ICEx - UFMG 1/24
1/24 Introdução à Bioestatística Teste de Hipóteses Enrico A. Colosimo/UFMG http://www.est.ufmg.br/ enricoc/ Depto. Estatística - ICEx - UFMG 2/24 Exemplo A concentração de certa substância no sangue entre
Leia maisCurso de Data Mining
Curso de Data Mining Sandra de Amo Curvas Roc Uma curva ROC (Receiver Operating Characteristic) é um enfoque gráfico que permite visualizar os trade-offs entre as taxas de positivos verdadeiros e positivos
Leia maisAPRENDIZAGEM DE MÁQUINA
APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.
Leia maisReconhecimento de Padrões/Objetos
Reconhecimento de Padrões/Objetos André Tavares da Silva andre.silva@udesc.br Capítulo 2 de Gonzales Classificação Linear Introdução Para utilizar uma função discriminante linear (Linear Discriminant Function)
Leia maisvariável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência
REGRESSÃO LOGÍSTICA É uma técnica recomendada para situações em que a variável dependente é de natureza dicotômica ou binária. Quanto às independentes, tanto podem ser categóricas ou não. A regressão logística
Leia maisExame de Aprendizagem Automática
Exame de Aprendizagem Automática 2 páginas com 12 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 12 de Janeiro de 2017 Nota: O exame está cotado para 40 valores. Os 20 valores
Leia maisAnálise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Leia maisEstatística e Modelos Probabilísticos - COE241
Estatística e Modelos Probabilísticos - COE241 Aula passada Para que serve a inferência estatística? Método dos Momentos Maximum Likehood Estimator (MLE) Teste de hipótese: definições Aula de hoje Teste
Leia maisProjeto AM Francisco de A. T. de Carvalho 1
Projeto AM 2018-1 Francisco de A. T. de Carvalho 1 1 Centro de Informatica-CIn/UFPE Av. Prof. Luiz Freire, s/n -Cidade Universitaria, CEP 50740-540, Recife-PE, Brasil, fatc@cin.ufpe.br 1) No conjunto de
Leia maisJAI 6 - Deep Learning Teoria e Prática
JAI 6 - Deep Learning Teoria e Prática Esteban Clua e Cristina Nader Vasconcelos Universidade Federal Fluminense Fundamentos Computação baseada em modelos crisnv@ic.uff.br 2 Computação baseada em aprendizado
Leia mais3 Modelos e metodologias comparadas
3 Modelos e metodologias comparadas Este capítulo tem o propósito de listar algumas das alternativas existentes na literatura que envolve classificação, e serão utilizadas neste trabalho sendo comparadas
Leia maisTestes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo
Testes de Hipóteses Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais
Leia maisRESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO
RESUMO DO CAPÍTULO 3 DO LIVRO DE WOOLDRIDGE ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO Regressão simples: desvantagem de apenas uma variável independente explicando y mantendo ceteris paribus as demais (ou
Leia maisInteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Leia maisDisciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 05 / Detecção Binária Baseada em
Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 05 / Detecção Binária Baseada em Múltiplas Observações e Detecção com Múltiplas Hipóteses Prof. Eduardo Simas (eduardo.simas@ufba.br) Programa
Leia maisModelos de Regressão Linear Simples - Análise de Resíduos
1 Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 27 de Setembro de 2016 2 3 O modelo de regressão linear é dado por 3 O modelo de regressão linear é dado por Y i = β
Leia maisClassificação: 1R e Naïve Bayes. Eduardo Raul Hruschka
Classificação: 1R e Naïve Bayes Eduardo Raul Hruschka Agenda: Conceitos de Classificação Técnicas de Classificação One Rule (1R) Naive Bayes (com seleção de atributos) Super-ajuste e validação cruzada
Leia maisBoas Maneiras Aprendizado Não Supervisionado Regressão
Universidade Federal do Paraná (UFPR) Especialização em Engenharia Industrial 4.0 Boas Maneiras Aprendizado Não Supervisionado Regressão David Menotti www.inf.ufpr.br/menotti/am-18b Hoje Boas Maneiras
Leia maisO uso de Máquina de Suporte Vetorial para Regressão (SVR) na Estimação da Estrutura a Termo da Taxa de Juros do Brasil 12
1 Introdução No Brasil, o grande aumento na adesão a planos de previdência privada nos últimos tempos implicou em maiores preocupações de bancos e seguradoras em fazer investimentos visando garantir o
Leia maisRedes Neurais Artificial. Inteligência Artificial. Professor: Rosalvo Ferreira de Oliveira Neto
Redes Neurais Artificial Inteligência Artificial Professor: Rosalvo Ferreira de Oliveira Neto Estrutura 1. Definições 2. Histórico 3. Conceitos Básicos 4. Aprendizado em RNA 5. Exemplo de Aprendizado com
Leia maisTestes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo
Testes de Hipóteses Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Introdução e notação Em geral, intervalos de confiança são a forma mais
Leia maisClassificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências
Leia maisUniversidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Introdução
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Introdução Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir os conceito básicos de reconhecimento
Leia maisModelos de Regressão Linear Simples - Análise de Resíduos
Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro
Leia maisCONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS As variáveis aleatórias X e Y seguem uma distribuição de Bernoulli com probabilidade de sucesso igual a 0,4. Considerando S = X + Y e que os eventos aleatórios A = [X = 1] e B
Leia maisMinicurso: Inteligência Artificial Aplicada a Sistemas Elétricos
Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos Introdução a Machine Learning: Teoria, Aplicações e IA na Arquitetura Intel Vitor Hugo Ferreira, DSc - UFF Flávio Mello, DSc UFRJ e Ai2Biz
Leia maisMAE Modelos Lineares Generalizados 2 o semestre 2017
MAE5763 - Modelos Lineares Generalizados 2 o semestre 2017 Prof. Gilberto A. Paula 3 a Lista de Exercícios 1. Supor y i ind FE(µ, φ i ) com φ i = α + γz i, para i = 1,..., n. Como ca a matriz modelo Z?
Leia maisECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.
ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc. Cap. 10 Multicolinearidade: o que acontece se os regressores são correlacionados? Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. Rio de Janeiro.
Leia maisIdentificação da Distribuição Teórica de Probabilidades
Identificação da Distribuição Teórica de Probabilidades A utilização de gráficos, tais como um histograma, são muito úteis para a identificação ou delineamento da distribuição teórica de probabilidades.
Leia maisAula 8: Árvores. Rafael Izbicki 1 / 33
Mineração de Dados Aula 8: Árvores Rafael Izbicki 1 / 33 Revisão Vimos que a função de risco é dada por R(g) := E[I(Y g(x))] = P (Y g(x)), Nem sempre tal função nos traz toda informação sobre g. É comum
Leia maisPROCEDIMENTO PARA A ESCOLHA DE UMA DISTRIBUIÇÃO
PROCEDIMENTO PARA A ESCOLHA DE UMA DISTRIBUIÇÃO O método de máxima verossimilhança somente deve ser aplicado após ter sido definido um modelo probabilístico adequado para os dados. Se um modelo for usado
Leia maisEsse material foi extraído de Barbetta (2007 cap 13)
Esse material foi extraído de Barbetta (2007 cap 13) - Predizer valores de uma variável dependente (Y) em função de uma variável independente (X). - Conhecer o quanto variações de X podem afetar Y. Exemplos
Leia maisFunções Discriminantes Lineares
Funções Discriminantes Lineares Revisão Cap. 2 Classificação Bayesiana: Fdp s conhecidas, w ) P e x w ) ( i p. ( i Cap. 3 Formas das fdp s conhecidas, idem No. de parâmetros. a) Máxima verossimilhança:
Leia mais1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.
1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3
Leia maisDelineamento e Análise Experimental Aula 4
Aula 4 Castro Soares de Oliveira ANOVA Significativa Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos evidência de que existem diferenças entre as médias populacionais.
Leia mais