READING DIGITS IN NATURAL IMAGES WITH UNSUPERVISED FEATURE LEARNING

Documentos relacionados
SEMINÁRIO DOS ARTIGOS:

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO

Reconhecimento de Caracteres em Imagens com Ruído

SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro

Inteligência Artificial

Descritores de Imagens

Redes Neurais Feedforward e Backpropagation. André Siqueira Ruela

Face Recognition using RGB-D Images

Reconhecimento de Gestos

Object Tracking. Fernando Medeiros Dufour Ciência da Computação - UFPR Tópicos em Visão Computacional

Brazilian License Plate Character Recognition using Deep Learning

Aprendizado de Máquina

Redes Neurais Convolucionais

Redes Neurais Convolucionais

2. Redes Neurais Artificiais

Descritores de Imagem

SISTEMA DE RECONHECIMENTO BASEADO EM RANDOM FOREST PARA CARACTERES DE CAPTCHAS. Ademir Rafael Marques Guedes, Victor Luiz Guimarães

Neural Networks. Neurônios: Elementos aritméticos simples. Redes Neuronais: conj de neurônios interligados.

GoogLeNet - Going Deeper with Convolutions

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION - VGG

Redes Convolucionais Aplicadas em Visão Computacional

Signature verification

JAI 6 - Deep Learning Teoria e Prática

INF011 - Seminários de Pesquisa II

RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil

Reconhecimento de Sinais de Trânsito Utilizando Deep Learning

Rede RBF (Radial Basis Function)

Redes Neurais Artificiais

Descritores de Imagens

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Roberto Lotufo Big Data Brasil São Paulo, 23 de junho de 2018

Regra de Oja. Para taxa de aprendizagem pequena, Oja aproximou. pesos para criar uma forma útil da aprendizagem

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Localização de placas veiculares por varredura de bordas verticais Amanda Cristine Damian e Giselle Lopes Ferrari

Redes Neurais Pulsadas. João Fausto Lorenzato Robson David Montenegro Tarcísio Lucas

Estudo Comparativo entre Redes Neurais Artificiais Aplicadas a Reconhecimento Facial

Region Based CNNs. Francisco Calaça Xavier. Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado. Instituto de Informática UFG

Kanade-Lucas-Tomasi Tracker

Aprendizagem Profunda (Deep Learning) Marcondes Ricarte Universidade Federal de Pernambuco Centro de Informática

ACCURATE IRIS LOCALIZATION USING CONTOUR SEGMENTS

Resolução da Prova 1 SCC Redes Neurais 2o. Semestre de Prof. João Luís

MouseCam: aplicação de controle do mouse via câmera

Workshop de Inteligência Artificial e Redes Neurais

Métodos de Deep Learning Aplicados a Candlestick como Estratégia de Investimento

Color Eyes Detector. Duarte Petiz. DCC/FCUP

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos

Detecção de Faces Humanas em Imagens Coloridas Utilizando Redes Neurais Artificiais

A evolução natural deu ao cérebro humano muitas características desejáveis que não estão presentes na máquina de von Neumann:

R 1: Se x é A 1 e y é B 1, então f 1 = p 1x + q 1y + r 1 R 2: Se x é A 2 e y é B 2, então f 2 = p 2x + q 2y + r 2

Reconhecimento de palma de mão. Peterson Wagner Kava de Carvalho

Sistema de Reconhecimento de Logotipos

Deep Learning for Chinese Word Segmentation and POS Tagging

Aprendizagem de Máquina

Uma Abordagem Genética Para Redes Neurais Convolucionais

IA - TensorFlow. Paulo Cotta

Aprendizado de Máquina (Machine Learning)

Usando MLP para filtrar imagens

First-person activity recognition. Matheus A. Nerone

Tópicos Especiais: Inteligência Artificial REDES NEURAIS

Redes Neurais Convolucionais Aplicadas à Preensão Robótica

PMR2560 Visão Computacional Conversão e Limiarização. Prof. Eduardo L. L. Cabral

Classificação de Faces de Personagens de Mangá

Projeto Multiresolução de Operadores Morfológicos. Morfológicos a Partir de Exemplos

Extração de Características para o Reconhecimento de Letras Manuscritas

Visão Computacional. Alessandro L. Koerich. Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal do Paraná (UFPR)

Orientação de Bordas em Imagens Digitais: Abordagem por Análise de Vizinhança Local

Classificadores Lineares

JAI 6 - Deep Learning Teoria e Prática

Introdução à Aprendizagem Profunda

Extração de características de imagens. Descritores de cor

TÓPICOS EM INTELIGÊNCIA ARTIFICIAL Redes Neurais Artificiais

Redes neurais artificiais

Aprendizado de Máquinas. Multi-Layer Perceptron (MLP)

Inteligência Artificial

Introdução a Local Binary Patterns (LBP) Prof. Dr. Geraldo Braz Junior

Máquinas de suporte vetorial e sua aplicação na detecção de spam

Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais

C o m p u t a ç ã o M ó v e l. André Siqueira Ruela

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Aprendizado por imitação usando Redes Neurais

Reconhecimento Ótico de Caracteres em Placas Veiculares

detecção de voz cantada em sinais de áudio polifônicos

Processamento de Imagens Termais Aplicado à Navegação Autônoma. Wanessa da Silva

10º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2016 Campinas, São Paulo ISBN

Introdução à Redes Neurais. Prof. Matheus Giovanni Pires EXA 868 Inteligência Artificial Não-Simbólica B Universidade Estadual de Feira de Santana

Primeiras Redes Neurais Artificiais: Perceptron e Adaline

Previsão de consumos a curto prazo

Redes Neurais: MLP. Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação

INF 1771 Inteligência Artificial

Redes Neurais Artificiais. Everton Gago

Redes Neurais Artificiais. Sistemas de Informação/Ciências da Computação UNISUL Aran Bey Tcholakian Morales, Dr. Eng. (Apostila 9)

REDES AUTO-ORGANIZÁVEIS SELF-ORGANIING MAP (SOM)

Um Estudo sobre Diferente Tipos de Funções de Custo Para Redes Neurais Convolucionais

Redes Neurais Artificiais

Reconhecimento de Modelos de Veículos

Redes Neurais. A Rede RBF. Redes RBF: Função de Base Radial. Prof. Paulo Martins Engel. Regressão não paramétrica. Redes RBF: Radial-Basis Functions

Simulação Gráfica. Segmentação de Imagens Digitais. Julio C. S. Jacques Junior

Transcrição:

READING DIGITS IN NATURAL IMAGES WITH UNSUPERVISED FEATURE LEARNING Fernanda Maria Sirlene

READING DIGITS IN NATURAL IMAGES WITH UNSUPERVISED FEATURE LEARNING NIPS Workshop on Deep Learning and Unsupervised Feature Learning Ano de publicação: 2011 Citado por 45 trabalhos. 07/10/2014 2

SUMARIO Introdução SHVN Dataset Modelos Hand Crafted Features Learned Features Resultados Aplicação Mapeamento Segmentação dos Dígitos Conclusão Referências 3 07/10/2014

INTRODUÇÃO Processar Imagens Naturais 07/10/2014 Problema: Identificar números das casas postados nas frentes de edifícios. Aplicações: Mapas mais precisos Serviços de navegação melhorados 4

INTRODUÇÃO Base: Google Street View imagens (SVHN) Mais de 600 mil 07/10/2014 Problema: Dígitos de números de casas nas ruas Método Dois Sistemas de aprendizagem Grande corpus de dados de dígitos. 5

BASE DE DADOS: STREET VIEW HOUSE NUMBERS (SVHN) Mundo real (cenas naturais); Mais de 600.000 imagens de dígitos: Treinamento: 73.257 Teste: 26.032 Extra (ligeiramente mais fáceis): 531.131 Formatos 1: Imagens originais com caixas delimitadoras. Formato 2 (cropped): Dimensão: 32-por-32 Não introduz distorções de aspect ratio Introduz dígitos (ou parte) além do dígito de interesse

FORMATO DOS DADOS Formato 1 Formato 2

MODELO: HAND CRAFTED FEATURES Binarização Sauvola Calcula um limiar local para cada pixel individualmente. Intensidades de imagem na vizinhança local do pixel único. 07/10/2014 8

MODELO: HAND CRAFTED FEATURES HOG Captura borda ou gradientes 07/10/2014 Duas classes de geometrias de blocos: R-HOG Os quadrados ou retangulares Redes densas em uma única escala sem alinhamento C-HOG Circulares Grade de log-polar 9

ALGORITMOS DE APRENDIZADO DE CARACTERÍSTICAS Aprendem características a partir dos próprios dados; Características mais especificas. Envolvem fase não supervisionada. Algoritmos utilizados: Auto-codificadores esparsos empilhados; Rede neural convolucional (com k-means).

AUTO-ENCODERS ESPARSOS EMPILHADOS Rede não supervisionada; Aprende um mapeamento de suas entradas para elas próprias. Exemplo: 8 neurônios de entrada e 3 na camada oculta Auto-encoder aprende a representar 8 exemplos com codificação binária de 3 bits.

DENOISING AUTO-ENCODER

TREINAMENTO DO AUTO-ENCODER Cada auto-encoder é treinado usando o algoritmo de retropropagação: Com o erro calculado, o algoritmo corrige os pesos em todas as camadas, partindo da saída até a entrada. Auto-encoder esparso: um termo para penalizar a ativação de neurônios é incluído. Após essa etapa de treinamento a camada de decodificação é descartada.

EMPILHAMENTO DE AUTO-CODIFICADORES

REDE NEURAL CONVOLUCIONAL (COM K-MEANS) K-means: banco de filtros D. Calcula-se z para cada sub-janela 8x8. z = max {0, D. x - α}, onde α = 0,5. Algoritmo de retropropagação não é utilizado. Classificação: SVM. 07/10/2014 15

RESULTADOS 07/10/2014 Tabela 1: precisões sobre SVHN-de teste. 16

APLICAÇÃO: MAPEAMENTO Imagens Street View 07/10/2014 Números de casas Melhorar a precisão dos mapas. Geocodificação de endereços. 17

SEGMENTAÇÃO DOS DÍGITOS A. Classificador baseado no deslizamento de janelas: intensidades da imagem e gradientes; B. Search Beam: usa uma função de pontuação heurística para limitar o espaço de buscas. C. Seleção manual.

CONCLUSÃO Melhores resultados: métodos que utilizam aprendizado de características não supervisionado. Ainda há espaço para melhorias.

REFERÊNCIAS Netzer, Y., Wang, T., Coates, A., Bissacco, A., Wu, B., & Ng, A. Y. (2011). Reading digits in natural images with unsupervised feature learning. In NIPS workshop on deep learning and unsupervised feature learning (Vol. 2011, p. 4). 07/10/2014 Coates, A., Carpenter, B., Case, C., Satheesh, S., Suresh, B., Wang, T.,... & Ng, A. Y. (2011, September). Text detection and character recognition in scene images with unsupervised feature learning. In Document Analysis and Recognition (ICDAR), 2011 International Conference on (pp. 440-445). IEEE. Wang, T., Wu, D. J., Coates, A., & Ng, A. Y. (2012, November). End-to-end text recognition with convolutional neural networks. In Pattern Recognition (ICPR), 2012 21st International Conference on (pp. 3304-3308). IEEE. 20