Recognition of Pantanal Animal Species using Convolutional Neural Networks

Tamanho: px
Começar a partir da página:

Download "Recognition of Pantanal Animal Species using Convolutional Neural Networks"

Transcrição

1 Recognition of Pantanal Animal Species using Convolutional Neural Networks Diogo Nunes Gonçalves, Mauro dos Santos de Arruda, Lucas Abreu da Silva, Reinaldo Felipe Soares Araujo, Bruno Brandoli Machado, Wesley Nunes Gonçalves Universidade Federal de Mato Grosso do Sul - CPPP Ponta Porã, MS, {dnunesgoncalves,maurosantosarruda}@gmail.com, {lucas10df, felipeiex}@hotmail.com, {bruno.brandoli, wesley.goncalves}@ufms.br Resumo Pantanal is one of the most important biomes of the world, with a large number of animal species. To reconcile the demand of development and biodiversity conservation, it is important to catalog the species in the region and the impact of development on the population of animals. However, the task of identifying the species of animals is time-consuming and depends on manual inspection of the images. To overcome this issue, this paper proposes a methodology for animal specie recognition using convolutional neural networks. Experimental results were performed using a database with images divided into 13 animals species showing a regognition rate larger than 92% when combining Resnet-152 and SVM classifier. I. INTRODUÇÃO O Pantanal é uma região natural localizada principalmente dentro dos estados brasileiros de Mato Grosso e Mato Grosso do Sul, mas se estende até a Bolívia e Paraguai. Esta região é a maior área úmida tropical do mundo, com área de aproximadamente km 2. O nome Pantanal vem da palavra Pântano, que significa zonas úmidas, porque 80% das planícies do Pantanal estão submersas durante as estações chuvosas. Pantanal é um dos ecossistemas mais ricos do mundo, que abriga um grande número de animais que vivem em equilíbrio ecológico. Junk et al. [1] lista 263 espécies de peixes, 96 espécies de répteis, 40 espécies de anfíbios, 390 espécies de aves e 130 espécies de mamíferos. O número de espécies diverge em vários trabalhos, por exemplo, o número de espécies de aves geralmente é dado como algo entre 600 e 700 espécies [2], embora apenas 390 foram confirmados [1]. Devido à sua importância e diversidade ecológica, o Pantanal é considerado pela UNESCO como Patrimônio Mundial e Reservas da Biosfera. Como resultado do uso insustentável da terra, o Pantanal sofre muita perda de biodiversidade e dos seus habitats naturais associados. Nessa região existem muitas espécies raras e ameaçadas de extinção, como o tatu-canastra (Priodontes maximus), cervo-pantanal (Blastocerus dichotomus), tamanduá-bandeira (Myrmecophaga tridactyla), cachorro-domato (Speothos venaticus), entre outras. O grande desafio para o Pantanal é conciliar a crescente demanda para o desenvolvimento social e econômico (por exemplo a pecuária, gado, agricultura, turismo), com a conservação da biodiversidade [3]. Desta forma, conhecer a biodiversidade é essencial para os esforços dos investigadores que trabalham para proteger o Pantanal e as espécies ameaçadas de extinção. A identificação de espécies de animais no Pantanal leva tempo devido ao ambiente de zonas úmidas e aos hábitos alimentares dos animais, o que torna difícil estimar de forma eficaz as espécies e suas densidades por km 2. Para acompanhar e monitorar a população, os pesquisadores passam dias no Pantanal observando as espécies com a ajuda de tecnologias, como a armadilha com câmera, as imagens aéreas, etc. O processo de identificação atual é extremamente demorado, requer treinamento especial e depende de uma inspeção manual das imagens. Este artigo propõe uma metodologia para o reconhecimento de espécies do pantanal usando redes neurais convolucionais (convolutional neural network - CNN). Para isso, a imagem é pré-processada e passa como entrada de uma CNN. A saída da penúltima camada da CNN é utilizada como vetor de características. Os vetores de características alimentam o treinamento de classificadores supervisionados, como as máquinas de vetores de suporte. Experimentos foram realizados em uma base com imagens divididas em 13 espécies importantes. Quatro arquiteturas de CNN e dois classificadores foram avaliados obtendo porcentagem de classificação correta de 97.24%. Este artigo está descrito em 6 seções. A Seção II apresenta uma revisão de literatura sobre reconhecimento de espécies de animais em visão computacional e redes neurais convolucionais. A metodologia proposta é descrita em detalhes na Seção III. A Seção IV apresentas os experimentos e resultados enquanto que a Seção V apresenta as conclusões e os trabalhos futuros. II. REVISÃO DA LITERATURA A. Reconhecimento de Espécies de Animas em Visão Computacional O reconhecimento de espécies animais é um grande desafio na área de visão computacional, principalmente pela característica do ambiente em que o animal se encontra e pela sua movimentação constante. Algumas abordagens têm sido propostas para superar esses desafios. Um método de captura muito usado é a armadilha fotográfica que basicamente é um sensor especialmente visual que grava as imagens dos animais que se movem através de seu campo de visão [4], [5], [6], elas são usadas em conjunto com métodos de visão computacional para a identificação das espécies animais.

2 Mauro et al. [7] usou um método de segmentação usando superpixels e componentes conexos em imagens térmicas para obter regiões da imagem contendo animais silvestres. Aguzzi et al. [4] usou as armadilhas fotográficas na captura das imagens, e aplicou o descritor de Fourier juntamente com o método de k vizinhos mais próximos para a identificação das espécies através de contornos dos animais na imagem. Yu et al [5] propôs uma identificação automatizada de espécies para as imagens capturadas por armadilhas fotográficas usando SIFT (transformada de características invariante a escala) e pirâmide espacial. Eles testaram o método em um banco de imagens com 18 espécies, obtendo uma precisão média de 82%. Algumas aplicações mais relacionadas a este trabalho foram de Chen et al. [8] e Gómez et al. [9], que propuseram métodos de identificação de espécies de animais usando redes neurais convolucionais. Chen et al. [8] usou um banco de imagens com 20 espécies comuns na América do Norte, chegando a 38% de precisão com um CNN de apenas 6 camadas. Por outro lado, Gómez et al. [9] alcançou 98% de precisão em um banco de imagens com 26 espécies da Tanzânia. Eles testaram seis arquiteturas CNNs, dentre elas a AlexNet [10], VGGNet [11] e GoogLeNet [12]. B. Redes Neurais Convolucionais (Convolutional Neural Networks - CNN) As redes neurais convolucionais consistem em camadas convolucionais, na qual é incorporado o algoritmo de backpropagation que aprende os parâmetros de cada camada. Desde a sua criação, a CNN tem sido caracterizada por três propriedades básicas, as conexões locais, o compartilhamento de peso e o pooling local. As duas primeiras propriedades permitem que o modelo aprenda os padrões visuais locais importantes com menos parâmetros ajustáveis que o modelo totalmente conectado, e a terceira propriedade prepara a rede para possuir invariância à translação. Uma das primeiras aplicações de redes neurais convolucionais é a rede LeNet-5 descrita por LeCun et al. [13] para o reconhecimento óptico de caracteres. Comparado às redes convolucionais profundas atuais, a rede foi relativamente modesta devido aos recursos computacionais limitados da época e aos desafios do treinamento de algoritmos para redes maiores. Embora houvesse muito potencial em redes convolucionais mais profundas, só recentemente elas se tornaram predominantes, seguindo o aumento do poder computacional atual, da quantidade de dados para treinamento disponíveis na Internet e da necessidade de desenvolvimento de métodos mais eficazes para a formação de tais modelos. Um exemplo recente e notável do uso de redes convolucionais profundas para classificação de imagens é o desafio Imagenet [10] em que uma CNN obteve um erro consideravelmente menor comparado com o erro das abordagens tradicionais de visão computacional (usando SIFT e Máquinas de Vetores de Suporte). Redes neurais convolucionais também obtiveram recentemente sucesso para diferentes aplicações, incluindo estimação de pose humana [14], análise de faces [15], detecção de pontos-chave facial [16], reconhecimento de voz [17] e classificação de ação [18]. III. METODOLOGIA PROPOSTA A metodologia proposta para reconhecimento de espécies de animais pode ser descrita em três etapas principais: i) préprocessamento da imagem de entrada; ii) extração de características com redes neurais convolucionais; e iii) treinamento supervisionado. As três etapas são descritas em detalhes nas subseções abaixo. A. Pré-processamento da Imagem de Entrada A primeira etapa consiste em pré-processar as imagens de entrada. Como as imagens estão em diferentes tamanhos e resoluções, uma imagem I é redimensionada para um tamanho fixo (W H 3). O tamanho fixo deve corresponder aos requerimentos de entrada de cada arquitetura das redes neurais convolucionais (e.g., para AlexNet e para Resnet). O segundo pré-processamento consiste em subtrair uma cor média µ de todos os pixels da imagem I: I(x, y, R) = I(x, y, R) µ R (1) I(x, y, G) = I(x, y, G) µ G (2) I(x, y, B) = I(x, y, B) µ B (3) onde µ é a cor média de todas as imagens usadas para treinar a rede neural convolucional. B. Extração de Características A arquitetura das CNNs contém milhões de parâmetros (e.g., 60 milhões para AlexNet), tornando inviável e problemático o treinamento em uma base com poucas imagens. Para contornar esse problema, Oquab et al. [19] propuseram o uso das camadas internas de CNN treinadas em grandes bases de imagens como extrator de características. Para usar uma CNN pré-treinada, a última camada que consiste em um classificador softmax foi desconsiderada e as camadas restantes foram utilizadas como um extrator de características. Nos experimentos foram utilizadas quatro arquiteturas de CNNs treinadas na ImageNet ILSVRC com 1.28 milhões de imagens. Para ilustrar a extração de características, considere a CNN conhecida como AlexNet proposta por Krizhevsky et al. [10]. A AlexNet é composta por cinco camadas convolucionais C1... C5 seguida por três camadas totalmente conectadas F C6... F C8. A entrada da rede consiste em uma imagem Y 0 = I R Em cada camada convolucional, a entrada da camada Y k 1 é convoluída com um conjunto de filtros treinados. Em seguida, aplica-se a unidade ReLU (Rectified Linear Unit) que consiste em pegar o máximo entre a convolução e 0, conforme: Y k = σ(conv(y k 1, W k, B k )) (4) onde (W k, B k ) é o conjunto de filtros treinados e σ(y k ) = max(0, Y k ) é a unidade ReLU. As três últimas camadas totalmente conectadas calculam Y 6 = σ(w 6 Y 5 + B 6 ), Y 7 = σ(w 7 Y 6 + B 7 ) e Y 8 = ψ(w 8 )Y 7 + B 8, onde Y k denota a saída da k-ésima camada e ψ(x)[i] = e X[i] / j ex[j] é o classificador softmax. Para obter as características, nós descartamos a última camada que classifica as características Y 7 nas classes em que a rede foi

3 treinada. Dessa forma, as características consistem na saída da penúltima camada Y 7 R 4096 para a rede AlexNet. As demais arquiteturas utilizadas neste trabalho são descritas abaixo. Para todas as camadas, a saída da penúltima camada é utilizada como o vetor de características. VGGNet [11]: a principal contribuição da VGGNet foi mostrar que CNN com mais camadas pode melhorar a acurácia. Os autores apresentaram e treinaram duas arquiteturas, uma com 16 camadas e outra com 19 camadas. A penúltima extrai vetores com 4096 valores. GoogLeNet [12]: esta arquitetura apresenta o módulo Inception que reduz o número de parâmetros da CNN (e.g., de 60M da AlexNet para 4M). Dessa forma, os autores apresentaram uma CNN mais profunda com 27 camadas. Vetores com 1024 valores são extraídos na penúltima camada. ResNet [20]: esta arquitetura propôs o aprendizado residual para treinar redes cada vez mais profundas. Os autores forneceram experimentos usando 50, 101 e 152 camadas, que são substancialmente mais profundas do que as arquiteturas descritas acima. A penúltima camada extrai vetores com 2048 valores. C. Treinamento Supervisionado Dados os vetores de características extraídos com uma CNN e suas respectivas classes, um classificador pode ser treinado. Os classificadores tradicionais, tais como máquina de vetores de suporte e vizinho mais próximo, foram utilizados nesta etapa. Portanto, essa etapa da metodologia proposta substitui a última camada das redes que são treinadas especificamente para as classes da base de imagens. IV. EXPERIMENTOS E RESULTADOS Nesta seção são descritos os experimentos, a base de imagens e os resultados obtidos. Para a validação da metodologia proposta, os experimentos foram realizados com imagens obtidas da Imagenet [21]. A Imagenet é um conjunto de imagens organizado de acordo com a hierarquia WordNet. Neste conjunto existem mais de classes com média de imagens para cada classe obtidas da internet. Portanto, não existe qualquer controle com relação a resolução e o dispositivo de captura. Desse conjunto, foram selecionadas 13 espécies de animais do pantanal conforme apresentado na Tabela I. A base de imagens possui um total de imagens em que cada espécie possui de 621 a imagens em diferentes resoluções, ambientes e dispositivos de captura, iluminação, etc. A Figura 1 apresenta quatro exemplos de cada espécie em que é possível observar a variação intra-classe. Para a classificação, utilizaram-se dois classificadores bem conhecidos na literatura: Vizinho mais próximo (Nearest Neighbor - NN) [22] e a Máquina de Vetores de Suporte (Support Vector Machine - SVM) [23] com núcleo polinomial. Para o treinamento e testes, as imagens foram divididas seguindo a validação cruzada em 10 dobras. Dessa forma, o conjunto de imagens foi particionado aleatoriamente em 10 subconjuntos com tamanho aproximadamente iguais e mantendo a proporção entre o número de imagens para cada Tabela II. Tabela I. BASE DE IMAGENS UTILIZADA. Nome Científico Nome Popular N. imagens Ardea occidentalis Garça Branca Caiman yacare Jacaré-do-Pantanal Caracara plancus Cariama cristata 834 Dasypus novemcinctus -galinha 975 Eunectes murinus Hydrochoerus hydrochaeris Jabiru mycteria Myrmecophaga jubata Panthera Onca Onça-pintada Pyrocephalus rubinus Rhea americana Tapirus terrestris 621 RESULTADOS EXPERIMENTAIS PARA ARQUITETURAS DE CNN E CLASSIFICADORES. CNN NN SVM AlexNet 86.75(±1.08) 92.35(±0.58) VGGNet (±0.72) 95.55(±0.42) VGGNet (±) 95.52(±0.60) GoogLeNet 92.69(±0.70) 95.61(±) Resnet (±0.53) 96.67(±) Resnet (±0.37) 96.93(±) Resnet (±0.60) 97.24(±) classe. Dos 10 subconjuntos, 9 subconjuntos são utilizados para treinar o classificador enquanto que o subconjunto restante é utilizado para avaliação. O processo é repetido 10 vezes tomando um subconjunto para avaliação exatamente uma vez. As porcentagens de classificação correta são utilizadas para calcular a média e o desvio padrão. A. Resultados A Tabela II apresenta os resultados obtidos pela abordagem proposta usando diferentes CNNs e os dois classificadores. Para todas as CNNs, o SVM obteve melhores resultados se comparado ao NN. A maior diferença entre os classificadores foi para a AlexNet, i.e., de 86.75%(±1.08) com NN para 92.35%(±0.58) com SVM. Os melhores resultados obtidos para os classificadores NN e SVM foram respectivamente 95.58%(±0.60) e 97.24%(±) ambos para a Resnet com 152 camadas. Esses resultados são extremamente promissores devido às dificuldades impostas pelas imagens. Com relação as CNNs, podemos observar que os melhores resultados foram obtidos pela AlexNet, VGGNet, GoogLeNet e Resnet, nessa ordem. Com relação a Resnet, os resultados mostraram que quanto mais camadas a CNN possui, melhor é o seu resultado. Por exemplo, a Resnet com 152 camadas (Resnet-152) obteve 97.24%(±) com o classificador SVM, enquanto que a mesma CNN com 50 e 101 camadas (Resnet- 50 e Resnet-101) obteve 96.67%(±) e 96.93%(±), respectivamente. Para avaliar detalhadamente o desempenho das CNNs, a Figura 2 apresenta as matrizes de confusão para AlexNet, VGGNet-16, GoogLeNet e Resnet-152 com SVM. Em uma matriz de confusão, os acertos são armazenados na diagonal principal. Como podemos observar, as espécies com maior acerto em todas as CNNs foram o (Figura 1(b)) devido a sua coloração específica e a onça-pintada (Figura 1(i)) devido a sua textura. Por outro lado, o (Figura 1(f)) obteve as menores taxas de 88.37%, 91.99%, 93.33% e

4 Figura 1. (a) (b) Prı ncipe (c) Carcara (d) Jacare -do-pantanal (e) (f) Tuiuiu (g) Garc a Branca (h) (i) Onc a-pintada (j) (k) (l) -galinha (m) Tamandua -bandeira Quatro exemplos para cada uma das 13 espe cies que compo em o banco de imagens % para AlexNet, VGGNet-16, GoogLeNet e Resnet-152, respectivamente. Os erros foram obtidos devido a similaridade do Tuiuiu com a Garc a Branca. Na Resnet-152, por exemplo, 3.43% das imagens do Tuiuiu foram classificadas como Garc a Branca. B. Custo Computacional Para medir o tempo para a aplicac a o da metodologia proposta, experimentos foram executados em um computador com processador Intel i5 1.6GHz e 8GB de memo ria RAM. Vale ressaltar que todos esses resultados foram obtidos rodando apenas na CPU, isto e, na o foi utilizada nenhuma GPU que deve acelerar ainda mais o processo. A Tabela III apresenta o tempo me dio em segundos para as etapas: pre -processamento da imagem de entrada (E1), extrac a o das caracterı sticas pela CNN (E2), classificac a o com o SVM (E3) e o tempo total para as tre s etapas. Os tempos de pre -processamento (E1) e classificac a o com o SVM (E3) sa o baixos e similares para todas as CNNs. Como esperado, a AlexNet possui o melhor tempo de processamento, pois possui menos camadas. O tempo me dio total para reconhecer uma imagem usando a AlexNet foi de 0.055s, tornando possı vel a sua aplicac a o em tempo real. As demais CNNs tambe m tiveram tempos totais aceita veis, como a GoogLeNet com 2s e a VGGNet-16 com 9s. Por fim, a Resnet com 152 camadas (CNN mais profunda avaliada) possui um tempo me dio total de 0.585s. C. Classificac a o de Quadros do Youtube Para verificar o poder de generalizac a o da metodologia, vı deos do youtube contendo diferentes espe cies foram obtidos, seus quadros foram extraı dos e classificados usando a Resnet152 e o classificador SVM. Para treinar a metodologia, todas as imagens da ImageNet foram utilizadas. A Figura 3 ilustra alguns quadros dos vı deos contendo as espe cies: anta, carcara, tamandua -bandeira, onc a-pintada,

5 Garça Branca Garça Branca Garça Branca Garça Branca (a) AlexNet (b) VGGNet-16 Garça Branca Garça Branca Garça Branca Garça Branca (c) GoogLeNet (d) Resnet-152 Figura 2. Matrizes de confusão para diferentes CNNs e classificador SVM. Tabela III. TEMPO MÉDIO PARA CADA UMA DAS ETAPAS DA METODOLOGIA PROPOSTA: PRÉ-PROCESSAMENTO DA IMAGEM DE ENTRADA - E1, EXTRAÇÃO DE CARACTERÍSTICAS PELA CNN - E2 E CLASSIFICAÇÃO COM O SVM - E3. CNN E1 E2 E3 Tempo Total AlexNet 0.012(±0.01) 0.043(±0.002) 0.001(±0.00) 0.055(±0.012) VGGNet (±0.01) 6(±0.003) 0.001(±0.00) 9(±0.014) VGGNet (±0.01) 0.457(±0.003) 0.001(±0.00) 0.469(±0.014) GoogLeNet 0.012(±0.01) 0.170(±0.002) 0.000(±0.00) 2(±0.013) Resnet (±0.01) 9(±0.004) 0.001(±0.00) 1(±0.014) Resnet (±0.01) 6(±0.006) 0.001(±0.00) 0.408(±0.015) Resnet (±0.01) 0.572(±0.007) 0.001(±0.00) 0.585(±0.015) de característica de uma rede neural convolucional. Os resultados obtidos através desta nova metodologia demonstraram ser possível uma caracterização robusta em uma base de imagens bastante complexa. O melhor resultado de 97.24% foi obtido usando a Resnet com 152 camadas e o classificador SVM. Os trabalhos futuros incluem a aplicação da abordagem em outras bases de imagens, e utilizar outros classificadores para avaliar os resultados. Além disso, pretendemos combinar os vetores de características extraídos de diferentes CNNs. seriema e tuiuiú. No topo de cada quadro, é apresentada a espécie mais provável classificada pela metodologia e sua porcentagem obtida pelo classificador SVM. Apesar dos desafios (e.g., escalas e ponto de vista), a metodologia apresenta uma excelente acurácia para as espécies. V. CONCLUSÕES E TRABALHOS FUTUROS Neste trabalho foi proposta uma nova metodologia para reconhecimento de espécies de animais por meio da obtenção AGRADECIMENTOS Os autores agradecem a Fundação Universidade Federal de Mato Grosso do Sul, ao programa PET - Fronteira, Fundação de Apoio ao Desenvolvimento do Ensino, Ciência e Tecnologia do Estado de Mato Grosso do Sul - Fundect pelo apoio financeiro e o espaço cedido para a realização das pesquisas e experimentos.

6 Figura 3. Quadros de vı deos do youtube classificados pela Resnet-152 e SVM. Na parte superior do vı deo e apresentada a espe cie mais prova vel seguida pela porcentagem. R EFER E NCIAS [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] W. J. Junk, C. N. da Cunha, K. M. Wantzen, P. Petermann, C. Stru ssmann, M. I. Marques, and J. Adis, Biodiversity and its conservation in the pantanal of mato grosso, brazil, Aquatic Sciences, vol. 68, no. 3, pp , [Online]. Available: F. A. Swarts, The Pantanal of Brazil, Paraguay and Bolivia: Selected Discourses on the Worlds Largest Remaining Wetland System. Hudson MacArthur Publishers, January C. Alho and J. Sabino, A conservation agenda for the Pantanal s biodiversity, Brazilian Journal of Biology, vol. 71, pp , J. Aguzzi, C. Costa, Y. Fujiwara, R. Iwase, E. Ramirez-Llorda, and P. Menesatti, A novel morphometry-based protocol of automated videoimage analysis for species recognition and activity rhythms monitoring in deep-sea fauna, Sensors, vol. 9, no. 11, pp , X. Yu, J. Wang, R. Kays, P. A. Jansen, T. Wang, and T. Huang, Automated identification of animal species in camera trap images, EURASIP Journal on Image and Video Processing, vol. 2013, no. 1, pp. 1 10, [Online]. Available: R. Kays, S. Tilak, B. Kranstauber, P. A. Jansen, C. Carbone, M. J. Rowcliffe, T. Fountain, J. Eggert, and Z. He, Monitoring wild animal communities with arrays of motion sensitive camera traps, ArXiv eprints, September M. dos Santos de Arruda, B. B. Machado, W. N. Gonc alves, L. Cullen, J. H. P. Dias, C. C. Garcia, and J. F. R. Jr, Thermal image segmentation in studies of wildlife animals, in Workshop de Visa o Computacional, 2015, pp G. Chen, T. X. Han, Z. He, R. Kays, and T. Forrester, Deep convolutional neural network based species recognition for wild animal monitoring, in IEEE International Conference on Image Processing (ICIP), Oct 2014, pp A. Gomez, A. Salazar, and F. Vargas, Towards automatic wild animal monitoring: Identification of animal species in camera-trap images using very deep convolutional neural networks, ArXiv e-prints, mar A. Krizhevsky, I. Sutskever, and G. E. Hinton, Imagenet classification with deep convolutional neural networks, in Advances in Neural Information Processing Systems 25, F. Pereira, C. J. C. Burges, L. Bottou, and K. Q. Weinberger, Eds. Curran Associates, Inc., 2012, pp [Online]. Available: imagenet-classification-with-deep-convolutional-neural-networks. pdf K. Simonyan and A. Zisserman, Very deep convolutional networks for large-scale image recognition, ArXiv e-prints, September [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, and A. Rabinovich, Going deeper with convolutions, in The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 2015, pp Y. LeCun, B. Boser, J. S. Denker, D. Henderson, R. E. Howard, W. Hubbard, and L. D. Jackel, Backpropagation applied to handwritten zip code recognition, Neural Computation, vol. 1, no. 4, pp , 2016/05/ [Online]. Available: http: //dx.doi.org/ /neco A. Toshev and C. Szegedy, Deeppose: Human pose estimation via deep neural networks, in The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 2014, pp P. Luo, X. Wang, and X. Tang, Hierarchical face parsing via deep learning, in IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 2012, pp Y. Sun, X. Wang, and X. Tang, Deep convolutional network cascade for facial point detection, in The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 2013, pp A. Graves, A. r. Mohamed, and G. Hinton, Speech recognition with deep recurrent neural networks, in IEEE International Conference on Acoustics, Speech and Signal Processing, May 2013, pp A. Karpathy, G. Toderici, S. Shetty, T. Leung, R. Sukthankar, and L. Fei-Fei, Large-scale video classification with convolutional neural networks, in The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), June 2014, pp M. Oquab, L. Bottou, I. Laptev, and J. Sivic, Learning and transferring mid-level image representations using convolutional neural networks, in Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition, ser. CVPR 14. Washington, DC, USA: IEEE Computer Society, 2014, pp [Online]. Available: K. He, X. Zhang, S. Ren, and J. Sun, Deep residual learning for image recognition, CoRR, vol. abs/ , [Online]. Available: O. Russakovsky, J. Deng, H. Su, J. Krause, S. Satheesh, S. Ma, Z. Huang, A. Karpathy, A. Khosla, M. Bernstein, A. C. Berg, and L. Fei-Fei, ImageNet Large Scale Visual Recognition Challenge, International Journal of Computer Vision (IJCV), vol. 115, no. 3, pp , D. Aha and D. Kibler, Instance-based learning algorithms, Machine Learning, vol. 6, pp , C. Cortes and V. Vapnik, Support-vector networks, Machine Learning, vol. 20, no. 3, pp , 1995, cited By

GoogLeNet - Going Deeper with Convolutions

GoogLeNet - Going Deeper with Convolutions - Going Deeper with Convolutions Heyde Francielle do Carmo França Prof. Dr. Anderson Soares Instituto de Informática Universidade Federal de Goiás 02 de Dezembro de 2016 1 / 35 Sumário I 1 2 3 2 / 35 3

Leia mais

Uma Abordagem Genética Para Redes Neurais Convolucionais

Uma Abordagem Genética Para Redes Neurais Convolucionais Uma Abordagem Genética Para Redes Neurais Convolucionais Roberto M. Pinheiro Pereira 1, Lucas Bezerra Maia 1, Polyana Bezerra Da Costa 1, Jordan Boaz Rodrigues 1, Geraldo Braz Junior 1 João D. S. De Almeida,

Leia mais

Reconhecimento de Modelos de Veículos

Reconhecimento de Modelos de Veículos Reconhecimento de Modelos de Veículos Fernando Benedito Veras Magalhães January 15, 2018 1 Introdução Em 2017, 2,1 milhões de automóveis, incluindo picapes e furgões, foram vendidos no Brasil. A variedade

Leia mais

Um Estudo sobre Diferente Tipos de Funções de Custo Para Redes Neurais Convolucionais

Um Estudo sobre Diferente Tipos de Funções de Custo Para Redes Neurais Convolucionais Um Estudo sobre Diferente Tipos de Funções de Custo Para Redes Neurais Convolucionais Roberto M. Pinheiro Pereira, Lucas Bezerra Maia, Thalles Alencar Silva, Alexandre César P. Pessoa, Geraldo Braz Junior

Leia mais

Roberto Lotufo Big Data Brasil São Paulo, 23 de junho de 2018

Roberto Lotufo Big Data Brasil São Paulo, 23 de junho de 2018 Roberto Lotufo roberto@neuralmind.ai Big Data Brasil São Paulo, 23 de junho de 2018 Classificação dedo falso/dedo vivo Desempenho atual: 200ms Intel I5 99% acurácia LivDet 2015 - Fingerprint Liveness Competition

Leia mais

Redes Convolucionais Aplicadas em Visão Computacional

Redes Convolucionais Aplicadas em Visão Computacional Redes Convolucionais Aplicadas em Visão Computacional Marcos José Canêjo Estevão de Azevêdo mjcea@cin.ufpe.br Sumário História Evolução Tipos Aplicações Considerações Finais 2 História Surgiram em 1980

Leia mais

SEMINÁRIO DOS ARTIGOS:

SEMINÁRIO DOS ARTIGOS: SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene

Leia mais

JAI 6 - Deep Learning Teoria e Prática

JAI 6 - Deep Learning Teoria e Prática JAI 6 - Deep Learning Teoria e Prática Cristina Nader Vasconcelos Universidade Federal Fluminense CNNs Câmeras estão por toda parte! crisnv@ic.uff.br Aquisição de imagens digitais crisnv@ic.uff.br 3 Representação

Leia mais

Region Based CNNs. Francisco Calaça Xavier. Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado. Instituto de Informática UFG

Region Based CNNs. Francisco Calaça Xavier. Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado. Instituto de Informática UFG Region Based CNNs Francisco Calaça Xavier Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado Instituto de Informática UFG Prof. Anderson Soares Agenda O problema Estado da arte R-CNN

Leia mais

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO

RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO RECONHECIMENTO DE CARACTERES EM IMAGENS COM RUÍDO Fernanda Maria Sirlene Pio SUMARIO Introdução Trabalhos Relacionados Metodologia Experimentos Conclusão Referências 2 INTRODUÇÃO Reconhecimento de Padrões

Leia mais

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION - VGG

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION - VGG Exemplo de Implementação - 16 VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION - VGG Edjalma Queiroz da Silva Programa de pós-graduação em Ciências da Computação Mestrado e Doutorado

Leia mais

Redes Neurais Convolucionais

Redes Neurais Convolucionais André Gustavo Hochuli Orientador: Prof. Dr. Luiz Eduardo Soares de Oliveira Programa de Pós-Graduação em Informática Departamento de Informática UFPR http://www.inf.ufpr.br/aghochuli/caffe/ Redes Neurais

Leia mais

Face Recognition using RGB-D Images

Face Recognition using RGB-D Images Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia

Leia mais

Redes Neurais Convolucionais

Redes Neurais Convolucionais André Gustavo Hochuli Orientadores: Dr. Luiz E. S. Oliveira/Dr. Alceu Britto Programa de Pós-Graduação em Informática Departamento de Informática UFPR Neurônio Artificial Redes Neurais - Vetor de Caracteristícas

Leia mais

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino Ricardo Cezar Bonfim Rodrigues 24 de abril de 2006 1 Antecedentes e Justificativa Hoje, em diversos processos industriais,

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 18 Descritores Locais e Frameworks SIFT SURF Viola-Jones

Leia mais

Machine learning para reconhecimento de padrões em tempo real

Machine learning para reconhecimento de padrões em tempo real Machine learning para reconhecimento de padrões em tempo real Felipe Kühne Guilherme Webber Mendes DBLab Laboratório de Inovação DBServer Assessoria em Sistemas de Informação Junho de 2018 Quem somos Felipe

Leia mais

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo Juliana Patrícia Detroz Professor: André Tavares da Silva Universidade do Estado de Santa Catarina

Leia mais

Aprendizado Profundamente Supervisionado. em Grafos Aplicado a Pecuária de Precisão

Aprendizado Profundamente Supervisionado. em Grafos Aplicado a Pecuária de Precisão Aprendizado Profundamente Supervisionado em Grafos Aplicado a Pecuária de Precisão Programa de Pós-Graduação Stricto Sensu - Doutorado em Computação INOVISAO Universidade Federal de Mato Grosso do Sul

Leia mais

Diagnóstico de Leucemia Linfoide Aguda com Redes Neurais Convolucionais Pré-treinadas

Diagnóstico de Leucemia Linfoide Aguda com Redes Neurais Convolucionais Pré-treinadas III Escola Regional de Informática do Piauí. Livro Anais - Artigos e Minicursos, v. 1, n. 1, p. 230-235, jun, 2017. www.eripi.com.br/2017 - ISBN: 978-85-7669-395-6 Diagnóstico de Leucemia Linfoide Aguda

Leia mais

READING DIGITS IN NATURAL IMAGES WITH UNSUPERVISED FEATURE LEARNING

READING DIGITS IN NATURAL IMAGES WITH UNSUPERVISED FEATURE LEARNING READING DIGITS IN NATURAL IMAGES WITH UNSUPERVISED FEATURE LEARNING Fernanda Maria Sirlene READING DIGITS IN NATURAL IMAGES WITH UNSUPERVISED FEATURE LEARNING NIPS Workshop on Deep Learning and Unsupervised

Leia mais

SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro

SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro Detecting Pedestrians Using Patterns of Motion and Appearance *Paul Viola *Michael J. Jones *Daniel Snow Por que detectar pedestres? http://conexaopenedo.com.br/2016/02/sistema-consegue-detectar-pedestres-em-tempo-real/

Leia mais

Classificação de espécies de peixe utilizando redes neurais convolucional

Classificação de espécies de peixe utilizando redes neurais convolucional Classificação de espécies de peixe utilizando redes neurais convolucional Andre G. C. Pacheco a,1 a Programa de Pós-Graduação em Informática (PPGI), Universidade Federal do Espírito Santo (UFES), Vitória

Leia mais

Descritores de Imagem

Descritores de Imagem Descritores de Imagem André Tavares da Silva 31 de março de 2014 1 Descritores de imagem (continuação) 1.1 Frameworks de detecção de objetos SIFT (scale-invariant features transform) (Lowe, 1999) SIFT

Leia mais

Reconhecimento de Sinais de Trânsito Utilizando Deep Learning

Reconhecimento de Sinais de Trânsito Utilizando Deep Learning Reconhecimento de Sinais de Trânsito Utilizando Deep Learning Marcos Vinícius Oliveira Sobrinho 1, Matheus Chaves Menezes 1, Chrystian Gustavo Martins Nascimento 1, Geraldo Braz Júnior 2 1 Curso de Ciência

Leia mais

Projetos finais. Grupo 3

Projetos finais. Grupo 3 Projetos finais Grupo 3 Integrantes Laez Barbosa da Fonseca Filho 8586902 laez.filho@usp.br Caetano Mastroianni Dieguez 7210164 caetano.dieguez@usp.br Lais Harumi Fukujima Aguiar 8587142 lais.aguiar.br@ieee.org

Leia mais

2. Redes Neurais Artificiais

2. Redes Neurais Artificiais Computação Bioinspirada - 5955010-1 2. Redes Neurais Artificiais Prof. Renato Tinós Depto. de Computação e Matemática (FFCLRP/USP) 1 2.6. Deep Learning 2.6.1. O Problema da Extração de Características

Leia mais

Object Tracking. Fernando Medeiros Dufour Ciência da Computação - UFPR Tópicos em Visão Computacional

Object Tracking. Fernando Medeiros Dufour Ciência da Computação - UFPR Tópicos em Visão Computacional Object Tracking Fernando Medeiros Dufour Ciência da Computação - UFPR Tópicos em Visão Computacional Índice 1. Introdução a. Problema b. Aplicações c. Dificuldades d. Datasets 2. Redes Neurais Convolucionais

Leia mais

Reconhecimento de Gestos

Reconhecimento de Gestos Reconhecimento de Gestos Henrique Augusto Richter Tópicos em Visão Computacional Universidade Federal do Paraná Sumário Introdução Utilização Problemas Trabalhos Artigo 1 Artigo 2 Project Soli Introdução

Leia mais

Redes Neurais Convolucionais com Tensorflow: Teoria e Prática

Redes Neurais Convolucionais com Tensorflow: Teoria e Prática III Escola Regional de Informática do Piauí. Livro Anais - Artigos e Minicursos, v. 1, n. 1, p. 382-406, jun, 2017. www.eripi.com.br/2017 - ISBN: 978-85-7669-395-6 Capítulo 7 Redes Neurais Convolucionais

Leia mais

Detecção de pessoas em um ambiente industrial utilizando imagens de profundidade e classificadores profundos

Detecção de pessoas em um ambiente industrial utilizando imagens de profundidade e classificadores profundos Detecção de pessoas em um ambiente industrial utilizando imagens de profundidade e classificadores profundos Eduardo Henrique Arnold e Danilo Silva Resumo Esse trabalho descreve o desenvolvimento de um

Leia mais

Segmentação Automática da Próstata em Imagens de Ressonância Magnética utilizando Redes Neurais Convolucionais e Mapa Probabilístico

Segmentação Automática da Próstata em Imagens de Ressonância Magnética utilizando Redes Neurais Convolucionais e Mapa Probabilístico Segmentação Automática da Próstata em Imagens de Ressonância Magnética utilizando Redes Neurais Convolucionais e Mapa Probabilístico Jonnison L. Ferreira 1, Giovanni L. F. da Silva 1, Artur B. S. Reis

Leia mais

TÍTULO: IDENTIFICAÇÃO DE CARACTERES APRESENTADOS A UMA CÂMERA POR MEIO DO MOVIMENTO DOS DEDOS DA MÃO DE UM SER HUMANO

TÍTULO: IDENTIFICAÇÃO DE CARACTERES APRESENTADOS A UMA CÂMERA POR MEIO DO MOVIMENTO DOS DEDOS DA MÃO DE UM SER HUMANO Anais do Conic-Semesp. Volume 1, 2013 - Faculdade Anhanguera de Campinas - Unidade 3. ISSN 2357-8904 TÍTULO: IDENTIFICAÇÃO DE CARACTERES APRESENTADOS A UMA CÂMERA POR MEIO DO MOVIMENTO DOS DEDOS DA MÃO

Leia mais

First-person activity recognition. Matheus A. Nerone

First-person activity recognition. Matheus A. Nerone First-person activity recognition Matheus A. Nerone Sumário 1. 2. 3. Introdução a. Contexto b. Problema c. Exemplos de uso d. Dificuldades Trabalhos Relacionados a. Artigo inicial b. Histórico Artigos

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala 3 CCET [quinta-feira, 8:20 12:00] Atendimento

Leia mais

Um comparativo entre arquiteturas de redes neurais profundas aplicadas no reconhecimento de imagens

Um comparativo entre arquiteturas de redes neurais profundas aplicadas no reconhecimento de imagens Um comparativo entre arquiteturas de redes neurais profundas aplicadas no reconhecimento de imagens Leandro R. L. Pavão, Tatiana F. M. dos Santos, Carlos O. Rolim Universidade Regional Integrada do Alto

Leia mais

Título do Projeto: Visão Computacional e Aprendizagem Automática para Aplicações em Agropecuária e Ciências Forenses.

Título do Projeto: Visão Computacional e Aprendizagem Automática para Aplicações em Agropecuária e Ciências Forenses. P L A N O D E T R A B A L H O Título do Projeto: Visão Computacional e Aprendizagem Automática para Aplicações em Agropecuária e Ciências Forenses. Título do Plano de trabalho: Redes convolucionais profundas

Leia mais

UNIVERSIDADE DE SÃO PAULO ESCOLA DE ENGENHARIA DE SÃO CARLOS. Kaio Augusto de Oliveira

UNIVERSIDADE DE SÃO PAULO ESCOLA DE ENGENHARIA DE SÃO CARLOS. Kaio Augusto de Oliveira UNIVERSIDADE DE SÃO PAULO ESCOLA DE ENGENHARIA DE SÃO CARLOS Kaio Augusto de Oliveira Avaliação de desempenho de redes neurais convolucionais para classificação de imagens de texturas rotacionadas. São

Leia mais

Reconhecimento de ações humanas em vídeos por meio de transferência de aprendizado

Reconhecimento de ações humanas em vídeos por meio de transferência de aprendizado https://eventos.utfpr.edu.br//sicite/sicite2017/index Reconhecimento de ações humanas em vídeos por meio de transferência de aprendizado Lucas Messias Valério lucasvalerio@alunos.utfpr.edu.br Universidade

Leia mais

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face.

O reconhecimento facial é dividido em três etapas: i) detecção da face, ii) extração de características e iii) reconhecimento da face. ESTUDO SOBRE MÉTODOS DE RECONHECIMENTO FACIAL EM FOTOGRAFIAS DIGITAIS Ana Elisa SCHMIDT¹, Elvis Cordeiro NOGUEIRA² ¹ Orientadora e docente do IFC-Campus Camboriú; ² Aluno do curso de Bacharelado em Sistemas

Leia mais

Color Eyes Detector. Duarte Petiz. DCC/FCUP

Color Eyes Detector. Duarte Petiz. DCC/FCUP Color Eyes Detector Duarte Petiz DCC/FCUP up201204625@fc.up.pt Resumo Este relatório descreve a implementação da aplicação desenvolvida Color Eyes Detector bem como mostra os resultados finais da execução

Leia mais

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010])

Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Sketch to Photo Matching: A Feature-based Approach (Klare and Jain [2010]) Marco Antonio de A. Silva Programa de Pós-Graduação em Ciência da Computação - PPGCC Departamento de Computação - DECOM Universidade

Leia mais

Combinação de Superpixels e Redes Convolucionais para Segmentação de Bovinos. Diogo Nunes Gonçalves

Combinação de Superpixels e Redes Convolucionais para Segmentação de Bovinos. Diogo Nunes Gonçalves Combinação de Superpixels e Redes Convolucionais para Segmentação de Bovinos Diogo Nunes Gonçalves SERVIÇO DE PÓS-GRADUAÇÃO DA FACOM- UFMS Data de Depósito: Assinatura: Combinação de Superpixels e Redes

Leia mais

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil

Face Detection. Image Processing scc moacir ICMC/USP São Carlos, SP, Brazil Face Detection Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Face Detection 2011 1 / 24 Agenda 1 Detectando faces 2

Leia mais

Reconhecimento de texturas utilizando padrão binário local e classificador knn.

Reconhecimento de texturas utilizando padrão binário local e classificador knn. Reconhecimento de texturas utilizando padrão binário local e classificador knn. Vinicius Santos Andrade 1 Resumo. Através de uma imagem é possível obter inúmeras informações. Portanto, é cada vez mais

Leia mais

UNIVERSIDADE DE SÃO PAULO ESCOLA DE ENGENHARIA DE SÃO CARLOS FABIO AUGUSTO GONÇALVES FACCINI

UNIVERSIDADE DE SÃO PAULO ESCOLA DE ENGENHARIA DE SÃO CARLOS FABIO AUGUSTO GONÇALVES FACCINI UNIVERSIDADE DE SÃO PAULO ESCOLA DE ENGENHARIA DE SÃO CARLOS FABIO AUGUSTO GONÇALVES FACCINI Avaliação de desempenho de uma rede neural convolucional para classificação de imagens ruidosas São Carlos 2018

Leia mais

Biometria Multimodalidade Íris + Face. Luiz Antonio Zanlorensi Junior

Biometria Multimodalidade Íris + Face. Luiz Antonio Zanlorensi Junior Biometria Multimodalidade Íris + Face Luiz Antonio Zanlorensi Junior Sumário Introdução Fusionamento Artigo 1 Seleção de características Multimodal Problemas Base de dados Artigo 2 Unimodal + Multimodal

Leia mais

UM ESTUDO SOBRE ABORDAGENS PARA DE CLASSIFICAÇÃO DE ANIMAIS EM IMAGENS DE ARMADILHAS FOTOGRÁFICAS

UM ESTUDO SOBRE ABORDAGENS PARA DE CLASSIFICAÇÃO DE ANIMAIS EM IMAGENS DE ARMADILHAS FOTOGRÁFICAS UNIVERSIDADE FEDERAL DO AMAZONAS INSTITUTO DE COMPUTAÇÃO PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA UM ESTUDO SOBRE ABORDAGENS PARA AVALIAÇÃO OUT-OF-SAMPLE DE MODELOS DE CLASSIFICAÇÃO DE ANIMAIS EM IMAGENS

Leia mais

Introdução a Visão Computacional. Prof. Dr. Geraldo Braz Junior DEINF - UFMA

Introdução a Visão Computacional. Prof. Dr. Geraldo Braz Junior DEINF - UFMA Introdução a Visão Computacional Prof. Dr. Geraldo Braz Junior DEINF - UFMA O que é Visão Computacional? Você já viu? 2 O que se espera? Visão é sobre entender imagens Coloridas ou em tons de cinza Pequenas

Leia mais

"Análise de Extratores de Característica para Reconhecimento de Face"

Análise de Extratores de Característica para Reconhecimento de Face Universidade Federal de Pernambuco Centro de Informática Graduação em Engenharia de Computação Proposta de Trabalho de Graduação "Análise de Extratores de Característica para Reconhecimento de Face" Orientador:

Leia mais

Avaliação do desempenho das ConvNets na detecção de ovos de esquistossomose PROPOSTA DE TRABALHO DE GRADUAÇÃO

Avaliação do desempenho das ConvNets na detecção de ovos de esquistossomose PROPOSTA DE TRABALHO DE GRADUAÇÃO UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO Avaliação do desempenho das ConvNets na detecção de ovos de esquistossomose PROPOSTA DE TRABALHO DE GRADUAÇÃO

Leia mais

Redes Neurais Convolucionais Aplicadas à Preensão Robótica

Redes Neurais Convolucionais Aplicadas à Preensão Robótica Redes Neurais Convolucionais Aplicadas à Preensão Robótica Renata Oliveira, Errison Alves e Carlos Malqui DEE - Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio), RJ, Brasil renata.garcia.eng@gmail.com

Leia mais

Reconhecimento de Produtos por Imagem Utilizando Palavras Visuais e Redes Neurais Convolucionais

Reconhecimento de Produtos por Imagem Utilizando Palavras Visuais e Redes Neurais Convolucionais Reconhecimento de Produtos por Imagem Utilizando Palavras Visuais e Redes Neurais Convolucionais Guilherme Defreitas Juraszek 1 Alexandre Gonçalves Silva 2 André Tavares da Silva 1 Resumo: Este trabalho

Leia mais

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES

RECONHECIMENTO FACIAL UTILIZANDO EIGENFACES Universidade Federal do Rio de Janeiro Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Engenharia de Sistemas e Computação Rio de Janeiro, RJ Brasil RECONHECIMENTO

Leia mais

11º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2017 Campinas, São Paulo ISBN

11º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2017 Campinas, São Paulo ISBN DETECÇÃO DE FRUTOS EM CAMPO POR APRENDIZADO DE MÁQUINA Andreza Aparecida dos Santos¹; Thiago Teixeira Santos 2 Nº 17603 RESUMO Métodos de reconhecimento de frutos utilizando diferentes descritores e classificadores

Leia mais

Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais

Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais Ricardo Cerri Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo cerri@icmc.usp.br Roteiro Introdução

Leia mais

Sistema de Reconhecimento de Logotipos

Sistema de Reconhecimento de Logotipos Sistema de Reconhecimento de Logotipos Fellipe Duarte, Saulo T. Oliveira {duartefellipe,sto}@cos.ufrj.br Relatório Técnico, Introdução ao Processamento de Imagens Programa de Engenharia de Sistemas e Computação

Leia mais

detecção de voz cantada em sinais de áudio polifônicos

detecção de voz cantada em sinais de áudio polifônicos detecção de voz cantada em sinais de áudio polifônicos Aplicações, Abordagens e Desafios Shayenne Moura 23. April 2018 Instituto de Matemática e Estatística Universidade de São Paulo o problema Detecção

Leia mais

PAULO ROBERTO SILVA CHAGAS JÚNIOR

PAULO ROBERTO SILVA CHAGAS JÚNIOR UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO PAULO ROBERTO SILVA CHAGAS JÚNIOR Avaliação de arquiteturas de Redes Neurais Convolucionais

Leia mais

Descritores de Imagens

Descritores de Imagens Descritores de Imagens André Tavares da Silva PPGCA/UDESC Outubro de 2017 André Tavares da Silva (PPGCA/UDESC) Descritores de Imagens Outubro de 2017 1 / 17 Introdução Excelentes pesquisas sobre descritores

Leia mais

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar Introdução Comidas podem apresentar deformações e variações em sua forma, além de conter muitos ingredientes, nem todos visíveis; Métodos tradicionais de reconhecimento requerem a detecção de características

Leia mais

Image Descriptors: color

Image Descriptors: color Image Descriptors: color Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: color 2011 1 / 29 Agenda

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Principais tópicos Aprendizado profundo André C P L F de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Introdução Redes profundas Aprendizado profundo Redes autodecodificadoras

Leia mais

Caracterização de Imagens via Redes Neurais Artificiais

Caracterização de Imagens via Redes Neurais Artificiais Caracterização de Imagens via Redes Neurais Artificiais Autor: Eduardo Ferreira Ribeiro 1, Orientadora: Celia Zorzo Barcelos 1 1 Programa de Pós-Graduação em Ciência da Computação Universidade Federal

Leia mais

2 Reconhecimento Facial

2 Reconhecimento Facial 2 Reconhecimento Facial Em termos gerais, o reconhecimento facial é o processo pelo qual se mede o grau de similaridade entre duas imagens faciais com o proposito de identificar a um indivíduo ou de verificar

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem (Redes Neurais - Complementar) Prof. a Joseana Macêdo

Leia mais

Reconhecimento de Caracteres em Imagens com Ruído

Reconhecimento de Caracteres em Imagens com Ruído Reconhecimento de Caracteres em Imagens com Ruído Sirlene Pio UFOP sirlenepg@gmail.com Fernanda Maria Ribeiro UFOP fernandamaria si@yahoo.com.br Abstract O desempenho dos métodos de aprendizagem de máquina

Leia mais

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/20) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Referências

Leia mais

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE CAMPINAS PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO COORDENADORIA GERAL DE PESQUISA EDITAL PROPESQ/CGP Nº 002/17

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE CAMPINAS PRÓ-REITORIA DE PESQUISA E PÓS-GRADUAÇÃO COORDENADORIA GERAL DE PESQUISA EDITAL PROPESQ/CGP Nº 002/17 EDITAL PROPESQ/CGP Nº 002/17 PROCESSO SELETIVO DE BOLSAS DE INICIAÇÃO EM DESENVOLVIMENTO TECNOLÓGICO E INOVAÇÃO PUC-CAMPINAS GRUPO ENGENHO A PONTIFÍCIA UNIVERSIDADE CATÓLICA DE CAMPINAS PUC-CAMPINAS, por

Leia mais

Avaliação de técnicas de Deep Learning aplicadas à identificação de peças defeituosas em vagões de trem

Avaliação de técnicas de Deep Learning aplicadas à identificação de peças defeituosas em vagões de trem Avaliação de técnicas de Deep Learning aplicadas à identificação de peças defeituosas em vagões de trem Rafael L. Rocha, Ana Carolina Q. Siravenha, Ana C. S. Gomes, Gerson L. Serejo, Alexandre F. B. Silva,

Leia mais

Composição de música utilizando LSTM

Composição de música utilizando LSTM Composição de música utilizando LSTM Alexandre de C. Araújo 12 Nelia Cantanhade Reis 12 André Monteiro 1 1 Departamento de Informática - Universidade Federal do Maranhão(UFMA) Av. dos Portugueses, 1966

Leia mais

introdução ao deep learning

introdução ao deep learning introdução ao deep learning Jeferson de Souza Santos SERFA 2016 IEAv / EGI-S introdução Introdução - Aplicações de Machine Learning - Redes Profundas Figure: Fontes: techli.com; wccftech.com; updateordie.net;

Leia mais

Aprendizado de Máquina. Combinando Classificadores

Aprendizado de Máquina. Combinando Classificadores Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores

Leia mais

Deep Learning for Chinese Word Segmentation and POS Tagging

Deep Learning for Chinese Word Segmentation and POS Tagging Deep Learning for Chinese Word Segmentation and POS Tagging Lin Yu Han Universidade Federal do Paraná Novembro 2015 Tagging: Sumário Sumário Introdução. Arquitetura da Rede Neural Experimentos Considerações

Leia mais

10º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2016 Campinas, São Paulo ISBN

10º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2016 Campinas, São Paulo ISBN Um Estudo de Descritores e Classificadores para Reconhecimento de Bagas de Café Pedro Henrique Ferreira Stringhini 1 ; Thiago Teixeira Santos 2 Nº 16605 RESUMO Métodos de reconhecimento de frutos baseados

Leia mais

JAI 6 - Deep Learning Teoria e Prática

JAI 6 - Deep Learning Teoria e Prática JAI 6 - Deep Learning Teoria e Prática Esteban Clua e Cristina Nader Vasconcelos Universidade Federal Fluminense Fundamentos Computação baseada em modelos crisnv@ic.uff.br 2 Computação baseada em aprendizado

Leia mais

INF011 - Seminários de Pesquisa II

INF011 - Seminários de Pesquisa II INF011 - Seminários de Pesquisa II Doutorando: Erick Toshio Yamamoto Orientador: Prof. Dr. Ricardo Suyama Professor da Disciplina: Prof. Dr. João Henrique Kleinschmidt Santo André, 02 de maio de 2018 Agenda

Leia mais

Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus

Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus Reconhecimento Facial 3D utilizando o Simulated Annealing com as Medidas Surface Interpenetration Measure e M-Estimator Sample Consensus Dissertação de Mestrado em Informática Sídnei Augusto Drovetto Jr.

Leia mais

Person Re-Identification. Autor: Guilherme Zasyeki Machado

Person Re-Identification. Autor: Guilherme Zasyeki Machado Person Re-Identification Autor: Guilherme Zasyeki Machado Sumário - Introdução ao problema - Visão geral ao processo de Re-Identificação - Evolução estado da arte - Datasets disponíveis - Análise estado

Leia mais

Deep Learning para Classificação de Imagens

Deep Learning para Classificação de Imagens Deep Learning para Classificação de Imagens Vinicius Eiji Martins 1, Sylvio Barbon Junior 1 1 Departamento de Computação Universidade Estadual de Londrina (UEL) Caixa Postal 10.011 CEP 86057-970 Londrina

Leia mais

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Juliana Patrícia Detroz Orientador: André Tavares Silva Visão computacional Tentativa de replicar a habilidade humana da visão através da percepção e entendimento de uma imagem; Fazer

Leia mais

Detecção e Correção Automáticas de Olhos Vermelhos

Detecção e Correção Automáticas de Olhos Vermelhos Setor de Tecnologia da Universidade Federal do Paraná Curso de Engenharia Elétrica TE 072 Processamento Digital de Sinais Detecção e Correção Automáticas de Olhos Vermelhos Trabalho elaborado pelo aluno

Leia mais

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes. HP UFCG Analytics Abril-Maio 2012 Um curso sobre Reconhecimento de Padrões e Redes Neurais Por Herman Martins Gomes hmg@dsc.ufcg.edu.br Programa Visão Geral (2H) Reconhecimento Estatístico de Padrões (3H)

Leia mais

FLODNet - Detecção e reconhecimento de objetos em dispositivos de baixa especificação: um estudo de caso em classificação de alimentos

FLODNet - Detecção e reconhecimento de objetos em dispositivos de baixa especificação: um estudo de caso em classificação de alimentos FLODNet - Detecção e reconhecimento de objetos em dispositivos de baixa especificação: um estudo de caso em classificação de alimentos B. A. G. de Oliveira 1, F. M. F. Ferreira 1, and C. A. P. S. Martins

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Apresentação da Disciplina Alessandro L. Koerich 2008 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem

Leia mais

Rumo à Melhoria de Produtividade e Sustentabilidade Agrícola por meio da Classificação Automática do Vigor de Sementes de Soja

Rumo à Melhoria de Produtividade e Sustentabilidade Agrícola por meio da Classificação Automática do Vigor de Sementes de Soja Rumo à Melhoria de Produtividade e Sustentabilidade Agrícola por meio da Classificação Automática do Vigor de Sementes de Soja Marcelo de Souza Junior 1, Rafael S. Bressan 1, Douglas F. Pereira 1, Priscila

Leia mais

RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ

RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ Marcela Ribeiro Carvalho marcela@enecar.com.br IFG/Câmpus Goiânia Hipólito Barbosa Machado Filho hipolito.barbosa@ifg.edu.br IFG/Câmpus Goiânia Programa Institucional

Leia mais

Classificação de Lesões no Cérebro em Imagens de Ressonância Magnética usando SLIC, Particle Swarm Optimization e Convolutional Neural Network

Classificação de Lesões no Cérebro em Imagens de Ressonância Magnética usando SLIC, Particle Swarm Optimization e Convolutional Neural Network Classificação de Lesões no Cérebro em Imagens de Ressonância Magnética usando SLIC, Particle Swarm Optimization e Convolutional Neural Network Carolina L. S. Cipriano 1, Felipe J. P. de Andrade 1, Jonnison

Leia mais

5 Experimentos Corpus

5 Experimentos Corpus 5 Experimentos 5.1. Corpus A palavra corpus significa corpo em latim. No contexto de Aprendizado de Máquina, corpus se refere a um conjunto de dados utilizados para experimentação e validação de modelos.

Leia mais

André de S. Moreira Caroline Rosa Redlich Suellen de A. C. da S. Motta Thiago R. da Motta Detecção de Pedestres em Vídeos

André de S. Moreira Caroline Rosa Redlich Suellen de A. C. da S. Motta Thiago R. da Motta Detecção de Pedestres em Vídeos André de S. Moreira Caroline Rosa Redlich Suellen de A. C. da S. Motta Thiago R. da Motta Detecção de Pedestres em Vídeos Trabalho apresentado na disciplina Aprendizado de Máquina I (INF 2979) ministrada

Leia mais

Reconhecimento de Alimentos utilizando Histograma de Cor e SIFT

Reconhecimento de Alimentos utilizando Histograma de Cor e SIFT Reconhecimento de Alimentos utilizando Histograma de Cor e SIFT Daniela S. Costa 1, Polyana B. Costa 1, Geraldo Braz Jr. 2 1 Núcleo de Computaçao Aplicada - Universidade Federal do Maranhão (UFMA) Caixa

Leia mais

T4.1 Processamento de Imagem

T4.1 Processamento de Imagem T4.1 Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas 4.

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Plano da Apresentação Aprendizagem de Máquina Alessandro L. Koerich 2007 Mestrado e Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Professor & Experiência Acadêmica Horários

Leia mais

Identificação de Órgãos Foliares utilizando as Wavelets de Daubechies

Identificação de Órgãos Foliares utilizando as Wavelets de Daubechies Identificação de Órgãos Foliares utilizando as Wavelets de Daubechies Alexander Scaranti, Ronaldo Bernardi e Rodrigo de Oliveira Plotze Instituto de Ciências Exatas e Tecnologia - Universidade Paulista

Leia mais

Extração de Atributos para Reconhecimento de Expressões Faciais

Extração de Atributos para Reconhecimento de Expressões Faciais Extração de Atributos para Reconhecimento de Expressões Faciais Vinícius Assis Saueia da Silva 1 1. Introdução Interação Homem-Computador é uma das áreas da computação que procuram fazer com que o ser

Leia mais

Capítulo III Processamento de Imagem

Capítulo III Processamento de Imagem Capítulo III Processamento de Imagem Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Manipulação ponto a ponto 2. Filtros espaciais 3. Extracção de estruturas geométricas

Leia mais

Extração de atributos usando o método LBP - Local Binary Pattern

Extração de atributos usando o método LBP - Local Binary Pattern Extração de atributos usando o método LBP - Local Binary Pattern Lia Nara Balta Quinta. 2 de maio de 2006 1 Antecedentes e Justificativa O Brasil possui, atualmente, um grande rebanho bovino, porém em

Leia mais

Alex Torquato Souza Carneiro Ciência da Computação Universidade Ibirapuera - UNIb São Paulo - SP, Brasil

Alex Torquato Souza Carneiro Ciência da Computação Universidade Ibirapuera - UNIb São Paulo - SP, Brasil Interface Homem-Máquina para Movimentação Bidimensional de Objeto Através de Reconhecimento de Posturas Corporais por Visão Computacional Projeto Labirinto Alex Torquato Souza Carneiro Ciência da Computação

Leia mais

Reconhecimento de Faces com PCA e Redes Neurais

Reconhecimento de Faces com PCA e Redes Neurais Reconhecimento de Faces com Sandro Santos Andrade Programa de Pós-graduação em Mecatrônica Setembro / 2003 Visão Computacional Computacional Computação Computação Visual Computação Computação Gráfica Introdução

Leia mais

Extração de características de imagens. Descritores de cor

Extração de características de imagens. Descritores de cor Extração de características de imagens Descritores de cor Descritores de imagens Problema: computar, de forma eficiente, valores que descrevam uma imagem (ou parte dela) Vetores de características (feature

Leia mais