XIII Simpósio Brasileiro de Automação Inteligente Porto Alegre RS, 1 o 4 de Outubro de 2017

Documentos relacionados
SUPPORT VECTOR MACHINE - SVM

Máquinas de Vetores de Suporte

Máquinas de Vetores de Suporte

2. Redes Neurais Artificiais

INF 1771 Inteligência Artificial

Modelagem para previsão/estimação: uma aplicação Neuro-Fuzzy

Support Vector Machines

Redes Neurais (Inteligência Artificial)

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos

Máquinas de suporte vetorial e sua aplicação na detecção de spam

Aprendizado de Máquina. Combinando Classificadores

RECONHECIMENTO DE PADRÕES DE ESPÉCIES DE MORCEGOS DO SUL DA BAHIA UTILIZANDO CLUSTERIZAÇÃO FUZZY

INF 1771 Inteligência Artificial

Adriana da Costa F. Chaves. Máquina de Vetor Suporte (SVM) para Classificação Binária 2

Classificadores Lineares

Diego Martin Mancini Orientador: Prof. Paulo A. V. de Miranda Instituto de Matemática e Estatística Universidade de São Paulo

Aprendizagem de Máquina

Thiago Zavaschi Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade

RECONHECIMENTO DE GÊNERO ATRAVÉS DA VOZ

Aprendizagem de Máquina

Classificação de arritmias em sinais ECG

Minicurso: Inteligência Artificial Aplicada a Sistemas Elétricos

O Algoritmo de Treinamento: Máquina de Aprendizado Extremo (Extreme Learning Machine - ELM)

Determinação de vícios refrativos oculares utilizando Support Vector Machines

detecção de voz cantada em sinais de áudio polifônicos

Fundamentos de Mineração de Dados

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:

Uma Introdução a SVM Support Vector Machines. Obs: Baseada nos slides de Martin Law

Aplicação de Histograma de Gradientes Orientados para detecção de hidrômetros em imagens de fundo complexo

PREVISÃO EM SÉRIES TEMPORAIS COMBINANDO MODELOS ESTATÍSTICOS E CONCEITOS FUZZY

7 Extração de Dados Quantitativos

3 Identificação de Locutor Usando Técnicas de Múltiplos Classificadores em Sub-bandas Com Pesos Não-Uniformes

IMPLEMENTAÇÃO DO FREx_SVM: MÁQUINAS DE VETOR SUPORTE PARA CLASSIFICAÇÃO EM MÚLTIPLAS CLASSES

SEMINÁRIO DOS ARTIGOS:

Objetivos. 1. O método desenvolvido usa características de pares de pixeis para fazer estatísticas e formar

Teoria do aprendizado

Considerações de Desempenho

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Classificação Hierárquica Multirrótulo Utilizando Redes Neurais Artificiais

Um Tutorial em processamento de sinais para EEG

DIVERSIDADE DA QUIROPTEROFAUNA (MAMMALIA, CHIROPTERA), NO BOSQUE MUNICIPAL PARQUE DAS AVES, APUCARANA-PARANÁ MARCHI. E. C. 1 ; TOZZO, R. A.

ÀS QUARTAS, NA APA MORCEGOS: INFINDÁVEL DIVERSIDADE ECOLÓGICA

Back Propagation. Dicas para o BP

Máquinas de Vetores de Suporte Aplicadas à Classificação de Defeitos em Couro Bovino

7 Resultados e Discussão

Time Series Trend Detection and Forecasting Using Complex Network Topology Analysis

Exame de Aprendizagem Automática

DETERMINAÇÃO DE FUNÇÕES DE TRANSFERÊNCIA DE PROCESSOS QUÍMICOS ATRAVÉS DO MÉTODO DE EVOLUÇÃO DIFERENCIAL UTILIZANDO O SCILAB

Caracterização Automática dos Agentes Causadores de Lesões em Folíolos de Cultivares do Brasil. Suellen Silva de Almeida David Menotti

Tópicos Especiais em Reconhecimento de Padrões [2COP329] Mestrado em Ciência da. Sylvio Barbon Jr

5 ESTUDO DE CASOS 5.1 CATEGORIZAÇÃO

Reconhecimento de Padrões de Falhas Tipo Fenda em Chapa de Alumínio Utilizando Clusterização Fuzzy

Identificação de Navios em Sinais de Sonar Passivo por Curvas Principais

DESENVOLVIMENTO DE TÉCNICA DE INTELIGENCIA ARTIFICIAL BASEADA EM REDE NEURAL FUZZY-CMAC PARA APLICAÇÃO EM CONTROLE DE MÁQUINAS DE PRODUÇÃO

Identificação automatizada de morcegos através de modelos estatísticos

Máquina de Vetores Suporte

PCC146 RECONHECIMENTO DE PADRÕES Trabalho Pacial

Reconhecimento Ótico de Caracteres em Placas Veiculares

SISTEMAS NEURO-FUZZY NEURAL-FUZZY SYSTEMS

Descritores de Imagens

HP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.

Caracterização de Imagens via Redes Neurais Artificiais

Aprendizado de Máquinas. Classificadores Lineares

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

10º Congresso Interinstitucional de Iniciação Científica CIIC a 04 de agosto de 2016 Campinas, São Paulo ISBN

5 Estudo de Caso e Resultados

Implementação dos Algoritmos e Resultados

Extração de características utilizando filtros de Gabor aplicado a identificação de defeitos no couro bovino

Descoberta de conhecimento em redes sociais e bases de dados públicas

EN3604 FILTRAGEM ADAPTATIVA

Capa Evento Congresso Programação Exposição Patrocínio Títulos Autores Código

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional

Otimização Combinatória - Parte 4

3 Aprendizado por reforço

Tecnologias Computacionais Aplicadas À Análise De Sinais De Voz

Fundamentos de Entropia Máxima para Aplicação na Modelagem de Distribuição Geográfica de Espécies

p TPP = (6.1) e a rajada de perda de pacote é medida pela Comprimento Médio da Rajada (CMR ) que é dada por

Algoritmo Array Rápido para Filtragem de Sistemas Lineares Sujeitos a Saltos Markovianos com Variação Estruturada dos Parâmetros no Tempo

T4 Processamento de Imagem

TÍTULO: IDENTIFICAÇÃO DE CARACTERES APRESENTADOS A UMA CÂMERA POR MEIO DO MOVIMENTO DOS DEDOS DA MÃO DE UM SER HUMANO

5 Experimentos Conjunto de Dados

3 Técnicas de Previsão de Séries Temporais 3.1. Introdução

FERRAMENTAS ESTATÍSTICAS PARA ANÁLISE DA CLASSIFICAÇÃO

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução

5 Estudo de Casos. Tabela 5 - Características dos Banco de Dados

PROCESSAMENTO DE TEXTO

CC-226 Introdução à Análise de Padrões

Processamento de Som com Escala de Mel para Reconhecimento de Voz

Pós-Graduação em Engenharia de Automação Industrial SISTEMAS INTELIGENTES PARA AUTOMAÇÃO

Combinando Mineração de Textos e Análise de Redes Sociais para a Identificação das Áreas de Atuação de Pesquisadores

PROGRAMA DE ENSINO. Teoria da Estimação II CAR Área de Concentração AQUISIÇÃO, ANÁLISE E REPRESENTAÇÃO DE INFORMAÇÕES ESPACIAIS

Espectro Sonoro Explorado com Sistema de Funções Iterativas

Regressão Local (LOESS)

4 Construção dos Classificadores

Redes Neurais. A Rede RBF. Redes RBF: Função de Base Radial. Prof. Paulo Martins Engel. Regressão não paramétrica. Redes RBF: Radial-Basis Functions

AVALIAÇÃO DA ESTIMATIVA DE PARÂMETROS PARA MODELOS AR2D APLICADOS NA EXTRAÇÃO DE ATRIBUTOS DE TEXTURA EM IMAGENS DE SENSORIAMENTO REMOTO

Sistema de Inferência Fuzzy baseado em Redes Adaptativas (ANFIS) Sistema de Inferência Fuzzy

6. Aplicação à Séries de Velocidade do Vento

Transcrição:

IDENTIFICAÇÃO AUTOMÁTICA DE ESPÉCIES DE MORCEGOS INSETÍVOROS DA MATA ATLÂNTICA ATRAVÉS DO SINAL DE ECOLOCALIZAÇÃO UTILIZANDO SISTEMA ESPECIALISTA FUZZY E MÁQUINAS DE VETOR DE SUPORTE Pedro Henrique Silva Coutinho, Allan Cavalcante Araújo, Filipe Hamdan S. Souto, Thiago Pereira das Chagas, Marcelo Alvinho S. D. Ganem, Fábio C. Falcão Emails: Departamento de Ciências Exatas e Tecnológicas Universidade Estadual de Santa Cruz Ilhéus, Bahia, Brasil TETRAPODA Consultoria Ambiental Ilhéus, Bahia, Brasil coutinho.p92@gmail.com, allancavalcante@gmail.com, filipehamdan@gmail.com, tpchagas@uesc.br, marcelo.sanjuan@hotmail.com, falcaobio@hotmail.com Abstract This work presents a methodology for identification of bat species of Atlantic Forest. The methodology consists in to extract features of the spectrogram of echolocation signal of the bat and use fuzzy expert system and support vector machines to identify the species. The advantage of use fuzzy systems to classification is the membership degree information, which provides robustness to analysis of real data. We extracted 36 features and 14 were selected through statistical analysis to compose the dataset. The obtained results of five species of Neotropical bats compare the fuzzy expert system with support vector machines and both methods provided more than 93% of mean accuracy. Keywords Feature extraction, Identification of species, Fuzzy expert system, Support vector machines. Resumo Este trabalho apresenta uma metodologia para identificação de espécies de morcegos da Mata Atlântica. A metodologia consiste em extrair características do espectrograma do sinal de ecolocalização do morcego e utilizar sistema especialista fuzzy e máquinas de vetor de suporte para realizar a identificação das espécies. A vantagem de se utilizar um sistema fuzzy para a classificação é a informação dos graus de pertinência, que torna o método mais robusto à análise de dados reais. Foram extraídas 36 características do espectrograma e, a partir de análise estatística, foram selecionadas 14 para compor o conjunto de dados. Os resultados obtidos de cinco espécies de morcegos Neotropicais comparam o sistema especialista fuzzy com máquinas de vetor de suporte e ambos os métodos apresentaram taxas de acerto médias maiores que 93%. Palavras-chave de vetor de suporte. Extração de características, Identificação de espécies, Sistema especialista fuzzy, Máquinas 1 Introdução Os morcegos frequentemente formam o grupo mais rico e troficamente distinto de mamíferos presentes nas regiões tropical e subtropical (Patterson et al., 2003), com mais de 1.200 espécies descritas pelo mundo, e pelo menos 174 espécies no Brasil (Paglia et al., 2012). São considerados organismos vitais para o funcionamento de muitos ecossistemas e desempenham ainda serviços ecossistêmicos de interesse econômico direto para o homem, como controle de pragas naturais, polinização e dispersão de sementes (Fleming, 1988; Patterson et al., 2003; Lobova & Mori, 2004). Por este motivo, estudos têm buscado métodos para monitorar as populações desses animais (Zamora- Gutierrez et al., 2016). A grande maioria dos morcegos utilizam sinais de ecolocalização como forma de predatismo e orientação espacial (Russo & Voigt, 2016). No caso das espécies insetívoras da região Neotropical, as ondas sonoras emitidas possuem um amplo espectro de frequências, com espécies que emitem pulsos em torno de 10kHz até outras que podem chegar a 210kHz (Falcão et al., 2015). A emissão dos chamados mais característicos dos morcegos ocorre geralmente na fase de busca, sendo esses, portanto, aqueles que devem ser utilizados para identificação das espécies (Farias, 2012). O processo de identificação de espécies a partir do sinal de ecolocalização pode ser manual ou automático. O primeiro caracteriza-se por uma análise que demanda muito tempo, além de exigir fortes habilidades de identificação por parte do pesquisador (Russo & Voigt, 2016). Classificadores automáticos apresentam-se como solução para esses problemas. Diferentes métodos de classificação passaram a ser empregados para identificação automática de espécies de morcegos, como análise de função discriminante (Russo & Jones, 2002), máquinas de vetor de suporte (SVM - Support Vector Machines) e ensembles de redes neurais (Redgwell et al., 2009), modelo de mistura de gaussianas (Henríquez et al., 2014) e inferência Bayesiana aproximada com o algoritmo expectationpropagation (Stathopoulos et al., 2017). As principais contribuições deste trabalho são ISSN 2175 8905 1868

a metodologia de extração de características de espectrogramas de sinais de ecolocalização de morcegos da Mata Atlântica e a proposição de um sistema especialista fuzzy para classificação. Os resultados obtidos com o sistema especialista são comparados, em termos de eficiência da classificação, com resultados obtidos utilizando SVM. A Seção 2 deste artigo apresenta a metodologia empregada para extração das características a partir dos espectrogramas. Na Seção 3 é apresentado o processo de seleção das características e construção do conjunto de dados utilizado. Na Seção 4 são apresentados os métodos de classificação empregados neste trabalho: sistema especialista fuzzy e SVM. Na Seção 5 são apresentados os resultados obtidos com a comparação entre os métodos de classificação utilizados. Na Seção 6 são apresentadas as conclusões. 2.2 Geração do espectrograma Os espectrogramas são gerados aplicando-se a Transformada de Fourier de Tempo Curto (STFT - Short-Time Fourier Transform), utilizando FFT de 1024 pontos, janela Hamming de 512 pontos e sobreposição de 7% do tamanho da janela. Esta última variável e o tamanho da janela determinam a resolução do tempo. Como alternativa para o efeito conhecido por clipping, onde a intensidade do sinal emitido é superior à intensidade máxima suportada pelo gravador, realiza-se uma filtragem nas regiões de 0.1 segundos em torno do ponto com tal intensidade identificada. A Figura 2(a) apresenta um sinal contendo três pulsos após a filtragem do clipping. Valores inferiores a 13 db da Densidade Espectral de Potência (DEP) máxima foram mais uma vez filtrados. O resultado dessa filtragem está apresentado na Figura 2(b). 2 Extração de características A extração das características dos sinais de ecolocalização é dividida em três partes: Préprocessamento, Geração do espectrograma e Obtenção de características. 2.1 Pré-processamento Primeiro, divide-se os arquivos de áudio em intervalos de 3 segundos e eliminar valores de frequência abaixo de 8kHz e acima de 120kHz, abrangendo a maior parte das espécies insetívoras encontradas na Mata Atlântica (Farias, 2012). Segundo, aplica-se o método de ajuste ponderado por spline cúbica de mínimos quadrados (De Boor, 1978) com um passo de 500 pontos no gráfico da Transformada Rápida de Fourier (FFT - Fast Foureir Transform) do sinal para suavizar a curva. Na spline obtém-se a frequência de máxima intensidade e as frequências nos limites inferior e superior onde o sinal é 17dB abaixo da máxima intensidade. A Figura 1 apresenta o gráfico da FFT do sinal de ecolocalização de uma espécie de morcego com spline e as frequências de interesse. (a) Sinal contendo três pulsos (b) Sinal filtrado com ampliação em um pulso Figura 2: Espectrograma da espécie Molossus molossus. 2.3 Obtenção automática de características Do espectrograma retiram-se os pontos com maior intensidade, sendo escolhido apenas um por cada resolução de tempo. Desta forma, analisa-se apenas a parte de maior DEP. A Figura 3 apresenta os pontos extraídos do espectrograma considerando as relações frequência-tempo e DEP-tempo. Destes são selecionadas características para análise, como duração do pulso, frequências máxima, média e mínima, tempo e frequência de maior DEP. 3 Geração do conjunto de dados Figura 1: FFT do sinal de ecolocalização de uma espécie de morcego. Foram selecionados 100 intervalos de 3 segundos de chamados que se enquadravam nos modelos encontrados na literaturas de 5 espécies da Mata Atlântica: Eptesicus furinalis (EPTFUR), 1869

(a) Frequência em relação ao tempo. (b) DEP em relação ao tempo. Figura 3: Pontos extraídos do espectrograma. Eumops glaucinus (EUMGLA), Molossus rufus (MOLRUF), Myotis nigricans (MYONIG) e Peropteryx kappleri (PERKAP) (Farias, 2012). Seguindo a metodologia da Seção 2, foram extraídas 36 características do espectrograma de cada um dos 500 chamados. Avaliou-se quais características eram representativas para cada espécie utilizando o Coeficiente de Variação (CV). Ao final do processo foram escolhidas 14 características com menor CV para o conjunto de espécies. 4 Identificação das espécies Esta seção apresenta os métodos de classificação utilizados neste trabalho para identificação das espécies de morcegos. 4.1 Sistema especialista fuzzy Sistemas especialistas fuzzy (SEF) são algoritmos que buscam imitar o raciocínio e o conhecimento de um especialista e disponibilizá-los para não especialistas (Siler & Buckley, 2005). Um SEF requer conhecimento prévio acerca do problema a ser analisado. Neste trabalho, esse conhecimento prévio é representado pela média e desvio padrão dos valores das características de cada espécie a ser reconhecida. Aqui, as entradas do sistema especialista são as características do conjunto de dados. O universo de discurso para cada entrada é determinado pelos valores de máximo e mínimo da característica e o intervalo entre estes é igualmente subdividido em 11 funções de pertinência, 9 triangulares e 2 trapezoidais nas extremidades. As regras de inferência são estruturadas da forma padrão da lógica fuzzy (Gomide & Gudwin, 1994). Todas as permutações entre as funções de pertinência de cada entrada são utilizadas e todas as regras têm peso unitário. As saídas do sistema especialista também são as características do conjunto de dados. Para cada saída são criadas funções de pertinência triangulares representando cada padrão. Estas funções de pertinência são centralizadas no valor médio e sua base tem comprimento igual a diferença entre o valor máximo e mínimo da característica para cada padrão. Após a avaliação da lógica fuzzy utilizou-se o método da média dos máximos para defuzzificação (Gomide & Gudwin, 1994). Neste trabalho o valor defuzzificado para cada saída é reaplicado na mesma saída gerando um valor de pertinência µ [0, 1] para cada padrão. A partir disso, é feita uma média de todas as pertinências obtidas para cada padrão nas diferentes características disponíveis. Esses valores permitem ordenar as pertinências de uma determinada amostra a cada padrão de maneira decrescente, possibilitando a posterior interpretação dos resultados. 4.2 Máquinas de vetor de suporte As máquinas de vetor de suporte (SVM - Support Vector Machines) são uma técnica de classificação de padrões baseadas na teoria de aprendizado estatístico de Vapnik (Lorena & de Carvalho, 2007). Para classificação de dados multidimensionais, a SVM utiliza hiperplanos ótimos para dividir as classes pertencentes ao conjunto de dados. O método busca maximizar a distância entre os hiperplanos e as classes. Neste trabalho foi utilizada a SVM com margens suaves, já que em dados reais podem existir ruídos e outliers (Lorena & de Carvalho, 2007). A SVM com margens suaves obtém os hiperplanos ótimos considerando o seguinte problema de otimização (Chang & Lin, 2011): 1 min {w,b,ξ} 2 w w + C ξ i (1) i=1 sujeito a y i (w T φ(x i ) + b) 1 ξ i, ξ i 0, i = 1,..., n, onde w R p é o vetor normal ao hiperplano descrito, b/ w, b R, é a distância do hiperplano à origem (Lorena & de Carvalho, 2007), φ(x i ) é uma função que mapeia x i R p para um espaço de dimensão superior, C > 0 é denominado parâmetro de regularização (Chang & Lin, 2011), y i { 1, 1} e ξ i é a i-ésima variável de folga, que pode ser vista como um erro de decisão devido à presença de dados entre as margens (Chou et al., 2008; Lorena & de Carvalho, 2007). Este é um problema de otimização quadrática sujeito à restrições lineares que pode 1870

ser resolvido introduzindo multiplicadores de Lagrange α = [α 1,..., α n ] e tornando as suas derivadas parciais nulas. Fazendo isso, tem-se o seguinte problema dual (Chou et al., 2008; Lorena & de Carvalho, 2007): max α i 1 2 i=1 i=1 j=1 α i α j y i y j k(x i, x j ) (2) sujeito a 0 α i C, i = 1,..., n e α i y i = 0, i=1 onde k(x i, x j ) = φ(x i ) φ(x j ) é denominada função kernel. Os kernels mapeiam os dados para espaços de características de dimensões maiores em que haja probabilidade de separação por hiperplanos (Lorena & de Carvalho, 2007). A escolha da função kernel afeta diretamente na capacidade de predição e na eficiência do algoritmo (Liu & Jiang, 2008). 5 Resultados A fim de explorar a estatística dos dados, foram gerados aleatoriamente, a partir do conjunto de dados original, 100 diferentes conjuntos de treinamento e de teste. Cada conjunto de treinamento é constituído por 70% das amostras e o de teste por 30%. Para comparar os resultados obtidos com o SEF e a SVM foram utilizadas matrizes de confusão e a taxa de acertos. Na matriz de confusão utilizada neste trabalho, as linhas representam as classes reais dos padrões e as colunas as classes preditas pelo classificador. Desta forma, os elementos da diagonal principal representam os padrões classificados corretamente. Ambos os métodos de classificação foram aplicados no software Scilab R. Para aplicação do SEF foi utilizado o pacote Fuzzy Toolbox 0.4.6.0. O algoritmo do SEF gera as entradas, saídas e regras de forma automática. Para a SVM foi utilizado o pacote LIBSVM 1.4.5 (Chang & Lin, 2011) com parâmetro de regularização C = 1. Foram testados os kernels linear, polinomiais de ordem 2 e 3 e sigmoidal. Os melhores resultados foram obtidos utilizando kernel linear, em que k(x i, x j ) = x i x j. O SEF empregado neste trabalho apresentou limitações na sua aplicação quanto ao número de características do conjunto de dados, devido ao grande número de regras geradas na etapa de treinamento. Foi necessário avaliar a relação entre a quantidade de funções de pertinência por entrada e a quantidade de entradas. A sua aplicação se limitou, portanto, ao uso de 6 características. Desta forma, inicialmente serão apresentados os resultados das aplicações dos métodos de classificação utilizados neste trabalho considerando 6 características com menor coeficiente de variação. 5.1 Identificação utilizando 6 características Para o SEF, em cada uma das 100 classificações realizadas foi gerado um modelo fuzzy de cada espécie a partir das 70 amostras do conjunto de treinamento. As matrizes de confusão mostradas na Tabela 1 apresentam a informação da média e desvio padrão das 100 classificações obtidas na etapa de treinamento utilizando os diferentes métodos de classificação empregados. O objetivo desta análise é validar os diferentes modelos obtidos. Tabela 1: Matrizes de confusão médias para etapa de treinamento dos sistemas de classificação aplicados aos dados com 6 características. Sistema especialista fuzzy EPTFUR 70±0 0±0 0±0 0±0 0± 0 EUMGLA 0±0 70±0 0±0 0±0 0±0 MOLRUF 0±0 6.2±1.09 51.8±1.64 0±0 12±1.58 MYONIG 3.8±0.84 0±0 0±0 66.2±0.84 0±0 PERKAP 0.6±0.55 0±0 0±0 0±0 69.4±0.55 Taxa de acertos = (93.97±0.64)% SVM Linear EPTFUR 70±0 0±0 0±0 0±0 0± 0 EUMGLA 0±0 69.41±0.83 0.59±0.83 0±0 0±0 MOLRUF 0±0 1.17±1.50 65.39±1.99 0±0 3.44±1.35 MYONIG 0±0 0±0 0±0 70±0 0±0 PERKAP 0±0 0±0 2.59±2.07 0±0 67.41±2.07 Taxa de acertos = (97.77±0.91)% Na etapa de treinamento o SEF obteve taxa de acertos média de 93.97% e a SVM de 97.77%. Em ambos os casos, os erros de classificação na classe MOLRUF ocorreram nas classes EUMGLA e PERKAP. As matrizes de confusão referentes à etapa de teste estão apresentadas na Tabela 2. Neste caso, o SEF também apresentou menor taxa de acertos média, mas classificou corretamente mais padrões das classes EPTFUR, EUMGLA e PERKAP do que a SVM. Novamente, para ambos os métodos, a maior quantidade de erros ocorreram na classe MOLRUF, com padrões classificados nas classes EUMGLA e PERKAP. A Tabela 3 apresenta os valores dos graus de pertinência percentuais nos casos em que o SEF classifica os padrões corretamente e incorretamente. Mesmo que o SEF tenha apresentado menor taxa de acertos média, a classificação por graus de pertinência pode ser utilizada pelo pesquisador na área de morcegos como uma ferramenta para decisão no processo de identificação das espécies. Quando o SEF classifica os padrões corretamente, os graus de pertinência médios às classes corretas são elevados, chegando aos 97.00% para a classe EPTFUR. Este resultado pode ser utilizado para indicar ao especialista possíveis erros de classificação do SEF para as espécies MOLRUF, MYONIG 1871

Tabela 2: Matrizes de confusão médias para etapa de teste dos sistemas de classificação aplicados aos dados com 6 características. Sistema especialista fuzzy EPTFUR 30±0 0±0 0±0 0±0 0± 0 EUMGLA 0±0 29.6±0.55 0.4±0.55 0±0 0±0 MOLRUF 0±0 0.6±0.55 27.6±0.89 0±0 1.8±0.84 MYONIG 1.2±0.84 0±0 0±0 28.8±0.84 0±0 PERKAP 0.4±0.55 0±0 2.8±1.64 0±0 26.8±1.30 Taxa de acertos = (94.58±1.67)% SVM Linear EPTFUR 29.74±0.44 0±0 0±0 0.26±0.44 0± 0 EUMGLA 0±0 29.01±1.05 0.99±1.05 0±0 0±0 MOLRUF 0±0 1.24±0.93 26.84±1.84 0±0 1.92±1.54 MYONIG 0±0 0±0 0±0 30±0 0±0 PERKAP 0±0 0±0 1.95±1.67 0±0 28.05±1.67 Taxa de acertos = (95.76±1.40)% Tabela 3: Graus de pertinência quando o SEF classifica os padrões corretamente e incorretamente. Pertinência (%) no caso de classificação correta. EPTFUR 97.00±0.8 0±0 0±0 2.42±2.22 0±0 EUMGLA 0.28±0.63 81.95±0.91 16.95±4.59 0.01±0.02 0±0 MOLRUF 0.28±0.63 18.98±2.18 76.89±4.35 0.01±0.02 0±0.09 MYONIG 5.87±5.77 4.22±1.32 0.93±0.53 93.36±1.22 0±0 PERKAP 0.39±0.65 4.22±1.32 1.21±0.85 3.11±1.86 88.76±2.52 Pertinência (%) no caso de classificação incorreta. EPTFUR 0±0 0±0 0±0 0±0 0±0 EUMGLA 0±0 1.95±4.36 19.75±44.15 0±0 0±0 MOLRUF 0±0 31.79±5.29 10.60±1.68 0±0 58.61±5.79 MYONIG 14.42±3.35 18.70±7.59 6.66±1.95 0±0 31.53±14.58 PERKAP 2.10±1.93 11.16±7.50 39.45±22.57 0±0 16.40±11.59 e PERKAP. Para o pior caso, o MOLRUF, classificações corretas levam a médias de pertinência máxima de 76.89% e em caso de erro este valor é de 58.61% ou 31.79%. Pode-se facilmente utilizar média e desvio padrão para indicar uma pertinência abaixo da qual o especialista deverá reavaliar a classificação. 5.2 Identificação utilizando 14 características Aqui, a SVM foi utilizada para classificação dos conjuntos de dados de treino e teste considerando as 14 características. O objetivo desta análise é avaliar a influência da inserção de novas características na eficiência da identificação das espécies de morcegos consideradas neste trabalho. A Tabela 4 apresenta as matrizes de confusão médias obtidas nas etapas de treino e teste da SVM. Na etapa de treino, verifica-se que em relação aos resultados obtidos com o SEF e a SVM considerando 6 características, o número médio de padrões da classe MOLRUF classificados corretamente aumentou e o desvio padrão diminuiu, assim como os erros médios e desvio padrão das classificações nas classes EUMGLA e PERKAP diminuíram. Além disso, a taxa de acertos média também foi maior, de 98.30%, que as obtidas com os métodos aplicados no caso anterior. Tabela 4: Matrizes de confusão médias para etapas de treinamento e teste da SVM aplicada aos dados com 14 características. SVM Linear - Treino EPTFUR 70±0 0±0 0±0 0±0 0± 0 EUMGLA 0±0 69.2±1.23 0.79±1.23 0±0 0±0 MOLRUF 0±0 0.52±0.89 66.7±1.88 0±0 2.75±1.59 MYONIG 0±0 0±0 0±0 70±0 0±0 PERKAP 0±0 0±0 1.85±1.38 0±0 68.2±1.38 Taxa de acertos = (98.30±0.95)% SVM Linear - Teste EPTFUR 30±0 0±0 0±0 0±0 0± 0 EUMGLA 0±0 28.8±1.16 1.19±1.16 0±0 0±0 MOLRUF 0±0 1.11±1.0 26.9±1.67 0±0 2.02±1.31 MYONIG 0±0 0±0 0±0 30±0 0±0 PERKAP 0±0 0±0 2.1±1.67 0±0 27.9±1.67 Taxa de acertos = (95.80±1.62)% Na etapa de teste, a taxa de acertos média obtida foi similar às obtidas pelos métodos empregados considerando 6 características. No entanto, o uso de um número maior de características pode aumentar a capacidade de generalização dos métodos de classificação, evitando a ocorrência de super-ajuste (overfitting) e/ou sub-ajuste (underfitting) (Lorena & de Carvalho, 2007). 6 Conclusões O sistema especilista fuzzy proposto neste trabalho apresentou limitações relacionadas ao custo computacional para realizar a classificação dos dados considerando mais de 6 características e 11 funções de pertinência. Foi verificado que o número de funções de pertinência por entrada é mais significativo para acertos do que o número de entradas. A sua aplicação, portanto, foi limitada a esse número. Os resultados obtidos com o SEF considerando 6 características foram comparados com a aplicação de SVM com kernel linear. Ambos os métodos apresentaram altas eficiências de classificação, com taxa de acertos média de mais de 93%, tanto na etapa de treinamento, quanto na etapa de teste. Além disso, foram realizados testes considerando as 14 características selecionadas para constituição do conjunto de dados utilizando SVM linear. Neste caso, os resultados da etapa de treino indicaram que o aumento do número de características contribui para aumento da eficiência de classificação de morcegos da espécie Molossus rufus. Contudo, mais que dobrar a quantidade de características teve uma melhora de apenas 0.04% na etapa de teste. 1872

Os resultados deste trabalho contribuem para estudos na área de monitoramento de espécies de morcegos presentes na região considerada. Isto se deve à carência de estudos mais aprofundados no âmbito de identificação desses animais, tanto em modelo quanto em métodos automáticos de classificação. Trabalhos futuros incluem alterações no algoritmo do SEF de modo a possibilitar a aplicação de um número maior de características, inserção de novas espécies de morcegos ao conjunto de dados, aplicação de métodos de seleção de características para identificar o melhor subconjunto de características dentre as 36 obtidas que melhor representem as espécies de morcegos e utilização de diferentes métodos de defuzzificação para o sistema especialista fuzzy proposto neste trabalho. Referências Chang, C.-C. & Lin, C.-J. (2011). Libsvm: a library for support vector machines, ACM Transactions on Intelligent Systems and Technology (TIST) 2(3): 27. Chou, F.-Y., Yang, C.-Y. & Yang, J.-S. (2008). Support vector machine based artificial potential field for autonomous guided vehicle, Fourth International Symposium on Precision Mechanical Measurements, International Society for Optics and Photonics, pp. 71304J 71304J. De Boor, C. (1978). A practical guide to splines, Vol. 27, Springer-Verlag New York. Falcão, F., Ugarte-Núñez, J. A., Faria, D. & Caselli, C. B. (2015). Unravelling the calls of discrete hunters: acoustic structure of echolocation calls of furipterid bats (chiroptera, furipteridae), Bioacoustics 24(2): 175 183. Farias, H. (2012). Monitoramento e identificação acústica de espécies de morcegos da mata atlântica por sinais de ecolocalização: Contribuições ecológicas e potencial para conservação. Fleming, T. H. (1988). The short-tailed fruit bat: a study in plant-animal interactions, University of Chicago Press. Gomide, F. A. C. & Gudwin, R. R. (1994). Modelagem, controle, sistemas e lógica fuzzy, SBA Controle & Automação 4(3): 97 115. Henríquez, A., Alonso, J. B., Travieso, C. M., Rodríguez-Herrera, B., Bolaños, F., Alpízar, P., López-de Ipina, K. & Henríquez, P. (2014). An automatic acoustic bat identification system based on the audible spectrum, Expert Systems with Applications 41(11): 5451 5465. Liu, S. & Jiang, N. (2008). Svm parameters optimization algorithm and its application, Mechatronics and Automation, 2008. ICMA 2008. IEEE International Conference on, IEEE, pp. 509 513. Lobova, T. A. & Mori, S. A. (2004). Epizoochorous dispersal by bats in french guiana, Journal of tropical ecology 20(05): 581 582. Lorena, A. C. & de Carvalho, A. C. (2007). Uma introdução às support vector machines, Revista de Informática Teórica e Aplicada 14(2): 43 67. Paglia, A. P., da Fonseca, G. A., Rylands, A. B., Herrmann, G., Aguiar, L. M., Chiarello, A. G., Leite, Y. L., Costa, L. P., Siciliano, S., Kierulff, M. C. M. et al. (2012). Lista anotada dos mamíferos do brasil 2 a edição annotated checklist of brazilian mammals, Occasional papers in conservation biology 6: 76. Patterson, B. D., Willig, M. R. & Stevens, R. D. (2003). Trophic strategies, niche partitioning, and patterns of ecological organization, Bat ecology 9: 536 57. Redgwell, R. D., Szewczak, J. M., Jones, G. & Parsons, S. (2009). Classification of echolocation calls from 14 species of bat by support vector machines and ensembles of neural networks, Algorithms 2(3): 907 924. Russo, D. & Jones, G. (2002). Identification of twenty-two bat species (mammalia: Chiroptera) from italy by analysis of time-expanded recordings of echolocation calls, Journal of Zoology 258(1): 91 103. Russo, D. & Voigt, C. C. (2016). The use of automated identification of bat echolocation calls in acoustic monitoring: A cautionary note for a sound analysis, Ecological Indicators 66: 598 602. Siler, W. & Buckley, J. J. (2005). Fuzzy expert systems and fuzzy reasoning, John Wiley & Sons. Stathopoulos, V., Zamora-Gutierrez, V., Jones, K. E. & Girolami, M. (2017). Bat echolocation call identification for biodiversity monitoring: a probabilistic approach, Journal of the Royal Statistical Society: Series C (Applied Statistics). Zamora-Gutierrez, V., Lopez-Gonzalez, C., MacSwiney Gonzalez, M. C., Fenton, B., Jones, G., Kalko, E. K., Puechmaille, S. J., Stathopoulos, V. & Jones, K. E. (2016). Acoustic identification of mexican bats based on taxonomic and ecological constraints on call design, Methods in Ecology and Evolution 7(9): 1082 1091. 1873