UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA DEPARTAMENTO DE ENGENHARIA ELÉTRICA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

Documentos relacionados

IW10. Rev.: 02. Especificações Técnicas

Ao longo do presente capítulo será apresentada uma descrição introdutória da tecnologia FPGA e dos módulos básicos que a constitui.

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Complemento II Noções Introdutória em Redes Neurais

EXERCÍCIOS RESOLVIDOS

Instituto Educacional São João da Escócia Colégio Pelicano Curso Técnico de Eletrônica. FET - Transistor de Efeito de Campo

Tutorial de Eletrônica Aplicações com 555 v

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto

Universidade Federal de Ouro Preto Escola de Minas Departamento de Engenharia de Controle e Automação. Ronilson Rocha

Coerência temporal: Uma característica importante

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital 1. Mapeamento não-linear. Unidade de Aprendizagem Radiológica

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

Engenheiro de Telecomunicações pelo Instituto de Estudos Superiores da Amazônia IESAM (Belém, Pará).

Capacidade = 512 x 300 x x 2 x 5 = ,72 GB

Codificação/Compressão de Vídeo. Tópico: Vídeo (Codificação + Compressão)

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

ACIONAMENTOS ELETRÔNICOS (INVERSOR DE FREQUÊNCIA)

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação

Video Lecture RF. Laps

Introdução 5. Amplificação com FET 6. Polarização do FET 6 Polarização do terminal dreno 7 Polarização do terminal porta 7

Teoria Princípio do Capacitor

Do neurônio biológico ao neurônio das redes neurais artificiais

Forneça a próxima onda de inovações empresariais com o Open Network Environment

Analisador de Espectros

Aula 2 Aquisição de Imagens

Márcio Leandro Moraes Rodrigues. Frame Relay

4 Arquitetura básica de um analisador de elementos de redes

Introdução a computação móvel. Middlewares para Rede de Sensores sem Fio. Uma avaliação na ótica de Adaptação ao Contexto

Introdução ao Projeto de Aeronaves. Aula 39 Relatório de Projeto Técnicas de Estruturação

MODULAÇÃO AM E DEMODULADOR DE ENVELOPE

Universidade Federal do Rio de Janeiro - IM/DCC & NCE

Instalações Máquinas Equipamentos Pessoal de produção

ARQUITETURA DE COMPUTADORES

Título: Controle de um sistema Bola- Barra com realimentação através de imagem

Aplicações com OpAmp. 1) Amplificadores básicos. Amplificador Inversor

CONTROLE DIGITAL DE VOLUME

Demonstração da técnica de detecção sensível à fase: uma aplicação óptica. Davi R. Ortega, Túlio C. Rizuti da Rocha Orientador: Flávio Caldas da Cruz

Filtragem. pixel. perfil de linha. Coluna de pixels. Imagem. Linha. Primeiro pixel na linha

IFBA MOSFET. CELET Coordenação do Curso Técnico em Eletrônica Professor: Edvaldo Moraes Ruas, EE. Vitória da Conquista

Modos de Propagação. Tecnologia em Redes de Computadores 5º Período Disciplina: Sistemas e Redes Ópticas Prof. Maria de Fátima F.

Análise Univariada de Sinais Mioelétricos

3 Arquitetura do Sistema

DEPARTAMENTO DE MATEMÁTICA E CIÊNCIAS EXPERIMENTAIS - Grupo 550 INFORMÁTICA Planificação Anual /Critérios de avaliação

Luz, olho humano e óculos Capítulo 12 (pág. 219)

Modelo Cascata ou Clássico

7.Conclusão e Trabalhos Futuros

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

1 Introduc ao 1.1 Hist orico

Disciplina Eletrônica de Potência (ENGC48) Tema: Conversores de Corrente Contínua para Corrente Alternada (Inversores)

4 Avaliação Econômica

Prof. Daniel Hasse. Multimídia e Hipermídia

Funções de Posicionamento para Controle de Eixos

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

Conforme explicado em 2.4.3, o sinal de voz x(n) às vezes é alterado com a adição de ruído r(n), resultando num sinal corrompido y(n).

MANUAL DE INSTRUÇÕES EFA72C35-A/00

Multiplexação. Multiplexação. Multiplexação - FDM. Multiplexação - FDM. Multiplexação - FDM. Sistema FDM

Introdução à Computação

Capítulo. Meta deste capítulo Entender o princípio de funcionamento de osciladores a cristal.

29/08/2011. Radiologia Digital. Princípios Físicos da Imagem Digital. Unidade de Aprendizagem Radiológica. Professor Paulo Christakis

2- Conceitos Básicos de Telecomunicações

RECEPTOR AM DSB. Transmissor. Circuito Receptor AM DSB - Profº Vitorino 1

Sinal analógico x sinal digital. Sinal analógico. Exemplos de variações nas grandezas básicas. Grandezas básicas em sinais periódicos

Organização e Arquitetura de Computadores I

SISTEMAS DE COMUNICAÇÃO ÓPTICA : INICIAR A PROPOSTA DA DISSERTAÇÃO DE MESTRADO EM DISCIPLINA OPTATIVA, DURANTE PERÍODO DE AQUISIÇÃO DE CRÉDITOS.

Visão humana. Guillermo Cámara-Chávez

3. Arquitetura Básica do Computador

INSTRUMENTAÇÃO INDUSTRIAL 1. INTRODUÇÃO / DEFINIÇÕES

Roteiro para preparação de proposta de Trabalhos Técnico-Científicos

11 de maio de Análise do uso dos Resultados _ Proposta Técnica

4 Orbitais do Átomo de Hidrogênio

UFGD FCA PROF. OMAR DANIEL BLOCO 4 PROCESSAMENTO DE IMAGENS

Sensores e Atuadores (2)

Eletrônica Analógica

APLICAÇÕES DA DERIVADA

UNIVERSIDADE FEDERAL DE SANTA CATARINA

Módulo FGM721. Controlador P7C - HI Tecnologia

Filtragem Espacial. (Processamento Digital de Imagens) 1 / 41

Instrumentação para Espectroscopia Óptica. CQ122 Química Analítica Instrumental II 2º sem Prof. Claudio Antonio Tonegutti

OBJETIVOS: CARGA HORÁRIA MÍNIMA CRONOGRAMA:

1 Problemas de transmissão

Conceitos Básicos de Telefonia Celular

dv dt Fig.19 Pulso de tensão típico nos terminais do motor

Sistema de Numeração e Conversão entre Sistemas. Prof. Rômulo Calado Pantaleão Camara. Carga Horária: 60h

Redes de Computadores sem Fio

Oficina de Multimédia B. ESEQ 12º i 2009/2010

Pesquisa e organização de informação

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

I D I DSS. Figura 3.1 Curva de transcondutância do MOSFET e definição do ponto Q em polarização zero.

Setores Trilhas. Espaço entre setores Espaço entre trilhas

Potencial de largura de banda de fibras multimodo

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

5 SIMULAÇÃO DE UM SISTEMA WDM DE DOIS CANAIS COM O SOFTWARE VPI

Máquinas Multiníveis

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Informática Aplicada a Radiologia

ULA Sinais de Controle enviados pela UC

CONVERSORES E CONTROLADORES DE FASE. Circuitos de retificação monofásicos

Carreira: definição de papéis e comparação de modelos

Transcrição:

UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA DEPARTAMENTO DE ENGENHARIA ELÉTRICA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA CIRCUITOS ANALÓGICOS EM TECNOLOGIA CMOS PARA IMPLEMENTAÇÃO DE PRÓTESES RETINIANAS Edson Pinto Santana Orientadora: Profª Drª Ana Isabela Araújo Cunha Co-Orientador: Prof. Dr. Raimundo Carlos Silvério Freire SALVADOR 2013

EDSON PINTO SANTANA Circuitos Analógicos em Tecnologia CMOS para Implementação de Próteses Retinianas Tese de Doutorado submetida ao Programa de Pós- Graduação em Engenharia Elétrica da Universidade Federal da Bahia como parte dos requisitos necessários para obtenção do grau de Doutor em Engenharia Elétrica. Ana Isabela Araújo Cunha (Orientadora) Raimundo Carlos Silvério Freire (Co-orientador) Salvador, Bahia, Brasil Maio de 2013

S232 Santana, Edson Pinto Circuitos analógicos em tecnologia CMOS para a implementação de próteses retinianas / Edson Pinto Santana. Salvador, 2013. 97 f. : il. color. Orientador: Profa. Dra. Ana Isabela Araújo Cunha Co-orientador: Raimundo Carlos Silvério Freire Tese (doutorado) Universidade Federal da Bahia. Escola Politécnica, 2013. 1. Visão artificial. 2. Circuitos elétricos. 3. Transmissão sinaptica. 4. Redes neurais (Computação). I. Cunha, Ana Isabela Araújo. II. Universidade Federal da Bahia. III. Título. CCD: 621.382

DEDICATÓRIA Aos meus pais e irmãos, com carinho e gratidão. À minha estimada sobrinha e afilhada Maria Eduarda.

AGRADECIMENTOS Os meus sinceros agradecimentos a todos que direta ou indiretamente auxiliaram no desenvolvimento deste trabalho: aos colegas, professores e funcionários do Laboratório de Concepção de Circuitos Integrados (LCCI-UFBA), do Programa de Pós-Graduação em Engenharia Elétrica (PPGEE-UFBA) e do Departamento de Engenharia Elétrica (DEE- UFBA). À Durval de Almeida Souza (IFBA), pelo apoio em momentos difíceis. À Plínio (SENAI-CIMATEC) e à Ruy (NTS-IFBA), pelo auxílio com a fabricação de placas de circuito impresso. Em especial, gostaria de expressar minha profunda gratidão à Profa. Dra. Ana Isabela Araújo Cunha.

RESUMO Este trabalho representa um estudo no incipiente campo de desenvolvimento de próteses retinianas, apresentando uma proposta de circuito eletrônico em tecnologia CMOS que explora de forma oportuna características arquiteturais para atingir requisitos desejáveis ao sistema. Desenvolveu-se uma nova topologia de circuito para a sinapse aplicada a uma classe de circuitos denominada Rede Neuronal/Não-Linear Celular (Cellular Neural/Nonlinear Network CNN) que possui, entre outras características, o processamento paralelo e programável no plano focal de sinais que representam a informação visual. São avaliados o desempenho individual do bloco de circuito da sinapse e sua aplicação na rede neuronal celular. Para tanto, foi desenvolvida uma rede compacta que explora a modularidade da sinapse proposta ao utilizar o reaproveitamento de blocos de circuito, e na qual são programados diferentes operadores de imagem. Palavras-chave: Próteses Retinianas, Visão Inicial, Sinapse Eletrônica, CNN, Multiplicador Analógico.

ABSTRACT This work consists of a contribution to the emerging domain of electronic retinal prosthesis. We propose an electronic circuit in CMOS technology that properly exploits architectural features in order to satisfy desirable system requirements. A new circuit topology has been developed to implement the synapses of a Cellular Neural/Nonlinear Network (CNN). This kind of network is remarkable for its ability in performing parallel processing and for its high programmability of functions relating signals that carry visual information in the focal plane. The performance of the proposed circuit has been analyzed regarding the synapse operation as an individual structure and its application to CNN implementation. To this purpose we have designed a cellular neural network which benefits from the strong modularity of the synapse circuit and from the reuse of functional blocks inside each cell as well as between cells. Therefore, compactness is an important feature of the proposed circuit, which also succeeded in accomplishing several image operators through simulation. Keywords: Retinal Prosthesis, Early Vision, Electronic Synapse, CNN, Analog Multiplier.

LISTA DE FIGURAS FIGURA 1.1 Causas de cegueira em 2002. Extraído de [2] com tradução para o português.... 14 FIGURA 1.2 Sistema visual humano com caminhos visuais realçados. Extraído de [2] com tradução para o português... 16 FIGURA 1.3 Esquema de organização simplificada da retina. Extraído de [2] com tradução para português.... 17 FIGURA 1.4 - Distribuição espacial de células fotorreceptoras na retina. Extraído de [10]... 18 FIGURA 1.5 Sensibilidade de cones e bastonetes com relação ao comprimento de onda. Extraído de [2] com tradução para português.... 19 FIGURA 1.6 Mecanismo de adaptação ao brilho. Extraído de [10]... 20 FIGURA 1.7 Campo de recepção da célula bipolar. Extraído de [2] com tradução para português.... 21 FIGURA 1.8 - Comportamento da filtragem espaço temporal adaptativa. Extraída de [11] com tradução para português.... 24 FIGURA 1.9 Circuitos neuronais de computação seletiva da retina. Extraído de [13] e traduzido para português.... 27 FIGURA 1.10 Principais componentes de uma prótese neuronal visual. Traduzido de [2]. 28 FIGURA 1.11 Rede neuronal celular.... 31 FIGURA 1.12 Diagrama de blocos da célula padrão.... 32 FIGURA 1.13 Máscara do operador sináptico A.... 32 FIGURA 1.14 Diagrama de blocos detalhado para a célula padrão.... 33 FIGURA 1.15 Diagrama de blocos para a célula do tipo FSR.... 34 FIGURA 1.16 Diagrama de blocos da CNN. Extraído de [15] com tradução para português.... 36 FIGURA 1.17 Circuito de entrada da célula da CNN. Extraído de [15] com tradução para português.... 36 FIGURA 1.18 Bloco de circuito para a sinapse. Extraído de [27].... 37 FIGURA 1.19 Bloco de circuito para a sinapse. Extraído de [28].... 37 FIGURA 1.20 Circuito de adaptação do pixel local. Extraído de [30].... 38 FIGURA 2.1 Núcleo do multiplicador corrente-tensão com saída em corrente.... 41 FIGURA 2.2 Esquema de cancelamento.... 42 FIGURA 2.3 Multiplicador de quatro quadrantes.... 43

FIGURA 2.4 Circuito subtrator de corrente.... 43 FIGURA 2.5 Circuitos de polarização para determinação de (A) V B e (B) I B.... 44 FIGURA 2.6 Circuito da célula FSR.... 48 FIGURA 2.7 Diagrama de blocos de uma vizinhança espacial invariante da célula FSR proposta.... 50 FIGURA 3.1 Características de transferência DC simuladas do multiplicador de quatro quadrantes. (A) corrente de entrada constante: i in = -160 na a 160 na (passos de 40 na); (B) tensão de entrada constante: v in = -16 mv a 16 mv (passos de 4 mv).... 54 FIGURA 3.2 Distorção Harmônica Total do multiplicador de quatro quadrantes para: i in = 160 na e v in senoidal de frequência 1 khz (círculos); v in = 16 mv e i in senoidal de frequência de 1 khz (triângulos).... 55 FIGURA 3.3 Resposta em frequência do circuito da sinapse para entrada em tensão com valor para a corrente de entrada constante i in = 160 na.... 56 FIGURA 3.4 Resposta em frequência do circuito da sinapse para entrada em corrente com valor para a tensão de entrada constante v in = 15 mv.... 56 FIGURA 3.5 Densidade espectral da corrente de ruído à saída do multiplicador da FIGURA 2.3.... 57 FIGURA 3.6 Característica de transferência simulada para o bloco grampeador.... 58 FIGURA 3.7 Resposta transiente de uma CCD de 16 células em linha para diferentes estados iniciais. A tensão de estado constante utilizada na célula de fronteira da borda esquerda é de -15 mv nos exemplos (a) e (b) e para a borda direita igual a -15 mv no exemplo (a) e 15 mv no exemplo (b).... 60 FIGURA 3.8 Operadores sinápticos para a detecção de fronteiras.... 61 FIGURA 3.9 Resultados de simulação da detecção de fronteiras para diferentes imagens à entrada da CNN-A. Imagem inicial à esquerda e imagem final à direita.... 62 FIGURA 3.10 Resultados de simulação da detecção de fronteiras para diferentes imagens à entrada da CNN-B. Imagem inicial à esquerda e imagem final à direita.... 63 FIGURA 3.11 Evolução temporal da tensão de estado e propagação de sinais na CNN-A para a imagem de entrada (A) da FIGURA 3.9.... 64 FIGURA 3.12 Evolução temporal da tensão de estado e propagação de sinais na CNN-B para a imagem de entrada (B) da FIGURA 3.10.... 65 FIGURA 3.13 Operadores sinápticos para o preenchimento de buracos.... 65 FIGURA 3.14 Resultados de simulação do preenchimento de buracos para diferentes imagens à entrada da CNN-A. Imagem inicial à esquerda e imagem final à direita.... 66

FIGURA 3.15 Resultados de simulação do preenchimento de buracos para CNN-B. Imagem inicial à esquerda e imagem final à direita.... 67 FIGURA 3.16 Evolução temporal e propagação de sinais na CNN-A para a imagem de entrada (A) da FIGURA 3.14.... 67 FIGURA 3.17 Evolução temporal da tensão de estado e propagação de sinais na CNN-B para a imagem de entrada da FIGURA 3.15.... 68 FIGURA 3.18 Operadores sinápticos para a projeção de sombra.... 68 FIGURA 3.19 Resultado de simulação da projeção de sombra na CNN-A. Imagem inicial à esquerda e imagem final à direita.... 69 FIGURA 3.20 Evolução temporal da tensão de estado e propagação de sinais na CNN-A para a imagem de entrada da FIGURA 3.19.... 70 FIGURA 3.21 Operadores sinápticos para o detector de quina... 70 FIGURA 3.22 Resultados de simulação do detector de quina para diferentes imagens à entrada da CNN-A. Imagem inicial à esquerda e imagem final à direita.... 71 FIGURA 3.23 Evolução temporal da tensão de estado e propagação de sinais na CNN-A para a imagem de entrada (A) da FIGURA 3.22.... 72 FIGURA 3.24 Operadores sinápticos para o CCD bidimensional.... 72 FIGURA 3.25 Resultados de simulação do CCD bidimensional para diferentes imagens à entrada da CNN-A. Imagem inicial à esquerda e imagem final à direita.... 73 FIGURA 3.26 Evolução temporal da tensão de estado e propagação de sinais na CNN-A para a imagem de entrada (A) da FIGURA 3.25.... 74 FIGURA 4.1 Circuito de amostragem e retenção à entrada de cada célula da rede neuronal.... 76 FIGURA 4.2 Esquema de chaveamento para operação bidirecional do bloco de amostragem e retenção conectado ao pino de saída. Extraído de [15].... 77 FIGURA 4.3 Circuito de amostragem e retenção conectado ao pino de saída. Extraído de [46]... 77 FIGURA 4.4 Amplificador operacional de transcondutância utilizado como buffer no circuito de amostragem e retenção à saída.... 78 FIGURA 4.5 Leiaute da rede neuronal celular implementada em CI1.... 79 FIGURA 4.6 Leiaute da célula genérica do tipo FSR proposta neste trabalho.... 80 FIGURA 4.7 Leiaute da estrutura de amostragem e retenção conectada à entrada de cada célula FSR.... 81

FIGURA 4.8 Leiaute da estrutura de amostragem e retenção conectada à saída de cada célula FSR.... 82 FIGURA 4.9 Leiaute do bloco da sinapse.... 83 FIGURA 4.10 Leiaute do bloco de geração de pesos.... 84 FIGURA 4.11 Leiaute do bloco de polarização.... 84 FIGURA 4.12 Leiaute do bloco grampeador.... 85

LISTA DE TABELAS TABELA 3.1 Parâmetros ACM extraídos para a tecnologia IBM CMOS8RF... 51 TABELA 3.2 Razões de aspecto dos transistores envolvidos na simulação da operação do multiplicador de quatro quadrantes.... 53 TABELA 3.3 Resultados de simulação do multiplicador de quatro quadrantes.... 53 TABELA 3.4 Razões de aspecto dos transistores da célula FSR da FIGURA 2.6, para a simulação de operações das redes celulares unidimensional e bidimensional.... 58

LISTA DE ABREVIATURAS E SIGLAS ACM Advanced Compact MOSFET ADC Analog to Digital Converter ASIC Aplication Specific Integrated Circuit CNN Cellular Neural Network CCD Connected Component Detector CNN-UM Cellular Neural Network - Universal Machine CPU Central Processing Unit DIBL Drain Induced Barrier Lowering FSR Full Signal Range FPGA Field Programmable Gate Array OMS Organização Mundial da Saúde OTA Operational Transconductance Amplifier SNR Signal to Noise Ratio SoC System on a Chip THD Total Harmonic Distortion UCT Unidade de Controle e Temporização

LISTA DE SÍMBOLOS C - capacitância por unidade de área do óxido g mg - transcondutância de porta g md - transcondutância de dreno g ms - transcondutância de fonte i f - corrente normalizada direta i r - corrente normalizada reversa I B - corrente de polarização I D - corrente de dreno I F - corrente de saturação direta I R - corrente de saturação reversa I S - corrente de normalização I SQN(P) - corrente tecnológica do transistor quadrado canal N(P) L - comprimento efetivo do canal n - fator de rampa q - magnitude da carga eletrônica Q - densidade de carga de inversão no lado do dreno Q - densidade de carga de inversão no lado da fonte T a - temperatura absoluta V DB - tensão entre os terminais de dreno e substrato V DBSAT - tensão entre os terminais de dreno e substrato no limiar da saturação V DD - tensão de alimentação positiva V DS - tensão entre os terminais de dreno e fonte V DSSAT - tensão entre os terminais de dreno e fonte no limiar da saturação V GB - tensão entre os terminais de porta e substrato V P - tensão de pinch-off

V SB - tensão entre os terminais de fonte e substrato V SS - tensão de alimentação negativa V TON(P) - tensão de limiar em equilíbrio do transistor canal N(P) W - largura efetiva do canal ϕ t - potencial termodinâmico μ - mobilidade global dos portadores λ - parâmetro de ajuste do comprimento da seção do dreno γ fator de efeito de corpo

SUMÁRIO RESUMO... i ABSTRACT... ii LISTA DE FIGURAS... iii LISTA DE TABELAS... vii LISTA DE ABREVIATURAS E SIGLAS... viii LISTA DE SÍMBOLOS... ix CAPÍTULO 1 - INTRODUÇÃO... 13 1.1 ESTRUTURA E OPERAÇÃO DA RETINA... 16 1.2 FUNÇÕES DA RETINA... 22 1.3 COMPARAÇÃO ENTRE ABORDAGENS USUAIS NA SÍNTESE DE PRÓTESES VISUAIS... 28 1.4 REDES NEURONAIS CELULARES... 30 1.4.1 Fundamentação... 30 1.4.2 Implementação de CNN utilizando circuitos analógicos... 34 CAPÍTULO 2 - CIRCUITO ANALÓGICO PARA IMPLEMENTAÇÃO DA CNN... 39 2.1 BLOCO DA SINAPSE... 39 2.1.1 Arquitetura e Princípio de Operação... 40 2.1.2 Circuitos de Polarização... 44 2.1.3 Considerações de projeto... 45 2.2 CÉLULA FSR COMPLETA... 46 CAPÍTULO 3 - AVALIAÇÃO POR SIMULAÇÃO... 51 3.1 MULTIPLICADOR DE QUATRO QUADRANTES... 52 3.2 REDE NEURONAL CELULAR UNIDIMENSIONAL... 57 3.3 REDE NEURONAL CELULAR BIDIMENSIONAL... 61 3.3.1 Detecção de fronteira... 61

3.3.2 Preenchimento de buracos... 65 3.3.3 Projeção de sombras... 68 3.3.4 Detector de quina... 70 3.3.5 CCD bidimensional... 72 CAPÍTULO 4 - PROTOTIPAGEM... 75 4.1 Circuito Integrado 1... 75 CAPÍTULO 5 - CONCLUSÃO... 86 REFERÊNCIAS... 88 APÊNDICE A... 94 APÊNDICE B... 96

CAPÍTULO 1 - INTRODUÇÃO Entre os muitos avanços encontrados nos diferentes tratamentos de problemas relativos à saúde humana é inquestionável a importância da fusão de conhecimentos entre as ciências biológicas e físicas. Muitos são os casos de sucesso que se beneficiaram dessa relação sinérgica, a exemplo do desenvolvimento no campo das imagens médicas e terapêuticas quando introduzida a tecnologia de raios X. Atualmente, diversos campos da medicina estão sendo beneficiados com soluções tecnológicas para doenças outrora sem tratamento disponível ou satisfatório, sendo estas soluções tecnológicas importantes aliadas para enfrentar os desafios impostos por uma diversidade de problemas que acometem os seres humanos. A degeneração retiniana hereditária apresenta-se como uma doença com as características já mencionadas, cujos mais recentes tratamentos clínicos apenas retardam a morte dos neurônios fotorreceptores [1], sendo incapazes de recuperar algum grau das funções visuais que já tenham sido comprometidas. Nestes casos, o desenvolvimento de próteses eletrônicas capazes de substituir a retina e restaurar as funções visuais prejudicadas configura uma alternativa terapêutica promissora [1]. A retinite pigmentosa e a degeneração macular (precoce ou associada à idade) são as formas mais comuns de doenças degenerativas hereditárias da retina [1] e ocupam um percentual significativo entre as possíveis causas da cegueira, conforme dados da Organização Mundial da Saúde (OMS) observados na FIGURA 1.1 [2]. Estas doenças comprometem irreversivelmente as funções visuais do indivíduo, de forma parcial ou total, e apresentam a tendência de atingir níveis epidêmicos com o aumento da expectativa de vida [1]. Entre as consequências usuais aos indivíduos acometidos com estas doenças pode-se citar a dificuldade no reconhecimento de objetos e de fisionomias e a dificuldade ou impossibilidade para a leitura, o que diminui a interação do indivíduo com a sociedade e degrada significativamente sua qualidade de vida, podendo não raramente originar quadros de depressão. Além dos aspectos sociais não menos importantes, os prejuízos econômicos causados por esta deficiência são substanciais, uma vez que os custos médicos para o tratamento são elevados, o tempo de assistência é longo e a capacidade produtiva do indivíduo é minimizada, justificando a necessidade de esforços e investimentos em pesquisas que 13

abordem soluções alternativas ao problema. A idealização de um dispositivo implantável, motivação subjacente deste trabalho, capaz de oferecer aos deficientes a recuperação de certo grau de acuidade visual, traria grandes benefícios sociais e econômicos. FIGURA 1.1 Causas de cegueira em 2002. Extraído de [2] com tradução para o português. A retina é um tecido neuronal presente no sistema visual da maioria dos mamíferos, que apresenta um alto grau de complexidade e inicia o processamento paralelo da informação visual, também denominado de visão inicial (Early Vision), utilizando canais especializados à execução de tarefas distintas [3]. Suas notáveis habilidades permitem atingir marcas surpreendentes: a detecção fidedigna de apenas 10 fótons em um conjunto de 5000 células fotorreceptoras durante a visão em um ambiente de penumbra e a boa visão em condições ambientais de alto brilho como em um dia ensolarado, atingindo uma faixa dinâmica de variação do brilho superior a 10 décadas, a detecção de até 0,5 % de contraste, a resolução de duas linhas que fazem um ângulo entre si de apenas 1/60 graus, a percepção da ordem de aparição de duas linhas iluminadas com um intervalo de separação de apenas 5 ms para a resolução temporal e a percepção de cores em comprimentos de onda que variam de 400 a 670 nm. O desenvolvimento de um sistema eletrônico implantável capaz de substituir a retina é, portanto, desafiador. Em [1] e [4] são apresentados exemplos recentes que demonstram a 14

viabilidade em se aproximar deste objetivo utilizando implantes de microchips em voluntários humanos na parte posterior da retina, o que revela a capacidade do cérebro receber, sintetizar e interpretar até mesmo sinais pouco processados. Os implantes cocleares em deficientes auditivos já realizados em larga escala representam uma fonte de inspiração e motivam pesquisadores a trilhar um caminho similar para os implantes retinianos. Aliados à causa nobre do tratamento de deficiências visuais, os avanços no campo dos sensores de imagem inspirados na retina, também denominados de sensores visuais neuromórficos, encontram aplicação crescente em sistemas artificiais que implementam as primeiras etapas do processamento da imagem [5], como sensores de movimento, sistemas móveis autônomos, robôs alimentados por bateria, entre outros. Sensores de pixel ativo (APS), que herdam da retina o conceito de processamento no plano focal e a realização de operações no nível dos pixels [3], encontram aplicações exploradas comercialmente em larga escala [6]. Engenharia neuromórfica é o termo cunhado por Carver Mead [7] para designar a técnica de concepção e emprego de sistemas artificiais de engenharia inspirados em arquiteturas neurobiológicas que possibilitam melhor desempenho em comparação com as técnicas tradicionais, nas mais diversas aplicações. Ao se ampliar a fonte de inspiração para qualquer arquitetura biológica, resulta-se no conceito de sistemas biomórficos [8]. Historicamente, a abordagem biomórfica tem tido potencial aplicação em sistemas com requisitos de baixa potência e alta eficiência energética, que realizam processamento de informação e apresentam algum tipo de adaptação e aprendizado [9], características estas que se fazem presentes em muitas arquiteturas biológicas. Entretanto, é razoável considerar-se a dificuldade do mais avançado sistema biomórfico para competir em desempenho com as arquiteturas biológicas nas quais se inspiram e, mesmo levando em consideração os avanços recentes da tecnologia, há que se levar em conta os milhões de anos de evolução das arquiteturas biológicas. Nesta seção foi apresentada a motivação e a justificativa para o desenvolvimento do presente trabalho. Foram ainda introduzidos conceitos presentes na bibliografia citada que auxiliam a contextualizar e delimitar o escopo deste trabalho. As demais seções deste capítulo dedicam-se a revisitar a estrutura e a operação da retina, focalizando suas diferentes funções, a apresentar uma análise de diferentes abordagens publicadas e características que justificam a metodologia adotada e a descrever a teoria de rede celular neuronal / não-linear (CNN), na qual se baseia a proposta deste trabalho. O capítulo 2 dedica-se à descrição detalhada da proposta de circuito. O capítulo 3 reúne as informações de dimensionamento e apresenta 15

resultados de simulação de diferentes aplicações de redes neuronais ao circuito proposto. O capítulo 4 descreve a prototipagem dos sistemas simulados, e o capítulo 5 apresenta as conclusões extraídas do trabalho desenvolvido e indica possíveis desdobramentos, continuidade ou aprofundamento de aspectos que não foram abordados. 1.1 ESTRUTURA E OPERAÇÃO DA RETINA Um caminho natural de compreensão da retina passa pela necessidade de contextualizá-la em um sistema mais amplo, o sistema visual humano, ilustrado na FIGURA 1.2. FIGURA 1.2 Sistema visual humano com caminhos visuais realçados. Extraído de [2] com tradução para o português. Uma cena natural contém uma quantidade elevada de informações, sendo muitas redundantes. Por este motivo, nas diversas estruturas que compõem o sistema visual são realizadas operações que permitem extrair apenas a informação considerada útil para o organismo sob a perspectiva da evolução da espécie. A maioria das tarefas complexas de processamento localizam-se nos centros visuais superiores, como o córtex visual humano. 16

Entretanto, já na retina são realizadas importantes operações associadas à sua estrutura e organização que permitem eliminar informações irrelevantes e realçar algumas informações úteis, como, por exemplo, as bordas de objetos. É importante mencionar que o processamento da informação visual desempenhado pela retina ocorre de forma independente ao processamento desempenhado nos centros visuais superiores, uma vez que a retina praticamente não recebe sinais de retroalimentação dos mesmos [2]. A retina pode ser morfologicamente dividida em camadas que possuem diferentes tipos de células neuronais e conexões, conforme ilustra a FIGURA 1.3. FIGURA 1.3 Esquema de organização simplificada da retina. Extraído de [2] com tradução para português. Da camada radialmente mais externa para a camada mais interna são identificadas: camada nuclear externa, camada plexiforme externa, camada nuclear interna, camada plexiforme interna e camada de células ganglionares. As camadas nucleares, juntamente com a camada de células ganglionares concentram os núcleos dos diferentes tipos de células. Nas camadas plexiformes ocorrem as conexões entre os diferentes tipos de células. O circuito neuronal de propagação do sinal de informação visual é composto verticalmente pelas células fotorreceptoras, células bipolares e células ganglionares e horizontalmente pelas células 17

horizontais e amácrinas. Cada uma destas categorias de células é morfologicamente subdividida em muitos subtipos de células. As células fotorreceptoras são responsáveis por capturar a informação visual, transformando-a em sinais elétricos. Existem dois tipos de células fotorreceptoras, denominadas de cones e bastonetes, que possuem diferentes sensibilidades e distribuição espacial na retina. Os bastonetes são responsáveis pela visão em ambiente com baixo nível de iluminação e concentram-se na região periférica da retina, enquanto os cones são responsáveis pela visão em ambiente com alto nível de iluminação e também pela percepção de cores, concentrando-se na região central da retina denominada fóvea, na qual a informação visual é capturada com a maior resolução espacial. A distribuição espacial destas células na retina está ilustrada na FIGURA 1.4. Os cones também se caracterizam por possuir uma resposta mais rápida que os bastonetes. A percepção de cores se dá por um mosaico de cones sensíveis a diferentes comprimentos de onda, denominados azuis, verdes e vermelhos, e o comportamento da sensibilidade destas diferentes células com relação ao comprimento de onda pode ser observado na FIGURA 1.5. FIGURA 1.4 - Distribuição espacial de células fotorreceptoras na retina. Extraído de [10]. 18

FIGURA 1.5 Sensibilidade de cones e bastonetes com relação ao comprimento de onda. Extraído de [2] com tradução para português. As células horizontais coletam os estímulos elétricos provenientes de um conjunto de fotorreceptores que definem uma região na retina denominada campo de recepção. Conectamse ainda umas às outras recebendo e transmitindo estímulos elétricos. Uma das funções associadas a estas células é a adaptação à intensidade luminosa, o que confere ao indivíduo uma ampla faixa dinâmica de visão. O mecanismo de adaptação se dá com o ajuste da sensibilidade ao brilho a partir do nível médio de intensidade luminosa do estímulo visual. As células horizontais capturam a informação do nível médio de intensidade luminosa por meio de sua conexão às células horizontais vizinhas e retroalimentam esta informação de forma inibitória para as células fotorreceptoras, de modo que o sinal propagado para as células bipolares corresponde à diferença entre o estímulo visual capturado pelas células fotorreceptoras e a média espacial deste estímulo. A FIGURA 1.6 ilustra como esta adaptação acontece no sistema de percepção visual humana [10], no qual, para cada nível de brilho médio, existe uma curva de excursão do brilho subjetivo, como a curva entre os pontos B a e B b, com sensibilidade menor que a sensibilidade da excursão total, sendo a sensibilidade fornecida pela inclinação da curva. 19

Logaritmo da intensidade (ml) FIGURA 1.6 Mecanismo de adaptação ao brilho. Extraído de [10]. Outras funções também associadas às células horizontais consistem na detecção de bordas e percepção de detalhes finos na imagem, uma vez que, se o sinal capturado pelos fotorreceptores fosse propagado diretamente pelas células bipolares e ganglionares, a imagem resultante seria granulada e borrada, já que existe uma redução dos canais de propagação da informação visual dos fotorreceptores para as células bipolares e destas consecutivamente para as células ganglionares. As células horizontais estabelecem um formato para o campo de recepção das células bipolares denominado de centro-vizinhança, conforme ilustrado na FIGURA 1.7. Este formato do campo de recepção está intimamente relacionado ao processo de filtragem espacial, assemelhando-se à resposta impulsiva de um filtro, também denominada de função de espalhamento pontual [10]. 20

FIGURA 1.7 Campo de recepção da célula bipolar. Extraído de [2] com tradução para português. Nas células bipolares ocorre uma separação de canais de informação que são sensíveis a diferentes aspectos da informação visual: ativação da luz (ONSET-ON) e desativação da luz (OFFSET-OFF). Do ponto de vista funcional, esta separação do sinal em dois canais complementares melhora a eficiência na utilização de toda a faixa dinâmica de cada canal por cada tipo de sinal, além de facilitar o processamento do contraste da informação visual. As células amácrinas propagam informação visual lateralmente e também retroalimentam estímulos elétricos para as células bipolares que alteram a interação entre estas e as células ganglionares, aguçando a distinção entre as regiões de centro e vizinhança no campo de recepção das células bipolares. Adicionalmente, conforme cita [11], tem-se atribuído às células amácrinas a participação em funções não-lineares desempenhadas pela retina, como o controle de ganho de contraste [12]. 21

As células ganglionares são responsáveis por conduzir a informação visual capturada pela retina para os centros visuais superiores através de sinais pulsados. Cada tipo de célula ganglionar é responsável por capturar uma única componente da informação visual. Portanto, cada célula ganglionar é capaz de identificar esta componente de informação em todo o plano visual e as entradas de células de um mesmo tipo não se sobrepõem, eliminando redundância na propagação do sinal para os centros visuais superiores. Um bom exemplo da codificação da informação visual realizada pelas células ganglionares é a existência, entre os diferentes tipos de células ganglionares, de células dedicadas à resposta transitória, especializadas na captura de baixas frequências espaciais e altas frequências temporais, e outras dedicadas à resposta de regime, especializadas na captura de altas frequências espaciais e baixas frequências temporais. Em [11] cita-se que estudos recentes sugerem que a extensão do acoplamento entre as células horizontais sofre mudanças em resposta a variações na intensidade média da informação visual, através de conexões com células interplexiformes, que recebem estímulos elétricos da camada plexiforme interna. Medidas realizadas individualmente sobre os diferentes tipos de células revelam que os fotorreceptores, as células horizontais e as células bipolares produzem uma resposta do tipo linear, enquanto as células amácrinas produzem distorções não-lineares [2]. 1.2 FUNÇÕES DA RETINA Tradicionalmente, os trabalhos de pesquisa sobre a retina apresentam como função primordial desta estrutura a pré-filtragem da informação visual de entrada e o subsequente envio para centros visuais superiores, aos quais são atribuídas as tarefas complexas de processamento. Entretanto, o trabalho apresentado em [13] chama atenção para o fato de que existe uma grande quantidade de diferentes tipos de células identificadas na estrutura morfológica da retina, entre os quais um pequeno grupo está associado à filtragem, criando um paradoxo entre a complexidade da estrutura e as funções tradicionalmente atribuídas à mesma. Em [13], é investigado um tipo recorrente, porém ainda não explorado, de processamento atribuído à retina denominado de computação seletiva de características específicas do estímulo visual. Para caracterizar as funções da retina são utilizadas diferentes metodologias que muitas vezes resultam em modelos matemáticos comportamentais. Uma das principais metodologias utilizadas por neurofisiologistas para caracterizar o comportamento da retina 22

consiste na análise de um conjunto de dados resultantes da aplicação de um estímulo conhecido à retina e na gravação da resposta das células ganglionares a cada respectivo estímulo [11], [2]. A estes dados são aplicadas ferramentas de análise como transformadas de Fourier e Laplace para caracterizar a resposta espaço-temporal da retina. Por exemplo, podese utilizar como estímulo um ponto luminoso espacial com uma determinada intensidade luminosa para simular um impulso espacial, obtendo a resposta a este impulso, ou ainda um estímulo tipo grade simulando um trem de impulsos para o comportamento espacial. Para o comportamento temporal, pode-se utilizar um estímulo formado por um período de tempo pré-estabelecido de descanso, com uma intensidade fixa, e outro intervalo com uma intensidade maior que a anterior, de curtíssima duração, seguido do mesmo intervalo de descanso, simulando um impulso temporal. Uma das desvantagens destas ferramentas é o requisito de atribuir um comportamento sistêmico linear para a retina, o qual a mesma não apresenta na realidade, além de um limitado conjunto de intensidades luminosas ou frequências espaço-temporais dos estímulos de teste. Outra ferramenta usualmente utilizada é a análise de ruído branco que, além de permitir uma maior diversidade de intensidades e frequências espaço-temporais de estímulo, possibilita a caracterização de sistemas que apresentam não-linearidade [11], [2]. Em [11], utilizando esta metodologia, a retina é modelada como a composição de um bloco linear e um bloco de não-linearidade estática, conectados em série. A seguir, estão listadas algumas das principais funções desempenhadas pela retina no processamento da informação visual. (a) Funções Adaptativas O processamento da informação visual não é estático, mudando suas características de acordo com o tipo de tarefa demandada pela informação visual de entrada. Dentre as funções adaptativas destacam-se: (a.1) Filtragem espaço-temporal A função mais frequente nos trabalhos de modelagem do pré-processamento retiniano é a filtragem espaço-temporal. Em [11], desenvolveu-se uma estratégia de filtragem otimizada com o objetivo de maximizar a taxa de transmissão da informação visual, sujeita ao custo da potência total do sinal transmitido através do canal. Mostrou-se que esta estratégia de 23

filtragem apresenta comportamento similar às medidas fisiológicas presentes na retina, conforme ilustra a FIGURA 1.8. Esta estratégia contempla a rejeição da faixa de frequência para a qual a relação sinal-ruído (SNR) é inferior à unidade, frequência esta na qual o incremento da taxa de informação não compensa o custo de disponibilização de banda, que é diretamente proporcional à potência consumida. É rejeitada também a faixa de frequência para a qual observa-se SNR >> 1, na qual o incremento na taxa de informação é logarítmico enquanto o custo de transmissão sofre um incremento linear. Demonstra-se ainda que na faixa de frequência para a qual SNR >> 1, a função ótima de filtragem é inversamente proporcional ao espectro de potência do sinal de entrada, ou seja, ao espectro de uma cena natural. Para atingir esta estratégia de filtragem, é modelado um filtro espacial correspondente à retina externa, e um filtro temporal adaptativo, cujo comportamento é modificado a partir de sinais de controle enviados pela retina externa. FIGURA 1.8 - Comportamento da filtragem espaço temporal adaptativa. Extraída de [11] com tradução para português. (a.2) Adaptação à luz Enquanto a faixa dinâmica do brilho de uma cena natural varia de aproximadamente nove ordens de grandeza, a faixa dinâmica da pulsação dos neurônios é de aproximadamente duas ordens de grandeza. A retina, portanto, ajusta sua sensibilidade para as intensidades predominantes, diminuindo-a de forma inversamente proporcional à intensidade média. 24

(a.3) Adaptação ao contraste O contraste, que de forma simples pode ser obtido a partir da faixa compreendida entre o brilho mais alto e o brilho mais baixo do estímulo visual, controla a sensibilidade e a velocidade de operação da retina. Quando a retina passa de um ambiente de baixo contraste para um ambiente de alto contraste, sua sensibilidade diminui e sua velocidade de resposta é acelerada, e vice-versa. Esta alteração nas características da retina ocorre em duas fases [13]: a fase inicial, de duração igual ou inferior a 100 ms, na qual a sensibilidade varia suavemente e a velocidade muda substancialmente, denominada de controle de ganho de contraste, e a fase subsequente, na qual a velocidade praticamente não sofre alteração e a sensibilidade continua sendo alterada, que é denominada de adaptação ao contraste. Em [11] sugere-se que as alterações no ganho do sistema relativas à mudança de contraste são praticamente instantâneas. (b) Computação Seletiva Em [13] estão realçados mecanismos de extração de características específicas do estímulo visual como detecção de movimento de objetos, detecção de aproximação, entre outros, que são realizados na retina sem a necessidade de processamento adicional nos centros visuais superiores. A maioria destes mecanismos são modelados por meio de não-linearidades associadas ao comportamento das células da retina. A seguir, estão explicados alguns destes mecanismos. (b.1) Detecção de níveis baixos de luminosidade A separação entre os sinais de baixos níveis de luminosidade e o ruído em células fotorreceptoras é uma tarefa que demanda um mecanismo de processamento específico já verificado em alguns animais. A conexão de vários bastonetes a uma única célula bipolar pode mascarar a detecção de um fóton, em virtude do ruído dos demais bastonetes. Em [13], sugere-se que as saídas dos bastonetes sejam retificadas antes de serem somadas e entregues às células bipolares através de um valor de limiar que descarta sinais de ativação dos bastonetes abaixo do mesmo. Embora isto afete também os sinais genuínos correspondentes a 25

um único fóton, esta perda de sinal é compensada pelo aumento da relação sinal-ruído (SNR), que é maximizada pelo ajuste do limiar. O circuito neuronal proposto em [13] pode ser visto na gravura A da FIGURA 1.9, na qual se verifica uma filtragem temporal e uma posterior retificação dos sinais provenientes dos bastonetes antes de serem somados e entregues às células bipolares. A filtragem temporal corresponde ao mecanismo usual proposto para separar as principais fontes de ruído localizadas à saída dos bastonetes, que possuem conteúdos espectrais diferentes. (b.2) Detecção de Movimento Em muitas espécies estão identificadas células ganglionares responsáveis por detectar características específicas associadas ao movimento. Uma destas características é o movimento de imagens texturizadas. Células ganglionares do tipo Y exibem uma sensibilidade elevada em relação a este tipo de estímulo. Em frequências espaciais elevadas, quando a resolução espacial da textura é inferior ao campo de recepção da célula, a resposta esperada à saída destas células seria o resultado do cancelamento das parcelas positivas e negativas resultantes do estímulo dentro do campo de recepção bifásico. Em lugar disto, a célula ganglionar do tipo Y soma os estímulos de sub-regiões menores, cujos sinais são individualmente retificados, e que estão associadas ao campo de recepção das células bipolares, conforme está ilustrado na gravura B da FIGURA 1.9. Desta forma, a detecção não depende da direção do movimento ou, ainda, do tipo de padrão espacial da textura. Outra importante característica de uma cena visual capturada por meio de circuitos neuronais específicos é o movimento de um objeto. O movimento incessante dos olhos, mesmo quando se tenta fixar o olhar em uma imagem estática, causa um movimento na imagem que é compartilhado por todos os seus pontos, impondo um desafio ainda maior à detecção do movimento de um objeto. Este, por sua vez, é realizado por meio da diferença entre a trajetória do movimento do objeto alvo detectado localmente e a trajetória do movimento do plano de fundo, utilizando células ganglionares seletivamente sensíveis a este tipo de sinal. O circuito neuronal utilizado para explicar esta operação está ilustrado na gravura C da FIGURA 1.9. Enquanto as células bipolares produzem uma sequência de sinais de excitação para as células ganglionares associadas à trajetória do movimento central, as células amácrinas produzem uma sequência de sinais de inibição para as células ganglionares associadas ao 26

movimento do plano de fundo. Quando a diferença entre estes sinais não é nula, a célula ganglionar especializada propaga um sinal da componente local do movimento. FIGURA 1.9 Circuitos neuronais de computação seletiva da retina. Extraído de [13] e traduzido para português. 27

O movimento de aproximação, por sua vez, muito importante à sobrevivência de várias espécies e que produz a imagem de um objeto que se expande gradualmente sem deslocamento do seu ponto central, é também seletivamente capturado por células ganglionares especializadas. O circuito neuronal apresentado na gravura D da FIGURA 1.9 é resultado de estudos realizados em ratos, onde células bipolares tipo off produzem um sinal de excitação enquanto células bipolares tipo on produzem sinais de inibição, ambos somados no campo de recepção da célula ganglionar. Em movimentos que não são de aproximação, como os movimentos laterais, o sinal de um extremo do objeto é cancelado em relação ao outro extremo, enquanto que, no movimento de aproximação, o resultado líquido da soma de sinais no campo de recepção da célula ganglionar aumenta. 1.3 COMPARAÇÃO ENTRE ABORDAGENS USUAIS NA SÍNTESE DE PRÓTESES VISUAIS No campo mais abrangente das próteses neuronais visuais, o aspecto inicial que permite diferenciar os trabalhos publicados na comunidade científica é o grau de severidade da deficiência visual nas quais estas se aplicam. Quando células da camada mais interna da retina permanecem funcionais, principalmente as células ganglionares, são utilizadas próteses retinianas que estimulam esta região, aproveitando todo o caminho visual natural que se encontra a partir desta. Este é o caso da degeneração macular e da retinite pigmentosa, que se manifestam com a morte das células fotorreceptoras que se encontram nas camadas mais externas da retina. Quando o grau de comprometimento atinge o nervo ótico, somente as próteses neurocorticais que estimulam diretamente o córtex visual primário se apresentam como aplicação viável, embora existam pesquisas que buscam estimular outras regiões, como o núcleo geniculado lateral [1]. Os principais componentes de uma prótese neuronal visual de acordo com suas funções estão identificados na FIGURA 1.10 [2]. Sensor Processador de Sinal Telemetria Gerador de Pulsos Interface Neuronal FIGURA 1.10 Principais componentes de uma prótese neuronal visual. Traduzido de [2]. 28

O elemento sensor é responsável por capturar a informação visual, transformando-a em sinais elétricos, e pode estar integrado ao bloco responsável pelo processamento, como acontece usualmente nos sistemas biomórficos. Nas próteses neurocorticais onde o elemento sensor não necessita ser implantado, são utilizados sensores convencionais, como câmeras baseadas na tecnologia Charge Coupled Device. No bloco responsável pelo processamento são realizadas funções relativas à modelagem do tratamento da informação visual, que varia com o tipo de prótese neuronal visual e, portanto, com o local onde será efetuado o estímulo. Podem estar inclusos neste bloco diferentes modelos adotados para a retina, responsáveis pelas funções da visão inicial, bem como modelos do mapeamento do espaço visual na estrutura alvo de estímulo. As estruturas auxiliares inclusas no bloco de telemetria são responsáveis pela transmissão de informação, potência, e sinais de controle de operação ao dispositivo implantado através da pele, seja por meio de radiofrequência ou conectores percutâneos. O bloco de circuitos geradores de pulsos estimulam eletrodos que pertencem ao bloco de interface neuronal, transformando sinais elétricos em correntes iônicas propagadas pelo corpo humano. Cada componente descrito apresenta um desafio substancial à realização de pesquisas. A atenção deste trabalho está voltada para o bloco de processamento de sinal no desenvolvimento da implementação eletrônica das funções da visão inicial desempenhadas nas camadas interna e externa da retina. Entre as próteses retinianas, predominam dois tipos de aproximação no desenvolvimento do modelo da retina: os modelos funcionais e os modelos estruturais. Os modelos funcionais tratam a retina como um bloco comportamental de entradas e saídas e objetivam reproduzir as funções desempenhadas entre estes terminais. Por outro lado, os modelos estruturais consistem em sistemas biomórficos que se inspiram no conhecimento fisiológico da retina e nos mecanismos de operação que resultam nas funções que a mesma desempenha. Modelos funcionais da retina usualmente utilizam um sistema tradicional que consiste em um sensor de imagem, um conversor analógico para digital (ADC) e um elemento de processamento único (CPU), de aplicação genérica ou aplicação específica, implementado em SoC ou FPGA. Podem ainda se beneficiar de um grau intermediário de processamento paralelo como o existente em [14]. Em comparação com os sistemas biomórficos, contam a seu favor a robustez do processamento, a facilidade para atingir maior resolução diante do alto fator de preenchimento do sensor de imagem, a flexibilidade da programação de propósito genérico, a menor dificuldade e a maior rapidez de desenvolvimento envolvidos no projeto. Entretanto, os sistemas biomórficos têm apresentado características promissoras e 29

desempenho superior em relação a requisitos indispensáveis às diferentes aplicações [5]. Como exemplo destes requisitos que se aplicam ao propósito das próteses retinianas podem ser citadas a mobilidade e a implantabilidade, que definem a necessidade de sensores inteligentes compactos, de baixo consumo e que operam com baixas tensões. Mais além, o processamento paralelo distribuído dos modelos estruturais da retina favorece a operação em tempo real e a interação com o ambiente. Sistemas biomórficos dedicados de aplicação específica (ASIC), como o desenvolvido em [11], são velozes, porém pouco flexíveis. Sistemas biomórficos reconfiguráveis, a exemplo do trabalho descrito em [15], que se baseia em redes neuronais/não-lineares celulares (CNN), apresentam um compromisso entre velocidade e flexibilidade de programação, características desejáveis durante o desenvolvimento de sistemas visuais [16], [17]. 1.4 REDES NEURONAIS CELULARES 1.4.1 Fundamentação As redes neuronais/não-lineares celulares (CNN) representam uma classe de circuitos de processamento analógico [18] que permitiram o desenvolvimento de um novo paradigma para computação analógica adequada ao processamento de imagens [19]. A arquitetura padrão de uma CNN consiste em um arranjo retangular de células C i,j, conforme ilustra a FIGURA 1.11, que se conectam a uma vizinhança S de raio r por meio de sinapses, sendo S = (k, l) max,n ( k i, l j ) r, para r, i,j, k, l inteiros positivos. Na FIGURA 1.11 são exibidas as sinapses para o caso uma rede neuronal celular 4x4 com vizinhança usual S 1 e as regiões correspondentes às condições de contorno, que podem ser definidas de diferentes formas [19]. 30

31 FIGURA 1.11 Rede neuronal celular. A expressão que rege a dinâmica de cada célula padrão é definida como: (1.1) em que x i,j, y i,j, u i,j e z i,j são denominados estado, saída, entrada e limiar da célula C i,j, respectivamente, e A(i,j;k,l) e B(i,j;k,l) são denominados operadores sinápticos de realimentação e de entrada, respectivamente. A equação de saída é uma função limitadora do estado, podendo assumir diversas formas. Na implementação padrão é definida como: (1.2) Em [18] demonstra-se, dentro de certas restrições, que o comportamento do estado ao longo do tempo é limitado e estável. Na FIGURA 1.12 está apresentado o diagrama de blocos que representa a célula padrão da CNN. C 1,1 C 2,1 C 1,2 C i,j FRONTEIRA CANTO 1 1 2 1 ) (,,,, j i j i j i j i x x x f y ), ( ), (,,, ), ( ), (,, ), ;, ( ), ;, ( j i S l k C j i l k l k j i S l k C j i j i r r z u l k j i B y l k j i A x x

Saída das células vizinhas Operador A -1 z i,j x i,j y i,j Para células vizinhas Entradas Operador B x (0) i,j FIGURA 1.12 Diagrama de blocos da célula padrão. De forma mais abrangente, é possível introduzir na equação (1.1) operadores sinápticos que dependem do estado R(i,j;k,l) = r(x k,l ) ou de uma mescla de variáveis T(i, j; k, l) = t(x,, y,, u, ) e todos os operadores sinápticos, que doravante serão denominados A, B, R, e T, podem variar no espaço e no tempo e executar operações nãolineares no intervalo de tempo 0 t t 0, que resultam em um escalar. Entretanto, um extenso conjunto de funções pode ser implementado com operadores sinápticos invariantes no tempo e no espaço, que correspondem à operação de multiplicação com coeficientes reais chamados de pesos sinápticos e que são representados por máscaras conforme ilustra a FIGURA 1.13. A aplicação do operador sináptico A, de forma similar ao operador sináptico B, resulta em (1.3), e o diagrama de blocos que representa a célula neuronal pode ser mais detalhado conforme ilustra a FIGURA 1.14. A( i, j; k, l) y A y A y A y k, l 1, 1 i 1, j 1 1,0 i 1, j 1,1 i 1, j 1 C ( k, l ) S r ( i, j) (1.3) na qual A p,q denota o peso sináptico, e (p, q) Z (Exemplo: A 0,-1 denota o peso sináptico para posição correspondente à célula vizinha na mesma linha e na coluna imediatamente à esquerda da célula em análise, C i,j ). A -1,-1 A -1,0 A -1,1 A 0,-1 A 0,0 A 0,-1 A 1,-1 A 1,0 A 1,1 FIGURA 1.13 Máscara do operador sináptico A. 32

y i-1,j A 0,0 x A -1,0 x -1 z i,j x i,j y i,j Para células vizinhas u i-1,j u i,j x B -1,0 x B 0,0 x (0) i,j FIGURA 1.14 Diagrama de blocos detalhado para a célula padrão. A cada tipo de função desempenhada pela CNN estão associadas máscaras A e B e são definidos valores para seus elementos, bem como para o limiar z i,j. O conjunto de funções implementado pela CNN pode ser ampliado se for permitido aos coeficientes destas máscaras se tornarem funções não lineares do estado, da saída ou da entrada, conferindo adaptabilidade aos pesos. Neste trabalho é adotado um tipo de rede neuronal celular direcionado à implementação física do modelo, denominado Full Signal Range (FSR), que foi introduzido por Rodriguez-Vázquez [20] e detalhadamente analisado com relação à estabilidade e propriedades de convergência por Espejo et al [21]. Este modelo diferencia-se da célula padrão já apresentada principalmente pelo fato de os valores para a variável de estado estarem restritos à faixa de entrada da célula, eliminando a necessidade de um bloco limitador nãolinear explícito à saída da célula, conforme ilustra a FIGURA 1.15. Esta diferença proporciona vantagem na utilização da célula do tipo FSR sobre a célula padrão, pois estabelece que as faixas dinâmicas da variável de estado e da variável de saída são iguais, resultando na implementação de circuitos mais compactos e robustos [21]. 33

c y -1,0 a 0,0-1 x a -1,0 x g(x) +1-1 x c D x c = y c Para os vizinhos c u -1,0 c u x b -1,0 x b 0,0 c x (0) FIGURA 1.15 Diagrama de blocos para a célula do tipo FSR. Considerando uma apresentação mais compacta, a dinâmica da rede neuronal celular do tipo FSR ilustrada na FIGURA 1.15 é descrita pelas seguintes expressões [20], [21]: x c g c c c c x Aˆ y B u D d Sr ( c) m( x 1), se x 1 g( x) lim 0, se 1 x 1 m m( x 1), se x 1 d d d d (1.4) (1.5) na qual o índice c denota uma célula genérica, o índice d denota uma posição específica (p,q) na vizinhança relativa a célula c, τ é a constante de tempo de integração, x c (0) é o valor inicial para a variável de estado x c, g(x) é uma função de grampeamento, D c é o fator de limiar para a célula c, e Â = A, exceto por A, = A, 1. 1.4.2 Implementação de CNN utilizando circuitos analógicos A partir da publicação do trabalho em [18], muitos esforços vêm sendo conduzidos para a implementação física de CNN em diferentes tecnologias de circuitos integrados, utilizando diferentes técnicas de concepção e com diferentes objetivos. Como exemplo, podem ser citadas implementações em tecnologia CMOS de porta flutuante [22], ou que utilizam circuitos em modo-corrente [23]. 34

Uma importante vertente destes trabalhos dedica-se à implementação de um sistema de aplicação geral, baseando-se no paradigma conceitual da Máquina Universal CNN (CNN- UM) [24], [25], que permite solucionar uma variedade de problemas complexos com a aplicação sequencial de diferentes máscaras e a realização de operações lógicas no nível local das células. No contexto computacional, as máscaras representam uma instrução e a sequência de máscaras uma subrotina ou função. No contexto biológico, cada máscara pode representar uma camada de células e a sequência de máscaras um tecido com diferentes camadas. A implementação destes sistemas contém a presença de blocos registradores e portas lógicas, além de um núcleo de processamento analógico em tempo contínuo espacialmente distribuído. Para a implementação destes sistemas, o uso da tecnologia CMOS representa uma vantagem por ser adequada ao processamento de sinais mistos. A modelagem da retina baseada em CNN aproveita a similaridade estrutural entre estas, possibilitando um mapeamento direto entre as camadas de células da retina e camadas de CNN. O trabalho apresentado em [15] implementa uma CNN multicamadas que se baseia na modelagem realizada em [26], na qual são capturadas apenas as células da retina importantes para a descrição funcional qualitativa da mesma. No trabalho citado, é proposto um sistema de sinais mistos, programável, com duas camadas acopladas de CNN, conforme ilustra o diagrama de blocos da FIGURA 1.16, que pode implementar as funções da retina interna e externa. A célula da CNN implementada utiliza como arquitetura para a sinapse apenas um transistor operando na região linear e muitos esquemas de cancelamento e calibragem em procedimentos algorítmicos que conferem ao circuito muitas estruturas auxiliares. No circuito da FIGURA 1.17, que representa o bloco de entrada da célula da CNN, nota-se a presença de uma memória do tipo S 3 I utilizada para extrair o nível contínuo resultante da sinapse. 35

De vizinhos De vizinhos Camada 1 Camada 2 Para vizinhos Para vizinhos FIGURA 1.16 Diagrama de blocos da CNN. Extraído de [15] com tradução para português. 1 : n Memória S 3 I 1 : 1/n FIGURA 1.17 Circuito de entrada da célula da CNN. Extraído de [15] com tradução para português. 36

Como melhoramento relativo à implementação da sinapse utilizando um único transistor, o trabalho desenvolvido em [27] propõe a utilização de um OTA linearizado e espelhos de corrente programáveis, conforme ilustra a FIGURA 1.18, promovendo aumento de linearidade com a mesma ordem de grandeza da área ocupada pelo chip de processamento, uma vez que a sinapse proposta elimina a necessidade de estruturas auxiliares. FIGURA 1.18 Bloco de circuito para a sinapse. Extraído de [27]. O circuito ilustrado na FIGURA 1.19 e desenvolvido em [28] também utiliza um OTA e pesos discretos para a sinapse da CNN. FIGURA 1.19 Bloco de circuito para a sinapse. Extraído de [28]. 37

Em [29], descrevem-se os resultados obtidos a partir de um processador de imagens no plano focal com captura adaptativa do estímulo visual. Este processador é baseado no elemento sensor proposto em [30] e ilustrado na FIGURA 1.20, que confere as características compatíveis ao desenvolvimento das próteses retinianas. V reset V ref V ref2 C m V ph (n-1) M reset V ph (n) M readout PD C p V out V shift FIGURA 1.20 Circuito de adaptação do pixel local. Extraído de [30]. Estes recentes trabalhos, entretanto, baseiam-se em uma estrutura com máscaras de coeficientes discretos e invariantes no espaço. Estas características conferem limitações à flexibilidade, uma vez que nos sistemas biológicos os coeficientes podem assumir qualquer valor de forma contínua em uma determinada faixa, além de poderem variar no espaço, característica esta que pode ser alcançada mediante algum recurso de ajuste local automático dos coeficientes. 38

CAPÍTULO 2 - CIRCUITO ANALÓGICO PARA IMPLEMENTAÇÃO DA CNN Este trabalho explora a possibilidade de conceber um sistema eletrônico em tecnologia CMOS que objetive realizar processamento de imagens, com potencial aplicação na reprodução das funções mais relevantes da retina humana, similares àquelas descritas na seção 1.2. Pretende-se alcançar a solução que apresenta melhor desempenho com relação à velocidade de operação e consumo de potência, tal como os sistemas biomórficos. Nos estágios iniciais do desenvolvimento de sistemas eletrônicos visuais é especialmente desejável a característica de flexibilidade no desempenho de diferentes funções e tarefas de processamento [16]. Buscando beneficiar-se desta característica aliada a outras, como desempenho superior dos sistemas biomórficos com relação à velocidade de operação e consumo de potência [5], processamento paralelo e possibilidade de integração conjunta com o elemento sensor, adotou-se a CNN como arquitetura de base para o sistema proposto. A implementação da CNN é foco de interesse de muitos trabalhos [31], [32], [33], apresentando-se como uma arquitetura bastante promissora. A tarefa de implementação de uma célula da CNN perpassa pela concepção de blocos com diferentes funções, conforme ilustrado na FIGURA 1.14. 2.1 BLOCO DA SINAPSE Entre os diferentes blocos que constituem uma rede neuronal celular, o bloco responsável pela sinapse possui destacada importância devida à frequência elevada com a qual o mesmo se apresenta na estrutura. Entre as características de desempenho desejáveis para o bloco da sinapse podem ser citadas: o baixo consumo, uma pequena área ocupada de silício e entradas inteiramente analógicas. Esta última característica confere flexibilidade no tocante à programabilidade e à adaptação automática dos pesos que constituem a máscara regular da rede, o quê não é constatado em trabalhos recentes [27], [28], que apresentam valores discretos para a entrada de pesos da sinapse. Por sua vez, a compactação do circuito para redução da área de silício pode ser obtida por meio de otimização da arquitetura do bloco da sinapse no contexto da 39

implementação da CNN. Esta otimização consiste na seleção adequada das variáveis de entrada e saída, de acordo com a equação (1.4) que governa a dinâmica da célula, de forma a minimizar o número de estruturas necessárias. Se estiverem sob a forma de corrente, os resultados à saída das sinapses são diretamente somados pela confluência em um nó do circuito. Por outro lado, se, em cada sinapse, a variável de entrada que corresponde a uma variável de estado estiver sob a forma de tensão, será roteada mais facilmente entre as células vizinhas. Desta maneira, também são características desejáveis ao bloco da sinapse uma saída em corrente e uma das entradas em tensão. Além das características desejáveis já citadas, no contexto do sistema de processamento da qual a sinapse faz parte, torna-se importante observar a compatibilidade com os sinais provenientes do elemento sensor. Convém ressaltar que a rede neuronal celular, de uma forma geral, não necessita contemplar o mecanismo de adaptação ao brilho, sendo esta função delegada a estruturas especializadas próximas ao elemento sensor e que utilizam diferentes técnicas, como a compressão logarítmica [34], [35], ou a adaptação do tempo de integração [30], ambas resultando em sinais de tensão. Portanto, considera-se que os sinais na entrada da rede neuronal celular derivam de uma condição previamente adaptada, para qual a faixa de excursão de valores é significativamente restrita, em similaridade ao comportamento retiniano apresentado pela curva entre os pontos B a e B b destacada na FIGURA 1.6. Neste trabalho, propõe-se uma arquitetura de circuito para o bloco da sinapse [36], [37], [38], de forma a atender as características de desempenho citadas. 2.1.1 Arquitetura e Princípio de Operação A FIGURA 2.1 apresenta o núcleo do circuito proposto para a sinapse [36], [37], [38], o qual consiste em um multiplicador com saída em corrente, uma das entradas em tensão e a outra entrada em corrente. 40

i outa V DD IB I B M 3C M 5 M2 V SS M 7 v in V B i in V SS M4 v' in V SS V SS M 1 M 3A M 6 V SS V SS FIGURA 2.1 Núcleo do multiplicador corrente-tensão com saída em corrente. O núcleo do multiplicador explicitado na FIGURA 2.1 utiliza o espelhamento da transcondutância de fonte [39] entre os transistores M 1 e M 3A, ambos operando no início da região de não-saturação, no qual assume-se uma relação linear entre a corrente de dreno e a tensão entre dreno e fonte, válida em todo o regime de inversão (fraca a forte). Uma vez que M 1 e M 3A compartilham os terminais de porta e fonte, e assumindo V DS1 constante, a transcondutância de fonte g ms1 = g ms3 é proporcional à soma i in + I B entre as correntes de entrada i in e de polarização I B. Desta forma, a corrente de dreno do transistor M 3, i = g v, é proporcional ao produto entre o somatório de corrente i in + I B e a tensão entre dreno e fonte: i outa iin I V B DS1 v in (2.1) A tensão V DS1 pode ser assumida como constante ao se considerar que o transistor M 2 opera em saturação com o potencial do terminal de porta constante e corrente de dreno constante, desprezando-se efeitos de canal curto e não-idealidades da fonte de corrente. Os transistores M 3C, M 4, M 5, M 6 e M 7 operam em saturação e proporcionam v = V + kv, com V IDC e k constantes, e terminal de saída com impedância elevada. A corrente de saída, portanto, resulta: 41

i outa i I in B V kv V DS1 IDC in (2.2) O transistor M 3C desacopla o terminal de saída da tensão de entrada v in, com deslocamentos de nível sucessivos desde o terminal de porta de M 7 até o terminal de porta de M 5. Os transistores M 5 e M 6 conectados em série são dimensionados de forma a proporcionar uma diferença constante entre seus respectivos potenciais de porta. Outro deslocamento de nível é realizado entre os terminais de porta de M 4 e M 6, os quais apresentam razões de aspecto iguais. Portanto, V IDC é o deslocamento de nível total desde o terminal de porta do transistor M 7 até o terminal de porta do transistor M 4, e o fator k deve-se ao efeito de corpo. As expressões para V IDC e k e as relações utilizadas para o dimensionamento do conjunto de transistores M 3C, M 4, M 5, M 6 e M 7, assim como as considerações envolvidas, estão apresentadas no Apêndice A. Um esquema de cancelamento faz-se necessário para eliminar termos indesejáveis em (2.2) devidos aos níveis de polarização, resultando assim em um multiplicador de quatro quadrantes. Neste trabalho, o esquema de cancelamento adotado, ilustrado na FIGURA 2.2, favorece a eliminação de estruturas redundantes, e consequentemente a diminuição da área de silício ocupada e do consumo de potência, uma vez que cada sinal de entrada (v in ou i in ) está aplicado a apenas um nó, sem a necessidade de réplica ou inversão. I + B i in g ms - X i outa v in ' = V + IDC k.v in I B espelho V IDC g ms - espelho X X X i outb i outc i outd + + subtrator de corrente i out FIGURA 2.2 Esquema de cancelamento. O diagrama esquemático de um multiplicador de quatro quadrantes de propósito genérico utilizando o núcleo proposto neste trabalho e o esquema de cancelamento da FIGURA 2.2 está ilustrado na FIGURA 2.3. 42

Subtrator de Corrente i out i outb i outa i outd i outc V DD V ISHDC I B I B I B V ISHDC M 5B M 3CB M 3CA M 5A M 5D M 3CD V WDC M 3CC M 5C M2X M 7 v in M 2Y M 4B V IDC V B1 i in M 4A M 4D VB1 V IDC M 4C M 6B M 3B M 1X M 3A M 6A M 6D M3D M 1Y M 3C M 6C V SS V SS V SS FIGURA 2.3 Multiplicador de quatro quadrantes. O subtrator de corrente empregado no esquema de cancelamento da FIGURA 2.2 consiste em uma versão cascode do circuito utilizado por Machado et al em [39], conforme ilustra a FIGURA 2.4. Trata-se de um jogo de espelhos cascodes, tais que as duas correntes a serem subtraídas são reproduzidas e aplicadas ao nó de saída com os sentidos desejados. V DD M P1 M P2 M P4 M P3 M P1C M P2C M P4C M P3C i in1 i in2 M N6C i out M N5C M N6 M N5 V SS FIGURA 2.4 Circuito subtrator de corrente. 43

2.1.2 Circuitos de Polarização As tensões e correntes de polarização e referência indicadas no circuito multiplicador da FIGURA 2.3 foram geradas por diferentes blocos de circuito. A tensão de polarização V B, aplicada aos terminais de porta dos transistores M 2X e M 2Y, é obtida por meio do circuito de polarização da FIGURA 2.5 (A) [39]. Assumindo que os transistores M 2X e M 2Y da FIGURA 2.3 e M B da FIGURA 2.5 (A) estão casados, bem como os transistores M 1X e M 1Y da FIGURA 2.3 e M A da FIGURA 2.5 (A), o valor da tensão de dreno-fonte de M 1X(Y), V DS1X(Y), é uma réplica da tensão dreno-fonte de M A, V DSA. Desconsiderando efeitos de canal curto, é possível demonstrar que a tensão V DSA é proporcional à temperatura absoluta [39]. Empregou-se neste trabalho o circuito gerador de corrente de referência ilustrado na FIGURA 2.5 (B). A corrente de referência I B conduzida pelo transistor M F4, que está em uma composição do tipo trapezoidal [40], como indica a presença do transistor composto (m)m F4, é espelhada para os demais blocos de circuito da FIGURA 2.3 e da FIGURA 2.5 (A) em substituição à fonte de corrente de polarização I B. Simulações permitiram inferir que a composição do tipo trapezoidal de transistores apresenta desempenho superior em relação a um transistor simples, por proporcionar reduzida condutância de saída aos espelhos que replicam a corrente de polarização nos diferentes blocos de circuito sem comprometer as excursões desejáveis aos diferentes sinais. V DD V DD M F4 M F4 I B (m)m F4 M B V B M F2 (m)m F4 M F1 M F3 I B M A V SS (A) FIGURA 2.5 Circuitos de polarização para determinação de (A) V B e (B) I B. (B) 44

2.1.3 Considerações de projeto Neste item será comentada a metodologia utilizada para o dimensionamento do núcleo do multiplicador ilustrado na FIGURA 2.1, utilizando o modelo ACM (Advanced Compact MOSFET model), revisitado no Apêndice B. A máxima excursão da corrente de entrada i in está relacionada às condições requeridas para a adequada operação do transistor M 2 e da fonte de corrente I B. Estabelecendo-se a tensão entre os terminais de dreno e fonte do transistor M 1 (V DS1 ), que deve ser constante por motivos já mencionados, o seu nível de inversão i f1 pode ser relacionado à excursão de i in pelas expressões (B.7) e (B.1) do Apêndice B, que aqui reescrevemos por conveniência: V DS1 t 1 i f 1 1 i r1 ln 1 i 1 i f 1 r1 1 1 (2.3) i r1 i f 1 i I D1 S1 (2.4) A corrente de M 1, i D1, varia entre os valores i D1max = I B + i inmax e i D1min = I B + i inmin. Quando a corrente de entrada for máxima, o potencial de porta do transistor M 1 atinge seu valor máximo, que ainda deve ser suficientemente baixo para a fonte de corrente operar adequadamente. Denominando V CS a mínima tensão entre os terminais da fonte necessária para sua correta operação, fica estabelecida a condição V G1max V DD V CS. Na condição de corrente mínima à entrada, a tensão de porta do transistor M 1 atinge seu valor mínimo, que deve ser um valor suficientemente alto para não retirar o transistor M 2 da região de saturação, o quê leva à condição V G1min > V DS1 + V DSSAT2, onde V DSSAT2 é uma função do nível de inversão de M 2, de acordo com a expressão (B.10) do Apêndice B. É possível relacionar os níveis de inversão máximo e mínimo aos valores limites V G1max e V G1min, respectivamente, pela expressão (B.6) do Apêndice B, aqui reescrita como: V G1max(min) V n N t SS V T 0 N V SS 1 i 2 ln 1 i f 1max(min) f 1max(min) 1 (2.5) Neste trabalho, determinamos i f1max pela condição de V G1max em (2.5). Substituindo (2.4) em (2.3), com i D1 = i D1max, calcula-se I S1 e, em seguida, a razão de aspecto de M 1, 45

(W/L) 1 = I S1 /I SQN, sendo I SQN a corrente tecnológica do transistor quadrado canal N. De modo inverso, com o valor calculado de (W/L) 1, determinamos i f1min por (2.3) e, com i D1 = i D1min, e, substituindo em (2.5), calcula-se V G1min, o que permite estimar V DSSAT2 e, consequentemente i f2. Como M 2 opera em saturação, fazendo-se I S2 = I B /i f2, pode-se determinar a razão de aspecto de M 2, (W/L) 2 = I S2 /I SQN. Os transistores do circuito de polarização do núcleo do multiplicador, apresentado na FIGURA 2.5 (A), são dimensionados partindo-se do valor da tensão dreno-fonte de polarização do transistor M A, V DSA, de forma similar a [39], onde também se utiliza o modelo ACM: VDSA t 1 I I B SA I 1 I SA SB I 1 I B SB I I I ln 1 B 1 SA 1 ln 1 B 1 I I SA SB I SB (2.6) Em (2.6), I SA e I SB são as correntes de normalização dos transistores M A e M B, respectivamente, proporcionais às suas razões de aspecto. 2.2 CÉLULA FSR COMPLETA A FIGURA 2.6 ilustra a célula FSR proposta neste trabalho [37]. Cada bloco de sinapse realiza a operação de multiplicação presente no diagrama de blocos da célula FSR exibido na FIGURA 1.15. Na FIGURA 2.6, tanto os operadores sinápticos de realimentação (A ), quanto o operadores sinápticos da entrada (B ) estão representados por sinais de corrente, a exemplo de i in no bloco gerador de peso, correspondente à parte mais à esquerda do núcleo multiplicador na FIGURA 2.1. O gerador de peso converte cada um dos sinais de corrente que representam pesos da sinapse em um sinal de tensão v w, tal como a tensão de porta do transistor M 1 na FIGURA 2.1, para ser aplicado aos terminais de porta dos transistores M 3A e M 3B do bloco da sinapse na FIGURA 2.6, e, portanto, conduzir a informação da transcondutância de M 1. Cada variável de entrada (u d ) ou saída (x c = y 0,0 ) está embutida em um sinal de tensão tal qual v ish na FIGURA 2.6, o qual é aplicado aos terminais de porta dos transistores M 5A e M 5D do bloco da sinapse. De fato, no caso da variável de saída (estado), v ish é o resultado do 46

deslocamento, através do bloco de deslocamento de nível, da tensão de saída do bloco grampeador na FIGURA 2.6. No caso da variável de entrada (u d ), embora não representado na FIGURA 2.6, utiliza-se um bloco dedicado de deslocamento de nível cuja saída é conectada a entrada v ish da sinapse. A parcela correspondente ao termo de limiar D c presente na FIGURA 1.15 está sendo implementada por meio de um bloco de sinapse específico. As correntes de saída de todas as sinapses (1 a N) são somadas no nó X e integradas através da capacitância total deste nó, formada predominantemente pelas capacitâncias dos terminais de porta dos transistores M 8A, M 8B (grampeador) e M 7 (deslocamento de nível). Embora o bloco de integração esteja indicado no diagrama da FIGURA 1.15, a integração da variável de estado na FIGURA 2.6 não é explicitamente realizada por algum bloco em particular. Neste trabalho foi adotado o circuito grampeador apresentado em [31], conforme ilustra a FIGURA 2.6. Neste circuito, um mesmo nó X corresponde à saída em corrente e à entrada em tensão. Os transistores M 9A e M 9AC constituem uma fonte de corrente cascode e os transistores M 9B e M 9BC, um sorvedor cascode. 47

GERADOR DE PESO V DD subtrator i out1 V DD M 9A V BP2 I B i outb i outa V DD i outd i outc M 10A M 9AC V BP2C DESLOCAMENTO DE DE Nᅦ NÍVEL VEL V B i in M 11 M 12 V SS M 5B M 3CB M 3CA M 5A M M 3CD M 3CC 5D M 5C V IDC V SS M 8A V SS V DD I B v o V SS M 4B M 4A M 4D M 4C V DD M 7 POLARIZAÇÃO POLARIZAᅦᅦ O V DD I B M 6B V SS M 3B M 3A M 6A V SS M 6D M3D M 3C M 6C V SS SINAPSE 1 V DD M 10B M 8B M 9BC M 9B V BN2C V BN2 V SS V ISHDC v w V DD v ish V WDC V B M 14 V SS M 13 V SS I B SINAPSE 2 i out1 i out2 X I clamp GRAMPEADOR V SS M 15 POLARIZAÇÃO POLARIZAᅦᅦ O V SS SINAPSE N i outn FIGURA 2.6 Circuito da célula FSR.

Quando a tensão do nó X, que é a entrada do grampeador, aumenta acima de um determinado limite superior, o potencial no dreno de M 8A (porta de M 10A ) sofre um significativo decréscimo e o potencial no dreno de M 8B (porta de M 10B ) sofre um decréscimo também importante, ambas alterações contribuindo para manter as correntes de dreno de M 8A e M 8B constantes. Assim, a corrente de saída do grampeador (I clamp ) é negativa para o sentido indicado na FIGURA 2.6, decrementando o somatório das correntes de saída das sinapses. Inversamente, quando a tensão do nó X diminui abaixo de um determinado limite inferior, eleva-se o potencial no dreno de M 8A e também o potencial no dreno de M 8B, de modo que a corrente I clamp fica positiva, incrementando o somatório de correntes de saída das sinapses. Como a tensão do nó X é proporcional ao resultado da integração do somatório de correntes, a realimentação negativa de I clamp permite compensar variações da tensão, mantendo-a dentro de limites preestabelecidos. Na célula FSR, estes limites são os mesmos da faixa de entrada. A tensão do nó X é também a entrada para o bloco de deslocamento de nível. A tensão deslocada (saída v o da célula) é então aplicada à entrada das sinapses de outras células, ou da mesma célula em um elo de realimentação. Como resultado da modularidade da arquitetura do multiplicador, o compartilhamento de blocos proporciona um decréscimo significativo na complexidade e no tamanho do circuito, além de minimizar o descasamento de características. Para implementar o grande número de sinapses presente em uma CNN de alta densidade minimizando a área de silício ocupada, os geradores de pesos, cada um consistindo de uma entrada em corrente aplicada a dois transistores em configuração idêntica à dos transistores M 1 e M 2 do núcleo multiplicador na FIGURA 2.2, são compartilhados por todas as células do tipo FSR, assumindo uma rede neuronal celular invariante no espaço. Adicionalmente, o bloco que processa o deslocamento de nível da tensão de entrada do multiplicador na FIGURA 2.3 (transistor M 7, e corrente de polarização associada) é movido para a saída da célula na FIGURA 2.6. Uma vez que a saída da célula já está deslocada, evitase a necessidade de um bloco de deslocamento de nível para cada sinapse. Os blocos que geram os potenciais de polarização V ISHDC e V WDC são compartilhados por todas as células. V WDC está associado a g ms1, que é constante e proporcional a I B neste bloco. O diagrama de blocos da FIGURA 2.7 representa uma vizinhança genérica da célula FSR proposta, enfatizando o compartilhamento de blocos dentro e fora de cada célula. 49

i inn i in2 i in1 gerador gerador gerador de peso de peso de peso v wn v w2 v w1 célula 1in v o1in = v ish1x sinapse 1X i o1x grampeador célula 1out célula 2in v o2in = v ish2x sinapse 2X i o2x v inx i clampx desl. de nível v ox célula 2out célula v onin Nin = v ishnx sinapse NX i onx célula Nout CÉLULA X V ISHDC polarização V WDC polarização FIGURA 2.7 Diagrama de blocos de uma vizinhança espacial invariante da célula FSR proposta.

CAPÍTULO 3 - AVALIAÇÃO POR SIMULAÇÃO Neste capítulo é apresentada uma compilação dos dados de dimensionamento e projeto, e também os resultados de simulação das arquiteturas de circuitos analógicos propostas neste trabalho, permitindo avaliar a funcionalidade e desempenho das mesmas. As simulações foram efetuadas por meio do conjunto de ferramentas de projeto Mentor Graphics [41]. A tecnologia CMOS adotada neste trabalho tem comprimento mínimo de canal igual a 0,13 μm, denominada IBM CMOS8RF. Esta tecnologia [42], na versão padrão, consiste em um processo litográfico de 130 nm do tipo poço duplo (twin-well) em substrato não epitaxial do tipo P de resistividade entre 1 e 2 Ω-cm, com espessura de óxido fino (óxido de porta) de 22 Å, com tensão nominal de 1,2 V e tensão máxima de 1,5 V, que oferece de 5 a 8 camadas de metal e dispositivos como resistor de poço N, indutores em espiral, resistor de polissilício, diodos de polarização direta, capacitores de óxido fino e de desacoplamento, capacitores verticais e terminais do tipo wire bond ou solder bump (C4). A tecnologia empregada disponibiliza ainda uma série de características opcionais a exemplo de poço triplo (triple-well). O acesso ao pacote de projeto (design kit) CMRF8SF e à fabricação na tecnologia discriminada foi obtido por intermédio do programa acadêmico da MOSIS [43]. Os parâmetros do modelo ACM extraídos a partir de resultados de simulação utilizando o modelo BSIM 3v3, para a referida tecnologia, encontram-se resumidos na TABELA 3.1. TABELA 3.1 Parâmetros ACM extraídos para a tecnologia IBM CMOS8RF. Parâmetro NMOS PMOS Unidade n 1,379 1,295 - V T0 0,362-0,356 V I SQ 353,4 49,51 na 51

3.1 MULTIPLICADOR DE QUATRO QUADRANTES Para avaliar o desempenho do bloco da sinapse da célula FSR proposta, foi simulada a operação do multiplicador de quatro quadrantes da FIGURA 2.3, que segue o mesmo princípio. Adotou-se como premissa para o dimensionamento de todos os transistores envolvidos no multiplicador, a utilização de comprimento de canal nunca inferior a cinco vezes o comprimento mínimo da tecnologia, com o intuito de diminuir os efeitos de canal curto. Este mesmo valor também foi adotado para a largura mínima do canal com intuito de minimizar outros efeitos de segunda ordem. Com relação à fonte de alimentação simétrica, os valores adotados para V DD e V SS foram 0,6 V e -0,6 V, respectivamente. O dimensionamento dos transistores do núcleo do multiplicador da FIGURA 2.1 foi realizado para uma corrente de polarização I B de 500 na, considerando como ponto de partida uma excursão de ±50% do valor de I B para a corrente de entrada e uma tensão constante de 15 mv entre os terminais de dreno e fonte de M 1. Buscou-se ainda estabelecer um nível de inversão para M 1 suficientemente alto para diminuir efeitos de segunda ordem, como o DIBL, identificado como a principal fonte de distorção da corrente de saída com relação à entrada de tensão, verificada em simulação. Os transistores M 4, M 5 e M 6 da FIGURA 2.1, responsáveis pela entrada em tensão, foram dimensionados de forma a apresentar o mesmo nível de inversão. Os transistores tipo P do subtrator de corrente da FIGURA 2.4 foram projetados para operar em regime de inversão fraca com o intuito de minimizar a queda de tensão sobre a entrada do subtrator, possibilitando maior excursão dos sinais de entrada do mesmo. Os transistores tipo N do mesmo bloco foram projetados com base no dimensionamento dos transistores tipo P, de forma a minimizar o descasamento DC, que produz deslocamento nas características de transferência de tensão e corrente, no nó de saída. A TABELA 3.2 reúne as razões de aspecto de todos os transistores que compõem o circuito multiplicador de quatro quadrantes da FIGURA 2.3, e também os transistores empregados no subtrator de corrente da FIGURA 2.4 e nos circuitos de polarização da FIGURA 2.5. 52

TABELA 3.2 Razões de aspecto dos transistores envolvidos na simulação da operação do multiplicador de quatro quadrantes. Transistor W / L (µm / µm) M 1X(Y), M 3A(B)(C)(D) 0,95 / 1,50 M 2X(Y) 5,39 / 1,50 M 3CA(B)(C)(D) 15,00 / 1,50 M 4A(B)(C)(D), M 6A(B)(C)(D) 0,60 / 15,90 M 5(A)(B)(C)(D) 0,60 / 2,87 M 7 19,94 / 0,60 M N5(6), M N5(6)C 1,38 / 1,50 M P1(2)(3)(4), M P1(2)(3)(4)C 75,00 / 0,60 M A 22,14 / 0,60 M B 5,39 / 1,50 M F2 0,60 / 7,50 M F1, M F3 1,21 / 0,60 M F4 (m=14) 2,86 / 0,30 A TABELA 3.3 resume parâmetros de desempenho do projeto do multiplicador de quatro quadrantes da FIGURA 2.3 obtidos por simulação. TABELA 3.3 Resultados de simulação do multiplicador de quatro quadrantes. Parâmetro Valor Área ativa (µm 2 ) 764 Consumo de potência (µw) 20 Largura de Banda (MHz) 1,4 Corrente de ruído RMS (na) 1 THD (db) < -34 A FIGURA 3.1 apresenta as características de transferência DC simuladas utilizando (A) corrente de entrada constante e (B) tensão de entrada constante. As curvas apresentam pequenas diferenças em relação ao comportamento linear esperado para uma entrada constante: o maior offset é de 0,73 na para o caso (A) e -1,30nA para o caso (B) e a máxima variação na inclinação da curva é de 5,5% no caso (A) e 8% no caso (B). A simetria é principalmente afetada no caso da variação da corrente de entrada, o que não causa problemas críticos na aplicação da CNN, uma vez que representam correntes de entrada constantes, embora programáveis. 53

200 na i in = -160 na 100 na i out 0-100 na i in = 160 na -15 mv -10 mv -5 mv 0 5 mv 10 mv 15 mv v in (A) 200 na 100 na v in = -16 mv i out 0-100 na -160 na -80 na 0 80 na 160 na i in v in = 16 mv FIGURA 3.1 Características de transferência DC simuladas do multiplicador de quatro quadrantes. (A) corrente de entrada constante: i in = -160 na a 160 na (passos de 40 na); (B) tensão de entrada constante: v in = -16 mv a 16 mv (passos de 4 mv). (B) 54

Com o intuito de avaliar a linearidade em relação a cada entrada, obteve-se o coeficiente de distorção harmônica total (THD) através de simulação para: (i) uma entrada de corrente constante de 160 na e uma entrada de tensão senoidal de frequência 1 khz e amplitude variando de 1 a 16 mv (ii) uma entrada de tensão constante de 16 mv e uma entrada de corrente senoidal de frequência 1 khz e amplitude variando de 10 na a 160 na. Os resultados estão ilustrados na FIGURA 3.2, na qual se observa que o parâmetro THD é menor que aproximadamente -43 db (0.7%) para toda a faixa de tensão de entrada, e menor que aproximadamente -34 db (2%) para toda a faixa de corrente de entrada. i in 0 40 na 80 na 120 na 160 na THD (db) (i in =160 na) -50-60 v in =16 mv i in =160 na -40-50 THD (db) (v in =16 mv) 0 4 mv 8 mv 12 mv 16 mv v in FIGURA 3.2 Distorção Harmônica Total do multiplicador de quatro quadrantes para: i in = 160 na e v in senoidal de frequência 1 khz (círculos); v in = 16 mv e i in senoidal de frequência de 1 khz (triângulos). O comportamento em frequência para cada entrada individual da sinapse projetada encontra-se na FIGURA 3.3 e na FIGURA 3.4, e foi obtido por meio de uma simulação AC mantendo-se uma das entradas em valor constante e não nulo (15 mv para a entrada em tensão e 160 na para a entrada em corrente). A banda de passagem atingida para a entrada em tensão foi de 1,4 MHz e de 2,2 MHz para a entrada em corrente, valores estes condizentes com os requisitos do sistema a ser implementado [1], [11]. 55

-134-136 i in = 160 na -138 I out (db) -140-142 -144-146 -148-150 -152 10 0 10 2 10 4 10 6 10 8 Frequência (Hz) FIGURA 3.3 Resposta em frequência do circuito da sinapse para entrada em tensão com valor para a corrente de entrada constante i in = 160 na. -130-135 v in = 15 mv i out (db) -140-145 -150-155 -160 10 0 10 2 10 4 10 6 10 8 Frequência (Hz) FIGURA 3.4 Resposta em frequência do circuito da sinapse para entrada em corrente com valor para a tensão de entrada constante v in = 15 mv. O valor médio quadrático do ruído na saída de corrente resultou em 1 na. O comportamento para a densidade espectral de ruído pode ser visualizado na FIGURA 3.5, no qual se evidencia a predominância do ruído balístico em baixas frequências e a limitação do ruído branco à banda de passagem do circuito nas frequências mais elevadas. 56

-360 (db) -380 2 Ruído à saída - i nout -400-420 -440-460 -480 10 0 10 2 10 4 10 6 10 8 Frequência (Hz) FIGURA 3.5 Densidade espectral da corrente de ruído à saída do multiplicador da FIGURA 2.3. 3.2 REDE NEURONAL CELULAR UNIDIMENSIONAL Para simular diferentes aplicações de redes celulares unidimensional ou bidimensional, utilizando o circuito proposto para a célula FSR, os transistores envolvidos em todas as estruturas presentes na FIGURA 2.6 foram dimensionados conforme apresentado na TABELA 3.4. Os transistores do bloco subtrator, M P1(2)(3)(4), M P1(2)(3)(4)C, M N5(6), M N5(6)C, e os do bloco gerador da corrente de referência I B, M F1(2)(3)(4) e (m)m F4, têm as mesmas dimensões apresentadas na TABELA 3.2. Os valores das tensões de polarização do bloco grampeador são: V BN2 = -407 mv, VB N2C = -182 mv, V BP2 = 377 mv e V BP2C = 118 mv. Este bloco foi projetado para manter a tensão de estado dentro dos limites de +15 mv, faixa de tensão na entrada das sinapses. A característica de transferência do bloco grampeador, obtida por simulação é ilustrada na FIGURA 3.6 e sua potência DC é de aproximadamente 4,8 W. 57

i clamp (A) 6 4 2 0-2 -4-6 -8-30 -20-10 0 10 20 30 40 v (mv) i FIGURA 3.6 Característica de transferência simulada para o bloco grampeador. TABELA 3.4 Razões de aspecto dos transistores da célula FSR da FIGURA 2.6, para a simulação de operações das redes celulares unidimensional e bidimensional. Transistor W / L (µm / µm) M 11, M 3A(B)(C)(D) 0,95 / 1,50 M 12 5,39 / 1,50 M 3CA(B)(C)(D) 15,00 / 1,50 M 4A(B)(C)(D), M 6A(B)(C)(D) 0,60 / 15,90 M 5A(B)(C)(D) 0,60 / 2,87 M 7, M 15 19,94 / 0,60 M 8A 0,30 / 6,45 M 9A 22,5 / 0,60 M 9CA 22,5 / 0,60 M 10A 37,5 / 0,60 M 8B 0,56 / 1,50 M 9B 7,50 / 0,60 M 9CB 7,50 / 0,60 M 10B 37,5 / 0,60 M 13 22,14 / 0,60 M 14 5,39 / 1,50 58

A aplicabilidade e o desempenho da proposta de circuito para a célula neuronal do tipo FSR contida neste trabalho [37] pôde ser inicialmente avaliada pela simulação de uma configuração unidimensional de 16 células em linha na operação denominada CCD (Connected Component Detector). Em uma conhecida configuração de valores iniciais pretos ou brancos para o estado dos pixels, a operação CCD desempenhada pela rede resulta em uma distribuição alternada de pixels pretos e brancos, da direita para a esquerda, tal que o número de pixels pretos (brancos) é igual ao número de agrupamentos de pixels pretos (brancos) presentes no estado inicial, quando o pixel localizado na extremidade esquerda é branco (preto). Os valores dos pesos utilizados nas máscaras do operador CCD situam-se na fronteira da estabilidade do espaço de valores do operador de realimentação da CNN [19], tornando esta aplicação bastante adequada para a avaliação de robustez de diferentes formas de implementação de CNN em circuito elétrico. A máscara da operação CCD [44] foi implementada utilizando correntes de entrada de 30 na, 30 na e -30 na para os pesos da esquerda, de realimentação e direita, respectivamente. Foram atribuídos valores constantes aos estados das células de fronteira esquerda e direita, estes tendo influência direta sobre o comportamento anteriormente descrito para a operação CCD. A simulação utilizando parâmetros nominais do processo atingiu os valores finais de estado dos pixels correspondentes à operação CCD desejada em menos de 6 µs, conforme ilustra a FIGURA 3.7. A potência DC consumida pela rede unidimensional de 16 células, obtida por simulação, é de 538 W. 59

FIGURA 3.7 Resposta transiente de uma CCD de 16 células em linha para diferentes estados iniciais. A tensão de estado constante utilizada na célula de fronteira da borda esquerda é de -15 mv nos exemplos (a) e (b) e para a borda direita igual a -15 mv no exemplo (a) e 15 mv no exemplo (b). 60

3.3 REDE NEURONAL CELULAR BIDIMENSIONAL A avaliação da aplicação e desempenho do circuito proposto para a implementação da célula neuronal do tipo FSR no processamento de imagens pôde ser realizada com a simulação de diferentes operações programadas em uma CNN bidimensional, ampliando os resultados apresentados em [38] com relação ao tamanho da rede e às diferentes operações utilizadas. A rede neuronal celular utilizada possui tamanho 10x10, excluindo-se as células de fronteira, para as quais foram atribuídos valores de estado e de entrada constantes. Ensejando a possibilidade de verificação experimental em um protótipo cuja fabricação foi encomendada (Capítulo 4), também foi simulada uma rede neuronal celular de tamanho 8x8 com a inserção de blocos digitais e blocos de amostragem e retenção que possibilitam a entrada e saída serial de sinais. Doravante, as redes neuronais celulares de tamanhos 10x10 e 8x8 serão denominadas de CNN-A e CNN-B, respectivamente. Na sequência, os resultados de simulação estão apresentados conforme a operação programada na rede neuronal celular. 3.3.1 Detecção de fronteira A operação de detecção de fronteira [45] extrai, como informação relevante de uma imagem em escala de cinzas, suas bordas binárias, que representam transições abruptas entre pixels vizinhos. Esta operação foi simulada na CNN-A e na CNN-B. Em ambas as redes, as correntes utilizadas para o operador sináptico de realimentação (A ) e o operador sináptico de entrada (B) encontram-se indicadas na FIGURA 3.8. 0 0 0-25 na -25 na -25 na 0 100 na 0-25 na 200 na -25 na 0 0 0-25 na -25 na -25 na (A ) (B) FIGURA 3.8 Operadores sinápticos para a detecção de fronteiras. Na simulação desta operação em ambas as redes, a sinapse relativa ao fator de limiar utiliza uma corrente de entrada de -140 na e uma tensão de entrada de +15 mv. As células de 61

fronteira são estabelecidas com valores de tensão de estado e de entrada constantes e iguais a 0 e -15 mv, respectivamente, e o estado inicial da rede corresponde à imagem de entrada. A FIGURA 3.9 e a FIGURA 3.10 apresentam os resultados simulados para diferentes imagens à entrada das redes CNN-A e CNN-B, respectivamente. As tensões de estado iniciais (à esquerda) e finais (à direita), limitadas ao intervalo [-15 mv, 15 mv], são representadas, em uma correspondência linear, por uma escala de tons de cinza. -15 mv -15 mv 0 0 +15 mv +15 mv (A) -15 mv -15 mv 0 0 +15 mv +15 mv (B) FIGURA 3.9 Resultados de simulação da detecção de fronteiras para diferentes imagens à entrada da CNN-A. Imagem inicial à esquerda e imagem final à direita. 62

-15 mv -15 mv 0 0 + 15 mv +15 mv (A) -15 mv -15 mv 0 0 +15 mv +15 mv (B) FIGURA 3.10 Resultados de simulação da detecção de fronteiras para diferentes imagens à entrada da CNN-B. Imagem inicial à esquerda e imagem final à direita. Utilizando uma representação tridimensional para as tensões normalizadas de estado, observa-se na FIGURA 3.11 e na FIGURA 3.12 a evolução temporal e a propagação de sinais na CNN-A, para o exemplo (A), e na CNN-B, para o exemplo (B), respectivamente. A convergência para o estado final esperado foi obtida em 4 µs para a CNN-A e 45,5 µs para a CNN-B. O maior tempo de evolução requerido para a simulação com a CNN-B justifica-se com o aumento da capacitância equivalente total do nó de estado pela adição de blocos de amostragem e retenção, que juntamente ao bloco digital inserido, permitem a aplicação dos valores iniciais dos estados das células serialmente, bem como a obtenção em modo serial dos valores finais destes estados. Deve ficar claro que a inserção de blocos de amostragem e retenção e do bloco digital foi implementada exclusivamente para fins de análise experimental do desempenho da rede, permitindo acessar entradas e saídas das 64 células sem a necessidade de uma grande quantidade de pinos do circuito integrado. Portanto, estes blocos podem ser dispensados na aplicação final da rede. 63

t = 0 µs t = 1,8 µs t = 3,0 µs t = 4,0 µs FIGURA 3.11 Evolução temporal da tensão de estado e propagação de sinais na CNN-A para a imagem de entrada (A) da FIGURA 3.9. 64

t = 0 µs t = 42,0 µs t = 43,5 µs t = 45,5 µs FIGURA 3.12 Evolução temporal da tensão de estado e propagação de sinais na CNN-B para a imagem de entrada (B) da FIGURA 3.10. 3.3.2 Preenchimento de buracos A operação de preenchimento de buracos [46] resulta na transformação de pixels brancos que estejam envolvidos por pixels pretos em pixels pretos. Esta operação foi simulada na CNN-A e na CNN-B. Em ambas as redes, as correntes utilizadas para o operador sináptico de realimentação (A ) e o operador sináptico de entrada (B) encontram-se indicadas na FIGURA 3.13. 0 50 na 0 50 na 50 na 50 na 0 50 na 0 (A ) 65 0 0 0 0 200 na 0 0 0 0 FIGURA 3.13 Operadores sinápticos para o preenchimento de buracos. (B)

Na simulação desta operação, a sinapse relativa ao fator de limiar utiliza uma corrente de entrada de -10 na e -1 na para a CNN-A e CNN-B, respectivamente, e uma tensão de entrada de +15 mv para ambas as redes. As células de fronteira são estabelecidas com valores de tensão de estado e de entrada constantes e iguais à zero, e o estado inicial da rede com todos os pixels em +15 mv. As FIGURA 3.14 e FIGURA 3.15 apresentam os resultados simulados para diferentes exemplos de imagens à entrada das redes CNN-A e CNN-B, respectivamente. As tensões de entrada (à esquerda) e finais de estado (à direita), limitadas ao intervalo [-15 mv, 15 mv], são representadas por uma escala de tons de cinza, em correspondência linear. -15 mv -15 mv 0 0 +15 mv +15 mv (A) -15 mv -15 mv 0 0 +15 mv +15 mv (B) FIGURA 3.14 Resultados de simulação do preenchimento de buracos para diferentes imagens à entrada da CNN-A. Imagem inicial à esquerda e imagem final à direita. 66

-15 mv -15 mv 0 0 +15 mv +15 mv FIGURA 3.15 Resultados de simulação do preenchimento de buracos para CNN-B. Imagem inicial à esquerda e imagem final à direita. Utilizando uma representação tridimensional para as tensões normalizadas de estado, observa-se na FIGURA 3.16 e na FIGURA 3.17 a evolução temporal e a propagação de sinais na CNN-A, para o exemplo (A), e na CNN-B, respectivamente. A convergência para o estado final esperado foi obtida em 4,5 µs para a CNN-A e 25 µs para a CNN-B. Mais uma vez, a presença dos blocos adicionais de amostragem e retenção e do bloco digital explica o maior tempo de evolução na simulação com a CNN-B. t = 1,2 µs t = 2,8 µs t = 4,2 µs t = 4,5 µs FIGURA 3.16 Evolução temporal e propagação de sinais na CNN-A para a imagem de entrada (A) da FIGURA 3.14. 67