Paulo Fábio Figueiredo Rocha. Extensão do Teste F Espectral Local para o caso multivariado com aplicação na detecção objetiva de respostas no EEG

Documentos relacionados
Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

p.1/48 Eduardo Mendes Departamento de Engenharia Eletrônica Universidade Federal de Minas Gerais Av. Antônio Carlos 6627, Belo Horizonte, MG, Brasil

Estudo sobre decodificação iterativa usando códigos de treliça

Capítulo 11 - Projeto de Testes e Escolha de Estruturas

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 05 / Detecção Binária Baseada em

7 Extração de Dados Quantitativos

Estimação da Resposta em Frequência

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

RESTAURAÇÃO E RECONSTRUÇÃO DE IMAGENS. Nielsen Castelo Damasceno

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 02 / Processos Aleatórios

Efeitos da filtragem sobre sinais de onda quadrada

6 Modelo Gamma-Cetuc (GC)

CONHECIMENTOS ESPECÍFICOS

Análise Multivariada Aplicada à Contabilidade

4 Cálculo de Equivalentes Dinâmicos

Estimação e Testes de Hipóteses

Técnicas Multivariadas para Detecção das Respostas Auditivas em Regime Permanente

TESTE DE COMPARAÇÃO MÚLTIPLA

Tratamento Estatístico de dados em Física Experimental

Ruído. Aula 11 Prof. Nobuo Oki

Sistemas e Sinais. Universidade Federal do Rio Grande do Sul Departamento de Engenharia Elétrica

1 O esquema de Alamouti: Diversidade na transmissão

3 Especificação Estatística da Dispersão dos Modos de Polarização em Cabos de Fibra Óptica

Processamento Digital de Sinais. Aplicações da DFT. Prof. Dr. Carlos Alberto Ynoguti

XIII Simpósio Brasileiro de Automação Inteligente Porto Alegre RS, 1 o 4 de Outubro de 2017

Delineamento e Análise Experimental Aula 3

4 Cálculo de Equivalentes Dinâmicos

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Eletroencefalograma no controlo de sistemas biónicos

Aula 2 Uma breve revisão sobre modelos lineares

Filtros Digitais. Filtros básicos, parâmetros no domínio do tempo e frequência, classificação de filtros

Especialização em Engenharia de Processos e de Sistemas de Produção

06/01/2011. Desenvolvendo equipamentos para a avaliação eletrofisiológica. Introdução. Introdução. Potenciais evocados. Avaliação do PEA e do VEMP

Aula 22. Conversão Sigma-Delta (continuação)

Complexidade Computacional do Algoritmo de Detecção de Energia

Rodrigo Pereira David. Técnica de Estimação de Canal Utilizando Símbolos Pilotos em Sistemas OFDM. Dissertação de Mestrado

PRE29006 LISTA DE EXERCÍCIOS #

Análise Estatística de Sistemas de Comunicação Digitais Usando o Diagrama de Olho

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

Transmissão de impulsos em banda-base

Ralph S. Silva

Estimação da função de transferência a partir do diagrama de Bode

Analisador de Espectros

4 Pré-Processamento e Extração de Características

3 Filtro de Kalman Discreto

Uma aplicação importante dos métodos de processamento digital de sinais é na determinação do conteúdo em frequência de um sinal contínuo

Estimação da Resposta em Frequência

5 Agregação das Reservas das Entidades

Métodos Estatísticos em Física Experimental. Prof. Zwinglio Guimarães 1 o semestre de 2015 Aulas 11 e 12

Noções de Exatidão, Precisão e Resolução

José Aparecido da Silva Gama¹. ¹Professor do Instituto Federal de Educação, Ciência e Tecnologia de Alagoas.

O processo de filtragem de sinais pode ser realizado digitalmente, na forma esquematizada pelo diagrama apresentado a seguir:

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

Transmissão de impulsos em banda-base

4 Cálculo de Equivalentes Dinâmicos

9DOXHDW5LVNHUHWRUQRGHXPLQYHVWLPHQWR

VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS

Cap. 9 Comparação entre tratamentos

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Reconhecimento de Padrões de EEG Relacionados a Potenciais Evocados por Foto-Estimulação Intermitente

Instituto Nacional de Pesquisas Espaciais - INPE. Divisão de Processamento de Imagens - DPI

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague

Experimento 5 Circuitos RLC com onda quadrada

Modelos de Regressão Linear Simples - parte III

Correlação e Regressão

Testes de Hipóteses Paramétricos

Transformada Discreta de Fourier

Processamento Digital de Sinais. Notas de Aula. Análise Espectral Usando a DFT

Delineamento e Análise Experimental Aula 4

Processamento de erros grosseiros - Identiمحcaچcﷺao

TP537 Transmissão Digital 1ª Avaliação 27/10/ :00h Prof. Dayan Adionel Guimarães. Aluno(a):

EN2611 Comunicação Digital Lista de Exercícios Suplementares 3 2 quadrimestre 2012

Fernando Nogueira Simulação 1

Um Wrapper para Seleção de Eletrodos em Interfaces Cérebro Computador Baseadas em Imaginação de Movimento

Boas Maneiras em Aprendizado de Máquinas

Introdução aos Sistemas de Comunicações

Filtros de Gabor Da Teoria à Aplicação

3º Trabalho de Laboratório Objectivo Geral: Largura de banda de impulsos; Espectros de sinais básicos; Propriedades da transformada de Fourier.

étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

4 Método Proposto CR AD PA NDVI Descrição geral do modelo

09 de setembro de 2013

Testes de Hipóteses Paramétricos

Fundamentos da Teoria da Probabilidade

1 Técnicas de Seleção de Antenas Transmissoras

GE-814: Introdução à Avaliação Operacional

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Lista de Exercícios GQ1

AJUSTE DE UM MODELO DE SÉRIES TEMPORAIS PARA PREVISÃO DA TEMPERATURA MÍNIMA DO AR PARA LAVRAS/MG EM 2011

Simulação MATLAB - Transmissão PCM em Banda Base e Diagrama de Olho. Testar o efeito de filtros sem ISI no espectro e na curva BERXE b /N 0.

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

rio de Guerra Eletrônica EENEM 2008 Estatística stica e Probabilidade de Variância (ANOVA) 1/24

Econometria Semestre

3 Identificação de Locutor Usando Técnicas de Múltiplos Classificadores em Sub-bandas Com Pesos Não-Uniformes

Testes de hipóteses Paramétricos

6. Aplicação à Séries de Velocidade do Vento

Análise de Desempenho de Sistemas de Comunicações Digitais

Transcrição:

Paulo Fábio Figueiredo Rocha Extensão do Teste F Espectral Local para o caso multivariado com aplicação na detecção objetiva de respostas no EEG Viçosa 2015

Paulo Fábio Figueiredo Rocha Extensão do Teste F Espectral Local para o caso multivariado com aplicação na detecção objetiva de respostas no EEG Dissertação submetida à banca examinadora designada pelo Colegiado do Programa de Pós-Graduação em Engenharia Elétrica da Universidade Federal de Minas Gerais, como parte dos requisitos necessários à obtenção do grau de Mestre em Engenharia Elétrica. Orientadores: Prof. Eduardo Mazoni Andrade Marçal Mendes, Ph.D. Prof. Leonardo Bonato Felix, Dr. Viçosa 2015

Dedico este trabalho aos meus pais e meus irmãos

Agradecimentos Agradeço a todos que de alguma forma contribuíram para que este trabalho fosse feito. Em especial aos orientadores Eduardo Mendes e Leonardo Bonato. À minha família que é um dos motivos de estar realizando este trabalho. Aos amigos que me apoiaram nestes últimos anos. Agradeço, também, à CAPES pelo apoio financeiro.

Resumo Um problema da teoria da detecção de sinais é decidir quanto a presença de informação em determinado sinal. Em especial no processamento de sinais biomédicos, existe a dificuldade em detectar respostas cerebrais evocadas devido a um estímulo externo em detrimento à atividade cerebral quando o indivíduo está em repouso. Para contornar esse problema, são usados métodos de detecção objetiva de respostas, dentre os quais um dos mais usados é o Teste F Espectral (TFE). A versão local do TFE analisa se uma frequência específica é estatisticamente diferente da faixa de frequência vizinha. Para aumentar a probabilidade de detecção de respostas é necessário aumentar o número de pontos da faixa de frequência vizinha, o que limita a aplicabilidade deste detector. Este trabalho propõe uma extensão do TFE para o caso multivariado como forma de melhorar o desempenho do detector, assim como tem sido observado em trabalhos com a extensão de outros métodos de detecção objetiva de respostas. Simulações de Monte Carlo foram feitas para corroborar os resultados teóricos, tais como valores críticos, taxa de falso positivo e probabilidade de detecção. As simulações mostraram que a taxa de falso positivo ficou dentro do nível de significância (5 %) independente do número de sinais ou frequências vizinhas e para uma mesma relação sinal-ruído a probabilidade de detecção aumenta diretamente com o número de sinal. O detector multivariado foi aplicado em sinais de eletroencefalograma (EEG) sob fotoestimulação intermitente (FEI) a 6 Hz e 10 Hz de 12 indivíduos normais. Com a extensão para o caso multivariado, a taxa de detecção tem uma melhora significativa com o uso de pelo menos quatro derivações de canais de EEG, aumentando em cerca de 20 %. Foi observado um aumento da taxa de falso positivo com o aumento do número de canais, porém usando um tamanho de janela suficientemente baixo foi possível obter taxas de falso positivo dentro do nível de significância para até oito canais.

Abstract A problem of signal detection theory is deciding about information presence in a signal. Particularly in biomedical signal processing, there is the difficulty in detecting brain evoked responses due to an external stimulus over the brain activity when the individual is at rest. To solve this problem, objective response detection techniques are used, one of the most widely used methods is the Spectral F Test (SFT). The local STF evaluates whether a specific frequency is statistically different of neighboring frequency band. The improvement in probability of detecting depends on the increase numbers of neighboring frequencies, which restricts the applicability of the detector. This work proposes extension of STF to the multivariate case in order to improve the performance of the detector, as has been observed in studies with the extension of other objective response detection techniques. Monte Carlo simulations were performed to corroborate the theoretical results such as critical values, false positive rate and probability of detecting. The simulations showed that false positive rate was within the significance level (5 %) independent of the signal number or neighboring frequencies and for same signal-to-noise ratio the probability of detection increases directly with the signal number. The multivariate detector was applied to the electroencephalogram (EEG) of 12 normal subjects during intermittent photic stimulation (IPS) to 6 Hz and 10 Hz. With the extension to the multivariate case, detection rate is significantly improved with use of at least four EEG leads, rate is rised by about 20 %. An increase in false positive rate with increasing of channels has been observed, however using low enough window was possible to obtain false positive rates within the significance level for up to eight channels.

Sumário 1 Introdução 1 1.1 Contextualização das técnicas de detecção objetiva de respostas..... 3 1.2 Objetivos................................... 5 1.2.1 Objetivos específicos......................... 5 1.3 Estrutura da Dissertação........................... 6 2 Extensão para o caso multivariado do Teste F Espectral Local 7 2.1 Teste F Espectral Local........................... 8 2.2 Extensão para o Teste F Multivariado................... 11 3 Materiais e Métodos 15 3.1 Simulações de Monte Carlo......................... 15 3.1.1 Valores críticos............................ 16 3.1.2 Probabilidade de detecção...................... 17 3.1.3 Curva ROC.............................. 19 3.2 Sinais de EEG................................ 19 3.2.1 Aquisição dos sinais......................... 20 3.2.2 Pré-processamento.......................... 21 3.2.3 Análise estatística.......................... 23

4 Resultados 24 4.1 Aplicação do Teste F Multivariado em simulações de Monte Carlo... 24 4.1.1 Valores críticos e taxa de falsos positivos.............. 24 4.1.2 Probabilidade de detecção...................... 26 4.1.3 Efeito da correlação nos sinais................... 29 4.1.4 Curva ROC.............................. 31 4.2 Detecção de respostas evocadas....................... 32 5 Discussão 41 6 Conclusão 44 A Trabalhos publicados 46 Refer^encias Bibliográficas 47

Lista de Figuras 2.1 Modelo linear de EEG durante uma estimulação, x[k] é o sinal de estímulo que é filtrado por H(f) resultando na resposta evocada r[k], n[k] é o EEG de fundo e y[k] é o sinal de EEG.................. 8 3.1 Área sob a PDF da distribuição F centralizada indicando a probabilidade de falso positivo................................ 16 3.2 Área sob a PDF da distribuição F não centralizada indicando a probabilidade de detecção.............................. 17 3.3 Sistema internacional 10-20 de posicionamento de eletrodos no escalpo.. 21 4.1 Valores críticos de ˆφ N (f o ) em função de L com nível de significância de 5 %. A linha contínua indica os valores teóricos e a pontilhada os simulados.................................... 25 4.2 Taxa de falso positivo de ˆφ N (), para N = 1, 2, 4 e 8, com L variando de 2 a 48...................................... 25 4.3 Curvas de probabilidade de detecção de ˆφ y (f o ) em função da SNR e para frequências vizinhas L = 8, 16, 32 e 64................... 26 4.4 Curvas de probabilidade de detecção utilizando ˆφ N em função da SNR para N = 1, 2, 4, 6 e 8 com L = 16..................... 27 4.5 Probabilidade de detecção dos sinais y 1 [k] e y 2 [k] em função da SNR de cada sinal para L = 16............................ 27

4.6 Linhas de contorno da superfície da figura 4.5 das P D = 0,25, 0,35, 0,55, 0,75 e 0,95. Além da curva da PD de y 1 [k] em linha pontilhada destacando as SNR de y 1 [k] e y 2 [k] em que P D = 0,95........... 28 4.7 Valores mínimos da SNR para que o sinal a ser adicionado mantenha uma PD de pelo menos 0,95......................... 29 4.8 Comparação das curvas da probabilidade de detecção de ˆφ N em função da SNR de sinais não correlacionados (linha pontilhada) e sinais com correlação de 0,5 (linha contínua), para N = 2 e 8 e L = 16........ 30 4.9 Comparação das curvas da probabilidade de detecção de ˆφ N em função da SNR de sinais não correlacionados (linha pontilhada) e sinais com correlação de 0,9 (linha contínua), para N = 2 e 8 e L = 16........ 30 4.10 Curva da PD com o aumento do número de sinais e da correlação entre eles, com uma SNR fixa de 5 db....................... 31 4.11 Comparação das curvas ROC de ˆφ N (f o ) para N = 1, 2, 4 e 8, com uma SNR fixa de 0 db. A linha pontilhada indica um detector aleatório.... 32 4.12 Valores de ˆφ N calculados na frequência de estimulação e em seus harmônicos do indivíduo 1 com FEI de 6 Hz para a) N = 1, b) N = 2, c) N = 4, d) N = 6 e e) N = 8. O triângulo cheio indica detecção, o triângulo vazio indica falha em detectar e a linha horizontal pontilhada indica o valor crítico do teste em cada caso................. 33 4.13 Valores de ˆφ N calculados na frequência de estimulação e em seus harmônicos do indivíduo 8 com FEI de 10 Hz para a) N = 1, b) N = 2, c) N = 4, d) N = 6 e e) N = 8. O triângulo cheio indica detecção, o triângulo vazio indica falha em detectar e a linha horizontal pontilhada indica o valor crítico do teste em cada caso................. 34 4.14 Taxas de detecção média de todos indivíduos em função do número de canais com FEI de 6 Hz e seu respectivo erro-padrão com janela de 16 s. 37

4.15 Comparação das diferenças entre as taxas de detecção média de acordo com o número de canais pelo teste HSD com nível de confiança de 95 %. FEI de 6 Hz................................... 37 4.16 Taxas de detecção média de todos indivíduos em função do número de canais com FEI de 10 Hz e seu respectivo erro-padrão com janela de 16 s. 38 4.17 Comparação das diferenças entre as taxas de detecção média de acordo com o número de canais pelo teste HSD com nível de confiança de 95 %. FEI de 10 Hz.................................. 38

Lista de Tabelas 3.1 Relação de derivações de EEG utilizadas para detecção com ˆφ N..... 22 4.1 Taxa de detecção de respostas de todos indivíduos para cada número de canais e FEI de 6 Hz com janela de 16 s................... 35 4.2 Taxa de detecção de respostas de todos indivíduos para cada número de canais e FEI de 10 Hz com janela de 16 s.................. 35 4.3 Taxa média de detecção com janelas de 1, 2, 4, 8 e 16 s com FEI de 6 Hz para L = 16.................................. 39 4.4 Taxa média de detecção com janelas de 1, 2, 4, 8 e 16 s com FEI de 10 Hz para L = 16.................................. 39 4.5 Taxa de falso positivo média utilizando ˆφ N de dez indivíduos antes da FEI a 6 Hz para N = 1, 2, 4, 6 e 8 das 20 janelas de tempos de 0,25, 0,5, 1, 2, 4, 8 e 16 s................................. 40

Lista de abreviaturas H 0 Hipótese nula H 1 Hipótese alternativa AUC CSM EEG FEI ICM IID MC MCSM MSC ORD PD PDF Area under the ROC curve Component Synchrony Measure Eletroencefalograma Fotoestimulação intermitente Interface cérebro-máquina Independente e identicamente distribuída Multiple Coherence Multiple Component Synchrony Measure Magnitude-Squared Coherence Objective response detection Probabilidade de detecção Probability density function

PE PEA PESS PEV ROC SNR TFE Potencial evocado Potencial evocado Auditivo Potencial evocado somatossensitivo Potencial evocado visual Receiver operating characteristic Signal-to-noise ratio Teste F Espectral

Capítulo 1 Introdução Um problema recorrente em processamento de sinais é a incerteza em decidir há ocorrência de um evento de interesse. A teoria de detecção de sinais se baseia em ferramentas estatísticas para quantificar a tomada de decisão quanto a presença ou ausência desse evento (Kay, 1998). A aplicação da teoria de detecção está intrinsecamente ligada a relação sinal-ruído (SNR, do inglês signal-to-noise ratio), quanto menor a SNR mais difícil é decidir existência de informação num sinal. A teoria de detecção é utilizada nas mais diferentes áreas do processamento de sinais, sendo o radar uma das primeiras aplicações. Nessa aplicação, um pulso eletromagnético é enviado com o objetivo de ser refletido pelo alvo, o problema é que o sinal refletido é susceptível a muitos ruídos na sua propagação na atmosfera gerando incerteza quanto a presença do alvo (Poor, 1994). A teoria de detecção também é aplicada em outras áreas como sistemas de comunicação, processamento de imagens etc. Pode ser usada no processamento digital de imagens, por exemplo, para determinar algum tipo de adulteração em imagens quando não é possível identifica-la visualmente (Popescu e Farid, 2005); ou para analisar o comportamento de consumidores na localização de produtos em determinada loja (Liu et al., 2008); ou, ainda, para detectar melhores dispositivos que retirem ou afastem peixes de áreas de risco como redes e turbinas

2 (Kemp et al., 2012). Outra área de aplicação da teoria de detecção é a engenharia biomédica, em especial na análise de sinais de eletroencefalograma (EEG). O EEG é o nome que se dá ao registro da atividade elétrica resultante das correntes iônicas que fluem durante as excitações sinápticas entre os neurônios do córtex cerebral (Sanei e Chambers, 2007). Geralmente, os sinais de EEG são registrados por eletrodos espalhados em pontos específicos do escalpo. Visualmente, esses sinais parecem somente ruído, mas existem informações que podem ser interpretadas por um observador experiente (Palaniappan, 2010). O cérebro responde a um estímulo sensorial externo sob forma do que é chamado de potencial evocado (PE) (Chiappa, 1997). Esse processo é usado para explorar informação acerca da integridade de algumas das vias nervosas. Geralmente, são utilizados estímulos: visual, desencadeando no PE visual (PEV); auditivo, desencadeando no PE auditivo (PEA); somatossensitivo, desencadeando no PE somatossensitvo (PESS). A resposta evocada pode ser transitória, quando os estímulos são de baixa frequência, ou em regime permanente, se a frequência da estimulação for suficientemente alta, neste caso a resposta é, em geral, sincronizada ao estímulo. Esse potencial possui uma amplitude muito menor se comparado com o sinal de EEG de fundo, ocasionando em um problema para identifica-lo. Para facilitar a identificação do PE em exames clínicos muitas vezes faz-se o uso da promediação do sinal a fim de aumentar a SNR. Mesmo assim o profissional especializado na identificação pode ter dificuldade nesta análise, levando-o a fazer diagnósticos errados. A utilização de ferramentas estatísticas na detecção dos potenciais evocados, de forma a tornar objetiva e automática, é chamada de detecção objetiva de respostas (ORD, do inglês objective response detection) (Dobie, 1993). Existem diversas técnicas ORD que podem ser aplicadas no domínio do tempo ou no domínio da frequência. Dado que o problema de detecção passa a ser um processo estatístico, com as técnicas ORD, é necessário definir inicialmente as hipóteses estatísticas. A hipótese

3 1.1. Contextualização das técnicas de detecção objetiva de respostas nula (H 0 ) é, em geral, definida como a ausência de resposta, ou seja, só há presença da atividade cerebral de fundo que é considerada um ruído gaussiano de média zero. A hipótese alternativa (H 1 ) é, então, a presença de resposta. O nível de significância de significância do teste é definido a priori, este vai determinar o limiar para rejeição da hipótese nula, de acordo com a distribuição estatística, assim como determinar a probabilidade de cometer erro tipo I, ou seja, rejeitar H 0 quando esta é verdadeira. Desse modo, com as técnicas ORD, a probabilidade de detectar erroneamente uma resposta é igual ao nível de significância estabelecido. Com o passar dos anos diversas técnicas ORD foram desenvolvidas, algumas aprimoradas. Além disso, as aplicações não ficaram restritas apenas na detecção de respostas em casos do ponto de vista puramente clínico, passando a serem usadas, por exemplo, em interfaces cérebro-máquina (ICM). Na próxima seção, serão, então, apresentas algumas das técnicas ORD mais utilizadas. 1.1 Contextualização das técnicas de detecção objetiva de respostas A correlação cruzada foi um dos primeiros métodos utilizados para detecção de respostas. A correlação quantifica o grau de similaridade entre duas funções no domínio do tempo, assim pode-se fazer a correlação entre um sinal padrão com o sinal que se deseja identificar. Quanto mais próximo de um for o coeficiente de correlação, mais similares são os sinais (Dobie, 1993). Como os PEs são obtidos, geralmente, a partir de estímulos rítmicos com frequência bem definida, é interessante utilizar métodos no domínio da frequência para quantificar a similaridade entre sinais (Picton et al., 2003). Um método análogo à correlação, só que no domínio da frequência é a coerência. A coerência também quantifica o grau de similaridade, porém entre os espectros dos respectivos sinais (Bendat e Piersol, 2011).

4 1.1. Contextualização das técnicas de detecção objetiva de respostas A correlação e a coerência são dois métodos clássico para verificar a similaridade entre sinais. O maior problema de ambos é em determinar um critério para significância estatística (Dobie, 1993). Diferente dos métodos a seguir, que são baseados nas distribuições F ou Chi-quadrado, podendo obter mais facilmente os limiares para aceitar ou rejeitar H 0. A partir da função de coerência, Dobie e Wilson (1989) desenvolveram a técnica ORD Magnitude Quadrada da Coerência (MSC, do inglês Magnitude-Squared Coherence) que leva em consideração o módulo e a fase dos sinais de estímulo e de EEG. Porém, ainda neste trabalho, mostraram que se o estímulo for periódico e determinístico, o valor estimado da MSC pode ser obtido apenas com as informações do sinal de EEG. A coerência é nula quando o sinal não apresenta resposta no sinal ou unitária se os sinais forem similares. A Medida de Componente Síncrona (CSM, do inglês Component Synchrony Measure) utiliza apenas a informação da transformada de Fourier dividido num determinado número de segmentos (Fridman et al., 1984). Essa ferramenta quantifica o grau de sincronismo entre as frequências do sinal analisado, sendo que para o caso do sinal ter uma componente periódica, a fase será mesma em cada janela e, então, a medida será igual a um. Existem, também, técnicas ORD que utiliza a informação apenas do módulo da transformada de Fourier, sendo Teste F Espectral (TFE) um exemplo, que é baseado no teste de Fisher de análise harmônica (Fisher, 1929). Esta técnica apresenta duas versões: uma analisa se o módulo na frequência de estimulação é estatisticamente diferente da média de seu espectro vizinho (Zurek, 1992), sendo chamado de TFE Local e outro que compara se existe diferença estatística entre o espectro do sinal antes e depois da estimulação (Dobie e Wilson, 1996), chamado de TFE global. Tendo em vista que, para o aumento nas taxas de detecção de PE com as técnicas ORD, existe a necessidade de um tamanho maior no registro dos sinais - o que nem

5 1.2. Objetivos sempre é viável - Miranda de Sá e Felix (2002) propuseram a extensão da MSC para que pudesse utilizar dois canais de EEG na determinação da detecção de respostas. A Coerência Múltipla (MC, do inglês Multiple Coherence), foi posteriormente expandida para um número N de canais (Miranda de Sá et al., 2004). Em seguida, a CSM também foi expandida para uma versão multivariada (Miranda de Sá e Felix, 2003), a Medida Múltipla de Componente Síncrona (MCSM, do inglês Multiple Component Synchrony Measure). Estas técnicas são as ORD multivariadas ou MORD (Felix et al., 2007). Os resultados obtidos com a extensão para os casos multivariados da MSC e CSM encoraja a propor a extensão de outras técnicas visando uma melhora na taxa de detecção de PE. A expansão do TFE local pode levar a um maior destaque do módulo na frequência de estimulação em detrimento ao seu espectro vizinho, visto que se as amplitudes dos espectros vizinhos de cada N for um ruído gaussiano, eles tenderão na média a se cancelarem. 1.2 Objetivos Este trabalho propõe uma nova técnica MORD, baseada na expansão para o caso multivariado do Teste F Espectral Local, visando obter um detector com melhor performance que o seu análogo de uma variável. 1.2.1 Objetivos específicos ˆ Obter a distribuição estatística, tanto da hipótese nula quanto da alternativa, do novo método para que seja factível usa-lo como uma técnica ORD. ˆ Fazer uso de simulações de Monte Carlo como forma de verificar a estatística do método. ˆ Verificar a aplicabilidade da técnica proposta em sinais de EEG sob fotoestimulação intermitente (FEI).

6 1.3. Estrutura da Dissertação 1.3 Estrutura da Dissertação No capítulo 2 é apresentado os fundamentos teóricos do TFE Local univariado, bem como sua distribuição estatística e a determinação de valores críticos. A partir dessa base é, então, obtida a extensão para o caso multivariado baseado num modelo de EEG linear. A metodologia acerca da aplicação do resultado teórico feito no capítulo 2 é discutida no capítulo 3. Neste capítulo é detalhado como foram realizadas as simulações, bem como a aplicação do novo método nos sinais de EEG. O capítulo 5 são feitas as discussões dos resultados obtidos. Por fim, o capítulo 6, são feitas as considerações finais, além de sugestões de análises futuras.

Capítulo 2 Extensão para o caso multivariado do Teste F Espectral Local Antes que seja obtida a extensão do TFE Local em sua versão multivariada, é importante que se conheça os fundamentos teóricos da univariada. Por isso, primeiramente será apresentado o detector de repostas objetivas TFE Local em sua versão univariada. Para o desenvolvimento teórico será considerado o modelo linear de um EEG da figura 2.1, em que o sinal de EEG y[k] é dado pela soma da resposta evocada r[k] de uma estimulação rítmica x[k] e a atividade de EEG de fundo não correlacionada n[k]. Neste modelo assume-se que r[k] e x[k] estão em sincronia e n[k] é um ruído gaussiano de média zero. Com este modelo é esperado que a resposta seja na frequência de estimulação e em suas harmônicas.

8 2.1. Teste F Espectral Local Figura 2.1: Modelo linear de EEG durante uma estimulação, x[k] é o sinal de estímulo que é filtrado por H(f) resultando na resposta evocada r[k], n[k] é o EEG de fundo e y[k] é o sinal de EEG. 2.1 Teste F Espectral Local O TFE Local é estimado pela razão entre a magnitude do sinal y[k] em uma frequência de estimulação (f o ) e a média das magnitudes das L frequências vizinhas mais próximas: ˆφ y (f o ) = 1 L Y (f o ) 2 o+l/2 i=o L/2 i o Y (f i ) 2 (2.1) onde Y (f o ) é o valor da transformada de Fourier na frequência f o e Y (f i ) são os valores da transformada de Fourier de cada i-ésima frequência vizinha à f o do sinal y[k] (Zurek, 1992). O TFE Local avalia se Y (f o ) 2 é estatisticamente diferente de sua banda vizinha (Miranda de Sá et al., 2010). Considerando que a hipótese nula (H 0 ) é a ausência de resposta evocada, de modo que a única contribuição para o sinal de EEG é a atividade de fundo, isto é, y[k] = n[k]. Sabendo que uma variável x tal que x = ν i=1 x2 i, onde x i possui distribuição gaussiana de média zero e variância σ e cada x i for independente e identicamente distribuída (IID)

9 2.1. Teste F Espectral Local possui distribuição Chi-quadrado central com ν graus de liberdade (Kay, 1998): 1 σ 2 ν x 2 i χ 2 ν (2.2) i=1 Daí, conclui-se que tanto o numerador quanto o denominador de (2.1) possuem distribuição Chi-quadrado independentes e, como possuem parte real e imaginária, com 2 e 2L graus de liberdade, respectivamente. Visto que a razão de duas distribuições Chi-quadrado é uma distribuição F, então, ˆφ y (f o ) sob H 0 possui distribuição F com 2 e 2L graus de liberdade: ˆφ y (f o ) H0 F 2,2L (2.3) O limiar empregado para aceitar ou rejeitar H 0 é valor crítico, que é dado de acordo com a distribuição estatística e o nível de significância α empregado. Como H 0 de ˆφ y (f o ) possui distribuição como indicada em (2.3), a rejeição de H 0, e por conseguinte aceitar a presença de resposta evocada, está condicionada ao valor do teste ˆφ y (f o ) ser maior que o valor crítico dado por: ˆφ ycrit (f o ) = F crit2,2l,α (2.4) em que F crit2,2l,α é o valor crítico da distribuição F com 2 e 2L graus de liberdade para um nível de significância α. A hipótese alternativa (H 1 ) é a presença de resposta evocada (y[k] = r[k] + n[k]). Escrevendo (2.1) em termos de r[k] e n[k]: ˆφ y (f o ) = R(f o) + N(f o ) 2 1 L o+l/2 i=o L/2 i o N(f i ) 2 (2.5) onde R(f o ) e N(f o ) são as transformadas de Fourier na frequência f o de r[k] e n[k],

10 2.1. Teste F Espectral Local respectivamente, e N(f i ) são as transformadas na banda vizinha. Expandindo o numerador de (2.5) (Miranda de Sá et al., 2010): ˆφ y (f o ) = [R(f o) + N R (f o )] 2 + NI 2(f o) (2.6) o+l/2 N(f i ) 2 1 L i=o L/2 i o onde N R (f o ) e N I (f o ) são as partes real e imaginária de N(f o ). Supondo que N(f i ) seja IID com variância σ f, então o denominador de (2.6) possui distribuição Chi-quadrado central com 2L graus de liberdade: 1 σ 2 f o+l/2 i=o L/2 i o N(f i ) 2 χ 2 2L (2.7) Visto que a soma dos quadrados de variáveis independentes com distribuição gaussiana e média diferente zero, possui distribuição Chi-quadrado não-central: 1 σ 2 ν i=1 ( x 2 i χ 2 ν λ = ν i=1 μ 2 x i σ 2 ) (2.8) onde λ é o parâmetro de não-centralidade e μ xi é a média de x i. O numerador de (2.6) também possui distribuição Chi-quadrado não-central devido ao termo R(f o ), assim: [R(f o ) + N R (f o )] 2 + N 2 I (f o) σ 2 f ( ) χ 2 ν λ = R(f o) 2 σf 2 (2.9) De acordo com (Miranda de Sá et al., 2002), o termo de não-centralidade λ pode ser relacionado com a SNR da seguinte forma: λ 2 = R2 (f o ) 2σf 2 = SNR (2.10) Dada a independência entre numerador e denominador a razão entre uma distribuição Chi-quadrado não-central e uma central resulta em uma distribuição F não-central

11 2.2. Extensão para o Teste F Multivariado (Kay, 1998). Assim, (2.6) possui distribuição F não-central com 2 e 2L graus de liberdade: ˆφ y (f o ) H1 F 2,2L(λ = 2 SNR) (2.11) 2.2 Extensão para o Teste F Multivariado Para extensão do TFE Local para o caso multivariado deve-se pensar no modelo linear da figura 2.1 com N sinais de saída (y 1 [k], y 2 [k],...,y N [k]). O Teste F Multivariado proposto é estimado a partir da relação entre a média da potência de todos sinais na frequência f o e a média das médias das potências nas L frequências vizinhas mais próximas: ˆφ N (f o ) = = 1 N 1 N N 1 L j=1 N 1 L j=1 N Y j (f o ) 2 j=1 o+l/2 i=o L/2 i o N Y j (f o ) 2 j=1 o+l/2 i=o L/2 i o Y j (f i ) 2 Y j (f i ) 2 (2.12) onde Y j (f o ) indica a transformada de Fourier em f o do j-ésimo sinal e Y j (f i ) a transformada de Fourier da banda de frequências vizinhas a f o do j-ésimo. É considerada independência entre cada j-ésimo sinal de saída, assim na hipótese nula de ausência de resposta evocada o numerador de (2.12) possui distribuição Chiquadrado central com 2N graus de liberdade:

12 2.2. Extensão para o Teste F Multivariado 1 σ 2 f N Y j (f o ) 2 χ 2 2N (2.13) j=1 O denominador de (2.12) possui a mesma distribuição Chi-quadrado, porém com 2NL graus de liberdade: 1 σf 2 j=1 N 1 L o+l/2 i=o L/2 i o Y j (f i ) 2 χ2 2NL (2.14) Dessa forma, na ausência de resposta, φ N (f o ) possui distribuição F central com 2N e 2NL graus de liberdade: ˆφ N (f o ) H0 F 2N,2NL (2.15) Então, o valor crítico para rejeição de H 0 a um nível de significância α de ˆφ N (f o ) é dado por: ˆφ Ncrit (f o ) = F crit2n,2nl,α (2.16) onde F crit2n,2nl,α é o valor crítico da distribuição F com 2N e 2NL graus de liberdade para um nível de significância α. Escrevendo (2.12) em termos de r[k] e n[k], para analisar a hipótese alternativa de presença de resposta evocada, tem-se: ˆφ N (f o ) = N R(f o ) + N j (f o ) 2 j=1 N 1 L j=1 o+l/2 i=o L/2 i o N j (f i ) 2 (2.17) onde N j (f o ) é a transformada de Fourier na frequência f o de cada j-ésimo sinal, e

13 2.2. Extensão para o Teste F Multivariado N j (f i ) é a transformada de Fourier na banda de frequências vizinhas de cada j-ésimo sinal. Considerando que R(f o ) seja somente real, efetuando a expansão do numerador de (2.17): ˆφ N (f o ) = = = = N j=1 { } [R(f o ) + N j (f o )] [R(f o ) + N j *(f o)] N 1 L j=1 o+l/2 i=o L/2 i o N j (f i ) 2 N [ R 2 (f o ) + 2R(f o )N Rj (f o ) + N j (f o ) 2] j=1 N j=1 N j=1 N 1 L j=1 o+l/2 i=o L/2 i o N j (f i ) 2 [ R 2 (f o ) + 2R(f o )N Rj (f o ) + N 2 Rj (f o) + N 2 Ij (f o) N 1 L j=1 o+l/2 i=o L/2 i o N j (f i ) 2 { [R(f o ) + N Rj (f o )] 2 + N 2 Ij (f o) N 1 L j=1 o+l/2 i=o L/2 i o N j (f i ) 2 } ] (2.18) onde N Rj (f o ) e N Ij (f o ) são, respectivamente a parte real e imaginária de N j (f o ). Assumindo que a presença de resposta evocada não altera a distribuição da banda vizinha a f o, então, assim como denominador de (2.12) o denominador de (2.18) possui distribuição Chi-quadrado central, porém com 2N L graus de liberdade. Já numerador possui distribuição Chi-quadrado não-central devido a presença do

14 2.2. Extensão para o Teste F Multivariado termo R(f o ) em cada j-ésimo sinal: 1 σ f N { [ R(fo) + NRj (f o ) ] 2 + N 2 (f Ij o)} j=1 χ 2 2N ( λ = NR2 (f o ) σ 2 f ) (2.19) Como o numerador e o denominador de (2.18) são independentes e substituindo o parâmetro de não-centralidade λ de acordo com o resultado de (2.10), a distribuição de H 1 é: ˆφ N (f o ) H1 F 2N,2NL(λ = 2N SNR) (2.20) onde F 2N,2NL é a distribuição F não-central com 2N e 2NL graus de liberdade.

Capítulo 3 Materiais e Métodos Neste capítulo são apresentados métodos utilizados para análise da técnica MORD desenvolvida, divididos em simulações de Monte Carlo e aplicação em sinal de EEG durante FEI. A partir das simulações foram estimados os valores críticos, taxa de falsos positivos, probabilidade de detecção de respostas e Curva ROC. Na aplicação em sinais de EEG é descrito o banco de dados utilizado bem como foram realizados os cálculos de taxa de detecção e de falso positivo. 3.1 Simulações de Monte Carlo A simulação de Monte Carlo estima a probabilidade de uma variável aleatória T ser maior que um limiar γ em I iterações. A probabilidade é estimada a partir do número de vezes I γ em que T > γ em uma iteração dividido pelo número de iterações I (Kay, 1998) ˆP = I γ I (3.1) Para as simulações deste trabalho foi usado I = 10000.

16 3.1. Simulações de Monte Carlo 3.1.1 Valores críticos Os valores críticos simulados foram estimados considerando α = 0,05. Os sinais y[k] foram gerados como ruído gaussiano com média zero (simulando ausência de resposta) para o cálculo de ˆφ y (f o ) e ˆφ N (f o ) pela equações 2.1 e 2.12, respectivamente. Os valores críticos foram estimados como sendo o 95º percentil dos menores valores após todas as iterações. A partir do momento em que se define um nível de significância do teste estatístico, é definido, também, a probabilidade de se cometer o erro do tipo I (falso positivo), área sombreada na curva da função densidade de probabilidade (PDF, do inglês - probability density function) indicada na figura 3.1. Então, foram feitas simulações a fim de verificar que essa propriedade é satisfeita, calculando a taxa de falsos positivo. Figura 3.1: Área sob a PDF da distribuição F centralizada indicando a probabilidade de falso positivo.

17 3.1. Simulações de Monte Carlo 3.1.2 Probabilidade de detecção Com o conhecimento das distribuições de H 0 e H 1 é possível calcular a probabilidade de detectar uma resposta em meio a ruídos. A probabilidade de detecção (PD) pode ser calculada pela área sob a curva da PDF de (2.20) a partir do valor crítico dado por (2.16). A figura 3.2 ilustra com a área sombreada o cálculo da PD. Figura 3.2: Área sob a PDF da distribuição F não centralizada indicando a probabilidade de detecção. Uma maneira alternativa de se determinar a PD é através de simulações de Monte Carlo. É calculada a probabilidade de ˆφ N (f o ) ser maior que o valor crítico dado por (2.16) de acordo com (3.1). Para as simulações, foi utilizada a expressão descrita em Miranda de Sá e Infantosi (2002) a fim de gerar o conjunto de variáveis y[k] baseada no modelo da figura 2.1. Nesta equação, x[k] é um trem de impulsos com frequência f o, cuja amplitude é ajustada de acordo com o valor de SNR e n[k] é um ruído gaussiano de média zero:

18 3.1. Simulações de Monte Carlo y[k] = f s SNR x[k] + n[k] (3.2) f o M onde f s é a frequência de amostragem e M o número de amostras da janela utilizada. A Equação (3.2) pode ser passada para o domínio da frequência e ainda usando a relação (2.10), a transformada de Fourier de y[k] na frequência (e harmônicos) de x[k] fica como: Y (f) = 2σf 2 SNR + N(f) (3.3) onde N(f) é a transformada de Fourier de n[k], com variância σ 2 f = L 2. Como o interesse do trabalho é o caso de N sinais, generalizando (3.3) para este caso: Y j (f) = 2σ 2 f SNR + N j(f) (3.4) com j = 1,2,...,N. Na aplicação em simulações foi adotada variância unitária σ 2 f = 1 em (3.4), o número de iterações de 10000 e o nível de significância de 5 %. Em muitas aplicações práticas os sinais não são independentes, o que vai contra os fundamentos teóricos do detector que parte da premissa que os sinais são IID. Nos sinais de EEG, por exemplo, é difícil haver uma independência, até porque alguns eletrodos são colocados próximos uns aos outros, cobrindo regiões do escalpo em que os sinais obtidos podem estar correlacionados em algum nível. Assim, foi realizado um estudo do efeito da correlação na PD. Os sinais com ruído correlacionados foram gerados a partir da equação (3.2) com frequência de amostragem f s = 256 Hz, frequência de estímulo f o = 8 Hz e número de pontos M = 512. O ruído correlacionado foi gerado da seguinte forma: n cj [k] = Un j [k] (3.5)

19 3.2. Sinais de EEG onde U é uma matriz triangular proveniente da decomposição de Cholesky da matriz dos coeficientes de correlação C, de forma que U T U = C (Haugh, 2004). 3.1.3 Curva ROC A curva de características de operação do receptor (ROC, do inglês - receiver operating characteristic) relaciona a probabilidade de falsos positivos com a de verdadeiros positivos, isto é, apresenta uma relação entre os benefícios (verdadeiros positivos) e os custos (falsos positivos) (Zweig e Campbell, 1993). Em um classificador aleatório os benefícios são iguais aos custos, assim a curva ROC é linear entre (0,0) e (1,1) e área sob a curva ROC (AUC, do inglês - area under the ROC curve ) é, então, de 0,5. Um classificador perfeito possui AUC igual a um, ou seja, a probabilidade de verdadeiro positivo é um e falso positivo zero. Logo, quanto mais próximo da unidade for AUC melhor, é o classificador. Para obter a curva ROC foi variado o nível de significância em passos de 0,05, e calculada a PD (verdadeiro positivo) para cada nível de significância (falso positivo). 3.2 Sinais de EEG Os sinais de EEG usados neste estudo foram adquiridos de indivíduos submetidos a fotoestimulação. A fotoestimulação pode desencadear um PEV presente no sinal de EEG. O PEV caracteriza-se por possuir uma amplitude muito pequena quando comparada a atividade elétrica cerebral de fundo e é mais evidenciado nas regiões occipital e parietal do córtex (Ding et al., 2006). Dependendo da frequência de estimulação o potencial pode ser do tipo transitório (PEV-T), quando a frequência de estimulação é menor que 2 Hz, ou de regime permanente (PEV-RP), quando a frequência de estimulação é maior que 4 Hz (Russo e Pitzalis, 2014). O PEV-RP é constituído por uma componente periódica na mesma frequência de estimulação, assim como componentes

20 3.2. Sinais de EEG harmônicos e sub-harmônicos (Bin et al., 2009). A fotoestimulação intermitente (FEI) é um método de ativação que consiste na aplicação de um estímulo visual com uma frequência pré-estabelecida, geralmente por luz estroboscópica, que desencadeia uma resposta fisiológica ou mesmo patológica. Este método é comumente utilizado no EEG clínico como forma de investigar indivíduos potencialmente fotossensíveis (Britto et al., 2008). Além de aplicações clínicas, o PEV, mais especificamente o PEV-RP, tem sido usado em interface cérebro-máquina (ICM) (Friman et al., 2007; Yijun et al., 2005; Pinto, 2011). 3.2.1 Aquisição dos sinais O banco de dados possuem sinais de EEG que foram adquiridos utilizando o eletroencefalógrafo Nihon-Kohden modelo EEG-5414K do Instituto Fernandes Figueira/Fiocruz 1. Os sinais passaram por uma filtragem passa-faixa de 0,1-70 Hz, foram digitalizados pelo conversor A/D DAQpad-MIO-16XE-50, da National Instruments, de 16 bits a uma taxa de amostragem de 256 Hz. O banco de dados é dividido em duas partes, uma com o indivíduo submetido a FEI e outra com o indivíduo em repouso antes da FEI. Com FEI, o banco de dados é composto de EEGs de 12 indivíduos normais, com idade entre 3 e 17 anos (média de 12,4 anos e desvio padrão de 3,6 anos). Sem FEI, o banco de dados possui EEGs de 10 destes 12 indivíduos. Os eletrodos foram posicionados no escalpo de acordo com o Sistema Internacional 10-20 (figura 3.3), tomando como referência o lóbulo auricular ipsilateral, sendo registradas as derivações: occipitais (O1 e O2), parietais (P3 e P4), centrais (C3 e C4), frontais (F3, F4, F7 e F8) e temporais (T3, T4, T5 e T6), além da derivação fronto-polar (Fp1) para verificação de artefatos devido ao movimento ocular. O sinal de ativação da FEI também foi registrado como medida de controle. Os exames foram realizados com FEI de frequência de 6 e 10 Hz com duração de aproximadamente 1 Dados cedidos gentilmente pelo Prof. Ant^onio Maurício Ferreira Leite Miranda de Sá

21 3.2. Sinais de EEG 25 s. Figura 3.3: Sistema internacional 10-20 de posicionamento de eletrodos no escalpo. As derivações utilizadas para aplicar o Teste F Multivariado são mostradas na tabela 3.1. O critério de escolha foi, partindo das derivações occipitais, acrescentar derivações próximas à região occipital. 3.2.2 Pré-processamento Os resultados das detecções de respostas evocadas foram obtidos com a estimação de ˆφ N (f o ) através da equação (2.12) com 16 bandas laterais. Para os testes foram

22 3.2. Sinais de EEG Tabela 3.1: Relação de derivações de EEG utilizadas para detecção com ˆφ N N = 1 N = 2 N = 4 N = 6 N = 8 Derivações utilizadas O1 O1 e O2 O1, O2, P3 e P4 O1, O2, P3, P4, C3 e C4 O1, O2, P3, P4, C3, C4, T5 e T6 utilizadas janelas de 1, 2, 4, 8 e 16 s, de forma que se possa verificar a influência do tempo. A taxa de detecção foi calculada a partir da detecção da resposta em cada harmônico da frequência de estimulação. Os EEGs sem estimulação foram usados no cálculo da taxa de falsos positivos. Diferentemente da taxa de detecção, a taxa de falso positivo foi calculada aplicando o detector ˆφ N (f o ) em toda a faixa de frequência, respeitando os limites das L/2 primeiras e últimas frequências. Outra diferença é que foram usadas 20 janelas, sendo a taxa de falso positivo a taxa média das 20 janelas, para que se tenha um maior número de pontos no teste e, além das janelas de tamanho já usados para o cálculo da taxa de detecção, foram usadas janelas de 0,25 e 0,5 s. O problema em usar essa quantidade de janelas para obter a taxa de falso positivo, é que o banco de dados não possui gravação de EEG suficiente para atender todos os tamanhos de janela, visto que os sinais possuem aproximadamente uma gravação de 25 s. Para que todos os sinais possuíssem o mesmo tamanho, foram tomados os 20 s primeiros de cada sinal. Assim, apenas os casos com janelas 0,25, 0,5 e 1 s possuem trechos inéditos. Para os outros casos, em que não é possível serem divididos em 20 janelas, foram criados sinais de EEG artificial conforme descrito em (Lotte, 2011). As janelas faltantes foram criadas dividindo o sinal em subjanelas com um quarto do tamanho da janela. Depois, essas subjanelas são concatenadas até que se tenha um sinal com tamanho necessário. Por exemplo, para gerar janelas de 16 s são divididos

23 3.2. Sinais de EEG quatro segmentos de 4 s, sendo possível criar 23 novos sinais de EEG, contudo são necessários 19 para que se complete as 20 janelas. 3.2.3 Análise estatística Para avaliar se há melhora na taxa de detecção com o aumento do número de canais é significativa, foi feita uma análise post hoc aplicando o teste HSD de Tuckey-Kramer (Abdi e Williams, 2010), após realização da análise de variância (ANOVA) com teste estatístico F. Este teste verifica se existe uma diferença significativa entre as médias (duas a duas) a um nível de confiança β, permitindo, assim, fazer uma comparação múltipla entre as médias das taxas de detecção para N. O nível de confiança utilizado foi de 95 %.

Capítulo 4 Resultados Este capítulo é dividido em duas seções, uma para mostrar os resultados obtidos com as simulações de Monte Carlo (sempre que possível serão comparados aos resultados teóricos) e outra com os resultados da aplicação em sinais de EEG sob FEI. 4.1 Aplicação do Teste F Multivariado em simulações de Monte Carlo 4.1.1 Valores críticos e taxa de falsos positivos Os valores críticos de ˆφ N (f o ), tanto calculados com (2.16) quanto estimados por simulação, são mostrados na figura 4.1. Para esta simulação foram usados N = 1, 2, 4 e 8, variando o número de frequências vizinhas L de 2 a 48 em passos de duas unidades. Como pode ser visto existe pouca diferença entre valores simulados e calculados. Como mostrado na figura 4.2 a taxa de falso positivo ficou em torno de 5 % (nível de significância usado) independente do número de sinais (N = 1, 2, 4, 6 e 8). Isso mostra que a taxa de falso positivo não se altera por conta da redução dos valores críticos com o aumento de N.

25 4.1. Aplicação do Teste F Multivariado em simulações de Monte Carlo Figura 4.1: Valores críticos de ˆφ N (f o ) em função de L com nível de significância de 5 %. A linha contínua indica os valores teóricos e a pontilhada os simulados. Figura 4.2: Taxa de falso positivo de ˆφ N (), para N = 1, 2, 4 e 8, com L variando de 2 a 48.

26 4.1. Aplicação do Teste F Multivariado em simulações de Monte Carlo 4.1.2 Probabilidade de detecção As curvas de PD do detector ˆφ y, tanto teóricas (em linhas contínuas) como simuladas (em linhas pontilhadas), em função de SNR para N = 1 e L = 8, 16, 32 e 64 são mostradas na figura 4.3. Para a simulação, as populações de sinais simulados foram gerados a partir da equação (3.4). Figura 4.3: Curvas de probabilidade de detecção de ˆφ y (f o ) em função da SNR e para frequências vizinhas L = 8, 16, 32 e 64. Para comparar as curvas de PD teóricas e simuladas com N = 1, 2, 4, 6 e 8, foram usadas L = 16 frequências vizinhas, além de considerar uma mesma SNR em todos os canais. As curvas de PD obtidas pelo detector multivariado são mostradas na figura 4.4, as linhas contínuas indicam as curvas teóricas e pontilhadas as simuladas. Comparando este resultado com o mostrado na figura 4.3, fica evidente que tanto o aumento de N quanto de L melhora a probabilidade de detecção. Porém, observe-se que a melhora com o aumento do número de sinais é mais expressiva. Já a superfície da figura 4.5 mostra a PD para o caso quando as SNRs de y 1 [k] e y 2 [k] são variadas de forma independente.

27 4.1. Aplicação do Teste F Multivariado em simulações de Monte Carlo Figura 4.4: Curvas de probabilidade de detecção utilizando ˆφ N em função da SNR para N = 1, 2, 4, 6 e 8 com L = 16. Figura 4.5: Probabilidade de detecção dos sinais y 1 [k] e y 2 [k] em função da SNR de cada sinal para L = 16.

28 4.1. Aplicação do Teste F Multivariado em simulações de Monte Carlo As linhas de contorno da superfície da figura 4.5, para P D = 0,25, 0,35, 0,55, 0,75 e 0,95, juntamente com curva da PD apenas de y 1 [k] são mostradas na figura 4.6. Nesta figura são destacadas, com linhas tracejadas e setas, as menores SNRs para as quais probabilidade de detecção é igual 0,95. Através da figura 4.6 é possível obervar que para N = 1 a menor SNR para obter uma probabilidade de detecção de 0,95 é de aproximadamente 9,1 db, para manter a mesma probabilidade com N = 2 é necessária uma SNR de aproximadamente 2,9 db. A figura 4.7 mostra os valores mínimos de SNR até o nono sinal que mantém a probabilidade de detecção de 0,95. Note que a medida que N aumenta a SNR para manter a probabilidade de detecção é menor. Figura 4.6: Linhas de contorno da superfície da figura 4.5 das P D = 0,25, 0,35, 0,55, 0,75 e 0,95. Além da curva da PD de y 1 [k] em linha pontilhada destacando as SNR de y 1 [k] e y 2 [k] em que P D = 0,95.

29 4.1. Aplicação do Teste F Multivariado em simulações de Monte Carlo Figura 4.7: Valores mínimos da SNR para que o sinal a ser adicionado mantenha uma PD de pelo menos 0,95. 4.1.3 Efeito da correlação nos sinais A figura 4.8 mostra as curvas de PD em função da SNR para sinais correlacionados (linha pontilhada) e compara com as curvas de PD de sinais não correlacionados (linha contínua). Nessa figura é mostrado o caso de N = 2 e 8, o nível de correlação entre os sinais é de 0,5. Para baixas SNR observa-se uma PD maior com sinais correlacionados, já para altas SNR a PD é menor. A PD para o caso de SNR baixa é um indício de que a taxa de falso positivo se eleva acima do nível de significância quando os sinais são correlacionados. Para uma correlação de 0,9 é ainda mais evidente essas alterações na curva de probabilidade de detecção, como mostrado na figura 4.9 A figura 4.10 mostra a PD quando varia N de 2 a 8 e a correlação de 0,1 a 0,99 para uma SNR fixa de 5 db. Com esse resultado é possível observar que para um mesmo número de sinais a probabilidade de detecção diminui com o aumento da correlação dos sinais.

30 4.1. Aplicação do Teste F Multivariado em simulações de Monte Carlo Figura 4.8: Comparação das curvas da probabilidade de detecção de ˆφ N em função da SNR de sinais não correlacionados (linha pontilhada) e sinais com correlação de 0,5 (linha contínua), para N = 2 e 8 e L = 16. Figura 4.9: Comparação das curvas da probabilidade de detecção de ˆφ N em função da SNR de sinais não correlacionados (linha pontilhada) e sinais com correlação de 0,9 (linha contínua), para N = 2 e 8 e L = 16.

31 4.1. Aplicação do Teste F Multivariado em simulações de Monte Carlo Figura 4.10: Curva da PD com o aumento do número de sinais e da correlação entre eles, com uma SNR fixa de 5 db. 4.1.4 Curva ROC Para avaliar a performance do Teste F multivariado como detector foram feitas curvas ROC para diferentes números de sinais. Com uma SNR de 0 db foram obtidas as curvas ROC do detector de respostas ˆφ N (f o ) com o incremento do número de sinais (N = 1, 2, 4 e 8), que são mostradas na figura 4.11. A linha pontilhada mostra um detector aleatório, servindo para auxiliar na interpretação da curva ROC. Quanto mais distante do detector aleatório, maior é a AUC, ou seja, maior é capacidade do teste detectar respostas.

32 4.2. Detecção de respostas evocadas Figura 4.11: Comparação das curvas ROC de ˆφ N (f o ) para N = 1, 2, 4 e 8, com uma SNR fixa de 0 db. A linha pontilhada indica um detector aleatório. 4.2 Detecção de respostas evocadas As figuras 4.12 e 4.13 mostram os valores de ˆφ N em cada harmônico quando a FEI é de 6 Hz do indivíduo 1 e 10 Hz do indivíduo 8, respectivamente. Os valores foram calculados com janela de de 16 s para L = 16. É evidente a melhora na detecção de respostas, pela quantidade de picos acima do valor crítico (linha horizontal pontilha), indicados com o triângulo cheio. Nas frequências em que não foi detectada resposta estão indicadas com o triângulo vazio. As taxas de detecção de cada indivíduo para janela de 16 s, dada a relação de canais da tabela 3.1, são mostradas nas tabelas 4.1 e 4.2 com FEI de 6 Hz e 10 Hz, respectivamente. Observa-se que na média sempre houve um aumento na taxa de detecção com o aumento do número de canais. Apesar deste aumento, alguns indivíduos tiveram uma oscilação com incremento de N e em apenas um caso (indivíduo 12 com FEI de 10 Hz) com N = 8 a taxa foi menor que com N = 6 (observar tabela 4.2), nos outros casos pelo menos manteve a mesma taxa entre seis e oito canais.

33 4.2. Detecção de respostas evocadas (a) (b) (c) (d) (e) Figura 4.12: Valores de ˆφ N calculados na frequência de estimulação e em seus harmônicos do indivíduo 1 com FEI de 6 Hz para a) N = 1, b) N = 2, c) N = 4, d) N = 6 e e) N = 8. O triângulo cheio indica detecção, o triângulo vazio indica falha em detectar e a linha horizontal pontilhada indica o valor crítico do teste em cada caso.

34 4.2. Detecção de respostas evocadas (a) (b) (c) (d) (e) Figura 4.13: Valores de ˆφ N calculados na frequência de estimulação e em seus harmônicos do indivíduo 8 com FEI de 10 Hz para a) N = 1, b) N = 2, c) N = 4, d) N = 6 e e) N = 8. O triângulo cheio indica detecção, o triângulo vazio indica falha em detectar e a linha horizontal pontilhada indica o valor crítico do teste em cada caso.

35 4.2. Detecção de respostas evocadas Tabela 4.1: Taxa de detecção de respostas de todos indivíduos para cada número de canais e FEI de 6 Hz com janela de 16 s. Indivíduo Taxa de detecção (%) N = 1 N = 2 N = 4 N = 6 N = 8 1 84,21 89,47 94,74 94,74 100,0 2 36,84 52,63 52,63 57,89 57,89 3 63,16 73,68 78,95 84,21 89,47 4 26,32 36,84 57,89 73,68 73,68 5 42,11 42,11 42,11 52,63 52,63 6 68,42 73,68 68,42 68,42 73,68 7 42,11 47,37 47,37 68,42 89,47 8 26,32 63,16 78,95 78,95 89,47 9 52,63 57,89 63,16 63,16 68,42 10 36,84 57,89 68,42 78,95 78,95 11 42,11 57,89 63,16 68,42 73,68 12 21,05 42,11 42,11 52,63 52,63 Média 45,18 57,89 63,16 70,18 75,00 Tabela 4.2: Taxa de detecção de respostas de todos indivíduos para cada número de canais e FEI de 10 Hz com janela de 16 s. Indivíduo Taxa de detecção (%) N = 1 N = 2 N = 4 N = 6 N = 8 1 66,67 83,33 100,0 100,0 100,0 2 33,33 66,67 66,67 75,00 75,00 3 66,67 75,00 83,33 91,67 100,0 4 58,33 58,33 75,00 83,33 83,33 5 50,00 58,33 58,33 58,33 58,33 6 91,67 83,33 100,0 100,0 100,0 7 58,33 50,00 91,67 91,67 91,67 8 75,00 100,0 100,0 100,0 100,0 9 58,33 66,67 58,33 58,33 58,33 10 41,67 75,00 75,00 91,67 100,0 11 83,33 83,33 91,67 91,67 91,67 12 25,00 25,00 50,00 100,0 91,67 Média 59,03 68,75 79,17 86,81 87,50