AGRUPAMENTO EVOLUTIVO APLICADO AO RECONHECIMENTO DE PADRÕES EM DADOS MÉDICOS

AGRUPAMENTO EVOLUTIVO APLICADO AO RECONHECIMENTO DE PADRÕES EM DADOS MÉDICOS Lourenço Bueno, Pyramo Costa, Enderson Cruz, Israel Mendes, Daniel Leite Programa de Pós-Graduação em Engenharia Elétrica, Pontifícia Universidade Católica de Minas Gerais, Brasil Centro Federal de Educação Tecnológica de Minas Gerais, Belo Horizonte, Brasil Centro Federal de Educação Tecnológica de Minas Gerais, Nepomuceno, Brasil Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Minas Gerais, Brasil Emails: lourenco.bueno@sga.pucminas.br, pyramo@pucminas.br, enderson.bh@gmail.com, professorisraelt@gmail.com, danfl7@dca.fee.unicamp.br Abstract Recognition of patterns of disease progression from data requires the use of advanced computational methods. These methods should be able to group similar data together and dissimilar data into different clusters. Given the medical context, data are generally obtained under adverse conditions, such as uncertainties and nonstationarities, which can be related to both the environment and the patient. A number of correlated variables are involved; however, it is infeasible to monitor all of them. This paper evaluates and compares the performance of well-known evolving methods for clustering data streams. The methods used in the evaluation are: evolving Fuzzy Clustering (eclustering + ); evolving Clustering Method (ecm); and evolving Granulation Method (egm). Computational experiments were performed using four benchmark datasets in the context of medical diagnosis, namely, Heart Disease, Cancer, Breast Cancer and Parkinson Telemonitoring. Keywords Evolving Clustering. Intelligent Systems; Pattern Recognition. Resumo O reconhecimento de padrões de progressão de doenças a partir de dados requer a utilização de métodos computacionais sofisticados. Estes métodos devem ser capazes de separar os dados em grupos de acordo com semelhanças observadas. Considerando o contexto médico em geral, os dados são adquiridos sob circunstâncias adversas como incertezas e não-estacionariedades relativas tanto ao ambiente como ao paciente propriamente dito. Muitas variáveis correlacionadas podem estar envolvidas, mas o monitoramento de todas elas é infactível. Este artigo propõe avaliar e comparar o desempenho de três conhecidos métodos evolutivos de agrupamento de dados sequenciais (fluxos de dados) no contexto de diagnóstico médico. Os métodos usados na avaliação são os seguintes: evolving Fuzzy Clustering (eclustering + ); evolving Clustering Method (ecm); e evolving Granulation Method (egm). Experimentos computacionais foram realizados considerando bases de dados padrões como Heart Disease, Cancer, Breast Cancer e Parkinson Telemonitoring. Palavras-chave Agrupamento Evolutivo; Sistemas Inteligentes; Reconhecimento de Padrões. 1 Introdução O reconhecimento incipiente de certos tipos de doenças através da análise de sintomas típicos pode salvar vidas. No contexto de diagnóstico médico é comum que um grande volume de dados seja coletado sob as mais diversas condições. Isso causa dificuldades de análise de dados a partir da intuição e do uso de métodos estatísticos convencionais. Sistemas inteligentes evolutivos apresentam características interessantes para lidar com incertezas e informação incompleta inerente à ambientes não-lineares e não-estacionários - como é o caso de diagnóstico médico. Dentre estas características está a capacidade de adaptação contínua dos parâmetros e da estrutura de modelos sempre que novas informações são disponibilizadas. O conhecimento atual a respeito de um fenômeno (o modelo atual) pode ser revisto quando os dados coletados são diferentes daqueles vistos anteriormente. Modelos baseados em redes neurais artificiais, modelos baseados em regras fuzzy, e híbridos são representações possíveis no contexto de sistemas inteligentes. Modelos evolutivos têm sido aplicados com sucesso a uma variedade de situações [7] [3]. Uma vertente da pesquisa em sistemas inteligentes evolutivos diz respeito à separação incremental de fluxos de dados em grupos (modelos locais), e à associação de rótulos de classes aos diferentes grupos. Algoritmos para agrupamento evolutivo monitoram fluxos de dados e adaptam os parâmetros de modelos locais quando conveniente. Além disso, quando os dados são suficientemente discrepantes do esperado, novos neurônios (em modelos neurais) ou novas regras (em modelos fuzzy) podem ser criados. A possibilidade de modificar a estrutura de modelos para incluir novas classes oferece flexibilidade à representação de sistemas variantes no tempo. Ao agrupar por espalhamento (the scattering approach for data clustering [10]) diferentemente de grid, permite o desenvolvimento de modelos locais em modo online e em domínio aberto. Protótipos de modelos locais são geralmente determinados por um vetor centro e uma matriz de dispersão (representação de grupos através de hiperesferas ou elipsoides), ou por vetores com va- 1240

lores limites (representação de grupos através de hiper-retângulos). Uma medida de similaridade determina a qual protótipo um novo vetor de dados deve ser associado. Através de camadas de processamento, a informação contida nos dados é comparada com o modelo atual e agregada para prover um valor de saída, i.e., um rótulo de classe. Os algoritmos de agrupamento evolutivo investigados neste artigo usam a abordagem de agrupamento por espalhamento. A proposta deste estudo é classificar dados médicos em classes a partir do uso de diferentes e conhecidos modelos de agrupamento evolutivo. Foram considerados os seguintes: evolving Fuzzy Clustering (eclustering + ) [3]; evolving Clustering Method (ecm) [7]; e evolving Granulation Method (egm) [10]. Atualmente não existe consenso sobre qual desses algoritmos é o mais eficiente em problemas de médio porte, como os problemas de classificação tratados aqui. Os problemas considerados para avaliação de desempenho dos diferentes algoritmos são problemas de classificação binária (separação de duas classes apenas) cujos dados estão disponíveis no Repositório de Dados da Universidade da Califórnia em Irvine. São eles: Heart Disease, Cancer, Breast Cancer e Parkinson Telemonitoring. O restante deste artigo está organizado da seguinte maneira. A Seção II apresenta uma visão geral sobre sistemas inteligentes evolutivos e revê brevemente os três métodos de agrupamento evolutivo sob investigação. A Seção III mostra resultados comparativos para os problemas de classificação de dados médicos. A Seção IV contém as conclusões e sugere possíveis trabalhos futuros. 2 Sistemas Inteligentes Evolutivos Sistemas inteligentes evolutivos é um paradigma recente no campo da inteligência de máquina que visa suprir a demanda por métodos de modelagem de processos variantes no tempo usando dados sequenciais. Sistemas evolutivos neurais e fuzzy podem ser inspirados no comportamento de redes neurais biológicas e na evolução de indivíduos durante seu ciclo de vida: aprendendo a partir da experiência, herança, mudança gradual, e informação incompleta e incerta. Conhecimento é gerado a partir de tarefas repetitivas e de fluxos de dados reais ou granulares produzidos através de percepções e enviados ao cérebro. O desenvolvimento de modelos evolutivos é gradual, i.e., regras fuzzy e/ou neurônios não são fixos nem pré-definidos, mas gerados sempre que novos dados são suficientemente informativos e não são comuns ao modelo/entendimento atual. A principal diferença entre modelos evolutivos e demais modelos de inteligência computacional é que modelos evolutivos podem ser construídos e adaptados ao longo do tempo sem a necessidade de usufruir de dados de instantes passados [6] [13]. Segundo [7], redes neurais e modelos de regras fuzzy são considerados evolutivos quando: (i) há aprendizado contínuo a partir de fluxos de dados; (ii) não há necessidade de armazenar amostras vistas anteriormente já que os cálculos associados são sempre recursivos; e (iii) independem das propriedades estatísticas de dados históricos. Em geral, pouco (ou nada) se sabe sobre as regras iniciais que governam a dinâmica do processo; e não se tem informação sobre os protótipos (grânulos) iniciais. O processo é conhecido à medida que os dados são disponibilizados. Um algoritmo incremental processa os dados e é responsável por capturar as informações essenciais. De uma maneira geral, pode-se pensar em modelos evolutivos como estruturas de três camadas. A primeira camada contém modelos locais resultantes do agrupamento de dados. A partir de uma medida de similaridade, os dados são associados a um grupo existente ou formam um novo grupo. A segunda camada consiste de funções localmente válidas associadas aos grupos. Funções locais são fundamentais em problemas de regressão e predição. Nesses casos, um polinômio de ordem 1 ou superior pode ser considerado. Em problemas de classificação, a função local é um polinômio de ordem 0. Em outras palavras, a função é simplesmente um valor constante (o rótulo de uma classe). A terceira camada consiste de um procedimento ou mecanismo para fusão de informação, i.e., as contribuições locais são agregadas para prover uma saída global. 2.1 Evolving Fuzzy Clustering - eclustering + O agrupamento incremental por espalhamento é uma técnica para identificação automática de estruturas de sistemas fuzzy [5] [4]. Métodos convencionais de agrupamento não toleram sobreposição de grupos, o que impossibilita a formulação de antecedentes de regras fuzzy. A Fig. 1 mostra a formação de dois grupos sobrepostos. A projeção dos grupos nos eixos em questão podem ser associadas à funções de pertinência de distribuição normal parcialmente sobrepostas. O al- Figura 1: Formação de dois grupos de dados sobrepostos [1] 1241

goritmo eclustering + descrito nessa seção tem o propósito de agrupar fluxos de dados - essencialmente da forma como ilustrado na Fig. 1. Os grupos podem ser usados na constituição de termos antecedentes de regras fuzzy. Em seguida, enfatiza-se o método de agrupamento incremental proposto em [1]. O método é baseado em elipsoides e funções de pertinência Gaussianas. Particiona-se o espaço de entrada via um estimador recursivo de parâmetros e uma medida de densidade. A densidade da distribuição dos dados é calculada a partir de uma função montanha do tipo (ver [14]): M(v) = k i=1 v i z i 2 e 2σ i 2 (1) onde v i é um elemento do vetor centro de um grupo; z i é um elemento do vetor de dados de um grupo;. 2 é a norma 2; σ i é um fator de dispersão; e k é um índice de amostras. A densidade D t das amostras de uma coleção z t assemelha-se a distribuição de probabilidade chamada de Parzen windows [12]. Isso pode ser descrito pela função de Cauchy [4]: D t (z t ) = 1 + 1 t 1 t 1 1 n+m z tj z ij 2 i=1 D 1 (z 1 ) = 1; t = 2, 3,...n (2) D t (z t ) é a densidade avaliada em torno da última amostra do fluxo de dados; n é a dimensão do vetor de entrada; m é a dimensão do vetor de saída; e t é um índice de amostras. Recursivamente, a densidade D t (z t ) é calculada a partir da seguinte relação: D t (z t ) = (t 1)( n+m t 1 ztj 2 + 1) + b t 2 n+m z tj c tj D 1 (z 1 ) = 1; t = 2, 3,...n; n+m b t = b t 1 + z (t 1)j 2; b 1 = 0; c tj = c (t 1)j + z (t 1)j ; e c 1j = 0; (3) Conhecida como estimador recursivo de densidade (RDE), a equação (3) é eficiente para estimação online da densidade das amostras de um grupo. RDE garante que as funções de pertinência de conjuntos fuzzy sejam formadas em torno de pontos focais de grupos. Evitam-se problemas relacionados à especificação de limites de grupos através do uso de funções de Cauchy. Diferentemente de funções Gaussianas, funções de Cauchy não se espalham ao infinito, o que evita a ativação de todas as regras fuzzy para uma amostra. Para cada interação de (3), se o dado atual é selecionado para ser o foco de um grupo, a sua densidade será determinada neste momento. A densidade na vizinhança do ponto focal é atualizada a partir de (ver [4]): D t (z i ) = t 1 t 1 + (t 2)( 1 D t 1(z i ) 1)G n+m G = (z tj z (t 1)j ) D t (z i ) = 1, t = 2, 3,... (4) onde i representa o foco da i -ésimo grupo. Um classificador fuzzy, conhecido como eclass de ordem zero [2], usa o resultado de eclustering + na descrição de regras do tipo: R i : SE (x 1 é X i1 ) E... E (x n é X in ) ENTÃO (y i é Classe c ) Classe c é um rótulo de classe e X ij j são funções de pertinência de Cauchy [8]. 2.2 Método de Clusterização Evolutivo - ecm O método ecm foi proposto para desenvolvimento gradual da segunda camada de sistemas de inferência neuro-fuzzy evolutivos (DENFIS), ver [7]. Sua função é particionar o espaço de entrada em grupos, de acordo com os dados de um fluxo. O método consiste na criação e adaptação contínua de parâmetros de grupos de modo que a distância máxima de uma amostra x i ao centro de qualquer grupo existente não seja maior que um certo limiar de distância, D thr. Distâncias são calculadas a partir da norma 2 (métrica Euclidiana). Por exemplo, a distância entre dois vetores, x = (x 1,..., x q ) e y = (y 1,..., y q ), é dada por: ( q ) 1/2 x y 2 = x i y i 2 i=1 (5) Neste caso x pode representar um vetor de dados, e y um vetor contendo as coordenadas do centro de um grupo. Somente pontos centrais de clusters são utilizados como protótipos em ecm; amostras de dados são lidas e descartadas. Mudanças no limiar 1242

de distância D thr alteram o número de grupos gerados para um mesmo conjunto de dados. O algoritmo de aprendizado incremental ecm é sumarizado a seguir em seis passos. Passo1: Ler amostra x k, onde k = 1,... é índice de tempo Passo2: Se k = 1, criar cluster C 1, com raio r 1 = 0 e centro c 1 = x k Passo 1 Passo3: Calcular D = x k c j 2, e S k = D + r j, onde c j é o centro do cluster mais próximo, r j é o raio deste cluster. Passo4: Se D < r j, a amostra x k pertence àquele cluster. Passo 1 Passo5: Se S k > 2 D thr, então criar cluster C novo com raio r novo = 0 e centro c novo = x k Passo 1 Passo6: Se S k < 2 D thr,então o cluster C j é expandido. O seu novo raio passa a ser: r atualizado = S k /2 Passo 1 Em ecm, um cluster C j não é mais atualizado quando seu raio r uj atinge um valor igual ao limiar D thr [7]. Note que, diferentemente do algoritmo eclustering + (onde os grupos são elipsoides no espaço de entrada), o algoritmo ecm lida com hiperesferas. Note também que o algoritmo ecm descrito acima claramente enfatiza a essência de abordagens de aprendizado orientadas à fluxo de dados. Amostras são lidas e descartadas uma a uma. Dados históricos são dispensáveis, e a evolução dos grupos acontece gradualmente, em uma base incremental. 2.3 Método Granular Evolutivo - egm Modelos granulares evolutivos levam em consideração a imprecisão e incerteza do valor dos dados mensurados. Além disso, informação baseada na percepção pode ser considerada como grânulo de informação [11]. Por exemplo, são dados possíveis de serem processados por algoritmos granulares: x é pequeno, aproximadamente 90 e temperatura alta. Em geral, dados granulares (intervalos ou intervalos fuzzy) podem ser considerados. Neste artigo processamos dados numéricos (valores reais) apenas. O algoritmo egm original [10] não necessita ser alterado para este propósito. Seja um fluxo de dados de entrada e saída (x, y) [h], h = 1,...; a saída y [h] é conhecida dada a entrada x [h] ou será conhecida no passo seguinte. Cada atributo x j de x = (x 1,..., x n ) é um valor real; y [h] é um rótulo de classe. Funções de pertinência trapezoidais M i j = (li j, λi j, Λi j, Li j ), i = 1,..., c; j = 1,..., n são consideradas neste estudo. Grupos egm são hiper-retângulos fuzzy no espaço de entrada. O número de grupos c é variável. Inicialmente, não há grupos. O propósito de adaptar simultaneamente os parâmetros e a estrutura de modelos fuzzy dinâmicos do tipo egm é usar a informação atual sobre o processo para manter uma representação atualizada. Regiões de expansão E i, tais como: E i = [L i ρ, l i + ρ], (6) ajudam a decidir se novos dados de entrada pertencem a um grânulo no espaço de entrada. ρ significa a largura máxima que conjuntos fuzzy M i podem expandir para encapsular os dados x. Um grânulo M i é formado a partir de conjuntos fuzzy M i ψ, ψ = 1,..., Ψ. Uma regra egm (um grupo) é criada sempre que um ou mais elementos de x não pertencem às regiões de expansão E i de M i, i = 1,..., c. Um novo grânulo M c+1 é construído a partir de conjuntos fuzzy M c+1 ψ, ψ = 1,..., Ψ, cujos parâmetros coincidem com x. A adaptação de um grânulo existente M i consiste em expandir o suporte [lψ i, Li ψ ] e atualizar o núcleo [λ i ψ, Λi ψ ] de seus conjuntos fuzzy. Entre os grânulos M i aptos a se expandirem para incluir x, aquele com maior similaridade é escolhido, ver [9]. S(x, M i ) = 1 1 6Ψ Ψ ( x ψ lψ i + 2 x ψ λ i ψ ψ=1 +2 x ψ Λ i ψ + x ψ L i ψ ) (7) Note que neste artigo, x = (x, x, x, x) (um dado granular trapezoidal) é degenerado em um valor real, i.e. x = x = x, = x. A adaptação procede dependendo de onde o dado x ψ está localizado em relação ao conjunto fuzzy. As condições para expansão do suporte são: SE x ψ [L i ψ ρ, li ψ ] ENTÃO li ψ (new) = x ψ, SE x ψ [L i ψ, li ψ + ρ] ENTÃO Li ψ (new) = x ψ. Parâmetros do núcleo são atualizados recursivamente a partir de: λ i ψ(new) = (wi 1)λ i ψ + x ψ w i (8) Λ i ψ(new) = (wi 1)Λ i ψ + x ψ w i, (9) onde w i é o número de vezes que o grânulo M i foi escolhido para ser adaptado. Regras egm governando grânulos M i são do tipo: R i : SE x 1 é M i 1 E... E x Ψ é M i Ψ ENTÃO yi = C i 1243

onde C i é um rótulo de classe. Note que a regra resultante do agrupamento egm é similar as regras resultantes do agrupamento ecm e eclustering +. A diferença essencial está no algoritmo incremental de criação e atualização dos grupos. Grupos ecm são hiperesferas no espaço de entrada. Grupos eclustering + e egm são elipsoides e hiperretângulos, respectivamente. 3 Experimentos Computacionais Utilizaram-se os métodos evolutivos abordados anteriormente nos experimentos de classificação de dados de diagnóstico médico. Foram utilizados dados do repositório de aprendizado de máquina da Universidade da Califórnia. As bases de dados escolhidas são: Heart Disease, Cancer, Breast Cancer e Parkinson Telemonitoring. Um sumário das características dessas bases de dados é apresentado na Tabela 1. Essa lista o número de atributos presentes nas amostras para cada uma das bases de dados. Ela também indica a quantidade de amostras referentes à ausência (Classe 0) ou presença (Classe 1) dos sintomas da doença em um determinado paciente. Note que as características das bases de dados evidenciam um problema de agrupamento. Neste tipo de problema os dados podem não ser temporalmente correlacionados. Neste caso, métodos orientados a fluxos tentam encontrar correlações espaciais entre os dados [9]. Note também que o número de amostras das diferentes bases de dados é pequeno e a quantidade de atributos é razoável. Logo, a proposta do estudo apresentado nesta seção é avaliar métodos evolutivos para esta classe de problemas. O problema de agrupamento a partir do uso de métodos evolutivos foi amplamente discutido em [9] e [10]. O uso de métodos evolutivos para construir modelos que encontram as fronteiras de separação das classes diferentemente dos métodos adaptativos convencionais é justificado por não se ter informação sobre qual estrutura adotar para o modelo. O próprio algoritmo de aprendizagem determina a quantidade de modelos locais (clusters, grânulos) e, portanto, determina uma possível representação para um processo ou fenômeno. Os modelos locais mudam com o tempo, são mesclados e apagados, conforme a necessidade, até convergir no sentido de minimizar uma medida de erro com relação a uma dada aproximação [9]. Tabela 1: Sumário das bases de dados Base de dados Amostras por classe Atributos Presente (1) Ausente (0) Total Heart Disease 120 150 270 13 Cancer 212 357 569 30 Breast Cancer 458 241 699 10 Parkinson 147 48 195 22 Realizou-se 50 simulações de fluxos de dados considerando ordens diversas de disponibilização das amostras. A precisão de cada método em classificações corretas foi calculada a partir de: ( Acc = Acerto Acerto + Erro ) 100% (10) Os resultados obtidos são apresentados nas Tabelas 2-5 para os diferentes problemas. Tabela 2: Resultado para Heart Disease ecm 69.25% ±2.37% 11 eclustering + 70.37% ±1.19% 7 egm 79.96% ±1.52% 5 Tabela 3: Resultado para Cancer ecm 85.94% ±2.32% 7 eclustering + 81.54% ±0.28% 6 egm 82.80% ±1.10% 4 Tabela 4: Resultado para Breast Cancer ecm 95.75% ±0.88% 7 eclustering + 96.48% ±1.46% 6 egm 95.50% ±0.44% 3 Tabela 5: Resultado para Parkinson ecm 83.58% ±1.00% 11 eclustering + 82.56% ±0.71% 5 egm 88.22% ±0.82% 5 Os resultados apresentados nas tabelas mostram que existe uma imparcialidade quanto a eleição do melhor método de agrupamento em problemas de classificações corretas para as bases de dados consideradas. Contudo, pode-se observar que o método egm provê modelos com estruturas mais compactas, menor quantidade de regras, ao contrário dos demais métodos avaliados. Isto é uma característica importante em certos tipos de situações onde interpretabilidade de modelos é fundamental. No entanto, o eclustering + apresentou melhores resultados na maioria dos experimentos com relação ao desvio padrão. Finalmente, concluiu-se a partir das análises dos experimentos que o método egm foi relativamente superior aos demais métodos em termos da relação precisão/compactação. Esta conclusão é válida apenas para classificação dos problemas médicos de médio porte considerados, i.e., problemas contendo 1244

entre 10 e 30 atributos e aproximadamente 450 amostras. 4 Conclusão Investigou-se neste artigo o desempenho de diferentes métodos de agrupamento incremental para classificação de dados médicos. Os métodos analisados foram os conhecidos evolving Fuzzy Clustering (eclustering + ); evolving Clustering Method (ecm); e evolving Granulation Method (egm). As bases de dados avaliadas foram Heart Disease, Cancer, Breast Cancer e Parkinson Telemonitoring. Apesar das restrições de informação temporais inerentes ao ambiente de processamento de dados online, os métodos evolutivos avaliados tiveram um desempenho satisfatório para classificação. O egm foi relativamente superior aos demais métodos avaliados em termos da relação classificações corretas/compactação do modelo resultante, embora os melhores resultados com relação ao desvio padrão tenham sidos alcançados pelo eclustering +. No futuro, pretende-se aplicar todos esses métodos evolutivos em problemas multiclasses para a detecção e a classificação de falhas em sistemas de engenharia e na modelagem de sistemas dinâmicos com incertezas variantes no tempo, para que sejam feitas as comparações do desempenho entre eles. Referências [7] Kasabov, N. (2007) Evolving Connectionist Systems. Springer - Verlag, London & Hall/CRC. [8] Kuncheva, L. (2000) Fuzzy Classifiers. Physica-Verlag. [9] Leite, D. (2012) Evolving Granular Systems. PhD Thesis University of Campinas, pp. 170, Jun. [10] Leite, D. Ballini, R. Costa, P. Gomide, F. (2013) Evolving Fuzzy Granular Modeling from Nonstationary Fuzzy Data Streams. Evolving Systems, vol. 38, pp. 1-16. [11] Pedrycz, W. (2005) Knowledge-Based Clustering: From Data to Information Granules. John Wiley & Sons. [12] Specht, D. (1991) A General Regression Neural Network. IEEE Transactions on Neural Networks, vol. 2 (6), pp. 568-576. [13] Watts, M. (2009) A Decade of Kasabov Evolving Connectionist Systems: A Review. IEEE Transactions on System, Man and Cybernetics - Part C, vol. 39, pp. 253-269. [14] Yager, R.; Filev D. (1994) Approximate Clustering via the Mountain Method. IEEE Transactions on Systems and Cybernetics, vol. 24 (8), pp. 1279-1284. [1] Angelov, P; Filev, D. (2003) On-line Design of Takagi-Sugeno Models. Lecture Notes in Computer Science (IFSA 2003) (T. Bilgiç, B. De Baets, O. Kaynak Eds.), pp. 576-584. [2] Angelov, P.; Zhou, X. (2008) Evolving Fuzzy Rule-Based Classifiers from Data Streams. IEEE Transactions on Fuzzy Systems, vol. 16 (6), Special Issue on Evolving Fuzzy Systems, pp. 1462-1475. [3] Angelov, P.; Filev, D.; Kasabov, N. (2010) (Eds.) Evolving Intelligent Systems: Methodology and Applications. Wiley-IEEE Press Series on Computational Intelligence. [4] Angelov, P.; Filev, D. (2004) An Approach to On-line Identification of Takagi-Sugeno Fuzzy Models. IEEE Transactions on System, Man, and Cybernetics - Part B, vol. 34 (1), pp. 484-498. [5] Babuska, R. (1998) Fuzzy Modelling for Control. Kluwer Publishers - Dordrecht. [6] Kasabov, N. (1999) Evolving Connectionist Systems: A Theory and a Case Study on Adaptative Speech Recognition. IEEE Transactions on Fuzzy Systems, vol. 8, pp. 3002-3007. 1245