3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução

Documentos relacionados
Análise de Componentes Principais Simbólicas

Conteúdo da Apresentação

Álgebra Linear I - Lista 7. Respostas

TÓPICO. Fundamentos da Matemática II APLICAÇÕES NA GEOMETRIA ANALÍTICA. Licenciatura em Ciências USP/ Univesp. Gil da Costa Marques

Lista 5. Em toda a lista, as coordenadas referem-se a um sistema de coordenadas fixo (O; i, j, k)

Otimização Combinatória - Parte 4

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Universidade Federal do Pará Curso de Licenciatura em Matemática PARFOR Lista de Exercícios Referentes a Prova Substitutiva de Geometria Analítica

Fundamentos IV. Gustavo Vinhal. September 13, Escola de Ciências Exatas e Computação

APLICAÇÕES NA GEOMETRIA ANALÍTICA

Otimização Linear. Profª : Adriana Departamento de Matemática. wwwp.fc.unesp.br/~adriana

P R O P O S T A D E R E S O L U Ç Ã O D O E X A M E T I P O 6

Geometria Analítica I

Capítulo 1-Sistemas de Coordenadas, Intervalos e Inequações

Geometria Analítica. Geometria Analítica 28/08/2012

BC Geometria Analítica. Lista 4

MAT Cálculo II - POLI a Lista de Exercícios

Otimização Linear. Profª : Adriana Departamento de Matemática. wwwp.fc.unesp.br/~adriana

Cálculo Numérico BCC760 Raízes de equações algébricas e transcendentes

Aula Exemplos diversos. Exemplo 1

Professor: Computação Gráfica I. Anselmo Montenegro Conteúdo: - Objetos gráficos planares. Instituto de Computação - UFF

3. Achar a equação da esfera definida pelas seguintes condições: centro C( 4, 2, 3) e tangente ao plano π : x y 2z + 7 = 0.

Introdução ao Processamento e Síntese de imagens Recorte 2D

Lista Determine o valor máximo e o valor mínimo da função f sujeita às restrições explicitadas:

UNIVERSIDADE FEDERAL DE ALAGOAS INSTITUTO DE MATEMÁTICA Aluno(a): Professor(a): Curso:

Resolvendo algebricamente um PPL

P2 de Álgebra Linear I Data: 10 de outubro de Gabarito

Redes Neurais. A Rede RBF. Redes RBF: Função de Base Radial. Prof. Paulo Martins Engel. Regressão não paramétrica. Redes RBF: Radial-Basis Functions

OTIMIZAÇÃO. O processo de otimização normalmente involve a procura de pontos de máximos e mínimos de uma função.

MAT VETORES E GEOMETRIA - IF/IME 1 o SEMESTRE Suponha fixado um sistema de coordenadas ortogonal cuja base é positiva.

2. Redes Neurais Artificiais

Universidade Tecnológica Federal do Paraná Câmpus Campo Mourão Departamento de Matemática

4 Método Proposto CR AD PA NDVI Descrição geral do modelo

Matemática Básica II - Trigonometria Nota 01 - Sistema de Coordenadas no Plano

Geometria Espacial Curso de Licenciatura em Matemática parte I. Prof.a Tânia Preto Departamento Acadêmico de Matemática UTFPR

Bacharelado em Ciência e Tecnologia 2ª Lista de Exercícios - Geometria Analítica

Geometria Analítica II - Aula 4 82

5 de setembro de Gabarito. 1) Considere o ponto P = (0, 1, 2) e a reta r de equações paramétricas. r: (2 t, 1 t, 1 + t), t R.

PUC-GOIÁS - Departamento de Computação

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Geometria Analítica I - MAT Lista 2 Profa. Lhaylla Crissaff

7 a lista de exercícios - GA Período de Prof. Fernando Carneiro

Algoritmos geométricos

Prof. Fernando Carneiro Rio de Janeiro, Outubro de 2015

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

2 Reconhecimento Facial

MAT Cálculo Diferencial e Integral para Engenharia II 3 a lista de exercícios

Proposta de teste de avaliação

Qual é a posição do Centro de Massa de um corpo de material homogêneo que possui um eixo de simetria

Métodos de Pesquisa Operacional

Otimização Linear. Profª : Adriana Departamento de Matemática. wwwp.fc.unesp.br/~adriana

Lista de exercícios de GA na reta e no plano Período de Prof. Fernando Carneiro Rio de Janeiro, Janeiro de 2017

TURMAS:11.ºA/11.ºB. e é perpendicular à reta definida pela condição x 2 z 0.

PADRÃO DE RESPOSTA - MATEMÁTICA - GRUPOS I e J

Geometria Analítica. Cleide Martins. Turmas E1 e E3. DMat - UFPE Cleide Martins (DMat - UFPE ) Retas e Planos Turmas E1 e E3 1 / 18

1. as equações paramétricas da reta que contém o ponto A e é perpendicular ao plano de equação x 2y + 3z = 17;

Distância entre duas retas. Regiões no plano

P1 de Álgebra Linear I Gabarito. 27 de Março de Questão 1)

5 Estudo de Casos. Tabela 5 - Características dos Banco de Dados

J. Delgado - K. Frensel - L. Crissaff Geometria Analítica e Cálculo Vetorial

Aprendizado de Máquina

Redes Neurais e Sistemas Fuzzy

Aula 5 Equações paramétricas de retas e planos

Aula 2 Vetores de força

Prova Escrita de MATEMÁTICA A - 12o Ano Época especial

Módulo de Elementos básicos de geometria plana. Conceitos Geométricos Básicos. Oitavo ano

O origami no ensino da Matemática

Geometria Analítica - AFA

Gabarito P2. Álgebra Linear I ) Decida se cada afirmação a seguir é verdadeira ou falsa.

Processamento digital de imagens

GEOMETRIA ANALI TICA PONTO MEDIANA E BARICENTRO PLANO CARTESIANO DISTÂNCIA ENTRE DOIS PONTOS CONDIÇÃO DE ALINHAMENTO DE TRÊS PONTOS

Proposta de teste de avaliação

LISTA DE REVISÃO PROVA TRIMESTRAL GEOMETRIA 2º ANO

3 Sistemas Neuro-Fuzzy Hierárquicos

J. Delgado - K. Frensel - L. Crissaff Geometria Analítica e Cálculo Vetorial

Geometria Analítica I - MAT Lista 1 Profa. Lhaylla Crissaff

Coordenadas Cartesianas

SEMINÁRIO DOS ARTIGOS:

Disciplina: MATEMÁTICA Série: 3º ANO ATIVIDADES DE REVISÃO PARA O REDI (4º BIMESTRE) ENSINO MÉDIO

Geometria analítica - Programação linear

4 Descrição axiomática do Origami

Resolução dos Problemas Pares da Primeira Lista de Exercícios

UNIVERSIDADE FEDERAL DE VIÇOSA DEPARTAMENTO DE MATEMÁTICA LISTA DE EXERCÍCIOS DE MAT243-CÁLCULO III

étodos uméricos ZEROS DE FUNÇÕES DE UMA OU MAIS VARIÁVEIS Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

a) b) c) d) e) x = ,7x 0,3x = 100 x =

Módulo de Elementos básicos de geometria plana. Conceitos Geométricos Básicos. Oitavo Ano

2 ) X = (0, 1, Escreva equações paramétricas dos eixos coordenados.

Matemática - 3ª série Roteiro 04 Caderno do Aluno. Estudo da Reta

Lista de exercícios de GA no espaço

Morfologia Matemática. Guillermo Cámara-Chávez

Geometria Analítica - Sistemas de Coordenadas no Plano

LISTA DE EXERCÍCIOS. [01] Determine o domínio natural (efetivo) de cada uma das funções indicadas abaixo.

ESCOLA SECUNDÁRIA FERREIRA DIAS, AGUALVA SINTRA

Cálculo Numérico. Aula 4 Zeros de Funções /04/2014. Prof. Rafael mesquita Adpt. por Prof. Guilherme Amorim

Derivadas Parciais Capítulo 14

GEOMETRIA ANALÍTICA. λ x y 4x 0 e o ponto P 1, 3. Se a reta t é tangente a λ no ponto P, então a abscissa do ponto de

Figura 1: Vila africana de Logone Birni [2]

Banco de questões. Geometria analítica: ponto e reta ( ) ( ) ( )

1. Encontre as equações simétricas e paramétricas da reta que:

Capítulo Equações da reta no espaço. Sejam A e B dois pontos distintos no espaço e seja r a reta que os contém. Então, P r existe t R tal que

Transcrição:

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução Como já mencionado na seção 1.1, as SVMs geram, da mesma forma que redes neurais (RN), um "modelo caixa preta" de difícil interpretação sobre a relação entre as variáveis de entrada e a variável de saída. No caso de redes neurais, vários métodos já foram desenvolvidos, traduzindo o conhecimento adquirido pelas redes neurais treinadas para uma representação interpretável [44], [45], [46], [47], [48], [49]. No caso de SVM, por ser um tópico de pesquisa mais recente, esse aspecto ainda não foi extensamente desenvolvido. Entretanto, nota-se um interesse crescente nessa linha de pesquisa [50]. Duas propostas expostas em [13], [14] e [15] podem ser destacadas. As seções seguintes descrevem os fundamentos básicos dos métodos RulExSVM [13] e SVM+Prototypes [14], [15].

42 3.2 Algoritmo RulExSVM Faz-se, a seguir, uma descrição do algoritmo RulExSVM, conforme apresentado em [13]. Como foi visto na seção 2, os vetores suporte gerados através da otimização do problema dual localizam-se próximo à fronteira de decisão. Se os pontos que não são vetores suporte fossem removidos do conjunto de treinamento, o mesmo hiperplano de separação seria obtido. Como os vetores suporte definem o hiperplano de separação, as regras associadas à fronteira de um hiper-retângulo chamadas regras hiper-retangulares são geradas diretamente a partir desses vetores. O algoritmo de extração de regras RulExSVM explora o fato de que decisões de uma SVM não linear podem ser decodificadas em regras baseadas em informações provenientes de vetores suporte e de sua função de decisão. Esse método consiste em três fases: a fase inicial, a fase de ajuste e a fase final. a) Fase inicial de geração de regras Todos os atributos de entrada são normalizados entre [0,1]. Notação utilizada: n: a dimensão dos dados; A1: um vetor suporte da classe 1; A2: um vetor suporte da classe 2; N 1 : número de vetores suporte da classe 1; N 2 : número de vetores suporte da classe 2; N s = N 1 + N 2 : número total de vetores suporte; s m = (s m1, s m2,..., s mn ): m-ésimo vetor suporte da classe 1; x = (x 1, x 2,..., x n ): um ponto do espaço de entrada. Para que fique mais claro o procedimento detalhado no algoritmo RulExSVM, considera-se o exemplo bidimensional exposto na Figura 5(a) extraído de [13], onde os vetores suporte da classe 1 são os pontos pretos A, B, C, D, E e F e os da classe 2, os pontos brancos G, I e J. À medida em que se descreve o algoritmo, faz-se em paralelo a ligação com o exemplo citado. A regra hiper-retangular derivada do vetor suporte s m da classe1 pode ser representada por: { s mi + λ 2i x i s mi - λ 1i, i = 1,...,n}, onde 1 λ pi 0, p = {1,2}.

43 Sejam L o (i) = s mi - λ 1i e H o (i) = s mi + λ 2i, respectivamente, os limites inferior e superior da regra hiper-retangular ao longo da i-ésima dimensão. Esses limites são determinados, inicialmente, pela função de decisão f que distingue a classe 1 da classe 2, como descrito abaixo. Pode ser visto na Figura 5(a) que, para cada um dos eixos, é traçada uma reta paralela aos mesmos, a partir de um vetor suporte da classe 1. Essa reta pode ser estendida nas duas direções. Através da geração dessas retas pode-se determinar os pontos de interseção entre essa linha e a fronteira de decisão, como é indicado no algoritmo a seguir. Dada uma SVM treinada, a regra baseada no vetor suporte s m pode ser gerada pelo seguinte algoritmo: 1. faça d = 1, d se refere a dimensão; 2. calcule x d sujeito a f(x) = 0 e x j = s mj (j = 1,...,n e j d) pelo método de Newton [51], onde f é a função de decisão da SVM; 3. determine L o e H o de acordo com a solução do problema no passo 2. O número de soluções para o problema do passo 2 pode ser diferente: i. se não existe solução, isto é, não existe interseção entre a linha estendida a partir de s m na dimensão d e a fronteira de decisão, então L o (d) = 0 e H o (d) = 1; ii. se existe uma solução se s mj x d, então L o (d) = x d e H o (d) = 1, caso contrário L o (d) = 0 e H o (d) = x d ; iii. se existem duas soluções, x d1 e x d2 (x d1 x d2 ), então L o (d) = x d1 e H o (d) = x d2 ; iv. se existem mais de duas soluções, as soluções x d1 e x d2 que estão mais próximos de s mj são escolhidas com a condição de que x d1 s mj, x d2 s mj e o conjunto de pontos {x x j = s mj, j = 1,..., n, j d, x d1 x d x d2 } são da mesma classe que o vetor suporte s m, então L o (d) = x d1 e H o (d) = x d2 ; 4. d = d +1; se d < n, vá para o passo 2, se não, fim. No exemplo em questão, o vetor suporte A (da classe 1), os pontos de interseção entre as linha estendidas e a fronteira de decisão são mostradas na Figura 5(a). A fronteira inicial do hiper-retângulo, mostrada na Figura 5(b) com linha pontilhada, pode ser obtida através desses pontos de interseção. Como há

44 somente um ponto de interseção no eixo vertical, que define o limite inferior (caso ii do algoritmo acima), o limite superior será 1 (todos os atributos dos pontos de entrada estão entre 0 e 1). b) Fase de ajuste das regras iniciais A fase de ajuste do método RulExSVM é realizada após uma regra inicial ser gerada como mostrado na seção anterior. Esse ajuste é feito de modo que qualquer ponto da classe 2 seja excluído da região da regra. O número de pontos cobertos por uma regra está relacionado ao volume da região associada a essa regra. Assim, o objetivo dessa fase é excluir os pontos da classe 2 de modo a se obter um hiper-retângulo com o maior volume possível. Ao se considerar um espaço de dimensão n, existem n possibilidades de se excluir um ponto, cada uma delas em uma das suas n dimensões. A escolha da dimensão em que o ponto não pertencerá à regra é feita de modo que o volume restante seja o maior possível. Isso é feito da seguinte forma: - para uma dada regra, ache todos os pontos da classe 2 que pertencem a essa regra e chame esse conjunto de Q; - escolha aleatoriamente um dos pontos e o chame de P; - calcule as distâncias de P às fronteiras do hiper-retângulo em cada dimensão; - retire P do hiper-retângulo, diminuindo a regra hiper-retangular no eixo que mantiver o máximo volume do hiper-retângulo; - escolha outro ponto de Q e repita o procedimento até todos os pontos de Q terem sido analisados. c) Fase final Regras de classes diferentes podem se interceptar. Se o hiper-retângulo associado a uma regra estiver totalmente contido no hiper-retângulo associado a uma outra regra, a primeira regra será descartada. Essa fase elimina as regras redundantes. A seguir é explicado o procedimento para a retirada das regras redundantes: ache os padrões que satisfazem a cada regra; se o conjunto de pontos que satisfazem a uma regra r está contido em algum conjunto de pontos que satisfazem a uma outra regra s, então a regra r é removida.

45 Figura 5 - RulExSVM (a) (b)

46 3.3 Algoritmo SVM+Prototypes Uma outra forma de se construir um extrator de regras é através da definição de elipsóides no espaço de entradas. A maneira como o algoritmo de extração de regras SVM+Prototypes [14], [15] define esses elipsóides é apresentada a seguir. O método também utiliza a informação dada pelos vetores suporte, usados para determinar as fronteiras das regiões definidas no espaço de entrada. Essas regiões são obtidas pela combinação de vetores protótipos (centros de cada classe) e de vetores suporte. Os vetores protótipos são computados através de um algoritmo de clusterização. Cada região define uma regra com uma sintaxe: regras com equações, que correspondem a equações matemáticas de elipsóides, e regras com intervalos, associadas a hiperretângulos definidos por elipsóides paralelos aos eixos coordenados. A Figura 6, extraída de [15], mostra exemplos desses tipos de regras. Na Figura 7, são mostradas duas partições, P1 e P2, com centros c1 e c2, onde os vetores suporte estão destacados. Regra com intervalo SE x [a,b] e y [c,d] ENTÃO CLASSE Figura 6 - Regras geradas pelo algoritmo SVM+Prototypes Define-se um elipsóide pelo protótipo, que é o seu centro, e pelo vetor suporte pertencente à partição. Na construção do método, o vetor suporte escolhido é o mais distante do protótipo. A linha reta definida por esses dois pontos é o primeiro eixo do elipsóide. Na Figura 7, para a partição 1, o vetor suporte v1 é o mais distante de c1 e é o escolhido pelo método para definir o primeiro eixo do elipsóide. Por simples geometria, determinam-se os outros eixos e os vértices correspondentes. Há duas possibilidades para a definição

47 desses vértices: calculá-los a partir dos vetores suporte ou usar o ponto mais afastado do protótipo. As Figuras 8 e 9 mostram a construção do segundo eixo do elipsóide e o elipsóide para cada um dos casos acima para a partição P1, onde v2 é o vetor suporte usado para definir o 2 0 eixo do elipsóide (Figura 8) e a1 é o ponto mais afastado do protótipo c1 (Figura 9). Figura 7 - Partições e 1 o eixo do elipsóide Figura 8 - Construção do 2 o eixo do elipsóide usando o vetor suporte v2

48 Figura 9 - Construção do 2 o eixo do elipsóide usando o ponto mais distante do protótipo A construção de hiper-retângulos é similar, com a diferença de que linhas paralelas aos eixos coordenados, e não aos eixos do elipsóide, são usadas para definir os eixos da região associada. Na Figura 10, é mostrado o retângulo construído para a partição 1, usando os vetores suporte v1 e v2. Figura 10 - Construção do hiper-retângulo Para se determinar o número de elipsóides por classe, o algoritmo segue um esquema incremental. Para cada classe, começando com um único

49 protótipo, gera-se o elipsóide associado. Em seguida, é feito um teste de partição para verificar a existência de vetores suporte de outras classes no elipsóide. Se não houver, a região é transformada em uma regra. Caso contrário, a região é dividida e novas regiões são geradas. O procedimento com o teste de partição e divisão do elipsóide é repetido enquanto houver uma região com vetores suporte de outras classes ou até que o número máximo de iterações seja atingido. Esse processo controla o número de regras geradas. A Figura 11, extraída de [15], mostra em (a) um elipsóide gerado pelo procedimento acima descrito. Pode-se ver que o elipsóide contém vetores suporte de outras classes, que estão acima da fronteira de decisão. Dividindo-o (Figura 11(b)), os dois elipsóides resultantes não contêm vetores suporte de outras classes e representam melhor a classe. Figura 11 - Geração e divisão de um elipsóide (a) Geração de um elipsóide. (b) O elipsóide de (a) dividido em dois elipsóides

50 3.4 Comentário sobre as deficiências dos métodos Como já mencionado, ambos métodos geram regras cujos antecedentes são intervalos ou equações. Essa característica torna as regras menos interpretáveis e prejudica a extração de conhecimento útil. Como já mencionado, o método RulExSVM utiliza o hiperplano de decisão para definir os hiper-retângulos. No caso de classificação em mais de duas classes, em geral, não existe um hiperplano de decisão, o que torna esse método difícil de ser estendido para mais de duas classes. Quanto ao método SVM + Prototypes, a extração de regras depende muito da escolha do algoritmo de clusterização tanto em número de regras quanto na acurácia das regras. De acordo com [14] e [15], a partição do cluster só depende dos protótipos e dos vetores suporte, o que pode levar a uma acurácia baixa das regras, pois pontos de outras classes que não são vetores suporte não podem ser detectados e retirados da região da regra pelo método. Além disso, a determinação das fronteiras das regras torna-se complicada com o aumento da dimensionalidade dos dados porque não pode ser resolvido por simples geometria.