Representação dos padrões. Tipos de atributos. Etapas do processo de agrupamento. 7.1 Agrupamento clássico. 7. Agrupamento fuzzy (fuzzy clustering)

Documentos relacionados
Capítulo 2. Aproximações de Funções

3- Autovalores e Autovetores.

3- Autovalores e Autovetores.

Bioestatística Curso de Saúde. Linha Reta 2 Parábola ou curva do segundo grau. terceiro grau curva do quarto. grau curva de grau n Hipérbole

16 - PROBLEMA DO TRANSPORTE

Estatística: uma definição

CAPÍTULO III. Aproximação de funções pelo método dos Mínimos Quadrados

CAPÍTULO III MÉTODOS DE RUNGE-KUTTA

A ciência de coletar, organizar, apresentar, analisar e interpretar dados numéricos com o objetivo de tomar melhores decisões.

Estatística: uma definição

SOLUÇÃO DE EQUAÇÕES DIFERENCIAIS POR DIFERENÇAS FINITAS-JM Balthazar- Maio Resolvendo um Problema de Condução de Calor

A ciência de coletar, organizar, apresentar, analisar e interpretar dados numéricos com o objetivo de tomar melhores decisões.

Como primeiro exemplo de uma relação de recorrência, consideremos a seguinte situação:

AULA Produto interno em espaços vectoriais reais ou complexos Produto Interno. Norma. Distância.

PROBLEMA DE INCERTEZA EM SISTEMAS DINÂMICOS UTILIZANDO DEFUZZIFICAÇÃO PELO CENTROIDE

Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira INEP Ministério da Educação MEC. Índice Geral de Cursos (IGC)

Interpolação. Exemplo de Interpolação Linear. Exemplo de Interpolação Polinomial de grau superior a 1.

Forma padrão do modelo de Programação Linear

Balanço de Massa e Energia Aula 2

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou. experimental.

DISTRIBUIÇÃO HIPERGEOMÉTRICA

CAPÍTULO VIII DIFERENCIAIS DE ORDEM SUPERIOR FÓRMULA DE TAYLOR E APLICAÇÕES

Centro de Ciências Agrárias e Ambientais da UFBA Departamento de Engenharia Agrícola

SUBSTITUIÇÕES ENVOLVENDO NÚMEROS COMPLEXOS Diego Veloso Uchôa

Introdução à Teoria dos Números Notas 1 Os Princípios da Boa Ordem e de Indução Finita Prof Carlos Alberto S Soares

Um estudo comparativo entre as funções de validação para agrupamento nebuloso de dados

Avaliação da qualidade do ajuste

(1) no domínio : 0 x < 1, : constante não negativa. Sujeita às condições de contorno: (2-a) (2-b) CC2: 0

Departamento de Informática. Modelagem Analítica do Desempenho de Sistemas de Computação. Modelagem Analítica. P x t i x t i x t i x t i

Aula de Hoje. Introdução a Sistemas Inteligentes. Redes RBF. Redes RBF. Tópicos em Redes Neurais II: Redes Neurais RBF 1ª Parte

Cap. 5. Testes de Hipóteses

Atividades Práticas Supervisionadas (APS)

RESUMO E EXERCÍCIOS NÚMEROS COMPLEXOS ( )

Técnicas Não Paramétricas

Sumário. Mecânica. Sistemas de partículas

Prof. Janete Pereira Amador 1

Relatório 2ª Atividade Formativa UC ECS

Números Complexos. 2. (IME) Seja z um número complexo de módulo unitário que satisfaz a condição z 2n 1, onde n é um número inteiro positivo.

Arquitetura da ART Controle 1 Controle 2

1. Revisão Matemática

6. Medidas de assimetria e curtose

Teoria Elementar da Probabilidade. a) Cada experiência poderá ser repetida indefinidamente sob condições essencialmente inalteradas.

Sumário. Mecânica. Sistemas de partículas

Bruno Hott Algoritmos e Estruturas de Dados I DECSI UFOP. Aula 10: Ordenação

XV SEMINÁRIO NACIONAL DE DISTRIBUIÇÃO DE ENERGIA ELÉTRICA - SENDI Técnicas de Cluster Analysis na Construção de Tipologias de Curva de Carga

1. Conceito de variável aleatória Podemos estudar, por exemplo, algumas características dos alunos do Curso de estatística.

MEDIDAS DE TENDÊNCIA CENTRAL I

Estatística Notas de Aulas ESTATÍSTICA. Notas de Aulas. Professor Inácio Andruski Guimarães, DSc. Professor Inácio Andruski Guimarães, DSc.

( ) ( IV ) n ( ) Escolha a alternativa correta: A. III, II, I, IV. B. II, III, I, IV. C. IV, III, I, II. D. IV, II, I, III. E. Nenhuma das anteriores.

Estatística Descritiva. Medidas estatísticas: Localização, Dispersão

SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL 8 a 11 de novembro de 2002, Rio de Janeiro/RJ A PESQUISA OPERACIONAL E AS CIDADES

Decomposição Lagrangeana com Geração de Colunas para o Problema de Programação Quadrática Binária Irrestrita

6. Inferência para Duas Populações USP-ICMC-SME 2013

A noção de função homogénea surge logo no primeiro ano dos cursos de licenciatura onde uma disciplina de Análise Matemática esteja presente.

4 Técnicas de Seleção de Características Independentes do Modelo para os Sistemas Neuro-Fuzzy Hierárquicos

Cursos de Licenciatura em Ensino de Matemática e de EGI. Teoria de Probabilidade

Difusão entre Dois Compartimentos

Cálculo Numérico Interpolação Polinomial Ajuste de Curvas (Parte II)

MÉTODO DOS MÍNIMOS QUADRADOS

6 Formulação probabilística para problemas de acoplamento fluido mecânico

CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE PPGEP Medidas de Tendência Central Média Aritmética para Dados Agrupados

Distribuições de Probabilidades

1.6- MÉTODOS ITERATIVOS DE SOLUÇÃO DE SISTEMAS LINEARES PRÉ-REQUISITOS PARA MÉTODOS ITERATIVOS

Nas Instituições de Ensino Superior(IES), há uma relação direta entre a qualidade do ensino e a taxa de inadimplência. A taxa de inadimplência das

CADERNO 1 (É permitido o uso de calculadora gráfica.)

Consideremos a fórmula que nos dá a área de um triângulo: = 2

Cálculo Numérico. Ajuste de Curvas Método dos Mínimos Quadrados. Profa. Vanessa Rolnik 1º semestre 2015

Econometria: 3 - Regressão Múltipla

INFERÊNCIA ESTATÍSTICA PARA DUAS POPULAÇÕES

ESTATÍSTICA MÓDULO 2 OS RAMOS DA ESTATÍSTICA

Atividades relacionadas à ManjarBrancoG

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Estimação Pontual

Oitava Lista de Exercícios

6.1 - PROCEDIMENTO DE AVALIAÇÃO DE INCERTEZA EM MEDIÇÕES DIRETAS

Centro de massa Dinâmica do corpo rígido

8. INFERÊNCIA PARA DUAS POPULAÇÕES

USANDO PROBABILIDADES PARA APROXIMAR FUNÇÕES POR POLINÓMIOS

Faculdade de Tecnologia de Catanduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL

2- Resolução de Sistemas Não-lineares.

Física 1 - Experiência 4 Lei de Hooke Prof.: Dr. Cláudio S. Sartori INTRODUÇÃO: Forma Geral dos Relatórios. Referências:

4 Métodos Sem Malha Princípio Básico dos Métodos Sem Malha

Centro de massa Dinâmica do corpo rígido

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

Projeto e Análise de Algoritmos Aula 2: Função de Complexidade Notação Assintótica (GPV 0.3)

1- Resolução de Sistemas Lineares.

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

Estimação pontual, estimação intervalar e tamanho de amostras

Média. Mediana. Ponto Médio. Moda. Itabira MEDIDAS DE CENTRO. Prof. Msc. Emerson José de Paiva 1 BAC011 - ESTATÍSTICA. BAC Estatística

4 O Método de Análise Hierárquica

Introdução à Decomposição de Dantzig Wolfe

INTRODUÇÃO À PROBABILIDADE E ALGUNS RESULTADOS IMPORTANTES

Ordenação: Introdução e métodos elementares. Algoritmos e Estruturas de Dados II

Construção e Análise de Gráficos

3 Sistema Neuro-Fuzzy Hierárquico BSP (NFHB)

? Isso é, d i= ( x i. . Percebeu que

INTRODUÇÃO A ESTATÍSTICA

d s F = m dt Trabalho Trabalho

MODELAGEM NEURO-FUZZY COM APOIO DO MATLAB LUIZ CARLOS BENINI E MESSIAS MENEGUETTE JUNIOR

O delineamento amostral determina os processos de seleção e de inferência do valor da amostra para o valor populacional.

Transcrição:

7. Agrupaeto fuzzy (fuzzy clusterg) 7. Agrupaeto clássco Agrupaeto é a classfcação ão-supervsoada de padrões (observações, dados, objetos, eeplos) e grupos (clusters). Itutvaete, padrões seelhates deve estar o eso grupo e padrões dsttos deve estar e grupos dsttos. Agrupaeto é ua técca drgda por dados, sto é, ão se cohece prevaete a que grupo os dados pertece. Represetação dos padrões Padrões pode ser u objeto físco (cadera) ou u coceto abstrato (estlo de prograação). Algortos de agrupaeto são aplcados a padrões descrtos coo vetores ultdesoas, sedo que cada desão represeta u atrbuto do padrão. Cojuto de dados E coposto por N padrões: E {,,..., N } Padrão descrto por atrbutos: (,,..., ) Tpos de atrbutos Os atrbutos pode ser: Quattatvos Valores cotíuos (peso) Valores dscretos (úero de coputadores) Itervalos (duração de u eveto) Qualtatvos Noas ou desordeados (cor) Ordas (avalações qualtatvas de teperatura coo quete e fro) 3 Etapas do processo de agrupaeto Padrões Represetação dos objetos Clusters Clusters valdados Preparação Agrupaeto Valdação Prodade Iterpretação Medda de slardade Sgfcado dos clusters 4

Téccas de agrupaeto Preparação: oralzações, coversões de tpo, redução do úero de atrbutos. Prodade: defção (escolha) de ua edda de slardade adequada ao doío de aplcação, por e. dstâca. Agrupaeto: aplcação do algortos de agrupaeto Valdação: avalação do resultado do agrupaeto. Deve deterar se os clusters são sgfcatvos. Iterpretação: rotulação do cluster, defdo sua atureza, por eo da aálse de seus objetos. De fora geral as téccas de agrupaeto dvde-se e: Herárqucas Partcoas 5 6 Agrupaeto herárquco Eeplo Gera ua represetação e fora de árvore chaada dedograa que represeta grupos de padrões ahados e íves de slardade os quas os agrupaetos uda. F G Cluster 3 No ível as alto todos os padrões estão e u eso grupo. No ível as específco cada padrão está e u grupo utáro. A C B Cluster D E Cluster 7 8

dedograa Agrupaetos partcoas Dado u cojuto de dados fto X o problea de agrupaeto e X cosste e ecotrar város cetros de agrupaetos (clusters) que possa caracterzar adequadaete classes relevates de X. A B C D E F G 9 0 Agrupaetos partcoas Gera ua úca partção os dados. Vatage: as efcete para cojuto de dados grade. Desvatage: é ecessáro defr prevaete o úero de grupos desejável. Gera grupos pela otzação de ua fução crtéro (objetvo). Algortos partcoas de erro quadrátco A fução crtéro as utlzada e algortos de agrupaeto partcoas é o erro quadrátco O erro quadrátco de u agrupaeto C co clusters de u cojuto de padrões E é: err ( E, C ) j j ( j ) c j Ode (j) é o -éso padrão pertecete ao j-éso cluster e c j é o cetróde do j-éso cluster

Método de agrupaeto de erro quadrátco ) Selecoe ua partção cal dos padrões co u úero fo de clusters e cetros de clusters. ) Atrbua cada padrão ao cetro de cluster as próo e calcule os ovos cetros de clusters coo os cetródes dos clusters. Repta este passo até que a covergêca seja obtda, sto é, até que a dvsão e clusters fque estável. Crtéros de covergêca Não ocorre re-atrbuções de padrões de u cluster para outro O erro quadrátco para de dur sgfcatvaete após u úero de terações 3) Faça erge e dvsão de clusters baseados e forações heurstcas, opcoalete volte ao passo. 3 4 Algorto -eas (-édas) Algorto -eas Mas sples e as cohecdo algortos de erro quadrátco. É fácl de pleetar e sua copledade é O() co sedo o úero de padrões. Problea: é sesível à partção cal e pode covergr para u ío local do valor da fução crtéro se a partção cal ão for escolhda apropradaete ) escolha cetros de clusters que pode ou ão cocdr co os padrões. ) atrbua cada padrão ao cetro de cluster as próo. 3) Recalcule os cetros de clusters usado os grupos defdos. 4) Se o crtéro de covergêca ão for satsfeto, vá para o passo. 5 6

Meddas de slardade A edda de slardade etre dos padrões o espaço dos atrbutos é essecal para o agrupaeto. Devdo à grade varedade de tpos de atrbutos e escalas, a edda deve ser selecoada co cudado. Meddas de dstâca para atrbutos cotíuos Dstâca Eucldaa: (caso partcular da étrca de Mows para p d ( d, j ) ( j ) / Usualete calcula-se a dsslardade etre dos padrões usado ua edda de dstâca. j 7 8 7. Agrupaeto fuzzy (fuzzy clusterg) Métrca de Mows: d d / p p p (, j ) j j p 9 Agrupaeto clássco gera partções sedo que padrões pertece a apeas u cluster, ou seja, os clusters são dsjutos. Agrupaeto fuzzy estede essa oção e assoca cada padrão a cada cluster usado ua fução de pertêca. O resultado desse algorto é u agrupaeto as ão é ua partção 0

Agrupaeto eclusvo X ão eclusvo Agrupaeto eclusvo (hard): cada objeto pertece elusvaete a u úco grupo. Agrupaeto ão-eclusvo (fuzzy): u objeto pode pertecer a as de u grupo, co dferetes graus. Algorto de agrupaeto fuzzy ) Selecoe ua partção fuzzy cal de N obejtos e clusters selecoado a atrz de pertêca U N. U eleeto uj dessa atrz represeta o grau de pertêca do objeto o cluster c j. ) Usado U, o valor da fução crtéro fuzzy, e. ua fução de erro quadrátco poderado, assocada co a partção correspodete. Ua possível fução crtéro fuzzy é: E K ( E, U ) µ Ode N c µ N j É o -éso cetro de cluster. Reatrbua padrões aos clusters para reduzr essa fução de crtéro e recalcule U. c No agrupaeto fuzzy, cada cluster é u cojuto fuzzy de todos os padrões. 3) repta o passo até que as etradas de U ão seja alteradas sgfcatvaete. 3 4

Eeplo Hard clusters: H {,,3,4,5} H {6,7,8,9} Fuzzy clusters: F {0,9/, 0,8/, 0,7/3, 0,6/4, 0,55/5, 0,/6, 0,/7, 0/8, 0/9} F {0/, 0/, 0/3, 0,/4, 0,5/5, 0,4/6, 0,35/7, /8, 0,9/9} Agrupaeto clássco X Agrupaeto fuzzy Aálse de clusters clássca: (requsto forte) Classes fora partção de X F F 7 3 4 6 8 9 H 5 H Aálse de clusters fuzzy: (requsto as fraco) Classes fora partção fuzzy ou pseudo-partção fuzzy de X 5 6 Método de Agrupaeto Fuzzy cmeas Método de agrupaeto partcoal que ecotra ua pseudo-partção fuzzy os dados. Pseudo partção fuzzy Seja X {,,..., } cojuto de dados Partção c-fuzzy de X (pseudo partção fuzzy de X) : Faíla de cojutos fuzzy de X deotados por: {A, A,..., A c } que satsfaz: c A ( ) para todo N 0 < A ( ) < para todo N c ode c é u tero postvo 7 8

Eeplos Eeplo ) Eeplo ) X {,, 3 } Z [0,0] A A A 3 A 0.6/ + / + 0./ 3 A 0.4/ + 0/ + 0.9/ 3 {A, A } é ua partção -fuzzy de X 3 4 5 6 7 8 9 0 {A, A, A 3 } é ua pseudo-partção de Z Z 9 30 Eeplo 3) Y [0,0] Método de agrupaeto fuzzy c-eas Problea de agrupaeto fuzzy : B B B 3 3 4 5 6 7 8 9 0 B (4) /; B (4) ; B 3 (4) 0 logo B (4) + B (4) + B 3 (4) {B, B, B 3 } é ua partção fuzzy de Y as ão é ua pseudo-partção fuzzy de y Y 3 X {,,..., } cojuto de dados ode [... p ] R p, para todo N Ecotrar ua pseudo partção fuzzy e os cetros de clusters assocados pelos quas a estrutura dos dados é elhor represetada. Isso requer: algu crtéro que epressa a déa geral de que assocações seja fortes etre eleetos detro do cluster e fraca etre clusters. Esse crtéro é forulado e teros de u Ídce de desepeho 3

Ídce de desepeho Usualete baseado e cetros de clusters Dada ua pseudo partção {A, A,..., A c } os cetros de clusters v, v,..., v c assocados co a partção são calculados: v [ A ( )] [ A ( )] Para todo N c é u úero real que cotrola a fluêca dos graus de pertêca o vetor v, que é o cetro da classe fuzzy A, é a éda poderada dos dados e A 33 Ídce de desepeho O ídce de desepeho J ( ) de ua partção fuzzy é defdo e teros dos cetros de clusters pela fórula: J ( ) [ A ( ode -v represeta a dstâca etre e v O ídce de desepeho ede a soa poderada das dstâcas etre cetros de clusters e eleetos os clusters correspodetes c )] v 34 Objetvo do étodo de agrupaeto fuzzy c-eas: Ecotrar ua pseudo partção que za o ídce de desepeho J ( ) 7.3 Algorto Fuzzy c-eas Assur que são dados: o úero de clusters c ua edda de dstâca e partcular u úero real u úero postvo pequeo ε (crtéro de parada) Passo. Seja t0. Selecoe ua pseudo partção cal (0) 35 36

Passo 3. Atualze (t+) pelo segute procedeto: Para todo X, se -v (t) > 0 para todo N c etão defa: Passo. Calcule os c cetros de clusters v (t),..., v (t) c para (t) e o valor escolhdo de por: v [ A ( )] [ A ( )] A ( t + ) ( ) c j se -v (t) 0 para algu I N c etão defa A (t+)( ) para I coo sedo qualquer úero real ão egatvo satsfazedo ( t + ) A ( ) I e defa A (t+)( ) 0 para N c -I v v ( t ) ( t ) j 37 38 7.4 Eeplo Passo 4. Copare (t) e (t+). Se (t+) - (t) εpare; caso cotráro creete t e volte ao passo. (t+) - (t) deota ua dstâca etre (t+) e (t) o espaço R Eeplo: (t+) - (t) a A (t+)( ) - A (t) ( ) para N c N 3 4 5 6 7 8 9 0 3 4 5 X 0 0 0 3 4 5 5 5 6 6 6 X 0 4 3 3 0 4 4 3 39 3 4 5 6 40