Roteiro. PCC142 / BCC444 - Mineração de Dados Agrupamento (Segmentação) Agrupamento (Segmentação) Introdução. Denição. Aplicações

Tamanho: px
Começar a partir da página:

Download "Roteiro. PCC142 / BCC444 - Mineração de Dados Agrupamento (Segmentação) Agrupamento (Segmentação) Introdução. Denição. Aplicações"

Transcrição

1 Roteiro PCC142 / BCC444 - Mineração de Dados (Segmentação) Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@icebufopbr wwwdecomufopbr/luiz Introdução Denição Aplicações Dados e Funções de Distância Requisitos Importantes para Técnicas de Categorias de Métodos Algoritmo k-means Introdução (Segmentação) (segmentação) é o processo de identicação de um conjunto nito de categorias (ou grupos - clusters), não denidos previamente, que contêm objetos similares Exemplo: Deseja-se separar os clientes em grupos de forma que aqueles que apresentam o mesmo comportamento de consumo quem no mesmo grupo Cada tupla deste exemplo indica a quantidade total de produtos consumidos e o preço médio destes produtos relativos a cada consumidor Consumidor QtdProds Preço Médio Prods Cons Qtd $ Méd Prods Grupo Cons Qtd $ Méd Prods Cada grupo identicado é caracterizado por consumidores semelhantes em relação à quantidade de produtos e ao preço médio dos mesmos

2 Em termos de aplicação: Objetivo Obter um agrupamento de dados com alta similaridade intra-grupos e baixa similaridade inter-grupos como tarefa alvo: Ajudar na percepção da distribuição dos dados Observar características particulares de cada grupo (cluster) como uma das etapas do processo de mineração de dados: Etapa de pré-processamento para outros algoritmos (p ex, classicação) Classicação x Exemplos de Aplicações Classicação é dito um processo de mineração supervisionado, pois os elementos que fazem parte da base de treinamento já têm seu atributo classe informado é dito um processo de mineração não supervisionado, pois os elementos que fazem parte da base de entrada não têm o seu grupo denido Muitas vezes nem mesmo o número de grupos é previamente denido Área de Negócios Descobrir grupos distintos em relação ao comportamento de consumo Biologia Denição de taxonomias de animais e plantas de genes com funcionalidades similares Geograa Descoberta de regiões da superfície terrestre com similaridades na utilização da terra Internet de documentos da Web

3 Área de pesquisa em plena evolução, onde esforços são realizados com objetivo de encontrar métodos ecientes capazes de trabalhar com grandes volumes de dados Dados Algoritmos de agrupamento trabalham a partir de uma das seguintes estruturas de dados: Matriz de dados (n p): base de dados com p objetos caracterizados por n atributos x11 x1f x1p xi1 xif xip xi1 xif xip Matriz de dissimilaridades (n n): d(i, j) = dissimilaridade entre os objetos i e j 0 d(2, 1) 0 d(3, 1) d(3, 2) 0 d(n, 1) d(n, 2) 0 Funções de Distância Algumas Funções de Distância Função de distância Para que uma função d seja uma distância, as seguintes condições devem ser satisfeitas para quaisquer objetos i, j, k: d(i, j) 0 d(i, i) = 0 d(i, j) = d(j, i) d(i, j) d(i, k) + d(k, j) Distância Euclidiana: d(i, j) = xi1 xj1 2 + xi2 xj xip xjp 2 Distância de Manhattan: d(i,j) = xi1 xj1 + xi2 xj2 + + xip xjp Distância de Minkowski: d(i, j) = q xi1 xj1 q + xi2 xj2 q + + xip xjp q

4 Atributos contínuos (escala não-linear) Atributos contínuos (escala linear) Processo de normalização: Objetivo: dar um peso igual para cada um dos atributos Procedimento (dados os valores de um atributo f): 1 Calcular o desvio médio absoluto: sf = 1 ( x1f mf + x2f mf + + xnf mf ), n onde mf é o valor médio do atributo f 2 Calcular os valores normalizados (z-score): zif = xif mf sf Valores segundo uma escala não-linear (p ex, crescimento de uma população de bactérias escala exponencial) Maneiras para se calcular a dissimilaridade: Tratar os atributos escalonados não-lineares da mesma forma que tratamos os atibutos contínuos (não recomendado) Transformar os valores dos atributos escalonados não-lineares para que eles quem em uma escala linear Por exemplo, se xif estiver numa escala exponencial, basta aplicar a função logarítmica (yif = log(xif )) para que os valores passem para uma escala linear Substituir cada xif por um valor rif correspondente na escala 1, 2,, Mf, onde Mf é o número de valores distintos assumidos pelo atributo f Feita essa substituição, trata-se os valores como tratamos os atributos contínuos (escala linear) Atributos binários Tratar os atributos binários da mesma forma que tratamos os numéricos pode nos conduzir à construção de agrupamentos errôneos Métodos especícos para o tratamento de valores binários são necessários Atributos binários Vejamos uma abordagem: Determinar a matriz de dissimilaridades para valores binários considerando a tabela de contingência Objeto j 1 0 Soma 1 q r q+r Objeto i 0 s t s+t Soma q+s r+t p onde: q é o número de atributos com valor 1 para i e j r é o número de atributos com valor 1 para i e 0 para j s é o número de atributos com valor 0 para i e 1 para j t é o número de atributos com valor 0 para i e j p é o número total de atributos, ou seja, p = q + r + s + t

5 Atributos binários (simétricos) Um atributo binário é simetrico se ambos os valores (0 e 1) são igualmente importantes para o agrupamento Exemplo: atributo Sexo (M ou F) Nesse caso, a distância entre dois objetos i e j é dada por r + s d(i, j) = q + r + s + t, ou seja, d(i, j) é a porcentagem de atributos que discordam entre os dois objetos Atributos binários (assimétricos) Um atributo binário é assimetrico se os valores (0 e 1) não forem igualmente importantes para o agrupamento Exemplo: nos resultados de testes para detectar uma enfermidade, o valor 1 (positivo) pode ser considerado mais importante do que o valor 0 (negativo) Nesse exemplo, a concordância entre os 1's é muito mais importante do que a concordância entre os 0's Nesse caso, a distância i e j é denida como sendo o coeciente de Jacquard: d(i, j) = r + s q + r + s, ou seja, d(i, j) é a porcentagem de atributos que discordam entre os dois objetos (mas o total de atributos desconsidera aqueles que concordam e ambos são iguais a 0) Atributos binários (assimétricos) Exemplo: Nome Gênero Febre Tosse Teste1 Teste2 Teste3 Teste4 Jack M Sim Não Pos Neg Neg Neg Mary F Sim Não Pos Neg Pos Neg Jim M Sim Sim Neg Neg Neg Neg Atributo(s) binário(s) simétrico(s): Gênero Atributo(s) binário(s) assimétrico(s): Febre, Tosse, Teste1, Teste2, Teste3 e Teste4 Considerando apenas os atributos assiméticos em nossa análise (e portanto utilizando o coeciente de Jacquard): d(jack, Mary) = d(jack, Jim) = = 0, 33 = 0, 67 d(jim, Mary) = = 0, 75 Atributos nominais Atributos nominais: generalização dos atributos binários, dado que eles podem ter mais do que 2 valores possíveis Cálculo da dissimilaridade: d(i, j) = p m, p onde p é o número total de atributos e m o número de atributos coincidentes Assim, d(i, j) é o percentual de atributos cujos valores são diferentes Outra possibilidade para o cálculo da dissimilaridade: Considerando que um atributo nominal A possa assumir M valores distintos, cria-se um novo atributo binário para cada um dos M possíveis valores Utiliza-se o método para atributos binários discutido anteriormente

6 Atributos ordinais Semelhante a um atributo nominal, com a diferença de que os valores assumidos admitem uma ordenação Exemplo: atributo Medalha, cujos valores são: Bronze, Prata e Ouro Atributos ordinais Cálculo de dissimilaridade: Seja xif o valor do atributo f do i-ésimo objeto Considere que f possui Mf valores distintos, que ordenados podem ser representados por 1, 2,, Mf Substitua cada xif por seu valor rif correspondente na escala 1, 2,, Mf Como os atributos ordinais podem ter quantidades diferentes de valores possíveis, é comum mapear os valores de todos os atributos ordinais para a escala [0, 1] para que eles tenham o mesmo peso no cálculo da distância O mapeamento é feito da seguinte maneira: zif = rif 1 Mf 1 Feita a conversão de xif para zif procede-se o cálculo da distância utilizando-se alguma das funções discutudas anteriormente (Euclidiana, Manhattan, ) Atributos mistos Até agora mostramos o cálculo de dissimilaridades considerando que todos os atributos são do mesmo tipo Mas na realidade um objeto pode ser caracterizado por atributos de tipos diferentes Nesse caso, como calcular a dissimilaridade entre dois objetos? R: Uniformizar a escala dos valores dos atributos Atributos mistos Uniformização da escala dos valores dos atributos Transformar os valores de todos os atributos colocando-os numa escala comum [0, 1] Suponha uma base de dados com p atributos A dissimilaridade d(i, j) entre os objetos i e j é dada por: onde: d(i, j) = p f=1 δf ij df ij p f=1 δf ij δij = 0 se uma das seguintes situações acontecer: 1 os valores xif ou xjf são desconhecidos 2 o atributo f é binário assimétrico e xif = xjf = 0 δij = 1, caso contrário,

7 Atributos mistos Uniformização da escala dos valores dos atributos O cálculo de d f ij depende do tipo do atibuto f: 1 Se o atributo f for binário ou nominal: d f ij = 0 se xif = xjf Caso contrário, d f ij = 1 2 Se o atributo f for contínuo (escala linear): d f ij = xif xjf maxh{xhf } minh{xhf }, onde h são os valores conhecidos do atributo f 3 Se o atributo f for ordinal ou contínuo (escala não-linear): mapeia-se xif para inteiros rif e considera-se zif = r if 1 M f 1 como atributo contínuo (escala linear) Requisitos Importantes para Técnicas de Escalabilidade Alguns algoritmos de agrupamento só trabalham bem com bases de dados pequenas (< 200 objetos) Contudo, uma base de dados pode conter milhões de objetos Fazer agrupamento a partir de uma amostra da base de dados original pode nos levar a resultados tendenciosos Necessidade por algoritmos de agrupamento escaláveis Requisitos Importantes para Técnicas de Requisitos Importantes para Técnicas de Habilidade para trabalhar com atributos de tipos diferentes Alguns algoritmos de agrupamento trabalham apenas com dados numéricos Contudo, várias aplicações apresentam outros tipos de dados (nominais, binários, ordinais etc) Necessidade por algoritmos de agrupamento capazes de trabalhar com diferentes tipos de dados Encontrar grupos com formas variadas Vários algoritmos de agrupamento denem os grupos a partir das medidas de distância Euclidiana ou Manhattan O uso dessas medidas tende a gerar somente grupos com formato esférico com tamanho e densidade semelhantes No entanto, a princípio, os grupos podem ter qualquer forma Importância do desenvolvimento de algoritmos de agrupamento que detectem grupos com quaisquer formatos

8 Requisitos Importantes para Técnicas de Requisitos Importantes para Técnicas de Habilidade para trabalhar com dados contendo ruídos Parâmetros de entrada Alguns algoritmos de agrupamento necessitam de parâmetros e entrada (pex, número de grupos desejados) Os resultados encontrados por esses algoritmos podem ser extremamente sensíveis a esses parâmetros A denição desses parâmetros pode ser muito difícil para o usuário, principalmente para bases de grandes dimensões Grande parte das bases de dados reais contêm outliers e/ou valores ausentes Algoritmos sensíveis a essas características podem apresentar resultados insatisfatórios Sensibilidade à ordenação dos dados Alguns algoritmos de agrupamento são sensíveis à ordenação dos dados de entrada É importante o desenvolvimento de algoritmos insensíveis à ordenação dos dados de entrada Requisitos Importantes para Técnicas de Métodos de Alta dimensionalidade Existem algoritmos de agrupamento são adequados apenas para bases de dados com poucos atributos Um desao é a criação de boas técnicas de agrupamento para objetos em espaços de dimensões altas com restrições Principais categorias de métodos: Métodos de Particionamento Métodos Hierárquicos Métodos Baseados em Densidade Métodos Baseados em Grade Aplicações reais podem exigir a realização de agrupamentos sob determinadas condições (restrições) Necessidade por técnicas que produzam bons agrupamentos respeitando todas as retrições

9 Métodos de Particionamento Métodos de Particionamento Seja uma base de dados D com n objetos Constrói k partições de dados, k n, onde: cada grupo contém pelo menos um objeto cada objeto pertence a somente um grupo Dado k, o método cria um particionamento inicial Por um processo iterativo de realocação, tenta-se melhorar o particionamento movimentando-se os objetos entre os grupos O que seria um bom particionamento? Resp: Em geral, um bom particionamento é aquele em que objetos de um mesmo grupo são semelhantes, enquanto objetos de grupos distintos são diferentes Métodos de Particionamento Métodos de Particionamento Existem dois métodos heurísticos populares: Como encontrar o melhor particionamento? Resp: Enumeração exaustiva de todas as partições possíveis Será esta a abordagem utilizada pelos algoritmos de agrupamento baseados em particionamento? k-means: cada grupo é representado pelo valor médio dos seus objetos k-medoids: cada grupo é representado pelo objeto mais próximo ao centro do grupo Características dessas heurísticas: Funcionam bem para bases de dados não muito grandes Encontram grupos (clusters) com formato esférico

10 Métodos Hierárquicos Métodos Hierárquicos Estes métodos criam uma decomposição hierárquica a partir de uma base de dados D com n objetos Podem ser classicados como: Aglomerativos Divisivos Aglomerativos (abordagem bottom-up): Inicialmente cada objeto corresponde a um grupo A cada iteração, os objetos ou grupos mais próximos vão sendo agrupados Este processo se repete até que todos os objetos quem num único grupo ou uma condição de nalização seja vericada Métodos Hierárquicos Métodos Hierárquicos Divisivos (abordagem top-down): Inicialmente todos objetos são colocados num mesmo grupo A cada iteração, o(s) grupo(s) vão sendo divididos em grupos menores Este processo se repete até que cada grupo contenha um único objeto ou uma condição de nalização seja vericada Qual a desvantagem dos métodos hierárquicos? Dica: Eles são rígidos Vantagem: redução do custo computacional Resp: Uma vez que numa dada iteração um passo (agrupamento ou divisão) é realizado, ele não pode ser desfeito

11 Métodos Hierárquicos Métodos Baseados em Densidade Duas abordagens foram propostas para melhorar estes métodos: 1 Realizar cuidadosa análise da ligação entre os objetos em cada iteração Exemplo: CURE e Chameleon 2 Juntar aglomeração com realocação, primeiro realizando aglomeração e então renando o resultado com realocação Exemplo: BIRCH Os métodos de particionamento agrupam objetos com base na distância entre eles Por isso, tais métodos cam limitados a encontrar grupos (clusters) com formato esférico Outros métodos têm sido desenvolvidos com base na noção de densidade Métodos Baseados em Densidade Métodos Baseados em Grades Idéia geral: Os grupos continuam a crescer enquanto a densidade (número de objetos) na vizinhança exceder um determinado limite Exemplos: DBSCAN e OPTICS Formato NÃO esférico Estes métodos dividem o espaço de objetos em um número nito de células formando uma estrutura de grid A partir da formação do grid todas as operações de agrupamento são realizadas sobre esta estrutura Exemplos: STING, WaveCluster e CLIQUE

12 Métodos Baseados em Grades Métodos de Qual a vantagem dos métodos baseados em grades? Dica: Vantagem com relação ao tempo de processamento Resp: O tempo de processamento independe do número de objetos de dados Ele depende somente do número de células em que o espaço de objetos foi dividido Alguns algoritmos de clusterização integram idéias de diferentes categorias de métodos Desta forma, pode ser difícil classicá-los como pertencendo a uma única categoria Algoritmo k-means Algoritmo k-means É um método de particionamento clássico Características: Quantidade de grupos é xa (parâmetro k) Resultados muito sensíveis à escolha inicial Para num ótimo local Entrada: Base de dados contendo n objetos Valor do parâmetro k Saída: Um conjunto de k clusters que minimiza um critério de erro

13 Algoritmo k-means Algoritmo k-means 1 Escolhe arbitrariamente k objetos como centros iniciais dos clusters 2 (Re)associa cada objeto com o cluster ao qual ele é mais similar (calculando a distância de cada objeto ao centro de cada cluster) 3 Atualiza o centro dos clusters (calculando o valor médio dos objetos para cada cluster) 4 Volta ao passo 2 e continua até que não haja mais alteração Algoritmo k-means Considerações Adicionais O k-means produz um conjunto de clusters que minimiza o erro quadrático (E) com relação ao centros de gravidade de cada cluster k E = p mi 2, i=1 p Ci onde p é um ponto do espaço que representa um dado objeto e mi é o ponto médio do cluster Ci O método funciona muito bem quando os clusters são núvens compactas de dados, bem separadas umas das outras O k-means é muito sensível a ruídos (que podem causar grande alteração no centro de gravidade dos clusters) Perguntas?

IA: Aprendizado IV. Professor Paulo Gurgel Pinheiro. 30 de Setembro de 2010

IA: Aprendizado IV. Professor Paulo Gurgel Pinheiro. 30 de Setembro de 2010 IA: Aprendizado IV Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 30 de Setembro de 2010 1 / 75 http://www.ic.unicamp.br/

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento

Leia mais

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia

Roteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br

Leia mais

2 Processo de Agrupamentos

2 Processo de Agrupamentos 20 2 Processo de Agrupamentos A análise de agrupamentos pode ser definida como o processo de determinação de k grupos em um conjunto de dados. Para entender o que isso significa, observe-se a Figura. Y

Leia mais

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André

Leia mais

1 Tipos de dados em Análise de Clusters

1 Tipos de dados em Análise de Clusters Curso de Data Mining Sandra de Amo Aula 13 - Análise de Clusters - Introdução Análise de Clusters é o processo de agrupar um conjunto de objetos físicos ou abstratos em classes de objetos similares Um

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga

Aula 8 - Reconhecimento e Interpretação. Prof. Adilson Gonzaga Aula 8 - Reconhecimento e Interpretação Prof. Adilson Gonzaga Elementos de Visão Computacional: Visão Computacional Processamento de Baio Nível Processamento de Nível Intermediário Processamento de Alto

Leia mais

M08. Introdução a Técnicas de Data Mining DM

M08. Introdução a Técnicas de Data Mining DM M08. Introdução a Técnicas de Data Mining DM 4 - REGRAS DE ASSOCIAÇÃO 5 - ANÁLISE DE AGRUPAMENTOS LNCC/MCT - 18/01/2008 Custódio Gouvêa Lopes da Motta custodio.motta@ufjf.edu.br www.dcc.ufjf.br Agradecimentos:

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Problema do Agrupamento Aprendizagem de Máquina Alessandro L. Koerich Seja x = (x 1, x 2,, x d ) um vetor d dimensional de características Seja D um conjunto de x vetores, D = { x(1), x(2),, x(n) } Problema

Leia mais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação

Leia mais

NOVAS METODOLOGIAS PARA CLUSTERIZAÇÃO DE DADOS. Lando Mendonça di Carlantonio

NOVAS METODOLOGIAS PARA CLUSTERIZAÇÃO DE DADOS. Lando Mendonça di Carlantonio NOVAS METODOLOGIAS PARA CLUSTERIZAÇÃO DE DADOS Lando Mendonça di Carlantonio TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA UNIVERSIDADE FEDERAL DO RIO DE

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos

Leia mais

Análise de Clusters. Aplicações da formação de Grupos (Clustering)

Análise de Clusters. Aplicações da formação de Grupos (Clustering) Análise de Clusters Aplicações da formação de Grupos (Clustering) Ver e analisar vastas quantidades de dados biológicos como um todo pode ser difícil É mais fácil interpretar os dados se forem divididos

Leia mais

Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters

Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Descoberta

Leia mais

Metodologia Aplicada a Computação.

Metodologia Aplicada a Computação. Metodologia Aplicada a Computação gaudenciothais@gmail.com Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,

Leia mais

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos

Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Trilha Learning Machine Cluster Analysis em 4 passos Marco Siqueira Campos Marco Siqueira Campos Sócio fundador Siqueira Campos Associados e sos-stat Estatístico UFRGS Certificado Data Science Specialization

Leia mais

Mineração de Dados. Modelos Descritivos. Descoberta de agrupamentos

Mineração de Dados. Modelos Descritivos. Descoberta de agrupamentos Mineração de Dados Descoberta de agrupamentos Modelos Descritivos tarefa de geração de um modelo descritivo consiste (em grande parte) em analisar os dados do domínio (entradas) e sugerir uma partição

Leia mais

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Análise de Agrupamento

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Análise de Agrupamento statística: plicação ao Sensoriamento Remoto SR 204 - NO 2017 nálise de grupamento amilo aleles Rennó camilo@dpi.inpe.br http://www.dpi.inpe.br/~camilo/estatistica/ nálise de grupamento (luster nalysis)

Leia mais

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos

Leia mais

Roteiro. Normalização. BCC321 - Banco de Dados I. Ementa. Para que serve a normalização? Posicionamento

Roteiro. Normalização. BCC321 - Banco de Dados I. Ementa. Para que serve a normalização? Posicionamento Roteiro Normalização Posicionamento Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução Dependências

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Clustering. Prof. Rodrigo Leite Durães.

Clustering. Prof. Rodrigo Leite Durães. Clustering Prof. Rodrigo Leite Durães. rodrigo_l_d@yahoo.com.br O que é Análise de Agrupamentos? Cluster: um grupo de objetos Similares entre si quando no mesmo grupo Dissimilares em relação a objetos

Leia mais

Tópicos em Mineração de Dados

Tópicos em Mineração de Dados Tópicos em Mineração de Dados Descoberta de agrupamentos Método k-médias 1. Introdução A descoberta de agrupamentos é uma tarefa descritiva que procura agrupar dados utilizando a similaridade dos valores

Leia mais

Aula 04: Dados Profa. Ms. Rosângela da Silva Nunes

Aula 04: Dados Profa. Ms. Rosângela da Silva Nunes Aula 04: Dados Profa. Ms. Rosângela da Silva Nunes 1 de 44 Visualização da informação Uso de representações visuais, interativas e suportadas por computador de dados abstratos para ampliar a cognição Stuart

Leia mais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica REDES NEURAIS ARTIFICIAIS MÁQUINA DE VETOR DE SUPORTE (SUPPORT VECTOR MACHINES) Prof. Dr. André A. P. Biscaro 1º Semestre de 2017 Introdução Poderosa metodologia para resolver problemas de aprendizagem

Leia mais

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka

Classificação: Árvores de Decisão e k-nn. Eduardo Raul Hruschka Classificação: Árvores de Decisão e k-nn Eduardo Raul Hruschka Árvores de Decisão Métodos para aproximar funções discretas, representadas por meio de uma árvore de decisão; Árvores de decisão podem ser

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Aprendizagem Não Supervisionada Alessandro L. Koerich Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática

Leia mais

Introdução ao Data Mining (Mineração de Dados)

Introdução ao Data Mining (Mineração de Dados) Introdução ao Data Mining (Mineração de Dados) Quem é da área de TI, provavelmente já ouviu sobre Data Mining, mesmo que não saiba o que é. É uma das últimas modas relacionados à BD. Para se ter uma noção

Leia mais

Inteligência Artificial

Inteligência Artificial Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis

Leia mais

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013

Inteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013 Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?

Leia mais

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados

Leia mais

ANÁLISE DE AGRUPAMENTOS

ANÁLISE DE AGRUPAMENTOS ANÁLISE DE AGRUPAMENTOS Análise de Agrupamentos 2 Definição Consistem em encontrar grupos de objetos entre os objetos Categorizá-los ou agrupá-los Tipo de aprendizado não supervisionado Encontrar grupos

Leia mais

A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos.

A Figura 28 mostra a representação gráfica dos dados presentes na base de dados fcmdata do Matlab de dimensão 140x2 dividida em 2 grupos. 84 5 Estudos de Caso A seguir serão apresentados três estudos de caso. Os dois primeiros estudos de caso têm por objetivo demonstrar a facilidade de uso do aplicativo, e o último estudo de caso é focado

Leia mais

2COP229 Inteligência Computacional. Aula 3. Clusterização.

2COP229 Inteligência Computacional. Aula 3. Clusterização. Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância

Leia mais

Mineração de Dados em Biologia Molecular

Mineração de Dados em Biologia Molecular Mineração de Dados em Biologia Molecular Principais tópicos André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Métodos baseados em distância Aprendizado baseado em instâncias Conceitos básicos KNN

Leia mais

IA: Aprendizado III. Professor Paulo Gurgel Pinheiro. 28 de Setembro de 2010

IA: Aprendizado III. Professor Paulo Gurgel Pinheiro. 28 de Setembro de 2010 IA: Aprendizado III Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 28 de Setembro de 2010 1 / 72 http://www.ic.unicamp.br/

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que

Leia mais

SUPPORT VECTOR MACHINE - SVM

SUPPORT VECTOR MACHINE - SVM SUPPORT VECTOR MACHINE - SVM Definição 2 Máquinas de Vetores Suporte (Support Vector Machines - SVMs) Proposto em 79 por Vladimir Vapnik Um dos mais importantes acontecimentos na área de reconhecimento

Leia mais

Image Descriptors: color

Image Descriptors: color Image Descriptors: color Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti Jr. (ICMCUSP) Image Descriptors: color 2011 1 / 29 Agenda

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Preparação de Dados: Parte B Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões: dos originais gentilmente

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial INF 1771 Inteligência Artificial Aula 13 K-Nearest Neighbor (KNN) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo k-nearest Neighbors (knn) Como os filmes são categorizados em gêneros? O que

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de

Leia mais

Redes Neurais não Supervisionadas: SOM

Redes Neurais não Supervisionadas: SOM Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Redes Neurais não Supervisionadas: SOM DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Tópicos

Leia mais

Hashing: conceitos. Hashing

Hashing: conceitos. Hashing Hashing: conceitos hashing é uma técnica conhecida como espalhamento, mapeamento ou randomização que tenta distribuir dados em posições aleatórias de uma tabela (array) associa cada objeto (de um determinado

Leia mais

Projeto de Escalonamento Alocação de médicos

Projeto de Escalonamento Alocação de médicos Projeto de Escalonamento Alocação de médicos Atol Fortin de Oliveira 15 de dezembro de 2009 1 Sumário 1 Introdução 3 2 O Problema 4 2.1 Especicação do problema................... 4 2.2 Resumo das variáveis

Leia mais

3 Técnicas de agrupamento

3 Técnicas de agrupamento 3 Técnicas de agrupamento Com o advento da internet a quantidade de informação disponível aumentou consideravelmente e com isso, tornou-se necessário uma forma automática de organizar e classificar esta

Leia mais

Instituto Nacional de Pesquisas Espaciais - INPE. Divisão de Processamento de Imagens - DPI

Instituto Nacional de Pesquisas Espaciais - INPE. Divisão de Processamento de Imagens - DPI 1 Sumário 2 Introdução Técnicas de ESDA Matrizes de Proximidade Espacial Média Espacial Móvel (m i ) Indicadores Globais de Autocorrelação Espacial Índices Globais de Moran (I), Geary (C) e Getis e Ord

Leia mais

SEL-0339 Introdução à Visão Computacional. Aula 5 Segmentação de Imagens

SEL-0339 Introdução à Visão Computacional. Aula 5 Segmentação de Imagens Departamento de Engenharia Elétrica - EESC-USP SEL-0339 Introdução à Visão Computacional Aula 5 Segmentação de Imagens Prof. Dr. Marcelo Andrade da Costa Vieira Prof. Dr. Adilson Gonzaga Segmentação de

Leia mais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os

Leia mais

KDD E MINERAÇÃO DE DADOS

KDD E MINERAÇÃO DE DADOS KDD E MINERAÇÃO DE DADOS Etapas do Processo de KDD Livro: Data Mining Conceitos, técnicas, algoritmos, Orientações e aplicações Ronaldo Goldschmidt, Eduardo Bezerra, Emmanuel Passos KDD Knowledge Discovery

Leia mais

Técnicas de recuperação de informação: filtragem, agrupamento

Técnicas de recuperação de informação: filtragem, agrupamento Técnicas de recuperação de informação: filtragem, agrupamento 1 Nome usado para descrever uma variedade de processos envolvendo a entrega de informação para pessoas que precisam dela; Compreende um método

Leia mais

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis:

Modelagem da Rede Neural. Modelagem da Rede Neural. Back Propagation. Modelagem da Rede Neural. Modelagem da Rede Neural. Seleção de Variáveis: Back Propagation Fatores importantes para a modelagem da Rede Neural: Seleção de variáveis; veis; Limpeza dos dados; Representação das variáveis veis de entrada e saída; Normalização; Buscando melhor Generalização

Leia mais

Arquitecturas Paralelas I Computação Paralela em Larga Escala LESI - 4º Ano. Desenvolvimento de Aplicações Paralelas

Arquitecturas Paralelas I Computação Paralela em Larga Escala LESI - 4º Ano. Desenvolvimento de Aplicações Paralelas Arquitecturas Paralelas I Computação Paralela em Larga Escala LESI - 4º Ano Desenvolvimento de Aplicações Paralelas (gec.di.uminho.pt/lesi/ap10203/aula06aplicaçõespar.pdf) João Luís Ferreira Sobral Departamento

Leia mais

Agrupamento de Dados. (Clustering)

Agrupamento de Dados. (Clustering) Agrupamento de Dados (Clustering) Organização 1. Introdução 2. Medidas de (Dis)similaridade 3. Métodos de Agrupamento (métodos hierárquicos, de partição) 4. Critérios numéricos para definir o número de

Leia mais

3 Sistemas Neuro-Fuzzy Hierárquicos

3 Sistemas Neuro-Fuzzy Hierárquicos 3 Sistemas Neuro-Fuzzy Hierárquicos 3. Introdução Sistemas neuro-fuzzy (SNF) são sistemas híbridos que combinam as vantagens das redes neurais, no que se refere ao aprendizado, com o poder de interpretação

Leia mais

Teoria dos Grafos Aula 18

Teoria dos Grafos Aula 18 Teoria dos Grafos Aula 18 Aula passada Coloração Algoritmo guloso Número cromático Teorema das 4 cores Aula de hoje Clusterização (ou agrupamento) Algoritmo Variação Clusterização Coleção de objetos Agrupar

Leia mais

Branch and Bound - Ramicar e Limitar

Branch and Bound - Ramicar e Limitar Programação Linear Inteira Branch and Bound Haroldo Gambini Santos Universidade Federal de Ouro Preto - UFOP 30 de agosto de 2011 1 / 19 Branch and Bound - Ramicar e Limitar Idéia Básica O algoritmo roda

Leia mais

Conteúdo. Histórico. Notas. Teoria dos Grafos BCC204. Notas. Notas. 1736: Euler e as Pontes de Königsberg

Conteúdo. Histórico. Notas. Teoria dos Grafos BCC204. Notas. Notas. 1736: Euler e as Pontes de Königsberg Teoria dos Grafos BCC204 Haroldo Gambini Santos Universidade Federal de Ouro Preto - UFOP 15 de março de 2011 1 / 31 Conteúdo 1 Introdução 2 Exemplos 3 4 Representação 2 / 31 Histórico 1736: Euler e as

Leia mais

Técnicas de Agrupamento (Clustering)

Técnicas de Agrupamento (Clustering) Técnicas de Agrupamento (Clustering) Sarajane M. Peres e Clodoaldo A. M. Lima 17 de setembro de 2015 Material baseado em: HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques. 2nd. 2006 ROCHA, T.,

Leia mais

Roteiro. Noções de Controle de Concorrência. BCC321 - Banco de Dados I. Ementa. Finalidade do Controle de Concorrência.

Roteiro. Noções de Controle de Concorrência. BCC321 - Banco de Dados I. Ementa. Finalidade do Controle de Concorrência. Roteiro Noções de Controle de Concorrência Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Posicionamento

Leia mais

3. Resolução de problemas por meio de busca

3. Resolução de problemas por meio de busca Inteligência Artificial - IBM1024 3. Resolução de problemas por meio de busca Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 3. Resolução de problemas por

Leia mais

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre

Leia mais

Self Organizing Maps - Redes de Kohonen

Self Organizing Maps - Redes de Kohonen Self Organizing Maps - Redes de Kohonen 1. Redes auto organizáveis Existe uma classe de redes neurais artificias que possuem a capacidade de auto organização, sendo por isto chamadas de redes auto organizáveis.

Leia mais

Realce de imagens parte 1: operações pontuais SCC0251 Processamento de Imagens

Realce de imagens parte 1: operações pontuais SCC0251 Processamento de Imagens Realce de imagens parte 1: operações pontuais SCC0251 Processamento de Imagens Prof. Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2013/1 Moacir Ponti Jr.

Leia mais

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel

MÉTODOS MULTIVARIADOS. Rodrigo A. Scarpel MÉTODOS MULTIVARIADOS Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo INTRODUÇÃO Semana Conteúdo Introdução aos métodos multivariados 1 Análise de componentes principais 2 Aplicações de análise

Leia mais

Rede RBF (Radial Basis Function)

Rede RBF (Radial Basis Function) Rede RBF (Radial Basis Function) André Tavares da Silva andre.silva@udesc.br Roteiro Introdução à rede neural artificial RBF Teorema de Cover da separabilidade de padrões RBF x MLP RBF Função de ativação

Leia mais

Combinação de Classificadores (fusão)

Combinação de Classificadores (fusão) Combinação de Classificadores (fusão) André Tavares da Silva andre.silva@udesc.br Livro da Kuncheva Roteiro Sistemas com múltiplos classificadores Fusão por voto majoritário voto majoritário ponderado

Leia mais

Projeto e Análise de Algoritmos

Projeto e Análise de Algoritmos Projeto e Algoritmos Pontifícia Universidade Católica de Minas Gerais harison@pucpcaldas.br 26 de Maio de 2017 Sumário A complexidade no desempenho de Quando utilizamos uma máquina boa, ela tende a ter

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Aprendizado de Máquina Template Matching Luiz Eduardo S. Oliveira Universidade Federal do Paraná Departamento de Informática http://lesoliveira.net October 25, 2012 Luiz S. Oliveira (UFPR) Aprendizado

Leia mais

Protótipo de Software para Reconhecimento de Impressões Digitais

Protótipo de Software para Reconhecimento de Impressões Digitais Protótipo de Software para Reconhecimento de Impressões Digitais Aluno: Alex Sandro da Silva Orientador: Paulo de Tarso Mendes Luna Semestre - 99/1 Roteiro da Apresentação INTRODUÇÃO CONCEITOS BÁSICOS

Leia mais

Análise de Agrupamento. Cluster Analysis

Análise de Agrupamento. Cluster Analysis Análise de Agrupamento Cluster Analysis Objetivo Classificar objetos, itens ou indivíduos de acordo com as suas semelhanças. Os objetos semelhantes são alocados em um mesmo grupo e, portanto, aqueles que

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC0173 Mineração de Dados Biológicos Classificação I: Algoritmos 1Rule e KNN Prof. Ricardo J. G. B. Campello SCC / ICMC / USP 1 Créditos O material a seguir consiste de adaptações e extensões dos originais:

Leia mais

Módulo III Medidas de Tendência Central ESTATÍSTICA

Módulo III Medidas de Tendência Central ESTATÍSTICA Módulo III Medidas de Tendência Central ESTATÍSTICA Objetivos do Módulo III Determinar a média, mediana e moda de uma população e de uma amostra Determinar a média ponderada de um conjunto de dados e a

Leia mais

3 Aprendizado por reforço

3 Aprendizado por reforço 3 Aprendizado por reforço Aprendizado por reforço é um ramo estudado em estatística, psicologia, neurociência e ciência da computação. Atraiu o interesse de pesquisadores ligados a aprendizado de máquina

Leia mais

Sumário. RObust Clustering using links ROCK. Thiago F. Covões. Motivação. Motivação. Links. Market basket analys. Motivação

Sumário. RObust Clustering using links ROCK. Thiago F. Covões. Motivação. Motivação. Links. Market basket analys. Motivação Sumário RObust Clustering using links ROCK Thiago F. Covões Motivação Links Função de qualidade Algoritmo Vantagens/Desvantagens SCC5895Análise de Agrupamento de Dados 1 2 Motivação Atributos categóricos/nominais/discretos

Leia mais

Algoritmos de pesquisa. Tabelas de dispersão/hash

Algoritmos de pesquisa. Tabelas de dispersão/hash Algoritmos de pesquisa Tabelas de dispersão/hash Introdução Motivação: Considerar o problema de pesquisar um determinado valor num vetor. Se o vetor não está ordenado, a pesquisa requer O(n) de complexidade.

Leia mais

O Problema da Ordenação Métodos de Ordenação Parte 1

O Problema da Ordenação Métodos de Ordenação Parte 1 Métodos de Ordenação Parte 1 SCC-201 Introdução à Ciência da Computação II Rosane Minghim 2010 Ordenação (ou classificação) é largamente utilizada Listas telefônicas e dicionários Grandes sistemas de BD

Leia mais

Estatística descritiva básica: Medidas de tendência central

Estatística descritiva básica: Medidas de tendência central Estatística descritiva básica: Medidas de tendência central ACH2021 Tratamento e Análise de Dados e Informações Marcelo de Souza Lauretto marcelolauretto@usp.br www.each.usp.br/lauretto *Parte do conteúdo

Leia mais

Otimização de horários Seminário. Clarisse Resende 25/01/2013

Otimização de horários Seminário. Clarisse Resende 25/01/2013 Otimização de horários Seminário Clarisse Resende 25/01/2013 O problema dos horários consiste numa sequência de atividades de programação, satisfazendo um conjunto de restrições de recursos. Pretende-se

Leia mais

Implementação dos Algoritmos e Resultados

Implementação dos Algoritmos e Resultados Capítulo 6 Implementação dos Algoritmos e Resultados 6.1 Considerações Iniciais Diversas situações foram exploradas neste trabalho visando analisar qual seria a wavelet mais adequada para sistemas de extração

Leia mais

Teoria dos Grafos Aula 23

Teoria dos Grafos Aula 23 Teoria dos Grafos Aula 23 Aula passada Apresentação de trabalhos Discussão da prova Subset sum Problema da mochila Aula de hoje Caminho mais curto entre todos os pares Algortimo de Floyd Warshall Programação

Leia mais

Estudo e Comparação de Métodos para Estimação de Números de Grupos em Problemas de Agrupamento de Dados. N o 340 RELATÓRIOS TÉCNICOS DO ICMC

Estudo e Comparação de Métodos para Estimação de Números de Grupos em Problemas de Agrupamento de Dados. N o 340 RELATÓRIOS TÉCNICOS DO ICMC Instituto de Ciências Matemáticas e de Computação ISSN - 0103-2569 Estudo e Comparação de Métodos para Estimação de Números de Grupos em Problemas de Agrupamento de Dados André Fontana Murilo Coelho Naldi

Leia mais

Escalonamento Multidimensional

Escalonamento Multidimensional Programa de Pós-Graduação em Administração de Organizações (PPGAO) Análise de dados multivariados I Escalonamento Multidimensional Escalonamento Multidimensional (EMD) CAPÍTULO 9 Escalonamento Multidimensional

Leia mais

PCC173 - Otimização em Redes

PCC173 - Otimização em Redes PCC173 - Otimização em Redes Marco Antonio M. Carvalho Departamento de Computação Instituto de Ciências Exatas e Biológicas Universidade Federal de Ouro Preto 31 de maio de 2017 Marco Antonio M. Carvalho

Leia mais

Reconhecimento facial. uma aplicação prática do reconhecimento de padrões

Reconhecimento facial. uma aplicação prática do reconhecimento de padrões Reconhecimento facial uma aplicação prática do reconhecimento de padrões Márcio Koch, junho 2014 Pauta Apresentação Visão computacional Reconhecimento de padrões Analise de Componentes Principais Reconhecimento

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção

Leia mais

Processamento digital de imagens

Processamento digital de imagens Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 6 de outubro de 2016 Segmentação de imagens A segmentação

Leia mais

Aprendizado de Máquina

Aprendizado de Máquina Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com

Leia mais

Análise de complexidade

Análise de complexidade Introdução Algoritmo: sequência de instruções necessárias para a resolução de um problema bem formulado (passíveis de implementação em computador) Estratégia: especificar (definir propriedades) arquitectura

Leia mais

Aprendizagem de Máquinas

Aprendizagem de Máquinas Universidade Federal do Rio Grande do Norte Departamento de Engenharia de Computação e Automação Aprendizagem de Máquinas DCA0121 Inteligência Artificial Aplicada Heitor Medeiros 1 Aprendizagem de Máquinas

Leia mais

Complemento a Um e Complemento a Dois

Complemento a Um e Complemento a Dois Complemento a Um e Complemento a Dois Cristina Boeres (baseado no material de Fernanda Passos) Instituto de Computação (UFF) Fundamentos de Arquiteturas de Computadores Cristina Boeres (IC/UFF) Complemento

Leia mais

CONCEITOS FUNDAMENTAIS SOBRE TABELAS E GRÁFICOS. Profa. Raquel C. de Melo Minardi

CONCEITOS FUNDAMENTAIS SOBRE TABELAS E GRÁFICOS. Profa. Raquel C. de Melo Minardi 3 CONCEITOS FUNDAMENTAIS SOBRE TABELAS E GRÁFICOS Profa. Raquel C. de Melo Minardi LIVRO: SHOW ME THE NUMBERS Capítulos 1, 2 e 3 Unidades de medida? Data? Como estas medidas de comparam aos planos? Como

Leia mais

Técnicas de Projeto de Algoritmos

Técnicas de Projeto de Algoritmos UNIVERSIDADE NOVE DE JULHO - UNINOVE Pesquisa e Ordenação Técnicas de Projeto de Algoritmos Material disponível para download em: www.profvaniacristina.com Profa. Vânia Cristina de Souza Pereira 03 _ Material

Leia mais

Data t Mi M ning : : Conceitos e Técnicas

Data t Mi M ning : : Conceitos e Técnicas Data Mining: Conceitos e Técnicas Algumas técnicas para Data Mining Geração de regras de associação; Classificação e predição; Agrupamento (clustering). Data Mining: Regras de Associação Regras de associação

Leia mais

Fundamentos de Inteligência Artificial [5COP099]

Fundamentos de Inteligência Artificial [5COP099] Fundamentos de Inteligência Artificial [5COP099] Dr. Sylvio Barbon Junior Departamento de Computação - UEL 1 o Semestre Assunto Aula 10 Modelos Preditivos - Árvore de Decisão 2 de 20 Aula 10 - Árvore de

Leia mais

PMR2560 Visão Computacional Detecção de cores e blobs. Prof. Eduardo L. L. Cabral

PMR2560 Visão Computacional Detecção de cores e blobs. Prof. Eduardo L. L. Cabral PMR2560 Visão Computacional Detecção de cores e blobs Prof. Eduardo L. L. Cabral Objetivos Detecção de cores; Detecção de blobs. Detecção de cores Cores são facilmente identificadas nas imagens. Cor a

Leia mais