AGRUPAMENTO DE DADOS SEMI-SUPERVISIONADO NO CONTEXTO DE APRENDIZADO DE MÁQUINA

Tamanho: px
Começar a partir da página:

Download "AGRUPAMENTO DE DADOS SEMI-SUPERVISIONADO NO CONTEXTO DE APRENDIZADO DE MÁQUINA"

Transcrição

1 AGRUPAMENTO DE DADOS SEMI-SUPERVISIONADO NO CONTEXTO DE APRENDIZADO DE MÁQUINA Jornada Científica UFSCar Priscilla de Abreu Lopes priscilla_lopes@dc.ufscar.br

2 AGRUPAMENTO DE DADOS - INTRODUÇÃO 1. Aprendizado de Máquina 2. O que é Agrupamento de Dados? 3. Por que utilizar Agrupamento? 4. Processo de Agrupamento

3 APRENDIZADO DE MÁQUINA Avanços da tecnologia computacional Maior capacidade de armazenamento Crescimento de aplicações Internet, digitalização de imagens, captura de vídeo Volume: 281 exabytes em 2007; 10 vezes maior em 2011 (Gantz, 2008) 3

4 APRENDIZADO DE MÁQUINA Aplicações automáticas Análise de dados Classificação Recuperação de informação Dados não-estruturados Dificuldade de análise Avanço das metodologias 4

5 APRENDIZADO DE MÁQUINA Reconhecimento de padrões Modelagem preditiva Dado um conjunto de treinamento, deseja-se predizer o comportamento dos dados desconhecidos Aprendizado Supervisionado Classificação, apenas dados rotulados Não-supervisionado Agrupamento ou clustering, apenas dados não rotulados Semi-supervisionado Híbrido, dados rotulados e não rotulados, restrições 5

6 O QUE É AGRUPAMENTO DE DADOS? A organização de dados em grupos é uma das formas mais fundamentais para entendimento e aprendizado. Ex: Taxonomia animal 6

7 O QUE É AGRUPAMENTO DE DADOS? Análise de grupos ou clusters é o estudo de algoritmos e métodos para agrupar objetos de acordo com suas características. Dada uma representação de n objetos, encontrar K grupos baseando-se em uma medida de similaridade, tal que objetos dentro de um mesmo grupo são semelhantes e objetos de grupos diferentes são distintos. O que é similaridade? Quão semelhantes são dois objetos diferentes de um conjunto de dados O que é um grupo? Ideal: conjunto compacto e isolado de pontos (objetos) Real: subjetivo, nos olhos de quem vê 7

8 O QUE É AGRUPAMENTO DE DADOS? (Jain, 2008) 8

9 POR QUE UTILIZAR AGRUPAMENTO? Análise de grupos é utilizada, especialmente, em casos de dados multivariados. A vasta literatura sobre agrupamento de dados mostra a importância deste tema. Uma busca pelas palavras data clustering resultou em mais de trabalhos, apenas de 2007 (Jain, 2008). Difícil listar todos os campos onde já foram/podem ser utilizadas as técnicas de agrupamento 9

10 POR QUE UTILIZAR AGRUPAMENTO? Algumas aplicações: Segmentação de imagens (Frigui& Krishnapuram, 1999), (Jain & Flynn, 1996), (Shi & Malik, 2000) Agrupamento de documentos (Iwayama & Tokunaga, 1995), (Sahami, 1998), (Bhatia & Deogun, 1998) Agrupamento de clientes para marketing eficiente (Arabie & Hubert, 1994) Gerenciamento e planejamento de força de trabalho (Hu et al., 2007) Estudo de dados de genoma (Baldi & Hatfield, 2002) 10

11 PROCESSO DE AGRUPAMENTO Preparação de Padrões Similaridade Agrupamento Validação Interpretação dos Resultados (Jain, Murty e Flynn, 1999) 11

12 PROCESSO DE AGRUPAMENTO Preparação de Padrões Normalização do conjunto Seleção de características Extração de características Representação Matriz de padrões Matriz e grafo de similaridade Similaridade Definição de medidas (Gordon, 1999) Características contínuas: distâncias baseadas na métrica Minkowski (distância Euclidiana, distância de Manhattan) Características binárias: distância de Manhattan Características nominais: coeficiente de casamento simples, coeficiente de Jaccard 12

13 PROCESSO DE AGRUPAMENTO Agrupamento Aplicação de um algoritmo de agrupamento Validação Avaliação da qualidade e confiabilidade dos clusters gerados Métodos estatísticos Interpretação dos Resultados Avaliação do resultado do agrupamento com objetivo de descrever a natureza dos grupos gerados 13

14 MÉTODOS DE AGRUPAMENTO NÃO- SUPERVISIONADO 1. Agrupamento Hierárquico 2. Agrupamento Particional a. Algoritmo K-means

15 AGRUPAMENTO HIERÁRQUICO Procedimento para transformação de uma matriz de similaridade em uma sequência de partições aninhadas. 15

16 AGRUPAMENTO HIERÁRQUICO Abordagem Aglomerativa (bottom-up) Inicia com agrupamento disjunto, onde cada um dos n objetos é um cluster. Pela matriz de similaridade, os cluster individuais são aninhados em novos clusters Cada algoritmo especifica a interpretação da matriz de similaridade Repete-se o processo, que diminui o número de clusters, até que haja apenas um único cluster contendo todos os n objetos 16

17 AGRUPAMENTO HIERÁRQUICO Abordagem Divisiva (top-down) Inicia com um único grupo que contém todos os n objetos. Pela matriz de similaridade, os clusters que contém mais de 1 objeto são divididos em sub-clusters Cada algoritmo especifica a interpretação da matriz de similaridade Repete-se o processo, que aumenta o número de clusters, até que haja um cluster para cada um dos n objetos 17

18 AGRUPAMENTO HIERÁRQUICO Métodos Single-Link e Complete-Link Abordagem aglomerativa Representam os objetos como vértices de um grafo Processo para aninhar clusters consiste na criação de arestas entre objetos pouco dissimilares Embora ambos utilizem conceitos da teoria dos grafos para aninhar os clusters, as análises são feitas de formas diferentes Single-link: número de sub-grafos conexos Complete-link: formação de sub-grafos completos 18 G(0) G(1)

19 AGRUPAMENTO HIERÁRQUICO (Jain & Dubes, 1988) 19

20 AGRUPAMENTO HIERÁRQUICO Clusters aninhados Difícil visualização quanto maior o número de objetos dentro do conjunto de dados Clusters que não existem Agrupamento em conjuntos com objetos não agrupáveis Mesmo método, resultados distintos Maioria dos algoritmos não melhora os clusters Popular nas ciências biológica, social e comportamental, devido à necessidade de construir taxonomias 20

21 AGRUPAMENTO PARTICIONAL Procedimento para encontrar todos os clusters simultaneamente, como uma partição dos dados 21

22 ALGORITMO K-MEANS O K-means é um dos mais populares e simples algoritmos de agrupamento. Publicado na década de 50 Apesar do grande número de publicações com diferentes algoritmos de agrupamento, o K-means ainda é amplamente utilizado É um algoritmo de fácil implementação e é eficiente 22

23 ALGORITMO K-MEANS Agrupar os dados em k subconjuntos disjuntos, de maneira que a soma das distâncias entre os padrões pertencentes a um agrupamento e seu respectivo centro seja mínima. O centro de cluster ou protótipo representa o ponto médio dos pontos pertencentes a um determinado agrupamento. 23

24 ALGORITMO K-MEANS Entradas: X = {x 1, x 2,... x n }: conjunto de dados com n pontos; k: número de grupos que serão criados 1. Definir os primeiros k centros de clusters 2. Alocação de pontos em clusters por cálculo da similaridade entre um ponto x i e cada um dos centros de clusters. 3. Atualização dos centros de clusters 4. Repete 2 e 3 até que não ocorra realocação de pontos ou o número máximo de iterações seja alcançado Saída: C = {C 1,..., C k }: partição do conjunto de dados X 24

25 ALGORITMO K-MEANS 25 Conjunto X

26 ALGORITMO K-MEANS 26 Definição dos centros

27 ALGORITMO K-MEANS 27 Iteração 2

28 ALGORITMO K-MEANS 28 Iteração 3

29 ALGORITMO K-MEANS 29 Final

30 MÉTODOS DE AGRUPAMENTO SEMI- SUPERVISIONADO 1. Agrupamento Semi-Supervisionado 2. Abordagem Baseada em Sementes 3. Abordagem Baseada em Restrições 4. Algoritmos a. Algoritmo SEEDED-K-means b. Algoritmo COP-K-means c. Algoritmo CONSTRAINED-K-means

31 AGRUPAMENTO SEMI-SUPERVISIONADO Diversos algoritmos com o objetivo de melhorar o agrupamento de dados explorando algum tipo de supervisão foram propostos nos últimos anos. A informação disponível para rotulação dos dados tem sido utilizada em duas abordagens diferentes: Abordagem baseada em restrições Abordagem baseada em sementes Em ambas, são realizadas modificações em algoritmos de agrupamento para que estes utilizem a informação disponível com o objetivo de obter um particionamento mais adequado 31

32 ABORDAGEM BASEADA EM SEMENTES Métodos que compreendem esta abordagem utilizam-se de dados rotulados para obter melhor agrupamento. Uma quantidade pequena de dados rotulados são utilizados junto a uma grande quantidade de dados não rotulados. Em alguns métodos, um número grande de exemplos rotulados pode afetar o desempenho do algoritmo e resultar em um agrupamento de baixa qualidade Algoritmo SEEDED-K-means 32

33 ABORDAGEM BASEADA EM RESTRIÇÕES É uma abordagem bastante comum para a utilização de informação extra de um conjunto de dados. Especificação de restrições entre pares de pontos Must-link O par pertence ao mesmo cluster Cannot-link O par não pertence ao mesmo cluster 33

34 ABORDAGEM BASEADA EM RESTRIÇÕES As restrições são, geralmente, obtidas com a ajuda de um especialista no domínio do conjunto. Há poucos trabalhos a respeito da obtenção automática de restrições a partir do conjunto de dados Restrição com relação a atributos, ao invés de restrições entre instâncias Algoritmo COP-K-means Algoritmo PCK-means 34

35 ALGORITMO SEEDED-K-MEANS Variante do K-means Particiona os dados em k clusters Utiliza exemplo inicialmente rotulados para calcular os centros iniciais dos clusters (SEED) Dado um conjunto de exemplos E, tem-se S como subconjunto de E. Na inicialização do algoritmo, o usuário deve atribuir a cada elemento de S um dos clusters a serem encontrados. Exigência: para cada cluster deve haver pelo menos uma semente As sementes são utilizadas apenas na inicialização do algoritmo 35

36 ALGORITMO COP-K-MEANS Variante do K-means. Utilização de conhecimento prévio, descrito na forma de relações entre os exemplos. Must-link Cannot-link As restrições são impostas pelo usuário nos exemplos rotulados. Durante a construção da partição, cada exemplo do conjunto de exemplos não rotulados é associado ao cluster mais proximo. 36

37 ALGORITMO CONSTRAINED-K-MEANS Híbrido entre as abordagens baseadas em sementes e restrições. Melhoria do SEEDED-K-means, utiliza-se de restrições. Os exemplos que fazem parte do conjunto das sementes não poderão ser associados a um outro cluster. É mais adequado quando as sementes estão livres de ruídos. 37

38 MÉTODOS DE AGRUPAMENTO FUZZY 1. Introdução a Sistemas Fuzzy 2. Agrupamento Não-Supervisionado a. Algoritmo Fuzzy C-Means 3. Agrupamento Semi-Supervisionado 1. Algoritmo semi-supervised Fuzzy C-Means 2. Algoritmo partially supervised Gustafson & Kessel 3. Algoritmo semi-supervised Point Prototype Clustering

39 INTRODUÇÃO A SISTEMAS FUZZY Conjuntos convencionais (crisp) podem ser definidos por Enumeração de elementos {1, 2, 3, 4, 5,..., 20} Propriedades dos elementos A = {x em N x é par} Função característica A: X {0, 1} Se o elemento x pertence ao domínio X, então A(x) = 1 Se o elemento x não pertence ao domínio X, então A(x) = 0 39

40 INTRODUÇÃO A SISTEMAS FUZZY Conjuntos fuzzy são definidos por Função de pertinência A: X [0, 1] Onde X é o conjunto base e A é o conjunto fuzzy Elementos do conjunto base pertencem ao conjunto com um certo grau, que usualmente varia entre 0 e 1. A função de pertinência mapeia elementos do conjunto base X em um número real entre 0 e 1. 40

41 INTRODUÇÃO A SISTEMAS FUZZY 41

42 INTRODUÇÃO A SISTEMAS FUZZY Representação de categorias Variável temperatura 42

43 INTRODUÇÃO A SISTEMAS FUZZY Formas de conjuntos fuzzy 43

44 INTRODUÇÃO A SISTEMAS FUZZY Representação por lista Temperatura Alta (TA) TA = 0/10 + 0/15 + 0/20 + 0/25 + 0/30 + 0,5/35 + 1/40 Temperatura Média (TM) TM = 0/10 + 0,5/15 + 1/20 + 0,5/25 + 0/30 + 0/35 +0/40 44

45 INTRODUÇÃO A SISTEMAS FUZZY Operações (união, intersecção, complemento,...) Relações (produto cartesiano, projeção,...) Propriedades de relações (reflexão, simetria, transitividade,...) Variáveis fuzzy Lógica fuzzy Raciocínio aproximado Regras, inferência, implicação Cálculo com regras 45

46 INTRODUÇÃO A SISTEMAS FUZZY Sistemas fuzzy Classificação Inferência Genéticos Agrupamento fuzzy Formação de partições fuzzy ou pseudo-partições fuzzy Pseudo-partição fuzzy X = {x 1, x 2, x 3 } A 1 = 0.6/x 1 + 1/x /x 3 A 2 = 0.4/x 1 + 0/x /x 3 {A 1, A 2 } é uma partição 2-fuzzy de X 46

47 AGRUPAMENTO NÃO-SUPERVISIONADO Algoritmo K-means Divisão de grupos a partir de centróides (centros de clusters) Um padrão pertence a um grupo de forma disjunta, ou seja, pertence a um grupo e somente àquele grupo Algoritmo Fuzzy C-Means (FCM) Semelhante ao K-means Cada padrão possui um grau de pertinência à cada grupo Pseudo-partições Fuzzy para divisão dos padrões de um conjunto em grupos 47

48 ALGORITMO FUZZY C-MEANS (FCM) Entradas: X: conjunto de dados c: número de clusters m: (1, ) nível de fuzzificação (influência dos graus de pertinência) ε: erro, critério de parada 1. Selecionar uma pseudo-partição Fuzzy inicial 2. Calcular os centros de clusters para a pseudo-partição Média Ponderada 3. Atualizar a pseudo=partição Fuzzy 4. Repete 2 e 3 até que a diferença entre a pseudopartição (t) e a pseudo-partição (t+1) seja menor ou igual ao erro ε, ou alcance o máximo de iterações Saída: Pseudo-partição Fuzzy e centros de clusters 48

49 AGRUPAMENTO SEMI-SUPERVISIONADO Algoritmo semi-supervised FCM (ssfcm) (Bensaid et al., 1996) Algoritmo partially supervised Gustafson & Kessel (psgk) (Pedrycz, 1985), (Pedrycz & Waletzky, 1997) Algoritmo semi-supervised Point Prototype Clustering (ssppc) (Bensaid & Bezdek, 1998), (Labzour et al., 1998) 49

50 ALGORITMO SEMI-SUPERVISED FCM (SSFCM) Baseado no algoritmo FCM Objetivos: Escolha do número de clusters Associação de rótulos aos grupos definidos pelo algoritmo Funções de desempenho que tendem a igualar o número de membros de cada cluster 50

51 ALGORITMO SEMI-SUPERVISED FCM (SSFCM) 51

52 ALGORITMO SEMI-SUPERVISED FCM (SSFCM) 52

53 ALGORITMO SEMI-SUPERVISED FCM (SSFCM) Modificações: Introdução de exemplos rotulados: o conjunto de dados X é substituído pela união de X r e X nr. Pertinência de exemplos rotulados não é alterada, refletindo no cálculo das pseudo-partições Peso atribuído ao exemplos rotulados para realizar o cálculo dos centróides. Peso definido de acordo com o grau de influência do exemplo rotulado Peso definido por um mesmo valor aleatório para todos os exemplos rotulados 53

54 ALGORITMO PARTIALLY SUPERVISED GUSTAFSON & KESSEL (PSGK) Extensão semi-supervisionada do método descrito por (Gustafson & Kessel, 1978) Utilização de uma distância quadrática adaptativa no lugar da distância Euclidiana (FCM). Conjunto de dados é a união de X r e X nr. Vetor de valores binários que indica quais são os dados rotulados (valor 1) e quais não são (valor 0). Cálculo para atualização das partições é modificado para incluir um termo de penalidade que balanceia a influência dos exemplos rotulados. 54

55 ALGORITMO SEMI-SUPERVISED POINT PROTOTYPE CLUSTERING (SSPPC) Utiliza exemplos rotulados para definir variáveis de entrada de agrupamento não supervisionado e para realizar o ajuste do grau de pertinência dos exemplos não rotulados aos clusters. Separa o conjunto de dados X em X r e X nr. O algoritmo de agrupamento não supervisionado pode ser qualquer um do tipo point-prototype O K-means e o FCM são exemplos, pois realizam divisão de grupos a partir de centróides (protótipos) 55

56 ALGORITMO SEMI-SUPERVISED POINT PROTOTYPE CLUSTERING (SSPPC) Passos principais: 1. Aplicação de um algoritmo de agrupamento pointprototype ao conjunto X nr, com número de clusters igual a n r ( Xr = n r ), ou seja, há um cluster para cada exemplo rotulado. Saída: vetor V contendo os centros de clusters e uma matriz com o grau de pertinência de cada padrão não rotulado aos grupos. 2. Determinação de um rótulo para cada um dos nr clusters obtidos em 1, baseando-se na distância entre os protótipos e os exemplos rotulados 56

57 ALGORITMO SEMI-SUPERVISED POINT PROTOTYPE CLUSTERING (SSPPC) 3. Cálculo do grau de pertinência de cada exemplo não rotulado a um rótulo, com auxílio da partição obtida após a aplicação do algoritmo pointprototype. 57

58 COMPARAÇÃO ENTRE ALGORITMOS 58 (Klose & Kruse, 2005)

59 COMPARAÇÃO ENTRE ALGORITMOS 59 (Klose & Kruse, 2005)

60 COMPARAÇÃO ENTRE ALGORITMOS 60 (Klose & Kruse, 2005)

61 COMPARAÇÃO ENTRE ALGORITMOS 61 (Klose & Kruse, 2005)

62 EXEMPLOS PRÁTICOS

63 EXEMPLOS PRÁTICOS Acesso: Exemplos Implementações do aluno de IC Fábio Henrique Farath Bases de dados no formato ARFF para utilizar com as implementações mencionadas anteriormente Framework JMinHEP análise de clusters Repositório UCI de base de dados para Aprendizado de Máquina 63

64 REFERÊNCIAS BIBLIOGRÁFICAS ARABIE, P., HUBERT, L Advanced methods in marketing research. Oxford: Blackwell. Chap. Cluster Analysis in Marketing Research, páginas BALDI, P., HATFIELD, G Dna microarrays and gene expression. Cambridge University Press. BENSAID, A.M., BEZDEK, J.C., Semi-supervised point prototype clustering. Pattern Recognition Artif. Intell. 12 (2) BENSAID, A. M.,HALL, L. O.,BEZDEK, J. C.,CLARKE, L. P. Partially supervised clustering for image segmentation. Pattern Recognition. v. 29, n. 5, p , BHATIA, S., & DEOGUN, J Conceputal clustering in information retrieval. Ieee transactions on systems, man and cybernetics, 28(B), DUDA, R., HART, P., STORK, D Pattern classification. New York: John Wiley & Sons. FRIGUI, H., KRISHNAPURAM, R A robust competitive clustering algorithm with applications in computer vision. Ieee transactions on pattern analysis and machine intelligence, 21, GANTZ, J. F The diverse and exploding digital universe. Disponível em: GORDON, A. D. Classification. Chapman & Hall/CRC GUSTAFSON, D. E., KESSEL, W. C., Fuzzy clustering with a fuzzy covariance matrix. In: Proc. IEEE Conference on Decision and Control including the 17th Symposium on Adaptive Processes, v. 17 p HU, J., RAY, B. K., SINGH, M Statistical methods for automated generation of service engagement staffing plans. Ibm j. res. dev., 51(3), IWAYAMA, M., & TOKUNAGA, T Clusterbased text categorization: a comparison of category search strategies. Pages of: Proceedings of the 18th acm international conference on research and development in information retrieval. 64

65 REFERÊNCIAS BIBLIOGRÁFICAS JAIN, A. K Data Clustering: 50 Years Beyond K-Means. Disponível em: JAIN, A. K., DUBES, R. C Algorithms for clustering data. Prentice Hall. JAIN, A. K., FLYNN, P Advances in image understanding. IEEE Computer Society Press. Chap. Image segmentation using clustering, páginas JAIN, A. K., M. N. MURTY e P. J. FLYNN. Data clustering: a review. ACM Computing Surveys, v.31, n.3, p KLIR, G. J., YUAN, B. Fuzzy Sets and Fuzzy Logic: Theory and Applications. Upper Saddle River, NJ: Prentice Hall, KLOSE, A., KRUSE, R. Semi-supervised learning in knowledge discovery. Fuzzy Sets and Systems. v. 149, p , LABZOUR, T., BENSAID, A., BEZDEK, J. Improved semi-supervised point-prototype clustering algorithms. in: Proc. Internat. Conf. on Fuzzy Systems pp PEDRYCZ, W. Algorithms of fuzzy clustering with partial supervision. Pattern Recognition Letters. v. 3, n. 1, p , PEDRYCZ, W., WALETZKY, J. Fuzzy clustering with partial supervision. IEEE Transactions on Systems, Man, and Cybernetics, Part B. v. 27, n. 5, p , SAHAMI, M Using machine learning to improve information access. Ph.D. thesis, Computer Science Department, Stanford University. SHI, J., MALIK, J Normalized cuts and image segmentation. Ieee transactions on pattern analysis and machine intelligence, 22,

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Clustering: K-means and Aglomerative

Clustering: K-means and Aglomerative Universidade Federal de Pernambuco UFPE Centro de Informática Cin Pós-graduação em Ciência da Computação U F P E Clustering: K-means and Aglomerative Equipe: Hugo, Jeandro, Rhudney e Tiago Professores:

Leia mais

UNIVERSIDADE FEDERAL DE SÃO CARLOS

UNIVERSIDADE FEDERAL DE SÃO CARLOS UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA Departamento de Computação Aprendizado não supervisionado em domínios fuzzy algoritmo fuzzy c-means Frank Sussumu Yonamine Lucia

Leia mais

UNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO

UNIVERSIDADE F EDERAL DE P ERNAMBUCO ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO UNIVERSIDADE F EDERAL DE P ERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2010.2 ANÁLISE DE UM MÉTODO PARA DETECÇÃO DE PEDESTRES EM IMAGENS PROPOSTA DE TRABALHO DE GRADUAÇÃO Aluno!

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS

UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS UNIVERSIDADE FEDERAL DE SANTA CATARINA GRADUAÇÃO EM SISTEMAS DE INFORMAÇÃO DEPARTAMENTO DE INFORMÁTICA E ESTATÍSTICA DATA MINING EM VÍDEOS VINICIUS DA SILVEIRA SEGALIN FLORIANÓPOLIS OUTUBRO/2013 Sumário

Leia mais

Vetor Quantização e Aglomeramento (Clustering)

Vetor Quantização e Aglomeramento (Clustering) (Clustering) Introdução Aglomeramento de K-partes Desafios do Aglomeramento Aglomeramento Hierárquico Aglomeramento divisivo (top-down) Aglomeramento inclusivo (bottom-up) Aplicações para o reconhecimento

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto

Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto Prof. Walter Cunha falecomigo@waltercunha.com http://waltercunha.com PMBoK Organização do Projeto Os projetos e o gerenciamento

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Encontrar grupos de objetos tal que objetos em um grupo são similares (ou relacionados) uns aos outros e diferentes de (ou não relacionados) a objetos em outros grupos Compreensão Agrupa documentos relacionados

Leia mais

Agrupamento de dados

Agrupamento de dados Organização e Recuperação de Informação: Agrupamento de dados Marcelo K. A. Faculdade de Computação - UFU Agrupamento de dados / 7 Overview Agrupamento: introdução Agrupamento em ORI 3 K-médias 4 Avaliação

Leia mais

Inteligência Computacional [2COP229]

Inteligência Computacional [2COP229] Inteligência Computacional [2COP229] Mestrado em Ciência da Computação Sylvio Barbon Jr barbon@uel.br (2/24) Tema Aula 1 Introdução ao Reconhecimento de Padrões 1 Introdução 2 Componentes clássicos da

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Programa de Pós-Graduação em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Horários Aulas Sala [quinta-feira, 7:30 12:00] Atendimento Segunda

Leia mais

4 Aplicativo para Análise de Agrupamentos

4 Aplicativo para Análise de Agrupamentos 65 4 Aplicativo para Análise de Agrupamentos Este capítulo apresenta a modelagem de um aplicativo, denominado Cluster Analysis, dedicado à formação e análise de grupos em bases de dados. O aplicativo desenvolvido

Leia mais

ADM041 / EPR806 Sistemas de Informação

ADM041 / EPR806 Sistemas de Informação ADM041 / EPR806 Sistemas de Informação UNIFEI Universidade Federal de Itajubá Prof. Dr. Alexandre Ferreira de Pinho 1 Sistemas de Apoio à Decisão (SAD) Tipos de SAD Orientados por modelos: Criação de diferentes

Leia mais

Complemento III Noções Introdutórias em Lógica Nebulosa

Complemento III Noções Introdutórias em Lógica Nebulosa Complemento III Noções Introdutórias em Lógica Nebulosa Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais

Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis

Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis Adriano Lima de Sá Faculdade de Computação Universidade Federal de Uberlândia 20 de junho de 2014 Adriano L. Sá (UFU)

Leia mais

Pré processamento de dados II. Mineração de Dados 2012

Pré processamento de dados II. Mineração de Dados 2012 Pré processamento de dados II Mineração de Dados 2012 Luís Rato Universidade de Évora, 2012 Mineração de dados / Data Mining 1 Redução de dimensionalidade Objetivo: Evitar excesso de dimensionalidade Reduzir

Leia mais

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade

Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Extensão do WEKA para Métodos de Agrupamento com Restrição de Contigüidade Carlos Eduardo R. de Mello, Geraldo Zimbrão da Silva, Jano M. de Souza Programa de Engenharia de Sistemas e Computação Universidade

Leia mais

Comparação entre as Técnicas de Agrupamento K-Means e Fuzzy C-Means para Segmentação de Imagens Coloridas

Comparação entre as Técnicas de Agrupamento K-Means e Fuzzy C-Means para Segmentação de Imagens Coloridas Comparação entre as Técnicas de Agrupamento K-Means e Fuzzy C-Means para Segmentação de Imagens Coloridas Vinicius Ruela Pereira Borges 1 1 Faculdade de Computação - Universidade Federal de Uberlândia

Leia mais

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

ISO/IEC 12207: Gerência de Configuração

ISO/IEC 12207: Gerência de Configuração ISO/IEC 12207: Gerência de Configuração Durante o processo de desenvolvimento de um software, é produzida uma grande quantidade de itens de informação que podem ser alterados durante o processo Para que

Leia mais

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining

Clustering - agrupamento. Baseado no capítulo 8 de. Introduction to Data Mining Clustering - agrupamento Baseado no capítulo 8 de Introduction to Data Mining de Tan, Steinbach, Kumar Clustering - agrupamento 1 O que é Clustering? Encontar grupos de objectos tal que os objectos dentro

Leia mais

Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais

Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais Estudo da Viabilidade da utilização de Cartão de Crédito para um Grupo de Clientes Essenciais Cleyton Zanardo de Oliveira CER, DEs, UFSCar Vera Lúcia Damasceno Tomazella, DEs, UFSCar Resumo Uma única pessoa

Leia mais

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS

UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS UFGD FCA PROF. OMAR DANIEL BLOCO 6 CLASSIFICAÇÃO DE IMAGENS Obter uma imagem temática a partir de métodos de classificação de imagens multi- espectrais 1. CLASSIFICAÇÃO POR PIXEL é o processo de extração

Leia mais

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS

AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO BACHARELADO AMBIENTE PARA AUXILIAR O DESENVOLVIMENTO DE PROGRAMAS MONOLÍTICOS Orientando: Oliver Mário

Leia mais

3 Metodologia para Segmentação do Mercado Bancário

3 Metodologia para Segmentação do Mercado Bancário 3 Metodologia para Segmentação do Mercado Bancário Este capítulo descreve a metodologia proposta nesta dissertação para a segmentação do mercado bancário a partir da abordagem post-hoc, servindo-se de

Leia mais

PLANO DE ENSINO. Mestrado em Matemática - Área de Concentração em Estatística

PLANO DE ENSINO. Mestrado em Matemática - Área de Concentração em Estatística 1. IDENTIFICAÇÃO PLANO DE ENSINO Disciplina: Estatística Multivariada Código: PGMAT568 Pré-Requisito: No. de Créditos: 4 Número de Aulas Teóricas: 60 Práticas: Semestre: 1º Ano: 2015 Turma(s): 01 Professor(a):

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

Algoritmos de Agrupamento - Aprendizado Não Supervisionado. Fabrício Jailson Barth

Algoritmos de Agrupamento - Aprendizado Não Supervisionado. Fabrício Jailson Barth Algoritmos de Agrupamento - Aprendizado Não Supervisionado Fabrício Jailson Barth Abril de 2013 Sumário Introdução e Definições Aplicações Algoritmos de Agrupamento Agrupamento Plano Agrupamento Hierárquico

Leia mais

IN0997 - Redes Neurais

IN0997 - Redes Neurais IN0997 - Redes Neurais Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática - CIn Departamento de Sistemas da Computação aluizioa@cin.ufpe.br Conteúdo Objetivos Ementa

Leia mais

Recuperação de Informação em Bases de Texto. Aula 10

Recuperação de Informação em Bases de Texto. Aula 10 Aula 10 1 Agrupamento/ clustering de documentos: Agrupar os documentos em classes/grupos, de acordo com a sua semelhança Aprendizagem não supervisionada Sem conjunto de treino/exemplos 2 3 Agrupamento/

Leia mais

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software PROCESSO DE DESENVOLVIMENTO DE SOFTWARE Introdução Modelos de Processo de Desenvolvimento de Software Os modelos de processos de desenvolvimento de software surgiram pela necessidade de dar resposta às

Leia mais

Descoberta de Domínio Conceitual de Páginas Web

Descoberta de Domínio Conceitual de Páginas Web paper:25 Descoberta de Domínio Conceitual de Páginas Web Aluno: Gleidson Antônio Cardoso da Silva gleidson.silva@posgrad.ufsc.br Orientadora: Carina Friedrich Dorneles dorneles@inf.ufsc.br Nível: Mestrado

Leia mais

Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS)

Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS) Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS) Definição Geral: Disciplina de Compiladores Prof. Jorge Bidarra (UNIOESTE) A especificação de requisitos tem como objetivo

Leia mais

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos

Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Sistema de mineração de dados para descobertas de regras e padrões em dados médicos Pollyanna Carolina BARBOSA¹; Thiago MAGELA² 1Aluna do Curso Superior Tecnólogo em Análise e Desenvolvimento de Sistemas

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

Pontos de Função. André Chastel Lima Andréia Ferreira Pinto Diego Souza Campos. Engenharia de Software Mestrado Ciência da Computação - UFMS

Pontos de Função. André Chastel Lima Andréia Ferreira Pinto Diego Souza Campos. Engenharia de Software Mestrado Ciência da Computação - UFMS Pontos de Função André Chastel Lima Andréia Ferreira Pinto Diego Souza Campos Engenharia de Software Mestrado Ciência da Computação - UFMS Roteiro Introdução Métricas de Projeto Análise de Pontos de Função

Leia mais

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001 47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações

Leia mais

A memória é um recurso fundamental e de extrema importância para a operação de qualquer Sistema Computacional; A memória trata-se de uma grande

A memória é um recurso fundamental e de extrema importância para a operação de qualquer Sistema Computacional; A memória trata-se de uma grande A memória é um recurso fundamental e de extrema importância para a operação de qualquer Sistema Computacional; A memória trata-se de uma grande região de armazenamento formada por bytes ou palavras, cada

Leia mais

Introdução. Capítulo. 1.1 Considerações Iniciais

Introdução. Capítulo. 1.1 Considerações Iniciais Capítulo 1 Introdução 1.1 Considerações Iniciais A face humana é uma imagem fascinante, serve de infinita inspiração a artistas há milhares de anos. Uma das primeiras e mais importantes habilidades humanas

Leia mais

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO

XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO XIII Encontro de Iniciação Científica IX Mostra de Pós-graduação 06 a 11 de outubro de 2008 BIODIVERSIDADE TECNOLOGIA DESENVOLVIMENTO EPE0147 UTILIZAÇÃO DA MINERAÇÃO DE DADOS EM UMA AVALIAÇÃO INSTITUCIONAL

Leia mais

Palavras-chave: Sistema neuro-fuzzy, Sistemas de avaliação, Sistemas Adaptativos.

Palavras-chave: Sistema neuro-fuzzy, Sistemas de avaliação, Sistemas Adaptativos. ANÁLISE DO CURSO DE ENGENHARIA ELÉTRICA NA UERJ A PARTIR DE INDICADORES CONSTRUÍDOS BASEADOS NO EXAME NACIONAL DE CURSOS: UM SISTEMA NEBULOSO DE AVALIAÇÃO Maria Luiza F. Velloso mlfv@centroin.com.br Universidade

Leia mais

Inteligência Computacional Aplicada a Engenharia de Software

Inteligência Computacional Aplicada a Engenharia de Software Inteligência Computacional Aplicada a Engenharia de Software Estudo de caso III Prof. Ricardo de Sousa Britto rbritto@ufpi.edu.br Introdução Em alguns ambientes industriais, pode ser necessário priorizar

Leia mais

Simulação Transiente

Simulação Transiente Tópicos Avançados em Avaliação de Desempenho de Sistemas Professores: Paulo Maciel Ricardo Massa Alunos: Jackson Nunes Marco Eugênio Araújo Dezembro de 2014 1 Sumário O que é Simulação? Áreas de Aplicação

Leia mais

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Um Sistema Gerenciador de Banco de Dados (SGBD) é constituído por um conjunto de dados associados a um conjunto de programas para acesso a esses

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Filosofia e Conceitos

Filosofia e Conceitos Filosofia e Conceitos Objetivo confiabilidade para o usuário das avaliações. 1. Princípios e definições de aceitação genérica. 2. Comentários explicativos sem incluir orientações em técnicas de avaliação.

Leia mais

Análise crítica dos resultados oriundos de certificados de calibração relativo à calibração de bloco-padrão utilizando lógica fuzzy.

Análise crítica dos resultados oriundos de certificados de calibração relativo à calibração de bloco-padrão utilizando lógica fuzzy. Análise crítica dos resultados oriundos de certificados de calibração relativo à calibração de bloco-padrão utilizando lógica fuzzy. Flávio Carnelli Frade 1,2, Pedro Bastos Costa 1,3, Giovane Quadreli

Leia mais

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008

Tabela de Símbolos. Análise Semântica A Tabela de Símbolos. Principais Operações. Estrutura da Tabela de Símbolos. Declarações 11/6/2008 Tabela de Símbolos Análise Semântica A Tabela de Símbolos Fabiano Baldo Após a árvore de derivação, a tabela de símbolos é o principal atributo herdado em um compilador. É possível, mas não necessário,

Leia mais

CURSO DE FORMAÇÃO. webqda - SOFTWARE DE APOIO À ANÁLISE QUALITATIVA. Entidade de formação credenciada e homologada

CURSO DE FORMAÇÃO. webqda - SOFTWARE DE APOIO À ANÁLISE QUALITATIVA. Entidade de formação credenciada e homologada CURSO DE FORMAÇÃO webqda - SOFTWARE DE APOIO À ANÁLISE QUALITATIVA Entidade de formação credenciada e homologada 1. Fundamentação A investigação nas ciências humanas e sociais tem passado nas últimas décadas

Leia mais

DIMENSIONANDO PROJETOS DE WEB-ENABLING. Uma aplicação da Análise de Pontos de Função. Dimensionando projetos de Web- Enabling

DIMENSIONANDO PROJETOS DE WEB-ENABLING. Uma aplicação da Análise de Pontos de Função. Dimensionando projetos de Web- Enabling DIMENSIONANDO PROJETOS DE WEB-ENABLING Uma aplicação da Análise de Pontos de Função Dimensionando projetos de Web- Enabling Índice INTRODUÇÃO...3 FRONTEIRA DA APLICAÇÃO E TIPO DE CONTAGEM...3 ESCOPO DA

Leia mais

Status. Barra de Título. Barra de Menu. Barra de. Ferramentas Padrão. Caixa de nomes. Barra de. Ferramentas de Formatação. Indicadores de Coluna

Status. Barra de Título. Barra de Menu. Barra de. Ferramentas Padrão. Caixa de nomes. Barra de. Ferramentas de Formatação. Indicadores de Coluna O que é uma planilha eletrônica? É um aplicativo que oferece recursos para manipular dados organizados em tabelas. A partir deles pode-se gerar gráficos facilitando a análise e interpretação dos dados

Leia mais

Aula 02: Conceitos Fundamentais

Aula 02: Conceitos Fundamentais Aula 02: Conceitos Fundamentais Profa. Ms. Rosângela da Silva Nunes 1 de 26 Roteiro 1. Por que mineração de dados 2. O que é Mineração de dados 3. Processo 4. Que tipo de dados podem ser minerados 5. Que

Leia mais

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com

Processamento de Imagem. Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com Processamento de Imagem Prof. MSc. André Yoshimi Kusumoto andrekusumoto.unip@gmail.com Visão Computacional Não existe um consenso entre os autores sobre o correto escopo do processamento de imagens, a

Leia mais

Sistemas de Informação

Sistemas de Informação Sistemas de Informação Prof. M.Sc. Diego Fernandes Emiliano Silva diego.femiliano@gmail.com Agenda Banco de dados Gerenciamento de banco de dados Sistemas de gerenciamento de banco de dados Como usar banco

Leia mais

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperação de Informação GSI521. Prof. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperação de Informação GSI521 Prof. Rodrigo Sanches Miani FACOM/UFU Introdução Organização e Recuperação de Informação(GSI521) Tópicos Recuperação de informação (RI); Breve histórico; O

Leia mais

PROJETO DE PESQUISA MODALIDADE INICIAÇÃO CIENTÍFICA (BOLSA PIC/FACIT/FAPEMIG)

PROJETO DE PESQUISA MODALIDADE INICIAÇÃO CIENTÍFICA (BOLSA PIC/FACIT/FAPEMIG) PROJETO DE PESQUISA MODALIDADE INICIAÇÃO CIENTÍFICA (BOLSA PIC/FACIT/FAPEMIG) MONTES CLAROS FEVEREIRO/2014 COORDENAÇÃO DE PESQUISA PROGRAMA DE INICIAÇÃO CIENTÍFICA DISPOSITIVOS MÓVEIS INTELIGENTES ORIENTADOR:

Leia mais

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões Classificação de imagens Autor: Gil Gonçalves Disciplinas: Detecção Remota/Detecção Remota Aplicada Cursos: MEG/MTIG Ano Lectivo: 11/12 Sumário Classificação da imagem (ou reconhecimento de padrões): objectivos

Leia mais

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc. MODELAGEM DE DADOS PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS Aula 2 Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord 1 Objetivos: Revisão sobre Banco de Dados e SGBDs Aprender as principais

Leia mais

Desenvolvimento do Módulo de Pré-processamento e Geração de Imagens de. Imagens de Teste do Sistema DTCOURO

Desenvolvimento do Módulo de Pré-processamento e Geração de Imagens de. Imagens de Teste do Sistema DTCOURO Desenvolvimento do Módulo de Pré-processamento e Geração de Imagens de Teste do Sistema DTCOURO Willian Paraguassu Amorim 27 de julho de 2005 1 Título Desenvolvimento do Módulo de Pré-processamento e Geração

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Alessandro L. Koerich Algoritmo k Means Mestrado/Doutorado em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUCPR) 2 Problema do Agrupamento Seja x = (x 1, x 2,,

Leia mais

ENGENHARIA DE SOFTWARE I

ENGENHARIA DE SOFTWARE I ENGENHARIA DE SOFTWARE I Prof. Cássio Huggentobler de Costa [cassio.costa@ulbra.br] Twitter: www.twitter.com/cassiocosta_ Agenda da Aula (002) Metodologias de Desenvolvimento de Softwares Métodos Ágeis

Leia mais

Projetos. Universidade Federal do Espírito Santo - UFES. Mestrado em Informática 2004/1. O Projeto. 1. Introdução. 2.

Projetos. Universidade Federal do Espírito Santo - UFES. Mestrado em Informática 2004/1. O Projeto. 1. Introdução. 2. Pg. 1 Universidade Federal do Espírito Santo - UFES Mestrado em Informática 2004/1 Projetos O Projeto O projeto tem um peso maior na sua nota final pois exigirá de você a utilização de diversas informações

Leia mais

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE Mariane Alves Gomes da Silva Eliana Zandonade 1. INTRODUÇÃO Um aspecto fundamental de um levantamento

Leia mais

Tecnologia e Sistemas de Informações

Tecnologia e Sistemas de Informações Universidade Federal do Vale do São Francisco Tecnologia e Sistemas de Informações Prof. Ricardo Argenton Ramos Aula 3 Componentes de SIs Pessoas SI Organiz. Unidades que exercem diferentes funções, tais

Leia mais

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD

ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD ANÁLISE DA CONSERVAÇÃO PÓS-COLHEITA DA ALFACE (Lactuca Sativa, L) UTILIZANDO O SISTEMA DE APOIO À TOMADA DE DECISÃO BKD RESUMO Thereza P. P. Padilha Fabiano Fagundes Conceição Previero Laboratório de Solos

Leia mais

Notas da Aula 17 - Fundamentos de Sistemas Operacionais

Notas da Aula 17 - Fundamentos de Sistemas Operacionais Notas da Aula 17 - Fundamentos de Sistemas Operacionais 1. Gerenciamento de Memória: Introdução O gerenciamento de memória é provavelmente a tarefa mais complexa de um sistema operacional multiprogramado.

Leia mais

5 Extraindo listas de produtos em sites de comércio eletrônico

5 Extraindo listas de produtos em sites de comércio eletrônico 5 Extraindo listas de produtos em sites de comércio eletrônico Existem diversos trabalhos direcionadas à detecção de listas e tabelas na literatura como (Liu et. al., 2003, Tengli et. al., 2004, Krüpl

Leia mais

Gerência de Projetos

Gerência de Projetos Gerência de Projetos Escopo Custo Qualidade Tempo CONCEITO PROJETOS: são empreendimentos com objetivo específico e ciclo de vida definido Precedem produtos, serviços e processos. São utilizados as funções

Leia mais

PROBLEMA DO CARTEIRO CHINÊS

PROBLEMA DO CARTEIRO CHINÊS Introdução à Teoria dos Grafos Bacharelado em Ciência da Computação UFMS, 005 PROBLEMA DO CARTEIRO CHINÊS Resumo A teoria dos grafos teve seu início há cerca de 50 anos e aplicações datadas daquela época

Leia mais

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi Metodologias de Desenvolvimento de Sistemas Analise de Sistemas I UNIPAC Rodrigo Videschi Histórico Uso de Metodologias Histórico Uso de Metodologias Era da Pré-Metodologia 1960-1970 Era da Metodologia

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS Capítulo 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7.1 2003 by Prentice Hall OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação?

Leia mais

O Software Face Match

O Software Face Match Apêndice A O Software Face Match A.1 - Desenvolvimento do software para a extração de características de imagens de faces humanas: Face Match. Para dar suporte à proposta do trabalho de mestrado iniciou-se

Leia mais

ESTÁGIO DE NIVELAMENTO DE GERENCIAMENTO DE PROJETOS MACROPROCESSO DE GESTÃO DO PORTFÓLIO

ESTÁGIO DE NIVELAMENTO DE GERENCIAMENTO DE PROJETOS MACROPROCESSO DE GESTÃO DO PORTFÓLIO ESTÁGIO DE NIVELAMENTO DE GERENCIAMENTO DE PROJETOS MACROPROCESSO DE GESTÃO DO PORTFÓLIO 05.11.2015 SUMÁRIO INTRODUÇÃO DEFINIÇÃO DE PORTFÓLIO CENÁRIO NEGATIVO DOS PORTFÓLIOS NAS ORGANIZAÇÕES GOVERNANÇA

Leia mais

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1. Universidade Federal de Santa Maria Curso de Arquivologia Disciplina de Banco de Dados Aplicados à Arquivística Prof. Andre Zanki Cordenonsi Versao 1.0 Março de 2008 Tópicos Abordados Conceitos sobre Banco

Leia mais

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia. 1 Introdução aos Sistemas de Informação 2002 Aula 4 - Desenvolvimento de software e seus paradigmas Paradigmas de Desenvolvimento de Software Pode-se considerar 3 tipos de paradigmas que norteiam a atividade

Leia mais

Conceitos de Banco de Dados

Conceitos de Banco de Dados Conceitos de Banco de Dados Autor: Luiz Antonio Junior 1 INTRODUÇÃO Objetivos Introduzir conceitos básicos de Modelo de dados Introduzir conceitos básicos de Banco de dados Capacitar o aluno a construir

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 12 Aprendizado de Máquina Agentes Vistos Anteriormente Agentes baseados em busca: Busca cega Busca heurística Busca local

Leia mais

ADMINISTRAÇÃO DOS RECURSOS DE DADOS

ADMINISTRAÇÃO DOS RECURSOS DE DADOS 7 ADMINISTRAÇÃO DOS RECURSOS DE DADOS OBJETIVOS Por que as empresas sentem dificuldades para descobrir que tipo de informação precisam ter em seus sistemas de informação ão? Como um sistema de gerenciamento

Leia mais

Conceitos de relação de confiança www.jpinheiro.net jeferson@jpinheiro.net

Conceitos de relação de confiança www.jpinheiro.net jeferson@jpinheiro.net Conceitos de relação de confiança www.jpinheiro.net jeferson@jpinheiro.net Procedimento para criar uma árvore O procedimento usado para criar uma árvore com o Assistente para instalação do Active Directory

Leia mais

OBJETIVOS. Orientações para Projetos de BD; Dependências Funcionais (DFs): Definição de DF; Regras de inferência para DFs.

OBJETIVOS. Orientações para Projetos de BD; Dependências Funcionais (DFs): Definição de DF; Regras de inferência para DFs. BANCO DE DADOS Universidade do Estado de Santa Catarina Centro de Ciências Tecnológicas Departamento de Ciência da Computação Prof. Alexandre Veloso de Matos alexandre.matos@udesc.br OBJETIVOS Orientações

Leia mais

Engenharia de Software III

Engenharia de Software III Engenharia de Software III Casos de uso http://dl.dropbox.com/u/3025380/es3/aula6.pdf (flavio.ceci@unisul.br) 09/09/2010 O que são casos de uso? Um caso de uso procura documentar as ações necessárias,

Leia mais

BCC204 - Teoria dos Grafos

BCC204 - Teoria dos Grafos BCC204 - Teoria dos Grafos Marco Antonio M. Carvalho (baseado nas notas de aula do prof. Haroldo Gambini Santos) Departamento de Computação Instituto de Ciências Exatas e Biológicas Universidade Federal

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

MODELAGEM DE DADOS MODELAGEM DE DADOS. rafaeldiasribeiro.com.br 04/08/2012. Aula 7. Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord

MODELAGEM DE DADOS MODELAGEM DE DADOS. rafaeldiasribeiro.com.br 04/08/2012. Aula 7. Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord MODELAGEM DE DADOS PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS Aula 7 Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord 1 Objetivos: Aprender sobre a modelagem lógica dos dados. Conhecer os

Leia mais

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka

Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka Extração de Árvores de Decisão com a Ferramenta de Data Mining Weka 1 Introdução A mineração de dados (data mining) pode ser definida como o processo automático de descoberta de conhecimento em bases de

Leia mais

Roteiro. Modelo de Dados Relacional. Processo de Projeto de Banco de Dados. BCC321 - Banco de Dados I. Ementa. Posicionamento.

Roteiro. Modelo de Dados Relacional. Processo de Projeto de Banco de Dados. BCC321 - Banco de Dados I. Ementa. Posicionamento. Roteiro Modelo de Dados Relacional Posicionamento Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Introdução

Leia mais

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados

Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento a partir de bases de dados Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2006.2 Administração de dados - Conceitos, técnicas, ferramentas e aplicações de Data Mining para gerar conhecimento

Leia mais

Persistência e Banco de Dados em Jogos Digitais

Persistência e Banco de Dados em Jogos Digitais Persistência e Banco de Dados em Jogos Digitais Prof. Marcos Francisco Pereira da Silva Especialista em Engenharia de Software Jogos Digitais - Computação Gráfica 1 Agenda Vantagens de usar a abordagem

Leia mais

Disciplina de Banco de Dados Introdução

Disciplina de Banco de Dados Introdução Disciplina de Banco de Dados Introdução Prof. Elisa Maria Pivetta CAFW - UFSM Banco de Dados: Conceitos A empresa JJ. Gomes tem uma lista com mais ou menos 4.000 nomes de clientes bem como seus dados pessoais.

Leia mais

Pós-Graduação em Engenharia Elétrica Inteligência Artificial

Pós-Graduação em Engenharia Elétrica Inteligência Artificial Pós-Graduação em Engenharia Elétrica Inteligência Artificial João Marques Salomão Rodrigo Varejão Andreão Inteligência Artificial Definição (Fonte: AAAI ): "the scientific understanding of the mechanisms

Leia mais

Controle de Almoxarifado

Controle de Almoxarifado Controle de Almoxarifado Introdução O módulo de Controle de Almoxarifado traz as opções para que a empresa efetue os cadastros necessários referentes a ferramentas de almoxarifado, além do controle de

Leia mais

Orientação a Objetos

Orientação a Objetos 1. Domínio e Aplicação Orientação a Objetos Um domínio é composto pelas entidades, informações e processos relacionados a um determinado contexto. Uma aplicação pode ser desenvolvida para automatizar ou

Leia mais

Data Warehouse. Debora Marrach Renata Miwa Tsuruda

Data Warehouse. Debora Marrach Renata Miwa Tsuruda Debora Marrach Renata Miwa Tsuruda Agenda Introdução Contexto corporativo Agenda Introdução Contexto corporativo Introdução O conceito de Data Warehouse surgiu da necessidade de integrar dados corporativos

Leia mais

Universidade Paulista

Universidade Paulista Universidade Paulista Ciência da Computação Sistemas de Informação Gestão da Qualidade Principais pontos da NBR ISO/IEC 12207 - Tecnologia da Informação Processos de ciclo de vida de software Sergio Petersen

Leia mais

Feature-Driven Development

Feature-Driven Development FDD Feature-Driven Development Descrição dos Processos Requisitos Concepção e Planejamento Mais forma que conteúdo Desenvolver um Modelo Abrangente Construir a Lista de Features Planejar por

Leia mais

Complemento II Noções Introdutória em Redes Neurais

Complemento II Noções Introdutória em Redes Neurais Complemento II Noções Introdutória em Redes Neurais Esse documento é parte integrante do material fornecido pela WEB para a 2ª edição do livro Data Mining: Conceitos, técnicas, algoritmos, orientações

Leia mais