Detecção de Réplicas de Sítios Web Usando Aprendizado Semi-supervisionado baseado em Maximização de Expectativas. Cristiano Rodrigues de Carvalho
|
|
- Natan Abreu Ventura
- 5 Há anos
- Visualizações:
Transcrição
1 Detecção de Réplicas de Sítios Web Usando Aprendizado Semi-supervisionado baseado em Maximização de Expectativas Cristiano Rodrigues de Carvalho Orientador: Nivio Ziviani Co-orientador: Adriano Veloso Departamento de Ciência da Computação Universidade Federal de Minas Gerais 19 de Setembro de
2 Problema 29% de conteúdo duplicado na Web Duplicação intra-sítios e inter-sítios Sistemas de busca armazenam cópias da Web Desperdício de recursos, anomalias no ranking, respostas repetidas Reduzir o número de duplicatas através da detecção réplicas de sítios web 2
3 Sítios Web Sítios: páginas web que compartilham o mesmo nome de servidor 3
4 Máquinas de Busca: Componentes Web Interface Web Coletor Web Processador de Consultas Indexador Repositório Local Índice Invertido 4
5 Desafios sítios pares Problema quadrático 5
6 Desafios Vários IPs para um único sítio e vários sítios para um único IP. 6
7 Desafios Pequena interseção de páginas conhecidas de sítios replicados Sítios muito similares que não são réplicas (cifras) 7
8 Solução Proposta Algoritmo baseado em aprendizado de máquina Duas fases: Seleção de sítios candidatos a réplica Classificação de pares candidatos Necessidade de treino rotulado Abordagem semi-supervisionada para aquisição de exemplos 8
9 Trabalhos Relacionados - Inter-sitios Estudo sobre replicação na Web [Bharat et al.,1999] Heurísticas para detecção de réplicas [Bharat et al.,2000] Uso eficiente de informações de conteúdo NormPaths [da Costa Carvalho et al.,2007] Estado-da-arte e baseline 9
10 Trabalhos Relacionados - Intra-sitios DUST (Different URLs with Similar Text) [Bar-Yossef et al., 2009] [Koppula et al., 2010] [Rodrigues et al., 2013] Detecção de conteúdo similar em URLs distintas Diversos trabalhos recentes 10
11 Metodologia
12 O Algoritmo Proposto Fase 1 Conjunto de Treino Fase 2 Base de Sítios Coletados Filtro Inicial Candidatos Avaliação Ranking de Réplicas 12
13 Filtro de Candidatos Caminho da URL Assinatura do Conteúdo 13
14 Avaliação de Candidatos Características de refinamento Distância de Edição (ndist) Correspondência de Nomes de Servidor (nmatch) Quatro Octetos (ip4) Três Octetos (ip3) Correspondência entre Caminhos Completos (fullpath) Algoritmo de Classificação LAC [Veloso & Meira Jr., 2011] 14
15 Modelos de Treino: PU == exemplo.com.br exemplo.gov.br == exemplo.br P U 15
16 Modelos de Treino: EM Passo E: Estimativa de dados Atualização de Variáveis Passo M: Atualização de Hipótese 16
17 Modelos de Treino: EM Passo E: Classificão (LAC) Transição de Rótulos (Limiar mínimo) Passo M: Atualização do Classificador Parâmetro a ser definido 17
18 Modelos de Treino: Escolha de Limiar Limiar global único Diferentes valores de teste (0.1 a 0.9) Limiar local ótimo Projeção de treino Abordagem de entropia mínima [Davis et al., 2012] 18
19 Modelos de Treino: Projeção de Treino p l ip4 ip3 ndist nmatch fullpath y 1 [ ] [ ] [8-10] [ ] [ ] y 2 [ ] [ ] [10-14] [ ] [ ] y 3 [ ] [ ] [8-10] [ ] [ ] y 4 [ ] [ ] [8-10] [ ] [ ] y 5 [ ] [ ] [5-8] [ ] [ ] y 6 [ ] [ ] [8-10] [ ] [ ] y 7 [ ] [ ] [10-14] [ ] [ ] y 8 [ ] [ ] [5-8] [ ] [ ] x [ ] [ ] [8-10] [ ] [ ]? ip4 ip3 ndist nmatch fullpath y 1 [ ] [8-10] [ ] y 2 [ ] [ ] [ ] y 3 [ ] [1-2] [ ] y 4 [ ] [ ] y 5 y 6 [ ] y 7 [ ] [ ] y 8 19
20 Modelos de Treino: Limiar ótimo 20
21 Modelos de Treino: PU == exemplo.com.br exemplo.gov.br == exemplo.br P U 21
22 Modelos de Treino: PU -> PN == exemplo.com.br exemplo.gov.br == exemplo.br Novos exemplos positivos P N 22
23 Modelos de Treino: NU Sítios que não são suspeitos N U 23
24 Modelos de Treino: NU -> NP Sítios que não são suspeitos N Novos exemplos positivos P 24
25 Combinação de Classificadores Agregação de resultados (PU + NU) Fronteira de Pareto Relação de dominância no espaço de predições Composta por candidatos que se destacam em um classificador ou possuem um balanceamento adequado entre ambos 25
26 Combinação de Classificadores 26
27 Algoritmo Completo Fase 1 Fase 2 P U PU EM Base de Sítios Filtro Inicial Candidatos Classificação Ranking PU Ranking NU Pareto Ranking PNU N U NU EM 27
28 Avaliação Experimental
29 Coleção Coleta entre Setembro e Outubro de 2010 Usando o coletor InWeb Nenhuma restrição ou filtro 30 milhões de páginas 583,411 sítios web ( pares possíveis) pares candidatos pares avaliados como réplicas 29
30 Dup-clusters intra-sítios (U A e U B ) inter-sítios (U A e U C ) 30
31 Dup-clusters: Distribuição 1e # dup-clusters # dup clusters K Tamanho do dup-cluster K 100K Sítios web Muitos dup-clusters contém poucas URLs Muitos dup-clusters contém poucos sítios 31
32 Inter-sítios vs. Intra-sítios # URLs duplicadas inter sítios # URLs duplicadas intra sítios Correlação entre o número de URLs duplicadas intra-sítios e inter-sítios por sítio web. 32
33 Distribuição de Similaridade Distribuição de similaridade (Y) Y 0.1 Y Coeficiente de Jaccard Concentração de réplicas (Y2) 33
34 Baselines NormPaths Detecção de réplicas de sítios B-SVM (Biased SVM)[Liu et al.,2003] Estado-da-arte em aprendizado semi-supervisionado com dados PU Limite Superior (Upper bound) Classificação com treino rotulado manualmente (Gabarito) 34
35 Resultados: ROC TPR PU data NU data PU + NU Norm Paths B-SVM Upper bound FPR 35
36 Resultados: Precisão e Revocação Precisão PU data NU data PU + NU Norm Paths B SVM Revocação 36
37 Resultados: Análise de Features AUC (Area Under the Curve) Individualmente Todas exceto Features PU NU PU NU ip ip nmatch ndist fullpath Todas
38 Resultados: Análise de Features AUC (Area Under the Curve) Individualmente Todas exceto Features PU NU PU NU ip ip nmatch ndist fullpath Todas
39 Resultados: Análise de Features AUC (Area Under the Curve) Individualmente Todas exceto Features PU NU PU NU ip ip nmatch ndist fullpath Todas
40 Resultados: Redução RR PU data NU data PU + NU Norm Paths Upper bound FPR 40
41 Resultados: Redução RR PU data NU data PU + NU Norm Paths B-SVM Upper bound FPR 41
42 Resultados: Taxa de Detecção Número de Candidatos Algorithms , , PU data NU data PU + NU NormPaths B-SVM Upper bound
43 Resultados: Taxa de Detecção Número de Candidatos Algorithms , , PU data NU data PU + NU NormPaths B-SVM Upper bound
44 Resultados: Redução Inter e Intra FPR # URLs duplicadas 6,948,501 # URLs intra-sítios 6,514,746 ɛ = ,374 ɛ = 0.1 1,628,685 # URLs inter-sítios 843, , ,384 1,331,215 # inter intra 409, , , ,927 ɛ = ,947 38,835 70, ,284 ɛ = ,683 98, , ,022 RR intra ɛ = ɛ = RR inter RR inter + intra ɛ = ɛ =
45 Conclusões Foi proposto um novo algoritmo para detecção de réplicas de sítios web em bases de máquinas de busca O método semi-supervisionado é capaz de criar de bons modelos de treino O algoritmo proposto obteve resultados superiores aos baselines A combinação com técnicas de detecção intra-sítios melhora a taxa de redução de duplicatas 45
46 Trabalhos Futuros Estudo de outras características como a conectividade entre sítios Criar estratégias para reavaliação de sítios replicados Propor abordagem para escolha justa de qual sítio deve ser eliminado da base (Fraudes). 46
47 Contribuições Desenvolvimento de novas técnicas de aprendizado de máquina para o problema de detecção de réplicas de sítios Coleção com dados a respeito de replicação Sítios coletados, rotulados e modelos de treino Artigo a ser submetido WWW 2015 (10 de Novembro) 47
48 Contribuições Artigo aceito no SPIRE 2013 Learning to Schedule Webpage Updates Using Genetic Programming Artigo em avaliação no Information Retrieval Journal A Genetic Programming Framework to Schedule Webpage Updates 48
49 Obrigado!
Rickson Guidolini Orientador: Nivio Ziviani Co-orientador: Adriano Veloso
Detecção de Réplicas de Sítios Web em Máquinas de Busca Usando Aprendizado de Máquina Rickson Guidolini Orientador: Nivio Ziviani Co-orientador: Adriano Veloso Universidade Federal de Minas Gerais LATIN
Leia maisDETECÇÃO DE RÉPLICAS DE SÍTIOS WEB USANDO APRENDIZADO SEMISSUPERVISIONADO BASEADO EM MAXIMIZAÇÃO DE EXPECTATIVAS
DETECÇÃO DE RÉPLICAS DE SÍTIOS WEB USANDO APRENDIZADO SEMISSUPERVISIONADO BASEADO EM MAXIMIZAÇÃO DE EXPECTATIVAS CRISTIANO RODRIGUES DE CARVALHO DETECÇÃO DE RÉPLICAS DE SÍTIOS WEB USANDO APRENDIZADO SEMISSUPERVISIONADO
Leia maisVERIFICAÇÃO DE UNICIDADE DE URLS EM COLETORES DE PÁGINAS WEB
VERIFICAÇÃO DE UNICIDADE DE URLS EM COLETORES DE PÁGINAS WEB Wallace Favoreto Orientador: Prof. Nivio Ziviani Universidade Federal de Minas Gerais LATIN - LAboratory for Treating INformation 1 Agenda Introdução
Leia maisDETECÇÃO DE RÉPLICAS DE SÍTIOS WEB EM MÁQUINAS DE BUSCA USANDO APRENDIZADO DE MÁQUINA
DETECÇÃO DE RÉPLICAS DE SÍTIOS WEB EM MÁQUINAS DE BUSCA USANDO APRENDIZADO DE MÁQUINA RICKSON GUIDOLINI DETECÇÃO DE RÉPLICAS DE SÍTIOS WEB EM MÁQUINAS DE BUSCA USANDO APRENDIZADO DE MÁQUINA Dissertação
Leia maisEscalonamento de Atualizações de Páginas Web Usando Programação
Escalonamento de Atualizações de Páginas Web Usando Programação Genética Aécio Solano Rodrigues Santos Orientador: Nivio Ziviani Departamento de Ciência da Computação Universidade Federal de Minas Gerais
Leia maisAprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquinas Introdução à Aprendizado Não- Supervisionado David Menotti, Ph.D. http://web.inf.ufpr.br/menotti Objetivos
Leia maisMáquinas de Vetores de Suporte
Máquinas de Vetores de Suporte Marcelo K. Albertini 14 de Setembro de 2015 2/22 Máquinas de Vetores de Suporte Support Vector Machines (SVM) O que é? Perceptron revisitado Kernels (núcleos) Otimização
Leia maisFundamentos de Mineração de Dados
Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento
Leia maisAprendizado de Máquina. Combinando Classificadores
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Aprendizado de Máquina Combinando Classificadores David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução O uso de vários classificadores
Leia maisThiago Zavaschi Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade
Thiago Zavaschi (zavaschi@ppgia.pucpr.br) Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade Católica do Paraná (PUC-PR) Conceitos relacionados a classificação
Leia maisSEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro
SEMINÁRIO Visão Computacional Aluno: Afonso Pinheiro Detecting Pedestrians Using Patterns of Motion and Appearance *Paul Viola *Michael J. Jones *Daniel Snow Por que detectar pedestres? http://conexaopenedo.com.br/2016/02/sistema-consegue-detectar-pedestres-em-tempo-real/
Leia maisAUTOMATED ASSESSMENT OF BREAST TISSUE DENSITY IN DIGITAL MAMMOGRAMS
AUTOMATED ASSESSMENT OF BREAST TISSUE DENSITY IN DIGITAL MAMMOGRAMS Introdução Câncer de mama É uma das neoplasias mais comuns que afligem as mulheres Globalmente, a cada 3 min uma mulher é diagnosticada
Leia maisInteligência Artificial
Universidade Federal de Campina Grande Departamento de Sistemas e Computação Pós-Graduação em Ciência da Computação Inteligência Artificial Aprendizagem Outras Técnicas Prof. a Joseana Macêdo Fechine Régis
Leia maisAgregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting
Leia maisMáquinas de Vetores de Suporte
Máquinas de Vetores de Suporte Prof. Marcelo Keese Albertini Faculdade de Computação Universidade Federal de Uberlândia 19 de Junho de 2017 2/27 Máquinas de Vetores de Suporte Support Vector Machines (SVM)
Leia maisCapítulo 4. Comitê BAS 35
4 Comitê BAS Devido à flexibilidade do algoritmo BAS, que aceita qualquer distribuição inicial para os exemplos, diversas heurísticas podem ser implementadas com o objetivo de criar classificadores de
Leia maisConceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional
Conceitos de Aprendizagem de Máquina e Experimentos Visão Computacional O que você vê? 2 Pergunta: Essa imagem tem um prédio? Classificação 3 Pergunta: Essa imagem possui carro(s)? Detecção de Objetos
Leia maisAnálise Estatística e Topológica do Webgraph
Análise Estatística e Topológica do Webgraph Luciana Salete Buriol Grupo de algoritmos: estudos no Webgraph Coordenação: Prof. Dr. Stefano Leonardi Universidade de Roma La Sapienza Webgraph O Webgraph
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisPOLVO-IIDS: Um Sistema de Detecção de Intrusão Inteligente Baseado em Anomalias p. 1/16
POLVO-IIDS: Um Sistema de Detecção de Intrusão Inteligente Baseado em Anomalias p. 1/16 POLVO-IIDS: Um Sistema de Detecção de Intrusão Inteligente Baseado em Anomalias Paulo Manoel Mafra 1, Joni da Silva
Leia mais1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a
1 Introdução 1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a partir de dados. Existem diversas aplicações
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 07 Classificação com o algoritmo knn Max Pereira Classificação com o algoritmo (knn) Um algoritmo supervisionado usado para classificar
Leia maisInformática. Aprendizado de Máquina. Professor Márcio Hunecke.
Informática Aprendizado de Máquina Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática Aula XX NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês:
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCA UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisAprendizado de Máquinas. Seleção de Características
Universidade Federal do Paraná (UFPR) Departamento de Informática (DInf) Seleção de Características David Menotti, Ph.D. web.inf.ufpr.br/menotti Introdução Um dos principais aspectos na construção de um
Leia maisInteligência Artificial Agrupamento de Dados. prof. Dr. Rogério R. de Vargas. Universidade Estadual de Santa Cruz - UESC. Ilhéus-Ba, Outubro de 2013
Inteligência Artificial de prof. Dr. Rogério R. de Vargas Universidade Estadual de Santa Cruz - UESC Ilhéus-Ba, Outubro de 2013 http://rogerio.in slide 1 Introdução http://rogerio.in slide 2 Como agrupar?
Leia maisInformática Parte 19 Prof. Márcio Hunecke
Escriturário Informática Parte 19 Prof. Márcio Hunecke Informática NOÇÕES DE ALGORITMOS DE APRENDIZADO O aprendizado automático, aprendizado de máquina (em inglês: "machine learning") ou aprendizagem
Leia maisTeoria do aprendizado
Teoria do aprendizado Marcelo K. Albertini 7 de Agosto de 2014 2/37 Teoria do aprendizado Teoremas não existe almoço grátis Viés e variância Aprendizado PAC Dimensão VC Máquinas de vetores suporte 3/37
Leia maisAprendizado de Máquina
Aprendizado de Máquina Aula #8.1 EBS 564 IA Prof. Luiz Fernando S. Coletta luizfsc@tupa.unesp.br Campus de Tupã Conhecimento: abstração (modelo) das relações existentes entre as informações contidas nos
Leia maisTriagem Virtual em Larga Escala. Profa. Dra. Rafaela Ferreira Dept. de Bioquímica e Imunologia 10 de outubro de 2014
Triagem Virtual em Larga Escala Profa. Dra. Rafaela Ferreira Dept. de Bioquímica e Imunologia rafaelasf@gmail.com 10 de outubro de 2014 1 O que é triagem virtual? Grande conjunto de compostos Estratégia
Leia maisColeta e Análise de Características de Fluxo para Classificação de Tráfego em Redes Definidas por Software
Coleta e Análise de Características de Fluxo para Classificação de Tráfego em Redes Definidas por Software Rodolfo Vebber Bisol, Anderson Santos da Silva, Cristian Cleder Machado, Lisandro Zambenedetti
Leia mais2COP229 Inteligência Computacional. Aula 3. Clusterização.
Aula 3 Clusterização Sumário (Clusterização) - Introdução - Aprendizado Não Supervisionado - Aprendizado Supervisionado - Introdução: Clusterização - Etapas para o processo de Clusterização - Distância
Leia maisAprendizado de Supervisionado
Aprendizado de Supervisionado Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Aprendendo com Exemplos 2. Classificação 3. Conceitos Gerais 4. Vizinho Mais Próximo 1 Aprendendo com Exemplos
Leia maisUniversidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Tipos de Aprendizagem. Luiz Eduardo S. Oliveira, Ph.D.
Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Tipos de Aprendizagem Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Objetivos Introduzir diferentes tipos de
Leia maisMecanismos de Detecção de Objetos Selective Search
Mecanismos de Detecção de Objetos Selective Search Visão Computacional Prof. Geraldo Braz Junior Contém material das notas de aula do CS131, CS229 CS231B Objetivo Como detectar instancias de objeto? 2
Leia maisINF 1771 Inteligência Artificial
INF 1771 Inteligência Artificial Aula 14 Support Vector Machines (SVM) 2016.1 Prof. Augusto Baffa Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisClassificação de arritmias em sinais ECG
de arritmias em sinais ECG Eduardo Luz Rensso Mora Universidade Federal de Ouro Preto 06/10/2010 Summary 1 Motivação 2 3 4 5 6 7 8 9 Motivação Diagnosticar doenças cardíacas em aplicações do tipo holter
Leia maisMineração de Dados - II
Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Mineração de Dados - II Sylvio Barbon Junior barbon@uel.br 10 de julho de 2015 DC-UEL Sylvio Barbon Jr 1 Sumário Etapa II Algoritmos Básicos Weka: Framework
Leia maisMineração de Dados - Introdução. Elaine Ribeiro de Faria UFU 2018
Mineração de Dados - Introdução Elaine Ribeiro de Faria UFU 2018 1 Mineração de Dados Processo de automaticamente descobrir informação útil em grandes repositórios de dados Tan P., SteinBack M. e Kumar
Leia maisDetecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC
Detecção de falsas correspondências em pares de imagens estereoscópicas utilizando a transformação projetiva no plano e o algoritmo RANSAC André Caceres Carrilho Mauricio Galo Renato César dos Santos Curitiba,
Leia maisà Análise de Padrões
CC-226 Introdução à Análise de Padrões Prof. Carlos Henrique Q. Forster Visão Geral do Curso e Introdução a Classificadores Padrões São apresentados como tuplas de variáveis aleatórias O conjunto amostra
Leia maisBoas Maneiras em Aprendizado de Máquinas
Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica Boas Maneiras em Aprendizado de Máquinas David Menotti www.inf.ufpr.br/menotti/ci171-182 Boas Maneiras Agenda Introdução Métricas
Leia maisscikit-learn: Aprendizado de máquina 101 com Python
scikit-learn: Aprendizado de máquina 101 com Python Luciana Fujii Campus Party BH 2016 1 / 30 Introdução Aprendizado de máquina Aprendizado de máquina é o campo da ciência da computação que dá aos computadores
Leia maisBruno Antunes da Silva UFSCar - Sorocaba
Bruno Antunes da Silva UFSCar - Sorocaba Introdução HDFS Arquitetura Leitura e escrita Distribuição de nós Controle de réplicas Balancer MapReduce Conclusão Aplicações web com grandes quantidades de dados
Leia maisCréditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores
SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..
Leia maisThiago Marzagão 1. 1 Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21
MINERAÇÃO DE DADOS Thiago Marzagão 1 1 marzagao.1@osu.edu ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão (Universidade de Brasília) MINERAÇÃO DE DADOS 1 / 21 árvore de decisão Aulas passadas: queríamos
Leia maisMonitoração de Tráfego Par-a-Par em Tempo Real
Monitoração de Tráfego Par-a-Par em Tempo Real Tiago Alves Macambira Orientador: Dorgival Olavo Guedes Neto Co-Orientador: Wagner Meira Jr. Departamento de Ciência da Computação Universidade Federal de
Leia maisTime Series Trend Detection and Forecasting Using Complex Network Topology Analysis
WAIAF 2018 Time Series Trend Detection and Forecasting Using Complex Network Topology Analysis Leandro Anghinoni Universidade de São Paulo DCM/RP Liang Zhao Universidade de São Paulo DCM/RP AGENDA Introdução
Leia maisReplicação em sistemas web
Sistemas Distribuídos abril de 2018 Servidores Web tolerância a falhas desempenho/escalabilidade desempenho: uso de servidores mais potentes (scale-up x scale-out) caching uso de servidores replicados
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Tópicos 1. Seleção de atributos 2. Redução de
Leia maisAprendizado de Máquina
Universidade Federal do Espírito Santo Centro de Ciências Agrárias CCENS UFES Departamento de Computação Aprendizado de Máquina Inteligência Artificial Site: http://jeiks.net E-mail: jacsonrcsilva@gmail.com
Leia maisAPRENDIZAGEM DE MÁQUINA
APRENDIZAGEM DE MÁQUINA (usando Python) Thiago Marzagão ÁRVORE DE DECISÃO & VALIDAÇÃO Thiago Marzagão APRENDIZAGEM DE MÁQUINA 1 / 20 árvore de decisão Aulas passadas: queríamos prever variáveis quantitativas.
Leia maisList Ranking: Solução probabilística. Baseado na dissertação de mestrado de Guilherme Pereira Vanni Orientador: Prof.
List Ranking: Solução probabilística Baseado na dissertação de mestrado de Guilherme Pereira Vanni Orientador: Prof. Siang Wung Song Introdução Definição Lista ligada: uma seqüência de nós tal que cada
Leia maisDescoberta de conhecimento em redes sociais e bases de dados públicas
Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:
Leia maisReconhecimento de Padrões
Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Duda e Hart Capítulo 1 Reconhecimento de Padrões (imagem) Objetivo: Interpretar um conjunto de dados através de um mapeamento (classificação)
Leia maisMineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri
Mineração de Dados Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri 1 Motivação Aumento da capacidade de processamento e de armazenamento de dados; Baixo custo; Grande quantidade de dados
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos
Leia maisTECNOLOGIA DE GRUPO. Introdução Aplicação da razão associação de objetos similares Biólogos; Bibliotecários classificação Manufatura
Introdução Aplicação da razão associação de objetos similares Biólogos; Bibliotecários classificação Manufatura Uma família de projeto Tecnologia de Grupo (GT) a percepção de que muitos problemas são similares,
Leia maisAula 9. Prof. Adilson Gonzaga
Aula 9 Prof. Adilson Gonzaga Mapeamento Atribuir uma Instância a uma classe. Cada Instância é mapeada para um elemento do conjunto de Rótulos de Classe {p,n} p positivo n negativo Atribui uma Instância
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular André C. P. L. F. de Carvalho Monitor: Valéria Carvalho Agrupamento de Dados Tópicos Agrupamento de dados Análise de cluster Dificuldades em agrupamento Algoritmos
Leia maisAprendizado de Máquina
Aprendizado de Máquina André C. P. L. F. de Carvalho Posdoutorando: Isvani Frias-Blanco ICMC-USP Agrupamento de dados Tópicos Agrupamento de dados Dificuldades em agrupamento Algoritmos de agrupamento
Leia maisRedes Neurais (Inteligência Artificial)
Redes Neurais (Inteligência Artificial) Aula 16 Aprendizado Não-Supervisionado Edirlei Soares de Lima Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest
Leia maisReconhecimento de Padrões
Reconhecimento de Padrões André Tavares da Silva andre.silva@udesc.br Roteiro da aula Conceitos básicos sobre reconhecimento de padrões Visão geral sobre aprendizado no projeto de classificadores Seleção
Leia maisRECONHECIMENTO DE PADRÕES - RP
RECONHECIMENTO DE PADRÕES - RP Definições Básicas O que é? 2 Ramo do aprendizado de máquina Consiste em atribuir um rótulo (ou classe) para uma certa amostra ou valor de entrada Exemplo: classificação
Leia maisClassificação de arritmias em sinais ECG
Classificação de arritmias em sinais ECG Eduardo Luz Rensso Mora Universidade Federal de Ouro Preto 06/10/2010 Summary 1 Introdução 2 3 4 5 Introdução Comparação entre três métodos para classificação de
Leia maisUm Tutorial em processamento de sinais para EEG
Um Tutorial em processamento de sinais para EEG Técnicas para reconhecimento de estados mentais em Interfaces Cérebro-Computador Grupo de Pesquisa em Computação Musical - IME/USP March 14, 2016 Interfaces
Leia maisRegressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC
Regressão Linear Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Overfitting 2. Treino e Validação 3. Baseline dos modelos 1 Overfitting Overfit Em muitos casos, a amostra de dados coletada
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira Nem todo conhecimento tem o mesmo valor. O que torna determinado conhecimento mais importante que
Leia maisIN-1131 Computação Evolucionária. Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática
IN-1131 Computação Evolucionária Aluizio Fausto Ribeiro Araújo Universidade Federal de Pernambuco Centro de Informática aluizioa@cin.ufpe.br Objetivos Este curso visa oferecer introdução abrangente em
Leia maisHP UFCG Analytics Abril-Maio Um curso sobre Reconhecimento de Padrões e Redes Neurais. Por Herman Martins Gomes.
HP UFCG Analytics Abril-Maio 2012 Um curso sobre Reconhecimento de Padrões e Redes Neurais Por Herman Martins Gomes hmg@dsc.ufcg.edu.br Programa Visão Geral (2H) Reconhecimento Estatístico de Padrões (3H)
Leia maisTópicos Especiais em Informática Fatec Indaiatuba 13/07/2017
Inteligência de Negócios Fatec Indaiatuba Prof. Piva Compreender as definições e conceitos básicos da Mineração de Dados (MD) Entender o processo KDD (Knowledge Discovery Data) e MD Descrever as etapas
Leia mais2 Sentiment Analysis 2.1
2 Sentiment Analysis 2.1 Definição do Problema Sentiment Analysis é um problema de categorização de texto no qual deseja-se detectar opiniões favoráveis e desfavoráveis com relação a um determinado tópico
Leia mais4 Construção dos Classificadores
4 Construção dos Classificadores 4.1. Modelagem O aprendizado supervisionado contém a etapa de modelagem, nessa etapa definimos quais serão as características encaminhadas ao classificador para o treinamento.
Leia maisSegmentação, Rastreamento de Objetos e Detecção de Eventos Primitivos com Aplicação no Monitoramento Automático de Ações Humanas em Vídeo
Segmentação, Rastreamento de Objetos e Detecção de Eventos Primitivos com Aplicação no Monitoramento Automático de Ações Humanas em Vídeo Dissertação de Mestrado Aluno: Bruno Costa Orientador: Herman Gomes
Leia maisImplementação de um sistema de validação estatística configurável de dados
Implementação de um sistema de validação estatística configurável de dados Eduardo Dias Filho Supervisores: João Eduardo Ferreira e Pedro Losco Takecian 16 de novembro de 2014 Introdução Table of Contents
Leia maisClassificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências
Leia maisPredição de Links em Redes Complexas utilizando Informações de Estruturas de Comunidades
Predição de Links em Redes Complexas utilizando Informações de Estruturas de Comunidades Jorge Carlos Valverde Rebaza Orientador: Prof. Dr. Alneu de Andrade Lopes Instituto de Ciências Matemáticas e de
Leia maisProcessamento digital de imagens
Processamento digital de imagens Agostinho Brito Departamento de Engenharia da Computação e Automação Universidade Federal do Rio Grande do Norte 27 de maio de 2016 Reconhecimento de objetos Padrão: arranjo
Leia maisReconhecimento facial. uma aplicação prática do reconhecimento de padrões
Reconhecimento facial uma aplicação prática do reconhecimento de padrões Márcio Koch, junho 2014 Pauta Apresentação Visão computacional Reconhecimento de padrões Analise de Componentes Principais Reconhecimento
Leia maisOtimização com Algoritmos Genéticos no MATLAB. Prof. Rafael Saraiva Campos CEFET-RJ
Otimização com Algoritmos Genéticos no MATLAB Prof. Rafael Saraiva Campos CEFET-RJ Conteúdo do Mini-Curso PARTE 1 Teoria PARTE 2 Prática Conteúdo do Mini-Curso PARTE 1 Teoria 1.1. Conceitos Básicos de
Leia mais5COP096 TeoriadaComputação
Sylvio 1 Barbon Jr barbon@uel.br 5COP096 TeoriadaComputação Aula 13 Prof. Dr. Sylvio Barbon Junior Sumário - Problemas NP-Completo Algoritmos Não-deterministas; Classes NP-Completo e NP-Dificil; Teorema
Leia maisSegmentação e Classificação. Prof. Herondino
Segmentação e Classificação Prof. Herondino Segmentação Neste processo, divide-se a imagem em regiões que devem corresponder às áreas de interesse da aplicação. Entende-se por regiões um conjunto de "pixels"
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 18 Aprendizado Não-Supervisionado Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor
Leia maisReplicação em sistemas web
Sistemas Distribuídos maio de 2015 Servidores Web tolerância a falhas desempenho/escalabilidade desempenho: uso de servidores mais potentes (scale-up x scale-out) caching Servidores Web tolerância a falhas
Leia maisMapeamento do uso do solo para manejo de propriedades rurais
1/28 Mapeamento do uso do solo para manejo de propriedades rurais Teoria Eng. Allan Saddi Arnesen Eng. Frederico Genofre Eng. Marcelo Pedroso Curtarelli 2/28 Conteúdo programático: Capitulo 1: Conceitos
Leia maisUniversidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Conceitos básicos Classificação não-supervisionada:
Leia maisProjeto Multiresolução de Operadores Morfológicos. Morfológicos a Partir de Exemplos
Projeto Multiresolução de Operadores Morfológicos a Partir de Exemplos Daniel André Vaquero Orientador: Junior Barrera Departamento de Ciência da Computação Instituto de Matemática e Estatística (IME)
Leia maisRedes Neurais Artificiais. Everton Gago
Redes Neurais Artificiais Everton Gago Como vai ser? O que é RNA? Conglomerado de neurônios!?!? Neurônio: Neurônio: Entradas: X0 = 0 X1 = 1 X2 = 1 Neurônio: Entradas: X0 = 0 X1 = 1 X2 = 1 Pesos: W0 = 0.3
Leia maisPor que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas
Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas Wrapper Filtros Muitos algoritmos de AM são projetados de modo a selecionar os
Leia maisT6.1 Reconhecimento de Padrões
T6.1 Reconhecimento de Padrões Proc. Sinal e Imagem Mestrado em Informática Médica Miguel Tavares Coimbra Resumo 1. Introdução ao reconhecimento de padrões 2. Representação do conhecimento 3. Reconhecimento
Leia maisSEMINÁRIO DOS ARTIGOS:
SEMINÁRIO DOS ARTIGOS: Text Detection and Character Recognition in Scene Images with Unsupervised Feature Learning End-to-End Text Recognition with Convolutional Neural Networks Fernanda Maria Sirlene
Leia maisUm Mecanismo de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank
Um Mecanismo de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank Glauber Rodrigues da Silva, Renata de Matos Galante Instituto de Informática Universidade Federal
Leia maisEEL891 Aprendizado de Máquina Prof. Heraldo L. S. Almeida. Introdução
1 Introdução 1. Introdução 1.1. O que é Aprendizado de Máquina? 1.2. Por que Machine Learning é o Futuro? 1.3. Algumas Aplicações 1.4. Tipos de Aprendizado 1. Introdução 17 1. Introdução 1.1. O que é Aprendizado
Leia maisCurso de Data Mining
Curso de Data Mining Sandra de Amo Curvas Roc Uma curva ROC (Receiver Operating Characteristic) é um enfoque gráfico que permite visualizar os trade-offs entre as taxas de positivos verdadeiros e positivos
Leia maisTeoria da Decisão. Otimização Vetorial. Prof. Lucas S. Batista. lusoba
Teoria da Decisão Prof. Lucas S. Batista lusoba@ufmg.br www.ppgee.ufmg.br/ lusoba Universidade Federal de Minas Gerais Escola de Engenharia Graduação em Engenharia de Sistemas Introdução Sumário 1 Introdução
Leia maisAprendizagem de Máquina
Problema do Agrupamento Aprendizagem de Máquina Alessandro L. Koerich Seja x = (x 1, x 2,, x d ) um vetor d dimensional de características Seja D um conjunto de x vetores, D = { x(1), x(2),, x(n) } Problema
Leia maisRESULTADO PARCIAL - PROVA DE SELEÇÃO DE BOLSISTA PARA PID-2017
PROGRAMA DE INICIAÇÃO À DOCÊNCIA PID SELEÇÃO DE BOLSISTAS DE INICIAÇÃO À DOCÊNCIA 2017 EDITAL N 02/2017 RESULTADO PARCIAL - PROVA DE SELEÇÃO DE BOLSISTA PARA PID-2017 ÁREA DE CONCENTRAÇÃO: COMPUTAÇÃO PROJETO:
Leia maisSISTEMA AUTOMÁTICO PARA AVALIAÇÃO POSTURAL BASEADO EM DESCRITORES DE IMAGENS
SISTEMA AUTOMÁTICO PARA AVALIAÇÃO POSTURAL BASEADO EM DESCRITORES DE IMAGENS GIAN LUCAS DE OLIVEIRA PAIVA GRADUANDO EM ENGENHARIA ELETRÔNICA ORIENTADOR: PROF. CRISTIANO JACQUES MIOSSO DR. EM ENGENHARIA
Leia mais