Análise Estatística e Topológica do Webgraph
|
|
- Rubens Amaro
- 5 Há anos
- Visualizações:
Transcrição
1 Análise Estatística e Topológica do Webgraph Luciana Salete Buriol Grupo de algoritmos: estudos no Webgraph Coordenação: Prof. Dr. Stefano Leonardi Universidade de Roma La Sapienza
2 Webgraph O Webgraph é o grafo direcionado gerado pela estrutura de links das páginas web. cada página web é um vértice cada hyperlink entre páginas é um arco direcionado. É um grafo esparso e desconexo
3 Sumário Motivação Extração, armazenamento e compactação do grafo Características topológicas e propriedades do grafo Algoritmos de classificação Bases de dados alternativas Algoritmos de acesso à memória secundária Algoritmos de Data Stream Conclusões
4 Motivações Grande dimensão: atualmente possui mais de 24 bilhões de vértices e 360 bilhões de arcos 1998: 24 milhões de páginas 1999: 200 milhões 2003: 3.5 bilhões de páginas 2005: 11.5 bilhões de páginas 2006: 24 bilhões de páginas
5 Motivações É o grafo utilizado por ferramentas de busca para classificação das páginas web Não possui controle de expansão Não se assemelha a outras redes Diversidade de tópicos, estilos e línguas
6 Coleta das páginas A coleta das páginas é realizada por uma máquina de busca (web crawler) Faz a busca a partir de um conjunto de páginas iniciais Após extrair a página, identifica seus links Página Web
7 Coleta das páginas É preciso possuir links entrantes para ser coletada Uma máquina de busca de grande dimensão deve: Identificar eficientemente páginas já extraídas Processar em paralelo Usar banda de rede limitada Usar a política da boa educação
8 Coleta das páginas Problemas práticos: Tempo x espaço. Ex: 42 milhões de páginas html do domínio italiano, tendo em média 10 KB por página. Espaço Tempo 400 GB: 1.33 discos de 300GB Banda disponível: 2 Mbps 24 bilhões de páginas: mais de 200 discos. 3 pontos de coleta 5.5 milhões de páginas por dia 8 dias executando
9 Coleta das páginas As máquinas de busca mais conhecidas na literatura: WIRE: Universidade do Chile UbiCrawler: Universidade Estadual de Milão; Nutch ( USA, implementado em Java, fácil instalação e utilização, opções para usuário As máquinas de busca comerciais, como Google, Alta Vista, não são de domínio público
10 Recuperação de Informação na Web Trata da representação, armazenamento, organização e acesso à informação referente às páginas web R. Baeza Yates e B. Ribeiro Neto, Modern Information Retrieval, 1999, www2.dce.ufmg.br/livros/irbook
11 Indexação Indexação Invertida: para cada palavra cria se uma referência a todos os arquivos que a contém As palavras e páginas recebem IDs São cerca de 100 milhões de palavras indexadas MG4J ( e SMART ( ftp://ftp.cs.cornell.edu/pub/smart) indexadores de domínio público
12 Armazenamento do webgraph Armazenamento do webgrafo e/ou conteúdo das páginas? Uma página html sem figuras, tem tamanho médio de 10 a 14 Kb Representação do grafo: lista de adjacência Dividido em vários arquivos e unidades de disco
13 Link Analysis Identificação da estrutura topológica do grafo Cálculo de diversas propriedades do grafo classificação das páginas web
14 Distribuição do grau das páginas
15 Estrutura Macroscópica do Webgraph Graph structure in the Web, Broder et al, 2000
16 Identificando OUT SCC OUT
17 Identificando IN SCC IN
18 Identificando tentáculos e tubos IN tentáculos_in OUT tentáculos_out
19 Ilhas: nós restantes
20 Webgraph do domínio.br Um novo retrato da web brasileira, M. Modesto, A. Pereira, N. Ziviani, C. Castillos, R. Baeza Yates, 2005 (Brasil + Chile) domínio.br 7.7 milhões de páginas e 126 milhões de links (média de 16 links por página)
21 Webgraph do domínio.br Média de 14,4 Kb por página. Anteriormente era de 9 Kb (Um retrato da web brasileira, Veloso et al, 2000) 6.4% das páginas são duplicadas 41.7% das páginas são dinâmicas
22 Webgraph do domínio.br Idioma: português 88,6% inglês 11,2% e espanhol 1,16% Domínio: 91.1% com.br 2.7% org.br 0,3% edu.br Extensão: html: 97.92% pdf: 0.88 % doc: 0.48%
23 Propriedades Avançadas Cálculo do número de triângulos do grafo Cálculo do número de cliques bipartidos de pequena dimensão Cálculo do coeficiente de clustering??
24 Comunidades Web emergentes Identifique todos cliques bipartidos de dimensão 3 i 10 Para cada um, identifique a comunidade web a que pertence
25 Pagerank As páginas web são apresentadas em ordem decrescente de seu pagerank PageRank (PR) é um valor numérico que representa o quão importante uma página é Simula o procedimento de um Internauta. Seleciona uma página aleatória: Repita até convergir: Com probabilidade α visita uma página vizinha Com probabilidade 1 α visita outra página aleatória. Em geral α = /3 1/3 1/3
26 PageRank: propagação do ranking
27 Cálculo do Pagerank { PR p1 PR p n } 1 α PR p =PR p α.... D p1 D pn N PR(p): PageRank da página p p1 pn: n páginas que apontam para página p D(p): grau de saída da página p N: número total de páginas web do grafo PR p =0, 59 0,85. { } 0, 32 0, 17 0, 15 D p 1 D p n N
28 Algoritmos de Classificação Outros alg. de classificação: HITs, Salsa, ExpertRank Avaliação: Classificação adequada Cálculo rápido Estabilidade Menos susceptível a link spamming
29 Pagerank Temporal Pagerank considera somente o webgraph no cálculo da classificação das páginas Outros fatores podem ser considerados: idade da página, número de atualizações e freqüência das atualizações Como considerar tais fatores? Tema de interesse atual Em 2004 apareceram as primeiras propostas de algoritmos na literatura
30 Bases de Dados Alternativas Wikipedia maior enciclopédia online do mundo Cada artigo é um nó e cada hyperlink entre artigos é um arco do grafo Poucos links externos Um grafo pode ser gerado para cada língua Língua Inglesa: nós (15 arcos por nó) Possui informação temporal
31 Página Principal:
32 Algoritmos de memória secundária O grafo não pode ser carregado em memória principal, mas armazenado em memória secundária Tratando se de grafos de grande dimensão, quase na totalidade os algoritmos não são executados em memória principal Algoritmos de memória principal, semi externos e de memória secundária Buscam minimizar acesso a disco e o uso de seek()
33 Algoritmos de Data Stream algoritmos de aproximação baseados em probabilidade usam memória limitada; Originalmente: dados são lidos uma única vez em forma de stream Usam sketch ou amostragem
34 Algoritmos de data stream O webgrafo é lido como um stream de arcos podem considerar estrutura de armazenamento podem ler dados mais de uma vez Usados para aproximar cálculo de propriedades avançadas do webgraph. Já propostos: triângulos, cliques bipartidos e coeficiente de clustering.
35 Contando o Número de Triângulos de um Grafo Dado um grafo G=(V,E), onde V e o conjunto de nós e E o conjunto de arcos, considere todas as triplas de três nós V;
36 Contando o Número de Triângulos de um Grafo Melhores resultados anteriores por Yossef, Kumar e Sivakumar: Reductions in Streaming Algorithms, with an Application to Counting Triangles in Graphs, T 1 T O. log. 1. logn δ T3 ε3 L. Buriol, G. Frahling, S. Leonardi, C. Soher, A. Marchetti, Counting Triangles in Data Streams, PODS 2006 T 1 T 2 1 O. log. 1 2 δ T3 ε 1
37 Compressão Níveis de compressão: Conteúdo da página URL da página Webgraph Usa técnicas especializadas que permitem grande compressão e rápido acesso aos dados.
38 Observações levadas em consideração para compressão Consecutividade: muitos links num mesmo web site são similares lexicograficamente. Ex: Localidade: cerca de 80% dos links são locais, ou seja, apontam para páginas no mesmo domínio Similaridade: Páginas do mesmo domínio tendem a ter muitos links que apontam para as mesmas páginas
39 Compressão das URLs São ordenadas lexicograficamente e armazenadas com indicação de similaridade + diferença em relação à precedente. Proposto em 1997 pelo Alta Vista: obtém redução de 70%.
40 Lista de Adjacência em Código Delta Vért ices Lista Adj
41 Lista de Adjacência em Código Delta Vért ices Lista Adj Vért ices 3 = (primeiro item) Lista Adj
42 Lista de Adjacência em Código Delta Vért ices Lista Adj Vért ices 3 = (primeiro item) 42 = (demais items) Lista Adj
43 Compressão do Webgraph Melhor compressão = ( ) bits por arco: Universidade Estadual de Milão ( Compressão vs. tempo de acesso Acesso seqüencial e aleatório
44 Tópicos de Interesse evolução temporal do grafo: geração de grafos, propriedades e classificação. determinar como tais propriedades podem aprimorar as ferramentas de busca propor algoritmos de data stream para o cálculo de propriedades avançadas alg de memória secundária
45 Projeto de Pesquisa Luciana Buriol, Leila Ribeiro, Fernando Dotti, Viviane Orengo e Marcus Ritt Futura cooperação com o grupo de mineração e banco de dados? Tópicos Especiais em Recuperação de Informações: Viviane, Leandro, Luciana
46 Conclusões Necessidade de integração de diversas áreas Necessita de conhecimento geral, mas um pesquisador em geral se especializa em sub áreas Probabilidade tem grande importância Os estudos são recentes, de interesse atual, e ainda carece de muita pesquisa Muitos problemas de dimensões diversas
47 Contato Luciana Salete Buriol Os slides da palestra estão disponíveis na minha página
Algoritmos e métodos envolvidos numa máquina de busca
Algoritmos e métodos envolvidos numa máquina de busca Luciana Salete Buriol Instituto de Informática, Universidade Federal do Rio Grande do Sul (UFRGS) Webgraph O Webgraph é o grafo direcionado gerado
Leia maisAnálise quantitativa e temporal do Wikigrafo-PT
Análise quantitativa e temporal do Wikigrafo-PT Marcelo Zambiasi 1 2, Thiago A. Presa 1 2, Luciana S. Buriol 1, Viviane M. Orengo 1 1 Instituto de Informática - Universidade Federal do Rio Grande do Sul
Leia maisTipos de Índices. Profa. Dra. Cristina Dutra de Aguiar Ciferri
Tipos de Índices Cristina Dutra de Aguiar Ciferri Tipos de Índice Ordenados em um único nível primário agrupamento (cluster) secundário Estruturas de dados de árvores índices multiníveis árvores-b, árvores-b+
Leia mais1 Introdução Motivação
1 Introdução 1.1. Motivação Informações podem ser armazenadas das mais variadas maneiras. O modo mais clássico de armazenamento de informação é através da palavra escrita, impressa. O acesso à informação
Leia maisAULA 11 PROJETO E ANÁLISE DE ALGORITMOS. Conceitos básicos e representação de grafos Karina Valdivia Delgado
AULA 11 PROJETO E ANÁLISE DE ALGORITMOS Conceitos básicos e representação de grafos Karina Valdivia Delgado Roteiro Motivação Conceitos básicos Representação Motivação Um grafo é uma abstração que permite
Leia maisDetecção de Réplicas de Sítios Web Usando Aprendizado Semi-supervisionado baseado em Maximização de Expectativas. Cristiano Rodrigues de Carvalho
Detecção de Réplicas de Sítios Web Usando Aprendizado Semi-supervisionado baseado em Maximização de Expectativas Cristiano Rodrigues de Carvalho Orientador: Nivio Ziviani Co-orientador: Adriano Veloso
Leia maisA quantidade de informação existente no mundo é grande e cresce a uma taxa exponencial a cada ano. Aplicações como engenhos de busca web, por
1 Introdução A quantidade de informação existente no mundo é grande e cresce a uma taxa exponencial a cada ano. Aplicações como engenhos de busca web, por exemplo, tem que lidar com uma quantidade de dados
Leia maisCompressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso:
Compressão de Textos Estrutura de Dados II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM O volume
Leia maisAlgoritmos e Estruturas de Dados II. Ordenação Externa II. Ordenação Externa. Ordenação Externa. Ordenação Externa
Algoritmos e Estruturas de Dados II Ordenação Externa II Prof. Ricardo J. G. B. Campello As análises dos métodos de ordenação tradicionais se preocupam basicamente com o tempo de execução dos algoritmos
Leia maisGRAFOS Conceitos Básicos (Parte 1)
ALGORITMOS E ESTRUTURAS DE DADOS II GRAFOS Conceitos Básicos (Parte 1) Gustavo Batista Profa. Elaine Parros Machado de Sousa alterações: Cris-na Dutra de Aguiar Ciferri Material baseado em aulas dos professores:
Leia maisWindows Explorer e Sistemas de Arquivos. Conceitos e usos do Windows Explorer e os Sistemas de Arquivos do Windows
Windows Explorer e Sistemas de Arquivos Conceitos e usos do Windows Explorer e os Sistemas de Arquivos do Windows Quem é o Windows Explorer? Utilitário do Windows responsável pelo gerenciamento de arquivos,
Leia maisOrganização de Computadores I
Organização de Computadores I Aula 2 Material: Diego Passos http://www.ic.uff.br/~debora/orgcomp/pdf/parte2.pdf Organização de Computadores I Aula 2 1/29 Tópicos de Computação. de um Sistema de Computação..
Leia maisGRAFOS. Prof. André Backes. Como representar um conjunto de objetos e as suas relações?
8/0/06 GRAFOS Prof. André Backes Definição Como representar um conjunto de objetos e as suas relações? Diversos tipos de aplicações necessitam disso Um grafo é um modelo matemático que representa as relações
Leia maisKeyword Search over RDF Graphs. Lucas Peres Gaspar
Keyword Search over RDF Graphs Lucas Peres Gaspar 1 Olá! Petiano emérito no PET Computação UFC; Bolsista no Arida; Graduando em Ciência da Computação; 2 Fonte http://www.dc.fi.udc.es/~roi/publications/cikm2011c.pdf
Leia maisProfa. Dra. Cristina Dutra de Aguiar Ciferri. Estruturas de Indexação de Dados
Estruturas de Indexação de Dados Cristina Dutra de Aguiar Ciferri Índice Estrutura de acesso auxiliar usada para melhorar o desempenho na recuperação de registros Pesquisa restringida a um subconjunto
Leia maisPré-Processamento de Documentos
Pré-Processamento de Documentos Introdução Pré-Processamento : Análise léxica; Stopwords; Stemming; Vocabulário; Thesaurus Compressão: Fundamentos; Método Estatístico; Método Dicionário; Arquivos Invertidos
Leia maisEndNote Basic. Maria Cristina Cavarette Dziabas Sabrina Di Salvo Mastrantonio
EndNote Basic Maria Cristina Cavarette Dziabas mcdziaba@ifsc.usp.br Sabrina Di Salvo Mastrantonio sabrina@ifsc.usp.br Novembro/2015 EndNote Gerenciador de Referências Bibliográficas; Software da Thomson
Leia maisHierarquia de Memória
Hierarquia de Memória Organização da cache AC1 Hierarquia da Memória: Organização 1 Mapeamento Directo A cada endereço de memória corresponde apenas uma linha da cache. linha = resto (endereço do bloco
Leia maisConteúdo. Histórico. Notas. Teoria dos Grafos BCC204. Notas. Notas. 1736: Euler e as Pontes de Königsberg
Teoria dos Grafos BCC204 Haroldo Gambini Santos Universidade Federal de Ouro Preto - UFOP 15 de março de 2011 1 / 31 Conteúdo 1 Introdução 2 Exemplos 3 4 Representação 2 / 31 Histórico 1736: Euler e as
Leia mais4 Testes e experimentos realizados 4.1. Implementação e banco de dados
32 4 Testes e experimentos realizados 4.1. Implementação e banco de dados Devido à própria natureza dos sites de redes sociais, é normal que a maior parte deles possua uma grande quantidade de usuários
Leia maisUso de Índices na Otimização e Processamento de Consultas. Otimização e Processamento de Consultas. Otimização e Processamento de Consultas
usuário processador de E/S gerador de respostas Uso de Índices na Otimização e Processamento de Consultas Profa. Dra. Cristina Dutra de Aguiar Ciferri analisador controle de autorização verificador de
Leia maisProfª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni
Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Motivação e Objetivos Etapas do Desenvolvimento de um Sistema de Recuperação de Informações (SRI): Pré-processamento; Representação; Extração
Leia maisFundamentos de Sistemas Operacionais
Fundamentos de Sistemas Operacionais Aula 19: Memória Virtual: Introdução Diego Passos Última Aula Paginação Método de gerenciamento de memória mais usado hoje. Espaço de endereçamento de um processo é
Leia maisAula 06. Slots para Memórias
Aula 06 Slots para Memórias Slot para as memórias 2 Slot para as memórias Os soquetes de memória são numerados: 1, 2 e 3. Instale memória primeiro no 1, depois no 2, depois no 3. Normalmente não é permitido
Leia maisDescoberta de conhecimento em textos - Análise semântica. Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes
Descoberta de conhecimento em textos - Análise semântica Diogo Cardoso Eduardo Camilo Inácio Eduardo Monteiro Dellandréa Guilherme Gomes Introdução Diversidade de textos não padronizados; Emails, artigos,
Leia maisVERIFICAÇÃO DE UNICIDADE DE URLS EM COLETORES DE PÁGINAS WEB
VERIFICAÇÃO DE UNICIDADE DE URLS EM COLETORES DE PÁGINAS WEB Wallace Favoreto Orientador: Prof. Nivio Ziviani Universidade Federal de Minas Gerais LATIN - LAboratory for Treating INformation 1 Agenda Introdução
Leia maisCapítulo 11: Implementação de Sistemas de Arquivos. Operating System Concepts 8th Edition
Capítulo 11: Implementação de Sistemas de Arquivos Sobre a apresentação (About the slides) Os slides e figuras dessa apresentação foram criados por Silberschatz, Galvin e Gagne em 2009. Esse apresentação
Leia maisCapítulo 2 Livro do Mário Monteiro Componentes Representação das informações. Medidas de desempenho
Capítulo 2 Livro do Mário Monteiro Componentes Representação das informações Bit, Caractere, Byte e Palavra Conceito de Arquivos e Registros Medidas de desempenho http://www.ic.uff.br/~debora/fac! 1 2
Leia maishttp://www.ic.uff.br/~debora/fac! 1 Capítulo 2 Livro do Mário Monteiro Componentes Representação das informações Bit, Caractere, Byte e Palavra Conceito de Arquivos e Registros Medidas de desempenho 2
Leia maisVolmir Eugênio Wilhelm Departamento de Engenharia de Produção UFPR 45
Volmir Eugênio Wilhelm Departamento de Engenharia de Produção UFPR 45 Introdução a Grafos Muitos problemas de otimização podem ser analisados utilizando-se uma estrutura denominada grafo ou rede. Problemas
Leia maisInternet Explorer 8.0 Navegador (Browser)
Internet Explorer 8.0 Navegador (Browser) O Internet Explorer 8 foi projetado para facilitar a navegação e a interação com sites na Internet ou na intranet. Sempre que você usa a Internet, ou um software
Leia maisBIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt
BIG DATA: UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com 70% 60% 50% 40% 30% 20%
Leia maisSumário. Trabalho que foi desenvolvido. Introdução
Proposta de um sistema de Classificação de Notícias utilizando técnicas de Aprendizagem de Máquina integrado com o ClippingBr Bruno Campagnolo de Paula PROJETO FINAL DA DISCIPLINA DE MACHINE LEARNING Mestrado
Leia maisUm Mecanismo de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank
Um Mecanismo de Detecção de Versões de Páginas Web para Melhoria do Desempenho do Algoritmo de PageRank Glauber Rodrigues da Silva, Renata de Matos Galante Instituto de Informática Universidade Federal
Leia maisTeoria dos Grafos Aula 8
Teoria dos Grafos Aula 8 Aula passada Classe de funções e notação Propriedades da notação Funções usuais Aula de hoje Grafos direcionados Busca em grafos direcionados Ordenação topológica Tempo de execução
Leia maisOs efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais
72 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Os efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais Renan Gomes Pereira¹ Maria Fernanda Moura²
Leia maisAnálise e Síntese de Algoritmos. Algoritmos em Grafos CLRS, Cap. 22
Análise e Síntese de Algoritmos Algoritmos em Grafos CLRS, Cap. 22 Mudança no Horário Aulas Teóricas de 4ª feira 10:30 12:00 Sala: FA1 12:00 13:30 Sala: FA1 Deixa de haver aula teórica às 9:00 por troca
Leia maisOrdenação e Busca em Arquivos
Ordenação e Busca em Arquivos Cristina D. A. Ciferri Thiago A. S. Pardo Leandro C. Cintra M.C.F. de Oliveira Moacir Ponti Jr. Exemplos de Busca Registros de tamanho fixo M A R I A R U A b 1 S A O b C A
Leia maisSSC546 -Avaliação de Desempenho de Sistemas
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação SSC546 -Avaliação de Desempenho de Sistemas Parte 1 -Aula 2 Sarita Mazzini Bruschi Material
Leia maisFundamentos de Sistemas Operacionais
Fundamentos de Sistemas Operacionais Aula 6 Gerenciamento de Memória Prof. Galvez Considerações Gerais Multiprogramação implica em manter-se vários processos em memória Memória necessita ser alocada de
Leia maisAlgoritmos e Técnicas de Programação. Professora Luciana Faria
Algoritmos e Técnicas de Programação Professora Luciana Faria luciana.faria@ifs.ifsuldeminas.edu.br Conceitos Básicos Computadores??? Máquina composta de elemento físicos do tipo eletrônico É uma máquina
Leia maisUniversidade Federal de Santa Catarina UFSC. Data mining na Web 2.0
Universidade Federal de Santa Catarina UFSC Centro Tecnológico CTC Departamento de Informática e Estatística INE Seminário de Data Mining Data mining na Web 2.0 Disciplina: Data Mining INE5644 Professor:
Leia maisFUNDAMENTOS DE ARQUITETURAS DE COMPUTADORES SISTEMAS DE COMPUTAÇÃO. Cristina Boeres
FUNDAMENTOS DE ARQUITETURAS DE COMPUTADORES SISTEMAS DE COMPUTAÇÃO Cristina Boeres Sistema de Computação! Conjunto de componentes integrados com o objetivo de manipular dados e gerar informações úteis.
Leia maisInformática I. Aula 7. Aula 7-20/09/2006 1
Informática I Aula 7 http://www.ic.uff.br/~bianca/informatica1/ Aula 7-20/09/2006 1 Ementa Histórico dos Computadores Noções de Hardware e Software Microprocessadores Sistemas Numéricos e Representação
Leia maisProtocolos de Roteamento link-state
CCNA Exploration (Protocolos e Conceitos de Roteamento) Protocolos de Roteamento link-state Cronograma Introdução Introdução ao algoritmo SPF Processo de roteamento link-state Criação de um B.D. link-state
Leia maisModelo Small World 2 o semestre de Virgílio A. F. Almeida Agosto de 2006
Modelo Small World 2 o semestre de 2006 Virgílio A. F. Almeida Agosto de 2006 1. Experimento Milgram 2. Watts & Strogatz: modelo small world 3. Kleinberg: modelo small world 4. Modelos de redes SW: exemplos
Leia maisBanco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas
Processamento e Otimização de Consultas Banco de Dados Motivação Consulta pode ter sua resposta computada por uma variedade de métodos (geralmente) Usuário (programador) sugere uma estratégia para achar
Leia maisGrafos - Introdução. Pedro Ribeiro 2014/2015 DCC/FCUP. Pedro Ribeiro (DCC/FCUP) Grafos - Introdução 2014/ / 32
Grafos - Introdução Pedro Ribeiro DCC/FCUP 2014/2015 Pedro Ribeiro (DCC/FCUP) Grafos - Introdução 2014/2015 1 / 32 Conceito Definição de Grafo Formalmente, um grafo é: Um conjunto de nós/vértices (V).
Leia maisFacebook. Um grafo é uma rede. Estrutura de dados fundamental em Informática, tal como listas e árvores.
Grafos Introdução Grafos Introdução Fernando Lobo Algoritmos e Estrutura de Dados II Estrutura de dados fundamental em Informática, tal como listas e árvores. Há muitos algoritmos interessantes sobre grafos.
Leia maisGerenciamento de Memória
Gerenciamento de Memória Prof. Clodoaldo Ap. Moraes Lima Paginação Espaço de endereço de um processo pode ser não contíguo; ao processo é alocado memória física sempre que disponível. Divide memória física
Leia maisIntrodução a Redes 2 o semestre de Virgílio A. F. Almeida Agosto de 2006
Introdução a Redes o semestre de 6 Virgílio A. F. Almeida Agosto de 6 Redes são coleções de pontos e linhas. 3 aresta nó Rede Grafo 4 5 pontos vertices nós atores linhas Arcos, arestas Links, arestas ligações,
Leia maisFUNDAMENTOS DE ARQUITETURAS DE COMPUTADORES MEMÓRIA CACHE CAPÍTULO 5. Cristina Boeres
FUNDAMENTOS DE ARQUITETURAS DE COMPUTADORES MEMÓRIA CACHE CAPÍTULO 5 Cristina Boeres Introdução! Diferença de velocidade entre Processador e MP O processador executa uma operação rapidamente e fica em
Leia maisAlgoritimos e Estruturas de Dados III CIC210
Algoritimos e Estruturas de Dados III CIC210 Algoritmos em Grafos - Haroldo Gambini Santos Universidade Federal de Ouro Preto - UFOP 28 de setembro de 2009 Haroldo Gambini Santos Algoritmos em Grafos 1/22
Leia maisUm Repositório Chave-Valor com Garantia de Localidade de Dados. Patrick A. Bungama Wendel M. de Oliveira Flávio R. C. Sousa Carmem S.
Um Repositório Chave-Valor com Garantia de Localidade de Dados Patrick A. Bungama Wendel M. de Oliveira Flávio R. C. Sousa Carmem S. Hara Agenda Motivação Desafios ALOCS Princípios de funcionamento Experimentos
Leia maisDistâncias entre vértces em um grafo. Implementação sequencial
Distâncias entre vértces em um grafo Implementação sequencial André de Freitas Smaira 16 de outubro de 2013 1 1 Introdução Nesse projeto, temos por objetivo a determinação das distâncias mínimas entre
Leia maisNivio Ziviani. Conjunto de transparências elaborado por Nivio Ziviani, Patrícia Correia e Fabiano C. Botelho
Tópicos em Recuperação de Informação 1 Nivio Ziviani 1 Conjunto de transparências elaborado por Nivio Ziviani, Patrícia Correia e Fabiano C. Botelho Tópicos em Recuperação de Informação - Nivio Ziviani
Leia maisPesquisa em Memória Secundária. Prof. Jonas Potros
Pesquisa em Memória Secundária Prof. Jonas Potros Pesquisa em Memória Secundária Pesquisa em memória secundária: arquivos que contém mais registros do que a memória interna pode armazenar. Algoritmos e
Leia mais4 Recuperação de Informação
4 Recuperação de Informação No presente capítulo são apresentados os fundamentos da área de Recuperação de Informação utilizados em Mineração de Textos, como por exemplo, os modelos de representação de
Leia maisRedes complexas: como as "coisas" se conectam
Prof. Antonio Augusto (Guto) IC/UFF arocha@ic.uff.br Áreas de Atuação: Redes de Computadores e Segurança de Dados Área de Interesse: Qualquer tópico interessante e desafiador! Redes complexas: como as
Leia mais01 Grafos: parte 1 SCC0503 Algoritmos e Estruturas de Dados II
01 Grafos: parte 1 SCC0503 Algoritmos e Estruturas de Dados II Prof. Moacir Ponti Jr. www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2011/1 Moacir Ponti Jr. (ICMCUSP) 01
Leia maisRedes Complexas. Renato Vicente. Complex Systems EACH USP
Redes Complexas Renato Vicente Complex Systems EACH USP Grafos Grafos são definidos por seus vértices e arestas G=(V,E). Para o grafo G acima: V={u,v,w,x,y} e E={a,b,c,d,e,f,g,h}. As arestas conectam dois
Leia maisSistemas Operacionais. Prof. André Y. Kusumoto
Sistemas Operacionais Prof. André Y. Kusumoto andrekusumoto.unip@gmail.com Introdução O sistema de arquivos é a parte mais visível do sistema operacional. Cria um recurso lógico a partir de recursos físicos
Leia maisPara onde vamos. Recuperação de Informação na WEB. Medidas de Avaliação. Recuperação de informação na WEB
Onde Estamos 1 Para onde vamos Medidas de Avaliação Recuperação de Informação na WEB 2 Sites de Busca (search engines/buscadores) Permitem ao usuário submeter sua expressão de busca e recuperar uma lista
Leia maisImplementação de Sistemas de Arquivos. Na Aula Anterior... Esquema do Sistema de Arquivos. Nesta Aula 31/10/2016. Estrutura de Baixo Nível de um Disco
GSI018 Sistemas Operacionais 31/10/2016 Implementação de Sistemas de Arquivos Universidade Federal de Uberlândia Faculdade de Computação Prof. Dr. rer. nat. Daniel D. Abdala Na Aula Anterior... Memória
Leia maisUma ferramenta para expansão do vocabulário com base em coocorrência
Resumos Expandidos: XI Mostra de Estagiários e Bolsistas... 11 Uma ferramenta para expansão do vocabulário com base em coocorrência Exupério Lédo Silva Júnior 1 Roberta Akemi Sinoara 2 Solange Oliveira
Leia maisAlg l ori r t i m t os e E str t u r tu t ra r s d e D ados I I Intr t o r duçã ç o ã a a Gr G a r f a o f s P of o a. M. C r C ist s ina n a /
Algoritmos e Estruturas de Dados II Introdução a Grafos Profa. M. Cristina / Profa. Rosane (2012) Baseado no material de aula original: Profª. Josiane M. Bueno Divisão do arquivo 1ª parte: Motivação Definição:
Leia maisAlgoritmos e Estruturas de Dados II Introdução a Grafos. Divisão do arquivo
Algoritmos e Estruturas de Dados II Introdução a Profa. M. Cristina / Profa. Rosane (2010/11) Baseado no material de aula original: Profª. Josiane M. Bueno Divisão do arquivo 1ª parte: Motivação Definição:
Leia maisProcessamento Cosequencial: Ordenação Interna e Externa. Thiago A. S. Pardo Leandro C. Cintra M.C.F. de Oliveira Cristina D. A.
Processamento Cosequencial: Ordenação Interna e Externa Thiago A. S. Pardo Leandro C. Cintra M.C.F. de Oliveira Cristina D. A. Ciferri Ordenação em RAM Situação: arquivo cabe em RAM Etapas leitura de todos
Leia maisAcesso Sequencial Indexado
Acesso Sequencial Indexado Utiliza o princípio da pesquisa seqüencial cada registro é lido seqüencialmente até encontrar uma chave maior ou igual a chave de pesquisa. Providências necessárias para aumentar
Leia maisNíveis de memória. Diferentes velocidades de acesso. Memória Cache. Memórias Auxiliar e Auxiliar-Backup
Memória Níveis de memória Diferentes velocidades de acesso Pequeno Alto(a) Cache RAM Auxiliar Auxiliar-Backup Memória Cache altíssima velocidade de acesso acelerar o processo de busca de informações na
Leia maisGrafos - Motivação. Grafos - Motivação. Algoritmos e Estruturas de Dados II Introdução a Grafos
Algoritmos e Estruturas de Dados II Introdução a Profa. M. Cristina/ Profa. Rosane (2010) Material de aula original: Profa. Josiane M. Bueno - Motivação : conceito introduzido por Euler, em 1736 Problema
Leia maisSistemas Operacionais
Introdução Sistemas Operacionais Implementação de arquivos Gerenciamento de espaço em disco Trabalho sob a Licença Atribuição-SemDerivações-SemDerivados 3. Brasil Creative Commons. Para visualizar uma
Leia maisCap. 2 Conceitos Básicos em Teoria dos Grafos
Teoria dos Grafos e Aplicações 8 Cap. 2 Conceitos Básicos em Teoria dos Grafos 2.1 Grafo É uma noção simples, abstrata e intuitiva, usada para representar a idéia de alguma espécie de relação entre os
Leia maisNem todos os problemas algorítmicos que podem ser resolvidos em princípio podem ser resolvidos na prática: os recursos computacionais requeridos
Nem todos os problemas algorítmicos que podem ser resolvidos em princípio podem ser resolvidos na prática: os recursos computacionais requeridos (tempo ou espaço) podem ser proibitivos. 1 Suponha que duas
Leia maisINF 1010 Estruturas de Dados Avançadas
INF Estruturas de Dados Avançadas Grafos // DI, PUC-Rio Estruturas de Dados Avançadas. Aplicações de grafos grafo vértices arestas Cronograma tarefas restrições de preferência Malha viária interseções
Leia maisArquivos invertidos 39
Arquivos invertidos 39 Arquivos invertidos É um mecanismo que utiliza palavras para indexar uma coleção de documentos a fim de facilitar a busca e a recuperação Estruturas de um arquivo invertido Vocabulário
Leia maisSeleção e Otimização de Fontes
Seleção e Otimização de Fontes 1. Introdução Muitos dados disponíveis Não há garantia de relevância Muitos acessos (custoso) O Autor propõe uma ideia para otimizar o processamento: A indexação e seleção
Leia maisINFORMÁTICA. Professor: Venicio Paulo Mourão Saldanha Site:
INFORMÁTICA Professor: Venicio Paulo Mourão Saldanha Site: www.veniciopaulo.com Graduado em Análises e Desenvolvimento de Sistemas Analista de Sistemas (Seplag) Instrutor(Egp-Ce) Professor(CEPEP) CONCEITOS
Leia maisMemória Virtual. Ciclo 4 AT2. Prof. Hermes Senger
Memória Virtual Ciclo 4 AT2 Prof. Hermes Senger Nota O presente material foi elaborado com base no material didático do livro Sistemas Operacionais, 3ª edição, de H.M.Deitel, P.J. Deitel, D.R. Choffnes,
Leia maisFrancisco Benjamim Filho. XHITS: Estendendo o Algoritmo HITS para Extração de Tópicos na WWW DISSERTAÇÃO DE MESTRADO
Francisco Benjamim Filho XHITS: Estendendo o Algoritmo HITS para Extração de Tópicos na WWW DISSERTAÇÃO DE MESTRADO DEPARTAMENTO DE INFORMÁTICA Programa de Pós-Graduação em Informática Rio de Janeiro,
Leia maisEstrutura de indexação de arquivos
Estrutura de indexação de arquivos Neste capítulo assume-se que um arquivo já existe e possui alguma organização primária desordenada ordenada ou hash Utiliza-se índices, que são estruturas de acesso adicionais
Leia maisslide Pearson Prentice Hall. Todos os direitos reservados.
Sistema de Arquivos slide 1 Sistemas de arquivos Condições essenciais para armazenamento de informações por um longo prazo: Deve ser possível armazenar uma grande quantidade de informação A informação
Leia mais4 Ambiente de Experimentação
4 Ambiente de Experimentação O ambiente de experimentação desenvolvido baseia-se em dois pontos principais, a saber: A implementação de uma ferramenta capaz de calcular as classificações das páginas da
Leia maisDepartamento de Engenharia de Produção UFPR 57
Departamento de Engenharia de Produção UFPR 57 Introdução a Grafos Muitos problemas de otimização podem ser analisados utilizando-se uma estrutura denominada grafo ou rede. Problemas em redes aparecem
Leia maisSistemas de Arquivos. (Aula 23)
Sistemas de Arquivos (Aula 23) Funções de um SO Gerência de processos Gerência de memória Gerência de Arquivos Gerência de I/O Sistema de Proteção 2 Sistemas Operacionais 2008/1 Necessidade de Armazenamento
Leia maisCapítulo 11 Sistemas de Arquivos
Sistemas Operacionais Prof. Esp. André Luís Belini Bacharel em Sistemas de Informações MBA em Gestão Estratégica de Negócios Capítulo Sistemas de s Introdução O armazenamento e a recuperação de informações
Leia maisRecuperação de informação na WEB
Recuperação de Informação na Sites de Busca (search engines/buscadores) Permitem ao usuário submeter sua expressão de busca e recuperar uma lista (geralmente ordenada) de endereços de páginas (URLs) que
Leia maisArquitectura de Computadores
Arquitectura de Computadores Hierarquia de Memória; Memória Cache (13.2 e 13.3) José Monteiro Licenciatura em Engenharia Informática e de Computadores Departamento de Engenharia Informática (DEI) Instituto
Leia maisANÁLISE E PROJETO DE BANCO DE DADOS
ANÁLISE E PROJETO DE BANCO DE DADOS ESTRUTURAS E INDEXAÇÃO FELIPE G. TORRES ARQUIVOS Um arquivo é uma sequência de registros. Em muitos casos do mesmo tipo. Se cada registro no arquivo tem exatamente o
Leia maisAlgoritmos e Estruturas de Dados II. Trabalho Prático 4
Algoritmos e Estruturas de Dados II Trabalho Prático 4 Entrega: 23/11/09 Devolução: 10/12/09 (sem possibilidade de entrega com atraso) Trabalho em dupla Prof. Jussara Marques de Almeida Problema 1: Construção
Leia maisTutorial sobre o MineraFórum I. Introdução
Tutorial sobre o MineraFórum I. Introdução O MineraFórum é um minerador de textos para fóruns de discussão. A ferramenta realiza um mapeamento dos principais conceitos relacionados ao tema em debate, calculando
Leia maisArquitetura de um sistema integrado de defesa cibernética para detecção. de botnets
Arquitetura de um sistema integrado de defesa cibernética para detecção 1 de botnets Autoria do artigo: Sérgio dos Santos Cardoso Silva e Ronaldo Moreira Salles Apresentação: Bruno Follmann 2 Apresentação
Leia maisINTRODUÇÃO A PROGRAMAÇÃO PARA WEB
INTRODUÇÃO A PROGRAMAÇÃO PARA WEB PROF. ME. HÉLIO ESPERIDIÃO Navegador O navegador também conhecido como web browser é um programa que habilita seus usuários a interagirem com documentos hospedados em
Leia maisGrafos: conceitos básicos e métricas
Grafos: conceitos básicos e métricas Principais Propriedades em Redes Complexas Definição de termos básicos em um grafo qualquer, nos quais as propriedades estruturais de redes complexas são baseadas Rede
Leia maisIntrodução. Estrutura de Dados II Prof Jairo Francisco de Souza
Introdução Estrutura de Dados II Prof Jairo Francisco de Souza Conteúdo Programático Parte 1 Manipulação de arquivos Ordenação, arquivos em série e sequências, classificação externa, arquivos de acesso
Leia maisSistemas Operacionais
Sistemas Operacionais Gerência de Memória Memória virtual Edson Moreno edson.moreno@pucrs.br http://www.inf.pucrs.br/~emoreno Slides baseados nas apresentações dos prof. Tiago Ferreto e Alexandra Aguiar
Leia maisAula 16. Tópicos Especiais II Banco de Dados. Prof. Dr. Dilermando Piva Jr.
16 Aula 16 Tópicos Especiais II Banco de Dados Prof. Dr. Dilermando Piva Jr. Site Disciplina: http://fundti.blogspot.com.br/ Sistemas de Arquivos O computador tem facilitado bastante a vida dos seres
Leia maisArmazenamento Secundário
Armazenamento Secundário Algoritmos e Estruturas de Dados II Prof. Ricardo J. G. B. Campello Adaptado dos Originais de: Leandro C. Cintra Maria Cristina F. de Oliveira Organização de Informação em Disco
Leia maisEvandro Deliberal Aula 03
Evandro Deliberal evandro@deljoe.com.br https://www.linkedin.com/in/evandrodeliberal http://www.deljoe.com.br/professor Aula 03 Agenda Estrutura de Banco de Dados e Infra Estrutura Infraestrutura X Estrutura
Leia mais