GSI024 - Organização e Recuperação da
|
|
- Alice Santana Miranda
- 7 Há anos
- Visualizações:
Transcrição
1 GSI024 - Organização e Recuperação da Informação Ilmério Reis da Silva ilmerio@facom.ufu.br UFU/FACOM/BSI Arquivo 5 - Peso de termos GSI024-ORI Pg:5. 1
2 Busca paramétrica usando atributos Regiões em documentos e indexação Peso de termos GSI024-ORI Pg:5. 2
3 Busca paramétrica Combina busca textual com Metadados Language = French Format = pdf Subject = Physics etc. Date = Feb 2000 GSI024-ORI Pg:5. 3
4 Busca paramétrica - Exemplo GSI024-ORI Pg:5. 4
5 Busca paramétrica - Exemplo (com busca textual) GSI024-ORI Pg:5. 5
6 Busca paramétrica/textual Seleção de atributos Filtros para definir documentos alvo Busca textual na coleção resultante GSI024-ORI Pg:5. 6
7 Índices em busca paramétrica/textual Linguagem de consulta modificada Exemplo: Encontre documentos em pdf com a frase Faculdade de computação da UFU Seleção de campos: listas invertidas por nome do atributo, incluindo técnicas de compressão Consultas do tipo wildcard: autor contêm s*trup Consultas por intervalo: data entre setembro e dezembro Técnicas de indexação de BD em geral funcionam melhor, por exemplo, Árvore- B+ (veja GSI024-ORI Pg:5. 7
8 Busca por atributos (Projeção) Exemplo: ISBN dos livros cujo autor contêm s*trup Seleção de documentos baseado em processamento de consulas wildcar Índexação direta (não invertida) de documentos GSI024-ORI Pg:5. 8
9 Regiões São partes do documento que contêm textos livres Exemplo: título, resumo, bibliografia Indexação por região permite consultas do tipo: sorting in Title AND smith in Bibliography AND recur* in Body GSI024-ORI Pg:5. 9
10 Exemplo de índice incluindo regiões no vocabulário GSI024-ORI Pg:5. 10
11 Exemplo de índice incluindo regiões na lista invertida GSI024-ORI Pg:5. 11
12 Temos agora um banco de dados? não temos transações não temos protocolos de recuperação em geral, armazenamos somente índices nosso foco é consultas orientadas a texto, não SQL GSI024-ORI Pg:5. 12
13 Além de consultas booleanas com consultas booleanas a resposta é um conjunto de documentos que atendem à consulta bom em ambiente de BD onde o usuário conhece o conjunto de dados e sabe o que quer difícil para maioria dos usuários GSI024-ORI Pg:5. 13
14 Além de consultas booleanas Objetivo retornar documentos que atendam às necessidades de informação do usuário como organizar os documentos em um ranking com relação à uma consulta atribuir um score (similaridade) para cada documento em geral é um casamento de palavras documento/consulta um adversário na web são palavras inseridas para driblar as máquinas de busca GSI024-ORI Pg:5. 14
15 Score baseado em pesos na consulta Score = 0.6 < sorting in T itle > < sorting in Abstract > < sorting in Body > < sorting in Boldface > Neste caso, quais as possibilidades de Score? Um problema com essa abordagem é como estabelecer pesos na consulta. GSI024-ORI Pg:5. 15
16 Consultas textuais Como interpretar a consulta bill of rights Não há conectivos lógicos Alguns documentos relevantes podem não conter alguns termos da consulta GSI024-ORI Pg:5. 16
17 Casamento documento x consulta Um documento pode ser representado como um conjunto de termos A consulta também pode ser representada como um conjunto de termos score = documento consulta GSI024-ORI Pg:5. 17
18 Casamento documento x consulta Problemas não considera freqüencia de termos nos documentos não considera freqüencia de termos na coleção não considera tamanho do documento GSI024-ORI Pg:5. 18
19 Casamento documento x consulta Normalização Coeficiente de Jacard Cosseno documento consulta documento consulta documento consulta documento consulta GSI024-ORI Pg:5. 19
20 Casamento documento x consulta Próximos passos Até aqui: posição e sobreposição de termos Próximo: medir o quanto um documento fala sobre o assunto da consulta Se possui grande quantidade de termos da consulta deve ser relevante. GSI024-ORI Pg:5. 20
21 Documento como vetor de termos Espaço N M GSI024-ORI Pg:5. 21
22 Documento como conjunto (ou vetor) de termos Problemas Documento 1: John is quicker than Mary Documento 2: Mary is quicker than John Vocabulário: is john mary quicker than d 1 = d 2 = Como diferenciar? GSI024-ORI Pg:5. 22
23 Problema com freqüencia de termos Seja a consulta: ides of march ides ocorre somente na peça Julius Caesar, 5 ocorrências march ocorre em várias of ocorre em todas Usando somente freqüencia (número de ocorrências), a que tiver mais ofs provavelmente ocupará o topo do ranking GSI024-ORI Pg:5. 23
24 Freqüencia do termo (tf) documentos grandes são favorecidos podemos normalizar os documentos alternativas usadas para peso baseado em tf contagem direta: wf t,d = tf t,d ou { 0 se tf = 0 wf t,d = log tf t,d cc GSI024-ORI Pg:5. 24
25 Casamento consulta/documento baseado em tf Score baseado em soma sobre termos da consulta score = t q tf t,q pode ser combinado com regiões pode-se usar wf t,d em substituição a tf mas ainda não considera freqüencia do termo na coleção um termo raro deve ser mais discriminante que um termo comum? no exemplo, ides é raro e of comun. GSI024-ORI Pg:5. 25
26 Peso do termo deve considerar características genéricas Qual termo abaixo diz mais sobre o assunto de um documento? 10 ocorrências de hernia 10 ocorrências de the Como atenuar o peso de termos muito comuns? o que é um termo comum? observar a ocorrência do termo na coleção GSI024-ORI Pg:5. 26
27 Freqüencia de documentos seja df o número de documentos da coleção que contêm o termo é diferente da freqüencia do termo na coleção (cf) Exemplo Termo cf df ferrari insurance como usar df? GSI024-ORI Pg:5. 27
28 Inverso da freqüencia de documentos idf o idf é uma medida inversa da freqüencia de documentos o idf mede a quantidade de informação de um termo em uma coleção a motivação é: quanto mais raro for o termo maior é sua importância em caracterizar um documento poderia ser idf t = 1 df t, mas a versão mais utilizada é idf t = log N df t, onde N é o número de documentos da coleção e ddf t é o número de documentos onte o termo ocorre. justificativa teórica baseada no conceito de entropia, conforme Kishore Papineni, GSI024-ORI Pg:5. 28
29 Pesagem tf idf (ou tfidf) Peso do i-ésimo termo (k i ) no j-ésimo documento (d j ) é: onde, w i,j = tf i,j log N df i tf i,j : freqüencia do termo k i no documento d j N : total de documentos na coleção df i : total de documentos que contêm o termo k i aumenta com o número de ocorrências do termo no documento aumenta com a raridade do termo entre os documentos Qual o peso de um termo que ocorre em todos os documentos? GSI024-ORI Pg:5. 29
30 Matriz de pesos baseada em tf.idf GSI024-ORI Pg:5. 30
31 Documento como vetor de termos cada documento pode ser visto como um vetor de termos (coluna na matriz) cada termo é um eixo no espaço vetorial documentos são vetores nesse espaço o espaço tem milhares de eixos (dimensões) a matriz nos dá também a opção de vetores de termos em um espaço de documentos GSI024-ORI Pg:5. 31
32 Resumo Busca parametrizada Score por regiões Peso de termos tf.idf Documentos como vetores em um espaço vetorial de termos GSI024-ORI Pg:5. 32
GSI024 - Organização e Recuperação da
GSI024 - Organização e Recuperação da Informação Ilmério Reis da Silva ilmerio@facom.ufu.br UFU/FACOM/BSI Arquivo 6 - Modelo Vetorial GSI024-ORI Pg:6. 1 Ranking baseado no modelo vetorial Considerações
Leia maisLista de exercícios 2 Recuperação de Informação Textual
Lista de exercícios 2 Recuperação de Informação Textual 2 de dezembro de 2015 0.1 O que é o modelo bag-of-words? Porque ele é uma simplificação? Dê um exemplo em que ele estaria incorreto. 0.2 O que é
Leia maisProfª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni
Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Motivação e Objetivos Etapas do Desenvolvimento de um Sistema de Recuperação de Informações (SRI): Pré-processamento; Representação; Extração
Leia maisMINERAÇÃO DE DADOS. Thiago Marzagão MINERAÇÃO DE TEXTOS. marzagao.1@osu.edu. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25
MINERAÇÃO DE DADOS Thiago Marzagão marzagao.1@osu.edu MINERAÇÃO DE TEXTOS Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25 transformando textos em dados Documento 1: "Não trabalho para ter clientes;
Leia maisMineração de Textos. Mineração de Textos
Mineração de Textos Os estudos em Aprendizado de Máquina normalmente trabalham com dados estruturados Entretanto, uma grande quantidade de informação é armazenada em textos, que são dados semi-estruturados
Leia maisTerm weighting: outras ideias
Term weighting: outras ideias Term Weighting i Diversas são as abordagens. Vamos discutir algumas ideias mais simples, porém conhecidas. i Abordagens 4 Pesos binários (já vimos) 4 Frequência (já vimos)
Leia maisVisualização de Texto e Documento
Visualização de Texto e Documento SCC5836 Visualização Computacional Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação
Leia maisDATA MINING & MACHINE LEARNING (I) Thiago Marzagão
DATA MINING & MACHINE LEARNING (I) Thiago Marzagão transformando textos em dados Documento 1: Não trabalho para ter clientes; tenho clientes para poder trabalhar. Documento 2: Não se pode forçar a inteligência
Leia maisArquivos invertidos 39
Arquivos invertidos 39 Arquivos invertidos É um mecanismo que utiliza palavras para indexar uma coleção de documentos a fim de facilitar a busca e a recuperação Estruturas de um arquivo invertido Vocabulário
Leia maisUniversidade do Sul de Santa Catarina Ciência da Computação Aula 09 Introdução a Análise de Textos Prof. Max Pereira
Universidade do Sul de Santa Catarina Ciência da Computação Técnicasde InteligênciaArtificial Aula 09 Introdução a Análise de Textos Prof. Max Pereira Processamento de Linguagem Natural Conjunto de técnicas
Leia maisPonderação de termos
Ponderação de termos Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Parte da ideia de que, dentro
Leia maisModelo Espaço Vetorial. Mariella Berger
Modelo Espaço Vetorial Mariella Berger Agenda Introdução Atribuição de Pesos Frequência TF-IDF Similaridade Exemplo Vantagens e Desvantagens Modelo Espaço Vetorial Introdução Modelo Espaço Vetorial O modelo
Leia maisMelhorando a Recuperação de Informação
Recuperação de Informação e Web Mining 1 Melhorando a Recuperação de Informação O modelo de espaço vetorial Utiliza pesos para termos Permite o ranqueamento dos resultados Pode reduzir a dimensão do espaço
Leia maisSegundo trabalho de Organização e Recuperação da Informação
FACOM- UFU Professor: Wendel Melo Segundo trabalho de Organização e Recuperação da Informação 2018-02 Descrição Este trabalho consiste em duas etapas: 1. Implementação de cálculo da ponderação TF-IDF,
Leia maisRealimentação de Relevância
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Ciclo de realimentação onde uma consulta q recebida do usuário é transformada em uma consulta modificada
Leia mais4 Recuperação de Informação
4 Recuperação de Informação No presente capítulo são apresentados os fundamentos da área de Recuperação de Informação utilizados em Mineração de Textos, como por exemplo, os modelos de representação de
Leia maisORI: Pontuação e o modelo de espaço vetorial
1/1 ORI: Pontuação e o modelo de espaço vetorial Marcelo Keese Albertini Faculdade de Computação Universidade Federal de Uberlândia Índice 2/1 3/1 Veremos hoje Ordenando resultados de busca: importância
Leia maisOrganizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Pré-processamento de documentos Organização e Recuperação de Informação(GSI521) Introdução O pré-processamento de
Leia maisOrganizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Modelo Vetorial Organização e Recuperação de Informação(GSI521) Motivação Discutido nos seguintes trabalhos: K. Spark
Leia maisRecuperação de Informações por Álgebra Linear Computacional
Recuperação de Informações por Álgebra Linear Computacional MAC499 - Projeto de Iniciação Científica Aluna: Ellen Hidemi Fukuda Orientador: Paulo José da Silva e Silva Departamento de Ciência da Computação
Leia maisRecuperação de Dado X Informação. Gerenciamento de Dados e Informação. Histórico. Recuperação de Informação. Histórico. Histórico
Recuperação de Dado X Informação Gerenciamento de Dados e Informação Recuperação de Informação Fernando Fonseca Ana Carolina Robson Fidalgo Comparação (matching) Recuperação de Dados Exata Recuperação
Leia maisIndexação e Modelos Clássicos
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Construção de um Sistema de Busca 1ª Etapa: Definir
Leia maisOrganizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Modelosde RI e o ModeloBooleano Organização e Recuperação de Informação(GSI521) Tópicos Modelagem em RI; Caracterização
Leia maisAprendizado de Supervisionado
Aprendizado de Supervisionado Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Padronizando e Normalizando os Atributos 2. Tipos de Atributos 3. Representação Textual 1 Padronizando e
Leia maisO modelo espaço de vetores. vetorial. Marcelo Keese Albertini. Faculdade de Computação - UFU. O modelo de espaço vetorial 1 / 25
Recuperação de Informação: O modelo de espaço vetorial Marcelo Keese Albertini Faculdade de Computação - UFU O modelo de espaço vetorial 1 / 25 Veremos hoje Modelo de espaço de vetores: representação vetorial
Leia maisO modelo espaço de vetores. vetorial. Marcelo Keese Albertini. Faculdade de Computação - UFU 12/03/2013. O modelo de espaço vetorial 1 / 27
Recuperação de Informação: O modelo de espaço vetorial Marcelo Keese Albertini Faculdade de Computação - UFU 12/03/2013 O modelo de espaço vetorial 1 / 27 Veremos hoje Modelo de espaço de vetores: representação
Leia maistextos documentos semi-estruturado
1 Mineração de Textos Os estudos em Aprendizado de Máquina normalmente trabalham com dados estruturados Entretanto, uma grande quantidade de informação é armazenada em textos, que são dados semiestruturados
Leia maisOrganizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Índice invertido Organização e Recuperação de Informação(GSI521) Laboratório 1- Pergunta Como os termos foram associados
Leia maisSistemas de Banco de Dados
Sistemas de Banco de Dados Fundamentos em Bancos de Dados Relacionais Wladmir Cardoso Brandão www.wladmirbrandao.com Departamento de Ciência da Computação (DCC) Instituto de Ciências Exatas e Informática
Leia maisOrganização e Recuperação da Informação
GSI024 Organização e Recuperação da Informação Introdução Ilmério Reis da Silva ilmerio@facom.ufu.br www.facom.ufu.br/~ilmerio/ori UFU/FACOM - 2011/1 Arquivo 1a Introdução Porque RI? Problemas da solução
Leia maisOutline. 2 Abordagem probabiĺıstica para ORI. 3 Teoria de probabilidades. 4 Princípio de ranking probabiĺıstico
Outline 1 Recapitulação 2 Abordagem probabiĺıstica para ORI 3 Teoria de probabilidades 4 Princípio de ranking probabiĺıstico 5 Apreciação&Extensões Modelo probabiĺıstico 1 / 47 Retorno de relevância: ideia
Leia maisNews Clipping. Como calcular ângulos entre notícias pode ajudar na prevenção à lavagem de dinheiro. Willian Gigliotti
News Clipping Como calcular ângulos entre notícias pode ajudar na prevenção à lavagem de dinheiro Willian Gigliotti wgigliotti@gmail.com Departamento de Ciências da Computação Instituto de Matemática e
Leia maisRecuperação de Informações
Recuperação de Informações Ana Carolina Salgado & Fernando Fonseca Comparação (matching) Dados Inferência Modelo Ling Consulta Esp da Consulta Recuperação de Dado X Informação Recuperação de Recuperação
Leia maisABD Arquivos e Bibliotecas Digitais
ABD Arquivos e Bibliotecas Digitais Abril 2008 Parte VII Dublin Core Fontes dublincore.org/ http://dublincore.org/usage/documents/principles/ http://dublincore.org/documents/dc-rdf/ Objectivo do Dublin
Leia maisIntrodução à Banco de Dados
Introdução à Banco de Dados Disciplina de Sistemas de Banco de Dados Prof. Marcos Antonio Schreiner /08/2015 Banco de dados Definição Coleção de dados relacionados. Fatos conhecidos que podem ser armazenados.
Leia maisUma ferramenta para expansão do vocabulário com base em coocorrência
Resumos Expandidos: XI Mostra de Estagiários e Bolsistas... 11 Uma ferramenta para expansão do vocabulário com base em coocorrência Exupério Lédo Silva Júnior 1 Roberta Akemi Sinoara 2 Solange Oliveira
Leia maisOs efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais
72 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Os efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais Renan Gomes Pereira¹ Maria Fernanda Moura²
Leia maisCurso: Banco de Dados I. Conceitos Iniciais
Curso: Conceitos Iniciais Discussão inicial O que são Bancos de Dados? Quais os programas de Bancos de Dados mais conhecidos no mercado? Quais as vantagens do uso de Bancos de Dados nas empresas? Como
Leia maisGBC053 Gerenciamento de Banco de Dados. Plano de Curso e Introdução. Ilmério Reis da Silva UFU/FACOM/BCC
GBC053 Gerenciamento de Banco de Dados Plano de Curso e Introdução Ilmério Reis da Silva ilmerio@ufu.br www.facom.ufu.br/~ilmerio/gbd UFU/FACOM/BCC Plano de Curso Ementa Arquitetura de um Sistema de Gerenciamento
Leia maisSegundo trabalho de Organização e Recuperação da Informação FACOM- UFU Professor: Wendel Melo
Segundo trabalho de Organização e Recuperação da Informação 2017-02 FACOM- UFU Professor: Wendel Melo Descrição O trabalho consiste na implementação de um programa que, a partir da construção do índice
Leia maisDescoberta de conhecimento em redes sociais e bases de dados públicas
Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:
Leia maisUm estudo sobre diferentes modelos de Recuperação de Informação em documentos semi-estruturados (XML) -
Um estudo sobre diferentes modelos de Recuperação de Informação em documentos semi-estruturados (XML) - Implementação, Análise, Avaliação e Comparação Autor: Mirella Silva Junqueira 1, Orientador: Prof.
Leia maisIntrodução XML. Vanessa Braganholo
Introdução XML Vanessa Braganholo {vanessa@ic.uff.br} Curso baseado em mini-cursos apresentados no SBBD. Autores: Carlos Heuser, Carina Dorneles e Vanessa Braganholo O que é XML? } XML = extensible Markup
Leia maisO Modelo e a Álgebra Relacional
O Modelo e a Álgebra Relacional O Modelo Relacional Modelo de dados, que se baseia no princípio em que todos os dados estão guardados em tabelas Baseado em lógica de predicados e na teoria de conjuntos.
Leia maisDIAGRAMAS DE CLASSE UML
DIAGRAMAS DE CLASSE UML Projeto Detalhado de Software (PDS) Profa. Cynthia Pinheiro Antes de mais nada... Calendário de Reposições Aula 1: 27/10/2017, 8h-10h, Sala 8 Aula 2: A verificar Aula 3: A verificar
Leia maisSGBDs NoSQL Modelos e Sistemas de Colunas e Grafos. Aluno: Jorge Dias Disciplina: IN940
SGBDs NoSQL Modelos e Sistemas de Colunas e Grafos Aluno: Jorge Dias Disciplina: IN940 Roteiro o Introdução o Motivação o NoSQL (Características) o Comparativo de SGBDs NoSQL x SGBDs Relacionais o Tipos
Leia maisLinguagem Python. Processamento Estatístico da Linguagem Natural. Barra invertida em strings. Strings. Aspas triplas. Operações com Strings
Processamento Estatístico da Linguagem Natural Aula 7 Professora Bianca (Sala 302 Bloco E) bianca@ic.uff.br http://www.ic.uff.br/~bianca/peln/ Linguagem Python Introdução Características de Python Rodando
Leia maisLinguagem Python. Inteligência Artificial. Características de Python. Importando módulos. Módulos. Usando Python no modo interativo
Linguagem Python Inteligência Artificial Aula 7 Profª Bianca Zadrozny http://www.ic.uff.br/~bianca/ia Introdução Características de Python Rodando programas Módulos Tipos básicos Números e variáveis Strings
Leia maisTECNOLOGIA DE GRUPO. Introdução Aplicação da razão associação de objetos similares Biólogos; Bibliotecários classificação Manufatura
Introdução Aplicação da razão associação de objetos similares Biólogos; Bibliotecários classificação Manufatura Uma família de projeto Tecnologia de Grupo (GT) a percepção de que muitos problemas são similares,
Leia maisCompressão de Imagens Usando Wavelets: Uma Solução WEB para a Codificação EZW Utilizando JAVA. Utilizando JAVA. TCC - Monografia
Compressão de Imagens Usando Wavelets: Uma Solução WEB para a Codificação EZW Utilizando JAVA TCC - Monografia Wanderson Câmara dos Santos Orientador : Prof. Dr. Luiz Felipe de Queiroz Silveira 1 Departamento
Leia maisBanco de Dados Geográficos
Banco de Dados Geográficos Valéria Gonçalves Soares Professora DIMAp/UFRN Conteúdo Bancos de Dados Geográficos 1. Conceitos e Definições Características Gerais 2. Modelos de Dados Geográficos Modelos de
Leia maisProcessamento de Malhas Poligonais
Processamento de Malhas Poligonais Tópicos Avançados em Computação Visual e Interfaces I Prof.: Marcos Lage www.ic.uff.br/~mlage mlage@ic.uff.br Conteúdo: Notas de Aula Curvas 06/09/2015 Processamento
Leia mais3 Recuperação de Informações Textuais
3 Recuperação de Informações Textuais Tudo deveria se tornar o mais simples possível, mas não simplificado. Albert Einstein Sistemas tradicionais de indexação costumam utilizar-se de termos-índice, que
Leia maisCompressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso:
Compressão de Textos Estrutura de Dados II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM O volume
Leia maisTabela Hash: Índice remissivo
Capítulo 3 Tabela Hash: Índice remissivo Um índice remissivo lista os termos e tópicos que são abordados em um documento juntamente com páginas em que aparecem. É bastante comum encontrar tais índices
Leia maisRápida revisão do Modelo Relacional
Rápida revisão do Modelo Relacional Conceito de relação Tuplas e atributos Rápida revisão do Modelo Relacional Regras de integridade Entidade: Deve existir uma chave primária com valor único e não-nulo.
Leia maisAula 2 BD Introdução. Profa. Elaine Faria UFU
Aula 2 BD Introdução Profa. Elaine Faria UFU - 2017 Motivação A quantidade de informação disponível está crescendo exponencialmente Os dados e as informações tem um papel importante para as organizações
Leia mais4. Algoritmos de Busca em Vetores
Introdução à Computação II 5952011 4. Algoritmos de Busca em Vetores Prof. Renato Tinós Local: Depto. de Computação e Matemática (FFCLRP/USP) 1 Principais Tópicos 4.1. Introdução 4.2. Busca Linear 4.2.1.
Leia maisAlgoritmos e Estruturas de Dados II. Trabalho Prático 4
Algoritmos e Estruturas de Dados II Trabalho Prático 4 Entrega: 23/11/09 Devolução: 10/12/09 (sem possibilidade de entrega com atraso) Trabalho em dupla Prof. Jussara Marques de Almeida Problema 1: Construção
Leia maisMeu Google é melhor que o seu
Estrutura de Dados II Universidade Federal de Juiz de Fora 2013.3 Trabalho Prof. Jairo Francisco de Souza Meu Google é melhor que o seu 1. Problema 1: Construção do Índice Invertido para Máquinas de Busca
Leia maisBIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt
BIG DATA: UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com 70% 60% 50% 40% 30% 20%
Leia maisDocumento de Requisitos*
* Rosana T. Vaccare Braga *slides adaptados a partir do material da Profa Ellen Francine Barbosa Processo de Engenharia de Requisitos Documento de requisitos Processo de Engenharia de Requisitos Estudo
Leia maisTrabalho Prático 1. Valor: 1,0 pontos (10% da nota total) Data de Entrega: 02/05/2010
Universidade Federal de Ouro Preto Instituto de Ciências Exatas e Biológicas Programa de Pós-Graduação em Ciência da Computação Projeto e Análise de Algoritmos - 1 o semestre de 2010 Professor: David Menotti
Leia maisLaboratório de Programação A Exercícios sobre vetores e matrizes
Universidade Federal do Amazonas Instituto de Ciências Exatas Departamento de Ciência da Computação Laboratório de Programação A - 2011.1 Exercícios sobre vetores e matrizes Observação Esta lista será
Leia maisGFM015 Introdução à Computação
GFM015 Introdução à Computação Noções básicas sobre os componentes de microcomputadores (cont...) - Terminologia: Sw, Hw, Programas, Bit, Byte e Códigos Ilmério Reis da Silva ilmerio@facom.ufu.br www.facom.ufu.br/~ilmerio/ic
Leia maisEstrutura de dados 1. Processamento de Cadeias de Caracteres
Estrutura de dados 1 Processamento de Cadeias de Caracteres Casamento de Cadeias Casamento de Cadeias Casamento Exato Casamento Aproximado Compressão Por Que Usar Compressão Compressão de Textos em Linguagem
Leia maisProgramação Estruturada Orientada a Objetos
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO NORTE Programação Estruturada Orientada a Objetos Docente: Éberton da Silva Marinho e-mail: ebertonsm@gmail.com eberton.marinho@gmail.com
Leia maisSistema de Banco de Dados. UNIDADE 1 Introdução aos Sistemas de Bancos de Dados Professor: Armando Hage
Sistema de Banco de Dados UNIDADE 1 Introdução aos Sistemas de Bancos de Dados Professor: Armando Hage Resumo da Unidade Banco de dados BD SGBD Objetivo Visão Geral Abstração Modelo de Dados Entidade Relaciomento(ER)
Leia maisSISTEMA PARA RECUPERAÇÃO DE INFORMAÇÃO DE DOWNLOADS DE SOFTWARES
SISTEMA PARA RECUPERAÇÃO DE INFORMAÇÃO DE DOWNLOADS DE SOFTWARES Elzo Soares Pereira Filho, Matheus Rossi de Oliveira Costa, Vinícius Lobo Silva, Luciene Chagas de Oliveira, UNIUBE Universidade de Uberaba
Leia maisI-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos
17 I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos Renan Gomes Pereira 1 Maria Fernanda Moura 2 Resumo: O objetivo deste trabalho é apresentar a ferramenta I-Preproc,
Leia maisIntrodução. Introdução. Álgebra Relacional. Linguagens formais de Consulta Modelo Relacional. O que foi visto até agora...
Ciência da Computação GBC043 Sistemas de Banco de Dados Linguagens formais de Consulta Modelo Relacional Profa. Maria Camila Nardini Barioni camila.barioni@ufu.br Bloco B - sala 1B137 1 semestre de 2019
Leia maisFundamentos IV. Introdução a OCTAVE. Clarimar Coelho. Departamento de Computação. August 11, 2014
Fundamentos IV Introdução a OCTAVE Clarimar Coelho Departamento de Computação August 11, 2014 Clarimar, Departamento de Computação Aula 1, Introdução a OCTAVE 1/42 Introdução Computação matemática integrada
Leia mais03/07/2017. Modelo de Recuperação de Informação
Modelo de Recuperação de Informação Modelo de Recuperação de Informação Um modelo de recuperação de informação é a especificação formal de três elementos: a representação dos documentos; a representação
Leia maisAprendizado de Máquina (Machine Learning)
Ciência da Computação (Machine Learning) Aula 02 Representação dos dados Pré-processamento Max Pereira Tipo de Dados Os atributos usados para descrever objetos de dados podem ser de diferentes tipos: Quantitativos
Leia maisIntrodução. descrever os tipos de interfaces e linguagens oferecidas por um SGBD. mostrar o ambiente de programas dos SGBD s
Introdução Contribuição do Capítulo 2: discutir modelos de dados definir conceitos de esquemas e instâncias descrever os tipos de interfaces e linguagens oferecidas por um SGBD mostrar o ambiente de programas
Leia maisSistema de Informação Geográfica
Sistema de Informação Geográfica Curso de Sistemas de Informação Karla Donato Fook karladf@ifma.edu.br DESU / DAI 2016 Arquiteturas SIG 2 1 Tipos de Implementação 3 Tipos de Implementação Em geral, um
Leia maisBancos de dados. Sistemas de bancos de dados. Professor Emiliano S. Monteiro
Bancos de dados Sistemas de bancos de dados Professor Emiliano S. Monteiro Introdução Apresentação do professor Apresentação da disciplina Avaliações Conceitos Banco de dados Segundo C.J. Date : "O sistema
Leia maisIntrodução a Ciência da Computação Estrutura e Organização das Informações PROFESSORA CINTIA CAETANO
Introdução a Ciência da Computação Estrutura e Organização das Informações PROFESSORA CINTIA CAETANO Introdução A qualidade do armazenamento dos dados, permitem uma melhor extração de informações, e consequentemente,
Leia maisTGR BCC Representação Computacional de Grafos. Prof. Ricardo José Pfitscher
TGR BCC Representação Computacional de Grafos Prof. Ricardo José Pfitscher Cronograma Representação Matriz de djacências Lista de djacências Matriz de Incidências Representação Como podemos representar
Leia maisLevantamento de Classes
Levantamento de Classes Conceito de Classe e Objeto Principais primitivas ou elementos de composição de softwares orientados a objetos Objeto elemento componente de um sistema computacional entidade que
Leia maisModelo Booleano Wendel Melo
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Modelo simples; Baseado em teoria dos conjuntos
Leia maisUniversidade Federal de Mato Grosso do Sul. Lista de Exercícios 2
Universidade Federal de Mato Grosso do Sul Facom - Faculdade de Computação Programação de Computadores I - Engenharia Ambiental Lista de Exercícios 2 Exercícios usando if 1. Escreva um programa que leia
Leia maisAula 8 BD1 Álgebra Relacional. Profa. Elaine Faria UFU
Aula 8 BD1 Álgebra Relacional Profa. Elaine Faria UFU - 2018 Introdução Linguagens de consulta formais associadas ao modelo relacional Álgebra Usa uma coleção de operadores e cada consulta descreve um
Leia maisBem vindo à semana 14! Tema central: Banco de Dados
Bem vindo à semana 14! Tema central: Banco de Dados Em todas as atividades que exercemos, sejam sociais ou profissionais, precisamos de dados. Para telefonar para um amigo, necessitamos de seu nome e telefone;
Leia maisPedro Paulo Balage Filho
Interface Web para o projeto: Sumarização Automática Multidocumento para o Português do Brasil com Base na Teoria de Estruturação Multidocumento CST (Cross-documentStructure Theory) Pedro Paulo Balage
Leia mais1 OBJETIVOS 2 HORÁRIO DE AULAS 3 PROGRAMA
1 OBJETIVOS Curso de Especialização em Engenharia de Software Universidade Federal de Minas Gerais Departamento de Ciência da Computação Estruturas de Dados Fundamentais Professor Roberto da Silva Bigonha
Leia maisDisciplina de Algoritmos e Programação
Disciplina de Algoritmos e Programação Atividades Plano de ensino Conteúdos da disciplina, definição das datas, critérios de avaliação e bibliografias Início da matéria Conceito e definição de algoritmos
Leia maisAula 7 Medidas de Distância. Profa. Elaine Faria UFU
Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André
Leia maisCapítulo 4. Comitê BAS 35
4 Comitê BAS Devido à flexibilidade do algoritmo BAS, que aceita qualquer distribuição inicial para os exemplos, diversas heurísticas podem ser implementadas com o objetivo de criar classificadores de
Leia maisRecuperação de Informação
Recuperação de Informação Avaliação de Desempenho de Sistemas de Recuperação de Informação Renato Fernandes Corrêa 1 Para que avaliar? Existem muitos modelos de RI, mas qual é o melhor? Qual a melhor escolha
Leia maisAplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+
Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo
Leia maisExercícios: Vetores e Matrizes
Universidade Federal de Uberlândia - UFU Faculdade de Computação - FACOM Lista de exercícios de programação em linguagem C Exercícios: Vetores e Matrizes 1 Vetores 1. Faça um programa que possua um vetor
Leia maisMCZA Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte III
MCZA017-13 Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte III Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2018 1 Bibliografia Daniel Jurafsky & James H. Martin.
Leia maisOrientação prática para preenchimento da Planilha de Contagem NESMA (EFP)
Orientação prática para preenchimento da Planilha de Contagem NESMA (EFP) 1) A planilha está dividida em três partes: Contagem, Funções e Sumário (veja figura abaixo). Cada aba possui campos específicos
Leia maisBanco de Dados. SGBDs. Professor: Charles Leite
Banco de Dados SGBDs Professor: Charles Leite Sistemas de BD Vimos que um BANCO DE DADOS representa uma coleção de dados com algumas propriedades implícitas Por exemplo, um BD constitui os dados relacionados
Leia maisInformática. 01- A figura abaixo mostra um texto sendo editado no BrOffice.org Writer.
Informática 01- A figura abaixo mostra um texto sendo editado no BrOffice.org Writer. Se o usuário der um clique duplo sobre a palavra intercâmbio, o Writer selecionará apenas a palavra. Se, ao invés de
Leia maisXML (extensible Markup Language)
Sumário 1. Introdução a Aplicações Não-Convencionais 2. Revisão de Modelagem Conceitual 3. BD Orientado a Objetos (BDOO) 4. BD Objeto-Relacional (BDOR) 5. BD Temporal (BDT) 6. BD Geográfico (BDG) 7. BD
Leia maisMetodologia LILACS. Objetivo: Conhecer a metodologia LILACS e seus componentes.
Metodologia LILACS Objetivo: Conhecer a metodologia LILACS e seus componentes. Conteúdo desta aula Definição de Metodologia LILACS Normas, manuais, guias Aplicativos e ferramentas Importância de aplicar
Leia maisBanco de Dados I. Sejam bem-vindos! Prof. Fred Lucena. 1
Banco de Dados I Sejam bem-vindos! 1 Bibliografia Básica COUGO, Paulo. Modelagem conceitual e projeto de banco de dados. 3.ed. Rio de Janeiro: F & W Publications, 1997. 284p. HEUSER, Carlos Alberto. Projeto
Leia mais