12/07/2017. Período 4: Indexação automática. processamento da linguagem natural. Indexação
|
|
- Artur Casado Antas
- 5 Há anos
- Visualizações:
Transcrição
1 Perío 4: Indexação automática processamento da linguagem natural Indexação 1
2 Indexação A indexação de um cumento visa representar o seu conteú temático por meio de um conjunto de termos com o objetivo de sintetizar o seu conteú, ressaltan o que lhe é essencial. Os termos de indexação servem também como pontos de acesso mediante os quais o cumento é localiza e recupera em um sistema de informação. Lancaster (2004, p.18) distingue is tipos de indexação: indexação por extração A seleção s termos fica restrita ao contexto próprio cumento. O indexar, utilizan critérios institucionais e pessoais, seleciona no texto palavras que serão utilizas para representar o cumento. indexação por atribuição. Utiliza-se de um elemento externo ao cumento, um conjunto de termos previamente definis e normalizas (léxico) cuja complexidade pode variar deste uma lista de cabeçalhos de assunto até um tesauro ou uma ontologia. Após a leitura texto, o indexar escolhe os termos mais adequas para representar o conteú informacional cumento. Indexação automática 2
3 Indexação Automática Embora a prática da indexação possa ser regulada por políticas e princípios institucionais, o processo de indexação manual é dependente de critérios subjetivos e pessoais relacionas à formação e experiência indexar. Assim, o tempo despendi e a qualidade da indexação ficam fortemente atrelas a fatores não controláveis, o que pode afetar o custo desse processo. As dificuldades inerentes à indexação manual e a grande quantidade de cumentos publicas e disponibilizas, justificaram estus que buscavam soluções alternativas para auxiliar o indexar no exercício de sua atividade. As primeiras pesquisas em indexação automática aconteceram no final s anos de A popularização da microinformática a partir s anos de 1980, mas principalmente o surgimento da Web nos anos de 1990 fez com que o nível de interesse nas pesquisas sobre indexação automática permanecesse praticamente constante até os dias de hoje. Indexação Automática Vantagens: baixo custo da indexação automática; facilidade de aplicação a grandes conjuntos de cumentos homogeneidade desse processo quan realizas por algoritmos computacionais. O resulta da indexação realizada por seres humanos pode variar de um indexar para outro, bem como de um mesmo indexar em momentos diferentes. Um sistema computacional irá realizar a indexação de maneira uniforme, utilizan sempre os mesmos critérios para o qual foi programa, independentemente da quantidade de cumentos ou de qualquer fator externo (ANDERSON; PEREZ-CARBALLO, 2001): 3
4 Indexação Automática: tipos De forma semelhante à sua classificação da indexação manual, Lancaster (2004, p.285) identifica is tipos de indexação automática: indexação por extração automática realizada geralmente por meio de cálculos matemáticos de frequência das palavras encontradas no texto de um cumento. indexação por atribuição automática é utiliza um elemento externo aos textos com o objetivo de normalizar os termos de indexação atribuís aos cumentos. Indexação por extração automática 4
5 A maioria s métos de indexação automática busca selecionar termos s próprios textos s cumentos; Tais métos pressupõem que os significantes, as palavras, são os únicos elementos passíveis de serem operas computacionalmente em um texto.; Assim, os termos de indexação são resultantes de cálculos estatísticos e sucessivas operações algorítmicas aplicadas às palavras de um ou de um conjunto de textos. Na literatura, é recorrente a referência a George Kingsley Zipf ( ) como pioneiro nos estus estatísticos texto. Linguista da Universidade de Harvard, Zipf apresentou a sua lei empírica na obra Human Behaviour and the Principle of Least Effort (ZIPF, 1949). Analisan a obra Ulisses, de James Joyce, Zipf observou que em um texto suficientemente longo, se listarmos as palavras em ordem decrescente de frequência, a posição de cada palavra multiplicada por sua frequência resulta um valor praticamente constante 5
6 Posição Palavra Frequência Posição x Frequência 1 A B C D E 2 10 Zipf Law Utilizan a lei de Zipf como ponto de partida, Hans Peter Luhn sugeriu que certas palavras poderiam ser automaticamente extraídas de um texto a fim de representar o próprio texto. Porém, nem todas as palavras seriam bons termos de indexação e nem tos os termos de indexação contribuem igualitariamente na representação conteú informacional texto. Luhn propôs técnicas para identificar e atribuir pesos aos termos de indexação. Palavras mais significativas são as palavras de frequência média. As palavras com frequência muito baixa seriam pouco significativas na representação cumento; As palavras muito frequentes teriam baixo poder para representar o conteú informacional cumento. 6
7 Indexação por extração automática f = frequência r = posição relativa da palavra (ranking) PROCESSO 1. Identificação das palavras (tokens) texto; 2. Remoção de palavras muito frequentes que são insuficientemente específicas para representar o conteú cumento (stop words); 3. Redução das palavras a uma forma normalizada ou ao seu radical (stemming); 4. Formação de termos compostos como termos de indexação; 5. Cálculo s pesos de cada termo; 7
8 Tokenizer Uma viagem pelas trilhas da Mata Atlântica, um s biomas mais conhecis Brasil e que possui uma das maiores biodiversidades mun. Essa é a proposta estande Projeto Biomas, desenvolvi pela Confederação da Agricultura e Pecuária Brasil (CNA) e a Empresa Brasileira de Pesquisa Agropecuária (Embrapa), em parceria com o Instituto Capixaba de Pesquisa, Assistência Técnica e Extensão Rural (Incaper), durante a 10ª Semana Estadual de Ciência e Tecnologia, que acontece entre 22 a 25 de outubro, em Vitória - Espírito Santo. No estande Projeto Biomas, os visitantes conhecerão mudas de plantas nativas da Mata Atlântica, como a aroeira, e produtos da floresta, como a juçara, a qual poderá ser degustada. Para as crianças, haverá telas interativas com jogos didáticos sobre a Mata Atlântica. Para os adultos, serão disponibilizadas mudas que estão sen cultivadas na área experimental projeto. No espaço, também haverá um pequeno laboratório, com caixas de insetos com espécies da Mata Atlântica e extração de nutrientes de amostras de solo retiradas local onde é desenvolvi o projeto. O Projeto Biomas tem o objetivo de avaliar e viabilizar soluções com árvores para a proteção, recuperação e o uso sustentável de propriedades rurais nos seis biomas brasileiros. O Espírito Santo, por meio Incaper, coordena as ações bioma Mata Atlântica, contribuin com pesquisas científicas, respostas e modelos possíveis de serem replicas, que promovam a inserção da árvore na propriedade rural, explicou a coordenara bioma Mata Atlântica, Fabiana Gomes Ruas. Os projetos de pesquisa desse bioma estão distribuís na área experimental localizada na Fazenda São Marcos, e na Área de Referência da Reserva Natural Vale, em Sooretama. Uma viagem pelas trilhas da Mata Atlântica um s biomas mais conhecis Brasil e que possui uma das maiores biodiversidade s mun Essa é a proposta estande Projeto Biomas desenvolvi pela Confederação da Agricultura e Pecuária Brasil... Tokenizer Objetivo Identificar e isolar os tokens de um texto; Algumas dificuldades Abreviações, Siglas e Acrônimos Célula Tronco - CT Ciência da Informação CI UNESP Universidade Estadual Paulista Utilização de hifens; MS-DOS; couve-flor; célula-tronco; Números e Datas; Transformações Letras maiúsculas e minúsculas (?) Nomes próprios Abreviações, siglas e acrônimos transformar em seu formato completo utilizan um dicionário; 8
9 Stop List Uma viagem pelas trilhas da Mata Atlântica um s biomas mais conhecis Brasil e que possui uma das maiores biodiversidades mun Essa é a proposta estande Projeto Biomas desenvolvi pela Confederação da Agricultura E Pecuária Brasil... a da das s e é essa mais pela pelas que um uma... Lista de Stopwords (Stoplist) Uma viagem pelas trilhas da Mata Atlântica um s biomas mais conhecis Brasil e que possui uma das maiores biodiversidades mun Essa é a proposta estande Projeto Biomas desenvolvi pela Confederação da Agricultura e Pecuária Brasil... Stop List As palavras de um texto não possuem o mesmo valor semântico. StopList (dicionário negativo) é uma lista de palavras (StopWords) que não podem ser escolhidas como termos de indexação; A eliminação das stopwords traz a vantagem de melhorar desempenho no processamento das demais palavras texto e uma redução espaço de armazenamento; 9
10 Stemming Livro Livros Andar Andei Andamos Andarei Nadar Nadan Nadarei Nau Nadei Livro Andar ou And Nadar ou Nad Stemming É o processo de redução das variantes morfológicas das palavras para seus radicais. Eliminação de afixos (prefixos e sufixos) das palavras; Assume-se que palavras com o mesmo radical são semanticamente relacionadas e possuem o mesmo significa; Na recuperação de informação tem por objetivo melhorar os resultas de busca, padronizan tanto os termos de indexação como os termos de busca; Stemming também reduz o número de termos de indexação mapean as variações morfológicas s termos para uma forma padronizada; 10
11 Termos Compostos Termos compostos carregam maior semântica que as palavras que os compõem. Principalmente os sintagmas nominais são bons indicares conteú informacional texto; Banco de das Base de conhecimento Ciência da Informação A utilização de termos compostos na indexação melhora a precisão da recuperação de informação, pois são menos ambíguos. Termos Compostos Reconhecimento de Nomes Próprios Nome de pessoas ou empresas, marcas de produtos, locais, moedas É importante para muitas aplicação de recuperação Métos Dicionário de nomes Letras maiúsculas Algumas palavras indicativas como Ltda, SA, Sr., Sra. 11
12 Complexidade da língua Abrin um parêntesis Anáfora É um elemento linguístico que estabelece uma referência dependente com um termo antecedente; Catáfora João está ente. Eu o visitei na semana passada. Ana comprou um cão. O animal já conhece tos os cantos da casa. Os experimentos foram realizas em um ambiente controla. Eles comprovaram a eficácia méto. Termo ou expressão que faz referência a um termo subsequente, estabelecen com ele uma dependência. A irmã olhou-o e disse: João, estás com um ar cansa; Os materiais utilizas nos experimentos foram estes: Azimute, Falácia Hidropônica e Manjericão. 12
13 Elipse É a supressão de uma palavra facilmente subentendida. Consiste da omissão de um termo facilmente identificável pelo contexto ou por elementos gramaticais presentes na frase com a intenção de tornar o texto mais conciso e elegante. Zeugma Na estante, livros e mais livros. (omissão verbo haver) Tão bom se ela estivesse viva me ver assim. (Tão bom seria se ela estivesse viva para me ver assim.) Caso especial de Elipse. É a omissão de um termo que já fora expresso anteriormente. Ele prefere um passeio pela praia; eu, cinema. (não repetição verbo preferir) Vamos jogar só nós is? Você chuta para mim e eu para você (não repetição verbo chutar) Fechan parêntesis 13
14 Atribuição de pesos O processo de indexação gera um conjunto de termos de indexação (palavras, radicais ou termo composto) para representar um texto. Porém, tais termos não possuem a mesma importância na tarefa de representar o conteú informacional de um cumento; Um indicar de importância (peso) pode ser associa a cada termo; Atribuição de pesos Frequência de um termo em um cumento tf i = frequência de ocorrência termo i no texto A ocorrência de um termo em um texto curto é mais significante em um texto longo. A utilização logaritmo reduz a importância da frequência termo em um coleção (corpus) com grande variação s tamanhos s textos. log(tf i ) ou ln(tf i ) 14
15 Atribuição de pesos Frequência de um termo nos cumentos de um corpus Em quanto mais cumentos um termo ocorrer, menor a importância desse termo; O peso de um termo é inversamente relaciona ao número de cumentos em que ele ocorre. idf = log (N / ni) N = número de cumentos no corpus ni = número de cumentos que possui o termo i Atribuição de pesos A medida idf é dependente corpus. Conforme o número de cumentos for varian com o tempo, os pesos s cumentos precisam ser recalculas.; Essa característica desencoraja a sua utilização. Porém, a ideia é utilizada em diversas outras medidas desenvolvidas; Essa medida ficou conhecida pela multiplicação de tf com idf: tf x idf O peso de um termo i em um cumento d pode ser expressa como: wi,d = tfi,d x idfi Os melhores termos de indexação (maios pesos) são aqueles que aparecem com grande frequência em um determina cumento, mas aparece poucas vezes em outros cumentos; 15
16 d1 d2 d3 A vida imita a arte e a natureza A vida representa a vida A natureza imita a natureza Term frequence ( tf ) c vida imita arte representa natureza d d2 2 1 d3 1 2 Term frequence ( tf ) c vida imita arte representa natureza d d2 2 1 d3 1 2 Document Frequence & Inverse cument frequence termo vida imita arte representa natureza df idf 0,176 0, ,176 idf = log ( N / df ) N = 3 16
17 Term frequence ( tf ) c vida imita arte representa natureza d d2 2 1 d3 1 2 Document Frequence (df) & Inverse cument frequence (idf) termo vida imita arte representa natureza df idf 0, ,176 tf x idf c vida imita arte representa natureza d1 0,176 0, ,176 d2 0,352 0,477 d3 0,176 0,352 d1 d2 d3 A vida imita a arte e a natureza A vida representa a vida A natureza imita a natureza vida imita arte natureza vida representa imita natureza
18 Indexação por atribuição automática Indexação por atribuição automática A extração de termos de um texto é uma tarefa realizada de forma relativamente satisfatória por computares, e apresenta como vantagem a padronização e a coerência (homogeneidade), característicos s processos algorítmicos. Porém, segun Lancaster (2004, p.289), a maior parte da indexação realizada por seres humanos é a indexação por atribuição, utilizan um vocabulário controla como ferramenta normalizara. Um vocabulário controla é essencialmente uma lista de termos autorizas. Porém, a estrutura terminológica de um vocabulário controla pode ir muito além de uma mera lista, poden incluir uma forma de estrutura semântica destinada especialmente a: controlar sinônimos optan-se por uma única forma padronizada, com remissivas de todas as outras formas; diferenciar homógrafos; reunir ou ligar termos cujos significas apresentem uma relação estreita; 18
19 Indexação por atribuição automática Uma maneira obvia de automatizar a indexação por atribuição é criar para cada termo vocabulário controla um perfil de palavras ou expressões que costumam ocorrer nos cumentos aos quais um indexar humano atribuiria esse termo. Assim, a indexação se dá em duas fazes: em uma primeira etapa extraem-se palavras ou expressões texto por meio de técnicas estatísticas. Em uma segunda fase, partin desse conjunto de palavras/expressões, seleciona-se no vocabulário controla o termo cujo perfil possui certo nível de coincidente. Indexação por atribuição automática Os vocabulários controlas podem ser disponibilizas para os usuários de um sistema de informação, permitin que tenham acesso à terminologia empregada na indexação s cumentos. Isto possibilita compatibilizar a linguagem s usuários à linguagem utilizada na representação cumentos, resultan em uma recuperação mais eficiente. 19
20 Indexação por atribuição automática x y z Perfil Termo a, b, x T1 y, z T2 d, e, f T3 T1, T2 Críticas à Indexação Automática 20
21 Críticas à indexação automática Algumas técnicas comuns na recuperação de informação, como a utilização de listas de stopwords e a normalização das variações linguísticas s termos (stemming), podem dificultar o julgamento de relevância de um cumento ou descontextualizar um determina termo (Riloff, 1995). A presença termo morto em um cumento não garante que o cumento descreva um assassinato. Porém, a frase morto a tiros possui uma conotação de crime. A presença termo assassinato (singular) em um cumento é um indicar de que o cumento descreve um assassinato específico. Já a presença termo assassinatos (plural) pressupõe que o texto descreva diferentes assassinatos ou fale sobre assassinatos de uma forma geral. Preposições, formas verbais, afirmações positivas ou negativas, podem ser significantes para determinar o senti de uma frase. Referências 21
22 Referências ANDERSON, J.D.; PEREZ-CARBALLO, J. The nature of indexing: how humans and machines analyze messages and texts for retrieval - Part I: Research, and the nature of human indexing. Information Processing and Management, v.37, n.2, CROFT, W.B.; TURTLE, H.R.; LEWIS, D.D. The use of phrases and structured queries in information retrieval. Proceedings of the 14th annual international ACM SIGIR conference on research and development in information retrieval, p LANCASTER, F.W. Indexação e Resumos: teoria e prática. 2ªed. Brasilia, DF: Briquet de Lemos, LEWIS, D.D. An evaluation of phrasal and clustered representation on a text categorization task. Proceedings of the 15th annual international ACM SIGIR conference on research and development in information retrieval, p RILOFF, E. (1995) Little words can make a big difference for text classification. Proceedings of the 18 th annual international ACM SIGIR conference on research and development in information retrieval, p ZIPF, G.K. Human Behavior and the Principle of Least Effort. Cambridge, MA: Addison-Wesley,
11/04/2017. Período 4: Indexação automática. processamento da linguagem natural. Indexação
Perío 4: Indexação automática processamento da linguagem natural Indexação 1 Indexação A indexação de um cumento visa representar o seu conteú temático por meio de um conjunto de termos com o objetivo
Leia maisRevisão. Meio ambiente da Recuperação de Informação. Linguagem Analógico x Digital
Revisão Meio ambiente da Recuperação de Informação Linguagem Analógico x Digital 1 Recuperação de Informação Recuperação de informação é o nome dado ao processo ou método pelo qual um potencial usuário
Leia maisProfª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni
Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Motivação e Objetivos Etapas do Desenvolvimento de um Sistema de Recuperação de Informações (SRI): Pré-processamento; Representação; Extração
Leia maisIndexação automática. CBD/ECA Indexação: teoria e prática
Indexação automática CBD/ECA Indexação: teoria e prática Indexação documentária Identificar pela análise dos documentos, os seus assuntos extrair os conceitos que indicam o seu conteúdo traduzir os conceitos
Leia maisOrganizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Pré-processamento de documentos Organização e Recuperação de Informação(GSI521) Introdução O pré-processamento de
Leia maisRecuperar informação consiste em identificar, no conjunto de documentos de um sistema, quais atendem à necessidade de informação do usuário.
Recuperação de Informação Recuperação de Informação Recuperar informação consiste em identificar, no conjunto de documentos de um sistema, quais atendem à necessidade de informação do usuário. 1 Recuperação
Leia maisUniversidade do Sul de Santa Catarina Ciência da Computação Aula 09 Introdução a Análise de Textos Prof. Max Pereira
Universidade do Sul de Santa Catarina Ciência da Computação Técnicasde InteligênciaArtificial Aula 09 Introdução a Análise de Textos Prof. Max Pereira Processamento de Linguagem Natural Conjunto de técnicas
Leia maisLinguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília
Linguagens Documentárias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Contexto Organização da Informação...... procura criar métodos e instrumentos para elaborar
Leia maisPré-Processamento de Documentos
Pré-Processamento de Documentos Introdução Pré-Processamento : Análise léxica; Stopwords; Stemming; Vocabulário; Thesaurus Compressão: Fundamentos; Método Estatístico; Método Dicionário; Arquivos Invertidos
Leia maisPôster PRINCÍPIOS PARA UTILIZAÇÃO DE ONTOLOGIAS NA INDEXAÇÃO AUTOMÁTICA. Maria Elisa Valentim Pickler UNESP/MARÍLIA Edberto Ferneda UNESP/MARÍLIA
XIV Encontro Nacional de Pesquisa em Ciência da Informação (ENANCIB 2013) GT 8: Informação e Tecnologia Pôster PRINCÍPIOS PARA UTILIZAÇÃO DE ONTOLOGIAS NA INDEXAÇÃO AUTOMÁTICA Maria Elisa Valentim Pickler
Leia maisIndexação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília
Indexação Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília 1 Penso, logo existo. Brincadeira feita por Fernando Modesto MODESTIKUS, Bibliotecário Grego René Descartes
Leia maisMineração de Textos na Web
Mineração de Textos na Web Luciano Antonio Digiampietri Escola de Artes Ciências e Humanidades da Universidade de São Paulo digiampietri@usp.br Resumo: Com o crescimento das informações disponíveis na
Leia maisI-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos
17 I-Preproc: uma ferramenta para pré-processamento e indexação incremental de documentos Renan Gomes Pereira 1 Maria Fernanda Moura 2 Resumo: O objetivo deste trabalho é apresentar a ferramenta I-Preproc,
Leia maisRecuperação de Informação
Recuperação de Informação Avaliação de Desempenho de Sistemas de Recuperação de Informação Renato Fernandes Corrêa 1 Para que avaliar? Existem muitos modelos de RI, mas qual é o melhor? Qual a melhor escolha
Leia maisVisualização de Texto e Documento
Visualização de Texto e Documento SCC5836 Visualização Computacional Prof. Fernando V. Paulovich http://www.icmc.usp.br/~paulovic paulovic@icmc.usp.br Instituto de Ciências Matemáticas e de Computação
Leia maisMelhorando a Recuperação de Informação
Recuperação de Informação e Web Mining 1 Melhorando a Recuperação de Informação O modelo de espaço vetorial Utiliza pesos para termos Permite o ranqueamento dos resultados Pode reduzir a dimensão do espaço
Leia maisRecapitulando... Abordagens: PLN. Abordagens: PLN 29/03/2012. Introdução ao Processamento de Línguas Naturais. Distribuição de palavras
Introdução ao Processamento de Línguas Naturais SCC5908 Introdução ao Processamento de Língua Natural Thiago A. S. Pardo Recapitulando... Abordagens superficiais vs. profundas Simbolismo vs. estatística
Leia maisIndexação e Construção de Índice. Renato Fernandes Corrêa
Indexação e Construção de Índice Renato Fernandes Corrêa Indexação de documentos Consiste de três passos: 1. Definição do vocabulário de indexação 2. Indexação - atribuição de termos de indexação a cada
Leia mais4 Recuperação de Informação
4 Recuperação de Informação No presente capítulo são apresentados os fundamentos da área de Recuperação de Informação utilizados em Mineração de Textos, como por exemplo, os modelos de representação de
Leia mais6 Atributos. A dívida da empresa subiu.
6 Atributos Para buscar o sentimento de um texto automaticamente precisamos encontrar boas pistas ao longo do discurso. Uma grande variedade de palavras e expressões possui conotação positiva ou negativa,
Leia mais03/07/2017. Modelo de Recuperação de Informação
Modelo de Recuperação de Informação Modelo de Recuperação de Informação Um modelo de recuperação de informação é a especificação formal de três elementos: a representação dos documentos; a representação
Leia maisÍndice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed
Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação
Leia maisDESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias
DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos
Leia maisOs efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais
72 Resumos Expandidos: XII Mostra de Estagiários e Bolsistas... Os efeitos do paralelismo e relações de thesaurus em uma ferramenta de busca em bases textuais Renan Gomes Pereira¹ Maria Fernanda Moura²
Leia maisO USO DE LINGUAGENS DOCUMENTÁRIAS ALFABÉTICAS NA INDEXAÇÃO AUTOMATIZADA Cristina Miyuki Narukawa 1, Mariângela Spotti Lopes Fujita 2
O USO DE LINGUAGENS DOCUMENTÁRIAS ALFABÉTICAS NA INDEXAÇÃO AUTOMATIZADA Cristina Miyuki Narukawa 1, Mariângela Spotti Lopes Fujita 2 1 Mestranda, Universidade Estadual Paulista (UNESP), Marília, São Paulo
Leia maisLeitura de Documentos. Priscila Engiel
Leitura de Documentos Priscila Engiel pengiel@inf.puc-rio.br Leitura de documentos Leitura de documentos formais que regulam ou descrevem o sistema ou aspectos que interferem em sua execução Quais documentos?
Leia maisLista de exercícios 2 Recuperação de Informação Textual
Lista de exercícios 2 Recuperação de Informação Textual 2 de dezembro de 2015 0.1 O que é o modelo bag-of-words? Porque ele é uma simplificação? Dê um exemplo em que ele estaria incorreto. 0.2 O que é
Leia maisGSI024 - Organização e Recuperação da
GSI024 - Organização e Recuperação da Informação Ilmério Reis da Silva ilmerio@facom.ufu.br UFU/FACOM/BSI Arquivo 6 - Modelo Vetorial GSI024-ORI Pg:6. 1 Ranking baseado no modelo vetorial Considerações
Leia maisMCZA Processamento de Linguagem Natural Normalização de texto: Palavras e stopwords
MCZA017-13 Processamento de Linguagem Natural Normalização de texto: Palavras e stopwords Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2018 1 Bibliografia Daniel Jurafsky & James H. Martin. Speech
Leia maisMedidas de Avaliação
Medidas de Avaliação Medidas de Avaliação Para a maioria dos sistemas computacionais é necessário criar medidas para aferir sua eficácia e eficiência; A medida mais comum é o tempo e o espaço. Quanto menor
Leia maisCastro (2008, p.7) define a palavra ontologia de forma mais simplificada:
Recuperação de Informação baseada em Castro (2008, p.7) define a palavra ontologia de forma mais simplificada: Ela é o resultado da junção de dois termos gregos onta (entes) e logos (teoria, discurso,
Leia maisO PAVEL: curso interativo de Terminologia
Disponível em:< http://www.termiumplus.gc.ca/didacticiel_tutorial/portugues/lecon1/indexe_p.html> Acesso em: 01/03/2011. O PAVEL: curso interativo de Terminologia Glossário Abreviação Designação formada
Leia maisDATA MINING & MACHINE LEARNING (I) Thiago Marzagão
DATA MINING & MACHINE LEARNING (I) Thiago Marzagão transformando textos em dados Documento 1: Não trabalho para ter clientes; tenho clientes para poder trabalhar. Documento 2: Não se pode forçar a inteligência
Leia maisVocabulário controlado e palavras-chave em repositórios digitais: relato de experiência do repositório institucional da FGV
Powered by TCPDF (www.tcpdf.org) Vocabulário controlado e palavras-chave em repositórios digitais: relato de experiência do repositório institucional da FGV Márcia Nunes Bacha (FGV) - marcia.bacha@fgv.br
Leia maisElipse consiste na omissão de um termo facilmente identificável pelo contexto ou por elementos gramaticais presentes na frase com a intenção de
Elipse consiste na omissão de um termo facilmente identificável pelo contexto ou por elementos gramaticais presentes na frase com a intenção de tornar o texto mais conciso e elegante. Ex.: Risco de vida.
Leia maisA QUESTÃO DAS PALAVRAS- CHAVE E A PROPOSTA DO USO DE VOCABULÁRIO CONTROLADO PARA AS REVISTAS CIENTÍFICAS DA UNESP
I Encontro de Editores de Revistas Científicas da Unesp A QUESTÃO DAS PALAVRAS- CHAVE E A PROPOSTA DO USO DE VOCABULÁRIO CONTROLADO PARA AS REVISTAS CIENTÍFICAS DA UNESP Fábio Sampaio Rosas Rosane Rodrigues
Leia maisSumário da aula. 2 Declaração De Princípios Internacionais De Catalogação. 1 tipos de catálogos. 3 Glossário básico. 4 Referências
Sumário da aula 1 tipos de catálogos 1.1a Internos ou auxiliares 1.1b Internos ou auxiliares 1.1.1 Catálogo de identidade 1.1.1.1 Exemplo de registro para de Catálogo de identidade 1.1.1.2 Exemplo de registro
Leia maisManual OntoLP. 1-Introdução ao OntoLP Instalação do OntoLP Executando o OntoLP Observação Importante...4
Manual OntoLP Sumário: 1-Introdução ao OntoLP...2 2-Instalação do OntoLP...2 3-Executando o OntoLP...2 4-Observação Importante...4 5-Aba de Carga do Corpus...5 6-Aba de Extração de Termos...7 7- Aba de
Leia maisRecuperação de Informação em Bases de Texto
Recuperação de Informação em Bases de Texto Mestrado em Engenharia Informática Universidade de Évora 2010/2011 Paulo Quaresma pq@di.uevora.pt http://www.moodle.uevora.pt 1 Objectivos Programa Avaliação
Leia maisCorretor Gramatical Para o Emacs
Trabalho de Conclusão de Curso Thiago Maciel batista Orientador: Prof. Dr. Marcelo Finger Instituto de Matemática e Estatística Universidade de São Paulo 16 de novembro de 2010 Roteiro 1 Introdução 2 Processamento
Leia maisSistemas de PROFA. LILLIAN ALVARES FACULDADE DE CIÊNCIA DA INFORMAÇÃO
Sistemas de Organização do Conhecimento PROFA. LILLIAN ALVARES FACULDADE DE CIÊNCIA DA INFORMAÇÃO UNIVERSIDADE DE BRASÍLIA Sistemas de Organização do Conhecimento tem como principal p objetivo...... a
Leia maisPlanejamento da Elaboração de Índice
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE BIBLIOTECONOMIA E COMUNICAÇÃO DEPARTAMENTO DE CIÊNCIAS DA INFORMAÇÃO CURSO DE BIBLIOTECONOMIA Carla Viganigo Rangel de Castilhos Carolina Patrícia
Leia maisTabela Hash: Índice remissivo
Capítulo 3 Tabela Hash: Índice remissivo Um índice remissivo lista os termos e tópicos que são abordados em um documento juntamente com páginas em que aparecem. É bastante comum encontrar tais índices
Leia maisA CASA DO SIMULADO DESAFIO QUESTÕES MINISSIMULADO 103/360
1 DEMAIS SIMULADOS NO LINK ABAIXO CLIQUE AQUI REDE SOCIAL SIMULADO 103/360 PORTUGUÊS INSTRUÇÕES TEMPO: 30 MINUTOS MODALIDADE: CERTO OU ERRADO 30 QUESTÕES CURTA NOSSA PÁGINA MATERIAL LIVRE Este material
Leia maisAlgoritmos e Estruturas de Dados II. Trabalho Prático 4
Algoritmos e Estruturas de Dados II Trabalho Prático 4 Entrega: 23/11/09 Devolução: 10/12/09 (sem possibilidade de entrega com atraso) Trabalho em dupla Prof. Jussara Marques de Almeida Problema 1: Construção
Leia maisPROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS
PROTÓTIPO PARA SUMARIZAÇÃO AUTOMÁTICA DE TEXTOS ESCRITOS EM LÍNGUA PORTUGUESA ALEXANDRE BUSARELLO JOYCE MARTINS Roteiro Introdução Objetivos Fundamentação Teórica Especificação Implementação Operacionalidade
Leia mais25/04/2017. Modelo de Recuperação de Informação
Modelo de Recuperação de Informação Modelo de Recuperação de Informação Um modelo de recuperação de informação é a especificação formal de três elementos: a representação dos documentos; a representação
Leia maisA/ART casa/n caiu/v./. Figura 3.1: Frase com anotação morfossintática.
3 Tarefa Esse capítulo começa dissertando sobre as vantagens de se agrupar as palavras em classes, como elas são agrupadas em part-of-speechs e suas aplicações. Em seguida é apresentado o Anotador Morfossintático
Leia maisPOLÍTICA DE INDEXAÇÃO PARA BIBLIOTECAS UNIVERSITÁRIAS
M ESA REDONDA: O RGANIZAÇÃO DA INFORMAÇÃO E DO CONHECIMENTO EM CONTEXTOS COLABORATIVOS E INTEGRADOS EM REDE POLÍTICA DE INDEXAÇÃO PARA BIBLIOTECAS UNIVERSITÁRIAS Dra. Mariângela Spotti Lopes Fujita (Nível
Leia maisImplementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes
Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes Luciana Kayo e Paulo Mei Prof. Dr. Marco Dimas Gubitoso Introdução Inspiração na competição When Bag of Words
Leia maisOrganizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Realimentaçãode relevânciae expansão de consultas Organização e Recuperação de Informação(GSI521) Realimentação de
Leia maisDesenvolvimento de Softwares de Indexação Automática: breve Avaliação dos Principais Critérios
Desenvolvimento de Softwares de Indexação Automática: breve Avaliação dos Principais Critérios Graciane Silva Bruzinga Borges Escola de Ciência da Informação/Universidade Federal de Minas Gerais, Email:
Leia maisFlávio Codeço Coelho, Bruno Cuconato TEXT ANALYTICS EM DOCUMENTOS HISTÓRICOS SENSÍVEIS: CONFIANÇA E ESCALABILIDADE 1 / 19
TEXT ANALYTICS EM DOCUMENTOS HISTÓRICOS SENSÍVEIS: CONFIANÇA E ESCALABILIDADE Flávio Codeço Coelho Bruno Cuconato TEXT ANALYTICS EM DOCUMENTOS HISTÓRICOS SENSÍVEIS: CONFIANÇA E ESCALABILIDADE 1 / 19 Coleções,
Leia maisRealimentação de Relevância
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Ciclo de realimentação onde uma consulta q recebida do usuário é transformada em uma consulta modificada
Leia maisTribunal de Contas da União
Tribunal de Contas da União Secretaria das Sessões Pesquisa de Jurisprudência Guia rápido O TCU disponibiliza 4 bases de dados para pesquisa de sua jurisprudência: Acórdãos Bases de pesquisa Jurisprudência
Leia maisSemântica no Reconhecedor Gramatical Linguístico
Workshop de Tecnologias Adaptativas WTA 2015 Semântica no Reconhecedor Gramatical Linguístico Ana Contier, Djalma Padovani, João José Neto Linguagem Natural - Desafios Crescente quantidade de documentos
Leia maisREDAÇÃO PARA CONCURSOS
REDAÇÃO PARA CONCURSOS Sumário Primeira Parte Primeira Lição Poesia matemática Gramática acentuação gráfica Tipos de palavras Regras gerais Dupla prosódia Pronúncia duvidosa Orientação Ortográfica emprego
Leia maisMINERAÇÃO DE DADOS. Thiago Marzagão MINERAÇÃO DE TEXTOS. marzagao.1@osu.edu. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25
MINERAÇÃO DE DADOS Thiago Marzagão marzagao.1@osu.edu MINERAÇÃO DE TEXTOS Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25 transformando textos em dados Documento 1: "Não trabalho para ter clientes;
Leia maisIndexação e Modelos Clássicos
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Construção de um Sistema de Busca 1ª Etapa: Definir
Leia maisHashing: conceitos. Hashing
Hashing: conceitos hashing é uma técnica conhecida como espalhamento, mapeamento ou randomização que tenta distribuir dados em posições aleatórias de uma tabela (array) associa cada objeto (de um determinado
Leia maisDescoberta de conhecimento em redes sociais e bases de dados públicas
Descoberta de conhecimento em redes sociais e bases de dados públicas Trabalho de Formatura Supervisionado Bacharelado em Ciência da Computação - IME USP Aluna: Fernanda de Camargo Magano Orientadora:
Leia maisNormalização. Anomalias Dependência e determinantes Normalização
FACULDADE ANGLO AMERICANO FOZ DO IGUAÇU Curso de Ciência da Computação 5º Periodo Disciplina: Banco de Dados I Prof. Erinaldo Sanches Nascimento Normalização Anomalias Dependência e determinantes Normalização
Leia maisModelo Espaço Vetorial. Mariella Berger
Modelo Espaço Vetorial Mariella Berger Agenda Introdução Atribuição de Pesos Frequência TF-IDF Similaridade Exemplo Vantagens e Desvantagens Modelo Espaço Vetorial Introdução Modelo Espaço Vetorial O modelo
Leia maisINTERPRETAÇÃO DE TEXTOS MECANISMOS DE COESÃO TEXTUAL (PARTE VI)
INTERPRETAÇÃO DE TEXTOS MECANISMOS DE COESÃO TEXTUAL (PARTE VI) RECURSOS ESTILÍSTICOS DE COESÃO: ELIPSE E ZEUGMA São duas importantes figuras de linguagem que funcionam como recursos coesivos por excelência,
Leia maisUNIVERSIDADE FEDERAL DE MINAS GERAIS DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO DISCIPLINAS DOS CURSOS DE GRADUAÇÃO
UNIVERSIDADE FEDERAL DE MINAS GERAIS DEPARTAMENTO DE ORGANIZAÇÃO E TRATAMENTO DA INFORMAÇÃO DISCIPLINAS DOS CURSOS DE GRADUAÇÃO DISCIPLINA LINGUAGENS DE INDEXAÇÃO CÓDIGO OTI 074 B1 PROFESSOR: KÁTIA LÚCIA
Leia maisSistemas de Organização do Conhecimento
Sistemas de Organização do Conhecimento P R O F A. L I L L I A N A L V A R E S F A C U L D A D E D E C I Ê N C I A D A I N F O R M A Ç Ã O U N I V E R S I D A D E D E B R A S Í L I A Há concordância dos
Leia maisVerificação automática de substantivos compostos através de reconhecimento de padrões sintáticos
Universidade Federal do Rio Grande do Sul Grupo de Processamento de Linguagens Naturais Projeto Expressões Multipalavras Verificação automática de substantivos compostos através de reconhecimento de padrões
Leia maisUniversidade do Estado de Santa Catarina Centro de Ciências Humanas e da Educação Departamento de Biblioteconomia e Gestão da Informação
PLANO DE ENSINO RECUPERAÇÃO DA INFORMAÇÃO Departamento: Biblioteconomia e Gestão da Ano/semestre: 2014/1 Curso: Biblioteconomia Fase: 5ª Disciplina: Recuperação da Turno: matutino Carga horária: 54 horas/aula
Leia maisConstrução de um Tesauro Especializado
Temática 1: Informação, Conteúdos e Conhecimento na Sociedade da Informação Construção de um Tesauro Especializado Vera Viana dos Santos veraviana@cnpm.embrapa.br Embrapa Monitoramento por Satélite RESUMO
Leia maisUM MÉTODO DE INDEXAÇÃO AUTOMÁTICA DE DOCUMENTOS: APLICAÇÃO EM LAUDOS DE EXAMES RADIOLÓGICOS
GT8 - Informação e Tecnologia Modalidade de apresentação: Comunicação Oral UM MÉTODO DE INDEXAÇÃO AUTOMÁTICA DE DOCUMENTOS: APLICAÇÃO EM LAUDOS DE EXAMES RADIOLÓGICOS EDBERTO FERNEDA Universidade Estadual
Leia maisSERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DO RIO GRANDE INSTITUTO DE CIÊNCIAS HUMANAS E DA INFORMAÇÃO - ICHI - INDEXAÇÃO: TEORIA E PRÁTICA
SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DO RIO GRANDE INSTITUTO DE CIÊNCIAS HUMANAS E DA INFORMAÇÃO - ICHI - INDEXAÇÃO: TEORIA E PRÁTICA Magali Aquino INDEXAÇÃO Processo que consiste em enumerar os
Leia maisUNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO
UNIVERSIDADE FEDERAL DE PERNAMBUCO CENTRO DE INFORMÁTICA GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO Sistema de Sumarização Automática de Textos Baseado em Classes de Documentos PROPOSTA DE TRABALHO DE GRADUAÇÃO
Leia maisProposta do seminário
Proposta do seminário 0 Importância e relação da indexação e recuperação de informação 0 Mostrar o que é e como funciona a indexação automatizada para textos 0 Vantagens e desvantagens Indexação 0 Análise
Leia maisPLANIFICAÇÃO ANUAL. Domínios Subdomínios Unidades Objetivos gerais
PLANIFICAÇÃO ANUAL Domínios Submínios Unidades Objetivos gerais A água, o ar, as rochas e o solo materiais terrestres Diversidade de e suas interações com o meio Unidade na diversidade de seres vivos A
Leia maisPlano de Trabalho Docente Ensino Técnico
Plano de Trabalho Docente 2016 Ensino Técnico Plano de Curso nº 246 aprovado pela portaria Cetec nº 181 de 26/09/2013 Etec: ETEC Paulino Botelho Código: 091 Município:São Carlos-SP Eixo Tecnológico: Controle
Leia maisPoda experimental de Schinus terebinthifolius Raddi (pimenta-rosa) em área de Cerrado
NOTA TÉCNICA DE PESQUISA Poda experimental de Schinus terebinthifolius Raddi (pimenta-rosa) em área de Cerrado Annete Bonnet, Gustavo Ribas Curcio, Edberto Moura, Deborah Santos, Roberto Ogata 2016 Foto:
Leia maisCombinando Fatores de Ponderação para Melhorar a
Computer on the Beach 2014 - Artigos Completos 32 Combinando Fatores de Ponderação para Melhorar a Classificação de Textos Frederico P. de Souza 1, Patrick M. Ciarelli 2, Elias de Oliveira 1 1 Departamento
Leia maisTERMINOLOGIAS EM SAÚDE: para uma linguagem comum
: para uma linguagem comum Paulino Sousa CINTESIS - Center for Research in Technology and Information Systems Universidade do Porto ICN-Accredited Centre for Information Systems Research and Development
Leia maisAVALIAÇÃO DA POLÍTICA DE INDEXAÇÃO DE ARTIGOS DA SEÇÃO DE PERIÓDICOS DA BIBLIOTECA CENTRAL DA UFPB: pesquisa em andamento
GT 2 - Organização e Representação do Conhecimento Modalidade de apresentação: pôster AVALIAÇÃO DA POLÍTICA DE INDEXAÇÃO DE ARTIGOS DA SEÇÃO DE PERIÓDICOS DA BIBLIOTECA CENTRAL DA UFPB: pesquisa em andamento
Leia maisPROCESSOS DE INDEXAÇÃO E ANÁLISE DE ASSUNTO: UMA ABORDAGEM BASEADA NA AVALIAÇÃO DOS FATORES INTERVENIENTES NESTES PROCESSOS¹
PROCESSOS DE INDEXAÇÃO E ANÁLISE DE ASSUNTO: UMA ABORDAGEM BASEADA NA AVALIAÇÃO DOS FATORES INTERVENIENTES NESTES PROCESSOS¹ Resumo Elizabeth Andrade Duarte * O presente artigo promove reflexão à indexação
Leia maisEscola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Planejamento de Experimentos
Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo Planejamento de Experimentos Piracicaba Agosto 2016 Estatística Experimental 11 de Agosto de 2016 1 / 24 Definições importante Planejamento
Leia maisO tesauro pode ser pesquisado no menu da Jurisprudência pelo link Vocabulário Jurídico.
Perguntas Frequentes Jurisprudência - Tesauro Jurídico 1. O que é o Tesauro Jurídico? Segundo o dicionário Aurélio, Tesauro é um 'vocabulário controlado e dinâmico de descritores relacionados semântica
Leia maisOntoLP: Engenharia de Ontologias em Língua Portuguesa
OntoLP: Engenharia de Ontologias em Língua Portuguesa Luiz Carlos Ribeiro Jr. (PUCRS, lucarijr@gmail.com) Renata Vieira (PUCRS, renata.vieira@gmail.com) Patrícia Nunes Gonçalves (PUCRS, patt.nunes@gmail.com)
Leia maisGestão e Recuperação de Informação. Avaliação em Sistemas de Recuperação de Informação. José Borbinha DEI/IST
Gestão e Recuperação de Informação Avaliação em Sistemas de Recuperação de Informação José Borbinha DEI/IST Problema: Como avaliar um sistema de RI? 2 Comecemos, analisando um exemplo... 3 Exemplo... 4
Leia maisCONTEÚDOS APS 1º BIMESTRE/2018 2º ANO
2º ANO Língua Portuguesa: Gramática: UNIDADES 1 A 6: Alfabeto; Ordem alfabética; Sílaba; Vogais e Consoantes Encontro Consonantal. Português Linguagens: INTERPRETAÇÃO DE TEXTO Cap. 1 Brincando na rua Cap.
Leia maisGSI024 - Organização e Recuperação da
GSI024 - Organização e Recuperação da Informação Ilmério Reis da Silva ilmerio@facom.ufu.br UFU/FACOM/BSI Arquivo 5 - Peso de termos GSI024-ORI Pg:5. 1 Busca paramétrica usando atributos Regiões em documentos
Leia maisA SEMÂNTICA DOS ADJETIVOS: COMO E POR QUE INCLUÍ-LA EM UMA ONTOLOGIA DE DOMÍNIO JURÍDICO
A SEMÂNTICA DOS ADJETIVOS: COMO E POR QUE INCLUÍ-LA EM UMA ONTOLOGIA DE DOMÍNIO JURÍDICO Anderson Bertoldi Rove Chishman UNISINOS 1 Recuperação de Informação Jurídica Área investigativa interdisciplinar:
Leia maisMétodos e Técnicas de Pesquisas ARTIGO CIENTÍFICO. Professor Adm. Walter Martins Júnior CRA-PR
Métodos e Técnicas de Pesquisas ARTIGO CIENTÍFICO Professor Adm. Walter Martins Júnior CRA-PR 15.063 ALGUMAS REGRAS 2 não deixe para a última hora escreva leia alguns relatórios ou resumos faça um esboço
Leia maisEVOLUÇÃO DO MECANISMO DE BUSCA DO AINFO-CONSULTA COM USO DE THESAURUS AGROPECUÁRIO
13 a 15 de agosto de Jaguariúna, SP EVOLUÇÃO DO MECANISMO DE BUSCA DO AINFO-CONSULTA COM USO DE THESAURUS AGROPECUÁRIO IGOR J. P. MARINHO 1 ; HENRIQUE T. M. CARDONE 2 ; GLAUBER J. VAZ 3 Nº 12610 RESUMO
Leia maisUma ferramenta para expansão do vocabulário com base em coocorrência
Resumos Expandidos: XI Mostra de Estagiários e Bolsistas... 11 Uma ferramenta para expansão do vocabulário com base em coocorrência Exupério Lédo Silva Júnior 1 Roberta Akemi Sinoara 2 Solange Oliveira
Leia maisIdentificação em Documentos
Identificação de Contexto Geográfico em Documentos Marcos Henrique Fonseca Ribeiro Bancos de Dados Geográficos Marcos Henrique Fonseca Ribeiro Slide 1 Roteiro Motivação e contexto Cenários a serem explorados
Leia maisINICIAÇÃO À PESQUISA
MINICURSO INICIAÇÃO À PESQUISA MÓDULO 2: Análise Bibliométrica LABORATÓRIO DE MÉTODOS QUALITATIVOS E QUANTITATIVOS EM ADMINISTRAÇÃO E CIÊNCIAS SOCIAIS APLICADAS INSTRUTORES: CHRISLAINE CAROLINE DE SOUZA
Leia maisRECURSOS HUMANOS. Pagamentos. Lançamentos de verbas
RECURSOS HUMANOS Pagamentos Lançamentos de verbas Sumário Introdução... 4 Definição de Cálculo e Valores Fixos.... 4 São Paulo: 11 2109-8500 Blumenau: 47 3321-1300 Curitiba: 41 2104-8989 Rio de Janeiro:
Leia maisUm estudo sobre diferentes modelos de Recuperação de Informação em documentos semi-estruturados (XML) -
Um estudo sobre diferentes modelos de Recuperação de Informação em documentos semi-estruturados (XML) - Implementação, Análise, Avaliação e Comparação Autor: Mirella Silva Junqueira 1, Orientador: Prof.
Leia maisHashing. Hashing. Hashing versus Indexação. Hashing. Hashing convencional... Exemplo de espalhamento. Revisão...
Algoritmos e Estruturas de Dados II Hashing Prof Debora Medeiros Hashing convencional Revisão Adaptado dos Originais de: Maria Cristina F de Oliveira Cristina Ciferri Hashing Exemplo de espalhamento 0
Leia maisIndexação automática e semântica: estudo da análise do conteúdo de teses e dissertações
Grupo de Estudos sobre Organização e Representação do Conhecimento (GEORC) UNESP de Marília DISCUSSÃO DO TEXTO - Indexação automática e semântica: estudo da análise do conteúdo de teses e dissertações..
Leia maisMétodo Guloso. Troco mínimo. Paulo Eustáquio Duarte Pinto (pauloedp arroba ime.uerj.br) junho/2012. Troco mínimo. Troco mínimo
Notas de aula da disciplina IME - ALGORITMOS E ESTRUTURAS DE DADOS II Paulo Eustáquio Duarte Pinto (pauloedp arroba ime.uerj.br) Troco mínimo Dados os tipos de moedas de um país, determinar o número mínimo
Leia maisFORMAÇÃO DE UM VOCABULÁRIO CONTROLADO A PARTIR DE PALAVRAS-CHAVE
GT 2 : Organização do Conhecimento e Representação da Informação FORMAÇÃO DE UM VOCABULÁRIO CONTROLADO A PARTIR DE PALAVRAS-CHAVE Manoel Palhares Moreira Mestre em Ciência da Informação, Doutorando em
Leia maisSeleção e Otimização de Fontes
Seleção e Otimização de Fontes 1. Introdução Muitos dados disponíveis Não há garantia de relevância Muitos acessos (custoso) O Autor propõe uma ideia para otimizar o processamento: A indexação e seleção
Leia mais