Recuperação de Informação
|
|
- Daniel Olivares Carvalho
- 6 Há anos
- Visualizações:
Transcrição
1 Recuperação de Informação Avaliação de Desempenho de Sistemas de Recuperação de Informação Renato Fernandes Corrêa 1
2 Para que avaliar? Existem muitos modelos de RI, mas qual é o melhor? Qual a melhor escolha para: Seleção de termos (stopword, stemming ) Definição de pesos (TF, TF-IDF, ) Função de Ranking (co-seno, correlação ) Quantos itens da lista de resultados o usuário deverá consultar para ainda encontrar algum documento relevante? 2
3 Como avaliar? Todo software pode ser avaliado quanto a corretude ou eficácia através da comparação da saída do programa com a saída esperada para valores de entrada predeterminados. Entrada de dados Corpus Consulta SRI Saída de dados Lista de documentos recuperados Julgamentos de Relevância Por Especialistas Lista de documentos relevantes 3
4 Avaliação de Sistemas de RI Dificuldades Eficácia do SRI está relacionada à relevância dos itens recuperados Relevância, do ponto de vista do usuário, é: Subjetiva: depende de um julgamento específico do usuário Dependente do contexto: relaciona-se às necessidades atuais do usuário Cognitiva: depende da percepção e comportamento humano Dinâmica: muda com o decorrer do tempo 4
5 Metodologia de Avaliação de Sistemas de RI 1. Selecione com um corpus de documentos chamado também de coleção de referência 2. Defina um conjunto de consultas para esse corpus 3. Use um ou mais especialistas humanos para exaustivamente categorizar (etiquetar, marcar) os documentos relevantes para cada consulta Geralmente assume relevância binária 4. Calcular métricas de avaliação do SRI 5
6 Metodologia de Avaliação de Sistemas de RI 6
7 Metodologia de Avaliação Vantagens: Pode ser adotada para avaliar qualquer SRI Desvantagens: Não leva em conta ordenação dos documentos na lista de documentos retornados Depende do julgamento de relevância dos documentos da coleção em relação a cada expressão de busca. Processo lento, caro e subjetivo. 7
8 Medidas de Avaliação de Sistemas de RI Precisão Habilidade de recuperar somente itens relevantes (unicidade) Revocação ou Cobertura Habilidade de recuperar todos os itens relevantes (completude) 8
9 Medidas de Avaliação Relevantes Irrelevantes Coleção de documentos Documentos relevantes Documentos recuperados Recuperados Não recuperados recuperados e relevantes Não recuperados e relevantes recuperados e irrelevantes Não recuperados e irrelevantes Revocação Número de documentos relevantes recuperados Número total de documentos relevantes Precisão Número dedocumentos relevantes recuperados Número total de documentos recuperados 9
10 Exemplos: Dados: Uma coleção de 5 documentos, D1 a D5 Uma consulta Q1 Julgamento de relevância de cada documento para a consulta Q1 Existem 3 documentos relevantes para Q1 Os documentos retornados por um SRI para a consulta Q1 10
11 Exemplo 1: Documento Retornado Relevante D1 SIM SIM D2 NÃO SIM D3 SIM SIM D4 NÃO NÃO D5 SIM NÃO Revocação = 2/3 = 0,667 ou 66,7% Precisão = 2/3 = 0,667 ou 66,7% 11
12 Exemplo 2: buscando maior precisão Documento Retornado Relevante D1 SIM SIM D2 NÃO SIM D3 NÃO SIM D4 NÃO NÃO D5 NÃO NÃO Revocação = 1/3 = 0,333 ou 33,3% Precisão = 1/1 = 1,0 ou 100% 12
13 Exemplo 3 : buscando maior Revocação Documento Retornado Relevante D1 SIM SIM D2 SIM SIM D3 SIM SIM D4 SIM NÃO D5 SIM NÃO Revocação = 3/3 = 1,0 ou 100% Precisão = 3/5 = 0,6 ou 60% 13
14 Exemplo 4: o ideal Documento Retornado Relevante D1 SIM SIM D2 SIM SIM D3 SIM SIM D4 NÃO NÃO D5 NÃO NÃO Revocação = 3/3 = 1,0 ou 100% Precisão = 3/3 = 1,0 ou 100% 14
15 Precisão Conflito entre Revocação e Precisão Retorna documentos relevantes mas esquece muitos outros relevantes 1 Ideal 0 Revocação 1 Retorna todos os documentos relevantes mas inclui muitos não relevantes 15
16 Conflito entre Revocação e precisão A exaustividade e a especificidade na indexação são os dois fatores mais importantes que governam a Revocação e a precisão; A exaustividade aumenta a Revocação e diminui a precisão, enquanto que uma maior especificidade leva à menor Revocação e maior precisão; Em síntese, o desempenho de um sistema de recuperação de informação é avaliado principalmente pelas medidas de Revocação e precisão. 16
17 Exercício: busca por carta antiga Calcule Precisão e Revocação Retornado Relevante 17
18 Combinando Precisão e Revocação F-Measure Medida de desempenho que considera tanto a Revocação como precisão Média harmônica da Revocação (Cobertura) e Precisão: 2PC 2 F 1 1 P C C P Vantagem de usar a média harmônica em relação à média aritmética: Ambas as medidas precisam ser altas para a média harmônica ser alta 18
19 E-Measure F-Measure parametrizado Variação da F-measure que permite associar ênfase na precisão sobre a Revocação: E 2 (1 ) PC 2 P C Valor de controla conflito: = 1: Peso igual para precisão e Revocação (E=F). C > 1: Mais peso para a precisão 1 P < 1: Mais peso para a Revocação (1 2 2 ) 19
20 Exemplo 1: Documento Retornado Relevante D1 SIM SIM D2 NÃO SIM D3 SIM SIM D4 NÃO NÃO D5 SIM NÃO Revocação = 2/3 = 0,667 ou 66,7% Precisão = 2/3 = 0,667 ou 66,7% F 2PC P C 2x0,667x0,667 0,667 0,667 0,89 1,334 0,667 20
21 Exemplo 2: buscando maior precisão Documento Retornado Relevante D1 SIM SIM D2 NÃO SIM D3 NÃO SIM D4 NÃO NÃO D5 NÃO NÃO Revocação = 1/3 = 0,333 ou 33,3% Precisão = 1/1 = 1,0 ou 100% F 2PC P C 2x1,0 x0,333 1,0 0,333 0,666 1,333 0,5 21
22 Exemplo 3: buscando maior Revocação Documento Retornado Relevante D1 SIM SIM D2 SIM SIM D3 SIM SIM D4 SIM NÃO D5 SIM NÃO Revocação = 3/3 = 1,0 ou 100% F Precisão = 3/5 = 0,6 ou 60% 2PC P C 2x1,0 x0,6 1 0,6 1,2 1,6 0,75 22
23 Exemplo 4: o ideal Documento Retornado Relevante D1 SIM SIM D2 SIM SIM D3 SIM SIM D4 NÃO NÃO D5 NÃO NÃO Revocação = 3/3 = 1,0 ou 100% Precisão = 3/3 = 1,0 ou 100% 2PC 2x1x1 2 F 1,0 P C
24 Medir Revocação é Difícil Número total de documentos relevantes nem sempre é disponível Ex., a Web Para esses casos, calcula-se Revocação relativa Selecione uma amostra do conjunto total de documentos e julgue relevância apenas dos itens da amostra Aplique diferentes algoritmos de recuperação na mesma base de documentos para a mesma consulta Para a Web, consultar diferentes engenhos de busca O conjunto total dos itens relevantes recuperados é considerado o conjunto total de documentos relevantes 24
25 Curva de Precisão Média por Revocação Tipicamente, essa curva mede o desempenho geral do sistema sobre um conjunto de consultas É sensível à ordenação dos documentos relevantes na lista de documentos retornados Mostra o desempenho do sistema em termos de precisão média para diferentes posições de exame da lista de resultados (pontos de corte - cutoffs) pelos usuários, denotados por níveis de revocação. 25
26 Comparando dois ou mais Sistemas A curva mais próxima do canto superior direito do gráfico indica melhor desempenho 1 0,8 NoStem Stem Precisão 0,6 0,4 0,2 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Cobertura 26
27 Procedimento para cálculo da Curva de Precisão Média por Revocação Determine o conjunto de documentos relevantes para cada consulta Assuma a Revocação em 11 níveis, correspondendo a 0%, 10%,20%,...,90%,100% ou 0.0, 0.1, 0.2,...,0.9, 1.0 Para cada sistema Para cada consulta Calcule a Revocação e Precisão para cada documento relevante retornado, levando em conta a ordem de retorno Assuma inicialmente Precisão igual a zero para níveis de Revocação não informados Interpole os valores de Precisão para cada nível de Revocação intermediário, tomando a Precisão igual ao valor máximo de Precisão para níveis de Revocação maiores Calcule a média de Precisão para cada nível de Revocação de todas as consultas Ligue os pontos para determinar a curva de Precisão por Revocação 27
28 Exemplo: Sistema 1, Consulta 1 Levando em conta que existem 3 documentos relevantes Retornado Documento Relevante Revocação Precisão 1 D1 SIM 0,33 1,00 2 D2 NÃO 3 D3 SIM 0,67 0,67 4 D5 NÃO 5 D4 SIM 1,00 0,60 R P F 0 0,1 0,2 0,3 1 0,46 0,4 0,5 0,6 0,67 0,63 0,7 0,8 0,9 1 0,6 0,75 R P F 0 1 0,00 0,1 1 0,18 0,2 1 0,33 0,3 1 0,46 0,4 0,67 0,50 0,5 0,67 0,57 0,6 0,67 0,63 0,7 0,6 0,65 0,8 0,6 0,69 0,9 0,6 0,72 1 0,6 0,75 28
29 Exemplo: Sistema 1, Consulta 1 Levando em conta que existem 3 documentos relevantes Retornado Documento Relevante Revocação Precisão 1 D1 SIM 0,33 1,00 2 D2 NÃO 3 D3 SIM 0,67 0,67 4 D5 NÃO 5 D4 SIM 1,00 0,60 R P F 0 1 0,00 0,1 1 0,18 0,2 1 0,33 0,3 1 0,46 0,4 0,67 0,50 0,5 0,67 0,57 0,6 0,67 0,63 0,7 0,6 0,65 0,8 0,6 0,69 0,9 0,6 0,72 1 0,6 0,75 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Precisão x Revocação 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 29
30 Exemplo: Sistema 1, Consulta 2 Levando em conta que existem 5 documentos relevantes Retornado Documento Relevante Revocação Precisão 1 D1 SIM 0,20 1,00 2 D2 NÃO 3 D3 SIM 0,40 0,67 4 D5 NÃO 6 D6 SIM 0,60 0,50 10 D9 SIM 0,80 0,40 R P F 0 0,1 0,2 1 0,33 0,3 0,4 0,67 0,50 0,5 0,6 0,5 0,55 0,7 0,8 0,4 0,53 0,9 1 R P F 0 1 0,00 0,1 1 0,18 0,2 1 0,33 0,3 0,67 0,41 0,4 0,67 0,50 0,5 0,5 0,50 0,6 0,5 0,55 0,7 0,4 0,51 0,8 0,4 0,53 0,9 0 0, ,00 30
31 Exemplo: Sistema 1, Consulta 2 Levando em conta que existem 5 documentos relevantes Retornado Documento Relevante Revocação Precisão 1 D1 SIM 0,20 1,00 2 D2 NÃO 3 D3 SIM 0,40 0,67 4 D5 NÃO 6 D6 SIM 0,60 0,50 10 D9 SIM 0,80 0,40 R P F Precisão x Revocação 0 1 0,00 1 0,1 1 0,18 0,9 0,2 1 0,33 0,8 0,3 0,67 0,41 0,7 0,4 0,67 0,50 0,6 0,5 0,5 0,50 0,5 0,4 0,6 0,5 0,55 0,3 0,7 0,4 0,51 0,2 0,8 0,4 0,53 0,1 0,9 0 0, ,00 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 31
32 Exemplo: Sistema 1 Consulta 1 R P F 0 1 0,00 0,1 1 0,18 0,2 1 0,33 0,3 1 0,46 0,4 0,67 0,50 0,5 0,67 0,57 0,6 0,67 0,63 0,7 0,6 0,65 0,8 0,6 0,69 0,9 0,6 0,72 1 0,6 0,75 Consulta 2 R P F 0 1 0,00 0,1 1 0,18 0,2 1 0,33 0,3 0,67 0,41 0,4 0,67 0,50 0,5 0,5 0,50 0,6 0,5 0,55 0,7 0,4 0,51 0,8 0,4 0,53 0,9 0 0, ,00 Média da Precisão R P F 0 1 0,00 0,1 1 0,18 0,2 1 0,33 0,3 0,835 0,44 0,4 0,67 0,50 0,5 0,585 0,54 0,6 0,585 0,59 0,7 0,5 0,58 0,8 0,5 0,62 0,9 0,3 0,45 1 0,3 0,46 32
33 Exemplo: Sistema 1, Curva de Precisão Média 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0, ,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0, ,9 0,8 0,7 0,6 Precisão x Revocação 1 0,9 0,8 0,7 0,6 0,5 0,4 0,5 0,4 0,3 0,2 0, ,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0,3 0,2 0, ,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 33
34 Comparando dois ou mais Sistemas Fazendo o mesmo para o Sistema 2 E plotando o gráfico com as duas curvas (Sistema 1 e Sistema 2) A curva mais próxima do canto superior direito do gráfico indica melhor desempenho 1 0,8 NoStem Stem Precisão 0,6 0,4 0,2 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 Cobertura 34
35 Média da Precisão Média (MAP) É uma medida que resume a um único número o desempenho de um sistema para uma consulta Precisão Média (AP) - Consiste na média dos valores de precisão por documento relevante para a consulta (total de documentos relevantes na coleção para a consulta) Média da Precisão Média - média dos valores de AP para várias consultas a fim de obter um único número que resume o desempenho de um sistema 35
36 Precisão Média (AP) Para o exemplo do sistema 1, consulta 1 Total de documentos relevantes para a consulta: 3 Retornado Documento Relevante Revocação Precisão 1 D1 SIM 0,33 1,00 2 D2 NÃO 3 D3 SIM 0,67 0,67 4 D5 NÃO 5 D4 SIM 1,00 0,60 1,0 0,67 0,60 AP 3 2,27 3 0,76 36
37 Precisão Média (AP) Para o exemplo do sistema 1, consulta 2 Total de documentos relevantes para a consulta: 5 Retornado Documento Relevante Revocação Precisão 1 D1 SIM 0,20 1,00 2 D2 NÃO 3 D3 SIM 0,40 0,67 4 D5 NÃO 6 D6 SIM 0,60 0,50 10 D9 SIM 0,80 0,40 AP 1,00 0,67 0,50 0,40 5 2,57 5 0,51 37
38 Média da Precisão Média (MAP) Pode-se calcular a média destes valores para várias consultas a fim de obter um único número que resume o desempenho de um sistema Média Aritmética Dominada por valores grandes de precisão média MAP 0,76 0,51 2 1,27 2 0,64 Média Harmônica (hmap) ou Média Geométrica (gmap) Dominadas por valores pequenos de precisão média hmap 0,61 gmap ,760,51 2 0,39 0, 62 1,32 1,96 3,28 0,76 0,51 38
39 Outros Fatores a Considerar Esforço do Usuário tempo gasto pelo usuário em formular consultas, conduzir a busca, e verificar os resultados Tempo de resposta Intervalo de tempo entre o recebimento da consulta do usuário e a apresentação das respostas do sistema Forma de apresentação influência do formato dos resultados da busca sobre a habilidade do usuário em utilizar o material recuperado 39
40 Experimentos e Coleções benchmark Desempenho deve ser medido para um dado conjunto de documentos, consultas, e julgamento de relevância Dados de desempenho são válidos apenas para o ambiente no qual o sistema foi avaliado Algumas coleções de referência: TREC (news, articles, patents, etc.) CACM (Computer Science Literature) ISI (Information Science Literature) 40
41 Referências (BAEZA-YATES, RIBEIRO-NETO 2013) BAEZA-YATES, R.; RIBEIRO-NETO, B. Recuperação de informação: conceitos e tecnologia das máquinas de busca. 2. ed. Porto Alegre: Bookman, Capítulo 3 41
Medidas de Avaliação
Medidas de Avaliação Medidas de Avaliação Para a maioria dos sistemas computacionais é necessário criar medidas para aferir sua eficácia e eficiência; A medida mais comum é o tempo e o espaço. Quanto menor
Leia maisProfª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni
Profª Ana Lúcia Lima Marreiros Maia Profª Fabiana Cristina Bertoni Motivação e Objetivos Etapas do Desenvolvimento de um Sistema de Recuperação de Informações (SRI): Pré-processamento; Representação; Extração
Leia maisMedidas de Avaliação. Após a execução de uma busca, pode-se dividir os documentos do corpus nos seguintes conjuntos: Recuperados não recuperados
Medidas de Avaliação Após a execução de uma busca, pode-se dividir os documentos do corpus nos seguintes conjuntos: Relevantes não-relevantes Recuperados não recuperados 1 Documentos úteis para atender
Leia maisAvaliação da Recuperação
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Avaliação de sistemas de busca Podemos avaliar
Leia maisGestão e Recuperação de Informação. Avaliação em Sistemas de Recuperação de Informação. José Borbinha DEI/IST
Gestão e Recuperação de Informação Avaliação em Sistemas de Recuperação de Informação José Borbinha DEI/IST Problema: Como avaliar um sistema de RI? 2 Comecemos, analisando um exemplo... 3 Exemplo... 4
Leia maisAvaliação de Desempenho de SRI
Avaliação de Desempenho de SRI Desempenho espaço x tempo é usual em computação quão preciso é o conjunto resposta (ranking) é usual em SRI Avaliação baseada em coleção de referência = documentos + consultas
Leia maisMineração de Textos. Mineração de Textos
Mineração de Textos Os estudos em Aprendizado de Máquina normalmente trabalham com dados estruturados Entretanto, uma grande quantidade de informação é armazenada em textos, que são dados semi-estruturados
Leia mais4 Recuperação de Informação
4 Recuperação de Informação No presente capítulo são apresentados os fundamentos da área de Recuperação de Informação utilizados em Mineração de Textos, como por exemplo, os modelos de representação de
Leia maisOrganizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Realimentaçãode relevânciae expansão de consultas Organização e Recuperação de Informação(GSI521) Realimentação de
Leia maisRealimentação de Relevância
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Ciclo de realimentação onde uma consulta q recebida do usuário é transformada em uma consulta modificada
Leia maisRecuperação de Informações
Recuperação de Informações Ana Carolina Salgado & Fernando Fonseca Comparação (matching) Dados Inferência Modelo Ling Consulta Esp da Consulta Recuperação de Dado X Informação Recuperação de Recuperação
Leia maisGSI024 - Organização e Recuperação da
GSI024 - Organização e Recuperação da Informação Ilmério Reis da Silva ilmerio@facom.ufu.br Arquivo 7 - Avaliação GSI024-ORI Pg:7. 1 Sumário de resultados Tornando os resultado úteis ao usuário Como avaliar
Leia maisIndexação. Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília
Indexação Profa. Lillian Alvares Faculdade de Ciência da Informação Universidade de Brasília 1 Penso, logo existo. Brincadeira feita por Fernando Modesto MODESTIKUS, Bibliotecário Grego René Descartes
Leia maisUm estudo sobre diferentes modelos de Recuperação de Informação em documentos semi-estruturados (XML) -
Um estudo sobre diferentes modelos de Recuperação de Informação em documentos semi-estruturados (XML) - Implementação, Análise, Avaliação e Comparação Autor: Mirella Silva Junqueira 1, Orientador: Prof.
Leia maisRecuperação de Dado X Informação. Gerenciamento de Dados e Informação. Histórico. Recuperação de Informação. Histórico. Histórico
Recuperação de Dado X Informação Gerenciamento de Dados e Informação Recuperação de Informação Fernando Fonseca Ana Carolina Robson Fidalgo Comparação (matching) Recuperação de Dados Exata Recuperação
Leia maisLista de exercícios 2 Recuperação de Informação Textual
Lista de exercícios 2 Recuperação de Informação Textual 2 de dezembro de 2015 0.1 O que é o modelo bag-of-words? Porque ele é uma simplificação? Dê um exemplo em que ele estaria incorreto. 0.2 O que é
Leia maisDesenvolvimento de um Web Crawler para indexação de documentos científicos
Desenvolvimento de um Web Crawler para indexação de documentos científicos Heitor de Sousa Miranda¹, Rafael Gonçalves Barreira², Edeilson Milhomem da Silva³ Curso de Sistemas de Informação - CEULP/ULBRA
Leia maisAvaliação de desempenho
Universidade Federal do Rio Grande do Sul Instituto de Informática Organização de Computadores Aula 9 Avaliação de desempenho INF01113 Organização de Computadores 9-1 Avaliação de desempenho 1. Introdução
Leia maisMÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL
MÉTODOS QUANTITATIVOS PARA CIÊNCIA DA COMPUTAÇÃO EXPERIMENTAL Pedro Henrique Bragioni Las Casas Pedro.lascasas@dcc.ufmg.br Apresentação baseada nos slides originais de Jussara Almeida e Virgílio Almeida
Leia maisOrganizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU
Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Pré-processamento de documentos Organização e Recuperação de Informação(GSI521) Introdução O pré-processamento de
Leia maisRickson Guidolini Orientador: Nivio Ziviani Co-orientador: Adriano Veloso
Detecção de Réplicas de Sítios Web em Máquinas de Busca Usando Aprendizado de Máquina Rickson Guidolini Orientador: Nivio Ziviani Co-orientador: Adriano Veloso Universidade Federal de Minas Gerais LATIN
Leia maisUniversidade do Sul de Santa Catarina Ciência da Computação Aula 09 Introdução a Análise de Textos Prof. Max Pereira
Universidade do Sul de Santa Catarina Ciência da Computação Técnicasde InteligênciaArtificial Aula 09 Introdução a Análise de Textos Prof. Max Pereira Processamento de Linguagem Natural Conjunto de técnicas
Leia maisLinguagens Documentárias. Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília
Linguagens Documentárias Profa. Lillian Alvares Faculdade de Ciência da Informação, Universidade de Brasília Contexto Organização da Informação...... procura criar métodos e instrumentos para elaborar
Leia mais3 Recuperação de Informações Textuais
3 Recuperação de Informações Textuais Tudo deveria se tornar o mais simples possível, mas não simplificado. Albert Einstein Sistemas tradicionais de indexação costumam utilizar-se de termos-índice, que
Leia maisAvaliação Sistemas de Recuperação da Informação
Avaliação Sistemas de Recuperação da Informação Prof. Rodrigo Tripodi Calumby DEXA / UEFS rtcalumby@ecomp.uefs.br Por que? Ex.: Projeto de Aviões Teste em simuladores e experimentos Construção e teste
Leia maisModelo Probabilístico
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Proposto em 1976 por Roberstson e Sparck Jones;
Leia maisCitações e fator de impacto não refletem relevância clínica da informação em saúde
Citações e fator de impacto não refletem relevância clínica da informação em saúde Prof. Dr. Ivan Luiz Marques Ricarte (UNICAMP, Brasil) Prof. Dr. Maria Cristiane Barbosa Galvão (USP, Brasil) Prof. Dr.
Leia maisCréditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores
SCC0173 Mineração de Dados Biológicos Classificação IV: Avaliação de Classificadores Créditos O material a seguir consiste de adaptações e extensões dos originais: gentilmente cedidos pelo rof. André C..
Leia maisGeração de um Perfil de Qualidade para Fontes de Dados Dinâmicas
Geração de um Perfil de Qualidade para Fontes de Dados Dinâmicas Everaldo Neto, Bernadette Lóscio, Ana Carolina Salgado (ecsn, bfl, acs)@cin.ufpe.br Universidade Federal de Pernambuco UFPE Centro de Informática
Leia maisIntrodução à Ciência da Computação II
Introdução à Ciência da Computação II Análise de Algoritmos: Parte I Prof. Ricardo J. G. B. Campello Este material consiste de adaptações e extensões de slides disponíveis em http://ww3.datastructures.net
Leia maisDESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING. Aluno José Lino Uber. Orientador Paulo Roberto Dias
DESCOBERTA DO CONHECIMENTO COM O USO DE TEXT MINING APLICADA AO SAC TEXT MINING Aluno José Lino Uber Orientador Paulo Roberto Dias Dezembro/2004 Roteiro Introdução Objetivo Conceitos Motivação / Tipos
Leia maisMelhorando a Recuperação de Informação
Recuperação de Informação e Web Mining 1 Melhorando a Recuperação de Informação O modelo de espaço vetorial Utiliza pesos para termos Permite o ranqueamento dos resultados Pode reduzir a dimensão do espaço
Leia maisInterpolação polinomial
Cálculo Numérico Prof. Daniel G. Alfaro Vigo dgalfaro@dcc.ufrj.br Departamento de Ciência da Computação IM UFRJ Motivação: População do Brasil Ano População (milhões) 1960 70, 992343 1970 94, 508583 1980
Leia maisEstatística Descritiva
C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística
Leia maisOrientações de resposta ATIVIDADES FORMATIVAS 3
Orientações de resposta ATIVIDADES FORMATIVAS 3 1 ORIENTAÇÕES DE RESPOSTA DAS ATIVIDADES FORMATIVAS De notar que, além da capacidade de refletir sobre os conteúdos estudados, é um fator importante para
Leia maisModelo Booleano Wendel Melo
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Modelo simples; Baseado em teoria dos conjuntos
Leia maisInteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]
Inteligência Artificial Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo] Aprendizagem de Máquina Área da Inteligência Artificial cujo objetivo é o desenvolvimento de técnicas computacionais sobre
Leia maisCircuitos resistivos alimentados com onda senoidal
Circuitos resistivos alimentados com onda senoidal 3 3.1 Material resistores de 1 kω e 100 Ω. 3.2 Introdução Nas aulas anteriores estudamos o comportamento de circuitos resistivos com tensão constante.
Leia maisEstatística. 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão. Renata Souza
Estatística 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão Renata Souza Medidas Depois que você conheceu os conceitos de coleta de dados, variação, causas comuns e causas especiais,
Leia maisBC1424 Algoritmos e Estruturas de Dados I Aula 05 Custos de um algoritmo e funções de complexidade
BC1424 Algoritmos e Estruturas de Dados I Aula 05 Custos de um algoritmo e funções de complexidade Prof. Jesús P. Mena-Chalco 1Q-2016 1 1995 2015 2 Custo de um algoritmo e funções de complexidade Introdução
Leia maisPré-Processamento de Documentos
Pré-Processamento de Documentos Introdução Pré-Processamento : Análise léxica; Stopwords; Stemming; Vocabulário; Thesaurus Compressão: Fundamentos; Método Estatístico; Método Dicionário; Arquivos Invertidos
Leia maisTransformando dados em resultados. Fernando Cassão Engenheiro de Vendas Marco Amorim Engenheiro de Vendas
Gerenciamento de dados técnicos: Transformando dados em resultados Fernando Cassão Engenheiro de Vendas Marco Amorim Engenheiro de Vendas O Desafio dos Dados Nós podemos criar e coletar dados complexos
Leia maisSSC643 -Avaliação de Desempenho de Sistemas Computacionais -
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação SSC643 -Avaliação de Desempenho de Sistemas Computacionais - Aula 2 Sarita Mazzini Bruschi
Leia maisSSC546 -Avaliação de Desempenho de Sistemas
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação SSC546 -Avaliação de Desempenho de Sistemas Parte 1 -Aula 2 Sarita Mazzini Bruschi Material
Leia maisAvaliação de Descritores de Imagem
Avaliação de Descritores de Imagem André Tavares da Silva andre.silva@udesc.br Descritor O par descritor de imagem e função de distância descreve como as imagens de uma coleção estão distribuídas no espaço
Leia maisMais Informações sobre Itens do Relatório
Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo
Leia maisEstatística Aplicada Professor: André Luiz Araújo Cunha. Moda. Media
Estatística Aplicada Professor: André Luiz Araújo Cunha Moda Define-se moda como sendo: o valor que surge com mais freqüência se os dados são discretos, ou, o intervalo de classe com maior freqüência se
Leia maisGQS Medidas. André Luís Duarte. exatasfepi.com.br
exatasfepi.com.br GQS Medidas André Luís Duarte O que adquire entendimento ama a sua alma; o que cultiva a inteligência achará o bem. Provérbios 19:8 Qualidade de software Papel dos números Fontes de ruído
Leia maisvariável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência
REGRESSÃO LOGÍSTICA É uma técnica recomendada para situações em que a variável dependente é de natureza dicotômica ou binária. Quanto às independentes, tanto podem ser categóricas ou não. A regressão logística
Leia maisMedindo o Custo de Vida. 23. Medindo o Custo de Vida. Medindo o Custo de Vida. O Que é Um Índice? Calculando o Índice e a Inflação
23. Medindo o Custo de Vida Medindo o Custo de Vida Para determinar o custo de vida, o governo ou os institutos definem uma cesta de bens e serviços que um consumidor típico adquire Anualmente essas instituições
Leia maisAula 2: Planejamento da RS
Universidade de São Paulo Instituto de Ciências Matemática e de Computação SSC 5905 - Revisão Sistemática Aula 2: da RS Profa. Dra. Elisa Yumi Nakagawa 1. Semestre de 2013 Processo de Revisão Sistemática
Leia maisEngenharia de Software II
Engenharia de Software II Aula 19 http://www.ic.uff.br/~bianca/engsoft2/ Aula 19-28/05/2006 1 Ementa Processos de desenvolvimento de software Estratégias e técnicas de teste de software Métricas para software
Leia maisANÁLISE DE ALGORITMOS: PARTE 1. Prof. André Backes. Como resolver um problema no computador? Precisamos descrevê-lo de uma forma clara e precisa
ANÁLISE DE ALGORITMOS: PARTE 1 Prof. André Backes Algoritmos 2 Como resolver um problema no computador? Precisamos descrevê-lo de uma forma clara e precisa Precisamos escrever o seu algoritmo Um algoritmo
Leia maisPré-processamento de dados
Pré-processamento de dados Clodoaldo A. M. Lima, Sarajane M. Peres 13 de agosto de 2015 Programa de Pós-Graduação em Sistemas de Informação Mestrado acadêmico - EACH - USP http://ppgsi.each.usp.br Clodoaldo
Leia maisMedidas de dispersão. 23 de agosto de 2018
23 de agosto de 2018 Dispersão de dados A representação feita pelas medidas centrais, ao mesmo tempo que permite uma visualização rápida das informações acaba levando ao embaralhamento do conjunto. A média
Leia maisi j i i Y X X X i j 1 i 2 i i
Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão
Leia maisNews Clipping. Como calcular ângulos entre notícias pode ajudar na prevenção à lavagem de dinheiro. Willian Gigliotti
News Clipping Como calcular ângulos entre notícias pode ajudar na prevenção à lavagem de dinheiro Willian Gigliotti wgigliotti@gmail.com Departamento de Ciências da Computação Instituto de Matemática e
Leia maisDados Internacionais de Catalogação na Publicação (CIP)
Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Expansão de Consultas com Realimentação e Pseudo Realimentação de Relevantes
Leia maisIndexação e Construção de Índice. Renato Fernandes Corrêa
Indexação e Construção de Índice Renato Fernandes Corrêa Indexação de documentos Consiste de três passos: 1. Definição do vocabulário de indexação 2. Indexação - atribuição de termos de indexação a cada
Leia maisAlgoritmos e Estruturas de Dados II. Trabalho Prático 4
Algoritmos e Estruturas de Dados II Trabalho Prático 4 Entrega: 23/11/09 Devolução: 10/12/09 (sem possibilidade de entrega com atraso) Trabalho em dupla Prof. Jussara Marques de Almeida Problema 1: Construção
Leia maisUma Abordagem de Componentes Combinados. para a Geração de Funções de Ordenação. usando Programação Genética. Humberto Mossri de Almeida
Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Ciência da Computação Uma Abordagem de Componentes Combinados para a Geração de Funções de Ordenação usando Programação
Leia maisEstudo de Validade feito por Spectrum Assessments Avaliação de Índice Comportamental
Estudo de Validade feito por Spectrum Assessments Avaliação de Índice Comportamental Insight.lideracoaching.com.br 1 Introdução A Avaliação O Índice Comportamental Spectrum Assessments foi desenvolvido
Leia mais05/06/2017. Representar graficamente uma análise econômica de investimentos;
As decisões de investimento em alternativas e projetos de economia e uso eficiente da energia passam, necessariamente, por uma análise de viabilidade econômica. Estas análises, em geral, utilizam-se de
Leia maisENGENHARIA DE USABILIDADE. Unidade IV Avaliação. Luiz Leão
Unidade IV Avaliação Luiz Leão luizleao@gmail.com http://www.luizleao.com Conteúdo Programático Técnicas de Avaliação de Usabilidade Avaliação Heurística Inspeção por meio de lista de verificação Ensaio
Leia maisModelo Espaço Vetorial. Mariella Berger
Modelo Espaço Vetorial Mariella Berger Agenda Introdução Atribuição de Pesos Frequência TF-IDF Similaridade Exemplo Vantagens e Desvantagens Modelo Espaço Vetorial Introdução Modelo Espaço Vetorial O modelo
Leia maisAplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo TR+
Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Programa de Pós-Graduação em Ciência da Computação Aplicação de uma Técnica Tradicional de Expansão de Consulta ao Modelo
Leia maisEngenharia de Software II
Engenharia de Software II Aula 12 http://www.ic.uff.br/~bianca/engsoft2/ Aula 12-31/05/2006 1 Ementa Processos de desenvolvimento de software (Caps. 2, 3 e 4 do Pressman) Estratégias e técnicas de teste
Leia maisBiblioteca Acadêmico Luiz Viana Filho do Senado Federal. O papel da informação e da Biblioteca do Senado Federal no Assessoramento Legislativo
Biblioteca Acadêmico Luiz Viana Filho do Senado Federal O papel da informação e da Biblioteca do Senado Federal no Assessoramento Legislativo HELENA CELESTE VIEIRA Diretora da Subsecretaria de Pesquisa
Leia maisFabrício Jailson Barth. Recuperação de documentos e pessoas em ambientes empresariais através de árvores de decisão
Fabrício Jailson Barth Recuperação de documentos e pessoas em ambientes empresariais através de árvores de decisão São Paulo 2009 Fabrício Jailson Barth Recuperação de documentos e pessoas em ambientes
Leia maisEXPERIÊNCIA M018-TE CONSTANTE ELÁSTICA DA MOLA
UFSC CFM DEPARTAMENTO DE FÍSICA LABORATÓRIO DE MECÂNICA, ACÚSTICA E TERMODINÂMICA EXPERIÊNCIA M018-TE CONSTANTE ELÁSTICA DA MOLA 1 OBJETIVOS Determinar experimentalmente o valor da constante elástica k
Leia maisAula 02: Custos de um algoritmo e funções de complexidade
MCTA028 Programação Estruturada Aula 02: Custos de um algoritmo e funções de complexidade Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 3Q-20106 1 Linguagem C: Tipos de dados 2 Linguagem C: Tipos
Leia maisUsando a Bibliometria para a Avaliação de informação e Gestão de Pesquisa e Publicação Científica
Usando a Bibliometria para a Avaliação de informação e Gestão de Pesquisa e Publicação Científica Deborah Dias Gerente Treinamento e Suporte - Brasil Thomson Reuters Scientific & Health Care Division DEBORAH.DIAS@THOMSONREUTERS.COM
Leia maisArquivos invertidos 39
Arquivos invertidos 39 Arquivos invertidos É um mecanismo que utiliza palavras para indexar uma coleção de documentos a fim de facilitar a busca e a recuperação Estruturas de um arquivo invertido Vocabulário
Leia maisi j i i Y X X X i j i i i
Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão
Leia maisModelos Evolucionários e Tratamento de Incertezas
Ciência da Computação Modelos Evolucionários e Tratamento de Incertezas Aula 05 Teoria dos Conjuntos Difusos Max Pereira CONJUNTOS CLÁSSICOS Teoria dos Conjuntos é o estudo da associação entre objetos
Leia maisIntrodução à Ciência da Computação II
Introdução à Ciência da Computação II 2semestre/200 Prof Alneu de Andrade Lopes Apresentação com material gentilmente cedido pelas profas Renata Pontin Mattos Fortes http://wwwicmcuspbr/~renata e Graça
Leia maisReciis Rev Eletron Comun Inf Inov Saúde nov.;11(sup) [www.reciis.icict.fiocruz.br] e-issn
pecha kucha Ciência de Dados aplicada ao Arca: desenvolvimento e disponibilização de ferramentas para recuperação da informação no Repositório Institucional da Fundação Oswaldo Cruz Data Science applied
Leia maisPCS 2039 Modelagem e Simulação de Sistemas Computacionais
UNIVERSIDADE DE SÃO PAULO ESCOLA POLITÉCNICA Departamento de Engenharia de Computação e Sistemas Digitais PCS 2039 Modelagem e Simulação de Sistemas Computacionais Graduação em Engenharia de Computação
Leia maisTE231 Capitulo 2 Zeros de Funções; Prof. Mateus Duarte Teixeira
TE231 Capitulo 2 Zeros de Funções; Prof. Mateus Duarte Teixeira Sumário 1. Como obter raízes reais de uma equação qualquer 2. Métodos iterativos para obtenção de raízes 1. Isolamento das raízes 2. Refinamento
Leia maisTS04. Teste de Software PLANOS DE TESTE. COTI Informática Escola de Nerds
TS04 Teste de Software PLANOS DE TESTE COTI Informática Escola de Nerds 1. PLANOS DE TESTE. Tipos de Testes de Software Teste Funcional Uma especificação funcional é uma descrição do comportamento esperado
Leia maisAs outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis.
RESUMO Medidas de Posição são as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência As medidas
Leia maisMineração de Dados em Biologia Molecular
Mineração de Dados em Biologia Molecular André C.. L. F. de Carvalho Monitor: Valéria Carvalho lanejamento e Análise de Experimentos rincipais tópicos Estimativa do erro artição dos dados Reamostragem
Leia maisPlano de Ensino. Identificação. Câmpus de Bauru. Curso Física. Ênfase. Disciplina A - Laboratório de Física IV
Curso 1605 - Física Ênfase Identificação Disciplina 0004218A - Laboratório de Física IV Docente(s) Americo Sheitiro Tabata Unidade Faculdade de Ciências Departamento Departamento de Física Créditos 2 T:30
Leia maisCircuitos resistivos alimentados com onda senoidal
Experimento 5 Circuitos resistivos alimentados com onda senoidal 5.1 Material Gerador de funções; osciloscópio; multímetro; resistor de 1 kω; indutores de 9,54, 23,2 e 50 mh. 5.2 Introdução Nas aulas anteriores
Leia maisModelo Booleano Wendel Melo
Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Profª Vanessa Braganholo - IC/UFF Modelo simples; Baseado em teoria dos conjuntos
Leia maisBUSCA EM ARRAYS. Prof. André Backes. Ato de procurar por um elemento em um conjunto de dados
BUSCA EM ARRAYS Prof. André Backes Definição 2 Ato de procurar por um elemento em um conjunto de dados Recuperação de dados armazenados em um repositório ou base de dados A operação de busca visa responder
Leia mais5 Experimentos Conjunto de Dados
Experimentos 48 5 Experimentos Este capítulo apresenta o ambiente experimental utilizado para validar o método de predição do CTR proposto neste trabalho. Na seção 5.1, descrevemos a geração do conjunto
Leia maisPlano de Ensino. Identificação. Câmpus de Bauru
Curso 1503 1504 1505 - Licenciatura em Matemática 1603 1604 1605 - Física 1701 - Bacharelado em Meteorologia 2103 - Bacharelado em Ciência da Computação 2902B 2903B - Bacharelado em Química Ambiental Tecnológica
Leia maisRaciocínio Baseado em Casos (Case Based Reasoning CBR)
Inteligência Artificial Escola de Verão 2007 Laboratório Associado de Computação e Matemática Aplicada LAC Raciocínio Baseado em Casos (Case Based Reasoning CBR) www.lac.inpe.br/~demisio/ia_lac.html Paradigma
Leia maisRecuperação de Imagens da Web Utilizando Múltiplas Evidências Textuais e Programação Genética
Recuperação de Imagens da Web Utilizando Múltiplas Evidências Textuais e Programação Genética Katia C. L. Santos 1, Humberto M. Almeida 1, Marcos A. Gonçalves 1, Ricardo da S. Torres 2 1 Departamento de
Leia mais03/07/2017. Modelo de Recuperação de Informação
Modelo de Recuperação de Informação Modelo de Recuperação de Informação Um modelo de recuperação de informação é a especificação formal de três elementos: a representação dos documentos; a representação
Leia maisCircuitos resistivos alimentados com onda senoidal. Indutância mútua.
Capítulo 6 Circuitos resistivos alimentados com onda senoidal. Indutância mútua. 6.1 Material Gerador de funções; osciloscópio; multímetro; resistor de 1 kω; indutores de 9,54, 23,2 e 50 mh. 6.2 Introdução
Leia maisCircuitos resistivos alimentados com onda senoidal
Circuitos resistivos alimentados com onda senoidal 5 5.1 Material Gerador de funções; osciloscópio; multímetro; resistor de 1 kω; indutores de 9,54, 23,2 e 50 mh. 5.2 Introdução Nas aulas anteriores estudamos
Leia maisUma publicação de 78 Anos. Desde 1932
Uma publicação de 78 Anos Desde 1932 Annual Reviews - Síntese de importantes pesquisas em 37 diferentes disciplinas que envolvem Biomedicina, Ciências da Vida, Física e Ciências Sociais. - Os artigos são
Leia maisAULA 07 Inferência a Partir de Duas Amostras
1 AULA 07 Inferência a Partir de Duas Amostras Ernesto F. L. Amaral 10 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola,
Leia maisAVALIAÇÃO DA QUALIDADE DO USO DE WAVELETS PARA RECUPERAÇÃO, CLASSIFICAÇÃO E AGRUPAMENTO DA INFORMAÇÃO TEXTUAL. Fabrício Raphael Silva Ferreira
AVALIAÇÃO DA QUALIDADE DO USO DE WAVELETS PARA RECUPERAÇÃO, CLASSIFICAÇÃO E AGRUPAMENTO DA INFORMAÇÃO TEXTUAL Fabrício Raphael Silva Ferreira Dissertação de Mestrado apresentada ao Programa de Pós-graduação
Leia maisClassificação Automática de Gêneros Musicais
Introdução Método Experimentos Conclusões Utilizando Métodos de Bagging e Boosting Carlos N. Silla Jr. Celso Kaestner Alessandro Koerich Pontifícia Universidade Católica do Paraná Programa de Pós-Graduação
Leia mais