O modelo espaço de vetores. vetorial. Marcelo Keese Albertini. Faculdade de Computação - UFU 12/03/2013. O modelo de espaço vetorial 1 / 27

Tamanho: px
Começar a partir da página:

Download "O modelo espaço de vetores. vetorial. Marcelo Keese Albertini. Faculdade de Computação - UFU 12/03/2013. O modelo de espaço vetorial 1 / 27"

Transcrição

1 Recuperação de Informação: O modelo de espaço vetorial Marcelo Keese Albertini Faculdade de Computação - UFU 12/03/2013 O modelo de espaço vetorial 1 / 27

2 Veremos hoje Modelo de espaço de vetores: representação vetorial O modelo de espaço vetorial 2 / 27

3 Matriz de incidência binária Marco Júlio A Hamlet Otelo Macbeth... Antônio César Tempestade Antônio Brutus César Calpúrnia Cleópatra Cada documento é representado como um vetor binário {0,1} V. O modelo de espaço vetorial 3 / 27

4 Matriz de incidência binária Marco Júlio A Hamlet Otelo Macbeth... Antônio César Tempestade Antônio Brutus César Calpúrnia Cleópatra Cada documento é representado como um vetor binário {0,1} V. O modelo de espaço vetorial 3 / 27

5 Matriz de contagem Marco Júlio A Hamlet Otelo Macbeth... Antônio César Tempestade Antônio Brutus César Calpurnia Cleópatra Cada documento é representado como vetor de contagem N V. O modelo de espaço vetorial 4 / 27

6 Matriz de contagem Marco Júlio A Hamlet Otelo Macbeth... Antônio César Tempestade Antônio Brutus César Calpurnia Cleópatra Cada documento é representado como vetor de contagem N V. O modelo de espaço vetorial 4 / 27

7 Outline 1 O modelo espaço de vetores O modelo de espaço vetorial 5 / 27

8 Matriz de incidência binária Marco Júlio A Hamlet Otelo Macbeth... Antônio César Tempestade Antônio Brutus César Calpúrnia Cleópatra Cada documento é representado como um vetor binário {0,1} V. O modelo de espaço vetorial 6 / 27

9 Matriz de contagem Marco Júlio A Hamlet Otelo Macbeth... Antônio César Tempestade Antônio Brutus César Calpurnia Cleópatra Cada documento é representado como vetor de contagem N V. O modelo de espaço vetorial 7 / 27

10 Binário contagem matriz de pesos Marco Júlio A Hamlet Otelo Macbeth... Antônio César Tempestade Antônio Brutus César Calpúrnia Cleópatra misericórdia pior Cada documento é representado como um vetor de valores reais de pesos tf-idf R V. O modelo de espaço vetorial 8 / 27

11 Binário contagem matriz de pesos Marco Júlio A Hamlet Otelo Macbeth... Antônio César Tempestade Antônio Brutus César Calpúrnia Cleópatra misericórdia pior Cada documento é representado como um vetor de valores reais de pesos tf-idf R V. O modelo de espaço vetorial 8 / 27

12 Documentos na forma de vetores O modelo de espaço vetorial 9 / 27

13 Documentos na forma de vetores Cada documento é representado em um vetor de pesos tf-idf R V. O modelo de espaço vetorial 9 / 27

14 Documentos na forma de vetores Cada documento é representado em um vetor de pesos tf-idf R V. Então temos um espaço vetorial com V dimensões. O modelo de espaço vetorial 9 / 27

15 Documentos na forma de vetores Cada documento é representado em um vetor de pesos tf-idf R V. Então temos um espaço vetorial com V dimensões. Termos são eixos do espaço. O modelo de espaço vetorial 9 / 27

16 Documentos na forma de vetores Cada documento é representado em um vetor de pesos tf-idf R V. Então temos um espaço vetorial com V dimensões. Termos são eixos do espaço. Documentos são pontos ou vetores nesse espaço. O modelo de espaço vetorial 9 / 27

17 Documentos na forma de vetores Cada documento é representado em um vetor de pesos tf-idf R V. Então temos um espaço vetorial com V dimensões. Termos são eixos do espaço. Documentos são pontos ou vetores nesse espaço. Alto número de dimensões: dezenas de milhões de dimensões em mecanismos de busca O modelo de espaço vetorial 9 / 27

18 Documentos na forma de vetores Cada documento é representado em um vetor de pesos tf-idf R V. Então temos um espaço vetorial com V dimensões. Termos são eixos do espaço. Documentos são pontos ou vetores nesse espaço. Alto número de dimensões: dezenas de milhões de dimensões em mecanismos de busca Cada vetor é muito espaço (maior parte das dimensões é zero) O modelo de espaço vetorial 9 / 27

19 Consultas como vetores O modelo de espaço vetorial 10 / 27

20 Consultas como vetores Ideia 1: fazer o mesmo para as consultas: representar no espaço de alta-dimensionalidade O modelo de espaço vetorial 10 / 27

21 Consultas como vetores Ideia 1: fazer o mesmo para as consultas: representar no espaço de alta-dimensionalidade Ideia 2: Rankear documentos de acordo com sua proximidade à consulta O modelo de espaço vetorial 10 / 27

22 Consultas como vetores Ideia 1: fazer o mesmo para as consultas: representar no espaço de alta-dimensionalidade Ideia 2: Rankear documentos de acordo com sua proximidade à consulta proximidade = similaridade O modelo de espaço vetorial 10 / 27

23 Consultas como vetores Ideia 1: fazer o mesmo para as consultas: representar no espaço de alta-dimensionalidade Ideia 2: Rankear documentos de acordo com sua proximidade à consulta proximidade = similaridade proximidade distância negativa O modelo de espaço vetorial 10 / 27

24 Consultas como vetores Ideia 1: fazer o mesmo para as consultas: representar no espaço de alta-dimensionalidade Ideia 2: Rankear documentos de acordo com sua proximidade à consulta proximidade = similaridade proximidade distância negativa Objetivo: estamos evitando modelo booleana e resultados tudo ou nada. O modelo de espaço vetorial 10 / 27

25 Consultas como vetores Ideia 1: fazer o mesmo para as consultas: representar no espaço de alta-dimensionalidade Ideia 2: Rankear documentos de acordo com sua proximidade à consulta proximidade = similaridade proximidade distância negativa Objetivo: estamos evitando modelo booleana e resultados tudo ou nada. Objetivo: rankear documentos relevantes em melhores posições que os não relevantes O modelo de espaço vetorial 10 / 27

26 Como formalizamos a similaridade no espaço vetorial O modelo de espaço vetorial 11 / 27

27 Como formalizamos a similaridade no espaço vetorial distância (negativa) entre dois pontos O modelo de espaço vetorial 11 / 27

28 Como formalizamos a similaridade no espaço vetorial distância (negativa) entre dois pontos ( = distância entre pontos finais entre pares de vetores) O modelo de espaço vetorial 11 / 27

29 Como formalizamos a similaridade no espaço vetorial distância (negativa) entre dois pontos ( = distância entre pontos finais entre pares de vetores) Distância euclidiana O modelo de espaço vetorial 11 / 27

30 Como formalizamos a similaridade no espaço vetorial distância (negativa) entre dois pontos ( = distância entre pontos finais entre pares de vetores) Distância euclidiana Distância euclidiana é uma má ideia... O modelo de espaço vetorial 11 / 27

31 Como formalizamos a similaridade no espaço vetorial distância (negativa) entre dois pontos ( = distância entre pontos finais entre pares de vetores) Distância euclidiana Distância euclidiana é uma má ideia......porque distância euclidiana é grande para vetores de diferentes comprimentos O modelo de espaço vetorial 11 / 27

32 Porque distância euclidiana é uma má ideia pobre 1 d d 2:Distância entre rico e pobre aumenta 1 :Grupos de poetas famintos aumentam q:[rico pobre] 0 d 3 :Salários recordes no baseball 2010 Rico 0 1 O modelo de espaço vetorial 12 / 27

33 Porque distância euclidiana é uma má ideia pobre 1 d d 2:Distância entre rico e pobre aumenta 1 :Grupos de poetas famintos aumentam q:[rico pobre] 0 d 3 :Salários recordes no baseball 2010 Rico 0 1 A distância euclidiana de q e d 2 é grande, embora a distribuição de termos na consulta q e a distribuição dos termo no documento d 2 são muito similares. O modelo de espaço vetorial 12 / 27

34 Porque distância euclidiana é uma má ideia pobre 1 d d 2:Distância entre rico e pobre aumenta 1 :Grupos de poetas famintos aumentam q:[rico pobre] 0 d 3 :Salários recordes no baseball 2010 Rico 0 1 A distância euclidiana de q e d 2 é grande, embora a distribuição de termos na consulta q e a distribuição dos termo no documento d 2 são muito similares. Perguntas sobre a configuração básica do espaço vetorial? O modelo de espaço vetorial 12 / 27

35 Usar ângulo em vez de distância O modelo de espaço vetorial 13 / 27

36 Usar ângulo em vez de distância Ordena documento de acordo com o ângulo em relação à consulta O modelo de espaço vetorial 13 / 27

37 Usar ângulo em vez de distância Ordena documento de acordo com o ângulo em relação à consulta Avalie: pegue um documento d e adicione-o a si mesmo em d. O modelo de espaço vetorial 13 / 27

38 Usar ângulo em vez de distância Ordena documento de acordo com o ângulo em relação à consulta Avalie: pegue um documento d e adicione-o a si mesmo em d. d e d têm mesma informação O modelo de espaço vetorial 13 / 27

39 Usar ângulo em vez de distância Ordena documento de acordo com o ângulo em relação à consulta Avalie: pegue um documento d e adicione-o a si mesmo em d. d e d têm mesma informação O ângulo entre os dois documentos é 0, máxima similaridade... O modelo de espaço vetorial 13 / 27

40 Usar ângulo em vez de distância Ordena documento de acordo com o ângulo em relação à consulta Avalie: pegue um documento d e adicione-o a si mesmo em d. d e d têm mesma informação O ângulo entre os dois documentos é 0, máxima similaridade......mesmo que a distância euclidiana entre os dois documentos seja grande O modelo de espaço vetorial 13 / 27

41 De ângulos a cosenos O modelo de espaço vetorial 14 / 27

42 De ângulos a cosenos As seguintes noções são equivalentes: O modelo de espaço vetorial 14 / 27

43 De ângulos a cosenos As seguintes noções são equivalentes: Ordenar documentos de acordo com o ângulo entre consulta e documento em ordem decrescente O modelo de espaço vetorial 14 / 27

44 De ângulos a cosenos As seguintes noções são equivalentes: Ordenar documentos de acordo com o ângulo entre consulta e documento em ordem decrescente Ordenar documentos de acordo com coseno(consulta, documento) em ordem crescente O modelo de espaço vetorial 14 / 27

45 De ângulos a cosenos As seguintes noções são equivalentes: Ordenar documentos de acordo com o ângulo entre consulta e documento em ordem decrescente Ordenar documentos de acordo com coseno(consulta, documento) em ordem crescente Coseno é uma função monotonicamente decrescente do ângulo para o intervalo [0,180 ] O modelo de espaço vetorial 14 / 27

46 Coseno O modelo de espaço vetorial 15 / 27

47 Coseno O modelo de espaço vetorial 15 / 27

48 Normalização de magnitude O modelo de espaço vetorial 16 / 27

49 Normalização de magnitude Como calcular o coseno? O modelo de espaço vetorial 16 / 27

50 Normalização de magnitude Como calcular o coseno? Um vetor pode ter magnitude normalizada a 1 com (norma L 2 ): x = x x O modelo de espaço vetorial 16 / 27

51 Normalização de magnitude Como calcular o coseno? Um vetor pode ter magnitude normalizada a 1 com (norma L 2 ): x = x x Essa operação mapeia os vetores na unidade esférica... O modelo de espaço vetorial 16 / 27

52 Normalização de magnitude Como calcular o coseno? Um vetor pode ter magnitude normalizada a 1 com (norma L 2 ): x = x x Essa operação mapeia os vetores na unidade esférica... Assim, documentos mais extensos ou curtos tem mesma informação O modelo de espaço vetorial 16 / 27

53 Normalização de magnitude Como calcular o coseno? Um vetor pode ter magnitude normalizada a 1 com (norma L 2 ): x = x x Essa operação mapeia os vetores na unidade esférica... Assim, documentos mais extensos ou curtos tem mesma informação Efeito nos documentos d e d (d dobrado ) : mesmo vetor depois da normalização O modelo de espaço vetorial 16 / 27

54 Similaridade cosena entre consulta e documento O modelo de espaço vetorial 17 / 27

55 Similaridade cosena entre consulta e documento cos( q, d) = sim( q, d) = q d q d = V V i=1 q2 i i=1 q id i V i=1 d2 i q i é o peso tf-idf do termo i na consulta. O modelo de espaço vetorial 17 / 27

56 Similaridade cosena entre consulta e documento cos( q, d) = sim( q, d) = q d q d = V V i=1 q2 i i=1 q id i V i=1 d2 i q i é o peso tf-idf do termo i na consulta. d i é o peso tf-idf do termo i no documento. O modelo de espaço vetorial 17 / 27

57 Similaridade cosena entre consulta e documento cos( q, d) = sim( q, d) = q d q d = V V i=1 q2 i i=1 q id i V i=1 d2 i q i é o peso tf-idf do termo i na consulta. d i é o peso tf-idf do termo i no documento. q e d são as magnitudes de q e d. O modelo de espaço vetorial 17 / 27

58 Similaridade cosena entre consulta e documento cos( q, d) = sim( q, d) = q d q d = V V i=1 q2 i i=1 q id i V i=1 d2 i q i é o peso tf-idf do termo i na consulta. d i é o peso tf-idf do termo i no documento. q e d são as magnitudes de q e d. Esta é a similaridade coseno entre q e d...ou, de maneira equivalente, o coseno do ângulo entre q e d. O modelo de espaço vetorial 17 / 27

59 Coseno para vetores normalizados Para vetores normalizados, o coseno é equivalente ao produto escalar (também conhecido como produto interno). cos( q, d) = q d = i q i d i (se q e d são normalizados). O modelo de espaço vetorial 18 / 27

60 Similaridade de coseno ilustrada O modelo de espaço vetorial 19 / 27

61 Similaridade de coseno ilustrada pobre 1 v(d 1 ) v(q) v(d 2 ) θ v(d 3 ) rico O modelo de espaço vetorial 19 / 27

62 Coseno: exemplo O quão similares são esses livros? ReS: Razão e Sensibilidade OeP: Orgulho e Preconceito MVU: Colina dos Vendavais O modelo de espaço vetorial 20 / 27

63 Coseno: exemplo O quão similares são esses livros? ReS: Razão e Sensibilidade OeP: Orgulho e Preconceito MVU: Colina dos Vendavais frequência de termos (contagem) termo ReS OeP MVU afeição ciúmes fofoca vendaval O modelo de espaço vetorial 20 / 27

64 Coseno: exemplo frequência de termos (tf) termo ReS OeP MVU afeição ciúmes fofoca vendaval O modelo de espaço vetorial 21 / 27

65 Coseno: exemplo frequência de termos (tf) termo ReS OeP MVU afeição ciúmes fofoca vendaval log da frequência termo ReS OeP MVU afeição ciúmes fofoca vendaval O modelo de espaço vetorial 21 / 27

66 Coseno: exemplo frequência de termos (tf) termo ReS OeP MVU afeição ciúmes fofoca vendaval log da frequência termo ReS OeP MVU afeição ciúmes fofoca vendaval Para simplificar este exemplo, não usaremos idf. O modelo de espaço vetorial 21 / 27

67 Se fosse usar, como seria o cálculo? idf t = log N df t presença de termos (df) termo ReS OeP MVU afeição ciúmes fofoca vendaval O modelo de espaço vetorial 22 / 27

68 Se fosse usar, como seria o cálculo? idf t = log N df t presença de termos (df) termo ReS OeP MVU afeição ciúmes fofoca vendaval idf termo idf afeição log(3/3) = 0 ciúmes log(3/3) = 0 fofoca log(3/2) = 0.17 vendaval log(3/1) = 0.47 O modelo de espaço vetorial 22 / 27

69 Coseno: exemplo log da frequência termo ReS OeP MVU afeição ciúmes fofoca vendaval O modelo de espaço vetorial 23 / 27

70 Coseno: exemplo log da frequência termo ReS OeP MVU afeição ciúmes fofoca vendaval log da frequência & normalização do coseno termo ReS OeP MVU afeição ciúmes fofoca vendaval O modelo de espaço vetorial 23 / 27

71 Coseno: exemplo log da frequência termo ReS OeP MVU afeição ciúmes fofoca vendaval log da frequência & normalização do coseno termo ReS OeP MVU afeição ciúmes fofoca vendaval cos(res,oep) O modelo de espaço vetorial 23 / 27

72 Coseno: exemplo log da frequência termo ReS OeP MVU afeição ciúmes fofoca vendaval log da frequência & normalização do coseno termo ReS OeP MVU afeição ciúmes fofoca vendaval cos(res,oep) cos(res,mvu) 0.79 O modelo de espaço vetorial 23 / 27

73 Coseno: exemplo log da frequência termo ReS OeP MVU afeição ciúmes fofoca vendaval log da frequência & normalização do coseno termo ReS OeP MVU afeição ciúmes fofoca vendaval cos(res,oep) cos(res,mvu) 0.79 cos(oep,mvu) 0.69 O modelo de espaço vetorial 23 / 27

74 Componentes do peso tf-idf Frequência de termos Frequência em Documentos Normalização n (natural) tf t,d n (não) 1 n (nenhum) 1 l (logaritmo) 1+log(tf t,d ) t (idf) log N dft c (cosine) 1 w 2 1 +w w2 M a (aumentado) tft,d b (boolean) L (log ave) maxt(tft,d) { 1 if tft,d > 0 0 senão 1+log(tft,d) 1+log(avet d(tft,d)) p (prob idf) max{0,log N dft } u (pivoted dft unique) 1/u b (byte size) 1/CharLength α, α < 1 O modelo de espaço vetorial 24 / 27

75 Componentes do peso tf-idf Frequência de termos Frequência em Documentos Normalização n (natural) tf t,d n (não) 1 n (nenhum) 1 l (logaritmo) 1+log(tf t,d ) t (idf) log N dft c (cosine) 1 w 2 1 +w w2 M a (aumentado) tft,d b (boolean) L (log ave) maxt(tft,d) { 1 if tft,d > 0 0 senão 1+log(tft,d) 1+log(avet d(tft,d)) p (prob idf) max{0,log N dft } u (pivoted dft unique) 1/u b (byte size) 1/CharLength α, α < 1 Melhor combinação conhecida de opções de pesos O modelo de espaço vetorial 24 / 27

76 Componentes do peso tf-idf Frequência de termos Frequência em Documentos Normalização n (natural) tf t,d n (não) 1 n (nenhum) 1 l (logaritmo) 1+log(tf t,d ) t (idf) log N dft c (cosine) 1 w 2 1 +w w2 M a (aumentado) tft,d b (boolean) L (log ave) maxt(tft,d) { 1 if tft,d > 0 0 senão 1+log(tft,d) 1+log(avet d(tft,d)) p (prob idf) max{0,log N dft } u (pivoted dft unique) 1/u b (byte size) 1/CharLength α, α < 1 Padrão: sem peso O modelo de espaço vetorial 24 / 27

77 Exemplo tf-idf O modelo de espaço vetorial 25 / 27

78 Exemplo tf-idf Frequentemente utiliza-se diferentes opções de pesos para consultas e documentos. O modelo de espaço vetorial 25 / 27

79 Exemplo tf-idf Frequentemente utiliza-se diferentes opções de pesos para consultas e documentos. Notação: ddd.qqq O modelo de espaço vetorial 25 / 27

80 Exemplo tf-idf Frequentemente utiliza-se diferentes opções de pesos para consultas e documentos. Notação: ddd.qqq Exemplo: lnc.ltn O modelo de espaço vetorial 25 / 27

81 Exemplo tf-idf Frequentemente utiliza-se diferentes opções de pesos para consultas e documentos. Notação: ddd.qqq Exemplo: lnc.ltn documento: log tf, sem peso df, normalização coseno O modelo de espaço vetorial 25 / 27

82 Exemplo tf-idf Frequentemente utiliza-se diferentes opções de pesos para consultas e documentos. Notação: ddd.qqq Exemplo: lnc.ltn documento: log tf, sem peso df, normalização coseno consulta: log tf, idf, sem normalização O modelo de espaço vetorial 25 / 27

83 Exemplo tf-idf Frequentemente utiliza-se diferentes opções de pesos para consultas e documentos. Notação: ddd.qqq Exemplo: lnc.ltn documento: log tf, sem peso df, normalização coseno consulta: log tf, idf, sem normalização É ruim não colocar peso idf no documento? O modelo de espaço vetorial 25 / 27

84 Exemplo tf-idf Frequentemente utiliza-se diferentes opções de pesos para consultas e documentos. Notação: ddd.qqq Exemplo: lnc.ltn documento: log tf, sem peso df, normalização coseno consulta: log tf, idf, sem normalização É ruim não colocar peso idf no documento? Exemplo consulta: melhor seguro carro O modelo de espaço vetorial 25 / 27

85 Exemplo tf-idf Frequentemente utiliza-se diferentes opções de pesos para consultas e documentos. Notação: ddd.qqq Exemplo: lnc.ltn documento: log tf, sem peso df, normalização coseno consulta: log tf, idf, sem normalização É ruim não colocar peso idf no documento? Exemplo consulta: melhor seguro carro Exemplo documento: melhor seguro carro auto O modelo de espaço vetorial 25 / 27

86 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

87 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto 0 melhor 1 carro 1 seguro 1 Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

88 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto 0 1 melhor 1 0 carro 1 1 seguro 1 2 Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

89 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

90 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

91 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

92 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

93 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

94 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

95 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

96 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento / / O modelo de espaço vetorial 26 / 27

97 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento O modelo de espaço vetorial 26 / 27

98 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento Resultado final de similaridade entre consulta e documento: i w qi w di = = 3.08 O modelo de espaço vetorial 26 / 27

99 Exemplo tf-idf : lnc.ltn Consulta: melhor seguro carro. Documento: carro seguro auto seguro. palavra consulta documento produto tf tf-com-peso df idf peso tf tf-com-peso peso norm. auto melhor carro seguro Colunas: tf: (sem peso) frequência de termo, tf-com-peso: log frequência de termo, df: frequência de documento, idf: frequência de documento inversa, peso: o peso final do termo na consulta ou documento, norm.: pesos de documentos depois de normalização, produto: produto do peso final da consulta e peso final do documento Resultado final de similaridade entre consulta e documento: i w qi w di = = 3.08 Perguntas? O modelo de espaço vetorial 26 / 27

100 Resumo: recuperação ordenada no modelo de espaço vetorial O modelo de espaço vetorial 27 / 27

101 Resumo: recuperação ordenada no modelo de espaço vetorial Representar a consulta como um vetor tf-idf com pesos O modelo de espaço vetorial 27 / 27

102 Resumo: recuperação ordenada no modelo de espaço vetorial Representar a consulta como um vetor tf-idf com pesos Representar cada documento como um vetor tf-idf com pesos O modelo de espaço vetorial 27 / 27

103 Resumo: recuperação ordenada no modelo de espaço vetorial Representar a consulta como um vetor tf-idf com pesos Representar cada documento como um vetor tf-idf com pesos Calcular a similaridade coseno entre o vetor consulta e vetor documento O modelo de espaço vetorial 27 / 27

104 Resumo: recuperação ordenada no modelo de espaço vetorial Representar a consulta como um vetor tf-idf com pesos Representar cada documento como um vetor tf-idf com pesos Calcular a similaridade coseno entre o vetor consulta e vetor documento Rankear documentos em relação à consulta O modelo de espaço vetorial 27 / 27

105 Resumo: recuperação ordenada no modelo de espaço vetorial Representar a consulta como um vetor tf-idf com pesos Representar cada documento como um vetor tf-idf com pesos Calcular a similaridade coseno entre o vetor consulta e vetor documento Rankear documentos em relação à consulta Exibir os K melhores resultados (e.g., K = 10) ao usuário O modelo de espaço vetorial 27 / 27

O modelo espaço de vetores. vetorial. Marcelo Keese Albertini. Faculdade de Computação - UFU. O modelo de espaço vetorial 1 / 25

O modelo espaço de vetores. vetorial. Marcelo Keese Albertini. Faculdade de Computação - UFU. O modelo de espaço vetorial 1 / 25 Recuperação de Informação: O modelo de espaço vetorial Marcelo Keese Albertini Faculdade de Computação - UFU O modelo de espaço vetorial 1 / 25 Veremos hoje Modelo de espaço de vetores: representação vetorial

Leia mais

ORI: Pontuação e o modelo de espaço vetorial

ORI: Pontuação e o modelo de espaço vetorial 1/1 ORI: Pontuação e o modelo de espaço vetorial Marcelo Keese Albertini Faculdade de Computação Universidade Federal de Uberlândia Índice 2/1 3/1 Veremos hoje Ordenando resultados de busca: importância

Leia mais

textos documentos semi-estruturado

textos documentos semi-estruturado 1 Mineração de Textos Os estudos em Aprendizado de Máquina normalmente trabalham com dados estruturados Entretanto, uma grande quantidade de informação é armazenada em textos, que são dados semiestruturados

Leia mais

Recuperação de Informação

Recuperação de Informação Recuperação de Informação Estrutura de Dados II Mariella Berger 1 Roteiro Tarefas de Recuperação de Informação Modelos de Recuperação de Documentos Modelo Booleano Modelo Espaço Vetorial Recuperação de

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Aula anterior Organização e Recuperação de Informação(GSI521) Modelo vetorial- Definição Para o modelo vetorial, o

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Modelo Vetorial Organização e Recuperação de Informação(GSI521) Motivação Discutido nos seguintes trabalhos: K. Spark

Leia mais

Agrupamento de dados

Agrupamento de dados Organização e Recuperação de Informação: Agrupamento de dados Marcelo K. A. Faculdade de Computação - UFU Agrupamento de dados / 7 Overview Agrupamento: introdução Agrupamento em ORI 3 K-médias 4 Avaliação

Leia mais

6. Geometria, Primitivas e Transformações 3D

6. Geometria, Primitivas e Transformações 3D 6. Geometria, Primitivas e Transformações 3D Até agora estudamos e implementamos um conjunto de ferramentas básicas que nos permitem modelar, ou representar objetos bi-dimensionais em um sistema também

Leia mais

Workshop: Como usar o software estatístico DAD?

Workshop: Como usar o software estatístico DAD? Workshop: Como usar o software estatístico DAD? Medidas de Pobreza e Desigualdade: algumas aplicações teóricas Prof. Caio Piza CCSA - Depto de Economia/NPQV Medidas de Pobreza e Desigualdade O que é DAD

Leia mais

Exercício 8 Busca de Músicas

Exercício 8 Busca de Músicas Exercício 8 Busca de Músicas Diversos softwares têm sido projetados para realizar a busca de músicas a partir de um trecho de áudio. Por exemplo, atualmente há ferramentas para celulares ou Web em que

Leia mais

Hardware de Computadores

Hardware de Computadores Sistema Binário Hardware de Computadores O sistema binário é um sistema de numeração posicional em que todas as quantidades são representadas, utilizando-se como base as cifras: zero e um (0 e 1). Os computadores

Leia mais

2. Representação Numérica

2. Representação Numérica 2. Representação Numérica 2.1 Introdução A fim se realizarmos de maneira prática qualquer operação com números, nós precisamos representa-los em uma determinada base numérica. O que isso significa? Vamos

Leia mais

Modelo Espaço Vetorial. Mariella Berger

Modelo Espaço Vetorial. Mariella Berger Modelo Espaço Vetorial Mariella Berger Agenda Introdução Atribuição de Pesos Frequência TF-IDF Similaridade Exemplo Vantagens e Desvantagens Modelo Espaço Vetorial Introdução Modelo Espaço Vetorial O modelo

Leia mais

Aula Teórica 12. Material Didático Proposto

Aula Teórica 12. Material Didático Proposto Universidade Federal de Ouro Preto - UFOP Departamento de Computação - DECOM Comissão da Disciplina Programação de Computadores I CDPCI Programação de Computadores I BCC701 www.decom.ufop.br/red 2014/1

Leia mais

Escola Secundária c/3º CEB José Macedo Fragateiro. Curso Profissional de Nível Secundário. Componente Técnica. Disciplina de

Escola Secundária c/3º CEB José Macedo Fragateiro. Curso Profissional de Nível Secundário. Componente Técnica. Disciplina de Escola Secundária c/3º CEB José Macedo Fragateiro Curso Profissional de Nível Secundário Componente Técnica Disciplina de Sistemas Digitais e Arquitectura de Computadores 29/21 Módulo 1: Sistemas de Numeração

Leia mais

CLASSIFICAÇÃO AUTOMÁTICA DE PATENTES COM O MODELO VETORIAL DE REPRESENTAÇÃO DE DOCUMENTOS

CLASSIFICAÇÃO AUTOMÁTICA DE PATENTES COM O MODELO VETORIAL DE REPRESENTAÇÃO DE DOCUMENTOS III SBA Simpósio Baiano de Arquivologia 26 a 28 de outubro de 2011 Salvador Bahia Políticas arquivísticas na Bahia e no Brasil CLASSIFICAÇÃO AUTOMÁTICA DE PATENTES COM O MODELO VETORIAL DE REPRESENTAÇÃO

Leia mais

MINERAÇÃO DE DADOS. Thiago Marzagão MINERAÇÃO DE TEXTOS. marzagao.1@osu.edu. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25

MINERAÇÃO DE DADOS. Thiago Marzagão MINERAÇÃO DE TEXTOS. marzagao.1@osu.edu. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25 MINERAÇÃO DE DADOS Thiago Marzagão marzagao.1@osu.edu MINERAÇÃO DE TEXTOS Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25 transformando textos em dados Documento 1: "Não trabalho para ter clientes;

Leia mais

Disciplina: : ELETRÔNICA DIGITAL

Disciplina: : ELETRÔNICA DIGITAL Disciplina: : ELETRÔNICA DIGITAL Professor: Júlio César Madureira Silva Julho 2011 1 Ementa: 1. Sistemas de numeração Numeração decimal Numeração binária Numeração octal Numeração

Leia mais

Otimização de Recuperação de Informação usando Algoritmos Genéticos

Otimização de Recuperação de Informação usando Algoritmos Genéticos Otimização de Recuperação de Informação usando Algoritmos Genéticos Neide de Oliveira Gomes, M. Sc., nog@inpi.gov.br Prof. Marco Aurélio C. Pacheco, PhD Programa de Doutorado na área de Métodos de Apoio

Leia mais

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS

RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS ISBN 978-85-61091-05-7 Encontro Internacional de Produção Científica Cesumar 27 a 30 de outubro de 2009 RECUPERAÇÃO DE DOCUMENTOS TEXTO USANDO MODELOS PROBABILISTICOS ESTENDIDOS Marcello Erick Bonfim 1

Leia mais

Aritmética de Ponto Flutuante e Noções de Erro. Ana Paula

Aritmética de Ponto Flutuante e Noções de Erro. Ana Paula Aritmética de Ponto Flutuante e Noções de Erro Sumário 1 Introdução 2 Sistemas de Numeração 3 Representação de Números Inteiros no Computador 4 Representação de Números Reais no Computador 5 Operações

Leia mais

O método multicritérios de apoio à decisão

O método multicritérios de apoio à decisão Centro de Gestão e Estudos Estratégicos Ciênci Tecnologia e Inovação Energia Anexo 3 O método multicritérios de apoio à decisão 2 Energia Considerando as características do problema de priorização sistematizadas

Leia mais

Análise de componentes principais (PCA)

Análise de componentes principais (PCA) Análise de componentes principais (PCA) Redução de dados Sumarizar os dados que contém muitas variáveis (p) por um conjunto menor de (k) variáveis compostas derivadas a partir do conjunto original. p k

Leia mais

1 Modulação digital Noções básicas

1 Modulação digital Noções básicas 1 Modulação digital Noções básicas A modulação envolve operações sobre uma ou mais das três características de uma portadora (amplitude, fase, frequência). Há três técnicas básicas de modulação para transformar

Leia mais

NOÇÕES DE ÁLGEBRA LINEAR

NOÇÕES DE ÁLGEBRA LINEAR ESPAÇO VETORIAL REAL NOÇÕES DE ÁLGEBRA LINEAR ESPAÇOS VETORIAIS Seja um conjunto V φ no qual estão definidas duas operações: adição e multiplicação por escalar, tais que u, v V, u+v V e α R, u V, αu V

Leia mais

Conversão de Bases e Aritmética Binária

Conversão de Bases e Aritmética Binária Conversão de Bases e Aritmética Binária Prof. Glauco Amorim Sistema de Numeração Decimal Dígitos Decimais: 0 2 3 4 5 6 7 8 9 Potências de base 0 0 0 2 0 0 3 4 0 0 00 000 0 000 Sistema de Numeração Binário

Leia mais

Lista de Exercícios. Vetores

Lista de Exercícios. Vetores Lista de Exercícios Vetores LINGUAGEM DE PROGRAMAÇÃO PROF. EDUARDO SILVESTRI. WWW.EDUARDOSILVESTRI.COM.BR ATUALIZADO EM: 13/03/2007 Página 1/1 1. Faça um programa que crie um vetor de inteiros de 50 posições

Leia mais

MESTRADO EM MACROECONOMIA e FINANÇAS Disciplina de Computação. Aula 02. Prof. Dr. Marco Antonio Leonel Caetano

MESTRADO EM MACROECONOMIA e FINANÇAS Disciplina de Computação. Aula 02. Prof. Dr. Marco Antonio Leonel Caetano MESTRADO EM MACROECONOMIA e FINANÇAS Disciplina de Computação Aula 02 Prof. Dr. Marco Antonio Leonel Caetano 1 Guia de Estudo para Aula 02 Comandos de Repetição - O Comando FOR - O comando IF com o comando

Leia mais

GesToc Gestão de Transferências entre Estoques Versão 7.1 Roteiro: Programação Diária

GesToc Gestão de Transferências entre Estoques Versão 7.1 Roteiro: Programação Diária GesToc Gestão de Transferências entre Estoques Versão 7.1 Roteiro: Programação Diária Roteiro: Programação Diária GesToc - Gestão de Transferências entre Estoques Versão 7.1 ilab Sistemas Especialistas

Leia mais

Minicurso de MATLAB. Programa de Educação Tutorial de Engenharia Elétrica 28/03/15. lmax Rodrigues. lcaroline Pereira.

Minicurso de MATLAB. Programa de Educação Tutorial de Engenharia Elétrica 28/03/15. lmax Rodrigues. lcaroline Pereira. Minicurso de MATLAB Programa de Educação Tutorial de Engenharia Elétrica lmax Rodrigues lcaroline Pereira lnayara Medeiros 28/03/15 Gráficos no Matlab O Matlab possui várias rotinas para plotagens gráficas

Leia mais

ANALÓGICA X DIGITAL. Vamos começar essa aula estabelecendo os dois tipos de eletrônica: Eletrônica Analógica. Eletrônica Digital

ANALÓGICA X DIGITAL. Vamos começar essa aula estabelecendo os dois tipos de eletrônica: Eletrônica Analógica. Eletrônica Digital ANALÓGICA X DIGITAL Vamos começar essa aula estabelecendo os dois tipos de eletrônica: Eletrônica Analógica Eletrônica Digital ANALÓGICA X DIGITAL A eletrônica analógica é caracterizada por um sinal que

Leia mais

Outline. 2 Abordagem probabiĺıstica para ORI. 3 Teoria de probabilidades. 4 Princípio de ranking probabiĺıstico

Outline. 2 Abordagem probabiĺıstica para ORI. 3 Teoria de probabilidades. 4 Princípio de ranking probabiĺıstico Outline 1 Recapitulação 2 Abordagem probabiĺıstica para ORI 3 Teoria de probabilidades 4 Princípio de ranking probabiĺıstico 5 Apreciação&Extensões Modelo probabiĺıstico 1 / 47 Retorno de relevância: ideia

Leia mais

Autómatos Finitos Determinísticos

Autómatos Finitos Determinísticos Ficha 2 Autómatos Finitos Determinísticos 2.1 Introdução Se olharmos, de forma simplificada, para um computador encontramos três componentes principais: a) A unidade de processamento central b) As unidades

Leia mais

Cálculo Numérico Aula 1: Computação numérica. Tipos de Erros. Aritmética de ponto flutuante

Cálculo Numérico Aula 1: Computação numérica. Tipos de Erros. Aritmética de ponto flutuante Cálculo Numérico Aula : Computação numérica. Tipos de Erros. Aritmética de ponto flutuante Computação Numérica - O que é Cálculo Numérico? Cálculo numérico é uma metodologia para resolver problemas matemáticos

Leia mais

Tabela de símbolos: tabelas de espalhamento

Tabela de símbolos: tabelas de espalhamento Tabela de símbolos: tabelas de espalhamento Marcelo K. Albertini 14 de Janeiro de 2014 2/28 Resumo de complexidades Análises para operação efetuada após N inserções pior caso caso médio keys chave get

Leia mais

CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO SUCKOW DA FONSECA HABILIDADES CONTEÚDO METODOLOGIA/ESTRATÉGIA HORA/ AULA ANÁLISE GRÁFICA DE FUNÇÕES

CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO SUCKOW DA FONSECA HABILIDADES CONTEÚDO METODOLOGIA/ESTRATÉGIA HORA/ AULA ANÁLISE GRÁFICA DE FUNÇÕES CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO SUCKOW DA FONSECA ENSINO MÉDIO ÁREA CURRICULAR: CIÊNCIA DA NATUREZA, MATEMÁTICA E SUAS TECNOLOGIAS DISCIPLINA: MATEMÁTICA I SÉRIE 1.ª CH 68 ANO 2012 COMPETÊNCIAS:.

Leia mais

GSI024 - Organização e Recuperação da

GSI024 - Organização e Recuperação da GSI024 - Organização e Recuperação da Informação Ilmério Reis da Silva ilmerio@facom.ufu.br UFU/FACOM/BSI Arquivo 5 - Peso de termos GSI024-ORI Pg:5. 1 Busca paramétrica usando atributos Regiões em documentos

Leia mais

Sistemas Distribuídos: Princípios e Algoritmos Introdução à Análise de Complexidade de Algoritmos

Sistemas Distribuídos: Princípios e Algoritmos Introdução à Análise de Complexidade de Algoritmos Sistemas Distribuídos: Princípios e Algoritmos Introdução à Análise de Complexidade de Algoritmos Francisco José da Silva e Silva Laboratório de Sistemas Distribuídos (LSD) Departamento de Informática

Leia mais

Sistema de Numeração e Conversão entre Sistemas. Prof. Rômulo Calado Pantaleão Camara. Carga Horária: 60h

Sistema de Numeração e Conversão entre Sistemas. Prof. Rômulo Calado Pantaleão Camara. Carga Horária: 60h Sistema de Numeração e Conversão entre Sistemas. Prof. Rômulo Calado Pantaleão Camara Carga Horária: 60h Representação de grandeza com sinal O bit mais significativo representa o sinal: 0 (indica um número

Leia mais

Aplicação da Medida TfIdf em Bancos de Dados Relacionais para Ordenação de Consultas por Termos

Aplicação da Medida TfIdf em Bancos de Dados Relacionais para Ordenação de Consultas por Termos Aplicação da Medida TfIdf em Bancos de Dados Relacionais para Ordenação de Consultas por Termos Daniel Pereira Lima 1, Naziane Alves Pinto 2, Carla Oran Fonseca de Souza 3, Francisca Sancha Azevedo da

Leia mais

Pesquisa Sequencial e Binária

Pesquisa Sequencial e Binária Pesquisa Sequencial e Binária Prof. Wylliams Barbosa Santos wylliamss@gmail.com Introdução à Programação Crédito de Conteúdo: Professora Ceça Moraes Agenda Pesquisa Sequencial Noções de complexidade Pesquisa

Leia mais

Estruturas de Dados. Prof. Gustavo Willam Pereira Créditos: Profa. Juliana Pinheiro Campos

Estruturas de Dados. Prof. Gustavo Willam Pereira Créditos: Profa. Juliana Pinheiro Campos Estruturas de Dados Prof. Gustavo Willam Pereira Créditos: Profa. Juliana Pinheiro Campos Árvores Conceitos Árvores binárias Árvores binárias de pesquisa Árvores binárias balanceadas Árvores ESTRUTURAS

Leia mais

Exercícios de Fixação Pseudocódigo e Estruturas Básicas de Controle

Exercícios de Fixação Pseudocódigo e Estruturas Básicas de Controle Disciplina: TCC-00.7 Prog. de Computadores III Professor: Leandro Augusto Frata Fernandes Turma: A- Data: / / Exercícios de Fixação Pseudocódigo e Estruturas Básicas de Controle. Construa um algoritmo

Leia mais

Introdução a Algoritmos Parte 04

Introdução a Algoritmos Parte 04 Universidade Federal do Vale do São Francisco Curso de Engenharia de Computação Introdução a Algoritmos Parte 04 Prof. Jorge Cavalcanti jorge.cavalcanti@univasf.edu.br www.univasf.edu.br/~jorge.cavalcanti

Leia mais

Introdução à Engenharia de

Introdução à Engenharia de Introdução à Engenharia de Computação Tópico: Sistemas de Numeração José Gonçalves - LPRM/DI/UFES Introdução à Engenharia de Computação Introdução O número é um conceito abstrato que representa a idéia

Leia mais

M A T E M Á T I C A DIRETRIZES GERAIS

M A T E M Á T I C A DIRETRIZES GERAIS M A T E M Á T I C A DIRETRIZES GERAIS O conteúdo programático de Matemática dos processos seletivos da UFU tem como objetivo identificar a habilidade do estudante em resolver problemas, fazer conexões

Leia mais

Pesquisa Sequencial e Binária. Introdução à Programação SI2

Pesquisa Sequencial e Binária. Introdução à Programação SI2 Pesquisa Sequencial e Binária Introdução à Programação SI2 3 Contexto Diferentes estratégias para pesquisa (busca) de um elemento específico em um conjunto de dados. Lista, array, coleção Operação importante,

Leia mais

Bem, produto interno serve para determinar ângulos e distâncias entre vetores e é representado por produto interno de v com w).

Bem, produto interno serve para determinar ângulos e distâncias entre vetores e é representado por produto interno de v com w). Produto Interno INTRODUÇÃO Galera, vamos aprender agora as definições e as aplicações de Produto Interno. Essa matéria não é difícil, mas para ter segurança nela é necessário que o aluno tenha certa bagagem

Leia mais

1 Tipos de dados em Análise de Clusters

1 Tipos de dados em Análise de Clusters Curso de Data Mining Sandra de Amo Aula 13 - Análise de Clusters - Introdução Análise de Clusters é o processo de agrupar um conjunto de objetos físicos ou abstratos em classes de objetos similares Um

Leia mais

O tornado de projeto é admitido, para fins quantitativos, com as seguintes características [15]:

O tornado de projeto é admitido, para fins quantitativos, com as seguintes características [15]: 4 Tornado de Projeto O tornado de projeto é admitido, para fins quantitativos, com as seguintes características [15]: Tornado do tipo F3-médio; Velocidade máxima de 233km/h = 64,72m/s; Velocidade translacional

Leia mais

Manual Sistema MLBC. Manual do Sistema do Módulo Administrativo

Manual Sistema MLBC. Manual do Sistema do Módulo Administrativo Manual Sistema MLBC Manual do Sistema do Módulo Administrativo Este documento tem por objetivo descrever as principais funcionalidades do sistema administrador desenvolvido pela MLBC Comunicação Digital.

Leia mais

Matemática A. Teste Intermédio de Matemática A. Versão 1. Teste Intermédio. Versão 1. Duração do Teste: 90 minutos 6.05.2010. 11.º Ano de Escolaridade

Matemática A. Teste Intermédio de Matemática A. Versão 1. Teste Intermédio. Versão 1. Duração do Teste: 90 minutos 6.05.2010. 11.º Ano de Escolaridade Teste Intermédio de Matemática A Versão 1 Teste Intermédio Matemática A Versão 1 Duração do Teste: 90 minutos 6.05.2010 11.º Ano de Escolaridade Decreto-Lei n.º 74/2004, de 26 de Março Na sua folha de

Leia mais

Quando você receber a nova edição do Caderno do Aluno, veja o que mudou e analise as diferenças, para estar sempre bem preparado para suas aulas.

Quando você receber a nova edição do Caderno do Aluno, veja o que mudou e analise as diferenças, para estar sempre bem preparado para suas aulas. Caro Professor, Em 009 os Cadernos do Aluno foram editados e distribuídos a todos os estudantes da rede estadual de ensino. Eles serviram de apoio ao trabalho dos professores ao longo de todo o ano e foram

Leia mais

Exercícios Teóricos Resolvidos

Exercícios Teóricos Resolvidos Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Matemática Exercícios Teóricos Resolvidos O propósito deste texto é tentar mostrar aos alunos várias maneiras de raciocinar

Leia mais

Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis

Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis Adriano Lima de Sá Faculdade de Computação Universidade Federal de Uberlândia 20 de junho de 2014 Adriano L. Sá (UFU)

Leia mais

I Seminário SIGCidades: Cadastro Territorial Multifinalitário. Fundamentos de Cartografia aplicados aos SIGs

I Seminário SIGCidades: Cadastro Territorial Multifinalitário. Fundamentos de Cartografia aplicados aos SIGs I Seminário SIGCidades: Cadastro Territorial Multifinalitário Fundamentos de Cartografia aplicados aos SIGs 1. FORMA DA TERRA Geóide Elipsóide Esfera Modelos de representação da Terra O modelo que mais

Leia mais

Arquitetura de Rede de Computadores

Arquitetura de Rede de Computadores TCP/IP Roteamento Arquitetura de Rede de Prof. Pedro Neto Aracaju Sergipe - 2011 Ementa da Disciplina 4. Roteamento i. Máscara de Rede ii. Sub-Redes iii. Números Binários e Máscara de Sub-Rede iv. O Roteador

Leia mais

Transformada de Hough. Cleber Pivetta Gustavo Mantovani Felipe Zottis

Transformada de Hough. Cleber Pivetta Gustavo Mantovani Felipe Zottis Transformada de Hough Cleber Pivetta Gustavo Mantovani Felipe Zottis A Transformada de Hough foi desenvolvida por Paul Hough em 1962 e patenteada pela IBM. Originalmente, foi elaborada para detectar características

Leia mais

2. Sistemas de Numeração

2. Sistemas de Numeração 2. Sistemas de Numeração 2.1. Introdução A necessidade de contar é algo que acompanha o ser humano desde tempos imemoriais. Muitas cavernas pré-históricas registram contagens, provavelmente de animais,

Leia mais

O matemático indiano Pingala apresentou a primeira descrição conhecida de um sistema numérico binário no século III a.c..

O matemático indiano Pingala apresentou a primeira descrição conhecida de um sistema numérico binário no século III a.c.. Sistema binário (matemática) O sistema binário ou base 2, é um sistema de numeração posicional em que todas as quantidades se representam com base em dois números, com o que se dispõe das cifras: zero

Leia mais

IBM1018 Física Básica II FFCLRP USP Prof. Antônio Roque Aula 3

IBM1018 Física Básica II FFCLRP USP Prof. Antônio Roque Aula 3 Linhas de Força Mencionamos na aula passada que o físico inglês Michael Faraday (79-867) introduziu o conceito de linha de força para visualizar a interação elétrica entre duas cargas. Para Faraday, as

Leia mais

Top Guia In.Fra: Perguntas para fazer ao seu fornecedor de CFTV

Top Guia In.Fra: Perguntas para fazer ao seu fornecedor de CFTV Top Guia In.Fra: Perguntas para fazer ao seu fornecedor de CFTV 1ª Edição (v1.4) 1 Um projeto de segurança bem feito Até pouco tempo atrás o mercado de CFTV era dividido entre fabricantes de alto custo

Leia mais

2. Sistemas de Numeração, Operações e Códigos. 2. Sistemas de Numeração, Operações e Códigos 1. Números Decimais. Objetivos.

2. Sistemas de Numeração, Operações e Códigos. 2. Sistemas de Numeração, Operações e Códigos 1. Números Decimais. Objetivos. Objetivos 2. Sistemas de Numeração, Operações e Códigos Revisar o sistema de numeração decimal Contar no sistema de numeração binário Converter de decimal para binário e vice-versa Aplicar operações aritméticas

Leia mais

Apostila de Calc. Profª Tatiane Tolentino 1

Apostila de Calc. Profª Tatiane Tolentino 1 APOSTILA DE CALC 1- Introdução O BrOffice.org Calc é um aplicativo de planilhas que pode ser utilizado para calcular, analisar e gerenciar dados. Você também pode importar e modificar planilhas do Microsoft

Leia mais

Vetores. Vetores. Figura 1 Exemplo de vetor com 10 elementos

Vetores. Vetores. Figura 1 Exemplo de vetor com 10 elementos Vetores Nos capítulos anteriores estudamos as opções disponíveis na linguagem C para representar: Números inteiros em diversos intervalos. Números fracionários com várias alternativas de precisão e magnitude.

Leia mais

Construção do Boxplot utilizando o Excel 2007

Construção do Boxplot utilizando o Excel 2007 1 Construção do Boxplot utilizando o Excel 2007 (1 Passo) Vamos digitar os dados na planilha. Para isso temos três banco de dados (Dados 1, Dados 2 e Dados 3), no qual irão gerar três Boxplot. Figura 1

Leia mais

PROGRAMAÇÃO ESTRUTURADA. CC 2º Período

PROGRAMAÇÃO ESTRUTURADA. CC 2º Período PROGRAMAÇÃO ESTRUTURADA CC 2º Período PROGRAMAÇÃO ESTRUTURADA Aula 06: Ponteiros Declarando e utilizando ponteiros Ponteiros e vetores Inicializando ponteiros Ponteiros para Ponteiros Cuidados a serem

Leia mais

CURSO BÁSICO DE PROGRAMAÇÃO AULA 7

CURSO BÁSICO DE PROGRAMAÇÃO AULA 7 CURSO BÁSICO DE PROGRAMAÇÃO AULA 7 Revisão para prova: Comandos de Entrada e Saída Estruturas de Decisão (Se, caso (escolha)) Laços de Repetição (Enquanto, Repita, Para) Relembrando Trabalho 1 Prazo de

Leia mais

Aula 8. Acesse: http://fuvestibular.com.br/

Aula 8. Acesse: http://fuvestibular.com.br/ Acesse: http://fuvestibular.com.br/ Aula 8 A multiplicação nada mais é que uma soma de parcelas iguais. E a divisão, sua inversa, "desfaz o que a multiplicação faz". Quer ver? Vamos pensar nas questões

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

Algoritmo e Programação

Algoritmo e Programação Algoritmo e Programação Professor: José Valentim dos Santos Filho Colegiado: Engenharia da Computação Prof.: José Valentim dos Santos Filho 1 Ementa Noções básicas de algoritmo; Construções básicas: operadores,

Leia mais

Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Engenharia Disciplina de Lógica Computacional Aplicada. Prof. Dr.

Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Engenharia Disciplina de Lógica Computacional Aplicada. Prof. Dr. Índice 1. SISTEMAS NUMÉRICOS 1.1 Caracterização dos Sistemas Numéricos 1.2 Sistemas Numéricos em uma Base B Qualquer 1.2.1 Sistema de Numeração Decimal 1.2.2. Sistema de Numeração Binário 1.2.3 Sistema

Leia mais

Circuitos Elétricos Senoides e Fasores

Circuitos Elétricos Senoides e Fasores Circuitos Elétricos Senoides e Fasores Alessandro L. Koerich Engenharia de Computação Pontifícia Universidade Católica do Paraná (PUCPR) Introdução Corrente contínua x corrente alternada. Ver War of Currentes

Leia mais

Lista de exercícios 2 Recuperação de Informação Textual

Lista de exercícios 2 Recuperação de Informação Textual Lista de exercícios 2 Recuperação de Informação Textual 2 de dezembro de 2015 0.1 O que é o modelo bag-of-words? Porque ele é uma simplificação? Dê um exemplo em que ele estaria incorreto. 0.2 O que é

Leia mais

GSI024 - Organização e Recuperação da

GSI024 - Organização e Recuperação da GSI024 - Organização e Recuperação da Informação Ilmério Reis da Silva ilmerio@facom.ufu.br UFU/FACOM/BSI Arquivo 6 - Modelo Vetorial GSI024-ORI Pg:6. 1 Ranking baseado no modelo vetorial Considerações

Leia mais

Classe A: Apenas o primeiro octeto identifica a rede e os três últimos identificam os Hosts.

Classe A: Apenas o primeiro octeto identifica a rede e os três últimos identificam os Hosts. MÓDULO 9 Endereçamento IP Em uma rede TCP/IP, cada computador possui um endereço IP que o identifica na rede, esse endereço é composto por uma seqüência de bits divididos em 4 grupos de 8 bits que recebem

Leia mais

UNIDADE 4 - ESTRUTURA CRISTALINA

UNIDADE 4 - ESTRUTURA CRISTALINA UNIDADE 4 - ESTRUTURA CRISTALINA 4.1. INTRODUÇÃO Em geral, todos os metais, grande parte dos cerâmicos e certos polímeros cristalizam-se quando se solidificam. Os átomos se arranjam em uma estrutura tridimensional

Leia mais

1 Módulo ou norma de um vetor

1 Módulo ou norma de um vetor Álgebra Linear I - Aula 3-2005.2 Roteiro 1 Módulo ou norma de um vetor A norma ou módulo do vetor ū = (u 1, u 2, u 3 ) de R 3 é ū = u 2 1 + u2 2 + u2 3. Geometricamente a fórmula significa que o módulo

Leia mais

Sistemas de Numeração

Sistemas de Numeração Professor Menezes SISTEMA DE NUMERAÇÃO 1-1 Sistemas de Numeração Observe que alguns números decimais a possuem uma representação muito curiosa no sistema binário: 1 decimal = 1 binário; 2 decimal = 10

Leia mais

EXERCÍCIOS. 2. Faça um algoritmo que receba dois números e ao final mostre a soma, subtração, multiplicação e a divisão dos números lidos.

EXERCÍCIOS. 2. Faça um algoritmo que receba dois números e ao final mostre a soma, subtração, multiplicação e a divisão dos números lidos. EXERCÍCIOS 1. Faça um algoritmo que receba dois números e exiba o resultado da sua soma. 2. Faça um algoritmo que receba dois números e ao final mostre a soma, subtração, multiplicação e a divisão dos

Leia mais

Plano Curricular de Matemática 9º ano - 2014 /2015-3º Ciclo

Plano Curricular de Matemática 9º ano - 2014 /2015-3º Ciclo Plano Curricular de Matemática 9º ano - 2014 /2015-3º Ciclo Tema/Subtema Conteúdos Metas Nº de Aulas Previstas Org.Trat.Dados / Planeamento Estatístico Especificação do problema Recolha de dados População

Leia mais

X.0 Sucessões de números reais 1

X.0 Sucessões de números reais 1 «Tal como a tecnologia requer as tøcnicas da matemætica aplicada, tambøm a matemætica aplicada requer as teorias do nœcleo central da matemætica pura. Da l gica matemætica topologia algøbrica, da teoria

Leia mais

Aula 2_1. Lei de Gauss I. Física Geral e Experimental III Prof. Cláudio Graça Capítulo 3

Aula 2_1. Lei de Gauss I. Física Geral e Experimental III Prof. Cláudio Graça Capítulo 3 Aula 2_1 Lei de Gauss I Física Geral e xperimental III Prof. Cláudio Graça Capítulo 3 Conceito de Fluxo do campo elétrico Fluxo do campo elétrico num campo uniforme Suponhamos uma superfície plana de área

Leia mais

PROVA MODELO 2015. Duração da prova: 120 minutos

PROVA MODELO 2015. Duração da prova: 120 minutos Página 1 de 8 Provas especialmente adequadas destinadas a avaliar a capacidade para a frequência do ensino superior dos maiores de 3 anos, Decreto-Lei n.º 64/006, de 1 de março AVALIAÇÃO DA CAPACIDADE

Leia mais

MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA

MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA MATERIAL DE DIVULGAÇÃO DA EDITORA MODERNA Professor, nós, da Editora Moderna, temos como propósito uma educação de qualidade, que respeita as particularidades de todo o país. Desta maneira, o apoio ao

Leia mais

2 A Derivada. 2.1 Velocidade Média e Velocidade Instantânea

2 A Derivada. 2.1 Velocidade Média e Velocidade Instantânea 2 O objetivo geral desse curso de Cálculo será o de estudar dois conceitos básicos: a Derivada e a Integral. No decorrer do curso esses dois conceitos, embora motivados de formas distintas, serão por mais

Leia mais

FACULDADE CAMPO LIMPO PAULISTA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO. Projeto e Análise de Algoritmos II Lista de Exercícios 2

FACULDADE CAMPO LIMPO PAULISTA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO. Projeto e Análise de Algoritmos II Lista de Exercícios 2 FACULDADE CAMPO LIMPO PAULISTA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO Projeto e Análise de Algoritmos II Lista de Exercícios 2 Prof. Osvaldo. 1. Desenvolva algoritmos para as operações abaixo e calcule a complexidade

Leia mais

Microsoft Access: Criar consultas para um novo banco de dados. Vitor Valerio de Souza Campos

Microsoft Access: Criar consultas para um novo banco de dados. Vitor Valerio de Souza Campos Microsoft Access: Criar consultas para um novo banco de Vitor Valerio de Souza Campos Conteúdo do curso Visão geral: consultas são essenciais Lição: inclui sete seções Tarefas práticas sugeridas Teste.

Leia mais

Matemática A. Teste Intermédio de Matemática A. Versão 1. Teste Intermédio. Versão 1. Duração do Teste: 90 minutos 5.05.2010. 10.º Ano de Escolaridade

Matemática A. Teste Intermédio de Matemática A. Versão 1. Teste Intermédio. Versão 1. Duração do Teste: 90 minutos 5.05.2010. 10.º Ano de Escolaridade Teste Intermédio de Matemática A Versão 1 Teste Intermédio Matemática A Versão 1 Duração do Teste: 90 minutos 5.05.2010 10.º Ano de Escolaridade Decreto-Lei n.º 74/2004, de 26 de Março Na sua folha de

Leia mais

REPRESENTAÇÃO DE DADOS EM SISTEMAS DE COMPUTAÇÃO AULA 03 Arquitetura de Computadores Gil Eduardo de Andrade

REPRESENTAÇÃO DE DADOS EM SISTEMAS DE COMPUTAÇÃO AULA 03 Arquitetura de Computadores Gil Eduardo de Andrade REPRESENTAÇÃO DE DADOS EM SISTEMAS DE COMPUTAÇÃO AULA 03 Arquitetura de Computadores Gil Eduardo de Andrade O conteúdo deste documento é baseado no livro Princípios Básicos de Arquitetura e Organização

Leia mais

AVALIAÇÃO À DISTÂNCIA 1 GABARITO

AVALIAÇÃO À DISTÂNCIA 1 GABARITO Fundação CECIERJ - Vice Presidência de Educação Superior a Distância Curso de Tecnologia em Sistemas de Computação UFF Disciplina INTRODUÇÃO À INFORMÁTICA... AD1 2 semestre de 2008. Data... AVALIAÇÃO À

Leia mais

Aula 2 Variáveis. Precisamos armazenar os tipos de dados da aula anterior (inteiros, reais, literais e lógicos) em memória. Como fazer?

Aula 2 Variáveis. Precisamos armazenar os tipos de dados da aula anterior (inteiros, reais, literais e lógicos) em memória. Como fazer? Aula 2 Variáveis 1. Introdução Computadores precisam manipular informações. Por conseguinte, precisam armazená-las em sua memória. Para isso, usamos a abstração de variáveis. 2. Sistemas de numeração Explicar

Leia mais

Escola Básica e Secundária de Velas

Escola Básica e Secundária de Velas Escola Básica e Secundária de Velas Planificação Anual do 12º Ano Matemática A Ano letivo 2015 /2016 1º Período 2º Período 3º Período Nº DE BLOCOS PREVISTOS 39 32 24 Apresentação 0,5 1º Período 2º Período

Leia mais

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2

O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2 3.2 O Espaço Nulo de A: Resolvendo Ax = 0 11 O ESPAÇO NULO DE A: RESOLVENDO AX = 0 3.2 Esta seção trata do espaço de soluções para Ax = 0. A matriz A pode ser quadrada ou retangular. Uma solução imediata

Leia mais

PROGRAMAÇÃO DE COMPUTADORES I - BCC701-2014-01 Lista de Exercícios do Módulo 1 - Preparação para a Prova 1

PROGRAMAÇÃO DE COMPUTADORES I - BCC701-2014-01 Lista de Exercícios do Módulo 1 - Preparação para a Prova 1 PROGRAMAÇÃO DE COMPUTADORES I - BCC701-2014-01 Lista de Exercícios do Módulo 1 - Preparação para a Prova 1 Exercício 1 Apesar da existência do Sistema Internacional (SI) de Unidades, ainda existe a divergência

Leia mais

Introdução ao processamento de imagens e OCTAVE. Julio C. S. Jacques Junior juliojj@gmail.com

Introdução ao processamento de imagens e OCTAVE. Julio C. S. Jacques Junior juliojj@gmail.com Introdução ao processamento de imagens e OCTAVE Julio C. S. Jacques Junior juliojj@gmail.com Octave www.gnu.org/software/octave/ Linguagem Interpretada (similar ao MATLAB... portabilidade) Voltada para

Leia mais

Análise de Arredondamento em Ponto Flutuante

Análise de Arredondamento em Ponto Flutuante Capítulo 2 Análise de Arredondamento em Ponto Flutuante 2.1 Introdução Neste capítulo, chamamos atenção para o fato de que o conjunto dos números representáveis em qualquer máquina é finito, e portanto

Leia mais

Organização e Arquitetura de Computadores I

Organização e Arquitetura de Computadores I Organização e Arquitetura de Computadores I Aritmética Computacional Slide 1 Sumário Unidade Lógica e Aritmética Representação de Números Inteiros Aritmética de Números Inteiros Representação de Números

Leia mais

Software. Guia do professor. Geometria do táxi Distâncias. Ministério da Educação. Ministério da Ciência e Tecnologia

Software. Guia do professor. Geometria do táxi Distâncias. Ministério da Educação. Ministério da Ciência e Tecnologia Números e funções Geometria e medidas Guia do professor Software Geometria do táxi Distâncias Objetivos da unidade 1. Consolidar o uso de coordenadas cartesianas no plano e introduzir uma nova noção de

Leia mais

Capítulo 2. Numéricos e Códigos. 2011 Pearson Prentice Hall. Todos os direitos reservados.

Capítulo 2. Numéricos e Códigos. 2011 Pearson Prentice Hall. Todos os direitos reservados. Capítulo 2 Sistemas Numéricos e Códigos slide 1 Os temas apresentados nesse capítulo são: Conversão entre sistemas numéricos. Decimal, binário, hexadecimal. Contagem hexadecimal. Representação de números

Leia mais